You are on page 1of 183

ES

Estadstica descriptiva

.Jess Amn
. 1
NDICE GENERAL

Prlogo ... ... . .. . .... .. ........ . . ... .. .... ... .. ... .. . . .. ...... . ..... .. ... 7

l. INTRODUCCIN

1. Matemticas en Psicologia . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . . 19

l. l. Lenguaje matemlico en las ciencias . . . . .. . . . . . . . . . . . . . . .. . . . . . . . .. . .. . 19


1.2. Lenguaje matemtico en Psicologa ........ . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 19
1.3. Matemticas y complejidad de las manifestaciones psicolgicas . . . . . . . . . . . 21
1.4. Comentario sobre los modelos matemlicos complejos en Psicologa . . . . . . 22

2. Medida en Psicologa .. . . .. . . . . . . . . . . . . . . . . . . . . . . .. .. . . . . .. . . . . . . . . . 25

2. 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . 25
2.2. Carac1crsticas y modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 . Delinicin de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4. Delinicin de escala de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Tipos de escalas de medida (nominal , onJinal, de intervalos, de razn) . . . 29
2.6. Comentario sobre las escalas de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7. Resumen: Deliniciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3. Qu es la Estadistca7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3. 1. Conceptos previos (poblacin. muestra. parmelro, estadstico) . . . . . . . . . . . 36


3.2. Delinicin de Es1adstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Divisin de la Estadistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Tareas de la Estadstica Descripliva (recogida. organizacin y anlisis de
datos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5. Resumen: Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
12 / Indice general
Indice general / 13

11. ESTUDIO DE UNA SOLA VARIABLE 8. Puntuaciones tpicas . 1.14

8 .1 . Puntuaciones J irccta,. d ifen,nciak ~ y t1p1ca, . . ... .... . . 1}4


8.2. Propiedades de las puntuaciones tpicas . . . ....... ... . .... . . . 1:15
4. Organizacin de datos . ... 45
8.3. Significado de las puntuaciones d irectas, diferenciales y tpicas . . . 138
!!.4. Comparabilidad de las puntuaciones tpicas .. . . ..... .. . ... .. . .... . 139
4.1. Definicio nes p revias (consta nte. variable. mud:~idades y clase,. frecuencia. 142
8.5. Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . ... .. ..... . . .
proporcin, porcentaJe) ......... . .. ...... ........ . .. ....... . ......... . 45 143
8.6. Combinaci n de puntuaciones . . . . . . . . . . . . . . . . . . . . . . . .. . . .
~.2. Organizacin de datos (variables cualitativa,, variabks cuasi-cuanlitativas . 8. 7. Desviac in tpica y puntuac,onc, tpkas . .......... . .. . .... .... . .. . ... . 144
variables cuan cicacivas discretas. v ariabks cuan ti ta ti vas conti nua,) ... ... . . 47
8 .8 . Puntuaciones tpicas y curva normal (lmite del hi;tograma ,un intervalos
4.3. Resumen: Definiciones ................................. .. ... . 61
infinitamente pequeo,. n ,rva normal, relacin entre las reas bajo la curva
Ejercicios ... ..... .... .. . .... . ... .. . ... . ........ .... . . . . . .. . ... . . . . . . 62
normal y propor<:ione; o probabilidades, uso de la tabla de las reas bajo la
curva normal) ...... .. .. . . . .. .. . .. . .... ..... . . . .. . .......... .... .. . 144
8.9. Puntuaciones T . ..... .. ......... .. ... . .. .. . ... .. .. . ...... .... ..... . . 149
64 M.10. Resumen: Definiciones y f rmulas . . . . . .. . . ...... . ..... . ... .. . 150
5. Estadsticos de posicin o tendencia central ... . . . ..... ... .. . .... .
Ejercicios . . . . . . . . . . . . . . ... .... .. ...... . . . ... . .. . . . .... .... .. . .... . 151
5.1 I ncroduccin . ....... . . . . ..... ... ... .... .. ...... . .... . .... .. ......... . 64
5.2. Media aritmtica (definicin. clculo. propiedades. mtodo abreviado pa ra e l
c:kulo de la media, media ponderada. medias aritmticas generalizadas) .. 64 111. ESTUDIO CONJUNTO DE DOS VARIABLES
5.3. Mediana (intro<luccin previa. d efinicin. d kulo. propiedades) ....... . .. . 78
5.4. Moda (d efinicin , p ropiedades) .. . . ... . . . ... . ... . . .... .. . ..... . . . ... .. . 89
5.5. Percen tilcs (definicin , clculo) .. . . . .... .. . . . . .. . . . , ... . .. .. ..... ... .. . 91 9. Organizacin de datos e ndices de tendencia central y variabilidad 159
5.6. Resume n: Definiciones y frmul as ............................ . ...... . . 95
Ejercic ios ....... . .... ... .... ... . . .. .. . .... . ......... ... .. .. .. . . .. .. 97 9.1. Oistribucin conjunta de frecuencias . . .. . .. . .. .. ... .... .. .... .. . . . .. .. 159
9.2. Representacin grfica ............. . . .... ..... .. .. .. .. .. ... . . .. . . . .. . 160
9.3. Distr ibucio nes marginales de X y de Y ....... .. ... . . .. . .. ... ..... . ... . . 161
9.4. Distribucio nes cond icionales de X y de Y ..... .. .. . ........... . .. 163
6. Estadsticos de variabilidad o dispersin .............. .. ...... ... . 103 168
9.5. Covar ianza de X e Y (definicin. clculo . propiedad es) . . . . . . . . . . . . . .
9.6. Resumen: Definiciones y frmulas ............. .... ...... . .. . . ...... .. . 175
6.1. Introduccin ................... .. .... ...... . ....... .. .... ...... ..... . 103 176
Ejercicios . . . . . . . . . . . . . . . .... . ...... .. .... . .. .... . .. . . . . .. .. ... . .. . . .
6.2. Desviacin media (definicin. clculo. propiedades) ... .. .. . .... .. ..... . . . 103
6 .3. Varianza y d esviacin tpica (introduccin, tlcfinkin. clculo. p ropiedades,
mto tlo abreviatlo para el clculo de la varianza) ... . . ........... . ...... . 105 179
10. Relacin (lineal) entre dos variables ..... . ... . ..... . .
6.4. Amplitud total (definicin. clculo. propied atles) . . .. .. .. .... . ...... . ... 114
6.5. Amplitud semiintercuartil (tlefinicin. clculo. p ropiedades) ...... . . ... . .. 116 179
10.1. Idea general ....... ....... .. . .... . ........... . . .. ...... . ...... . . . . . . .
6 .6. Coeficiente <le variac i n (tlefinicin. clculo, propiedades) .. ... . . ... .. .. 117
10.2. Coeficiente tle correlacin de Pearson (definicin. clculo. propiedades,
6.7. Notas ...... .. . ......... ..... .............. - - - - - . ... 11 !! 180
mtodo abreviado para el calculo de ,,,.) . . ..... ....... .. .... .. . ... .. . . .
6.8. Resumen: Definiciones y frmu las . . .. . .......... .. . . . ....... . .. . . . .. 119 190
10.3. Factores de los que d epende r,, . ... ... . . , .. . ........... . .. . . . .. ..... .
Ejercicios ........ . . ........ .... . ... . .. . ........... . ...... ..... . .. . . . . 120 195
10.4. Condicin esencial para poder calcular ,., . .......... ... . . . . . .. . .. . ... .
10.5. Interpretacin de ,,,. ........... . ............ .... . .... .. . . .. . .. . ..... . 196
10.6. Correlacin y causalidad ... .... . . . .... . .... . ........... .. . ... . . .. ... . 196
10.7. Resumen: Definiciones y frmulas ... .. .. . . . . .. ... . ...... ... ...... . 197
7. Estadsticos de asimetra y apuntamiento . . . . .. .. . .. . ... . ..... . . . . 123
Ej ercicios .. ..... . . . . . . ..... .... . .. .. . . .. .. . .............. . ......... 198

7.1. 1ntro<lu ccin 123


7.2. Asimetra (idea ge neral , ndice basado en los tres cuartiles. indice basado en 201
el momento tic tercer ord en) ................ . ...... . .... . .. .... ...... . 123 11. Ecuaciones de regresin
7.3. Apuntamiento (idea previa. ntlic c basatlo en el momento de cu arto orden) 130
11.1 . Regresin y prediccin ......... .... . .... ......... . ......... .. , . . . . .. 201
7.4 . Resumen: Defi niciones y frmulas ........ ... .. ....... . . ..... .. . . . . ... . ) )2
11.2. Ecuacin de la rec ta en el plano . . .. . ..... . .. .... ........... . .. . ..... . 201
Ejercicios .... .. ......... .... . .. .. ... .......... . .... ............ . .. . 133
14 / Indice g eneral Indice general / 15

11.3. Ecua ciones de las rec tas de regresin d e Y sobre X segn el cri terio d e 15. Relacin entr variables nominales .. . . ... . ... ...... . ... < .. 272
mnimos cuadrados ............... . .......................... . .. . . . . . 203
11.4. Ecuaciones de las rectas d e regresin de X sobre Y seg n el criterio de 15. l. Idea previa. .. . . . . ..... . .. .. . .. . ................. . . . . . . . . . . . . . . . . . . . 272
mnimos cuadrados .. . .. . . . ....... . .... . .... . . .. . . . ..... . . .. . . . . . . .. . 21 4 15.2. Coeficiente Q de Yule (undamento y rmula, clculo, propiedades) . . . . 272
11.5. A plicacin d e las rectas de regresin ...... . .... .. . . ........ . .... . . .. . . 2 16 15.3. Coeficie nte 1.' (fundamento y frmula , clculo. prop iedades} . . . . . . . . . . . . . 279
11 .6. Resume n: Definiciones y frmulas ........... . . . . . ........... . .. ..... . 21 7 15.4 . Coeficiente de conti ngencia, C (fundamento y frmula. clculo. propiedades) 284
Apndice. (Introduccin , fu nci n c uadrtica , potencial, exponencial. loga- 15.5. 1n terprc taci n de Q y C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
rtmica/ . . .. .. .. . .. ..... . .... . ...... . .. . . ...... .... .... .. .. . .. . ..... . 218 15.6. Resumen : Definiciones y frmu las . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
E1ercicios .. .. . . .. . ... . .. .. , .... .. .. . . . .. . ... . . . . . .. ........ . ... . . .. 228 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

16. Relacin entre variabl es dicotmicas o dicotomizadas 289


12. El coeficiente de correlacin de Pearson r,,., y las rectas de
16. 1. Conceptos previos (variables d icotmicas y dicotomizadas) . . . .. . ... . .. . . 289
regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
16.2 . Coefi cientes de correlaci n q ue son mera aplicacin de r,, (coeficiente de
correlaci n biserial puntu al , rr coeficiente de correlacin cp. propiedades
12. 1. r_;, como ndice de reduccin error en los pronstic os . . . . . . . . . . . . . . . . . . 230
d e rr y de <p . interpretacin de rr y de cp ) .. . . ... .. . . . .. . . . 289
12.2. r;, co mo ndice de aproximacin d e los puntos a la rec ta de regresin.. . 234
)6.3 . Coefi cientes de correlacin que son estimacin de r,, (coeficiente de corre-
12.3. r;, com o proporcin d e la varianza d e Y a sociada a la var iacin de X . . . 235
lacin biserial, r. coeficiente de correlacin tetracrica , r, . propiedades de r
12.4. Resum en: Definiciones y frmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
y de r,, interpretacin de r, y de r. ) ... . .. . . ....... . .. . .. .. .. .. . ... .. . 297
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
16.4. Comparacin de rb, y de r .. .... . .. .. . ... . .. . .. . .. ... .. . ........ . . 303
16.5. Co mparacin d e 1p y r, . ... .. .. ... ..... . .. .. ..... .. . ... . . .... . .... .. . . 304
16.6. Resumen: Definiciones y f rmulas . .... . .. .. ....... . ... . ...... . . ..... . 304
16.7. Apndice: Ded uccin de las frmu las derr y de <p a partir der,,. (d educcin
13. Relacin (curvilnea) entre dos variables: Razn de correlacin . 243
de la frmula de r,, a partir de r,,., deduccin de la frmula de cp a partir
305
13. 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
t e;~i~i;s : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 308
13.2. Fu ndamento y d efinicin (razn de correlacin d e Y sob re X) . . . . . . . . . . 244
13.3. Clcu lo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
13.4 . P ropiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . .. . . . .. . . . . .. . . . . . 250 IV. ESTUDIO CONJUNTO DE TRES VARIABLES
13.5. Raz n de correlacin d e X sobre Y . . . . . . . . . . . . . . . . . . . . . . . . . 252
13.6. Interpre taci n d e 11;, o d e 11',,. . . . . . . . . . . . . . .. . . . . . .. . . .. .. .. . . . . .. . . 252
13.7. R esu men : Definicin y frmu las . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 17. Correlacin y regresin . ... ............ . . ......... ..... ... .. . .... . . 313
Ej ercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
17. 1. Introduccin ..... . . . . . .... ........... .... .. . . ... . .... .. ........ . . .. . 313
17.2. Correlaci n parcial (u ndamento y frm ula, clculo, propiedades) . .. .. .. . 3 13
17 .3. Regresin mltip le (introduccin, ecu aci n del p lano en un espacio tridi-
14. Relacin entre variables ordinales . . . . . . . . . . . . . . . . . . . . . . . . .. .. . . . . 255 mensional , ecuaciones d e los planos de regresin de X, sobre X, y X, segn
el criterio de mnimos cuadrados , ap licacin de los planos de regresin) . 3 16
17.4. Correlaci n m ltiple (definici n . clculo, propied ades) . . ....... .. . 330
14 . 1.Idea p revia.......... . .. . ..... . .... . . . . . . .. . .. .. . . . ........... . .. . 255
17.5. Resumen: Defi niciones y frmulas . .................... . . ... ........ . . 333
14.2. Coefi ciente d e correlacin d e Spea rman r, (fu nd amento y frmula. clculo ,
Ejercicios . . .. .. ....... .. .. .. .. .. . . .. . ...... .. ..... . .. .. . . . .. . .. ... . . 337
propiedades) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
14.J. Coefi ciente d e correlaci n d e Ke ndall t (fundame nto y definic i n , clculo ,
propiedad es) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 18. El coeficiente de correlacin mltiple y los planos d e regresin . 339
14 .4. Coeficiente de correlacin d e G oodman y Kru skal (introdu ccin . definicin ,
clculo, p ropiedades) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 18 . 1. R1" como ndice de reduccin de error en los pronsticos .. .. . .. ... .. . 339
14 .5. Interpre tacin d e los coefi cientes d e correlacin o rdinal . . . . . . . . . . . . . . . . 267 18.2. R;"' co mo nd ice de aproximacin d e los puntos al plano de regresin .. 343
14.6. A pndice: Deduccin d el coeficie nte d e correlaci n d e Sp carman ........ 267 18.3. Rl "' como proporcin d e la varianza de X, asoc iada a la variacin d e X , y X , 344
14.7. Resumen: Definicio nes y frmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 18.4. Resumen : Definiciones y frmulas . . .... .. ... ...... . .. . .. ........ . ... . 346
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 Ejercicios ... . .. .. . ... . .... . .. . . . ... . .. . .. . .. ... ....... . . . . . 346
16 / Indice general

V. APNDICES ..,,.

Apndice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351

1. Signo (simple) de sumar. r (definicin, propiedades) . . . . . . . . . . . . . . . . . . . . . . 351


2. Signo (doble) de sumar. rr (definicin. propiedades) .... .... ...... ... ..... 354
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Apndice 11. Soluciones a los ejercicios propuestos .................. 361

Apndice 111. Tablas .. ... ..... ..... .............. .. ... .. ..... ... .. ... ...

Bibliografa .. .. .. . .. .. . .. .. . .. .. .. .. .. . .. . .. .. . .. . . . .. . . . . .. .. .. .. .. .. .. .
371

375
1
381
Indice de autores
Indice de materias . .. . . . . . . . . .. . .. . .. . . . . . .. . . . . . . . . . . . . . . .. . . . . . .. . . . .. 383

Introduccin
1
Matemticas en Psicolog a

1.1. Lenguaje matemtico en las ciencias

Po r regla general, las ciencias se han man tenido a un nivel meramen te cuali-
tativo en su in fancia y han ido ascendiendo a niveles superiores cuantitativos al
ir alcanzando su edad adulta. Los investigadores se han esforzado en ir traducien-
do a lenguaje matemtico la form ulacin verbal primitiva d e las ideas cientficas
y este esfuerzo ha resuhado fec undo p ara la ciencia por un doble motivo . En primer
lugar, el in tento de expresar matemticamen te las hiptesis cientficas ha obli-
gad o a los investigadores a clarificar ms sus conceptos y a perfil ar mejor esas
hiptesis an tes de p lasmarlas definitivamente. En segundo lugar, toda hiptesis
cien tfica es susceptible de una comprobacin experimental ms satisfactoria
cuando viene formulada matemticamente que cuando viene propuesta en forma
meramente verbal.
Son m ltiples las citas aducibles segn las cuales van unidos estrechamente el
progreso de una ciencia y el grado de su desarrollo matemtico. Slo voy a presen-
tar el testimonio de dos psiclogos. Para Stevens (l 951, pg. 1), la importancia
de una ciencia es medida comnmente por el grado segn el cual hace uso de las
matemticas. A juicio de Atkinson et al., (1965, pg. 2), es un hecho histrico
fam iliar que a medida que la ciencia progresa, ;us teoras se van haciendo ms
y ms matemticas en la forma.
Parece, pues, clara la tendencia general de las ciencias modernas a expresar sus
conceptos matemticamente.

1.2. Lenguaje matemtico en Psicologa

La Psicologa moderna, casi desde sus comienzos, ha intentado proponer sus


leyes {o, al menos, algunas) bajo frmulas matemticas. A este respecto puede
ser consultado Miller (1964). Thurstonc (1959, pg. 9) cree que la Psicologa se-
guir el camino recorrido por otras ciencias, hacindose cad a vez ms y ms ma-
20 / Estadstica para Ps,clogos Matemticas en Psicologa / 21

temtica a medida que vaya formu lando ms rigurosamente sus ideas fundamentales. o fr ecido cada uno de ellos por separado. En algunas ocasiones. la discordancia
Horst (i966, pg. 2) piensa que la Psicologa ha tardado tanto tiempo en ocupar entre los resultados de uno y otro enfoque puede sugerirnos un plan teamien to
su lugar apropiado entre las ciencias aplicadas, quiz por no haber reconocid o la n uevo m ucho ms acertado que el concebid o previamente.
importancia de la medida en la investigacin psicolgica. Segn Nunnally (1967,
pg. 6) todas las teoras psicolgicas, con el tiempo, irn siendo propuestas en for-
ma matemtica. Bailey (1967, IX) admite que la Biomatemlica ayudar a la Bio-
1.3. Matemticas y complejidad de las manifestaciones
loga y a la Medicina, como la Fsica matemtica ha ayudado a la Fsica. Existe.
psicolgicas
pues, un convencimiento casi general de que el lenguaje cuantitativo ir asumiend o
cada vez mayor relieve en las ciencias de la conducta y, en particular, en la Psico-
loga. De hecho, los modelos matemticos juegan hoy un papel importante en mu- De lo dicho se infiere que hoy las tcnicas matemticas son utilizadas en Psico-
chas reas psicolgicas: Psicologa experimental, diferencial, social, industrial, logia con gran profusin y no poco xito. Por ello consideramos superfluo poner-
pedaggica, ... y aun clnica. La lectura de bastantes artculos y libros relaciona- nos a refutar ciertas dificultades clsicas contra la aplicabilidad de los mtodos
dos con estas disciplinas exige una preparacin matemtica no ligera y, en oca- matemticos en Psicologa. Si n embargo, queremos responder a una pregunta
siones, profunda. Desde luego, sin esta ltima es imposible leer revistas de espe- que, obviamente, pueden hacer muchos lectores. Es posible acercarse a los pro-
cializacin psico o bio-matemtica (Psychometrika, Biometrica, Biome- blemas psicolgicos, de innegable complejidad, con instrumentos de naturaleza
trics, ,dournal of Mathematical Psychology, etc.) o entender libros, cada vez simple y elemental?
ms numerosos, que abordan los problemas psicolgicos de modo rigurosamente Comencemos admitiendo que tanto en Psicologa humana , como, sobre todo ,
mtrico. Igualmente, es necesaria una slida preparacin matemtica para com- en Psicologa animal, existen procesos bastante rudimentarios encajables fcil-
prender diversas leyes o teoras psicolgicas, tal como hoy son propuestas . As, mente dentro de esquemas matemticos. En estos casos no s lo es p osible, sino.
por ejemplo, leyes psicofisicas y psicomtricas, teoras sobre el aprendizaje, teora tambin, muy til la introduccin de instrumentos matemticos. No obstante,
de la decisin y teora de la informacin aplicadas a la Psicologa, teora de tests, debemos aceptar que son escasos los fenmenos psicolgicos de gran simpl icidad
etctera. En conclusin , las matemticas se van h aciendo cada vez ms indispen- y q ue, sobre todo, los fenmenos psquicos de mximo inters son p recisamente
sables dentro de las ciencias humanas y, en particular, dentro de . la Psicologa. los de contextura ms compleja. Qu hacer? En primer lugar, podernos conside-
Los mltiples libros de Matemticas para psiclogos, socilogos, bilogos, etc., rar aspectos parciales del fenmeno com plejo, limitando nuestra investigacin
que vienen apareciendo durante estos ltimos aos, son un ndice cla ro de que a ellos y, por supuesto, restringiendo, despus, n uestras conclusiones a esos ni-
estos investigadores necesitan y piden una fundamentacin matemtica cada vez cos aspectos. De esta manera pod remos uti lizar tcnicas matemticas relativamente
ms seria para poder abordar adecuadamente muchos problemas de sus corres- simples. En segundo lugar, conviene advertir que existen modelos matemticos
pondientes especialidades. muy complejos y a los q ue podemos acudir en muchos casos. Desde Juego, su ma-
Sin negar, ni mucho menos, la importancia del lenguaje matemtico en Psico- nejo exige con ocimientos matemticos no asequibles a .todos los psicl ogos. Es una
loga, conviene, no obstante, advertir que la tarea fundamental de un psiclogo dificultad innegable, pero no invencible. Es extrnseca y superable con una prepa-
es llegar a consecuencias psicolgicas a partir de premisas, tambin, psicolgicas. racin matemtica adecuada. En conclusin, parece p osible acercarse a muchos
Los instr umentos matemticos sern tiles en Psicologa en cuanto nos ayuden problemas psicolgicos con instrumentos matemticos con tal que stos sean sufi-
a alcanzar conclusiones psicolgicas. Sin duda alguna, es mucho ms estimable cientemente apropiados. Aclaremos lo dicho con un ejemplo.
una afirmacin con contenido psicolgico, expuesta en trminos verbales, que una Dos personas. Pablo y Santiago, consideran una frase sobre cierto problema
afirmacin carente de significado psicolgico, por ms elegante que sea su formu- social. Tienen que decir si estn de acuerdo o en desacuerdo con la misma. Pues
lacin matemtica y por ms riguroso que sea el proceso matemtico que nos ha bien, la situacin siguiente es muy posible. Pa blo responde que est de acuerdo
llevado a ella. Por tanto, como psiclogos, deberemos abordar matemticamente y Santiago que est en desacuerdo. Cuando Santiago escucha a Pablo razonar
un problema psicolgico siempre y slo cuando esta tctica nos ayude a encon- su respuesta afirmativa , nos dice : Yo tambin habra estado de acuerdo si hu-
trar una solucin psicolgica apropiada. Si un problema psicolgico no admite biera considerado la fra se desde el punto de vista bajo el cual l la ha considerado.
un enfoque matemtico, no nos empearemos en introducir modelos matemti- A su vez, cuando Pablo escucha a Santiago razonar su respuesta negativa, nos
cos que, en el caso ms favorable. sern perfectamente intiles. Con todo , si un dice : Yo tambin habra estado en desacuerdo si hubiera considerado la frase
problema psicolgico admite un enfoque matemtico y otro no matemtico. ser. desde el pun to de vista bajo el cual l la ha consid erado. Sin embargo. es muy pre-
muy interesante acometer el problema bajo los dos puntos de vista. Ambos enfo- visible que no preguntemos a ninguno de los dos la razn de sus respuestas y nos
ques, lejos de se;: antitticos, se complementarn mutuamente. El resultado con- contentemos con atribuir a Pablo un 1 (por estar de acuerdo) y a Santiago un O
junto de ambos puede ofrecernos una solucin ms rica que la que nos hubiera (por estar en desacuerdo). Si se trata de un cuestionario compuesto de diversas
22 / EstadstJca para Psiclogos
M atemticas en Ps,col oga / 23
frases, nos limitaremos a atribuir a cada persona una puntuacin igual al nmero
b) Es verdad que los modelos matemaucos complejos suelen ser los nica-
de frases con las que ha estado de acuerdo. Este tratamiento matemtico es muy
mente vlidos en situaciones psicolgicas compl~jas y que el dominio de tales mo-
asequible. De modo muy elemental dispondremos enseguida de una puntuacin
d elos exige un nivel matemtico algo ms que mediano. Sin embargo. conviene
para cada persona. Pero, es esto legtimo? Probablemente, no. En efecto, la tc-
hacer algunas pun tualizaciones. En primer lugar, segn ya hemos indicado, no
tica anterior supone implcitamente que a alta puntuacin en el cuestionario co-
todos los problemas psicolgicos son extremad amente complejos. Ms adelante
rresponde estar de acuerdo con el tema social del mismo . Ahora bien, tal supo-
sicin slo sera defendible si dicho tema social fuera unidimensional, admitiese nos encontraremos, de hecho, con situaciones bastante simples. Comprobaremos
cmo en ellas son aplicables legtimamente tcnicas matemticas sencill as y cmo
un nico enfoque, y ste hubiera sido asumido por todas las personas que respon-
sus resul tados numricos son susceptibles de una interpretacin psicolgica muy
den al cuestionario. Ms an, deberamos estar seguros de que la nica dimensin
satisfactoria. En segundo lugar, la apl icacin de modelos matemticos complejos
considerada por ellas ha sido entendida tal como lo pretenda el que aplica el cues-
no implica necesariamente una preparacin matemtica extremadamente especia-
tionario. De no cumplirse estas condiciones, el nmero atribuido a cada persona
lizada . Son deseables unos conocimientos matemticos serios, pero no es nece-
es susceptible de mltiples y aun equvocas interpretaciones psicosociales. Esto
sario que el in vestigador psicomatemtico sea especialista en reas matemticas
quiere decir que el modelo matemtico simple aplicado en esta ocasin no es el
concretas. Lo verdaderamente importante es que sepa acercarse con mentalidad
ms apropiado, pero ello no significa que sea rechazable todo tratamiento mate-
matemtica a los problemas q ue se le presenten. Es d ecir, que se esfuerce en asim ila r
mtico. Podemos valernos de un modelo que nos descubra las dimensiones fun -
el proceso lgico subyacente al razonamiento matemtico. que logre captar la es-
damentales simples del tema social complejo y que nos permi ta determinar la si-
tructura formal del modelo matemtico de que se trate, q ue conozca las condiciones
tuacin de cada persona respecto a cada una de esas dimensiones o facetas. Este
que lo hacen posible y, consiguientemen te, las condiciones que ste exige de la
modelo matemtico tratara de considerar los diversos aspectos considerados por
realidad concreta para que sea legtima su aplicacin a la misma . Slo as, sabr
las personas que responden al cuestionario, evaluando a las personas segn cada
elegir el modelo matemtico ms apropiado en cada situacin prctica de la vida
uno de estos aspectos, sin contentarse con clasificarlas en las dos nicas categoras
real. Por otra parte, asimilada esta mentalidad matemtica, no slo podr manejar
a favor o en contra. Es posible que muchos temas sociales, simples y unidi-
mensionales en apariencia, sean complejos y multidimensionales *. Pero ello no con suficiente pericia instrumentos matemticos bastan te sofisticados, sino que
podr enta blar dilogo con los especialistas en Estadstica matemtica para que
implica que sea inviable todo enfoque matemtico. Slo quiere decir que los pro-
le asesoren en el planteamiento mtrico de algn problema psicolgico y con los
blemas psicosociales multidimensionales deben ser afrontados con modelos mul -
especialistas de un Centro de Clculo para que le ayuden en la eleccin o creacin
tidimensionales. Admitimos ciertas dificultades de orden prctico en su aplica-
del programa ms adecuado con el q ue pueda resolver su problema psicolgico
cin, pero negamos la imposibilidad de acometer dichos problemas complejos con
instrumentos matemticos. mediante un ordenador electrnico.
e) Los modelos matemticos, aun los ms complejos, son todava bastante
elemen tales respecto a la realidad psicolgica concreta. Las relaciones previstas
por el modelo se verifican exactamente en una realid ad simplificada, ideal, y slo
1.4. Comentario sobre los modelos matemticos complejos aproximadamente en la realidad compleja, existente. El grado de aproximacin
en Psicologa ser tanto m,iyor, cuanto menor haya sido el proceso simplificador que ha permi-
tido crear el modelo. Cuanto ms mutilemos la realidad concreta, ms sencillo
a) Ante todo, queremos reafirmar que estos modelos complejos no slo son
y ms manejable ser el modelo creado a p artir de esa realid ad cercenad a, pero
posibles, ~ino que an son los nicos realistas en muchos casos. Es errneo creer ms problemtica ser su aplicacin a la realidad concreta, no mutilada. Cuanto
que las tcnicas matemticas algo complicadas son construcciones puramen te menos m utilemos la realidad concreta, mas com plicado ser el modelo, pero ms
ideales, muy propias para discusiones tericas, pero sin relacin alguna con los fiable ser su aplicacin a dicha realidad. Tendremos que ll egar a un compromiso:
problemas de la vida real. Con gran frecu encia los instrumentos sencillos y d e fcil simpl ificar la realidad concreta lo menos posible, p ero , a la vez lo suficiente de
aplicacin suelen ser menos realistas y menos tiles que los modelos matemticos modo que el modelo creado a partir de ella sea fc ilmen te manejable desde el punto
complejos a la hora de tomar decisiones psicolgicas de importancia en situaciones de vista in strumental matemtico. En Psicologa los casos prcticos que se nos
prcticas complejas. presentan en la vida real suelen ser ms complejos q ue los que aparecen en otras
ciencias de la Naturaleza. Por ello, si deseamos modelos sencillos, deberemos
Por poner un ejemplo, Amn ()969} comp rob cmo una faceta social tan aparentemente un1 simplificar la realidad concreta de man era notable. Aun q uedndonos con mo-
dimensional como la religio sidad l:)tililaria. medida con un cuestionario sumamente purificado. se ma - delos algo complejos, deberemos imponer a la realidad mutilaciones de ciena
nifest como pluriditp.cosional, siendo, adems. bast ante independientes entre s la s dimension es en las
que se descompoo3.-' impor tancia. Ello quiere decir que en Psicologa debemos ser prudentemente
cautos en la aplicacin de los modelos a la realidad concreta y en la traduc-
24 / Estadstica para Pstclogos

c1n a lenguaje psicolgico de los resultados numricos obtenidos mediante el


modelo.
Conviene advertir que los investigadores psicomatemticos con slida pre-
paracin matemtica suelen ser muy cautos en la interpretacin psicolgica de
2
los resultados numricos. La razn es que ellos conocen muy bien las limitaciones Medida en Psicologa
de los modelos matemticos aun de aquellos que pueden aparecer bastan te com-
plejos. Son mucho ms audaces en dichas interpretaciones psicolgicas los que
carecen de adecuada preparacin matemtica, precisamente por carecer de ella,
por desconocer la limitacin de los modelos que usan. Es necesaria una buena
preparacin matemtica para conocer la potencia y la debilidad de las tcnicas
estadsticas y, consiguientemente, para saber usarlas con eficacia y, a la vez, con
prudencia.

2.1 . Introduccin

Hemos visto que es posible enfocar matemticamen te los problemas psicol-


gicos. Este enfoque im plica atri buir nmeros a las manifestaciones psicolgicas,
someter estos nmeros a ciertas tcnicas matemticas de modo que lleguemos a
un resultad o numrico fi nal e interpretar psicolgicamente este resultado. En
realidad, el estadio estrictamente matemtico es el segundo que comienza con
datos numricos y concluye con resultados, tambien, n umricos. Pero ste es in-
concebible sin una preva atribucin d e nmeros a las manifestacio nes psicol-
gicas. Por ello, vamos ahora a referirnos brevemente a dicha atribucin numrica o,
lo que es equivalente, a la delnicin de medida.

2.2 . Caracteristicas y modalidades

Los objetos manifiestan caractersticas segn diversas modalidades. Asi, por


ejemplo, las personas manifiestan la caracterstica sexo segn dos modalida-
des: varn y mujer: la caracterstica religin segn muchas modalidades: cat-
lico, protestante, mahometano, budista, ateo, etc. ; la caracterstica peso segn
infini tas modalidades, pues entre d os modalidades, por prximas que se encuentren,
son siempre posibles otras modalidades in termedias.

2.3. Definicin de medida

Atribucin de n meros a los objetos segn ciertas reglas* .

La definicin anterior est tomada de Stevens . En su primera publ icacin sobre la medida
~.-!'"
( 1946. pg. 2 , deca: Parafra seando a N. R, Campbell . ... . podemos deci r que medid a. en su sentido
mas ampli o. es definida como la at ribucin de numerales a objetos o su cesos de acuerdo con regl as"' ,
26 / Estadstica para Psiclogos Medida en Psicologa / 21

Tenemos por una parte nmeros y, por otra, objetos con sus correspondientes dola en algunos casos particulares, para concluir ofreciendo una defin icin general.
modalidades. Entre los nmeros existen ciertas relaciones que son vlidas siempre Consideremos la caracterstica peso. Aceptemos como u nidad emprica de
dentro del mundo aritmtico, ideal. Entre las modalidades existen ciertas relacio- medida la modalidad p resentada por un cuerpo elegido arbitrariamente. Me-
nes (en unos casos, pocas y simples; en otros, bastantes y complejas) que son veri- diante una balanza podemos elegir otro cuerpo que manifieste la caracterstica
ficables en el mundo emprico, real. Pues bien, la atribucin d e nmeros a los ob- peso bajo la misma modalidad que el primero (es decir, que pese lo mismo ). Me-
jetos no va a ser arbitraria, sino de acuerdo con esta regla general: aceptar slo diante estos dos cuerpos podemos elegir otro nuevo cuya modalidad sea igual a
como relaciones vlidas entre los nmeros aquellas que sean verificables emp- la suma de las modalidades de los dos cuerpos anteriores (es decir, q ue pese lo
ricamente entre las correspondientes modalidades. Esta regla general se concre- mismo que los dos primeros juntos). Para ello, basta con colocar estos dos cuerpos
tar en unas u otras reglas particulares, segn sea mayor o menor el nmero de en un platillo de la balanza y en el otro un tercer cuerpo tal que la balanza quede
relaciones verificables empricamente. equilibrada. Esta operacin la podemos ir repitiendo, poniendo tres cuerpos d e
Exigimos, por tanto, un cierto paralelismo o isomorfismo entre las relaciones peso unidad en un platillo y en el otro un cuerpo tal que la balanza permanezca
aceptadas como vlidas entre los nmeros y las relaciones verificables entre las en equilibrio. Asi, llegaremos a obtener un conjunto de cuerpos materiales, uno
correspondientes modalidades (en nuestro caso, psicolgicas). Consiguientemente, con la modalidad unitaria , otro con una modalidad dos veces mayor que la uni-
con los nmeros atribuidos a las modalidades, slo podremos realizar aquellas taria, etc. Podemos ahora atribuir nmeros a estas modalidades (o a estos cuerpos
operaciones que estn de acuerdo con las relaciones aceptadas como vlidas entre manifestando la caracterstica, segn estas modalidades). Una atribucin obvia
los mismos. Por otra parte, estas relaciones son precisamente las verificables entre (no la nica, como luego veremos) es asignar el 1 a la primera modalidad, el 2 a
las modalidades empricas, psicolgicas. En consecuencia, parece que el resul- la modalidad emprica doble, el 3 a la triple, ele. Esta atribucin es obvia, en cuanto
tado numrico final, obtenido operando de este modo con los nmeros atribuidos que la primera modalidad ha sido elegida arbitrariamente como modalidad em-
a las modalidades psicolgicas, admitir una interpretacin psicolgica razonable. prica unitaria.
Ordinariamente, la expresin atribucin de nmeros a las modalidades Pues bien, llamaremos escala de medida a este conjunto de modalidades em-
ser una simplificacin de atribucin de nmeros a los objetos segn las modali- pricas distintas y de nmeros distintos, puestos en correspondencia biunvoca
dades bajo las cuales manifiestan cierta caracterstica. Pasamos por alto las ven- (a cada modalidad le corresponde un solo nmero y a cada nmero una sola mo-
tajas e inconvenientes que esta equivalencia lleva consigo. Tampoco nos detene- dalidad). O, lo que es igual, a este conjunto de cuerpos materiales, con pesos dis-
mos a discutir si los nmeros deben ser atribuidos a los objetos o a sus caracters- tintos, y de los nmeros distintos atribuidos a dichos cuerpos. Medi ante esta es-
ticas, por creer dicha discusin ajena al fin de este tex to . nicamente, nos conten- cala podemos atribuir nmeros de modo coherente a otro cuerpo cualquiera,
tamos con proponer la anterior equivalencia, usando preferentemente la expresin comparando su modalidad peso con las modalidades de la escala tipo acabada
primera por meras razones de sencillez. de cons1ruir y atribuyndole el nmero de la escala asociado a la modalidad que
coincide empricamente con la modalidad del cuerpo en cuestin.
Veamos otro ejemplo algo ms complejo. Se trata de la caracterstica tempera-
tura . Consideremos una vasija llena de agua y situada sobre una fuente calorifica.
2.4. Definicin de escala de medida Introduzcamos dentro del agua un tubo estrecho de vidrio en uno de cuyos extre-
mos lleva un pequeo depsito conteniendo mercurio. Al aumentar la tempera-
La palabra escala es usada profusamente en la literatura psicomatemtica , tura el mercurio se dilata y va avanzando por el tubo de vidrio que supondremos
pero raramente definida. Ya Suppes y Zinnes se quejaban (1968, pg. 10) de que en posicin vertical y con el depsito de mercurio en su extremo inferior. En un
es raro encontrar en la literatura sobre la medida una definicin exacta de escalas. momento arbitrario la vasija manifestar la caracterstica temperatura segn cier1a
Ni el mismo Stevens ha si do lo suficientemente explcito. Suppes y Zinnes han pre- modalidad determinada y la columna de mercurio habr alcanzado una altura de-
sentado una definicin clara de escala. Algo parecido ocurre con Coombs, Dawes terminada. Sealemos una raya en el tubo de vidrio junto al nivel alcanzado por
y Tverski (l 970) y con Pfanzagl (1971). el mercurio en ese momento. Vayamos aumentando la temperatura del agua y
Veamos qu entendemos aqu por escala de medida . Comenzaremos definin- en otro momento, tambin arbitrario, veamos hasta dnde ha ascendido la columna
de mercurio marcando otra raya en el tubo de vidrio junto al nivel alcanzado por
el mercurio en este segundo momento . Sigamos calentando el agua hasta el pre-
En artculos posleriores (195 1, 1959. 1966. 1968a , 1975. por ejemplo) volver a proponer illnlicas o
parecidas formulaciones sobre la medida. Ordinanamenle usa la r alabra numeral, pero, lambin. ciso momento en que la diferencia entre esta altura y la obtenida en el momento
usa la palabra nmero (vase, por ej emplo, 1968b, pg. 850). Segn algu nos amores, hay que segundo sea igual que la diferencia entre las alturas alcanzadas en los momentos
diferenciar cuidadosamen1e los dos vocablos numeral y nmero. As, enlre olros. Lorge (1%7,
pg. 44), Sender (l'ljS, pg. 50). Segn ellos. numeral es un concepto ms amplio que nmero.
segundo y primero respectivamente y hagamos otra raya en el tubo de vidrio junto
Con todo, Steveos ( 19~9. pg. 19) no parece dar mayor imponancia a esta dislincin. al nivel alcanzado por el mercurio en este tercer momento . Si verificamos una ope-
28 / Estadstica para Psiclogos Medida en Ps,co/ogia / 29

racwn semejante en repetidas ocasiones, el tubo de vidrio habr quedado mar- Ntese que hablam os de modalidades y nmeros relacionados biunvocamente.
cado con una sucesin de rayas equidistantes, correspondientes a las modalida- Ordinariamente, tendremos conjuntos de objetos tales que, dentro de cada con-
des de la caracterstica temperatura manifestadas por el agua de la vasija en el junto, todos sus objetos no manifiesten la caracterstica de que se trate bajo moda-
primer momento, en el segundo, en el 1ercero, etc. Podemos, ahora, atribui r n- lidades distintas. Es decir, 1endremos ms objetos que modalidades. En este caso,
meros a esas rayas. A una cualquiera de ellas le atribuimos el valor O. A cada una a cada objeto le corresponde un solo nmero; pero un mismo nmero puede corres-
de las rayas superiores (correspondientes a modalidades ms clidas) les vamos ponder a varios objetos (todos los que manifies ten la caracterstica seg n la misma
atribuyendo los nmeros 1, 2, 3, . .. A su vez, a cada una de las rayas inferiores modalidad). En el caso general, tendremos n objetos y III modalidades. Si defini-
(correspondientes a modalidades ms fras) les vamos atribuyendo los nmeros mos la escala como conjunto de objetos y de nmeros, deberemos distinguir d os
- 1, - 2, - 3, . .. casos. En el primero, m = n ; habr correspondencia biunvoca entre objetos y
Pues bien, llamaremos escala de medida a este conjunto de rayas y de nmeros nmeros (isomorfismo ). En el segundo, m < 11; no habr correspondencia biu-
relacionados biunvocamente. Mediante esta escala podemos atribuir nmeros nvoca, ser slo unvoca : a cada objeto un solo nmero (homomorfismo). Para
de modo coherente a un cuerpo cualquiera. Para ello, le ponemos en contacto con evitar estas distinciones, hemos definido la escala como un conjunto de modali-
el tubo de vidrio tipo (o termmetro), acabado de construir, y observamos hasta dades (distintas) y de nmeros (distintos) relacion ados, siempre, biunvocamente.
qu raya de ste, r., ha ascendido la columna de mercurio. Hecho esto, atribui-
remos al cuerpo en cuestin el nmero correspondiente a '
Por supuesto, la sucesin de nmeros(... , - 3, - 2, -1, O, !, 2, 3, . . .), aunque 2.5. Tipos de escalas de medida
obvia, no es la nica, segn veremos ms adelante. Adems, es claro que ahora la
medida es indirecta, en cuanto que lo que medimos directamente es la altura alcan- Al medir, o sea, al atribuir nmeros a los objetos, decamos q ue slo acept-
zada por el mercurio e indirectamente la temperatura causante de esa altura. Antes, bamos como vlidas entre los nmeros aquellas relaciones que fueran verificables
en cambio, medamos directamente la caracter.stica peso. empricamente entre las correspondientes modalidades. Ahora bien , estas rela-
Consideremos, finalmente, la caracterstica provincia de origen. Emprica- ciones son muy simples en algunos casos y complejas en otros. Por consiguien-
mente podemos distinguir las modalidades Soria y Segovia, por ejemplo. Tendre- te, en unos casos slo aceptaremos como vlidas entre los nmeros, relaciones
mos tantas modalidades distintas como provincias espaolas. Podemos atribuir muy sen cillas ; en cambio, en los otros daremos validez a relaciones aritmticas
a cada provincia un nmero distinto. Tendremos tantos nmeros distintos como ms complejas.
provincias distintas.
Pues bien, diremos que nos encon tramos a bajo o alto nivel de medida, segn
Pues bien, llamaremos escala de medida a este conjunto de modalidades (tantas sea menor o mayor la complejidad de las relaciones que podamos verificar emp-
como provincias espaolas) y de nmeros relacionados biunvocamen te. Mediante ricamente entre las modalidades. Esta terminologa parece la ms oportuna. Sin
esta escala, podemos atribuir nmeros de modo coherente a una persona cualquiera. embargo, en vez de niveles se suele hablar preferentemente de escalas de med ida.
Le atribuiremos, sencillamente, el nmero de la escala correspondiente a la mo- Nosotros hablaremos a veces de niveles de medida ; pero, por ahora, aceptaremos
dalidad bajo la cual manifiesta esa persona su provincia de origen . Por supuesto la expresin escalas de medida, dada su aceptacin casi un iversal. Esta ltima
existen infinitas sucesiones de nmeros distintos que puedan ser atribuidos a las expresin tiene, tambin, un sentido razonable. La escala es el conjunto de moda-
modalidades anteriores, segn veremos luego. lidades empricas y de nmeros relacionados biunvocamente. Pues bien, segn
En conclusin, podemos ofrecer la siguiente definicin general de escala : con- que entre las modalidades de la escala sea verificable uno u otro tipo de relaciones,
junto de modalidades (dis1intas) y conjunto de nmeros (distintos) relacionados tendremos uno u otro tipo de escala. Naturalmente, dentro de cada uno de estos
biunvocamente. Es decir, a cada modalidad le corresponde un solo nmero y a tipos slo sern vlidas entre los nmeros aquellas relaciones que sean verifica-
cada nmero una sola modalidad. bles entre las correspondientes modalidades.
La escala, as definida, es un instrumento natural de medida . Con ella podemos Distinguiremos cuatro tipos de escalas, siguiendo el esq uema tradicional pro-
atribuir nmeros a cualquier objeto. Para ello, basta con observar qu modalidad, puesto ya por Stevens en su primera publicacin sobre teora de la med ida (1946).
m,, de la escala coincide empricamente con la modalidad del objeto en cuestin,
atribuyendo a ste el nmero correspondiente a m, en la escala.
La definicin anterior de escala est de acuerdo con la idea que tenemos de 2.5.1. Escala nominal
uno de los instrumentos de medida ms usuales, la regla. Una regla no es ms que
un conjunto de rayas equidistantes marcadas sobre un listn de madera (o de otro Supongamos que, dadas dos o ms modalidades, slo podemos comprobar
material) y un ~pnjunto de nmeros, en correspondencia biunvoca : a cada raya empricamente si ellas son iguales o distin tas. Consiguientemen te, entre los nmeros
le corresponde n solo nmero y a cada nmero una sola raya. atribuidos a las mismas slo aceptaremos como vlida la relacin igualdad-des-
30 / Estadistica para Psiclogos Medida en Psicologia / 31
igualdad. Si, por ejemplo, se trata de la caracterstica provincia de origen y por ellos). Sigamos as hasta poner en l timo lugar aquel que raya a los nueve res-
atribuimos el 1 a la modalidad Soria, el 2 a la modalidad Segovia y el 3 a la moda- tantes y no es rayado por ninguno de ellos.
lidad Avila, entre los nmeros l, 2 y 3 slo aceptaremos como vlida la relacin Tenemos, por tanto, diez modalidades de la caracterstica dureza ordenadas
igualdad-desigualdad. Es decir, el smbolo l ser considerado como algo distinto empricamente desde la ms blanda hasta la ms dura. Atribuyamos a la primera
de los smbolos 2 y 3, y stos, tambin, como distintos entre s, del mismo modo que modalidad el nmero l, a la segunda el nmero 2, ... , a la ltima el nmero 10.
son distintas entre s las tres modalidades correspondientes; pero, el 2 no ser Ahora a ceptaremos no slo que los nmeros l , 2, . .. , l O son smbolos distintos,
considerado como mayor que el 1, ni el 3 como mayor que el 2 y el 1, del m ismo sino que, adems, el 2 es mayor que el l , el 3 es mayor que el 2 y el l, .. . , el 1O
modo que la modalidad Segovia no es una manifestacin mayor de la caracters- es mayor que los nueve primeros nmeros enteros positivos. Pero, a este nivel no
tica provincia de origen que la modalidad Soria, sino, simplemente, una mani- tiene sentido admitir como vlida entre los nmeros una igualdad del tipo 7 - 6 =
festacin distinta. A este nivel, los nmeros atribuidos son puros nombres>> (de = 3 - 2, pues no podemos comprobar empricamente si la diferencia de dureza
aqu el apelativo nominal) que podan ser sustituidos por cualesquiera smbolos entre la modalidad a la que he atribuido el 7 y la m odalidad a la que he atribuido
no numricos: letras, colores, figuras geomtricas, etc. Por consiguiente, los n- el 6 es igual que la diferencia de dureza entre la modalidad a la qu e he atribuido
meros no gozan aqu de ninguna de las propiedades aritmticas. No tiene ningn el 3 y la modalidad a la que he atribuido el 2.
sentido aceptar a este nivel que 3 = 2 + J, pues ello implicara que la modalidad Evidentemente, la escala ordinal permanece invanante frente a cualquier trans-
Avila era el resultado de unir las modalidades Soria y Segovia. En otras palabras. formacin montona creciente. En otras palabras, seguiremos teniendo una misma
que el resultado de unir una persona con la modalidad Soria y otra persona con escala ordinal, cuando, permaneciendo las mismas modalidades tipo, los n meros
la modalidad Segovia dara como resultado una nueva persona con la modalidad atribuidos a las mismas sean sometidos a una transformacin m ontona creciente,
Avila. es decir, que haga corresponder a una sucesin ordenada de nmeros otra sucesin
Evidentemente, la escala nominal permanece invariante frente a cualquier trans- de nmeros ordenados del mismo modo que los primeros. Si, por ejemplo, a tres
formacin que a nmeros distintos haga corresponder nmeros distintos. Es decir, modalidades ordenadas de menor a mayor les hemos a tribuido los nmeros 3, 5 y 8,
seguiremos teniendo una misma escala nominal, cuando, permaneciendo las mismas podemos atribuirles, con igual derecho, otras ternas del tipo : 6, 70, 95 ; 82, 195,
modalidades tipo, los nmeros atribuidos a las mismas sean transformados en otros 981; etc.
con la nica limitacin de que a nmeros distintos primitivos, correspondan , tam-
bin, nmeros distintos nuevos. Si, por ejemplo, a tres modalidades distintas les
hemos a tribuido los nmeros 5, 7, JO, podemos atribuirles con igual derecho cuales- 2.5.3. Escala de intervalos
quiera otra terna compuesta de nmeros distintos como 6, 9, 2; 7, 3, 1; etc.
Supongamos que, dadas dos o ms modalidades, n o slo podemos comprobar
empricamente la igualdad-desigualdad y el orden, sino que, tambin , podemos
2.5.2. Escala ordinal establecer una unidad emprica de medid a y observar cuntas veces se encue ntra
contenida dentro de la diferencia entre dos modalidades cualesquiera. Consiguien-
Supongamos que, dadas dos o ms modalidades, no slo podemos comprobar si temente, dadas tres modalidades a, b y e, podemos comprobar empricamen te
son iguales o distintas, sino, siendo distintas, cul de cada dos es la mayor. Es decir, cuntas veces la diferencia entre a y b es mayor (o menor) que la diferencia entre
dados dos objetos, podemos comprobar empricamente si ambos manifiestan una b y e, suponiendo que las dos diferencias son distintas. Consiguientemente, entre
caracterstica segn la misma o distinta modalidad y, supuesto que la manifiesten los nmeros atribuidos a las modalidades admitiremos como vlidas las relaciones
segn distinta, podemos comprobar cul de los dos la manifiesta segn una moda- igualdad-desigualdad y orden, y las operaciones suma y resta entre ellos . Adems,
lidad mayor. Consiguientemente, entre los nmeros atribuidos a las modalidades podemos admitir como vlidas la multiplicacin y divisin entre las diferencias
admitiremos como vlidas las relaciones igualdad-desigualdad y orden. obtenidas a partir de dichos nmeros (no entre los m ismos nmeros).
Si, por ejemplo, se trata de la caracterstica dureza, diremos que A es ms duro Supongamos que se trata de la caracterstica temperatura. Elegimos tres cuer-
que B si A raya a By no es rayado por ste, al frotarlos entre s. Es una definicin pos y los ponemos en contacto con un tubo de vidrio en uno de cuyos extremos
operativa de dureza, es decir, verificable empricamente. Vamos a construir una lleva un pequeo depsito con mercurio. Observamos ahora el nivel alcanzado
escala de dureza, o sea, una escala para medir la caracterstica dureza. Elijamos por el mercurio en cada uno de los tres casos. Tendremos tres niveles termomtri-
diez cuerpos de naturaleza fsica distinta y ordenmoslos empricamente de acuerdo cos n 1 , n 2 , 11 3 Elegimos arbitrariamente una unidad emprica de medida, es decir,
con la definicin anterior. Pongamos en primer Jugar aquel cuerpo que es rayado una distancia arbitraria sobre el tubo de vidrio. Por sencillez, supongamos que las
por todos y no raya a ninguno. Pongamos en segundo lugar aquel que raya al pri- diferencias entr e 11 1, n 2 y n 3 contienen esa unidad un nmero entero de veces. Pa ra
mero (sin ser fyado por ste) y no raya a ninguno de los restantes (siendo rayado ser ms concretos, supongamos que la unidad emprica q ueda comprendida dos
32 / Estadistica para Ps,clogos Medi da en Ps,colog ia / 33
veces entre n 1 y n 2 , y ocho veces entre n2 y n 3 , es decir, que la diferencia entre n 2 arbitrario que llamaremos v. Aplicamos r. a las tres varillas A, B y C y contamos
y n 3 es cuatro veces mayor que la diferencia entre 11 1 y 112 (No se olvi de que todas el nmero de veces q ue v. cabe.en A, en B y en C. Supongamos q ue v. cabe tres veces
estas relaciones las estamos constatando empricamente.) en A, seis veces en B y 24 veces en C. Tenemos, pues, tres objetos manifestando la
Pues bien, una atribucin obvia de nmeros a las tres modalidades anteriores caracterstica longitud segn tres modalidades distintas y equivalentes respecti-
puede ser: 4, 6, 14. Entre estos tres nmeros aceptaremos como vlidas las rela- vamen te a tres, seis y veinticuatro veces la mod alidad unitaria.
ciones: 4 f 6 f 14, 4 < 6 < 14, 14 - 6 = 4(6 - 4). Una atribucin obvia de nmeros a las tres modalidades anteriores puede ser:
Evidentemente, la escala de intervalos permanece invariante frente a cualquier 3, 6, 24. Entre estos tres nmeros son vlidas las relaciones siguientes : 3 ef= 6+ 24,
transformacin de la forma y = ax + b, donde a y b son dos constantes arbitra- 3 < 6 < 24, 24 - 6 = 6(6 - 3), y, adems, 6/3 = 2, 24/3 = 8, 24/6 = 4, dado
rias. En otras palabras, seguiremos teniendo una misma escala de intervalos, que empricamente podemos comprobar que la modalidad longitud de B es
cuando, permaneciendo las mismas modalidades tipo, los nmeros atribuidos a doble de la de A , la de Ces ocho veces la de A y la de Ces c uatro veces la de B .
ellas son sometidos a una transformacin de la forma y = ax + b. Esto es debido Evidentemente, la escala de razn es invariante fren te a cualquier transforma-
a que son arbitrarios tanto el origen, como la unidad de medida. Por consiguiente, cin de la forma y = ax, d onde a es una constan te arbitraria . En o tras palabras,
tan legtima es la terna primitiva 4, 6, 14, como la terna (4a + b), (6a + b), (14a + b), seguiremos teniendo la misma escala de razn, cuando, permaneciendo, las mismas
donde a y b son dos constantes arbitrarias. As, por ejemplo, para a = 2 y b = - 5, modalidades tipo, los nmeros atribuidos a ellas son sometidos a una transformacin
tendremos la terna 3, 7, 23. Para esta nueva terna siguen siendo vlidas las tres de la forma y = ax. Esto es debido a ser a rbitraria la unidad de medida, pero no
relaciones que fueron vlidas para la terna primitiva, a saber, 3 4= 7 4= 23, 3 < 7 < el origen. Ahora el origen emprico corresponde siempre a la carencia total de la
< 23, 23 - 7 = 4(7 - 3). caracterstica, a la modalidad nula. No lo podemos elegir arbitrariamente donde
Ntese que la introduccin de la unidad emprica de medida legtima la suma y nos parezca.
resta entre los nmeros atribuidos a las modalidades y la multiplicacin y la divisin Por consiguiente, tan legtima es la terna primitiva: 3, 6, 24, como la terna:
entre las diferencias obtenidas a partir de dichos nmeros. Pero no legitima la mul- 3a, 611, 24a, donde II es una constante arbitraria. As, por ejemplo, para 11 = 5,
tiplicacin y divisin entre los nmeros mismos. La legitimidad de estas ltimas tendremos la terna : 15, 30, 120. Para esta nueva terna siguen siendo vlidas las
operaciones slo es posible cuando contemos con un origen emprico absoluto y mismas r elaciones que fueron vlidas para la terna primitiva : 15 ef= 30 f 120,
no con un origen meramente arbitrario. Ahora bien, esta arbitrariedad en el origen 15 < 30 < 120, 120 - 30 = 6(30 - 15), 30/ 15 = 2, 120/ 15 = 8, 120/30 = 4.
es propia de las escalas de intervalos. As, por ejemplo, el origen emprico d e iem-
peraturas en la graduacin centgrada no corresponde a la temperatura nula , a la
carencia total de calor, es decir, no es absoluto. Ese origen corresponde a la moda-
lidad o grado de temperatura a la cual se funde el hielo, es decir, es arbitrario. Con 2.6. Comentario sobre las escalas de medida
el mismo derecho podramos haber elegido como modalidad origen cualquier otra
temperatura inferior o superior a la que se funde el hielo. As se hace, por ejemplo, En primer lugar, la aceptacin de cuatro tipos de escalas es tan arbitraria como
en las escalas Fahrenheit y Reaumur. lo hubiera sido aceptar dos, veinticinco u otro nmero cualquiera . El mismo Stevens,
propugnador de las cuatro escalas, acepta la posibilidad de esquemas no cuatri-
partitos. Las anteriores escalas representan los cuatro tipos de uso comn . Otros
2.5.4. Escala de razn tipos son posibles (1968b, pg. 850). De hecho, otros autores han aceptado otros
tipos de escalas o han aceptado el cuatripartito d e Stevens, pero modificado .
Supongamos que, dadas dos o ms mo dalidades, no slo podemos comprobar En segundo lugar, conviene distinguir en tre medida y estadstica . Esta es una
empricamente la igualdad-desigualdad, el orden y cuntas veces la diferencia ciencia matemtica que comienza y concluye con nmeros, sin atender al origen
entre dos modalidades es mayor que la diferencia entre otras dos, sino, adems, ex tramatcmtico de los mismos y sin pretender in terpretaciones ul tramatem ticas
cuntas veces una modalidad es mayor que la otra. Por tanto, en tre dos nmeros (psicolgicas, por ejem plo ). La medida, en cambio, como atribucin de n meros a
atribuidos a las modalidades admitiremos como vlidas las relaciones igualdad- modalidades empricas (psicolgicas, en par ticular ), es el eslabn que une las modali-
desigualdad y orden, y las operaciones suma, resta, multiplicacin y divisin . dades empricas con los nmeros y, gracias a l, podemos interpretar empricamente
Supongamos que se trata de la caracterstica longitud. Elegimos tres va rillas (psicolgicamente, en particular) los resultados numricos fina les que nos ofrece la
metlicas que manifiesten la caracterstica longitud segn tres modalidades distin - estadstica. Los p uros estadsticos prescinden de las escalas de medida. As, por ejem-
tas. (Basta con escoger tres varillas tales que, al compararlas simultneamente, plo, Savage (1957, pg. 331 ). Los psiclogos, en ca mbio, no pueden adop tar una pos-
coincidaJ las tres en uno de sus extremos y difieran en el otro. ) Determinarnos tura aspticamente matemtica. Necesitan recoger da tos psicolgicos, atribuirles
arbitra'riarnente una unidad emprica de medida, es decir. un trocito de varil la nmeros, operar con estos nmeros e interpretar psicolgicamente los resultados
'l
'
li
: 34 / Estadistica para Psiclogos Medida en Ps,col og,a / 35

viene advenir, adems, que muchos de los q ue anatematiLa n a quienes usan ins-
1 finales. Si los nmeros con los que empezamos una investigacin estadstica estn
desligados de las realidades psicolgicas, no ser fcil dar una interpretacin psico- trumentos estad sticos sin encontrarse al nivel estricto de medida requerido por
lgica al resultado obtenido a partir de aquellos nmeros iniciales. estos ltimos, luego los utilizan ellos mismos sin graves escrpulos en circunstan-
cias idnticas o muy parecidas.
Est claro, pues, que como psiclogos no podemos prescindir de la interconexin
entre modalidades psicolgicas y nmeros, ni del paralelismo en tre la contextura
relacional de las modalidades psicolgicas y la contextura relacional de los nmeros.
Sin embargo, tampoco debemos exagerar la necesidad de este paralelismo. En 2.7. Resumen : Definiciones
efecto, si llevramos a sus ltimas consecuencias este isomorfismo entre modali-
dades psicolgicas y nmeros, nos sera imposible aplicar muchas de las tcnicas
estadsticas que muy frecuente y razonablemente usamos en Psicologa. Suponga- Supuesto que los objetos manifestaban cierta s caracter1sticas segn d iversas
modalidades, proponamos las siguien tes definiciones:
mos, por ejemplo, que tres personas A, By Chacen un examen de Geografia. Aunque
con las naturales reservas, podemos aceptar que la lectura imparcial de los tres ex- Medida : atribucin de nmeros a los objetos segn ciertas reglas. Estas reglas
menes nos permitir ordenar empricamente a las tres personas segn las modalidades se resumen en la siguiente: aceptar slo como vl idas entre los nmeros aquellas
bajo las cuales manifiesta cada una de ellas su ciencia geogrfica. Pero, nos atre- relaciones que sean verificables empricamente en tre las correspondientes modali-
dades.
veramos a determinar empricamente cuntas veces la diferencia de ciencia geo-
grfica entre A y B es mayor o menor que la diferencia de ciencia geogrfica entre Escala de medida: conjunto de modalidades (distin tas) y de nmeros (distintos)
By C? Esta determinacin no parece muy viable. Ahora bien, slo bajo esta con- relacionados bi un vocamente. Es decir, a cada modalidad le corresponde un solo
dicin los nmeros atribuidos a las tres modalidades pueden ser considerados nmero y a cada nmero una sola modalidad. Tendremos uno u otro tipo de escala.
corno autnticos nmeros, es decir, susceptibles de ser sometidos a operaciones segn que sean verificables empricamente ms o menos relaciones entre las moda-
aritmticas como la suma y la resta. En otras palabras, la atribucin de un 10, un lidades que forman parte de la escala. De acuerdo con este criterio. hemos distin-
g uido cuatro tipos de escalas.
9 y un 7 (con propiedades de nmeros estrictamente dichos) a las tres modalidades,
slo sera legtima si pudiramos comprobar empricamente que la diferencia entre a) Nominal: slo es verificable empricamente la igualdad-desigualdad.
la ciencia de A y la de B era la mitad que la diferencia entre la ciencia de By la de C. b) Ordinal: son verifica bles empricamente igualdad-desigualdad y orden.
Pero, como ya hemos dicho, esta comprobacin es muy dificil en una gran mayora c) De imerrulos : son verificables empricamente igualdad-desigualdad y orden.
de los casos que se presentan en Psicologa. Podemos, adems, comprobar cun tas veces q ueda contenida una unidad emp-
Qu decisin tornar ? Llegar a un compromiso razonable guiados por el sentido rica, elegida arbitrariamen te, dentro de la diferencia entre dos modalidades.
comn. Usar aquellas tcnicas estadsticas que creamos ms apropiadas en cada d) De razn; son verificables empricamente igualdad-desigua ldad y orden.
caso, en cuanto usndolas esperamos llegar, como psiclogos, a conclusiones Adems de poder comprobar empricamente cun tas veces queda contenida una
psicolgicas razonables. La experiencia parece confirmar que podemos llegar a unidad emprica , elegida arbitrariamente. dentro de la diferencia entre dos mo-
resultados numricos interpretables psicolgicamente, aunque las tcnicas esta- dalidades, podemos, tam bin, comprobar cun tas veces una modalidad cualquiera
dsticas utilizadas no hayan sido las ms oportunas, teniendo en cuenta el nivel contiene dicha unidad emprica.
o escala de medida requeridos por los datos. El mismo Stevens (1968) reconoce
este h echo. Por su parte, Amn (1 968) pudo comprobar cmo eran susceptibles
de una misma interpretacin psicolgica los resultados obtenidos a par tir de unos
datos, valindose de unas tcnicas que implicaban mero nivel nominal, de otras
que implicaban nivel ordinal y, finalmente, de otras que requeran nivel de in ter-
valos.
De todo lo dicho se desprende que no aceptamos la postura de textos como
Sender (1958), Freeman (1968), el mismo Siegel (1958), etc., que encuadran algo
rgidamente las tcnicas estadsticas dentro del esquema cuatripartito de Stevens.
Si con alguna frecuencia acudimos nosotros, tambin, a dicho esquema, ser
con gran flexibilidad y valindonos de l con fines preferentemente d idcti-
cos. En ningn caso condenaremos a los que, por ejemplo, calculen la media
aritmtic.(cfe las puntuaciones dadas por un profesor a sus alumnos en un examen
o use oiras tcnicas estadsticas sin encontrarse a su estricto nivel de medida . Con-
/!j
!I,
1
Ou es la Estadstica ? / 37

3 versitarios espaoles, pues d icha media aritm tica no es ms que la suma de las
alturas de la poblacin de universitarios espaoles dividida por el nmero de stos,
es decir, es una funcin definida sobre los valores numricos de la poblacin.
Qu es la Estadstica? Conviene distinguir entre la funcin, como tal, y el resultado numrico obte-
nido mediante la misma en cada caso concreto . La funcin es idntica en todos los
casos particulares. Por el contrario , el resultado numrico varia, en general, de
caso a caso.

3.1.4. Estadstico

Toda funci n definida sobre los valores numricos de una muestra. As, p or
ejemplo, ser estadstico la media aritmtica de las alturas de una muestra de 300 uni-
3.1. Conceptos previos versitarios espaoles.
Supongamos una poblacin constituida por diez personas a quienes hemos
3.1. 1. Poblacin aplicado una prueba objetiva. Tenemos diez observaciones y diez valores num-
ricos. Supongamos que stos son : 3, 12, 14, 8, 7, 7, 3, JO, 6, 8. Las puntuaciones
Conjunto de objetos (realmente existentes o posibles) que verifican una de- 8 y 10, por ejemplo, constituirn una muestra de esa poblacin . Ser un parmetro
finicin bien determinada. Por objeto entendemos cualquier persona, animal, cosa, la media aritmtica de las diez pun tuaciones (poblacin ), es decir, (3 + 12 + 14 +
operacin, famil ia, institucin, etc. As, por ejemplo, constituirn una poblacin + 8 + 7 + 7 + 3 + 10 + 6 + 8)/ 10 = 7,8. Ser un estadstico la media aritm-
los universitarios espaoles, las familias europeas, los coches fabricados al ao tica de las dos puntuaciones 8 y 10 (m uestra), es decir (8 + 10)/2 = 9.
por cierta empresa automovilstica, los posibles lanzamientos de un d ado. Consideremos ahora el sexo de las diez personas. Atribuyamos un J a los va-
rones y un O a las mujeres. Tenemos, tambin, diez observaciones y diez valores
numricos. Supongamos que stos son: O, 1, 1, O, 1, O, 1, l, 1, l. Ellos constituyen
3.1.2. Muestra la poblacin. Los tres primeros, por ejemplo , constituirn una muestra de esa po-
blacin. Ser un parmetro la proporcin de unos (varones ) en la poblacin
Cualquier subconjunto de una poblacin. La muestra hace siempre referencia
de las diez personas, es decir, 7/ 10 = 0,70. Ser un estadstico la proporci n de
a una poblacin de la cual es parte. Asi, por ejemplo, constituirn una muestra
de las anteriores poblaciones : 300 universitarios espaoles, 1.200 familias europeas, unos (varones) en la muestra de las tres primeras personas, es decir, 2/ 3 = 0,67.
213 coches, 80 lanzamientos de un dado.
Supongamos que observamos una caracterstica de los objetos de una pobla-
cin. Por ejemplo, consideremos la altura de los universitarios espaoles (pobla- 3.2. Definicin de Estadstica
cin). Tendremos una poblacin de observaciones y una poblacin de nmeros.
Paralelamente, observando la altura de una muestra de universitarios espaoles , Ciencia que recoge, ordena y analiza los datos de una muestra, extrada de cier-
tendremos una muestra de observaciones y una muestra de nmeros. ta pobl acin, y que, a par tir de esa muestra, valindose del Clculo de Probabili-
Es claro que, dada una misma poblacin de objetos, podemos tener diversas dades, se encarga de hacer inferencias acerca de la poi.ilacin.
poblaciones de observaciones y, consiguien temente, diversas poblaciones de n- Ordinariamente, las inferencias versarn sobre los parmetros d e la poblacin
meros, segn que estudiemos una u otra caracterstica. As, con los mismos uni- a partir de los estadsticos de la muestra. Pero, tambin, haremos inferencias acerca
versitarios espaoles, podamos haber considerado su peso, su capacidad inte- de la forma de la distribucin* de la poblacin, a partir de la forma de la distribu-
lectual, su actitud fren te a la guerra, etc. cin de la muestra. En cualquier caso las inferencias estarn basadas nicamente
en la informaci n objetiva contenida en la muestra. La informacin ser exclusi-
vamente objetiva, no su bjetiva ; contenida en la m uestra y no en o tras fue ntes ex-
3.1.3. Parmetro traas a la misma. Esta postura es la llamada clsica cuyo exponente mximo
ha sido Ronald Aymer Fisher (1890-1962). Nos limitamos a este punto de vista
Toda jtncin definida sobre los valores numricos de una poblaci n. As,
por ejemplo, ser parmetro la media ari tmtica de las alturas de todos los un i- "' En el captulo 4 trataremos sobr e di stribucin de frecuencias
11
i
!
38 / Estadistica para Psiclogos
Out! es la Estadistica? / 39
clsico por una doble razn. En primer lugar, slo con una base slida en esta-
dstica clsica es posible acceder a otros puntos de vista como el bayesiano o el A su vez, es prcticamente imposible presentar el muestreo sin haber expuesto
de la teora de la decisin . En segundo lugar, ni la estadstica enfocada bayesiana- algunas nociones previas de Probabilid ad.
mente, ni la teora de la decisin pueden presentar hoy un cuerpo de doctrina tan
estructurado como el que presenta la estadstica clsica. Adems, el enfoque clsico
hoy por hoy es mucho ms til en la aplicacin a los casos prcticos psicolgicos 3.4.2. Organizacin de los datos
que los otros dos enfoques.
Conviene distinguir entre Estadstica, estadsticas y estadstico (o estadsticos). Supongamos una muestra de 300 nmos a quienes aplicamos una prueba de
a) Estadstica es la ciencia acabada de definir. inteligencia. Estos nios manifestarn dicha caracterstica segn diversas modali-
b) Estadsticas son los resultados numricos obtenidos mediante la Estads- dades. Si la prueba consta de 20 pregu ntas, un conjunto posible de modalidades
tica : nmero de accidentes de trfico durante un mes, proporcin d e alcohlicos sera: ninguna pregunta bien respondida, una pregunta bien respondida, . .. ,
en diversas naciones, consumo medio semanal de leche por famili a, etc. veinte preguntas bien respondidas. Atribuyamos nmeros a esas modalidades.
e) Estadstico es todo valor numrico obtenido a partir de los valores pre- Una atribucin razonable (no la nica) puede ser la siguiente: un O a la primera
sentados por una muestra, segn lo dicho anteriormente. modalidad, un I a la segunda, . .. , un 20 a la vigsimo primera. (Recurdese que
Por supuesto, estadstico como sustantivo es, tambin, usado para denominar esta atribucin de nmeros, en rigor, no es propia de la Estadstica que comienza
a la persona dedicada a la Estadstica. Como adjetivo es utilizado para calificar a actuar sobre unos nmeros ya atribuidos previamente.)
personas y cosas relacionadas con la Estadstica. Tenemos, por tanto, 300 nmeros (varios de ellos necesariamente iguales entre
s) correspondientes a los 300 nios. Este conjunto desordenado de nmeros nos
ofrece una informacin muy pobre sobre la inteligencia de la muestra. Una orde-
3.3. Divisin de la Estadstica nacin razonable consiste en colocar los 21 nmeros posibles (O, 1, 2, .. . , 20)
de menor a mayor. Pues bien, al nmero de ceros le llamaremos frecuencia corres-
Segn la definicin acabada de dar en el prrafo anterior, la Estadstica cons- pondiente a la primera modalidad (mejor an, correspondien te al O, atribuido
ta de dos partes fundam entales: a la primera modalidad ), al nmero de unos le llamaremos frecuencia correspon-
a) Recogida, ordenacin y anlisis de los datos de una muestra. diente a la segunda modalidad (mejor an, correspondiente al 1, atribuido a la
b) Verificacin de inferencias acerca de la poblacin (de sus parmetros, d e segunda modalidad), ... , al nmero de veintes le llamaremos frecuencia corres-
la forma de su distribucin), a partir de la muestra (de sus estadsticos, de la fo rma pondiente a la vigsimo primera modalidad (mejor an, correspondiente al 20,
de su distribucin). atribuid o a la vigsimo primera modalidad). Por fin, llamaremos distribucin
La Probabilidad es el puente que nos permite pasar vlidamente de la muestra de frecuencias al conjunto de todas las modalid ades (mejor an, de todos los n-
a la poblacin, que legitima el salto desde las caractersticas (conocidas) de la mues- meros atribuid os a dichas modalidades) y de sus correspondientes frecuencias.
tra hasta las caractersticas (desconocidas) de la poblacin. De esta manera obtendremos una informacin ms clara sobre la inteligencia de
La primera parte constituye la Estadstica Descriptiva, cuyo cometido es des- la muestra.
cribir una muestra. La segunda parte constituye la Estadstica Jnferencial, cuyo Es posible que sean muchas vein tiuna modalidad es. Por esta razn, podamos
cometido es hacer inferencias sobre la poblacin, a partir de la muestra. En este reducirlas, por ejemplo, a siete clases, cada una de ellas con tres modalidades.
primer tomo nos limitaremos a la Estadstica Descriptiva. En el segundo tomo , La primera compuesta d e las modalidades: ninguna pregunta bien respondida,
tras unos captulos sobre Probabilidad, estudiaremos la Estadstica Inferencia!. una pregun ta bien respo ndida, dos preguntas bien respondidas. Y as, suce-
All discutiremos la diferencia entre Probabilidad y Estadstica y veremos el papel sivamente. En este caso la distribucin de frecuencias quedara constituida por el
que juega la Probabilidad en la fundam entacin de las inferencias estadsticas. conjunto de las siete clases (mejor an, por el conjunto de los siete nmeros atri-
buidos a las siete clases) y de sus correspondientes frecuencias. Por regla general,
este agrupamiento en pocas clases nos ofrece una informacin ms asequible que
3.4. Tareas de la Estadstica Descriptiva la ofrecida por las 21 modalidades.
En el caso de caractersticas no cuan tificables, por ejemplo, provincia de ori-
3.4.1 . Recogida de datos gen, podemos seguir haciendo algo anlogo a lo acabado de realizar. Suponga-
mos una muestra de J.000 espaoles que manifiestan la caracterstica provincia
Posponemos la consideracin de este apartado, dejndola para el tomo JI. de origen segn diversas modalidades. En principio el nmero de modalidades
Es muf dificil hablar de recogida de datos sin haber tratado sobre el muestreo. posibles es 50. Podemos atribuir los nmeros 1, 2, . .. , 50 a estas modalidades.
Tendremos 1.000 nmeros (varios de ellos necesariamente iguales entre s), corres-
j!
li
1
i1 40 / Estadstica para Psiclogos Ou es la Estadstica? / 41
pondientes a los 1.000 espaoles. Podemos seguir un esquema anlogo al anterior Estadslica ; ciencia que recoge, ordena y ana liza los datos de una muestra,
hasta llegar a una distribucin de frecuencias. De igual modo podemos reducir extrada de cierta poblacin, y que, a partir de esa muestra, valindose del Clculo
las 50 modalidades (provincias) a un nmero menor de clases (por ejemplo, ha- de Probabilidades, se t>ncarga de hacer inferencias acerca de la po blacin.
ciendo de cada regin una clase). Es claro que, bajo estas condiciones, las diversas Estadstica Descriptira; parte de la Es tadstica que se limita a recoger, ordenar
clases no estarn constituidas por el mismo nmero de modalidades. y analizar los datos de una muestra . Es d ecir, se limita a describir la muestra.
Estadstica Inferencia/: parte de la Estadstica que se encarga de hacer nfe-
rencias acerca de la poblacin a partir de una muestra extrada de la misma.
3-4.3. Anlisis de los datos

a) Supul'sla una sola caracterstica

En el caso de caractersticas cuantificables nos ser muy til obtener un solo


nmero, promedio de todos los nmeros de la muestra, y que, como tal, los repre-
sente a todos ellos y nos indique su posicin. Tambin, nos ser til obtener un
valor numrico que nos diga si los nmeros de la muestra se encuentran muy pr-
ximos entre s (y respecto del promedio de todos ellos) o muy distantes o dispersos
unos de otros. En resumen, calcularemos estadsticos de tendencia central o de
posicin y estadsticos de variabilidad o de dispersin.

b) Supuestas dos o ms caractersticas

Comenzaremos estudiando conjuntamente dos caractersticas. As, por ejem-


plo, podemos considerar la inteligencia espacial y la habilidad mecnica de 368 adul-
tos. Tendremos 368 pares de nmeros (cada persona tiene dos puntuaciones, una
en inteligencia espacial y otra en habilidad mecnica). A partir de ellos construi-
remos diversos ndices que nos manifiesten el grado de relacin existente entre
esas dos caractersticas y que nos permitan pronosticar, del mejor modo posible,
la puntuacin de una persona en una de las dos caractersticas, conociendo la que
ha obtenido en la otra. Veremos ms adelante cmo nos ser posible elaborar
ndices de correlacin e instrumentos de pronstico, tanto en el caso de variables
cuantificables como en el caso de no cuantificables, aunque sean distintos los modos
de alcanzarlos en uno y otro caso.
Estudiado el caso ms simple de solas dos variables, trataremos el caso de tres
variables.

3 .5. Resumen: Definiciones

Poblacin : conjunto de objetos (actuales o posibles) que veri fi can una defi-
nicin bien determinada.
Muestra: cualquier subconjun to de una poblacin.
Patjmetro : toda funcin definida sobre los valores numricos de una poblacin.
Esradsrico: toda funcin definida sobre los valores numricos de una muestra.
Q)
.e
ctl
;::
-
ctl
o>
-e ctl
.:3
(1)
o(1)
LU
ctl
e
::::,
Q)
-e
\..
1 ;
i

4
Organizacin de datos

4.1. Definiciones previas

4.1.1. Constante

Caracterstica que slo puede manifestarse bajo una nica modalidad. Por
ejemplo, la longitud de todas las circunferencias con el mismo radio.

4.1.2. Variable

Caracterstica que puede manifestarse segn dos o ms modalidades. Por


ejemplo, el peso, la inteligencia, la edad, la agudeza visual, etc. Cuando una carac-
terstica, en s misma variable, slo puede manifestarse bajo una modalidad, ser
considerada como constante. Por ejemplo, si estudiamos la extroversin en un
grupo de varones, diremos que la caraclerslica sexo se mantiene conslante en dicho
grupo .

Variable cualitatfra

Caracterstica que slo puede ser considerada a nivel meramente nominal :


sexo, profesin, lugar de origen, ele. Los nmeros atribuidos a sus moda lidades
solamente gozan de la relacin igualdad-desigualdad.

Variable cuasi cuantitatirn

Caraclerslica que puede ser considerada, como mximo, a nivel ordinal: du-
reza de los cuerpos, responsabilidad de un grupo d e operarios estimada por su ca-
...~ pataz, etc. Los nmeros atribuidos a sus modalidades slo' gozan de las relaciones
igualdad-desigualdad y orden.
1!

46 / Estadstica para Psiclogos Organizacin de datos / 47

Variable cua11tratim 4.2. Organizacin de datos

Caracterstica que puede ser considerada, al menos, a nivel de intervalos: peso, 4.2. 1. Variables cualitativas
inteligencia, fuerza fsica, nmero de hijos, etc. Con los nmeros atribuidos a las
mismas podemos realizar operaciones aritmticas. Warren (1974) investig la caracterstica tipo de color asociado a la palabra
paz (en tre otras). Para ello, la present a un grupo de cien personas, pidiendo
que cada una escogiese entre 4 colores (rojo, azul, amarillo y verde) el que mejor
Variable cuantitatira discl'l'la se ajustase a dicha palabra.
La distribucin de frecuencias fue la siguiente:
Caracterstica que no admite siempre una modalidad intermedia entre dos
cualesquiera de sus moda lidades: nmero de hijos, nmero de coches vendidos al
ao, nmero de caras al lanzar diez monedas al aire, etc. Una familia puede tener, Distribucin de frecuencias
por ejemplo, cuatro o cinco hijos, pero no cuatro y medio. Esta modalidad es im-
posible.
Color Frecuencia Proporcin Porcentaje
--- - -- - - - - -
Variable cuantitativa continua rojo 6 0,06 6
azul 58 0,58 58
amarillo 19 0,19 19
Ca racterstica que admite siempre una modalid ad intermedia entre d os cuales- verde 17 0,17 17
quiera de sus modalidades: fuerza fisica, lo ngitud, inteligencia, etc. - - - - ---
100 1,00 100

4.1.3. M odalidades y clases

Represemacin grfica
Como ya hemos indicado, frecuentemente es muy grande el nmero de moda-
lidades bajo las cuales puede manifestarse una caracterstica. Conviene reducir
estas mltiples modalidades a un nmero menor de clases. Estas clases deben
estar bien definidas (es decir, debemos saber claramente qu modalidades inclu ye
cada una de ellas dentro de s), deben ser mutuamente exclusivas (es decir, nin-
guna modalidad puede pertenecer simultneamente a dos o ms clases distintas),
deben ser exhaustivas (es decir, toda modalidad debe pertenecer necesariamente
a alguna de las clases).

4.1.4. Frecuencia, proporcin, porcentaje

Frecuencia (o, frecuencia absoluta) de una clase es el nmero d e observaciones


contenidas dentro de ella.
Proporcin (o, frecuencia relativa) de una clase es el cociente entre la frecuenc ia
1 1
absoluta d e dicha clase y el nmero total de observaciones (en todas las clases).
verde amarillo azul
Porcentaje de una clase es igual a la proporcin multiplicada por 1OO . rojo
Distribucin de frecuencias: conjunto de las clases y de las frecuencias (pro-
porciones o porcentajes) correspondientes a cada una de aquellas. O, mejor an ,
Los cuatro rectngulos anteriores tienen la misma base y sus alturas (y reas)
conjunto,<tle los nmeros atribuidos a las clases y de las frecuencias (proporciones
o porcntajes) correspondientes a cada una de aquellas. son proporcionales a las frecuenc ias (proporciones y porcentajes) correspondientes.
i:
: 1

48 / Estadistica para Psiclogos Organizacin d e datos / 49

Otras representaciones grficas son posibles: ciclogramas, pictogramas, etc. El A n ivel ordinal tiene sentido hablar de frecuencias, proporciones y porcentajes
fin de todas ellas es representar de modo intuitivo las frecuencias de cada una de acumulados (Fr. ac., Prop. ac., Porc. ac.). Ordinariamente, se suele comenzar la
las modalidades (o clases de modalidades). acumulaci n a parllr de la clase infe rior. As lo hemos hecho en el cuadro adjunto .
En el diagrama de barras las modalidades (o clases de modalidades) pueden La primera frecuencia acumulada es la frecuencia de la clase inferio~. La segunda
ser coiocadas en cualquier orden, pues representan distintos aspectos, no orde- frecuencia acumulada es la suma de las frecuen cias de las dos clases in feriores.
nados, de una caracterstica. La tercera frecuencia acum ulada es la suma de las frecuencias de las tres clases
En el ejemplo anterior las modalid ades eran slo cua tro y no pareca razona- infer iores o , lo que es equivalente, la suma de la segunda fre cuencia acumulad a
ble agruparlas en clases. Pero pueden darse otros casos en los que el agrupamiento ms la de la tercera no acumulada. Y as sucesivam ente. Por supuesto la ltima
en clases sea muy conveniente. As, por ejemplo, supongamos un colegio mayor frecuencia acumulada ser igual, siempre, a la frecuencia total. En n uestro ejemplo,
con 80 universitarios. Estudiemos la caracterstica carrera universitaria y su-
po ngamos que tenemos 15 modalidades d istintas: Filologa Clsica, Arte, Fsica, Primera frecuencia acumu lada : 147
Ingeniera Naval, Qumica, etc. Hagamos con estas 15 modalidades cuatro clases Segunda frecuencia acumulada : 147 + 129 = 276
que las engloben a todas ellas, de acuerdo con el siguiente esq uema: Tercera frecue ncia acumulada : 147 + 129 + 212 = 276 + 212 = 488
Cuarta frec uencia acumulada : 147 + 129 + 212 + 134 = 488 + 134 = 622
Distribucin de frccuC'llcias De modo anlogo se obtienen las proporciones y los porcentajes acumulados
a partir de las proporciones y porcentajes sin acum ular. Naturalmente, las pro-
Carrera univ. Frecuencia Proporcin Porcentaje porciones acumuladas p ueden, tambin , ser obknidas dividiendo cada frecuencia
-- - - acumulada por el total de las observaciones. As, en nuestro caso, 147/622 = 0,2363,
Letras 24 0,30 30 276/ 622 = 0,4437, 488/622 = O,7846, 622/622 = 1,0000_ Multiplicando por 100
Ciencias 28 0,35 35 estas proporciones acum uladas, obtendremos los correspondientes porcentajes
Ingeniera 8 0, 10 10 acumulados.
Derecho 20 0,25 25
- - --
80 l,00 100 Representacin grf ica

Con esta distribucin de frecuencias tendramos una representac10n grfica Usaremos el diagrama de barras, como antes. Sin em bargo, ahor a las clases
deben ser colocadas segn un orden bien determinado, pues represen tan aspectos
semejante a la anterior, con la nica diferencia que ahora cada barra representa a
ordenados de una caracterstica.
una clase de modalidades y no a una sola modalidad.
La figura 4. l y la figura 4.2 han sido construidas con distinta unidad de medid a.
La primera barra de la izquierda de la figura 4 .1 y la primera barra de la izquierda
4.2.2. V ariables cu as-cuantitativas de la figura 4.2 representan lo mismo, a saber, la frecue ncia (proporcin o por-
centaje) correspondiente a la modalidad mejora n ula. La razn de elegir una
Con objeto de investigar la eficacia diagnstica y teraputica de algunas tc- distinta unidad de medida ha sido meramente prctica. Si hubiramos elegido la
nicas clnicas, Harrower (1965) recopil los datos que exponemos a continuacin misma unidad, o la fi gura 4. 1 habra quedado excesivamente reducida, o la fig u-
sobre la mejora de 622 pacientes. ra 4.2 habra quedado exageradamente grande.

Mejora Free. Prop. Porc. Fr. ac. Prop~ ac. Porc. ac.
-- --- ---- - - 4.2.3. Variables cuant itat ivas discretas
Mxima (4) 134 0,21543 21.543 62 2 1,0000 100,00
Moderada (3) 212 0,34084 34,084 4 88 0,7846 78,46 Considerem os cierta situacin experimental en que una persona debe aprender
Leve (2) 129 0,20740 20,740 276 0 ,4437 44.37 una lista de pares de palabras, de manera que al presentar le una pa labra de cada
Nula (l ) 147 0.23633 23,633 147 0,2363 23,63 par sepa decir cul es la otra que forma parte del m ismo . Tomaremos como nd ice
- - - -- - - -- de dificultad de la tarea, el nmero de ensayos necesarios para asociar cada palabra
.,.""; - 622 1,00000 100,000 con la correspondiente de su par. A continuacin proponemos la distribucin


:I '
11
1

50 / Estadistica para Psiclogos


Organizacin de datos / 51

Representacin grfica

r--

.---
-
.---

(l) (2) (3) (4)

Fig. 4.J (Sin acumular) Fig. 4.2 (Acumulando)


1
de frecuencias y la representacin grfica acerca del nmero de ensayos necesitados 4 5 6 7 R 9 JO 1l 12 13
por un grupo de 59 estudiantes de Psicologa para aprender una lista de dificultad F ig . 4.3 (Sin acumular ) Fig . 4.4 (Acu mulando )
media formada por seis pares de palabras (Jez, 1976).
Respecto a la unidad de medida usada en la figura 4.3 y la usada en la figura 4.4
vale lo dicho para las figuras 4.1 y 4.2.
Dis1ribucin de frecuencias
Otra manera de representar grficamente las frecuencias acumuladas, en e(
caso de variables discretas, es la siguiente:
Nmero de ensayos Free. Prop. Porc. Free. ac. Prop, ac. Porc. ac,
------e~
13 2 0,0339 3,39 59 1,0000 100,00 ----e
12 2 0,0339 3,39 57 0,9661 96,61 --e
11 3 0,0508 5,08 55 0,9322 93,22
10 6 0,1017 10, 17 52 0,88 14 88, 14
9 10 0,1695 16,95 46 0,7797 77,97 ----<:
8 8 0,1356 13,56 36 0,6102 61,02 ~
7 7 0,1186 11 ,86 28 0,4746 47,46
6 6 0,1017 10,17 21 0,3559 35,59 ---e
5 JO 0, )695 16,95 15 0,2542 25,42 ----e
4 5 0,0847 8,47 5 0,0847 8,47

. f' . 59 0,9999 99,99 ---.e

6 9 10 11 12 13 14
11 ,
I
.,1
1 52 / Estadisttca para Psiclogos Organizacin de datos / 53
1
Este grfico es el que usaremos en Probabilidad para representar la funcin H abra que distinguir entre intervalos abiertos y cerrad os, abiertos por la de-
1 de distribucin (concepto muy parecido al de distribucin de frecuencias acumu- recha (izquierda) y cerrados por la izq uierda (derecha). En rigor, la amplitud de
ladas) en el caso de varia bles aleatorias discretas. cada intervalo elemental valdr la unidad de medida utilizada si nos valemos de
Ntese que los saltos vienen dados en los puntos 4, 5, 6, ... Por ejemplo. al intervalos semiabiertos. Sin embargo, estas distinciones, aunque importantes a
punto 6 (necesitar 6 o menos ensayos) le corresponde exactamente la proporcin nivel matem tico, tienen poca importancia a n ivel psicolgico-estadstico . Por
acumulada 0,3559. Al punto 7 le corresponde 0,4746. A todos los puntos en trt: 6 ello, las pasaremos po r alto y aceptaremos un mismo valor com o lmite exacto
y 7 (excluido el 7) les hacemos corresponder la proporcin 0,3559, pues necesitar comn de dos intervalos consecutivos, admitiendo que la amplitud de cada in -
6,45: 6,78: ... (cualquier valor entre 6 y 7, excluidos ambos) equivale a necesitar tervalo elemental vale la unidad de medida.
seis ensayos, ya que es imposible necesitar seis ensayos y una fraccin de ensayo.
Por eso, a todos los valores entre 6 y 7 (excluidos a mbos ) les hacemos corresponder
la misma proporcin que corresponde al punto 6 (necestar seis ensayos). 4.2.4.2. Interva los elementales y compuestos

Recordemos que cada valor d iscreto representa a todos los valores situados
4.2.4. Variables cuantitativas continuas media unidad a su izquierda y meda unidad a su derecha. Es decir, con cada va lor
discreto va asociado un intervalo de amplitud unidad qu e hemos llamado element al.
4.2.4.1. Interpretacin continua de los valores discretos Llamaremos intervalo compuesto (o, simplem ente, intervalo) al conjunto de var ios
intervalos elemen ta les consecutivos. Por regla general, todos los inte rvalos com-
puestos (para un conjunto de datos) contendr n cada uno de ellos e l mism o n -
Consideremos, por ejemplo, la longitud. Entre dos modalidades cualesquiera mero de intervalos elemen tales.
existe un nmero infinito de modalidades posibles. Sin embargo, de hecho, slo
somos capaces de detectar un nmero finito de ellas, debido a la imperfeccin del
instrumento de medida, en este caso, la regla. Cuanto ms fina sea dicha regla. es 4.2.4.3. Lmites exactos y lm i tes apa rentes
1 decir. cuanto mayor nmero de subdivisiones contenga, tanto mayor ser el e-
mero de modalidades que podremos detectar. Pero, en todo caso, ese nmero 1rr Supongamos que en u na investigacin el valor discreto mnimo obtenido es 8
finito, por culpa del instrumento de medida. En conclusin, la variable que en s y el mxim o es 19. Los va lores-discretos posibles (incluy~ndo el 8 y el 19) ser.in:
misma es continua se manifiesta, de hecho. como discreta. El nmero de modali- 8, 9, 1O, 11, 12, 13, 14, 15, 16, 17, 18, 19. Cada uno de ellos representa un intervalo
dades discernibles es finito y, por ta nto, ser finito el nmero de va lores atribuibles elemental unitario. Formemos un intervalo compuesto con los intervalos elemen-
a dichas modalidades. Contemplemos algo ms despacio este nm ero finito le tales r epresentados por 8, 9 y 10. D ado que es 7,5 el limite exacto inferior del in-
valores discretos. tervalo elemental representado por el 8 y es 10,5 el lmite exacto superior del inter-
Supongamos que nuestra regla no discierne ms all de los centmetros. Ello valo elemental representado por el 10, ac;eptaremos 7,5 como lmite exacto
nos permitir atribuir valores tales como 1,87, 1,88, 1,89, por ejemplo, pero 110 inferior del intervalo compuesto y 10,5 como lmi te exacto superior del mismo .
valores intermedios. Ahora bien, esta limitacin, segn lo visto, es debida a la m- Por consiguiente, tendremos 4 intervalos compuestos cuyos lmites exactos sern :
perfeccin del instrumen to material de medida, no a que sean imposi bles esos ,i,a- 7,5-10,5 ; 10,5-13,5 ; 13,5-16,5; 16,5-19,5 . Llamaremos lmites aparentes de estos
lores intermedios. Por ello, p ara salvar la con tinuidad, vamos a admi tir que C11.rla cuatro in terva los a: 8 - 10, 11 - 13, 14 - 16, 17 - 19. Ntese que estos valores
valor discreto r epresenta a todos los infini tos valor es situados media unidad ,de aparentes son los nicos que, de hecho, p ueden aparecer.
medida (medio centmetro ) a su izquierda y media unidad a su derecha. En n uestro
caso. l ,68 representa a los infinitos valores que van desde J ,675 hasta 1,685 (in -
cluid o el mismo 1,68), el valor 1,69 representa a todos los valores que van da;de 4.2.4.4. Amplitud y punto medio de los i ntervalos. A mp litud tota l
1.685 hasta 1,695, etc. Es decir, 1,68 representa a una clase con infinitas modali-
dades. Llamaremos intervalo elemen tal a cada una de estas clases. D inmos La ampli tud de un intervalo es la diferencia ent re su lmite exacto superior y
que 1,675 es el lmite exacto inferior del intervalo representado por 1,68, y l.685 su lmite exacto inferior. En el ejemplo anterior la amplitud de los cuatro intervalos
su lmite exacto superior. Diremos que 1.685 es el lmite exacto inferior del ima.er- ser: 10,5 - 7,5 = 13,5 - 10,5 = 16,5 - 13,5 = 19,5 - 16,5 = 3. Aceptamos
valo representado por l ,69, y 1,695 es su limite exacto superior. Admitiremos, como punto medio de cada intervalo la media aritmtica de sus d os lmites exac-
por t~o, q ue 1,685 es, a la vez, limite exacto superior de un intervalo y lmite tos. As, los puntos medi os de los intervalos anter iores sern : (7.5 + 10,5)/2 = 9,
exacto inferior del intervalo siguiente (10,5 + 13.5)/2 = 12, (13,5 + 16,5)/2 = 15, (16,5 + 19.5 )/2 = 18. A los mismos
1 ,
, 1
1
r

54 / Estadstica p ar a Psiclogos
Organ,zac,n de datos / 55

Ordenemos estas puntuaciones:


resultados habramos llegado calculando la media aritmet1ca de los dos lm ites
aparentes de cada intervalo. En el ejemplo ante rior: (8 + 10)/2 = 9, (11 + 13)/2 = 6 6 6 6 7 7 8 8 8 8 9 9 9 9 JO 10
12, (14 + 16)/2 = 15, (17 + 19)/2 = 18. 11 11 11 11 11 12 12 12 12 12 12 12 12 12 13 13
Llamaremos amplitud total de una serie de valores numricos a la diferencia 13 13 14 14 14 14 14 15 15 15 16 16 16 16 17 17
entre el lmite exacto superior del intervalo mximo y el lmile exacto infe rior del 19 19
intervalo mnimo. En nuestro caso , 19,5 - 7,5 = 12 .
Decidimos elegir cinco in terva los . La a mpli tud total vale 19,5 - 5,5 = 14.
Calculamos 14/5 = 2,8. La amplitud mnim a posible d e cada intervalo ser 3.
4.2 .4.5. Nmero y amplitud de los intervalos
Y, por ello, la elegimos como ampli tud comn a los cinco intervalos.
Ordinar iam ente, se suele comenzar por fija r el lmite inferior del intervalo m -
Para una misma amplitud total, si aumenta el nmero de intervalos, tan to menor
nimo. Hay varias reglas convencionales en la eleccin de dicho lmi te. Segn unos,
ser la a mplitud de cada uno de ellos. Se recomienda que, con 100 o ms observa-
debe ser la pun tuacin mnima (en nuestro caso 6). Segn otros, debe ser mltiplo
ciones, el nmero de intervalos no sea meno r que 12, ni mayor que 18. Segn otros,
de la a mplitud elegida (en nuestro caso, 3, 6). De acuerdo con algunos autores,
ni menor que 10 ni mayor que 20. Sin embargo, ninguna de estas reglas es inllexible.
es mejor comenzar lijand o el lmite sup erior del intervalo mximo. Desde luego,
Elegiremos en cada caso la regla que juzguemos ms oportuna.
estas reglas son convencionales y no tenemos por qu acomodarnos a ellas.
Ordinariamente, comenzamos fijando el nmero de intervalos en funcin del
La distr ibucin de frecuencias en n uestro caso puede ser la sigu iente ;
nmero total de observaciones. La amplitud de cada uno de los intervalos, d epen-
der de la amplitud total , una vez fijado su nmero . Por ejemplo, suponga mos
que 8, 8, 10, 1l , 11 , 12, 14, 15, 15, 15, 17, 19, 20, 2 1 son las puntuaciones obtenid as
en una prueba por 14 personas. La amplitud total es 21 ,5 - 7,5 = 14. Suponga- Free. Prop. Porc. Fr. ac. Prop. ac. Porc. a c.
mos que decid imos hacer tres intervalos. La amplitud de cada uno de ellos tiene que
ser 5 por lo menos. Si fuera slo 4, alguna puntuacin quedara no contenida den- 17-19 //// 4 0,08 8 50 1.00 100
tro de esos tres intervalos. As, aceptando como intervalo nfimo el 8-11 , el segun do 14-16 lfl/ fH/ // 12 0,24 24 46 0,92 92
sera el 12-15 y el tercero el 16-19. No quedaran incluidas dentro de ello s las pun- 11-13 . fH/ fH/ 11/ 18 0,36 36 34 0.68 68
tuaciones 20 y 21. La amplitud 5 sera suficiente, pues dentro de tres intervalos 8-10 /fl/ fH/ 10 0,20 20 16 0,32 32
de amp litud 5 pueden caber todas las puntuaciones. (Advirtase que, tam bin, 5.7 lfl/ I 6 0,12 12 6 0,12 12
podran caber dentro de tres intervalos de amplitud 6, 7, 8, 9, 10, 11 y aun 12.) Lo
ordinario es elegir la mnima entre todas las posibles. En el caso an terior elegira- 50 1,00 100
mos la amplitud 5. Con esta amplitud seran posibles dos ternas de intervalos:
(8-1 2, 13-17, 18-22) y (7-11 , 12-16, 17-21 ).
Segn algunos autores, es preferible elegir amplitudes iguales a uno de los va- D esde luego, podamos haber elegido 14 intervalos de amplitud unidad y cuyos
lores siguientes: 1, 2, 3, 5, 10 20. Estos nmeros y sus mltiplos son fcilmente p untos medios fueran 6, 7, .. . , 19. Es claro que, bajo esta cond icin, las puntua-
manejables. Sin embargo , este cr ite rio es a rbitrar io y puede ser rech azado siempre ciones originales coincidirn con los puntos medios de los intervalos un itarios.
que sea conveniente.

4.2.4.7. Represent aci n g rfica


4.2.4.6. Distribucin de frecuencias
a) His1ograma y polgono de fi-ecuencias 110 acumuladas
Cinc ue nta estudiantes han obtenido en un a prueba de in teligencia las siguientes
puntuaciones: Com enzam os aceptando que todos los intervalos tienen la m isma a mplitud.
Esto supuesto, sobre cada uno de ellos, como base, levantamos un r ec1ngulo cuya
8 JI t i 8 9 JO 16 6 12 19 13 14 9 13 15 9 altura (y rea) sea proporcional a la frecuencia (p roporcin o porcentaje) no acumu-
.,.12 16 8 7 14 11 15 6 14 14 17 11 6 9 10 19 lados de dic ho intervalo . Llamamos histograma de frecuencias no acumu ladas a
.. 12 11 12 6 15 16 16 12 13 12 12 8 17 D 7 12 este conjunto de rectngulos consecutivos.
14 12
Orgamzac,n de da tos / 59
58 / Estadistica para Ps,clogos
TABLA 4. 1
4.2.4.8. Normas prcticas para las representaciones grficas Distribucin d" edades correspondwntes a los 1aro11es

a) El eje de abscisas (horizontal) representar las puntuaciones de la variable Edad Free. Pro p. Po rc. 1- rec. ac. Prop. ac. Porc. ac.
de que se trate, y el eje de ordenadas (eje vertical) re presentar las frecuencias , pro- -- -- - -
20-2 1 17 0, 1954 19.54 87 1,0000 100,00
porciones o porcentajes.
21 0.2414 24,14 70 0,8046 80,46
b) En el eje de abscisas pondremos las puntuaciones menores a la izquierda 18-19
16-17 33 0,3793 37,93 49 0,5632 56,32
y las mayores a la derecha. En el eje de ordenadas pondremos las frecuencia s me- 16 0. 1839 18.39
14- 15 15 0, 1724 17.24
nores abajo y las mayores arriba. 1 0,01 15 1, 15 l 0.0 115 1.15
12-1 3
e) La unidad de medida elegida en cada uno de los ejes ser tal que el grfico --
construido tenga una altura y una anchura cuya relacin aproximada sea igual 87 1,0000 100,00
a 3/ 5. Es decir, si tiene una altura de 9 cm, por ejemplo, deber tener una anchura
aproximada de 15 cm . T ABLA 4 .2
d ) La interseccin de los dos ejes ser tomada como orige n de puntuaciones Distribucin d, edades torrespondientes a la., mujeres
en el eje de abscisas y como origen de frecuencias, proporciones o porcentajes en
el eje de ordenadas . Edad Free. Prop. Porc. Free . ac Prop. ae. Pore. ac.
e) Si la puntuacin mnima de que se trate es alta y la frecuencia mnima en -- - -
20-21 13 0. 1857 18,57 70 1,0000 100,00
cuestin es, tambin, alta, tanto en el eje de abscisas como en el de ordenadas se
18-19 25 0,3571 35,71 57 0,8 143 81,43
suelen hacer dos cortes, segn la figura adj unta.
16-17 16 0,2286 22,86 32 0,4571 45,71
14-15 16 0.2286 22,86 16 0,2286 22.86
12-13 o 0,0000 00.00 o 0,0000 00,00
-
70 1,0000 100,00
v.
"'
;:;
e
0,40
"~ _ __ __ varone s
u: /\
- -- - - ~ mujeres I \
I \
~
I \
0 ,30
"'
80 90 100 1 ro 120
-e
"'
]
\\
Cocie ntes lntelec tua1cs \
"o ,- \
C
0,20 1
/) Conviene indicar explcitamen te qu repr esenta el grfico en ge neral y ~
I \
" \'
-~"
qu representa cada uno de los ej es, siempre que sea necesario. I ~
I \\
Por supuesto, las anteriores normas son convencionales y slo las seguiremos o
en tanto que nos sean tiles. e
~
0 , 10
I
l.
I \\
~
i
/

4.2.4.9. Polgonos de frecuencias de varios grupos


considerados conjuntamente
/J
'
Veamos la distribucin de edades de 157 a do lescentes (87 var ones y 70 muje- l0.5 12.5 14,5 16,5 18 .5 20.5 22.5
res ) con<lerectos auditivos y en los cuales Balow, Fulton y Peploe (1 971) estudia ron Edades
algunas implicaciones educa tivas de la sordera .

... r.:"
.
h~<
/2
~... ? .
1 TI
!

1

60 / Estadisllca para Psiclogos Organizacin de datos / 61

bk la masa informe de datos primitivos. Sin em ba rgo , tiene el inconvenien te de


1,00 '-"arones
falsear ms o m enos, de cercenar en parte, la informacin contenida en los datos
mujeres originales. En resumen, la informacin o frecida por los d atos no agrupa dos es la
~
h verdadera e ntegra, pero es menos manejable . La informacin ofrecida por los
~
datos a grupados es ms manejable, pero es menos ntegra y verda dera.
"
"C
'l
"
,; '
I
/ 4.3. Resumen : Definiciones
"
~
0.50 I
"ee: /
/
2 '/
/ Constante: caracters tica que slo puede m an ifestarse bajo una nica moda-
e
c. 1/
o lidad.
; Variabll': carac terstica que puede ma nifestarse bajo dos o ms modalidades.
/,
/ Variable cua/itatim: caracterstica que slo puede ser considerada a nivel me-
/.
? ramen te nominal.
Variable cuasi cwmtit,1tira: ca racterstica que slo puede ser considerada a
nivel mxim o ordinal.
11.5 13,5 15 ,5 17,5 19.5 21.5 Variable cuamitatim : caracterstica que puede ser considerada, a l menos, a
nivel de interva los.
Edades
Variable cuantitatim discreta : carac terstica que no admite siempre una mo-
dalidad intermedia entre d os cua lesquiera de sus modalidades.
Valindonos de proporciones no a cumuladas y d e proporciones acumuladas.
Variable cuantitativa cominua : ca rac terstica que admite siempre una moda-
tendremos las dos representaciones grficas anteriores .
lidad interm edia entre dos cualesquiera de sus modalidades.
Frecuencia de una clase : nmero de observaciones contenidas dentr o de ella.
4.2.4 .1O. Datos sin agrupar y agrupados Proporcin de una clase: cociente entre la frecuencia de una clase y e l nmero
total de obse rvaciones.
Agrupar ciertas puntuaciones en intervalos implica h acerlas equivalen tes a los Porcentaje de una clase: proporcin de la misma m ultiplicad a por I OO.
puntos medios de los intervalos dentro de los cuales se e ncuentra cada una de ellas. Distribucin de frecuencias: conjunto de nmeros, a tribuidos a las modali-
As, por ejemplo, al agrupar en cinco intervalos las cincuen . 1 puntuac iones pro- dades o clases, y de las frecuencias (propo rciones o porcentajes) correspondientes
puestas en el aparta do 4.2.4.6, nos quedaremos con slo cinco va lores distintos, a cada una de aquellas.
los puntos medios de los cinco intervalos. Es decir, /mermlo: tratndose de vana bles continuas, clase compuesta de infinitas mo-
dalidades o, mejor, com puesta de los infinitos nm eros a tribuibles a dichas m o-
6, 6, 6, 6, 7, 7 (dentro del intervalo 5-7) equivaldrn a 6. dalidades y situados entre dos valores numricos que llamaremos sus lmites e.me-
8, 8, 8. 8, 9, 9, 9. 9, 10, 1O (d entro del intervalo 8-10) equivaldrn a 9. tas. Llamaremos amplitud d el intervalo a la diferencia en tre esos dos lmites exac-
11 , 11, 11, 11 , 11, 12, 12, 12, 12, 12, 12, 12, 12, 12, 13, 13. 13, 13 (dentro d el inter- tos y pumo medio a la semisuma de dichos lm ites. D iremos que u n intervalo es
valo 11 - 13) eq uivaldrn a 12. elemental si su amplitud es la unidad de medida utilizada y diremos que es com-
14, 14, 14. 14, 14, 15, 15, 15, 16, 16, 16, 16 (dentro del inte rvalo 14- 16) equivaldrn puesto si su amplitud es mayor que dicha unidad.
a 15.
Histograma : supuesto que todos los in terva los tienen la m isma a mplitud. le-
17, 17. 19, 19 (den tro del in tervalo 17-19) equivaldrn a 18. vantamos sobre cada intervalo , como base, u n rectngulo c uya a ltura (y rea)
sea proporcional a la frec uencia (proporcin o porcentaje) de dicho inter valo, lla-
Si el nmero de da tos fuera mayor (por ejemplo , 350), haciendo diez interva los mando histograma a l conjunto de estos rectngulos consecutivos.
nos queda ramos slo con d iez p untuac iones distintas. Evidentemente, es ms Polgono de fi-ecuencias: dibujado un pun to sobre la mitad del lado sup erior
manejable el nuevo conjunto de d iez datos distintos que el conjunto d e las puntua- (el opuesto a la b ase) de cada rectngulo, unimos cada d os puntos consecutivos
ciones q~gm ales y tanto ms manejable, cuanto mayor sea el nmero de p untuacio- mediante un segmento rectilneo, llamando polgono de frecuencias a la lnea o rigi-
nes originales distintas. El agrupamiento tiene la ventaja de hacer ms maneja - nada po r este conjunto d e segmentos rectil neos.
I !"J
62 / Estad,st,ca para Ps,clogos
Organizacin de datos / 63
EJERCICIOS
Calcular las proporciones y porcentaj es correspondientes a cada una de las cate-
goras y dibujar el correspondiente diagrama de barras.
4.1. , Cules son los lmites exactos de los siguientes intervalos 9
4.8. A partir de la siguiente distribucin de frecuencias, calcular las frecu encias
a) 15 - 24 b) 62,5 - 68,5 e) 20,0 - 20, 8 d) 44.35 - 54,35 acumuladas y las proporciones y porcentajes sin acumular y acumulados. Dibujar,
adems, el histograma y el polgono de frecuencias, considerando stas sin acumu-
4.2. Cul es la amplitud de los intervalos anteriores? lar y acumuladas.

4.3. Cul es su punto medio ?


X 11
4.4. En un examen de Estadstica los alumnos han obtenido las siguientes pun -
tuaciones: 16, 18, 26, 15, 17, 21, 27, 21, 21 , 26, 14, 20, 23, 16, 19, 24, 22, 23, 20, 26, 20-24 12
18, 20, 14, 17, 21 , 17, 24, 27, 18, 17, 25, 19, 22, 21 , 21, 15, 24, 22, 15, 18. 15- 19 18
Preparar una distribucin de frecuencias, sin acumular y acumuladas, introdu- 10-14 24
ciendo intervalos de amplitud 3. Calcular las proporciones y porcentajes sin acumu- 5-9 16
lar y acumulados. 0-4 10

4.5. Dibujar el correspondiente histograma y el polgono de frecuencias sin acumu-


lar y acumuladas a partir de los datos del ejercicio anterior. 4.9. Las puntuaciones en una prueba de inteligencia abstracta han sido las si-
4.6. A parlir de la siguiente distribucin de frecuencias, calcular las frecuencias guientes:
acumuladas y las proporciones y porcentajes sin acumular y acumulados. Dibujar,
adems, el histograma y el polgono de frecuencias, considerando stas sin acumu- 91 , 92, 83, 81, 88, 94, 9 1, 87, 90, 94, 85, 85, 93, 90, 89, 86, 87, 89, 85, 89
lar y acumuladas.
Preparar una distribucin de frecuencias, sin acumular y acumuladas, in troducien-
X ni do intervalos de amplitud 4. Calcular las p roporciones y porcentajes sin acumular
y acumulados.
17-19 8
14-16 9 4.10. Dibujar el correspondiente histograma y el polgono de frecuencias sin
Jl-13 12 acumular y acumuladas a partir de los datos del ejercicio an terior.
8-10 10
5-7 7
2-4 4

4.7. Durante el curso 1971 -1972 en las Facultades universitarias estatales espa-
olas estaban matriculados los siguientes alumnos:
Facultad de Ciencias . . . . . .. .. . 42.572
Fac. de Cienc. Polit. Econm . y Comerc .. . 25.683
Fac. de Derecho. . . . . . . . . . . . . ...... . .. . 22.665
Fac. de Farmacia. . . . . . . . . . . . ... . . .. . . 8.083
Fac. de Filosofia y Letras .. .. ... . . . ... . 49.049
Fac. de Medicina ......... .. . .. .. .... . 37.578
Fac. de Veterinaria .. . . . . . . . . . . . . . ... . 2.166

187.796

FUENTfi--Comentaro soco/gco, Esm,c1ura social de Espaa. 1973-74. Confederacin Espaola


, de CaJas de Ahorro , ao 11 , nms. 4-5 .
. 1
'1
1

'
!1
Estadisr,cos de posicin o tend enc,a central / 65

5 Es decir, la med ia ari tmtica de 11 valores no es ms que su suma divid ida por
el n mero de ellos.

Estadsticos de posicin o tendencia central 5.2.2. Clculo

a) Dalos 110 agrupados

Aplicacin directa de la frm ula (5.1) a los datos o riginales. es decir. sumando
una a una las 11 puntuacion es y dividiendo el resu ltado por 11 .
EJEMPLO 5.1. Para obtener un ndice de la carga de significacin que posee la
palabra GOLA, Jez (1 976) la present a 23 personas con objeto de observar
el nmero de palabras que GOLA suscitaba en cada persona d urante cuarenta y
cinco segundos y obtuvo los siguientes r esultados:
5.1. Introduccin
10, 5, 2, 7, 9, 5, 7, 6, 5, 9, 12, 2, 6, 6, 9, 12, 6, 6, 6, 4, 9, 7. 12
Supongamos que deseamos comparar el aprovechamiento en Estadistica de una
muestra de 200 varones con el de otra muestra de 250 mujeres. Esta comparacin La media aritm tica fue tomada como ind ice de la carga de significacin de
ser muy difcil si hemos d e tener en cuenta todas las puntuaciones de ambos gru- GOLA y vali:
pos. Lo que solemos hacer es comparar el promedio de la primera muestra con el
promedio de la segunda. En otras palabras, lo que hacemos es determinar un esta- i = JO+ 5 + 2 + + 7 + 12 = 7,04
dstico (funcin de las puntuaciones de la muestra) que nos ofrezca la posicin 23
de una y otra muestra en la variable aprovechamiento. En general, este tipo d e
estadsticos se utiliza para darnos la posicin de cada una de las mues tras a las qu e b) Dalos agrupados
va representando y, por esta razn, deber ir tomando siempre un valor situado
hacia el centro de las puntuaciones de cada una de dichas muestras. Debido a esta Supongamos n observaciones agrupadas en r in terva los, lod os ellos de igua l
circunstancia, suelen ser llamados de posicin o tendencia central. amplitud. Sea X , el pun lo m edio del intervalo primero y 11 1 el nmero de observa-
Antes de comenzar a estudiar estos estadsticos, el lector d ebe consultar el ciones dentro del mismo. Sea X2 el pun to med io del in tervalo segundo y 11 1 el n-
Apndice A que trata sobre el signo de sumar :E. Este signo ser utilizado muy mero de obser vaciones d entro del mismo. Sea X, el punto m edio del intervalo r
profusamente de ahora en adelante y, por ello, conviene que el lector se familia- y n, el nmero de observaciones dentro del mismo . Segn sabemos, al agrupar las
rice con su uso. pun tuaciones en in tervalos, atrib uimos a cada u na de ellas (como pun tuacin )
el punto medio dentro d el intervalo dentro del cual se encuentra. Por consiguien le,
dentro del intervalo primero tendremos n 1 puntuacrnnes iguales a X , y su suma
valdr n 1 X 1 Dentro del intervalo segundo tendrem os 112 pun tuaciones igua les
5.2. Media aritmtica* a X, y su suma valdr n 2 X 2 . Dentro del intervalo r- sim o tendremos 11, puniuacio-
nes iguales a X, y su suma valdr n,X,. En conclusin, la suma !Otal de las n, + 11 2 +
5.2.1. Definicin + + n, = n puntuaciones valdr n 1 X 1 + 111 X 2 + + n,X, y su med ia ar it-
mtica valdr

Dados n valores, X 1 , X 2 , .. , X., su media aritmtica, i , viene d efin ida por


X= 111 X, + 11 2 X 2 + + 11,X, = I:n 1X1 ~ ~~
(5.2 1
11, + 11 2 + + 11, r.11
1
n
X = Xi + X i .... + X. ~X, (5.1 )
EJEMPLO 5.2. Valin donos de los d atos del ej emplo 5.1, agrupmoslos ,:n
.,, }/ ll
cuatro intervalos de acuerdo con el cuadro siguiente y calculemos su media aril-
- mtica.
"' Siem pre que u semos )a expresin .. meda,. , nos r eferimos a la .-:media aritmtica .
I:I'
1 : :
Estadist,cos de posici n o tendenci a central / 61
66 / Estadistica para Psiclogos

5.2.3. Propiedades
X ", x, n)X1

a) Si k = X, la suma de las diferencias den pun tuaciones X 1 , X 2 , . . , Xn res -


10-12 4 11 44
pecto a k vale cero. Es decir, la suma de las diferencias den puntuaciones X 1 , X 2 , . ,
7-9 7 8 56
50
x = !~ = 6.70 X respecto a su media vale cero .
4-6 10 5 23
1-3 2 2 4 " En efecto, si k = X tendremos

23 154 - - :EX
:E(X.t - k ) = :E(X l
- X) = :EX t
- nX = :EX - n - /l '
J
= :EX. 1
- :EX- = O
1

Ntese que la definicin de media es la misma : sumar n puntuaciones y dividir a ' ) Si la suma de las diferencias de n puntuaciones X 1 , X2 , , X,, respecto
esa suma por n. Las que no suelen ser exaclamente iguales son las puntuaciones
a k vale cero, k = X.
antes y despus del agrupamiento en intervalos. As, comparando el ejemplo 5.1 En efecto, si se verifica que :E(X, - k) = O, entonces :EX, - nk = O. Es decir,
con el ejemplo 5.2, lenemos: :EX; = nk. Por tanto,
EJEMPL-0 5.1: 2, 2, 4, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 9, 9, 9, 9, 10, 12, 12, 12
k =:EX, = X
EJEMPLO 5.2: 2, 2, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 8, 8, 8, 8, 8, 8, 8, 11 . 11 , 11, 11 11

Consiguientemente, el valor de la media aritmtica obtenida a partir de ciertos . 16 .


datos no agrupados en intervalos diferir, en general, del valor de la media arit- EJEMPLO 5.4. La media de 1, 2, 5, 8 vale- = 4. Pues bien. (1 - 4 ) + (2 - 4) +
4
mtica obtenida a partir de estos mismos datos, pero agrupados en in tervalos. + (5 - 4) + (8 - 4) = (-3) + ( -2) + (1 ) + (4) = O.
Adems, este ltimo valor ser en general, uno u otro segn que los mismos datos
sean agrupados de una u otra manera. b) Si k = X, la suma de las diferencias cuadrticas de n puntuaciones X 1,
Por supuesto, podamos haber elegido intervalos de amplitud unidad, cuyos X 2 , . , X0 respecto a k es mnima. Es decir, la suma de las difer encias cuadrticas
puntos medios coincidan con nmeros enteros consecutivos y tales que dentro de n puntuaciones X 1 , X 2 , . , x. respecto a su media es menor que la suma de las
de la sucesin de stos se encuentren las puntuaciones originales. Naturalmente, diferencias cuadrticas respecto a cualquier o tro valor distin to de la media.
bajo estas condiciones coincidirn la media aritmtica obtenida mediante datos
no agrupados y la obtenida mediante datos agrupados en in tervalos (unitarios).
Intentarnos probar que :E(X, - k) 2 > :E(X, - X)2 si k X. +
EJEMPLO 5.3. Valindonos de los datos del ejemplo 5.1 calculemos la media En efecto, si k f X, k = X + e (con e 1- O, bien positiva, bien negativa). Por
aritmtica agrupando los datos en intervalos unitarios, segn lo acabado de exponer. tanto,
l:(X, - k) 2 = :E[X, - (X+ c)] 2 = :E[(X, - X)- c] 2 = :E(X, - X)2 - 2c:E(X, - X) +
+ nc2 = :E(X, - X) 2 + ne', pues r(X, - X) = O, (segn a).
Xi n, n,x, Ahora bien, nc2 es un valor esencialmente positivo, pues tanto n como c2 son esen-
12 3 36 cialmente p ositivos. Por otra parte, :E(X, - X )2 es esencialmente no negativa
11 o o (ser siempre positiva, salvo el caso extrem o en que X1 = X 2 = = x. y en
10 1 10 el cual valdr cero). Por tanto, dado que l:(X; - k) 2 = l:(X, - %)2 + nc2 , nece-
9 4 36 sariamente :E(X, - k)2 > :E(X, - X)-'.
8 o o EJEMPLO 5.5. Reslcmos 1, 2, 5, 8 de su media 4, elevemos al cuadrado estas
3 21 X = 1: 11,X, = 162 = 7_04 diferencias y summoslas. Hagamos lo mismo con las diferencias cuadrticas res-
6 6 36 n 23
pecto a dos valores distintos de 4, el 5 (mayor que 4) y el 3 (menor que 4).
5 3 15
4 1 4
3 o o (1 - 4)2 + (2 - 4)2 + (5 - 4) 2 + (8 - 4 )2 = 9 + 4 + 1 + 16 = 30
2 2 4 (1 - 5) +
2
(2 - 5) 2
+ (5 - 5)2 + (8 - 5)2 = 16 + 9 + O + 9 = 34
1c,t -
23 162 (] - 3)2 + (2 - 3 )2 + (5 - 3) 2 + (8 - 3)2 = 4 + 1 + 4 + 25 = 34
r
11

68 / Estadistica para Psiclogos Estadist1cos de posicin o tendencia central / 69


Vemos cmo la suma de las diferencias cuadrticas respecto a 4 (media ) es
menor q ue la suma de las diferencias cuadrticas respecto a 5 y a 3 (distintos de X n,
la media).
b') Si la suma de las diferencias cuadr ticas de n puntuaciones X,, X 2 , . . . , X., 17 o ms 9
respecto a k es mnima, k = X. 14-1 6 15
En efecto, si k fuera distinta de la media, la suma de las diferencias cuadr 11 -13 22
8- 10 13
ticas no podra ser mnima (segn b), contra lo supuesto .
7 o menos 8
e) La media de Y, = AX, + B, Y2 = AX2 + B, .. . , Y., = AX., + B, sien-
do A y B dos constantes arbitraria!{, es Y = AX + B.
En efecto, Ir) La media es el centro de gravedad de la distribucin de frecue ncia s. Con -
sideremos un tablero ideal, sin peso, largo y estrecho. R epresentemos cada obser-
vacin por un cubo de peso unidad . Todas las observaciones con la misma pun-
y= ~ = !: (AX,+ B ) =A !: X,+ nB = A!: X,+ 11B =AX+ B tuacin son colocadas una encima de o tra sobre el punto d el tablero que coincide
n n n n n con esa puntuacin. Apoyemos el ta blero, as cargado con las observaciones, sobre
un fulcro F. Pues bien, solamente se mantendr en eq uilibrio el tablero, cuando
EJEM PLO 5.6. A p artir de las puntuaciones 1, 2, 6 (con media 3) formemos la media sea el punto de apoyo del mismo sobre el fulcro. Es decir, la media es el
las nuevas puntuaciones Y, = 2X, + 4, es decir, las puntuaciones Y, = 2X1 + 4 = centro de gravedad del sistema. Por ejemplo, supuestas las puntuaciones l, 1,
= (2)( 1) + 4 = 6, Y2 = 2X2 + 4 = (2)(2) + 4 = 8, Y3 = 2X3 + 4 = (2)(6) + 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 5, 5, 6, 6, 6, 7, su media valdr 70/20 = 3,5. Pues bien,
+ 4 = 16 y veamos cmo la media de las nuevas puntuaciones debe valer Y = el tablero cargado con las veinte puntuaciones se mantendr en equili brio si se
= 2X + 4 = (2)(3) + 4 = 10. En efecto, apoya sobre el fulcro F en la pun tuacin 3,5 y perder dicho equilibrio si se apoya
sobr e un punto a la derecha o a la izquierda de 3,5.

y = !: Y, = 6 + 8 + 16 = 30 = JO
11 3 3

Si A = 1 y B j O, Y= (l)(X) + B = X+ B. Es decir, si sumamos a todas


las pun tuaciones una constante no nula, la media de las nuevas puntuaciones es
igual a la media de las antiguas ms esa constante B.
Si A f O y B = O, Y = AX + O = AA Es decir, si multiplicamos todas las
puntuaciones por una constante A, la media de las nuevas puntuaciones es igual
a la media de las antiguas multiplicada por esa constante A .
d) La media es sensible a la variacin de cada una de las puntuaciones . Basta
con que vare una sola puntuacin, para que vare la media. La media es funcin
de todas y cada una de las puntuaciones y variar con que vare una sola de ellas.
e) Es fu ncin de los intervalos elegidos (de su amplitud, de su nmero y de
los lmites de los mismos).
/ ) E s fundamento de muchas otras tcnicas estadsticas. F
g) No podr ser calculada si el intervalo mximo no tiene lmite superior
y/o el intervalo mnimo no lo tiene inferior. Pues si no conocernos los lmites ex-
tremos, no podremos calcular los puntos medios de los intervalos mximo y m- i) No es recomendable calcul ar la media cuando la distr ibucin de frecuen cias
nimo y, consiguientemente, no podrem os calcular la media que exige conocer los es muy asimtrica. Es decir, cuando existen una o muy pocas puntuaciones en uno
puntQf medios de todos los intervalos. As, por ejemplo, no podremos calcular de los dos extremos (o muy altas o muy bajas, respecto a las restantes que cons-
la media a pa rtir de la siguiente distribucin de frecuencias: tituyen la mayora).
.
1 11
l. II'
1

70 / Estadstica para Psiclogos Estadsticos de posicin o tendencia central / 71

j) Dados r grupos con n,, n2 , . , n, puntuaciones, respectivamente, y sien- x= (6)(5) + ~4li9! :!: (5)p~
do .X', X2 , , X, sus correspondientes medias, la media de las n, + n 2 + +
12(, = 8,40
15 15
+ n, = n puntuaciones vale X = (n,X, + n2.X\ + + n,X,)/n.
En efecto, sean EJEMPLO 5.8. Las puntuaciones de la tabla adjun ta representa n el aumento
X 11 , X21 , X., 1 las n 1 puntuaciones del grupo primero
. , en el cociente in telectual de un grupo de dos ni os y de un grupo de cuatro nias,
X, 2 , X 22 , , x.,
2 las 11 2 puntuaciones del grupo segundo todos de dos aos, tras haber sido estimulada la interaccin verba l co n sus madres
.... . . . ... . . . ' . .... . ........ . . . ......... . . . .... . duran te cua tro meses (Levenstei n, 1968). Ca lculemos el aum ento medio del grupo
Xi,, X 2 ,, . . , x.,, las n, puntuaciones del grupo r total, a partir del aumento med10 de los nios y del de las nias.

Esto supuesto, tendremos


X1 = (X 11 + X 21 + + X. 11 )/ 11 1 ; por tanto , 11 1 1' = X 11 + X 2 , + + X., 1 Nios Nias
~--- -
-~'i = (X 12 + X22 + + x.,2 )/n2 : por tanto, n2 X2 = X 12 + X22 + + x., 2 13 16
29 16
- -1) -+ -(4)(JO) = 6 =
(5.3) 82
2 X_ =(2)(2 13, 67
X,= (X 1, + X 2 , + + x.,,)/n,: por tanto, n,X, = X,,+ X 2, + + x.,, 6 6
42 40
Ahora bien, por definicin,
111 = 2 11, =4
x1 = 21 x, = 10
X= (X + X21 + . .. + x.,,) + (X12 + X22 + . .. + x . 12 ) + +
n 1 + 112 + + n,
+ + + (X 1 , + X 2, + + X.,,) En el caso particular en el que n 1 = n 2 = = n, = k,
(5.4)
+ n 2 + + n,
11 1
-
X= kX 1 + kX2 + + kX, = x + x
_1_ _ _ .._ +__ __
+ x
,
Por consiguiente, sustituyendo los r 1rminos del numerador de (5.4) por sus kr r
equivalentes en (5.3), nos q ued a
k) Sean r grupos con n1 , 11 2 , . . , n, p ersonas. Sean p 1 , p2 , . , p, las p ropor-
X = n1X1 + n2 X2 + + n,X, = n1x1 + n2 X2 + + n,X, ciones con cierta caracterstica dentro de cad a grupo. Por ejemplo , sea p 1 la pro-
porcin de varones en el grupo primero , p 2 la proporcin de varones en el grupo
n 1 + n2 + + n, n
segundo, . .. , p, ia proporcin de varones en el grupo r . Esto supuesto , la pro-
EJEMP LO 5.7 . porcin de varones en el grupo total vale

p 1 + 112 p 2 +
Grupo primero Grupo segundo Grupo tercero p = -n 1---- - - - - +- n,p,
- -
11 + n 2 + + n,
2 7 14
5 14 17
En efecto, llamando 11;, n;, .... n;
al nmero d e varones en el grupo p rimero,
4 7 8 en el segundo, ... , en el r , tendremos
7
7
8 12
9
p1= n;, de donde, 11; = n,P1; p2 = -n;, de d on de, 112' = n2 p2 , P, =~
n1 11 , 11,
5 de donde n; = n,p, .
-- - - -- - - -- -- - - - - - -- - --- -- Por definici n, la proporcin de varones dentro del grupo tota l va ldr,
30 36 60
..,,-r-
n1 =6 11, =4 11, =5 + 11; + + n;
x, = 5 x, = 9 x, = 12 11;
p= ~ -- - - -- -
11, + 11 2 + + n,
:

72 / Estadistica para Ps1cologos Estadist1cos de posicin o tendencia centr al / 73

Sustituyendo n; por n 1 p 1 , n por p


11 2 2 , , n; por n,p,, nos queda
X - Xo
x, XJ = __]_ -
p = 11 1 p 1 + 11 2p 2 + + n,p,
n 1 + n2 + + n,

EJEMPLO 5.9. En tres grupos distintos, con 270, 180 y 300 personas, la propor-
cin de demcra tas es 0,70, 0,65 y 0,62, respectivamente. Esto supu esto , cul X0 + 31 (Xo + 31) - .\ o = 3
es la proporcin de demcratas en el grupo toial ? I
X0 + 21 (Xo _: !! ) -: _:\'o = 2
= (270)(0,70) + (180)(0,65) + (300)(0,62) = 492 = O656 I
P 270 + 180 + 300 750 ' + /) -
X0 +l
(X 0
-- - - - - -X0 = l
I
La propo rcin de demcratas en el grupo to tal es 0,656 o, dicho de otro modo,
X0 + O _(~o -!"u = 0
_+__) -:
el 65 ,6 por 100 del grupo total son demcratas. I
(Xo - l) - Xo
X., - l - - -- - -=- !
5.2.4. M t odo abreviado para el c lculo de la media
X0 - 2/ ! X..<> --:_ }/J --: !~ = - 2
I
Supongamos n puntuaciones a grupadas en intervalos, todos ellos con am-
plitud /. Sea X0 el punto medio de uno de ellos, elegido arbitrariamente, al que (X0 - 31) - X0
Xo - 3/ - - I - -- - = -3
:;_, ' llamaremos intervalo origen. Hagamos

A B = X!'.
I I
EJEMPLO 5.10. Apliquemos el mtodo abreviado a la sigu iente distribucin
Segn 5.2.3. e), las puntuaciones de frecuencias, donde todos los intervalos tien en amplitud / = 3 y d onde hemos
elegido como origen el in tervalo 6 - 8.

-'1
' 1
= IX; + (-~o) = X, -I Xo n1 x; n_rY;

13 - 7
tendrn como media
,, 12- 14 8 -- -=- - = 2 16
X.
."\ ' = ~ X - ~ = :" - Xo
,<"-.: "' 9-ll 12 -
10 - 7
- - = 1 12
1 I J 3 -, 10
X = -- = 0,2
De d onde, X = J.f:' + X0 Esta ltima frmula nos permi te obtener X mediante 7- 7 50
6-8 16 =o o
3
.i', cuyo clculo suele ser mucho ms sencillo y breve que el de X. x = !3)(0.2) +7 = 7,6
Si X0 es el punto medio del intervalo origen, los puntos medios de los inter- 4 - 7
valos superiores al origen sern X0 + /, X0 + 21, X0 + 3/, . .. y los puntos medios
3-5 10
3
= -1 - 10

de los intervalos sucesivos inferio res al origen sern X0 - / , X0 - 2/ , X0 - 3/, .. . ,


1- 7
ya que la diferencia entre dos puntos medios consecutivos es igual a la ampli tud, 0-2 4 = - 2 - 8
3
l , d;:I intervalo. Consiguientemente la transformacin x 1'. =XL _!_Q... establece la
.~ I 50 10
siguiente correspondencia:
l",,
74 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 75

Veamos en qu ha consistido la transformacin x; = ~-~


I
en el ejemplo Es decir, la media ponderada de n puntuaciones es la media de esas puntuacio-
nes multiplicadas o ponderadas por coeficientes o pesos apropiados. Ntese que
que acabamos de exponer. atribuir los pesos 4,5; 3,5 y 2 no es ms que hacer aparecer la primera puntuacin
4 5 veces, la segunda 3,5 veces y la tercera 2 veces. Es, por tanto, como si tuviramos
Escala original: X, 4'.5 + 3,5 + 2 = JO puntuaciones. De aqu que el denominador de la media p on-
10 13 derada sea igual a la suma de los pesos.
En realidad, la media obtenida con datos agrupados en intervalos es una me-
dia ponderada. El peso asignado a cada puntuacin (o punto medio del intervalo
de que se trate) es igual al nmero de observaciones d entro de dicho intervalo .

-7 X = n1 X, + n2 X2 + + n,X,
6 ./
,. .
;1 /
\
u ~-
T
, - ..-;
7 1 1 ) ' ' ....
n 1 + 112 + + n,
(cambio de ongen)

Escala nueva: x '; ; ex, - 7); 3 5.2.6. Medias aritmticas generalizadas

(camhio de unidad de medida. supuesto el cambio de origen) a) Media geomtrica

Llamamos media geomtrica, X9 , den valores X 1 , X 2 , , x. a la raz ensima


De lo dicho se in!ere que es muy sencilla la manera prctica de transformar
del producto de esos n valores. Es decir, X9 = j(X1 )(X2 ) .. . (X.) .
1.,: 1 las X; en las x;.
En efecto, basta con elegir como origen un intervalo cualquiera, Mientras que la media aritmtica se obtena sumando n puntuaciones y divi-
atribuyndole como punto medio el valor O. A continuacin, atribuir un 1 al inme- diendo psa suma por n, la media geomtrica se obtiene multiplicando las 11 pun-
diatamente superior, un 2 al superior siguiente, etc.; atribuir un - 1 al intervalo tuaciones y calculando la raz ensima de ese producto. Es decir, lo que all era
inmediatamente infer ior, un -2 al inferior siguiente, etc. Es claro que en el ejemplo suma, ac;u es producto; lo que all era divisin, aqu es radicacin.
acabado de exponer no compensa utilizar el mtodo abreviado puesto que el no Usando logaritmos, tendremos
abreviado es tan sencillo como el abreviado. Pero en otros casos no sucede esto.
La diferencia suele ser de cierta importancia cuando las puntuaciones contienen
cifras decimales, cuando son muchas las obser vaciones y grande el nmero de in-
log X, = log X 1 + log X 2 + + log x. = L log X,
/ n
tervalos.
Desde luego, la introduccin creciente de mquinas calculadoras y miniorde-
En otras palabras, la media geomtrica, X9 , es un valor tal que su logaritmo
nadores va haciendo cada vez menos necesario el uso de mtodos abreviados.
es igual a la media aritmtica de los logaritmos de los datos. De aqu que digamos
Igualmente, poseyendo dichos instrumentos de clculo, deberemos obtener la
que la media geomtrica es una media aritmtica generalizada.
media a partir de las puntuaciones originales, sin agruparlas en intervalos, siempre
EJEMPLO 5.11. En investigaciones sobre promedios de tiempos (latencias,
que las tengamos a nuestra disposicin . tiempos de reaccin, tiempo empleado en solucin de problemas, ... ) es frecuente
la utilizacin de medias geomtricas. Por tanto, si 22, 11 , 7, 7, 28 son los tiempos
(en segundos) empleados por una persona para la solucin de cinco problemas
5.2.5. Media ponderada (Sokolov, 1972), aceptaremos, como ndice del tiempo medio consumido por esa
persona en cada problema, la media geomtr ica de esos datos. Es deci r,
La media de 2, 4 y 12 es 6. Pero, si por ejemplo, atribuimos a la primera pu n-
tuacin un peso igual a 4,5, a la segunda un peso igual a 3,5 y a la tercera un
peso igual a 2, tendremos la siguiente media ponderada X9 = .j(22)(1 I )(7)(7)(28) = 12,71 segundos

4:t (4,5)(2) + q,5)(4) + (2)!_12) = ~~ = 4 7 EJEMPLO 5.12. En Psicofisica suele preferirse la media geomtrica a la media
4,5+3,5+2 10 ' aritmtica cuando se trata de promediar razones. Un caso tpico es el siguiente.
1~
:11

76 / Estadistica para Psiclogos


Estadsticos de p osicin o tendenci a cen tral / 77
A un sujeto se le impone la tarea de valorar las veces que cada uno de los estmulos va nerviosa por la q ue /a de transmitirse, la mitad de la distancia la recorre a un a
supera a los restantes, segn cierta caracterstica, es decir, la tarea de ofrecer la velocidad de 2 m /scg y el resto a una velocidad de JO m/seg. (Vase Osgood, 1953.)
la razn entre cada par de estmulos que l juzga ms exacta. Con frecuencia, el La velocidad media con que se traslada el imp ulso es la media a rm nica de las do s
mtodo experimental utilizado permite establecer varias estimaciones de cada velocidades. En efecto, de acuerdo con la ecuacin fundamental de la cinemtica .
razn. Pues bien, para poder alcanzar una mejor estimacin de ella, se suele calcu-
lar la media geomtrica entre las distintas estimaciones d e la misma. (Vase, por
ejemplo, Torgcrson, 1963 .)
( e)
e = vi o, r = - , en los pnmeros
I'

20
O,20 m se venfi1cara 11 = - - y en Jos u 1ttmos
2
Sean 3; 2,5; 4; 3,5 y 3,8 cinco estimaciones de la razn entre los estmulos A y B. 0,20 m se venf!Cara lz
= 102-. eOns1gmentemente,
1a ve1OC!da d me d 1a
. b USCa d a sera
Es decir, A es juzgado como 3; 2,5; 4; 3,5 y 3,8 veces mayor que B, en cinco ocasio-
nes d istin tas. Aceptaremos como estimacin media de la razn entre A y B igual al espacio total (0,20 + 0,20) recorrido, dividido por el tiempo (1 1 + r2 ) em-
pleado en recorrerlo. Es decir,
j(3)(2,5)(4 )(3,5)(3,8) = 3,31. En otras palabras, aceptaremos que el es tmulo A
es juzgado como 3,31 veces mayor que el estmulo B. t = (2 )(0,20 ) = _2_ = 113 /
Si los datos estuvieran agrupados en intervalos, "' 0,20 0,20 1 1 ,. m seg
- +- - + -
2 10 2 JO
X9 = i(x 1 r ' (X 2 r' ... (X,r
que es la media armnica de las dos velocidades.
donde 12 1 , 12 2 , . , 12, son las observaciones correspondientes a cada uno de los Si los datos estuvieran agrupa dos en in tervalos,
r intervalos (con 12 1 + 122 + + 12, = 12) y donde X 1, X2 , . . , X, son los pun-
tos medios de dichos intervalos. /j
Usando logaritmos, tendremos X"= - - - - - - -
: , log Xa = 12, log Xi + 12, log X2 + + 12, log X, L n; log X,
!!..!.+ 112 + . . . + 11_,_
X1 X2 X,
!!..!.. + 112 + . .. + !1_,
X1 X2 X,
n
n 12

donde 12 1 , n 2 , , n, son las o bservaciones correspondientes a cada uno de los r


b) Media armnica intervalos (con 12 1 + 122 + + n, = n) y donde X, , X2 , . . , X, son los p unto s
medios de dichos interva los.
Llama mos media armnica, X., de 12 valores X,, X 2 , , x. al reciproco de la
media a ritmtica de los recprocos de esos n valores. Es decir,
c) M edia cuadrtica
n
x. 1 1 1 1 1 I
- + - +--+ - -+ - + + - Llamamos media cuadrtica, X,, de II valores X1 , X 2 , .. , x. a la raz cuadrada
X X2 X. X X2 X. de la media aritmtica de los cuadrados de esos n valores. Es decir ,
ll

D e la expresin an terior se deduce que ~


. =v/ x 2
1
+ x 22 + --- + x2
1 I 1
-+ - + + - De la expresin anterior se deduce que
X X2 X.
X. = 12
g 2 _ Xf + X1 + + X;
En otras palabras, la media armnica, X. , es un valor tal que su recproco es ' - 12
igual a la media aritmtica de los recprocos de los datos. De aqu que digamos
que la media armnica es una media ari tmtica generalizada. En otras palabras, la media cuadr tica, X,, es un va lor tal que su cuadrado es
&l!MPLO 5.13. Sea un impulso nervioso eferente que recorre 0,40 m para al- igual a la m edia aritmtica de los cua drados de lo s d a los. De aqu que digamos
canz ar el msculo y provocar una contraccin. Debido a las carac tersticas de la que la media cua dr tica es una media aritmtica generalizada .
Es tadist,cos d e posicin o tendencia central / 19
78 / Estadistica para Psiclogos

1 ' 5.3.2. Definicin


EJEMPLO 5.14. Calculemos la media cuadrtica de 1, O, 3, - 1, 3.
Punto o valor numrico q ue d eja por encima y por debaJo de s el 50 por 100
x=
,
Jl + o+ 9
5
+ 1 +9= /20 = 2
Vs
de las observaciones.

5.3.3. Clculo
Si los datos estuvieran agrupados en intervalos,
a) Datos agrupados en i111en:alos

Comenzamos con datos agrupados en intervalos porque la aplicacin del con -


'n 1 X ~ 2 X~ + + n,X;
x' = n
cepto propuesto de mediana es ms obvia en este caso que en el de datos no agru-
pados.
EJEMPLO 5.1 5. Engelman (]970) investig la inluencia del_ educacin esco lar
sobre el cociente intelectual (CI) en un grupo de nios con bajo nivel social y cul-
donde n 1 , n 2 , . . . , n, son las observaciones correspondientes a cada uno d e los r tural. Para ello les som eti a un p rograma educativo intensivo dura nte dos aos
intervalos (con 11 1 + 112 + + n, = n ) y donde X 1, X2 , , X, son los puntos y midi sus cocientes intelectuales al principio y al fin d el programa. Comenzaron
medios de dichos intervalos. el programa 15 nios de cuatro aos. Lo concl uyeron 12. Los datos (agrupados
por nosotros en intervalos) de los 15 ni os al empezar son los siguientes :

5.2.7. NOTA
TAB LA 5. 1
La segunda propiedad de la media, la suma de las diferencias cuadrticas de --
n puntuaciones respecto a su media es mnima, queda legitimada ms sencilla- CI n,
mente derivando F(k ) = I: (X, - k) 2 respecto a k. En efecto, F ' (k) = 129,5
-2 I: (X; - k), F "(k) = 2n. 11 5 -129
Con estos supuestos, 114,5
a) Si k = X, F '(X ) = -2 I: (X; - X) = O, F " (X) = 2n > O. Por tanto, 100-114 4
99,5
para k = X, F pasa por un m nimo.
85-99 8
b) Si F pasa por un mnimo, F'(k) = - 2 I: (X; - k ) = O. Por tanto, I: X ; = nk, 84,5
k =:EX; = X 70-84 2
n 69,5
15

5.3. Mediana A partir de ellos, calculemos la mediana.

Comenzamos aceptando que d entro de cada intervalo, las observaciones en l


5.3.1. Introduccin previa
contenidas se distr ibuyen homogneamente. Es decir, que si en un in tervalo tene-
mos cinco observaciones, suponemos que cada una de ellas ocu pa la quinta parte
Suponemos que, antes de calcular la mediana, hemos ordenado las pun tua- del mismo_
ciones de m enor a mayor o de mayor a menor. Ordinariamente, lo haremos de La mediana tiene que ser un punto o valor nu mrico mayor que 69,5 y menor
menor a mayor. Nos limitamos a variables cuantitativas continuas, porque, aunque que 129,5, tal q ue deje por encima y por debajo de s el 50 por 100 de las 15 obser-
es posible calcularla en el caso de variables cuantitativas discretas y aun en el de vaciones, es decir, 7,5 observaciones. Evidentemente, 84,5 no puede ser la mediana,
var,iir$ls cuasi-cuantitativas (ordinales), sin embargo, de hecho, casi siempre suele pues deja por debajo de si 2 observaciones (y por encima 13 ). Tam poco 99,5 ser
ser' calculada para variables cuantita tivas contin uas.
80 / Estadistica para Psiclogos
Estadis t,cos de posicin o tendencia central / 81

mediana, pues deja por debajo de s 10 observaciones (y por encima 5 J. La mediana Ntese que
tiene que ser un valor entre 84,5 y 99,5. Llamemos crtico al in terva lo (84,5 -
- 99,5) y dibujmoslo ampliado (Fig. 5. 1). Md = 845 + 1031=845 + (5, 5 Hl 5 ) = 845 + 7 , 5 - 2 15 =
' ' ' 8 ' 8

~- 2)
t ~----~~r~-ur
99 5

(T
t t
---------- 2.5 x' 84.5 + 15 = 94.81

== .,O,
94.81--------- -- Ahora bien,
8 15 5,5 X
84,5 = !, : lmi te exacto inferior del intervalo crtico.
oblrv. unid.
~
2
= ~
2
mitad o 50 por 100 de las observaciones.

84 ,5 ==--J Fig. 5.1 15


2
8
= nb; nmero de observaciones bajo el intervalo crtico.
= 11,J: nmero de observaciones dentro del intervalo crtico".
= / : amplitud del intervalo crtico*.
Como el razonamiento expuesto en este caso par ticular es vlido para cualquie r
Si las ocho observaciones del intervalo (84,5 - 99,5) ocupan homogneamente otro caso, podemos aceptar como f rmula de la mediana:
una distancia igual a 15 unidades, las 5,5 observaciones (que con las 2 inferiores
forman el 50 por 100) ocuparn una distancia igual a x unidades. Es decir, - - n
ll )
Md = !, + ~ - -b 1 (5.5)
( nd
8 15 (5,5)(15)
~ x= - - - 10.31
5,5 x 8
Podamos, tambin, haber pensado as: Si las ocho observaciones del intervalo
(84,5 - 99,5) ocupan homogneamente una distancia igual a 15 unidades, la s
Por tanto, Md = 84,5 + 10,31 = 94,81
2,5 observaciones (que con las cinco superiores forman el 50 por 100) ocuparn
La vertical levantada sobre la mediana divide el rea total en dos reas de igual una_ distancia igual a x ' unidades. Es decir,
superficie (Fig. 5.2).
8 15 , (2,5 )(15)
-2,5 = -x' , x = -
8
- ~ = 4,69. Por tanto, Md = 99,5 - 4,69 = 94,81.

Ntese que
25
Md = 995 - 469 = 995 - ( , Hl2) = 995 - 75 - 5 15 =
' ' ' 8 ' 8

= 99,5 -
~-5)
( - 15 = 94,81

69,5 84 .5 '99.5 114,5


94,81
Es puramente casual que coJncida el valor deJ nmero de observaciones (n = 15) con el valor
f correspondiente a la amplitud del intervalo critico (! ; 15). Veremos cmo en el ejemplo 5. 16 no
Fig. 5.2 se da tal coincidencia.
82 / Estadistica para Psiclogos Esradist,cos de posicin o tenden cia cen tral / 83

Ahora bien, 122. 5 t


99,5 = !, : lmite exacto superior del intervalo crtico. 1 X

5 = n,: nmero de observaciones sobre el intervalo crtico.


119.17_ ____ ___ j_ __ j _______ :b~c- unid

2
15 , 8 y 15 s1gm
. .Ji1can Io mismo
. que en eI caso anterior.
.

Por consiguiente, podemos proponer la siguiente como frmula alternativa


J
ob ser v. unid .
10 1
para la mediana 2 X
., obs erv. unid .

-- n
n )
Md = !, - 2 nd s (5 .6)
(

EJEMPLO 5.16. Calculemos la mediana a partir de los datos (agrupados en


"'' Fig. 5.3
j
1, intervalos por nosotros) correspondientes a los 12 nios que concluyeron los dos
aos del programa intensivo. La tabla adjunta nos muestra los CJ de dichos nios
al final del segundo ao. Si las tres observaciones del intervalo (J 12,5 - 122,5 ) ocupan homognea
mente una distancia igual a diez un idades, las dos observaciones (que con las cuatro
inferiores forman el 50 por 100) ocuparn una distancia igual a x unid ades. Es
TABLA 5.2 decir,

3 10 (2)(10) = 6,67
CI n; -=- X = -3
142,5 2 X

133.142 2
132,5
123132 3 Por tanto, Md = 112,5 + 6,67 = 119, 17.
....:1 122,5 Por supuesto, a este mismo resultado habramos llegado aplicando (5.5 ). En
113122 3 efecto.
,:
112,5
.,1~ 103112 4
g _ 4
102,5
2
12 Md = 112,5 + -- 10 = 112,5 + 6,67 = 119,1 7
3

Podamos, tambin, haber pensado as : Si las tres observaciones del inter va lo


La mediana tiene que ser un punto o valor numenco mayor que 102,5 y (112,5 - 122,5) ocupan h omogneame nte una distancia igual a 10 unidades, la
menor que 142,5, tal que deje por encima y por debajo de s el 50 por 100 de nica observacin (que con las cinco superiores forma el 50 por 100) ocupar una
las 12 observaciones, es decir, seis observaciones. Evidentemente, 112,5 no puede distancia gua! a x ' unidades. Es decir,
ser la mediana, pues deja por debajo de s cuatro observaciones (y por enci
ma ocho). Tampoco 122,5 ser mediana, pues deja por debajo de s siete ob-- 3 10 (1)(1 0 ) = 3,33
x' = -3
servaciones (y por encima cinco). La mediana tiene que ser un valor entre l x' '
11 2, 5:,Y 122,5 . Llamemos crtico a l intervalo (112,5 - 122,5) y dibujmoslo
ampiado (Fig. 5.3). Por tan to, M d = 122, 5 - 3,33 = 11 9, 17
84 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 85

Por supuesto, a este mismo resultado habramos llegado aplicando (5.6). En


efecto,

Mtl = 122,5 - -
~ - 5
2
3- 10 = 122,5 - 3,33 = 119,17 W8 &j+ : 1 D
6 7 9 !O 13
La vertical levantada sobre la mediana divide el rea total en dos reas d e igual
superficie. (Fig. 5.4.) Es decir, la mediana es la pun tuacin que ocupa el lugar cen tr al. La vertical le-
vantada sobre la mediana (9) divide el rea to tal en dos reas de igual superficie
(2 + 0,5 = 2,5 ; 2 + 0,5 = 2,5).
2) La puntuacin que ocupa el lugar central es igu al a una o varias de las
restantes.
EIEMPL05. 18. Calcul emos la mediana de 14, 15, 16, 18, 18, 18, 18, 19,20, 20, 22.
La puntuacin que ocupa el lugar sexto (el central) es 18 que es igual a las que
,;'
,. ocupan los lugares cuarto, quinto y sp timo. El intervalo crtico es el intervalo
'l unitario (17,5 - 18,5). Por tanto,
J

7 3)
... .!...!. _
:j Md = 17,5+ ( 1 17,5 + ?~ = 18,125
4
102 ,5 112,5 t 122 ,5 132,5 142,5
J
l 19,17
I'
/ Fg. 5.4

, La diferencia entre la mediana al principio del experimento y la m ediana al


fin del mismo (119,17 - 94,81 = 24,36 puntos del CI) manifiesta la inluencia de
1 la educacin escolar sobre el C/.
5 3
3 + 4 --- ~ 5,5 4+4 --- ~ 5,5

b) Datos no agrupados en intervalos

No es ms que una aplicacin de lo dicho en el apartado anterior para el caso


particular en que 1 = 1 y n4 = 1 o nd = k , segn que exista una sola o existan k
observaciones dentro del intervalo unitario crtico. Consideremos por separado
las dos alternativas: nmero impar de observaciones y umero par de las m ismas.
Nmero impar de observaciones. Tendremos un solo lugar central. 14 IS 16 18 19 20 22
1) La puntuacin que ocupa el lugar central es distinta de todas las dems. 18 . 125
EJEMPLO 5. 17. Calculemos la mediana de 6, 7, 9, 10, 13 . La puntuacin que
ocupa el lugar tercero (el central) es 9, que es distinta de todas las restantes. El
intervalo crtico es el intervalo unitario (8,5 - 9,5). Por tanto, La ver tical levantada sobre la m ediana (18,125) divide el rea total en dos reas
de igual superficie (3 + 2,5 = 5,5; 4 + 1,5 = 5,5 ).

.,.
' Md = 8,5 +
~- 2)
(T 1 = 8,5 + 0,5 =9
Nmero par de observaciones. Tendremos dos lugares centrales.
1) Las puntuaciones que ocupan los lugares centrales son distintas entre
s y ambas son consecutivas o no lo son.
86 / Estadistica para Psiclogos Esradisticos de posicin o tendencia central / 87

Bajo una y otra condicin es posible seguir aplicando la frmula general eli-
giendo como intervalo crtica>>unitario, bien el que contiene la puntuacin central
inferior, bien el que contiene la superior. Sin embargo, slo si las puntuaciones
centrales son consecutivas, el valor encontrado para la mediana es nico y, adems,
coincide con la media aritmtica de las dos puntuaciones centrales. Por el contrario,
si no son consecutivas, el valor obtenido para la mediana es uno si elegimos com o
intervalo crtico unitario el que contiene la puntuacin central inferior y es otro
si elegimos el que contiene la puntuacin central superior. Son, adems, posibles
otros infinitos valores distintos para la mediana, situados entre los dos anteriores.
Todos ellos verifican la definicin de mediana. Pero con el fin de fijar un valor nico 31 32 33 37 39 40
para la mediana, se suele tomar, arbitrariamente, como tal la media aritm tica 35
de las dos puntuaciones centrales.
En conclusin, en uno y otro caso la mediana ser la media aritmtica d e las 2) Las puntuaciones que ocupan los lugares centralesn son iguales entre s,
dos puntuaciones centrales. pero distintas de todas las dems.
EJEMPLO 5.19. Calculemos la mediana de 24, 25, 26, 26, 27, 27, 27, 29. Las EJEMPLO 5.21. Calculemos la mediana de 3, 3, 4, 6, 6, 7, 7, 9. Las puntua-
puntuaciones que ocupan los lugares cuarto y quinto (los dos centrales) son 26 ciones q ue ocupan los lugares cuarto y quinto {los centrales") son las dos
y 27. Por tanto, la mediana valdr 26,5, media aritmtica de 26 y 27. iguales a 6 y distintas de las restantes. El intervalo crtico es el interva lo uni-
. tario (5,5 - 6,5).
ii~ Por tan to,
j ~
1
Md = 5,5 +
~-3)
(-- l = 5,5 + 0,5 = 6

Es decir, la mediana es el valor comn a las dos p untuaciones centrales>>. La


vertical levantada sobre la mediana (6) d ivide el rea total en dos reas de igual
superficie (3 + 1 = 4: 3 + 1 = 4).
J 24 25 26 1 27
26,5
29
1
3+22 ~ 4 3+2..!..~4
2
Si el lector aplica la frmula general eligiendo como crtico tanto el intervalo
(25,5 - 26,5) como el intervalo (26,5 - 27,5) llegar al mismo resultado, a saber, 1
Md = 26,5. T
La vertical levantada sobre la mediana (26,5) divide el rea total en dos reas 1
de igual superficie (4 , 4 ). T
EJEMPLO 5.20. Calculemos la mediana de 31, 32, 32, 33, 33, 37, 37, 37, 39, 40.
Las puntuaciones que ocupan los lugares quinto y sexto (los dos centrales) son 6 9
33 y 37. Por tanto, la mediana valdr 35, media aritmtica de 33 y 37.
Si el lector aplica la frmula general q,ligiendo como crticm> el intervalo
(32,5 - 33,5) llegar a Md = 33,5. Si, en cambio, elige como crtico el interva- 3) Las puntuaciones que ocupan los lugares centrales son iguales entre s
lo (36,5 - 37,5) llegar a Md = 36,5. Ciertam ente, tanto 33,5 como 36,5 (y los e iguales a una o varias de las restantes.
infinitos si tuados entre ambos) verifican la definicin de m ediana. Sin embargo, EJEMPLO 5.22. Calculemos la mediana de 2, 5, 5, 5, 6, 8. Las puntuaciones
solemos elegir como mediana el situado en el punto medio de todos ellos, es decir, 35. que ocupan los lugares tercero y cuarto (los centrales) son iguales las dos a 5 e
Id vertical levantad a sobre la m ediana (35) divide el rea total en dos reas de iguales a la que ocupa el lugar segundo. El intervalo crtico>J es el intervalo uni -
igal superficie (5, 5). tario (4,5 - 5,5). Por tanto,
88 / Estadstica para Psiclogos Estadsticos de posicin o tendencia cenera/ / 89

Md = 4,5
~-1)
+ (T 1 = 4,5 + 0,67 = 5,17
Vemos, en efecto, cmo la suma de las diferencias (en valor absoluto) respec-
to a la media es mayor que la suma respecto a la mediana (la primera suma vale
8 y la segunda vale 7 ).
b) Es menos sensible que la media a la variacin de cada una de las puntua-
ciones. Aunque la variacin de una sola puntuacin (elegida a propsito) puede
La vertical levantada sobre la mediana (5,17) divide el rea total en dos reas
hacer variar la mediana, sin embargo, la variacin, de modo bastante anrquico,
de igual superficie (1 + 2 = 3; 2 + 1 = 3).
1 de la mayora y aun de todas las puntuaciones pueden dejar invariante la mediana.
As, por ejemplo, (2, 59, 61 , 945) y (57, 58, 62, 63) tienen la misma mediana (60).
e) Es funcin de los in tervalos elegidos (de su amplitud, de su nmero y de
1+3 .2. ; 3
3
2 + 3 ,_!_; 3
3
1 los lmites de los mismos).
d) Es fundamento de diversas tcnicas estadsticas. Sin embargo, el nmero
de stas es mucho menor que el de las tcnicas basadas sobre la media.
e) Puede ser calculada aunque el intervalo mximo no tenga lmite superior,
ni el intervalo mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su
correspondiente lmite extremo). Con todo, cuando uno de esos dos intervalos
sin lmite extremo contenga dentro de s ms del 50 por 100 de los casos, tampoco

rr,.rro ,u~
5
1
6
o_ 8
podr ser calculada la mediana. As, ser imposi ble calcular la mediana, dada la
siguiente distribucin de frecuencias

5,17
1 X "i

46-4 8 2
NOTA . Quiz, sean un poco superfluas las distinciones acabadas de exponer 43-45
40-42 2
para el caso de datos no agrupados en intervalos y baste con el siguiente criterio:
37-39 14
,; a) Si el nmero de observaciones es impar, la mediana es la puntuacin de la
36 menos 20
observacin que ocupa el lugar central.
b) Si el nmero de observaciones es par, la mediana es la media aritmtica
1: de las puntuaciones correspondientes a las dos observaciones que ocupan los dos f) La mediana es un punto tal, que la vertical levantada sobre el mismo di-
f11 valores centrales. vide el rea total del histograma en dos reas con idntica superficie.
g) Es ms recomendable que la media cuando la distribucin de frecuencias
'.' es muy asimtrica.
p 5.3.4. Propiedades /) Dados r grupos con medianas Md 1 , Md2 , . , Md,, la mediana del grupo
total es igual o mayor que la mediana mnima e igual o menor que la mxima.
a) La suma de las diferencias (en valor absoluto) den puntuaciones respecto a (Vase Calot, 1969.)
su mediana es igual o menor que la suma de las diferencias (en valor absoluto) de
esas puntuaciones respecto a cualquier otro valor. Para la legitimacin de esta
propiedad pueden ser consultados Freeman (1963), Horst (1966), Calot (1969). 5.4. Moda
Aqu nos limitaremos a comprobarla con un,ejemplo muy sencillo.
EJEMPW 5.23. Dadas las puntuaciones 2, 4 y 9, calculemos la suma de sus di- 5.4.1. Definicin
ferencias (en valor absoluto) respecto de la media y de la mediana.
Su media vale 5 y su mediana vale 4. Esto supuesto, Nivel de intervalos o razn

.,(" . a) Datos no agrupados en intervalos.


12 .:.. 51 + 14 - 51 + 19 - 51 = s 12 - 41 + 14 - 41 + 19 - 41 = 7 Puntuacin a la que corresponde frecue ncia mxima. Es decir, la puntuacin
90 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 91

que ms veces se repite. As, por ejemplo, valdr 2 la moda de las puntuaciones: Nivel nominal
2, 5, 7, 2, 4, 2, 6, 6, 4, 2, 2, 3, 2.
b) Datos agrupados en intervalos_. Modalidad o categora nominal a las que corresponde frecuencia mxima.
Punto medio del intervalo al que corresponde frecuencia mxima. EJEMPLO 5.26. Conde y Domnech (1976) proponen los siguien tes resultados
EJEMPLO 5.24. Conde y Domnech (1976) estudiando una mues tra de pacien- respecto a su muestra de esquizofrnicos.
tes esquizofrnicos encontraron la siguiente distribucin de frecuencias:
Estado civil Total Varones M ujeres

Edad Total Varones Mujeres


Solteros 80 52 28
Casados 20 JO 10
80-89 9 3 6
2 9
Viudos 7 o 7
70-79 11
60-69 15 9 6
50-59 16 5 11
40-49 7 3 4 La moda es la categora solteros tanto para el grupo total, corno para el gru-
30-39 11 9 2 po de los varones y de las mujeres por separado. Es la categora solteros a la que
20-29 31 25 6 corresponde frecuencia mxima. En otras palabras, la mayora de los esquizo-
10-19 7 6
frnicos estudiados son solteros.

La moda para el grupo total y para el de los varones vale 24,5 aos (punto medio 5.4.2. Propiedades
del intervalo 20 - 29) y vale 54,5 aos (punto medio del intervalo 50 - 59) para
a) Es muy sencilla de calcular.
el de las mujeres.
b) Tiene el inconveniente de no ser necesariamente nica. Dentro d e una misma
distribucin de frecuencias pueden aparecer dos o ms valores o d os o ms cate-
Nivel ordinal goras a los que corresponda frecuencia mxima.
e) Es funcin de los intervalos elegidos (de su amplitud, de su n mero y de
Valor o categora ordinal a los que corresponde frecuenci a mxima. los lmites de los mismos).
1,
-:~ EJEMPLO 5.25. Conde y Domnech (1976) en la misma investigacin acabada d) Puede ser calculada aunque el in tervalo mximo no tenga lmite superior
1;- de citar encontraron que el nivel cultural de 97 personas, de la muestra estudiada, ni el mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su correspon-
diente lmite extremo). Con todo, cuando uno de esos dos intervalos sin lmite
era el siguiente:
extremo contenga dentro de s la frecuencia mxima, tampoco ser calculable la
1~; moda.
Nivel cultural Total Varones Mujeres

Superior (4) 14 13 1 1 5.5. Percentiles


Medio (3) 19 10 9
Inferior (2) 63 30 33
Nulo (1 ) 1 o 1 1 5.5.1. Definicin

Hemos definido la mediana como un valor numrico q ue deja por debajo de


s el 50 por 100 de las observaciones. Pues bien, definiremos el percentil k como un
La moda es la categora inferior (o valor ordinal 2) tanto para el grupo lota!,
valor numrico que deja por debajo de s el k por 100 de las observaciones. As,
como para el grupo de los varones y de las mujeres por separado. Es la categora
decir que 35 es el percentil 72 equivale a d ecir que dicho valor numrico deja por
inferior a la que corresponde frecuencia mxima. En otras palabras, el grupo
debajo de s el 72 por 100 de las observaciones del grupo de que se trate.
con nivel cultural inferior es el ms numeroso.
92 / Estadistica para Psiclogos
Esradisr,cos de posicin o tendencia centr al / 93

1 1
Todo percen til sigue siendo ndice de posicin. Nos indica la posicin dentro
del grupo del objeto (persona, animal, cosa, familia, entidad, etc.) que tiene como
50.5 1 1 t t
puntuacin dicho percentil. Si, por ejemplo, dicho objeto tiene como puntuacin 3 x'

LJ ____ T T
el percentil 80, sabemos que deja por debajo de s el 80 por 100 de los objetos de su
grupo. O, expuesto de otro modo, que su puntuacin supera al 80 por 100 de las
puntuaciones del grupo. Sin embargo, ya no podemos decir que sea ndice d e ten-
dencia central. Un percentil, por su propia naturaleza, es una p untuacin que puede 7 15
estar situada tanto hacia el centro de las restantes puntuaciones de un grupo, como observ. uni<l.
en uno cualquiera de los dos extremos.
4 X
obscrv. und.
1

"' . j j
5.5.2. Clculo

Se siguen pasos anlogos a los seguidos para el clculo de la mediana. En rea-


lidad, la mediana es un percentil determinado, el percentil 50. Al igual q ue sta,
Fig. 5.5
los percentiles son calculables a nivel ordinal. No obstante, slo suelen ser apli-
cados a variables cuantitativas y, ms concretamente, continuas. El percentil 60, P 60 , tiene que ser un pun to o valor numrico mayor que 5,5 y
Propondremos el clculo de percenliles nicamente en el caso de datos agru- menor que 80,5, tal q ue deje por debajo de s el 60 por 100 de las 20 observaciones,
pados en intervalos. El lector se encargar de hacer consideraciones anlogas a 6 2
las verificadas para el clculo de la mediana en el caso de datos no agrupados en es decir, ( 0)( 0) = 12 observaciones. Evidentemente 35,5 no puede ser P60 ,
100
intervalos. pues deja por debajo de si ocho observaciones. Tampoco 50,5 ser P6 0 , pues deja
EJEMPLO 5.27. Cravioto y Robles (1965), mediante el test de Gesell, encon-
por debajo de s 15 observaciones. P60 tiene que ser un valor entre 35,5 y 50,5. Llame-
traron los siguientes cocientes de desarrollo motor en un grupo de nios de corta
mos <<crtico al intervalo (35,5 - 50,5) y dibujmoslo ampliado (Fig. 5.5 ).
edad que sufran una fuerte desnutricin de protenas : 67, 25, 20, 20, 33, 33, 40, 69,
Si las siete observaciones d el intervalo (35,5 - 50,5) ocupan homogneamente
75, 42, 38, 46, 37, 52, 31, 57, 40, 39, 7, 26. Calculemos el percentil 60 de estos datos
una distancia igual a 15 unidades, las cuatro observaciones (que con las ocho in-
despus de haberlos agrupado en los siguientes intervalos :
feriores fo rman el 60 por 100) ocuparn una distancia igual ax unidades. Es decir,
7 15 =
~ = ~ X= (4)(151 8,57
X n, 4 X 7
80 ,5
;
66-80 3 Por tan to, P 6 0 = 35,5 + 8,57 = 44,07.
65,5
:f 51 -65 2
50,5
36-50 7
35,5
21-35 5
20,5
6-20 3
5,5
20

Comenzamos aceptando, al igual que lo hicimos al tratar de la mediana, que 5,S 20.5 35.5 4/0150,5 65 ,5 80,5
dentro-.de cada intervalo las o bservaciones, en l contenidas, se distribuyen homo- Fig. 5.6
gnemente.
94 / Estadistica para Psiclogos Estadsticos de posicin o ten dencia central / 95

La vertical levantada sobre P60 divide el rea total en dos reas iguales al 60 Ahora bien,
por 100 (la de la izquierda) y al 40 por 100 (la de la derecha) respectivamente
(3 + 5 + 4 = 12 ; 3 + 2 + 3 = 8) (Fig. 5.6). 50,5 = I,: lmite superior del intervalo crtico.
Ntese que
2
12 8 (40)( 0) = (k ' )(n): k ' por 100 de las observaciones, d onde k ' por 100 = 100 por
P6o = 35,5 + 8,57 = 35,5 + (4 )(I 5 ) = 35,5 + - 15 = ' 100 100
7 7 JOO - k por 100.
(60)(20) _ 8) 5 = n, : nmero de observaciones sobre el intervalo crtico.
100
= 35,5 + ( 15 = 44 ,07 7 y 15 representan lo mismo que en el caso anterior.
7
Ahora bien, Por consiguien te, podemos proponer la siguiente como frmula alternativa
para P1 ,
35,5 = I, : lmite exacto inferior del intervalo crtico.
(k ')(n ) _ 11
)
(60)(20) (k)(n) .
= 100 :k por 100 de las observacwnes. P, = /, _ ( 100 ' J (5.8)*
100 nd
8 = nb: nmero de observaciones bajo el intervalo crtico.
7 = nd; n mero de observaciones dentro del intervalo crtico.
15 = 1 ; amplitud del intervalo crtico. 5.6. Resumen: Definiciones y frmulas
Como el razonamiento expuesto en este caso particular es vlido para cualquier
otro caso, podemos aceptar como frmula del percentil k, P1 ;
Media aritmtica: Llamarnos media aritmtica den valores a la suma de ellos
dividida por n .
-(k)(n) - nb)
P, = I; + ( 100 nd 1 (5.7) X =LX, (d atos no agrupad os en intervalos)
11

Podamos, tambin, haber pensado as: Si las siete observaciones del intervalo
X- I:n X
= =-:..:.L.:..:.. (datos agrupa d os en m
. lerva 1os )
(35,5 - 50,5) ocupan homogneamente una distancia igual a 15 unidades, las n
tres observaciones (que con las cinco superiores forman el 40 por 100) ocuparn
una distancia igual a x ' unidades. Es decir, Medias aritmticas generalizadas

7 15
= (3)(15)
-7
= 6,43 a) Media geomtrica: Llamamos med ia geomtrica de n valores a la raz
3 =~ , x' ensima del producto de esos n valores.

Por tanto, P60 = 50,5 - 6,43 = 44,07.


Ntese que X, = j (X 1 )(X2 ) . . (X") (datos no agrupados en intervalos)

P 60 = 50 5 - 6 43 = 50 5 - (
3HI 5 ) = 50 5 - S - 5 15
, , ' 7 ' 7 X9 = J (X , )"' (X1 )"' (X, )"' (d atos agrupados en intervalos)

(40)(20) 5)
,,.f'
= 50 5 - ( IOO 15 = 44 07 El pcrcen!il 25 suele s er llamad o pri mer cua rt il , e l perccn!il 50 segundo cuart il (o me diana) y el
' 7 ' percent il 75 sue le denomi narse tercer cuartil.
96 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 97

b) M edia armnica: Llamamos media annomca de 11 valores al reciproco EJERCICIOS


de la media aritmtica de los recprocos de esos 11 valores.
5.1. Calcular la media aritmtica a partir de los siguien tes datos no agrupados en
n
x = - - - - - --
1 1 1 1 l 1 (datos no agrupados
intervalos.
-X + - + " + -X,, - + - +"+- en intervalos)
X 2
Xi X2 X,, a) 8, 7, 2, 8, 6, 5, 2, 4 b) 18, 20, 18, 17, 24, 20, 23
n e) 5, -1, 4,8, - 2 d) 2, -3, 8, -9, O, 2, l, - 4, O, -2
e) 1/2, 1, 2/5 /) l/ 2, - 3, - 1/4, 2/5
ll
g) 0,050, - 0,200, 0,005, -0,01 O, -0, 100.
X= - - - -- - (datos agrupados en
~+ 112 + .. _+ 11, ~ + 112 + ... + 11,__ 5.2. Calcular la media aritmtica a partir de los siguien tes datos agrupados en
X1 X2 X, X1 Xi X, in lervalos) intervalos
ll
- --
a) X n, b) X n, e) X ni d) X n1
e) M edia cuadrtica: Llamamos media cuadrtica de 11 valores a la raz cua- - -- - - - - --
drada de la ~edia aritmtica de los cuadrados de esos 11 valores. 11 -13 3 100-104 1 80-83 8 41-47 7
8-1 0 6 95-99 5 76-79 12 34-40 14
-
X' _
,,xi1 + xi2 + . . . + xi (datos no agrupados en intervalos)
5.7 7 90-94 !O 72-75 14 27-33 12
- 11
2--4 4 85-89
80-84
7
2
68-7 1 6 20-26 5

11 1 X f + n 2 X + + 11,X,2 (datos agrupados en intervalos) - --


X =
' n e) X n1 [) X n; g) X 11,
- -- - - -- - --
Mediana: Punto o valor numrico que deja por encima y por debajo de si el 45.49 6 0,20-0,22 9 19-2 1 2
50 por 100 de las observaciones. 40-44 JO 0,17-0, 19 15 16-18 4
35-39 17 0, 14-0,16 18 13-15 7
30-34 18

-(i -
0, 11-0,13 20 10-12 8
11 25-29 10 0,08-0, 10 14 7. 9 6
Md = /, + (~ - nb) J = /, ' ) J 20-24 10 0,05-0,07 6 4- 6 5
"d lid 15- 19 9 1-3 4

Moda: Puntuacin a la que corresponde frecuencia mxima. O punto medio


del intervalo al que corresponde frecuencia mxima. (Si nos encontramos a nivel 5.3. Sabiendo que la media aritmtica vale 8,85, calcular las dos frecuencias que
de intervalos o de razn.) fallan en el cuadro siguien te :
Categora ordinal a la que corresponde frecuencia mxima. (Si nos encontra-
mos a nivel ordinal.) X n, n,x,
Categora nominal a la que corresponde frecuencia mxima. (Si nos encontra - - - --- --
mos a nivel nominal. ) 14-16
Percentil: Llamamos percen til k al punto o valor numrico que deja por debajo l l - 13
de si el k por 100 de las observaciones. 8-1 0 8
5.7 4
2-4
(k)(n) _ nb) ((100 - k)(n ) _ 11 )
.... pk =l + ( 100 1 = Is - 100 ' 1 177
-
nd nd
98 / Estadistica para Ps1c/ogos Estadsticos de pos,c,n o tendencia central / 99

5.4. La media aritmtica de dos nmeros vale 8 y uno de ellos es tres veces mayor 5.13. Calcular la proporc10n de mdicos, abogados e ingenieros dentro de un
que el otro, ,cunto valen ambos nmeros? grupo de 800 personas, conociendo el nmero de personas y la proporcin de m-
dicos, abogados e ingenieros dentro de cada uno de los subgrupos en los que se
5.5. Demostrar que, siendo X, = A, + B, + C,, X =A+ B + . divide el grupo primero, de acuerdo con el cuadro siguiente:
5.6. Deseamos transformar las puntuaciones 8, 13, 9, 15, 10 en otras (sumndoles
a todas ellas una misma constante) de modo que su media valga 26. Cul debe
ser esa constante aditiva ?
5.7. Ocho personas han comparado dos frases, A y B , acerca del divorcio, valo-
G r. 1. 0 , 11 1 = 2 10 Gr. 2. 0 , 11, = 180 Gr. 3. 0 , n 3 = 220 G r. 4.o, 114 = 190
- -
rando cuntas veces ms favorece A que B al divorcio. Los datos obtenidos han Mdicos 0,25 0,30 0,35 0,33
sido los siguientes: 2; 2,5; 2,7; 1,8; 3; 1,5: 2; 2,5. En qu proporcin, por trmi- Abogados 0,50 0,52 0,45 0,40
no medio, ha resultado ser ms favorabl e al divorcio la frase A que la B? Ingenieros 0,25 0, 18 0.20 0,27
5.8.Calcular dos nmeros tales que su media aritmtica valga 7,5 y su media
1,00
- - -- - - - - - --
1,00 1,00 1,00
geomtrica valga 6.
5.9. Sea k el valor de uno de dos nmeros cuya media aritmtica es igual que su
media armnica. Esto supuesto, cunto vale el otro nmero ?
5. 10. Un ciclista va de A a B a 20 km por hora y vuelve de B a A a 60 km por hora . 5.14. Calcular la proporcin de solteros, casados y viudos dentro de un grupo
Esto supuesto, cul es la velocidad media a la que ha recorrido la distancia total? de 150 adultos, conociendo el nmero de personas y la proporcin de solteros, ca-
(Sugerencia: utilizar la media armnica.) sados y viudos dentro de cada uno de los subgrupos en los que se divide el grupo
5. 11 .Calcular el peso medio de un grupo de personas, conocido el nmero de primero, de acuerdo con el cuadro siguiente:
personas y el peso medio de cada uno de los subgrupos en los que se divid e el grupo
total primero, teniendo en cuenta el cuadro siguiente :
Gr. l.". 11 1 = 60 Gr. 2. 0 , n 2 = 90
- - - --
Subgrupo i Personas (n;) Media (X.) So lteros 0,30 0.25
Casados 0,45 0,55
1 150 75 Viudos 0,25 0,20
2 220 60
3 180 65 1,00 1,00

[.::
5.12. Calcule la media aritmtica en lenguaje del primer curso de Bachillerato 5.15. Calcular la mediana a partir de los siguientes datos agrupados en intervalos:
de un centro escolar, sabiendo que est dividido en cuatro secciones, A, B , C y D,
segn el cuadro siguiente:
a) X "1 b) X 11 e) X n d) X
-- ~- "1
-- - -~ ~
Seccin N mero de al umnos Nota media 7-8 7 30-34 8 40-45 6 57-64 7
5-6 JO 25-29 18 34.39 12 49-56 11
A 20 10 3-4 8 20-24 20 28-33 16 4 1-48 18
B 50 6 1-2 5 15-19 16 22-27 14 33-40 15
..,:- e 60 5 - - - 10-14 10 16-21 8 25-32 JO
D 30 8 - -- 17-24 3
t Estadsticos de posicin o tendencia central / 1O1
100 / Esradst1ca para Psiclogos
1- --- --- t 5,20. Calcular la mediana de las puntuaciones 4, 4, 5, X, 5, 4, 4, sabiendo que su
1. X h) X n,
1 e) X
- -
",
38-41 13
f) X

137- 141
11)

lO
g)
- - -
n,

90-91 JO 122-128 5 ' media vale 5 y donde X es un valor desconocido.


. 5.21. Calc~lar los percentiles 15, 25, 36, 15 y 82, a partir de la siguiente distribu cin
34-37 26 132-1 36 17 88-89 o 115-121 JO de frecuencias
30-33
26-29
30
34
127-131
122-126
33
44
86-87 2
84-85 3
108-114
101-107
23
38
1
22-25 25 l 17-121 40 82-83 5 94-100 35 X ll;
18-21 18 112-11 6 24 87-93 30
14-17 12 80-86 14 100-104 2
95-99 lO
90-94 21
85-89 30
5.16. Calcular la mediana a partir de los siguientes datos no agrupados en inter- 80-84 40
valos. 75-79 38
70-74 34
a) 8, 1, 3, 5, 14, 2, 25 b) 87 , 42,21, 105,1 18,8, 102,20,38
65-69 18
e) 20, 4 , 14, 52, 39, 6, 1O, 35 d) 32, 5, 9, 18, 44, 60, 18, 11 60-64 7
e) 12, 3, 7, 12, 12, 13, 8, 12 /) 5, 1, 2, 5, 14, 5, 5, 12, l, 5
g) 1, 8, 9, 8, 11, 7, 8, 6, 3, I , 8 /) 22, 20, 37, 22, 25
D 4,4,2,2,4, 2, ~ 4,4
/. 5.22. Calcular los percentiles 25, 36 y 75, a partir de la siguiente d istrib ucin
5.17. , Es posi ble calcular la mediana a partir de los dos cuadros siguientes? de frecuencias

a) X n, b) X n, X n,

25 puntos o ms 3 25 puntos o ms 3 103-108 8


21-24 10 21-24 16 97-102 JI
17-20 26 17-20 18 91-96 16
13-16 38 13-16 24 85-90 10
12 puntos o menos 64 12 puntos o menos 63 79-84 5

5.18. ;, Cual de las dos, media o mediana, representa mejor a los valores numri-
cos : l, 3, 4, 6, 8, 200, 8, 6, 4, 3, I ? J. 5.23. A partir de la siguiente distribucin de frecuencias , calcular las dos pun-
tuaciones que dejan entre s las 133 observaciones centrales y decir qu percen-
5.19. Cul eligira usted en primer lugar, la media o la mediana, como medida
tiles son esas d os pun tuaciones.
de tendencia central, a partir de las siguientes distribuciones de frecuencias ?

a) X n, b) X n, e) X
- -- -
n, r X n,
- -- --
34-39 2 66-69 8 91-100 6 f.! 40-44 13
28-33 o 62-65 10 81-90 10
35-39 40
22-27 l 58-61 25 71-80 25
30-34 77
16-2 1 6 54-57 28 61-70 26 t: 25-29 25
-...... ,,1:
10-15 15 50-53 12 51 -60 11
20-24 20
4-9 12 49 puntos o menos 9 41 -50 5
- - -
102 / Estadistica para Psiclogos

J.
5.24. Llamemos decil primero, decil segundo, ... , decil noveno a los puntos de
la escala que dejan por debajo de s el 10 por 100, el 20 por 100, ... , el 90 por 100
de las observaciones, respectivamente. Esto supuesto, tiene que ser igual la dis-
6
tancia sobre la escala entre dos deciles cualesquiera consecutivos que la distancia Estadsticos de variabilidad o dispersin
entre otro par cualquiera de deciles tambin consecutivos?
1
i;,. 5.25. Los percentiles son valores esencialmente positivos. S? No?

6.1. Introduccin

Los estadsticos de tendencia central o de posicin indican dnde se sita un


grupo de puntuaciones (en zona alta, media o baja). Los de variabilidad o disper-
sin nos indican si esas puntuaciones se encuen tran muy prximas entre s o muy
dispersas. Por ejemplo (7, 9, 11) y (1, 10, 16) tienen la misma media (posicin ),
pero la variabilidad o dispersin de las p untuaciones del primer grupo es menor
que la de las puntuaciones del segundo.

6.2. Desviacin media

6.2.1 . Definicin

Es la media de las d iferencias (en valor absoluto) den puntuaciones respecto


a su media aritmtica. En otras palabras, d adas n puntuaciones X 1 , X2 , x., su
desviacin media viene definida por

DM = /xi - x + 1x2 - x + + x. - x = 1: xi - x (6.1 )


n ll

6.2.2. Clculo

a) Datos no agrupados en intervalos

Aplicacin directa de la frmula (6.l ) a los datos originales.


EJEMPLO 6.1. Diez ratas blancas podan o btener un poco de comida al mover
una palanca situada dentro de una caja. Cada da, despus de veintids horas de
..~ ayuno, las ratas eran introducidas en la caja y se meda el tiempo transcurrido desde
que se les abra el acceso a la palanca hasta que la movan. Los datos de la tabla
104 / Estadistica para Psiclogos Estadsticos de variabilidad o disp ersin / 105

adjunta corresponden al quinto da de entrenamiento. (Vase Hull, Felsinger,


Gladstone y Yamaguchi (1947).) Tiempo n xj nxj lxj- -x'I n,lx; - x')

2 1 2 1,2 2,4
x' = ~
JO = - 02

31-45
Rata n." 2 3 4 5 6 7 8 9 10 16-30 4 o o 0,2 0,8
1-15 4 - 1 -4 0,8 3,2
Tiempo (en seg.): 25; 1,43; 20; 1; 8,56; 16,5; 16; 34; 4,43; 44 X= 17,09 segundos
DM = 15 64 = 9,6 segundos
10 -2 6,4 10

17,09 1 + iJ,43 - 17,09 1 + . .. + j44 - 17,091 _ 109,26 -


DM = 125 10 - 10 -
Queda como ejercicio para el lector la legitimacin de (6.2) y (6.3).
10,926 segundos

6.2.3. Propiedades
b) Datos agrupados en interwlos
Es fcilmente inteligible y fcilmente calculable.
a)
Raramente usada debido a que los valores absolu tos son muy poco mane-
b)
DM = I: nIX; - XI = L n;IX - !_I (6.2) jables matemticamente.
I:nj n

donde nj y Xj ~on, respectivamente, el nmero de observaciones y el punto medio 6.3. Varianza y desviacin tpica
del intervalo j.
EJEMPLO 6.2. Agrupemos los datos del ejemplo 6. 1 en tres intervalos y calcu-
6.3.1. Introduccin
lemos la desviacin media.
Si sumamos las diferencias den p untuaciones respecto a su media, sabemos que
dicha suma vale siempre cero. Para evitar este inconveniente, podemos tomar
Tiempo n, X nX IX, - iJ nJ!X, - xJ -
X = -200 = 20 segund os
dichas puntuaciones en valor absoluto (caso de la desviacin media) o podemos,
tambin, elevar dichas diferencias al cuadrado y sumar estas diferencias cuadrticas.
36 JO
31-45 2 38 76 18 Esta ltima tctica es la que seguiremos en el caso de la varianza y de la desviacin
16-30 4 23 92 3 12 tpica.
1-15 4 8 32 12 48
DM = -96 = 9,6 segundos La varianza, referida a una m uestra, ser designada por s2 y, referida a una
10 poblacin , por a 2 Como en este tomo J nos limitamos al estudio de muestras,
10 200 96
usaremos s 2 al tratar de la varianza. Excepcionalmente usaremos el smbolo a2
cuando de modo incidental nos refiramos a la varianza de la poblacin. A su vez,
la desviacin tpica, referida a una muestra, ser designada por s y referida a una
Junto a la frmula (6.2) y mediante la transformacin x1= X - Xo de que poblacin por a. Llamaremos s;, s~ . .. , a la varianza de la variable X , Y, ...
1
hemos hablado en 5.2.4, tendremos la siguiente frmula
6.3.2. Definicin
DM = I: nlx1 - x'I = I: nlxJ ~ x'I (6.3)
I: n n a) Varianza

Es la media de las diferencias (al cuadrado) de n puntuaciones respecto a su


EJEMPLO 6.3. Elijamos como origen el intervalo 16 - 30 en el cuadro corres- media aritmtica. En otras palabras, dadas n puntuaciones Xi, X2 , . , X", su
pndiente al ejemplo 6.2 y calculemos la desviacin media. varianza viene definida por:
106 / Estadistica para Psiclogos Estadistcos de variabi hdad o dispersin / 107
1
X) 2 + X).2 + + (X. - X) 2 I: (X; - X)2 306
1 1
s; (X, - (X2 -
n
(6.4) Segn (6.4): s; = 5 = 61,20 sx = 7,823 ensayos
n

Segn (6. 5) : s,2 = -6.431 2


- - 35 = 1.286,20 - 1.225 = 6 1,20 sx = 7, 823 en-
b) D esviacin lipica 5
sayos
2
(5)(6.431) - 175
Es la raz cuadrada de la varianza. Ser considerada siempre como positiva. Segn (6.6): s; S2
32. l 55 - 30.625 = 61 ,20 s, = 7, 823
25 ensayos
6.3.3. Clculo

a) Dalos no agrupados en intervalos b) Datos agrupados en n/C'rva/os

Aplicacin directa de (6.4) a los datos originales. Supongam os II observaciones agrupadas en r intervalos, todos ellos de igual
Desarrollando (6.4) podemos llegar a otras dos frmulas equivalentes. amplitud. Sea X, el punto m edio del in tervalo primero y 11 1 el nmero de obser-
vaciones dentro del mismo. Sea X2 el pun to medio del intervalo segundo y n2 el
2
X)2 + X2 ) nmero de observaciones dentro del mismo . Sea X, el pun to medio del intervalo
I:
- (X,
~ -- - = I:
______c.(X; - 2XX,
._ ,__ __,___....:. = :I:
- X,2 2X I:-
- - - X, + nX
- = , y n, el nmero de observaciones dentro del mismo. Segn sabem os, al agrupar
n n n n n
las observaciones en intervalos, atribuimos a cada una de ellas (como puntuacin )
= I: Xt _ 2g 2 + gz _ :I: X _ gi _ I: Xf _ (:I: X,) 2 _ n I: X,2 -2 (:I: X, )2 el punto medio del intervalo dentro del que se encuentra. Restemos ahora cada
n n n n n una de las puntuaciones de la media del grupo y elevemos al cuadrado estas d ife-
rencias. Dentro d el intervalo primero tendremos n 1 puntuaciones iguales a X , y,
Por con siguiente, consiguientemente, n 1 diferencias cuadrticas iguales a (X, - X)2 cuya suma
I:- X _ X2 valdr n 1(X 1 - X) 2 . Dentro del intervalo segundo tend remos n2 puntuaciones
52 - (6.5)
x - n iguales a X2 y, consiguientemente, n 2 diferencias cuadrticas iguales a (X 2 - X )2
cuya suma valdr 112 (X2 - X )2. Dentro del intervalo r ten dremos n, puntuaciones
2 _ n I: X - (:I: X, )2 (6.6) iguales a X, y, consiguien temen te, n, diferencias cuadrticas iguales a (X, - X )2
Sx - nz cuya suma valdr n, (X, - X)2 . En conclusin, la suma de las 11 1 + n2 + + n, = n
dife rencias cuadrticas valdr: n 1 (X, - X )2 + 112 (%2 - X )2 + + n,(X, - X )2 =
EJEMPLO 6.4. Rachman (1968) en un experimento con cinco jvenes pudo = !: nj{Xj - X) 2 y su media (es decir, la varianza de las n puntuaciones) valdr:
confirmar la hiptesis de que el fetichismo sexual es un comportamiento que puede
ser establecido tras un proceso de condicionamiento clsico. El nmero de ensayos I: n1 (X1 - X) 2 !: n(Xj - X) 2
de condicionamiento que fueron necesarios para implantar una conducta fe ti- si = (6.7)
chista en cada uno de los cinco sujetos fue : 35, 36, 21, 45, 38. Calculemos la varianza
r ni n

y la desviacin tpica de estos da tos. De (6.7) es fcil deducir las dos f rmulas siguien tes, de acuerd o con lo dicho
para el caso de da tos no agrupados en intervalos,
X, X,' (X, - X) (X, - .f)2
s2 = :I: nj_ - .f2
35 1.225 o o X
n
(6.8)
36 1.296 1 1 - 175
21 441 -14 196 X = - = 35 ensayos ,2 = n r '!J.-2]_::_J!: 111xy (6.9)
100
5 n2
45 2.025 JO X

38 1.444 3 9
EJEMPLO 6.5. Agrupando en cuatro in terva los los da tos de Conde y Domnech
ns- 6.431 o 306 (1976) propuestos en el ejemplo 5.24, nos queda
108 / Estadi5tica para Psiclogos
Estadisticos de variabilidad o di spersin / 109

Si A = l y B + s;O, = ( 1)s;. Es decir, si sumarnos a todas las puntuaciones


Edad n1 X xi
)
njX1 n;Xf X; - X (X; - i)2 n(X, - X)' una constanle, B, la- varianza (y la desviacin tipica ) de las nuevas puntuaciones
es igual que la varianza (y que la desviacin tipica ) de las antiguas. Lo cual es obvio,
70-89 20 79,5 6.320,25 1.590,00 126.405,00 33,832 1.1 44,604 22.892,080
ya que aadir una constante, B, a todas las puntuaciones, equivale a moverlas corno
50-69 31 59,5 3.540,25 J.844,50 109.747,75 13.832 191 ,324 5.931,044
un bloque rgido, sin alterar su dispersin o variabilidad, bien hacia la derecha
30-49 18 39,5 1.560,25 7 11 ,00 28.084,50 - 6 ,168 38,044 684,792
(si Bes positiva), b ien hacia la izquierda (si Bes negativa).
10-29 38 19,5 380,25 74 1,00 14.449,50 -26, 168 684,764 26.021 ,032
Si A+ O y B = O, s; s;.
= A 2 Es decir, si multiplicarnos todas las puntuaciones
107 4.886,50 278.686,75 55.528,948 por una constante, A, la varianza de las nuevas puntuaciones es igua l que la varianza
de las antignas multiplicada por A 1 . Consiguientemente, la desviacin ti pica de
las nuevas es igual que la desviacin tpica de las antiguas multipl icada por A.
_
X =~
4.886,50 = 45,668 aos pero tornada sta en valor absoluto. La razn de esta restriccin es la siguiente.
Veremos enseguida que una desviacin tipica, no nula, tiene que ser positiva. Por
tanto, s, ser positiva. Ello lleva consigo que si A fuera negativa, s, = As, debera
Segn (6.7): ser negativa, lo cual no tiene sentido, segn lo acabado de indicar. De aqu se sigue
que A debe ser tornada en valor absoluto.
55.528,948 = 518,962 = 22,781
s; = 107 s, aos b) La varianza y la desviacin tpica son sensibles a la variacin de cada una
de las puntuaciones. Baste con que vare una de stas, para que varen aquellas.
Ello es debjdo a que varianza y desviacin tpica dependen de todas y cada una
Segn (6.8):
de las puntuaciones y, consiguientemente, de la media .
e) Son fundamento de muchas tcnicas estadsticas que tienen gran impor-
s; = 278.686
,n~'
75
- 45,6682 = 2.604,549 - 2.085,566 = 518,983, s, = 22,781
anos tancia en Psicologa.
d) Son funcin de los intervalos elegidos (de su amplitud, de su nmero y
Segn (6.9): de los lmites de los mismos ).
e) Fuera del intervalo (X - 2s,, X + 2s,) se encuentra, a lo ms, el [ (l /22 )l 00]
(107)(278.686,75) - 4.886,s2 = 29.819.482,25 - 23.877.882,25 = 518 962 por 100 = 25 por 100 de las observaciones. Fuera del intervalo (X - 3s, , X + 3s, )
s~ se encuentra, a lo ms, el [(1/3 2 )100] por 100 = 11 por 100 de las observaciones.
1072 11.449 '
En general, fuera del intervalo (X - ks, , X+ ks,) se encuentra, a lo ms, el
s, = 22,781 aos [(l /k2 )100J por 100 de las observaciones, sea cual sea la forma de la dist ribucin
de frecuencias.
La diferencia entre 518,962, en (6.7) y 518,983, en (6.8) y (6.9), es debida a efec- Esta propiedad quedar legitimada en el torno 2: Estadstica lnferencial.
tos de redondeo. f) No sern calculables, o no sern recomendables, cuando no sea calculable,
o no sea recomendable, la media corno medida de posicin o tendencia central.
g) La desviacin tpica viene expresada en las mismas unidades en las que
6.3.4. Propiedades vienen expresados los datos. No ocurre lo mismo con la varianza. Si los datos,
por ejemplo vienen dados en metros, la desviacin tpica vendr dada en metros,
a) La varianza de Y1 = AX1 + B, Y2 = AX2 + B, . . . , Yn = AX" + B,
pero la varianza ven dr dada en metros cuadrados.
siendo A y B dos constantes arbitrarias, es igual a la varianza de X multiplicada por h) Dados r grupos. el primero con 11 1 puntuaciones. meda X, y varianza sf,
A 2 . Consiguientemente, la desviacin tpica de Y,, Y2, , Yn, es igual a la des- el segundo con n 2 puntuaciones, media X2 y varianza si, .. . , el r-sirno con n,
viacin tpica de X multiplicada por !Al. puntuaciolleS, media X, y varianza s;, la varianza, s;, de las 11 1 + n 2 + + 11, =
En efecto, sabernos que Y = AX + B (vase 5.2.3.c). Por tanto , la varianza = n puntuaciones, vale
de las nuevas puntuaciones, s;,
valdr, por definicin,

s; = I [(AX,+ B) - (AX+ B)]


2
=I (AX, - AX )2 A1 I (X, - X)
- 2
= A2_1.~
1: n n 11 s2 _ L ll ST !; 11 -(X _ X)2
.._!' ;x - -~. + _ .,_J--'-'----'~
11 n
Consiguientemente, s,. = !Alsx.
11 O / Estadistica para Ps,c/ogos Estadis t,cos de var,ab1/Jdad o d1spers1n / 111

Es decir, la varianza de las n puntuaciones es igual a la media de las varianzas En-.MPLO 6.6.
ms la varianza de las medias.
En efecto, sean

X11 , X2 1 , , X,., 1 las n 1 puntuaciones del grupo 1.0 con media X\ y varianza s}. Gru po p rimero Grupo segundo G ru po tercero

X 12 , X 22 , , X,,, 2 las 11 2 puntuaciones del grupo 2.o con media %2 y varianza sf 1 6 3


-1 8 7 11 = 11
3 5
X 1 ,, X 2 , , . , X.,, las n, puntuaciones del grupo r-simo con media X, y varianza s;. 5 5 X =4
2
Sean X y s~ la media y la varianza del grupo total, es decir, del compuesto por .2 72
14 20 1
las n1 + n2 + + n, = n puntuaciones. Esto supuesto, 10 'X
11
11,=5 11,=2 1 =4
113
x, = 2 x, = 7 x, = 5
1
X) + {X - X)] 2 s = 4 s = 1 s~ = 2
s; = LE (X,j - X)
~,_, _ __ E E [(X,j -
J '
1

/l /l

E E {X,, - 2 1 2 2 E (Xi - X) E (X; - Xi ) E n(X - X )2 L nsj = (5)(4) + (2)( 1) + (4 )(2 ) 30


J ' + J ' + ~;_ _ __ 11 11 = Ti
n /l /J

I: n/X, - X) 2 (5)(2 - 4)2 + (2)(7 - 4)2 + (4 )(5 - 4)2 20 + 18 +4 42


E E (X, - Xi)1 11
E i (X - X)
2
E n -s2 E n (X, - X )2 n
11 = 11 = 11
j 1 + 0 +1 = = + --"--"--- -
n n n n
r . 72 . l 30 , 42
Vemos, en e,ecto, como - es 1gua a - mas --
11 11 11
Es decir, la varianza del grupo total es igual a la media de las varianzas de cada
uno de los r subgrupos ms la varianza de las medias de cada uno de estos mism os r
subgrupos.
6.3.5. Mtodo abreviado para el clculo de la varianza
Recurdese que, segn 5.2.3. a),
Supongam os n puntuaciones agrupadas en in tervalos, todos ellos de amplitud /.
Sea X0 el punto medio de uno de ell os, elegido ar bitrariamente. al que llamaremos
E (X,1 - X) = I: (X,2 - A\) = = E (X,, - X,) = O intervalo origen. Hagamos A = ~ . B =- Xo . Segn 6.3 .4.a), las puntuaciones
1 1 ,
I I
Por tanto, x'. = ~ X + (- Xo) = ~ L :::._ X..9 tendrn com o varianza s 2 - = 1
2
De do n- J.
, I ' I I ' /" . '.
de, s; !2s;-.
= Esta ltima frmula nos permite obten er mediante cuyo s; s;.,
E {X1 - X) E (X, - X, ) = (X , - X) E (X1 - Xi) + {X1 - XJE (X, 2 - 1') + clculo suele ser ms sencillo y breve que el de s;.
Recordando las indicaciones
) 1 1 l propues tas en 5.2.4, vamos a aplicar el m todo abreviado a los mismos datos del
+ ,- .!!= {X, - X ) E (X,, - X,)= O + O+ + O = O ejemplo (6.2) y de los que hemos calcu lad o, all, la varianza mediante el mtodo
1 no abreviado .
112 / Estadistica para Psiclogos
Estadisllcos de vanabi/1dad o dispersin / 113

EJEMPLO 6.7. resulta que la media de todas estas varianzas, as definidas, vale
11
-
1
a; y no a;.
11

Para alcanzar que esa media valga a;:, basta con multiplicarla por _ n_ o, lo que
111 x; x;2 IJ/<; IJ,-l/
> xj - _y (x; - n' n;(x; - .n' 11 - 1
. Iente, b asta con d efimir
es equ1va . s,2 = - 11 I (X, - X )2 = -I (X,
- - - - -- -
- X)
--- - .
2

40 80 1,6916 2,8615 57 ,2300


70-89 20 2 4 ll - J 11 ll - ]
31 0,6916 0,4783 14,8273
50-69 31 l l 31 Esta ltima definicin de s; es la que suele aparecer en ciertos libros de Esta-
o 0,0951 1,71 18
30-49 18 o o o -0,3084
dstica Descriptiva y es la que usan m uchas mquinas de calcula r. La discusin de
38 - 1,3084 1,7119 65,0522
10-29 38 - 1 1 -38
este problema la dejamos para el tomo 2: Estadstica Inferencia!. Por ahora nos
149 138,8213 limitamos a comprobar lo dicho con el siguiente ejemplo.
107 33
EJEMPLO 6.8 . Sea la poblacin finita compuesta por los tres elementos l, 2, 3.
' vale
Su media .
= 2 y su varianza 2)_
(l _- __:.
vale a 2 = .:.._
2
+__;(2__
- 2)2 + (3 - 2)2 2
....:__.....c...._ _c.. = - .

.f' = ]_~ = O 3084 3 . 3


107 ' Formemos todas las muestras binarias posibles. pero de modo q ue extrado un
elemento de la poblacin, lo repongamos en la misma antes de extraer el segundo.
Calcular s;, equivale a aplicar (6.7 ), (6.8) y (6.9) a las puntuaciones x;. Tendremos (3)(3) = 9 muestras bin arias.

Segn (6,7 ):

l 38,8213 Muestras :i.: (X, - X) 2 :i.: (X, - X) 2


2
Sx =- - 1,2974
binarias
x n
107 n-1
- -- - - ~ - - - - - - - --
1, l 1,00 0,00 0,00
Segn (6.8): 1, 2 1,50 0,25 0,50
l. 3 2,00 1,00 2,00
s2 .
X
= 149
107
- O 30842
'
1.3925 - 0,095 1 1,2974 2, 1 1,50 0,25 0,50
2,2 2,00 0,00 0,00
2, 3 2,50 0,25 0,50
Segn (6.9) : 3, 1 2,00 1,00 2,00
3, 2 2,50 0,25 0,50
52, = (107)( 149) - 33~ = 14.854 = J 2974 3,3 3,00 0,00 0,00
X 107 2 11.449 > - - --
3,00 6,00
Por tanto,
s; = (20)2( 1,2974) = 5 18,96 3 6 2
- =- - =-
9 3 9 3
2
6.3.6. NOTA: sobre la definicin de s
'
Comprobamos como la m edta d e 1as varianzas
' d efi1mctas por -'-'---
I (X - xi-
Supongamos una poblacin finita compuesta de l\' elementos equiprobables. n -1
2
2
I (X, - t) d d l d . d d. h
Por d e fim1c1on , su varianza va e ax = --- -- - , on e i es a me ta e 1c a
vale 3,
3
es decir, un valor igual que el de la varianza de la poblacin y cmo la media
N
, , poblacin. Formemos ahora todas las muestras ordenadas posibles de tamao n .
de 1as varianzas I (Xi - -X)'
d efi1m.das por-'--'- 1
' - vaIe -, es decir,
. un va Ior d1stinto
. . (me-
, -~ . . . . I (X, - X )1 11 3
y calculemos sus varianzas mediante la formula s; = - - - - - - . Pues
11

bien, nor) que el de la varianza de la poblacin.
114 / Estadstica para Psiclogos Estadsticos de variabilidad o dispersin / 115

6.4. Amplitud total


AT = 91 - 31 = 60 o AT = 91 - 31 + 15 = 98,5 - 23,5 = 75

Ahora, en realidad, las nicas puntuaciones ex istentes son los p untos medios
6.4.1. Definicin de los intervalos. Por tanto, la amplitud total ser la diferencia en tre el punto medio
del intervalo mximo (91) y el punto medio del intervalo mnimo (3 1). A su vez,
Diferencia entre la puntuacin mxima y la mnima. O, teniendo en cuenta los Ja unidad que puede ser aadida es una unidad de intervalo , medio intervalo por
lmites exactos de los intervalos elementales o compuestos, diferencia entre la pun- debajo del punto medio mnimo y medio intervalo por encima del punto medio
tuaci n mxima y la mnima ms una unidad. mximo. En otras palabras, aadir una unidad de intervalo, equivale a aceptar
romo amplitud total la diferencia entre el lmite exacto superior del intervalo m-
ximo y el lmite exacto inferior del intervalo mnimo.
6.4.2. Clculo
23,5 31 38,5 83 ,5 91 98,5
a) Datos no agrupados en intervalos
EJEMPLO 6.9. La fenilcetonuria es una enfermedad causante de un deterioro
1 ' / " 1

mental que se agudiza con la edad. Los datos siguientes, tomados de Berman, ~ '-- - - - - ~( 60 )>-- - -- - -
Waisman y Graham (1966) representan los cocientes intelectuales de cinco nios
afectados por dicha enfermedad y cuya edad media aproximada era de cinco aos. 75

18. 29, 39, 40, 54

AT = 54 - 18 = 36 o AT = 54 - 18 + 1 = 54,5 - 17,5 = 37 1 6.4.3. Propiedades


54 54 , 5
1
7
53,5 a) Muy fcilmente calculable.
17 .5 18 18,5
1 '( 1 <--~~--~- b) Presenta el inconveniente de tener en cuen ta nicamente dos puntuacion es:
las dos extremas. Si stas se man tienen constantes, la amplitud total se mantendr
constante aunque varen de cualquier modo las restantes, siempre claro est, que
37 1 stas queden dentro del in tervalo limitado por las dos primeras.
As, dejando intactas las dos puntuaciones extremas (18 y 54) del ejemplo 6.9,
hagamos variar las tres interiores de dos maneras distintas. Comparemos los re-
b) Datos agrupados en intervalos sultados del caso primi tivo con los de los dos nuevos y veamos cmo per manece
EJEMPLO 6.10. Calculemos la amplitud total de los cocientes in telectuales de
invariante la amplitud total en los tres y cmo varan claramente la desviacin media
y la desviacin tpica.
otro grupo de 22 nios fenilcetonricos ms jvenes que los del ejemplo 6.9 y,
como puede apreciarse, con menor deterioro mental. Los datos expu estos a conti-
nuacin estn tomados de Berman y otros (1966) y han sido agrupados en inter-
valos p or nosotros del modo siguiente :
Puntuaciones AT DM s,

18,29, 39, 40, 54 36 37 10 12,01 7


CI X; n;
18, 36, 36, 36, 54 36 37 7,2 11,384
- - - -- -
91 6
18. 54, 54, 54, 54 36 37 11,52 14,40
84-98
69-83 76 5
54-68 61 2
39-53 46 5
24-38 31 4 6.4.4. Nota
; 22 La amplitud total suele ser llamada, tambin, recorrido o rango.
116 / Estadistica para Psiclogos Estad1st1cos d e vanabilida d o dispersin / 117

6.5. Amplitud semintercuartil Mientras que la amplitud semiin tercuartil ha permanecido invariante frente al
cambio de puntuaci ones. la desviacin media ha pasado de 5 a 37,33 y la desviacin
6.5.1. Definicin
tpica ha pasad o de 7,07 a 59,58.

Semidistancia entre el tercer cuartil y el primer cuartil , es decir, entre el per.


centil 75 y el percentil 25. 6.6. Coeficiente de variacin

6.6.1. Nota previa


6.5.2. Clculo

Basta con calcular los percentiles 75 y 25 (segn lo dicho en 5.5.2) y hallar la Consid eremos dos variables distintas, por ejemplo, peso (X ) y altura ( Y). Es
semidiferencia entre ambos. claro que s, vendr dada en unidades de peso (por ejemplo, gramos ) y s,. en unida-
EJEMPLO 6.11. Calculemos la amplitud semiintercuartil, a partir de los datos des de longitud (por ejemplo, metros). Ambas desviaciones tpicas no son compara-
del ejemplo 6. 1O. bles. Si s, valiera 5 gramos y s, 3 me tros, 5 gramos no son ms ni menos que 3 me-
En dichos datos, P 7 5 = 84,75, P25 = 43. Por tanto tros, son cosas distintas. Para hacer comparables las variabilidades de ambos gru-
pos, con variables de d istinta naturaleza, es necesario que vengan expresadas en
nmeros abstractos (es decir, ni en me tros, ni en gramos). Un modo de conseguirlo
AS/ = 84,75 - 43 = 20 875 es tomar como medidas de variabilidad s_,/X y s,/Y. Estos cocientes son nmeros
2 ' abstractos. Lo nico q ue n os indican es el nmero de veces que el numerador con -
tiene al denominador, ind ependientemente de lo que ambos signifiquen (gramos,
metros, etc.).
; ' Consideremos ahora una misma variable y dos grupos distintos, cuyas medias
6.5.3. Propiedades en esa variable son muy distintas entre si. Por ejemplo, el peso de 100 elefantes y
; el de 100 hormigas. Es evidente que una misma desviacin tpica igual a l kg repre-
a) Es preferible a la desviacin tpica en el caso de distribuciones muy asim- senta una variabilidad insignificante para el grupo de los elefantes e inconcebible-
tricas. (Recurdese que en este caso la mediana era preferible a la media .) mente alta para el de las hormigas. Por tanto, la desviacin tpica ser algo equ-
b) Cuando el intervalo mximo carece de lmite superior y/ o el mnimo ca- voca, en este caso, como medida de variabilidad. Un modo de evitar esta dificultad
rece de lmite inferior, es imposible calcular la desviacin tpica. Bajo estas con- es dividir la desviacin tpica de cada grupo por su correspondien te media, s, ,!X,,
diciones es posible calcular la amplitud semiintercuartil, siempre que el primero s,,fX2
y el tercer cuarlil no se encuentren en esos intervalos extremos. (Recurdese que
bajo estas condiciones era posible calcular la mediana y no era posible el clculo
de la media.) 6.6.2. Definicin
e) Definida como distancia entre d os puntos, slo es calculable a nivel de
intervalos o de razn, pero no a nivel meramente ordinal. Resultado de dividir la desviacin tpica por la media. Ordinariamente, este
d) Menos sensible q ue la desviacin media y que la desviacin tpica a la va- cociente viene multiplicado por 100. Es decir,
riacin de los datos. Veamos confirmada esta afirmacin en los siguientes d atos :
CV =~ o , ms frecuentemente, CV =~ 100
X
Puntuaciones AS/ DM s,

(45 - 3~ = 5 5 7.07 6.6.3. Clculo


30, 30. 30, 40, 40,40, 40, 40, 40, 50, 50, 50
' 1 2
(109 - 99) Mera aplicacin de la frm ula anterior.
._;.. l, 98, 100, 100, 100, !08, 108, 108, 1JO, 207, 207 ---- = 5 37,D 59,58
2 EJEMPLO 6.1 2. El peso medio (media aritmtica) de un grupo de elefantes es
6.000 kg y el de un grupo de hormigas es 2 dg. Sup oniendo que la desviacin tpica
118 / Estadistica para Psiclogos Estad1sticos de variabihdad o dispersin / 119

en ambos grupos fuera l dg, ,cunto valdr el coeficiente de variacin en uno y hay alguna variabilidad) o nula (todas las puntuaciones son iguales entre s, no hay
otro grupo? variabilidad), pero es inconcebible una variabilidad negativa . De aqu que sean
esencialmente no negativos los valores que pueden tomar los ndices de variabilidad
CV = ~~ 1- - - = 0,0000000167 , multiplicado por 100, 0,00000167 o dispersin. Por esta razn, supondremos X j O y tomaremos X en valor absoluto.
60.000.000

CV = i= 0,5 o, multiplicado por 100, 50


6.8. Resumen: Definiciones y frmulas

El segundo CV es 30 millones (!) mayor que el primero. Esto quiere decir que
la variabilidad relativa de ambos grupos es enormemente distinta, a pesar de que Desviacin media: Media de las diferencias (en valor absoluto) den pu ntuaciones
son iguales sus desviaciones tpicas. Una desviacin tpica de l decigramo repre- respecto a su media aritmtica.
senta una variabilidad apreciable en relacin con el grupo de las hormigas y no
representa, prcticamente, variabilidad alguna en relacin con el grupo de los ele- DM = r.1x, -x 1 (datos no agrupados en intervalos)
fantes. n

6.6.4. Propiedades DM = Ln1IX1 - x (datos agrupados en interva los )


n
a) Es un valor abstracto, como cociente de dos nmeros concretos (es decir,
dados en ciertas unidades concretas de medida) del mismo tipo. Recurdese que Varianza: Media de las diferencias (al cuadrado) den puntuaciones respecto
la media y la desviacin tpica vienen dadas en las mismas unidades en las que a su media aritmtica.
vienen dadas las puntuaciones a partir de las cuales aquellas son calculadas.
b) Si a unas puntuaciones dadas les sumamos una cantidad positiva, el coe-
ficiente de variacin disminuir, ya que sx se mantendr constan te, pero X aumen- 2
Sx
r
= -
(X, - X) 2
-- (datos no agrupados en intervalos)
tar en esa cantidad. Por tanto, el cociente sx/X disminuir despus de dicha suma. n
Si, por el contrario, les restamos una cantidad positiva, el coeficiente de varia-
cin aumentar, por anloga razn .
s~ = ~~ - X)
2
e) Si multiplicamos unas puntuaciones dadas por cualq uier constante positiva,
(datos agrupados en intervalos)
el coefici ente de variacin se mantendr constante, pues el numerador, sx, y el ll
denominador, X, quedarn multiplicados por la misma cantidad.
Es recomendable que, junto al coeficiente de variacin , se ofrezcan las corres- Desviacin tpica : Raiz cuadrada de la varianza.
pondientes sx y X a partir de las cuales ha sido calculado . Amplitud total: Diferencia entre la pu ntuacin m xima y la mnima (o, entre
la mxima y la mnima ms una unidad).
Amplitud semiimercuartil: Semidiferencia entre el tercer cuartil , Q 3 , y el primer
6.7. Notas cuartil, Q 1

AS] = ql. -= i\
a) Recordemos que, a nivel de intervalos o de razn, todo ndice de tendencia 2
central era un valor numrico que vena representado por un punto sobre el eje
de abscisas. Pues bien, todo ndice de variabilidad es una distancia q ue viene repre- Coeficientl' de tariacin : Cociente entre la desviacin tpica y la media (multi-
sentada por un segmento rectilneo . plicado, ordinariamente, por 100).
b) Tengamos presen te que todo indice de variabilidad es esencialmente no
negativif. Las puntuaciones pueden ser positivas o nega tivas, pero su variabilidad CV =~ 100
o dispersin ser siempre positiva (no son todas las puntuaciones iguales entre s, X
120 / Estadistica p ara Psiclogos Estadistlcos de var,abl/1dad o dispersin / 121

EJERCICIOS 6.10. Sean 7 y 20, respectivamente, la media y la varianza de las puntuaciones


x1 , X2 , . X,,. Calcule la media de las nuevas pun tuaciones Xf . Xi, .. . , X,; .

6.1. Calcular la varianza y la desviacin tpica a partir de los siguientes datos ,w 6.l 1. Sean 10 y 4, respectivamente, la media y la desviacin tpica de las puntua-
agrupados en intervalos. ciones X 1 , X 2 , . , X,, . Calcule la media de las nuevas puntuaciones (X1 - 3)2.
{X 2 - 3)2 , ... , (X,, - 3)2
a) 3, 5, !, 6, 10 b) 3, 4, 1, 4 6.12. Calcule el coeficien te de variacin a parti r de los da los del ejercicio 6. 1.
e) 2, 5, 6, l. 1 d) 1, O, 3, 1, 3, 4
e) 5,2,1,5,3,8 f) 1, 9, 3, 7, 8, 8 6.13. Sean 4 y 3, respectivamente, la media y la desviacin tpica de las punt ua-
ciones X 1 , X 2 , . . . , X,,. Calcule la media y la desviacin tpica de las puntuaciones
6.2. Calcular la d esviacin media a pa r tir de los datos del ejercicio anterior. Xf , X], . . . , X;, sabiendo que el coeficiente de variacin de estas ltimas puntua-
ciones vale 96 .
6.3. Calcular la varian za y la desviacin tpica a par tir de los siguen tes da tos
agrupados en intervalos. 6. 14. Sean 25 y 15, respectivamente, la m edia y la desviacin tpica de las pun-
tuaciones 3X1 - 5, 3X2 - 5, 3X. - 5. Calcular la desviacin tpica de las
- - - - nuevas puntuaciones Xr, X;. ... , X;.
sabiendo que el coeficiente de variacin
a) X ", b) X ll; e) X llj d) X ", de estas ltimas vale 80.
---
9-11 1 10-12 1 9-1 0 1 15-2 1 4 6.15. Sabiendo que las cinco puntuaciones - 4, 2, X , 4, O tienen como varianza 16
6-8 2 7-9 4 7-8 2 8- 14 10 y como coeficiente de variacin 200, calcular el valor de la tercera puntuacin
3-5 5 4-6 3 5-6 l 1-7 6 desconocida, X , y la mediana de las cinco.
0-2 4 1-3 2 3.4 4
6.16. Sea un grupo compuesto de n 1 personas con media X1 y varianza sf y olro
i) --- 1-2 2
grupo compuesto de n2 personas con media X2 y va rianza sf Demostrar que la
variam.a del grupo total, s1 , compuesto de las n 1 + n 2 personas, vale:
{-
- --
e) X n, f) X n, g) X ni h) X n
ll1Si + n2si + '!/~2 - (%1 - X2 )2
11 + 112
11-13 2 109-113 2 110-1 12 2 75-78 2 s2
8- 10 3 104-1 08 4 107-109 4 71 -74 :l 11 + 112
5-7 6 99-103 8 104-106 3 67-70 8
2-4 4 94-98 5 101- 103 1 63-66 7 (Sugerencia: recordar la propiedad 6.3.4.i de la varianza.)
--- 89-93 1 59-62 4
6. 17. Deducir las frmulas (6.2) y (6.3 ).
55-58 1
6.18. Deducir las frmulas (6.8) y (6.9).
6.19. Supongamos una poblacin compuesta de los cuatro elementos : l , 2, 3 y 4.
6.4. Calcular la desviacin media a pa rtir de los da tos del ejercicio anterior. Formemos a partir de la misma las (4)(4)(4) = 64 muestras ternarias posibles,
6.5. Calcular la amplitud semiintercuartil a partir de los datos de los ejercicios entendiendo q ue, extrado un elemento de la poblacin, es devuelto a la misma
5.21 y 5.22. antes de extraer un segundo elemento y, a su vez, ste es devuelto a la misma antes
de extraer un tercero. Esto supuesto, calcular la media de las va ria nzas de las 64 m ues-
6.6. Demostrar que L (X, - X)2 =L (X; - k )2 - n(X - k) 2
2
6.7. Comprobar la igualdad a nterior para X 1 = 1, X 2 = 2, X3 = 6 y k = 5. tras, habiendo definido, primero, la varianza como L (X, - X) Hacer lo mismo,
11
6.8. Vlgase de la igualdad expuesta en 6.6 para calcular L (X, - X )2 usando I: , - 2
k = 5 y teniendo en cuenta los datos siguientes: 3, 4, 5, 4, 6, 7, 4, 5. habiendo definido la varianza como _Q._::-~)_ (donde 11 = 3 ). Comprobar.
11 - 1
6.9. /. Qu hara Vd. para sim plificar el clculo de la varianza de las siguientes - 2 - 2
. L (X - X) 480/9 5 . I: (X, - X ) 720/9 5
punt\]a6nes: 2,75; -3,25; 6,75; 1,75; 5,75; -2,25; 4,75; - 4,25? _Cunto vale fi na1mente, como - ~ 1 - -
'
=- -=
64
-
6
y como - ~ - - = -
2 64 4
dicha varia nza?
122 / Esiadistica para Ps,clogos

que es, precisamente, el valor de la varianza de la poblacin :

(l 2,5)2 + (2 - 2,5)2 + (3 - 2,5)2 + (4 - 2,5)


2 5
4
7
4 Estadsticos de asimetra y apuntamiento
(Recuerde el lector lo dicho en 6.3.6.)

7. 1. Introduccin

Una distribuci n de frecuencias queda bastante bien caracterizada mediante


los estadsticos de posicin o tendencia cen tral y de varia bilida d o dispersin,
pero quedar an mejor caracterizad :'\ si conocemos la sim etr a o asimetra de la
misma y su apuntamiento.

7 .2. Asimetra

7.2.1 . Idea general

Sabemos que la mediana d ivide el h istograma (represen tacin grfica de la


I> distribucin de frecuencias) en dos reas iguales, es decir, de igual superficie. Pues
bien , d iremos que la distribucin de frecuencias es sim trica si una de las reas
es imagen de la o tra. Ntese que si un rea es imagen de la otra, ambas tienen la
misma superficie, pero pueden tener a mbas la misma superficie y no ser una imagen
de la o tra. As, por ejemplo, en la figura 7. 1, A y A ' tienen igual superficie y una es
imagen de la otra . En cam bio. en la figu ra 7.2. A y A ', teniend o igua l superficie.
una no es imagen de la otra.

- - 7
f
L __

A'

~J'~

Fig. 7. 1 Fig. 7.2


124 / Estadistica para Psiclogos Estadist1cos de asimetra y apuntamiento / 125

Es claro que si la d istribucin es simtrica , la mediana es, tam bin, centro a e puntuaciones X 1 , X 2 . , x. sigue siendo el mismo que el obtenido a partir de
gravedad, es d ecir, la med ia na coincide con la media. Por otra parte, si la distribu- Jas puntuaciones Y1 = AX 1 + B, Y2 = AX2 + B. ... , Y. = AX. + B .
cin de frecuencias es unim oda l, esa nica m o da coincide con la m ediana y, con-
siguientemente, con la media. En conclusin, si la distribucin es sim trica, m edia,
med iana y moda co inciden .
Diremos que la asim etra es positiva si tenemos m uchas puntuaciones bajas y
pocas a ltas. D irem os que es negativa si sucede lo contrario . Un test dilcil dar
lugar a una d istribucin asimtrica positiva. U n test fcil da r lugar a una distri-
bucin asimtrica negativa :

Q, Q, Q, Q, Q, Q,
Asimetra positiva Asimetra negativa

5 10 15 20 25 30 JO IS 20 25 30
Asimetra positiva Asimetra negativa

T eniendo en cuenta estas consid eraciones, presentamos a continuacin diver-


sos estadsticos o ndices d e asimetra .

7.2.2. Indice basado en los t res cuartiles


Q, Q, Q,
Llamarem os Q 1 , Q 2 y Q 3 a los cuartiles primero (o pcrcentl 25), segundo (o Simtrica
pcrcentil 50. o m ediana ) y tercero (o percentil 75), respectivamen te. Esto su-
puesto : Ntese que a l dividir por (Q 3 - Q) = (Q 3 - Q 2 ) + (Q 2 - Q .), hacemos
Si la d istribucin es simtrica, Q.1 - Q2 = Q2 - Q1 Si es asimtrica positiva, que A, sea un nmero abstracto. adems de co nseguir que quede dentro del inter-
Q3 - Q2 > Q 2 - Q 1 Si es asimtrica nega tiva, Q 3 - Q 2 < Q2 - Q 1 (vase valo ( - 1, + 1).
figuras adju ntas). D e a qu to mar como ndice de asimetra el siguien te criterio: Conviene advertir lo siguien te a cerca del criterio (7.1 ):
a) Si la distribucin es simtrica. necesariamente Q3 - Q 2 = Q2 - Q, y,
A,= (Q~ Q2l - (Ql - Q,) _ (Q3 - Q2 ) - (Q2 - Q) consiguientemente, A, = O. Pero si Q 3 - Q 2 = Q 2 - Q 1 , la distribucin puede
(7 .1)
Q3 - Q - (Q 3 - Q2 ) + (Q2 - Q) ser simtrica o asim trica.
b) Si Q3 - Q2 1 Q2 - Q1 , necesariamente la distribucin es asimtrica.
Si la distribucin es a simtrica pos1t1va, A, > O. Si es asimtrica negativa, Pero, siendo la distribucin asimtrica, tanto puede verificarse Q 3 - Q 2 = Q2 - Q,,
A, < O. Si es sim trica, A , = O. Ad ems, - 1 < A , < l . En efecto, al tender como Q 3 - Q2 j Q2 - Q ,.
(Q 3 - 9.
2 a cero, A, tiende a - 1; y al tender (Q 2 - Q 1 ) a cero, A, tiende a l. E JEMPLO 7.1. Los siguientes d atos (una vez agrupados en in tervalos) corres-
El nmero as o btenido es invariante frente a cualquier tra nsformacin del origen ponden a la latencia media de una respuesta motora ma nifestada por 59 ratas blan-
y de la unidad de medida. En otras palabras, el nm ero ob tenido a partir de unas cas (vase Felsinger. Gladstone, Y amaguchi y Hull , 1947).
126 / Estadistica para Ps1clogos Estadist,cos de as,metria y apuntamien to / 127

TABLA 7.l Segn (7.l):

Latencia
x, - ex, - x A = (2,470 - 1,074) - (1,074 - 0,535) = 1,396 - 0,539 = 0,857 =
", x,
2
nJXi X X)2 ni(X, - (Xi - X)' niX1 - X)' 0443
(en segundos) ' (2,470 - 1,074) + (1,074 - 0,535) l,396 + 0.539 l ,935 '
9,00-10,49 1 9,75 9,75 7,91 62,57 62,57 494,9 1 494,91
La asimetra es positiva. Consideremos el histograma correspondi ente a la
7,50-8,99 1 8,25 8,25 6,41 41,09 41,09 263,37 263,37
distribucin de frecuencias an terior (Fig. 7.3).
6,00-7,49 l 6,75 6,75 4,91 24,11 24,11 118,37 118,37
4,50-5,99 3 5,25 15,75 11,63 34,89 39,65 EJEMPW 7.2. En la tabla 7.2, dentro de cada intervalo tenemos los nios na-
3.41 118,95
3,00-4,49 7 3,75 26,25 1,91 3,65 25,55 6,97 48,79 cidos que, entre 10.000, probablemente presentarn el sndrome de D own (mon-
1,50-2,99 5 2,25 l l ,25 0,4 [ 0,17 0,85 0,07 0,35 golismo) y cuyas madres tienen edades comprendidas dentro de dicho intervalo
0,00- 1,49 41 0,75 30,75 -1 ,09 1, 19 48,79 -1,30 -53,30 (vease Coliman y Stoller, 1962). Como se ve, el riesgo de tener un hijo monglico
aumenta con la edad, por lo cual la distribucin es asimtrica negativa.
59 108, 75 237,85 991,44

X= 1,84 seg. Md = Q2 = 1,074 seg. Mod = 0,75 seg. Q1 = 0,535 seg.


Q3 = 2,470 seg. S, = 2,01 seg.

2,195 "'-4,495 5,995 7,495 8,995 10,495


1,~95\
1 1 1
~
...,. q
:::e -<;;' .,.:,,
<:,'
"- \\
.,, .,, .,,::,
~
/
Cl,'
11
e
~f' ~
0
. 'd' ,,. Q, ~ 45, 12
31

Fig, 7.4
F ig. 7.3
Esradisticos de asimerria y apuntami ento / 129
128 / Esrad1st1ca para Psiclogos

TABLA 7.2 Pues bien, aceptaremos como indice de asimetra la expr esin

X)' n,(X1 X)'


X) 2 (X 1
l: (X, - %)3/n
-
Edad n, X; n,X, x1 - X (Xi - i)2 n;(X; -
-
-

- - -- -- -- -
m3
a3 = - - - = - ~- '-'-
_ "f.11 (X, - X )3/n
a3 - (7. 2 )

45-49 218 47 10.246 3,78 14,29 3.115,22 54 ,01 11.774,18 m~2 s; SJ


X

149,00 - t.82 - 182,00


4 .200 - 1,22 1,49
40-44 100 42 - 8.422.40
1.295 -6,22 38 ,69 1.354, 15 - 240,64 Segn sabemos, m 1 = O siempre. El momento m 2 (o va ria nza) es siempre no
35-39 35 37 - 1.412 ,47 - 15.537. 17
- 11 ,22 125,89 1.384.79 negativo. Ninguno de los dos nos vale para medir la asimetra. El momento de
30-34 JI 32 352 -34. 138,32
263,09 2.104,72 - 4.267,29 tercer orden, m 3 , puede ser positivo, negativo o nulo. Si la distribucin es simtri-
25-29 8 27 2 16 - 16,22
-9,555. 12 - 57.330,72
20-24 6 22 132 - 21 ,22 450,29 2.701,74
2.749,96 - 18.025.95 - 72.103,08 ca, m 3 = O. En efecto, debido a la simetra, a cada diferencia (Xi - X ) positiva,
15-19 4 17 68 - 26,22 687,49 le corresponde otra igual pero negativa. Consiguientemente, a cada cu bo (X, - X )3
- 175 .939,5 1 positivo le corresponde otro cubo igual pero negativo. Por tanto, la suma de todos
13.559,58
382 16. 509 los cubos ser nula y a 3 = O.
Por su parte, si la distribucin es asimtrica positiva, la s diferencias (X; - X )
Md = Q2 = 45, 12. Q, = 41 ,08, Q3 = 47,31 , s, = 5,96
i = 43,22, mximas son positivas y estas diferencias quedarn muy a umentadas al ser elevadas
al cubo. Ello hace que la suma de las diferencias positivas, elevadas al cubo, sea
Segn 7.1: mayor que la suma de las diferencias nega tivas, elevadas al cubo, aunq ue el n mero
de estas ltimas sea mayor que el de las diferencias p osi tivas. Lo contrario ocurre
A = (47,31 - 45,12) - (45, 12 - 41 ,08) 2, 19 - 4,04 =- 1.85 = _ 0.297 cuando la asimetra es negativa.
' (47,31 - 45,12) + (45, 12 - 41,08) 2,1 9 + 4.04 6.23 En conclusin, a 3 es positivo c uando la asimetra es positiva y es negativo c uan-
do la asimetra es negativa .
La asimetra es negativa. Consideremos el histograma cor respondiente a la La razn de dividir por s; a
es conseguir que 3 sea un n mero abstracto e inde-
distribucin de frecuencias anterior (Fig. 7.4). pendiente de la variabilidad del grupo.
EJEMPLO 7.3. Calculemos a 3 a partir de la tabla 7.1.

7.2.3. Indice basado en el momento de tercer orden 2


s,
237,85
= 59 = 4,03, s, = 2, o1, J
s, = 8,10
Llamaremos momento emprico de orden p respecto a la media. a la expresin :
a = 991,44/ 59 =
3 2 08
r.n -(X- - X)P 8,10 '
n 1P = r.~_,_,
(X, - X'f
_..:.... ,nP = J J
n
11
Ntese que hay 41 diferencias (X1 - X) nega tivas y slo 18 positivas, pero la
suma de stas (elevadas al cubo} es mucho mayor que la suma d e las primeras (ele-
E n particular, vadas, tambin , al cubo ).
EJEMPLO 7.4. Calculemos a 3 a partir de la tabla 7.2.
"f.(X, -X ) m1 = ~..!~}X1~ X)
m, =- - 11-- - n
13.559,58
r. (Xi - X)2 m = L n 1(X =- X)2
s2X = = 35,50, s, = 5,96, s_: =e 21 1,58
382
m2 = 11
2
11

- 175.939,5 1/ 382 = _ 2, 18
r. (X, - i)3 r. n}X1 - X) 3 3 = 2 11 ,58
nl3 = - - -- - m, =- - n -- -
11
Ntese que hay 218 diferencias (X1 - X ) p ositivas y slo 164 negativas, pero la
r. = ~~ ::..!1.. suma de stas (elevadas al cu bo) es mucho mayor que la suma de las primeras (ele-
4
X)
4 ..~
(X1 - /114
m4 = vadas, tambin, al cubo).
11
n
Estadsticos de asimetra y apuntamiento / 131
130 / Estadstica para Psiclogos
7.3.2. Indice basado en el momento de cuarto orden
Conviene advertir lo siguiente acerca del criterio (7.2):
3
a) Si la distribucin es simtrica. necesariamente l: (X, - X ) = O y, consi- Para dos curvas con la misma desviacin tpica, la ms apuntada deber con-
guientemente, 11 3 = O. Pero si ,1 3 = O, la distribucin puede ser simetrica o asi- tener ms observaciones bajo los dos extremos alejados de la media que la me-
m trica . nos apun tada. Para estas observaciones extremas, las diferencias (X, - .X) ser n
b) Si r (X, - .X) 3 +
O, necesariamente la distribucin es asimtrica, pero
3 grandes y sern mucho mayores al ser elevadas a la cuarta potencia. Por tanto ,
siendo la distribucin asimtrica, puede verificarse tanto l: (X, - X ) = O, como r (X; - X )4 ser mayor para la curva leplocrtica que p ara la platicrtica. Por
l: (X, - X )3
+O. .. .
otra parte, se dem uestra en Estadistica In feren cial que
l:(X- X )4/n
' 4 - 3 = O
s,
en el caso de la curva normal. Por e llo, suele ser elegido corno criterio de apunta-
7.2.4. Nota miento o curtosis la expresin
Hemos visto que si la distribucin es simtrica y unimodal, media, mediana y
moda coinciden y que si no coinciden, la dislribucin tiene que ser asimtrica. Fun- u4 = l: (X, - X)4/ n - 3
dados en ello, podemos introducir indices de asimetra . De hecho . han sido pro- s!
. d. d . .
puestos como m ices e as1metna A,= - - -
X - Mod y A,= --'---3(X - Md)
---' esperando De lo expuesto se infiere que a 4 > O para las curvas Ieptocrticas y a 4 < O
s,l; .\x
para las pla licrticas.
que A, > O si la asimetra es positiva y que A , < O si la asimetra es negativa. Lo
L a razn de dividir l: (X; - X) 4 /n por s! es a nloga a la ofrecida en 7.2.3 res-
que indudablemente es cierto es que A = O si la distribucin es simtrica y que
pecto a l ndice de asimetra a 3
si A, +
O, la distribucin es asimtrica . EJEMPLO 7. 5. Burt (1963) midi el cociente intelectual de un grupo numeroso
de nios y obtuvo la distribucin de frecuencias que, con ligeras modificaciones,
exponernos a continuacin.
7 .3. Apuntamiento
CI n1 x, n,X; (X1 - X) IX1 -X)2 ni(X - X)' n;(X; - X]4 /4 .659
7.3.1. Idea previa 150-159 5 154,5 772,5 55,74 3. 10<,,95 15.534,75 10.359,652
140-1 49 18 144,5 2.601,0 45,74 , 2.092, 15 37.658,70 16.9 10,81 1
De un modo no muy riguroso diremos que una curva es muy apuntada si es ff 130-139 84 134,5 11.298,0 35,74 1.277,35 107.297,40 29.4 17,433
muy alta y estrecha. Diremos que es p oco apuntada si es baja y ancha. Eligiendo 120-129 253 124,5 31.498,5 25,74 662,55 167.625, 15 23.837,570
como patrn la curva normal (de la que hablaremos pronto }, diremos que una JI0-119 74 7 114 ,5 85.531 ,5 15,74 247,75 185.0<,9,25 9.841 ,1 72
curva es leptocrtica si es ms apuntada que la normal y que es platicrtica si es 1 100-109 1.21 7 104,5 127. 176,5 5,74 32,95 40.100, 15 283,560
menos apuntada que la normal. Diremos que la curva normal es mesocrtica *. 90-99 1.148 94,5 108.486,0 -4,26 18,15 20.836,20 81 ,150
80-89 719 84,5 60.755,5 - 14 ,26 203,35 146.208,65 6.381 ,375
70-79 294 74,5 21.903,0 -24 ,26 588,55 173.033,70 2 1.858,372
60-69 99 64,5 6.385,5 -34,26 1.173,75 116.20 1,25 29.274,664
50-59 47 54,5 2 .561,5 - 44 ,26 1.958,95 92.070,65 38.712,462
40-49 21 44 ,5 934,5 - 54,26 2.944,15 61.827, 15 39.070,2 10
30-39 7 34,5 241 ,5 -64.26 4 .1 29,35 28.905,45 25.6 19,356

4.659 460. 145,5 1.192.368,45 251.647, 787

X=
460.145,5
4.659
= 98, 76, s; =
1.1 92.368,45
4 .659
= 255,93, s: = 65.500,1 6
X
25 1.647, 787
~1" 04 = - 3 = 3,84 - 3 = 0,84
Del griego, ,cnt<; (lepts): delgado, estrecho: ~tlI; (plats): ancho. extendido ; ,<!o<; 65.500, J 6
(mesos): medio : ppr,; (kirts): encorvado, convexo: xuptr~<; (kirtotes): curvatura.
132 / Estadistica para Psiclogos Estadsticos de asimetra y apuntamiento / 133

La distribucin es leptocrtica, lo cual indica que existen ms subnormales y EJERCICIOS


ms superdotados que los que habra habido si la distribucin hubiera sido normal.
7.1. Calcula r el ndice de asimetra basado en el momento de te rcer orden a parti r
de los siguientes datos: 10, 12, 12, 14, 10, 10, 16, 12, 14. JO.
7.4. Resumen : Definiciones y frmulas 7.2. Calcular el ndice de a puntamiento a partir de los da tos del ejercicio anter ior.
7.3. Sean n puntuaciones X, , X 2 , , x . Transfor mem os estas puntuaciones
Asimetra: Diremos que una distribucin de frecuencias es simtrica si a cada en las siguientes: r 1 = A X 1 + B, Y1 = AX2 + B, . . . , Y. = AX. + B . Demos-
puntuacin X, + d istante de la media, por la derecha, una distancia k, le corres- trar que el ndice de curtosis o apuntamiento, propuesto en el texto, de las nue-
ponde otra puntuacin X,_ distante de la media, por la izquierda, la misma dis- vas puntuaciones Y, es el mismo que el de las puntuaciones primitivas X, .
tancia k y tales que la frecuencia correspondiente a X;+ es la misma que la corres-
7.4, Calcular los ndices de asimetra, propuestos en el texto, a partir de las si-
pondiente a X, _ . guientes distribuciones de frecuencias :
Diremos que es asimtrica toda distribucin que no cumpla con lo acabado
de indicar.
a) X n, b) X 11
- -- - - -
ndices de usimetr1 : 10- 12 5 9-11 2
7-9 10 6-8 10
(Q3 - Q2) - (Q2 - Q) 4-6 20 3.5 6
J-3 15 0-2 2
a) A, = - - - - - - -
(Q3 - Q2) + (Q2 - Q1)

b) a3 =L (X, - X)3/n
7.5. Calcular el n dice de curtosis, propuesto en el texto, a partir de las d istri-
(para datos no agrupados en intervalos ) buciones del ejercicio a nterior.
53
X

7.6. Supongam os que, sie ndo simtrica la distribucin de frecue ncias, el per-
L n-(X - - X) 3 /n centil 25 vale 6,5, L n; = 12, L n;X; = 114, !: n;X; = l .259. Esto supuesto. calcu-
03 = 1 1 J
Sx
(para datos agrupados en intervalos)
lar el percentil 75 y el coeficiente de variacin.
7.7. En una distri bucin simtrica de 40 elementos, X 1 , X 2 , . , X40 , L (X, -
Apuntamiento : Diremos que una distribucin de frecuencias es muy apuntada
- 11 )2 = l.040, L x, - k I es m nima para k = 1O. Esto supuesto, calcular el
o poco apuntada segn que el correspondiente histograma sea alto y estrecho o coeficiente de variacin de dichas pu ntu aciones .
bajo y ancho.

ndice de apuntamiento :

a4 =L (X -
' X)4/n - 3 (para datos no agrupados en intervalos)
4
Sx

Ln(X - X)4 / n
a4 = 1 1
4
- 3 (para datos agrupados en intervalos)
sx

!'
Punruac,ones tip,cas / 135

8 equivale a

x , = AX, + B

Puntuaciones tpicas
con A 1y B = -X ;

1 -
= s- X - X 1 -
.X sx

equivale a

8.1. Puntuaciones directas, diferenciales y tpicas z, = A X,+ B

a) Puntuacin directa
l -
con A= - y B
sx
= -~
X
La atribuida directamente a cada objeto al ser sometido a cualquier tipo de
prueba . Estas puntuaciones suelen ser designadas en Estadistica Descriptiva, por
letras maysculas latinas.

8.2. Propiedades de las puntuaciones tpicas


b) Puntuacin diferencial
a) La media de las puntuaciones tpicas vale cero.
Puntuacin directa menos la media. Estas pun tuaciones suelen ser designadas, En efecto,
en Estadstica Descriptiva, por letras minsculas latinas.
1
:E::,- = !: (X, - X)/s, = (I/s,) r (X, - X) =o
c) Punwacin rpica
-pues segn sabemos (ver 5.2.3.a)
Puntuacin diferencial dividida por la desviacin tpica. Estas pun tuaciones
suelen ser designadas en Estadstica Descriptiva, por la letra min scula latina z.
r (X, - X)= o
EJEMPLO 8.1. Sean 6, 4, 2, 5, 8 los valores obtenidos directam ente en una
prueba por cinco personas. Su media vale 5 y su desviacin tpica vale 2. Esto su- Con siguientemente,
puesto, veamos cunto valen las puntuacio nes dife renciales y tpicas.
Puntuaciones directas : X, =6 4 2 5 8
Puntuaciones diferenciales : x , = X, - X = 1 -1 - 3 O 3
:; = L z/n = {l /11) L Z =
Puntuaciones tpicas : = x,ls, = (X, - X)/s., = 0,5 - 0.5 - 1.5 O I,5
Podamos, tambin, haber pensado as :
Ntese que
1 -
/" =- X, - X
X ;= x,. - X sx sx
136 / Estadistica para Psiclogos
Puntuaciones tpicas / 137
Por consiguiente, segn 5.2.3.c,
Por tanto,

:=2X -~ = 0
Sx Sx f = Az + B = (A)(O) + B = B (recordando 5.2.3 .c)
s, = IAl-r, = !A!O) = IA (reco rdando
1 6.3.4.a)
EJEMPLO 8.2 . Comprobemos esta propiedad con los datos del ejemplo 8.1.
EJEMPLO 8.4 . T ransformemos las puntuaciones tpicas del ejemplo 8.1 me-
: = (0,5) + (- 0,5 ) + (-1,5) + (0) + (1,5) = Q= O diante Y, = 10::, + 20 y comprohcmos cmo la media y la desviacin tpica de
5 5 Jas nuevas puntuaciones Y, valen, respectivamente, f = 20. = 1O. s,.
b) La varianza (y la desviacin tpica) d e las puntuaciones tpicas vale uno.
>' 1 = (1 0)(0,5) + 20 = 25 Y2 = ( 10)(-0.5) + 20 = 15
En efecto,
Y.i = (10)(-1 ,5) + 20 = 5 , Y4 = (10)(0) + 20 = 20
I _2 Y 5 = ( 10)(1, 5) + 20 = 35
s; = I (z, - .:)2 -2 I (x,/s,)2 I xf I I x; 1 2
- ~-'-- = ~ - = - - = - s
n n n (s;)(n) s; n s; '
y= 25 + 15 + 5 + 20 + 35 = l 00 = 20
De lo acabado de ver se deduce que I ::! = n . 5 5
Podamos, tambin, haber pensado as:
+ + + (20 - 20) 2 + (35 - 20) 2
s; (25 - 20)2 (15 - 20)' (5 - 20)2
5
-, = -l X, - ~-
Sx sx
500
100 1, = 10
Por consiguiente, segn 6.3.4.a, 5

2 1 2 Basndonos en esta propiedad podemos convertir unas puntuaciones dadas


s= =2sx =
s, X 1 , X 2 , , X,,, con media X y desviacin tpica s,, en otras puntuaciones Y1 ,
Y2 , , Y,. cuya media Y y cuya desviacin tpica s,, sean dos valores fijados de
EJEMPLO 8.3. Comprobemos esta propiedad con los datos d el ejemplo 8.1. antemano p or nosotros. En efecto. basta con transformar en tpicas las p untuacio -
nes primitivas. multi plicando, despus, dichas punt uaciones t picas por s, y su-
mando 9 a cada uno de esos productos. donde s,. e Y son dos valores elegidos a
{l,5)2 = ~ =
2
s! = (0,5)2 + (-0,5)2 + (- 1,5)
2
+ (0) + 1 nuestro a rbi tro. Es decir, las n uevas puntuaciones sern:
5 5

e) Si m ultiplicarnos las puntuaciones tpicas por una constan te A y sumamos }, =X,--


s . + }~
- X s, X +
= -.\x (l C s, - )
- -'- X
a esos productos otra constante B, las nuevas puntuaciones tienen como media 1 sx } j s.l
By corno desviacin tpica IAj.
En efecto, acabamos de ver que EJEMPLO 8.5. Deseamos t ransformar las p untuaciones 21 , 11, 1, 16, 31 obte-
nidas en un test en otras cuya media sea 100 y cuya desviacin tpica valga 20. Esto
z= o y s, = supuesto, en qu pun tuaciones se convertirn las puntuaciones da das?
La media de estas pu ntuaciones vale l 6 y la desviacin tpica vale I O. Por consi-
Ahora bien. las nuevas puntuaciones son guiente,

,,_-:-- 20 20
Y1 = A~,+ B Y = -- X + (100 - - - 16) = 2X + 68
' 10 ' 10 '
Puntuaciones //picas / 139
138 / Estadistica para Psiclogos

Supongamos dos grupos A y B. ta les que s,i = 2 y s8 = 4. La misma puntua-


Es decir,
cin diferencial tres, significa ms referid a a A que a B. Ahora bien, esta diferente
Y1 = (2)(21) + 68 = 110 Y2 = (2)(11) + 68 = 90 significacin viene dada precisamente por las correspondientes puntuaciones
, Y4 = (2)(16) + 68 = 100 tpicas, :,. = 3/ 2 = 1,5, : 8 = 3/4 = 0,75. Por consiguiente, la pun tuacin tpica
Y3 = (2)(1 ) + 68 = 70
admite una interpretacin ms completa sobre la memoria de Pedro.
l\ = (2 )(3 1) + 68 = 130

Las nuevas puntuaciones cumplen con las condiciones exigidas, Y= 100,


s, = 20. En efecto:

y = 110 + 90 + 70 + 100 + 130 = 500 = 100


5 5
(110 - 100)2 + (90 - 100)2 + (70 - 100)2 + (100 - 100)2 + (1 30 - 100)2
s; 5

= 2.000 = 400
5
S1. = 20
x~ t9 22
-J--.-
8.3. Significado de las puntuaciones directas, diferenciales
y tpicas En conclusin, el significado de las puntuaciones directas. consideradas en s
mismas, es prcticamente nulo. Admiten un cierto significado, consideradas en
Sabiendo que Pedro obtiene una puntuacin directa igual a 22 en una prueba relacin con la tendencia central (media). s te es an ms completo, consideradas
de memoria, nada podemos afirmar sobre su memoria. Es necesario conocer las en relacin con la tendencia central (media) y con la variabilidad (desviacin t-
puntuaciones obtenidas por las restantes personas del grupo al que pertenece pica). Es decir, las puntuaciones tpicas significan ms que las diferenciales y stas
Pedro. Este grupo puede ser reducido o amplio, puede constar de sus compaeros ms que las directas.
de clase, de los muchachos de su propia edad, de las personas de su nacin, de to- Pronto veremos que, muy frecuentemente, en Psicologa cada puntuacin tpica
dos los habitantes de la Tierra. Pero, pequeo o grande, es necesario un grupo de ser, adems, traducible en un porcentaje. Dada una puntuacin tpica, podremos
referencia para poder hacer la ms mnima afirmacin sobre la memoria de Pedro. calcular cuntas personas del grupo de referencia se encuentran po r debajo de ella.
Supongamos que, definido dicho grupo, la media de ste vale 19. La puntuacin As, m ediante las puntuaciones tpicas podemos obtener una interpretacin muy
diferencial de Pedro valdr 22 ~ 19 = 3. Por ser positiva comprobamos que Pe- razonable sobre la memoria de Pedro.
dro est encima de la media de su grupo. Si hubiera sido negativa, Pedro se habra
encontrado por debajo de la media . La puntuacin diferencial nos permite afirmar
algo sobre la memoria de Pedro, pero an esta interpretacin es bastante impreci- 8.4. Comparabilidad de las puntuaciones tpicas
sa. Superar la media en tres unidades, _es mucho o poco'? Depende de los casos.
Si nadie o casi nadie del grupo se aparta de la media tres o ms unidades, tres sig-
nifica mucho. Pero si bastantes la superan en ms de tres unidades, tres sign ifica En principio, dos puntuaciones directas (o diferenciales) r eferi das a dos carac-
mucho menos. Ahora bien, en general, en el primer caso la variabilidad del grupo tersticas distintas, no son comparables entre s. Si, por ejemplo, las dos caracters-
(y, en concreto, la desviacin tpica) ser pequea. Por el contrario, en el segundo ticas son p eso y altura, 70 kg ni son ms ni son menos que 180 cm. Son dos cosas
se:; grande. Por consiguiente, la in terpretacin de una misma puntuaci n diferencial distintas y, por tanto, no comparables. Por el contrario, dos pun tuaciones tpicas
-sr distinta segn sea una u otra la variabilidad del grupo y, en concreto, la des- son siempre comparables, al ser nmeros abstractos; es decir, al no venir expresadas
en ninguna unid ad concreta de medida.
viacin tpica.
140 / Estadistica para Psiclogos Puntuaciones tpicas / 141

Ms aun. En el caso de una sola caracterstica, seran ya comparables dos pun- Pero, A I dejar por debajo de s el 70 por 100 de los casos y A 2 slo el 60 por 100.
tuaciones directas y diferenciales, pues ambas vendran expresadas en una misma Es decir, a iguales puntuaciones tpicas (y directas) corresponden distintos por-
unidad de medida. Sin embargo, aun en este caso, las puntuaciones tpicas son centajes.
ms comparables entre s que las directas y diferenciales. Supongamos que dos es-
tudiantes, M y N, pertenecientes a dos grupos distintos realizan una misma prueba.
Es claro que las puntuaciones tpicas del primer grupo y las del segundo tienen una
misma media (igual a cero) y una misma desviacin tpica (igual a uno ). Por esta ra-
zn, las puntuaciones tpicas de M y N, referidas a una misma media y a una misma
desviacin tpica, son ms comparables entre s que sus puntuaciones directas,
referidas probablemente a distintas medias y a distintas desviaciones tpicas, y
que sus puntuaciones diferenciales, referidas probablemente a distintas desviaciones
tpicas. Por consiguiente, en general, dos puntuaciones tpicas admiten una com-
parabilidad mayor que las directas y diferenciales.
Con todo, esta mayor comparabilidad no implica que dos o ms personas,
40 30 20 20 30 40
pertenecientes a dos o ms grupos distintos, sean iguales bajo cualquier aspecto
por el mero hecho de haber obtenido las mismas puntuaciones tpicas. Vamos a 4 5
2 2
limitarnos a un par de casos elementales.
a) Dos grupos distintos realizan una misma prueba y obtienen la misma me-
dia y la misma desviacin tpica. Pues bien, si dos personas, una del primero y otra A su vez, A 1 con z , = 0,5, y ,4 2 con ::1 = 0,75, obtendrn puntuaciones d irectas
del segundo, obtienen la misma puntuacin tpica, obtendrn la misma puntuacin distintas X, = 3 + (1)(0,5) = 3,5, X 2 = 3 + (l )(0,75) = 3,75, pero dejarn por
directa (es decir, dentro de lo posible, manifestarn en el mismo grado la caracte- debajo de s el 70 por 100 en ambos casos. Es decir, a iguales porcentajes corresponden
rstica de que se trata), pero no dejarn necesariamente por debajo de si el mismo puntuaciones tpicas (y directas) distintas.
porcentaje. Recprocamente, si dos personas, una de cada grupo, dejan por debajo b) Dos grupos distintos realizan una misma prueba y alcanzan diversa media
de si el mismo porcentaje, no obtendrn necesariamente la misma puntuacin y/o diversa desviacin tpica. Pues bien , si dos personas, una del grupo primero
directa (es .decir, no manifestarn la caracterstica en el mismo grado) ni, en conse- y otra del segundo, obtienen Ja misma puntuacin tpica, obtendrn, en general,
cuencia, obtendrn necesariamente la misma puntuacin tpica. Consideremos, distintas pun tuaciones directas (es decir, manifestarn la caracterstica en distinto
por ejemplo, los dos grupos siguientes que, realizando una misma prueba , X, al- grado) y dejarn por debajo de s distintos porcentajes. Si dos personas, una del
canzan la misma media y la misma desviacin tpica, pero tales que el primero primer grupo y otra del segundo, obtienen la misma puntuacin directa, (mani-
muestra una clara asimetra positiva y el segundo una clara asimetra negativa. fiestan la caracterstica en el mismo grado), obtendrn, en general, distintas pun-
tuaciones tpicas y dejarn por debajo de s distintos porcentajes. Consideremos,
por ejemplo, los dos grupos siguientes que, realizando una misma prueba, X, al-
Grupo 1.0 Grupo 2. 0

x, n, n;X; n,X/ x, n, n,X, nXl


l canzan distinta media y distinta desviacin tpica, pero tales que el primero mues-
tra una clara asimetra positiva y el segundo una clara asimetra negativa.

4 40 160 640 Grupo J. 0 Grupo 2.0


5 JO 50 250
4 20 80 320 3 30 90 270
3 30 90 270 2 20 40 80 x, n, n,X, n;X/ x, il n;X
1 nX,2
2 40 80 160 1 10 10 10
5 JO 50 250 10 40 400 4.000
100 300 J.000 4 20 80 320 8 30 240 1.920
100 300 1.000
- 3 30 90 270 6 20 120 720
x, = 3, s, = 1 X, = 3, Sz =] 2 40
- - -- - --
80 160 4 JO 40 160

100 300 1.000 100 800 6.800


Dos personas, A 1 (del grupo 1. 0 ) y A 2 (del grupo 2.0 ), con la misma puntuacin t-
pica' 0,5, obtendrn la misma puntuacin directa : X 1 = X 2 = 3 + (1 )(0,5 ) = 3,5. x, = 3, s, = l
- x, = 8, s, = 2
Puntuaciones t1picas / 143
142 / Estadistica para Psiclogos
a posicin relativa idntica de dos personas segn uno de los dos criterios, corres-
ponde posicin relativa idntica de las mismas segn el otro criterio . Y a posic in
distinta, segn uno, corresponde posicin relativa dis tinta segn el otro .
Ahora bien, las distribuciones de frecuencias en Psicologa suelen ser normales
o aproximadamente normales con bastante frecuencia. En otras palabras, dos
grupos distintos sometidos a la misma o distinta prueba suelen dis tribuirse de la
misma manera, de acuerdo con la distribucin n ormal, de la que hablaremos en-
seguida . Por consiguie nte, con gran frecuenc ia, dos personas con la misma puntua-
cin tpica dejarn po r debajo de s, aproximadamente, el nsmo porcentaje . Ms
a n , conociendo esa puntuacin t pica, podremos determinar cul es el porcentaje
20 10 20 30 40 que queda por d ebaj o.
40 30

4 4 6 8 IO
2
8.6. Combinacin de puntuaciones
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0), con la misma puntuacin
tpica 0,5, obtendrn distintas puntuaciones directas: X 1 = 3 + (1 )(0,5) = 3,5,
x2 = 8 + (2)(0,5) = 9 y dejarn por debajo de s distintos porcen tajes : 70 por 100 Para combinar en una sola pun tuacin to ta l, las pun tuaciones de varias pruebas,
y 60 por 100 respectivamente. Es decir, a iguales puntuaciones tpica s correspon- conviene operar con puntuacion es tpicas. Es decir, reducir las unidades de las
den distintas puntuaciones directas y distintos porcentajes. distintas pruebas a una un idad comn. Esto es conveniente aun en el caso e n que
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) con la misma puntuacin las pruebas sean muy semejan tes (por ejemplo, varias notas de una m isma asig-
45 3 nat ura com binad as para d ar la nota fin a l de curso) ya que superar la media en un a
directa 4, 5 , o b ten d ran
. d'1stmtas
. .
puntuac10nes ' .
t1p1cas: z 1 = -, --- = 1,5 , z 2 =
1 mism a distan cia significa ms cuando la desviacin tpica es pequea que cuando
es grande. D e aqui la necesidad de operar con puntuaciones tpicas, de tener en
= 4 ,5 - 8 = - 1,75 y dejarn por debajo de s distintos porcentajes: 90 po r l 00 cuenta la d esviacin tpica de cada prueba.
2
y 7,5 por 100 respectivamente. Es decir, a iguales puntuaciones directas corresponden EJEMPLO 8.6. Sean tres prueba s I, 11, Jll y dos al umnos A y B. Sean X 1 = 45,
s1 = 2; %11 = 60, s 11 = 4 ; %111 = 60, sm = 6. Sean fi na lmente las puntuaciones
distintas puntuaciones tpicas y distintos porcentajes.
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) que dejan por debajo d e siguientes las obtenidas p or A y B en las tres prue bas :
s el mismo porcentaje (30 por 100), obtendrn distintas puntuaciones directas:
5 X 7 d' . . . . 2,25 - 3 7
X 1 = 2.2 , 2 = , y 1stmtas puntuaciones t1p1cas: z 1 = = - O, 5.
DIRECTAS DIFER ENCIAi. ES TIPICAS
1
z = -7 -- -8 = - 05 , . Es d ec1r,
. a 1gua
. 1es porcentajes,
. correspon d en d1stmtas
.. pun- JI JII TOTA L IJ IJl TOTAL 11 111 TOTAL
2
2
tuacioncs directas y distintas puntuaciones tpicas. A406466 170 - 5 4 6 5 - 2,5 -0.5
B 50 56 54 160 5 - 4 - 6 -5 2,5 - l - 1 0,5

8.5. Nota
El al umno A tiene una puntuacin total (a partir de las d irectas y diferenciales)
Acabamos de considerar dos criterios indicadores de la posicin relativa de un a mayor q ue B. Sin embargo, el a lumno B tiene una puntuacin total (a parti r de las
persona respecto a un grupo de referencia: a ) Posicin relativa como dista ncia de esa tpicas) m ayor que A . El alumno B est por encima de la media en una sola p rueba,
persona a la media del grupo (medida en unidades tpicas) ; b ) Posicin relativa pero d onde la variabilidad es muy pequea . En cambio, el alumno A est por encima
como porcentaje de personas del grupo que deja por debajo de s esa persona. He- de la media en dos pruebas, pero donde la variabilidad es muy grande. En co njunto,
mos visto que dos personas, pertenecientes a dos grupos distintos, cuya posicin rela- el a lumno B debera ser p referid o al A , pues su pun tuacin tpica total es mayor
tiva es"itlntica segn uno de los dos criterios, no lo es necesa riamen te segn el otro
que la de A .
Sin ~mbargo, si las distribuciones de frec uencias de ambos grupos son t!ua lc,.
144 / Estadistica para Psiclogos
Puntuaciones tpicas / 145
8.7. Desviacin tpica y puntuaciones tpicas 8.8.2. Curva normal

Desviacin tpica y puntuacin tpica son conceptos distintos. La primera De ella trataremos ampliamente en el tomo 2 (Estadstica Inferencia!). Sin
es propia del grupo. La segunda es propia de cada persona. En un grupo den personas, embargo, vamos a ofrecer ahora una idea sucinta sobre la misma. Suponemos
tenemos n puntuaciones tpicas (algunas de las c uales pueden ser iguales entre s) que operamos con proporciones. Ello significa que vale la unidad el rea limitada
y una sola desviacin tpica. Sin embargo, es equivalente decir que un a persona por el histograma o (en el lmite) por la curva F y el eje de abscisas. Bajo esta con-
obtiene una puntuacin tpica igual a dos o que supera a la m edia en dos desviacio- dicin, la cur va normal es la representacin grfica de la siguiente funcin :
nes tpicas. Por ejemplo, suponiendo X = 60, sx = 3, una persona con puntuacin
directa X, = 66, tendr como puntuacin tpica : 1 -2 1(~)2
6
y = -- e
.j2na
z = 66-60 =~=o2
1
3 3 == media de la poblacin, a= desviacin tpica de la poblacin, e= base de los
logaritmos neperianos: 2,718281828 . .. , n = relacin de la circunferencia a su
Esto equivale a decir que su distancia de la media (66 - 60 "' 6 unidades) dimetro: 3, 141592 . . .

contiene dos veces la desviacin tpica : 3, ( } "' 2), o, a decir que supera la media
Para cada par de valores de y de a tendremos una curva normal distin ta . Es
decir, tenemos una familia de curvas. Pero todas ellas coincid en en algunas carac-
en dos desviaciones tpicas. tersticas (vase la figura adjun ta ):

8.8. Puntuaciones tpicas y curva normal

8.8 .1. Lmite del histograma con intervalos infinitamente pequeos

Al aumentar indefinidamen te el nmero de intervalos, disminuye su amplitud


y los rectngulos del histograma se adelgazan ms y ms. En el limite, la lnea que-
brada H se identificar con la curva F. Esta curva es, con gran frecuencia , en Psi-
cologa la llamada curva normal o campana de Gauss.
-a ~+a

a) Tienen un nico mximo para X=.


b) Tienen dos puntos de inflexi n, para x = - a y para X= + a. Es
decir, en el punto X= - a la c urva pasa de ser cncava hacia arriba a ser cn-
cava hacia abajo y en el p unto X = + a la curva pasa de ser cncava hacia abajo
a ser cncava hacia arriba.
e) Se acercan asintticamente al eje de abscisas. En otras pala bras, se acercan
ms y ms a ese eje, tanto por la derecha como por la izquierda, sin llegar a tocarlo en
ningn punto finito.
d ) Son simtricas respecto al eje vertical que pasa por la media.

Suele ser til operar con p untuaciones tpicas. En este caso la ecuacin de la
curva normal viene dada por
1 _ !,!
-~ .v= fo
- -e 2
146 / Estadistica para Ps,clogos
Puntuaciones lip,cas / 147
y su representacin grfica es la siguiente:
8.8.4 . Uso de la tabla de las reas bajo la curva normal

La tabla A (Apndice lll) ofrece con cada puntuacin tpica la proporcin


(porcen taje si la multiplicamos por 100) o rea situadas bajo dicha puntuacin,
suponiendo, na turalmente, que la distribucin de frecuencias es normal.
EJEMPLO 8.7. ;.Qu porcentaje de observaciones queda por debajo de la pun-
tuacin directa X = 23, valiendo 30 la media y 4 la desviacin tpica?
Transformemos esa puntuacin directa e n tpica :

z
=n = -23 4 :,_cJ = _ 1,75
:--
-3 -2 -1 o 2

En la tabla, a:: = -1,75 le corresponde un porcentaje igual a 4,01. Por tanto,


Entre tres desviaciones tpicas por la izquierda y tres por la derecha (es decir, por debajo de la puntuacin tpica z = - 1, 75 (es decir de la directa X = 23 )
entre la puntuacin tpica - 3 y la puntuacin tpica 3) se encuentra el 99,74 por 100 queda el 4,01 por 100 de las observaciones.
del rea total contenida bajo la curva normal.

8.8 .3. Relacin entre las reas bajo la curva normal y proporciones
o probabilidades

En la figura adjunta el rea A representa la probabilidad de obtener una pun-


tuacin igual o menor que =A- Interpretada esta probabilidad como proporcin,
el rea anterior representa la proporcin de observaciones con puntuaciones igua-
les o menores que :,., en el supuesto, claro est, de que dichas observaciones se
distribuyan normalmente.

EJEMPLO 8.8. ,Q u porcentaje de observaciones queda por encima de la p un-


tuacin directa X = 54, valiendo 48 la media y 5 la desviacin tpica ?

z,

Por ahora, sern equivalentes para nosotros probabilidad y proporcin. En


el tomo 2 discutiremos ms detalladamente esta equivalencia. Naturalmente,
las .cas representadas sern porcentajes si multiplicamos las proporciones por
cien:
1.2
148 / Estadistcil para Psiclogos Puntuaciones t1picas / 149

T ransformemos esa puntuacin directa en tpica: EJEMPt.O 8.1 l. ,Qu puntuacin directa d eja por encima de s el 61 por 100
de las observaciones, va liendo 40 la med ia y 6 la desviacin tpica'>
48 = 1,2 Dejar por encima de s el 61 por 100 de las observaciones equivale a deja r por
:54 = 54-5-- debajo de s el 39 por 100 de las mismas. En la tabla, el porcentaje ms prximo a l
39 por 100 es el 38,97 por 100 y a este porcen taje le corresponde la p untuacin
En la tabla, a z = 1,2 le corresponde un porcentaje igual a 88,49. Por tanto, tpica :: = - 0,28 . Por tan to,
por encima de la puntuacin tpica z = 1,2 (es decir, de la directa X = 54 ) queda
el (100 - 88,49) por 100 = 11,51 por 100 de las observaciones. - 0,28 = X - 40 X = (6)( - 0,28) + 40 = 40 - 1,68 = 38,32
EJEMPt.O 8.9. _Qu porcentaje de observaciones queda po r encima d e la pun. 6
tuacin directa X = 9 y, simultneamente, por d ebajo de la puntuacin direcia,
X = 3 1, valiendo 25 la media y 8 la desviacin tpica ? EJEMPLO 8. 12. Calculemos d os puntuaciones directas, X 1 y X 2 , ta les que la pri-
mera deje por debajo de s un 10 por 100 de las observaciones y la segunda deje por
encima de s o tro 1O p or 100 de los casos, valiendo 40 la media y 7 la desvia cin
tpica.
En la tabla, el porcentaje ms prximo a l 10 por 100 es el 10,03 p or 100 y a este
porcen taje le corresponde la puntuacin tpica z = - 1,28. Po r otra parte, dejar

~
por encima el 10 por 100 eq uivale a dejar por debajo el 90 por 100. En la tabla el
porcentaje m s prximo al 90 por 100 es el 89,97 por 100 y a este porcentaje le corres-
ponde la puntuacin tp ica ;; = 1,28. Por tanto,

- 1,28 = X i - 40 X1 = (7)( - 1,28) + 40 = 40 - 8,96 = 31,04


-2 0,75 7

1, 28 = !-2 -7 40
-- X2 = (7)(1,28 ) + 40 = 40 + 8,96 = 48 ,96

Transformemos esas puntuaciones directas en tpicas.


8.9. Puntuaciones T

Z9 = 9 - 2~
-8
=_2 Z 31 = ~831 - 25 = 0,75
Las p un tuaciones tpicas ofrecen un doble inconveniente . En primer lugar,
unas son positivas y otras negativas (circunstan cia que puede ocasionar errores
En la ta bla, a :: = - 2 le corresponde un porcentaje igual a 2,28 y a ;: = O, 75
en los clculos). En segundo lugar , casi todas las o bser vaciones suelen quedar
un porcentaje igual a 77,34. Por tanto, por encima de la puntuacin tpica z = - 2 contenidas dentro de tres d esviaciones tpicas a la derecha de la media (igual a cero)
(es d ecir, de la directa X = 9) y, simultneamente, por debajo de la puntuacin y otras tres desviaciones tpicas a la izquierd a de la misma. Es decir , slo tendremos
tpica :: = O, 75 (es deci r, de la puntuacin directa X = 31) queda el (77,34 - 7 puntuaciones enteras posibles ( - 3, -2, - l , O, 1, 2, 3); tod as las dems sern
- 2,28) por 100 = 75,06 por 100 de las observacio nes. decimales (con los consiguientes inconvenientes para el clculo).
EJEMPLO 8. 10. ,Qu puntuacin directa deja por debajo de s e l 64 por 100 Para evitar los d ecimales (o, al menos, bastantes de ellos) multiplicamos las pun-
de las observaciones, valiendo 30 la media y 5 la desviacin tpica? tuaciones tpicas por una constante apropiada. Para evitar los valores negativos,
En la tabla , el porcentaje ms prximo al 64 por 100 es el 64,06 por 100 y a este sumamos a los productos o bten idos otra constante adecuada. En par ticula r, suelen
porcentaje le corresponde la puntuacin tpica z = 0,36. Por tanto: ser usadas, respectivam ente, 10 y 50. En otras ocasiones, 100 y 500 u otras cons-
tantes que nos sirvan para conseguir el fin pretendido.
,.. 0,36 =! - 30 X = (5)(0,36) + 30 = 1,8 + 30 = 31,8 Dentro de este contexto, llamaremos puntuaciones Ta las obtenidas mediante
- 5 la constante multiplicadora 10 y la constante aditiva 50, pero tras previa norma-
150 / Estadistica para Psiclogos Puntuaciones tipicas / 151

lizacin de la distribucin de frecuencias. Ello equivale a calcular las puntuaciones Cumu normal: representacin grfica de la siguiente funcin.
tpicas valindonos de la tabla de las reas bajo la curva normal y no mediante
la media y la desviacin tpica de las puntuaciones directas que nos son dadas.
Las puntuaciones tpicas as calculadas son las que se multiplican por l O y se les y = -_!_
:;:- (' _!2 (1_::_J'
)
'
(en punt uaciones directas)
aade la constan te 50. ,J.L1!
EJEMPLO 8.13. Calculemos las puntuaciones T a partir de la siguiente distri-
1 ,,
bucin de frecuencias: .V= - - e- -2 (en puntuaciones tpicas)
fo
+ 50
X; n, Free. ac. (pm) Porc. ac. (pm) zl (10)(: ; ) ()O)(z,)

95,63 1,71 17,1 67,1


18-20 7 76,5 EJERCICIOS
1,09 10,9 60,9
15-17 8 69 86,25
71,88 0 ,58 5,8 55,8
12-14 15 57,5
52,50 0,06 0,6 50.6
9-11 16 42 44,4
8.1. Calcular las correspondien tes puntuaciones diferenciales y tpicas a partir
28,75 - 0,56 -5,6
6-8 22 23 de las siguientes puntuaciones directas.
7,50 - 1.44 - 14,4 35,6
3-5 12 6
a) 2, 6, 8, 5, 4 b) 7, 4, 1, 5, 3 e) 1, 11, 11 , l
80
d) 2, 3, 5, 2 e) l, 4, 7

Free. ac. (pm): frecuencia acumulada hasta el punto medio. Es decir, hasta la mi- 8.2. Suponiendo X = 20 y s, = 4, q u puntuaciones diferenciales y directas
tad del intervalo (3-5) habr .13. = 6 observaciones. Hasta la mitad correspondern a las siguientes puntuaciones tpicas?
2
a ) z,=2 ; b ) Zx= 1,5 ; e) Zx = - 1 ; d) :, = - 0.25 ; e) Zx=0 ,9
del intervalo (6-8) habr 12 + ?~2 = 23. Etc.
8.3. Supongamos que X 1 , X 2 , , X" son ciertas puntuaciones directas y que
Porc. ac. (pm) : porcentaje acumulado hasta el punto medio . Basta con dividir x 1 , x 2 , , x" son sus correspondientes puntuaciones diferenciales. Esto supuesto,
cada frecuencia acumulada hasta el punto medio por 80 y mul- demostrar que 1: X,y, = L x,Y,
tiplicar este cociente por 1OO.
8.4. Calcular el coeficiente de variacin de X, sabiendo que
Z/ puntuacin tpica normalizada. Es decir, -1 ,44 es la puntuacin
tpica que, supuesta una distribucin normal, deja por de bajo Zx , = z>., z~i = ZJ'2' Z.x 1 = Zy~ que Sy = 4~
de s el 7,5 por 100 de las observaciones. Etc.
que el coeficiente de variacin de Y va le 20 y teniendo en cuenta el cuadro adj un to .

X, Y,
8.10. Resumen: Definiciones y frmulas
18
6 22
Puniuacin directa; la atribuida directamente a cada elemento de un grup o. 1 26

Puntuacin diferencia/; puntuac1on directa menos la media del grupo. 20

/Vntuacin tpica: puntuacin diferencial dividida por la desviacin tpica del


grupo. 8.5. Son tpicas las pun tuacion es - 3, 1, 1, O, 1, O, o btenidas por seis personas ?
152 / Estadstica para Psiclogos Puntuaciones t1picas / 153

8.6. Transformar las puntuaciones 9, 5, 7, 1, 13 en otras cuya media valga 50 y d) Mayores que 33. e) M a yores que 22 y menores que 28. j ) Mayores que 32
cuya desviacin tipica valga 12. y menores q ue 35. g ) Mayores q ue 28 y m enores que 34.

8.7. Sean X 1 , X2 , . . , X., n puntuaciones con media X = 10. Consideremos la s 8.14. Suponiendo que X = 50, s, = 8 y n = 500 y que la distribucin de frecuen-
puntuaciones 3X1 , 3X2 , . , 3X. cuya desviacin tpica nos es dada y va le 6. cias es normal, ca lcular la puntuacin directa que deja po r d ebaj o o por encima
Esto supuesto, calcular la varianza de las 2n puntuaciones X 1 X 2 . . , X., 3X 1 , de s los siguientes p orcentajes o nmero d e observaciones. a) Q ue deja por debaj o
3Xi, . . . , 3X . el 11 p or 100. b) Q ue deja por de bajo 220 observacion es. e) Q ue deja por encim a
el 48 por I OO. d) Que deja por encima 320 observaciones. e) D os pun tuaciones
8.8. Transformar las puntuaciones X , = 7, Xi = 5, X 3 = 3, X4 = 6, X 5 = 9 en (equidistantes de la media, a uno y otro lado de la misma ) q ue dejan entre ambas
otras puntuaciones Y tales que Y = 2X - 5, s, = 2sx. el 54 p or 100. f) D os pu ntuaciones (equidistan tes de la media) que dejan entre
ambas l 00 observa cion es.
8.9. Ponga las puntuaciones que fa ltan en el cuadro siguiente, sabiendo que
Zx, = z,,, , Zx , = z,.,, . . . , Zx , = z,.,, que Sx = 2 Y que los coeficien tes de va ria - 8.15. Calcular la media de un grupo de pe rsonas, suponiendo que la distribucin
cin de X y de Y valen 20 y 50, respectivamente . de frec uencia s es no rmal y sabien do que la desviacin tpica vale 10 y que el 4 0 por
100 obtiene punt uaciones menores q ue 28.

X, Y, 8.16. Calcular la med ia de un grupo de 200 personas, distri buidas normalmente,


sa biend o que la desviacin tpica vale 8 y que 15 personas obtienen puntuaciones
13 ma yores que 28.

7 4 8.17. Calcular la d esviacin tpica de un grupo d e personas, distribuidas normal-


JO men te, sabiend o que la media vale 47,7 y que el 98 por 100 o btiene puntuaciones
11 menores q ue 60.

8.18. Ca lcula r la desviacin tpica de un grupo de 120 personas, distribu idas


normalm ente, sabiendo que la m edia vale 44,24 y que 12 personas obtienen pun-
8.10. Sean X = 50 y Sx = 4 la media y la desviacin tpica de n puntua ciones t uacion es mayores q ue 50.
X 1 , Xi, . . . , x . Esto supuesto, cunto valdr el coeficiente de variacin de las
puntuaciones Y , = 3X , - 30, Y i = 3X 2 - 30, ... , Y. = 3X . - 30? 8. 19. C alcular la media y la desviacin tpica de un grupo de 500 personas, dis-
tribuidas nor malmente, sabiendo q ue 100 personas de d icho grupo han obtenido
8.11. Sabiendo que los coe!icientes de variacin de X e Y vale n, respectiva men te, pun tuaciones direc ta s mayores q ue 64,20 y 130 han obtenido pun tuaciones directas
40 y 50, que s,. = (3/4)sx y que la puntuacin tpica correspondien te a 24 en X es m enores que 56,80.
la misma que la correspondiente a 15 en Y, calcular X, Y, sx y s,..
8.20. Calcular la med ia y la desviacin tpica de un g rupo d e 5.000 personas,
8.12. Aplicado un test ll a un grupo normativo de person as, las p untuaciones distribuidas nor malmen te, sabiendo q ue el primer cua r til vale 30,65 y que 3.203
directas obtenidas por stas han sido transformadas mc_dia nte la ecuacin 3X + 45 personas han obtenido puntuacio nes directas mayores que 32,2.
con el !in de que su media fuera l 00 y su desviacin tpica, 20. E l mismo test II es
aplicado a tres nuevas personas que obtienen las puntuaciones d irectas 15, 22, 25 . 8.21. Calcular el n mero de personas que obtendrn p untuaciones directas ma-
En este supuesto: a ) Qu hara usted pa ra comparar estas tres puntu acio nes yores que 27,9 en un grupo de 50.000 cuya d istribuci n de frecuencias es norm al,
con las puntuaciones transformadas del grupo norma tivo ? b) Rea lizada la trans- cuya am plitud semiintercua rtil va le 2,01 y cuyo coeficiente de var iacin vale 10.
formacin apropiada a cuntas desviaciones tpicas se encuentran estas tres per-
sonas por encima o por debajo de la media ? 8.22. Sean 20, 26 y 32 las m edias o btenidas por tres grup os distintos, siendo nor-
males las tres distri buciones de frecuencias. Cada g rupo consta de 150 personas
8.13. Suponiendo que X = 30, sx = 4, n = 150 y que la d istribucin d e frecuencias y stas se ex tiend en d esde tres desviaciones tpicas a la izq uierd a de su media hasta
es normat, calcular el porcen taje y el correspondiente nmero de o bservaciones tres d esviaciones tpicas a la derecha de la misma . Esto supuesto, cuntas personas
con puntuaciones : a) Menores que 24 . b) M eno res que 34. e) M ayores q ue 28. quedarn d entro del rea rayada en el grfico adj unto , siend o s , = s 2 = s 3 ?
154 / Estadistica para Psiclogos Pun tuaciones tpicas / 155

aptitud mecnica, Y, se distribuyen normalmente. Calcular el porcentaje de nios


cuyas puntuaciones en X superan la media de las puntuaciones en Y, sabiendo que
Mdy - Mdx = 15, Md,, + Mdx = 95 y r. X;- = 850.000.
8.28. Calcular el coeficiente de variacin de un grupo de puntuaciones, sabiendo
que la distribucin es normal, que Q3 - Q1 = 5,36 y que P6 7 = 62,96.
8.29. Un grupo de 400 personas responde a un cuestionario y sus respuestas se
distribuyen normalmente. El coeficiente de variacin vale 25. Por encima de la pun-
tuacin directa 23,85 se encuen tran 88 personas. Calcular la media y la desviacin
tpica .
8.23. Sean dos grupos A y B, cada uno de ellos con 300 personas y distribuido 8.30. ,Es simtrica toda curva normal?
normalmente. En cada grupo las 300 personas se extienden desde tres desviacio-
nes tpicas a la izquierda de su media hasta tres desviaciones tpicas a la derecha 8.31. Es normal toda curva simtrica ?
de la misma. Suponiendo, adems, que s,. = s 8 , ,cuntas personas quedarn den- 8.32. Siempre que conozcamos unas puntuaciones tpicas, ,podemos determinar
tro del rea rayada en el grfico adjunto? el porcentaje que deja cada una de ellas por debajo o por encima de s, acudiendo
a la tabla de las reas bajo la curva normal?
8.33. Sean X 1 , X 2 , , Xn las puntuaciones directas obtenidas por n personas
en un test de extroversin. Supongamos q ue su distribucin de frecuencias es asi-
mtrica positiva. Transformamos en tpicas las puntuaciones directas anteriores.
Esto supuesto, ser normal (o, al menos, simtr ica) la distribucin de frecuencias
de estas puntuaciones tpicas?
8.34. Transforme en puntuaciones T (normalizadas ) las siguientes puntuaciones
directas:

a) X, n; h) X 11,
~ -
35 5 26 - 28 4
8.24. Hemos aplicado una prueba de memoria a 5.000 varones y a 2.000 mujeres
33 6 23 - 25 8
separadamente. Son normales tanto la distribucin de los varones como la de las 7 20 - 22 10
31
mujeres. Del total de los varones, l.148 superan la media de las mujeres. Adems, 29 12 17 - 19 14
134 mujeres han obtenido puntuaciones superiores a 70. Suponiendo que la me- 27 16 14 - 16 12
dia y la desviacin tpica de los varones valen 54,3 y 5 respectivamente, calcular 25 4 11 - 13 2
la media y la desviacin tpica de las mujeres.
8.25. Un grupo de personas se distribuye normalmente en la va riable X. Para
estas personas el percentil 6 I vale 44 y la desviacin tpica vale 5. Calcular la media
y la desviacin tpica de unas nuevas puntuaciones Y relacionadas con las prime-
ras mediante 4X - 2 Y - 20,4 = O.
8.26. De un grupo de 600 personas, distribuidas normalmen te, 114 obtienen una
puntuacin directa menor que 20. Sabiendo que la varianza vale 16, calcular la
moda de dicha distribucin y el nmero de personas con puntuaciones mayores que
24 y menores
,,.. . que 28.
8.27. '. Las puntuaciones de un grupo de 500 ni os en inteligencia espacial, X, y en
--
-- --- ---- ... ------~--
\.
9
Organizacin de datos e ndices
de tendencia central y variabilidad

9.1. Distribucin conjunta de frecuencias

Hasta aqu hemos considerado una sola variable. Ahora vamos a estudiar con-
juntamente dos variables. Por ejemplo, peso y altura de un grupo de estudian tes,
aptitud para una asignatura y aprovechamiento en la misma, provincia de origen
y carrera estudiada, etc. Con cada persona tenemos dos modalidades, una perte-
neciente a la primera variable y otra a la segunda.
D esde luego, podamos ir estudiando por separado cada uno de los casos po-
sibles: ambas variables nominales, ambas o rdinales, .. . ; una nominal y otra
ordinal, una nominal y otra de intervalos, etc. Sin embargo, no seguiremos es1e
camino por una doble razn . En primer lugar, sera enormemente prolijo irnos
~ I
deteniendo en cada uno de los casos posibles, dado su gran nmero. En segundo
lugar, ello nos llevara a repeticiones superfl uas ya que lo dicho para uno de los casos,
vale p rcticamen te para los resta ntes, salvo diferencias accidentales fci lmen te
comprensibles. Consiguientemente, nos limitaremos por ahora a exponer la distri-
bucin conjunta de frecuencias respecto al caso en que las variables sean estric ta-
mente cuantitativas (es decir, a nivel, al menos, de in tervalos), por ser el ms comn
en Psicologa.
EJEMPW 9.1. Supongamos que 50 personas han obtenido, segn podem os
ver en la tabla de la pgina siguiente, los siguientes resultados en un test de inte-
ligencia abstracta (X) y en una prueba de aritmtica ( Y).
Podemos considerar estas pu ntuaciones tal com o vienen dadas, es decir, no
agrupadas en intervalos ni en X ni en Y. Cada persona aparece con el par de pun-
tuaciones que ha obtenido directamen te en el tesl y en el examen . Pero, tambin,
podemos considerarlas agrupadas en intervalos. Para ello, est udian do por separado
cada una de las dos variahles, agrupa mos sus puntuaciones en intervalos, siguiendo
los criterios ya expuestos para agrupar datos en el caso de una sola variable. El n-
mero de intervalos en cada una de las dos variables puede ser el mism o o distinto.
-.,.~ La amplitud de los in tervalos en una de las dos variables puede ser la misma o dis-
tinta que la a mplitud de los intervalos en la otra. Elijamos p ara X !os intervalos :
160 / Estadistica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 161

- - -- - - - - - -y
X y X y X y X X )'

--
10 51
--
8 51
-13 -51 12- -56 -JO -52
12 51 10 53 19 55 18 55 14 53 5
10 54 9 53 12 53 17 56 16 56
5.
20 56 15 54 11 52 16 57 14 55
13 54 14 56 17 54 18 58 21 57 5
21 58 18 57 16 54 13 53 17 53 5'
13 52 JI 54 10 50 9 51 17 55
5
20 57 9 so 12 55 16 55 15 56
18 56 19 54 20 58 15 53 17 57
19 57 14 52 14 54 15 55 8 52

7- 10, 11 -14, 15-18, 19-22 (con puntos medios 8,5 ; 12,5 ; 16,5 y 20,5, respectivamente) tro ejemplo tendremos 50 puntos. Este conjunto o nube de puntos constituye el
y elijamos para Y los intervalos: 50-52, 53-55, 56-58 (con puntos medios 51, 54 y diagrama de dispersin.
57, respectivamente). Tendremos: Otra manera de representar grficamente los datos no agrupados sera la siguiente.
A cada valor X, le corresponde un intervalo unitario y a cada valor Y otro intervalo
TABLA 9.1 unitario. Es decir, a cada par de puntuaciones ( X ,, Y,) les corresponder un rec-
..
X X
..
tngulo unitario limitado por los intervalos unitarios. Pues bien. sobre cada rectn-
7-10 11- 14 15- 18 19-22 7-10 11 -14 15-18 19-22 gulo unitario podemos levantar un prisma con una altura proporcional al nmero
de personas cuyo par de puntuaciones coincide con el par correspondiente a ese
56-58 // fllJ /// fl{j/ 56-58 o 2 8 6 16
rectngulo unitario. Ntese que la unidad elegida en el eje de las X no tiene por qu
y 22
ser igual que la elegida en el eje de las Y. Si fue ra igual, el rectngulo unitario se
y 53-55 /!/ fllJ /// fllJ /!// /! 53-55 3 8 9 2
convertira en un cuadrado.
50-52 7 5 o o 12 Consideremos ahora los datos agrupados en intervalos. La representacin
50-52 fllJ // fllJ
grfica correspondiente al histograma (propuesto para el caso de una sola variable),
10 15 17 8 50 es la siguiente. El plano quedar dividido en (r) x (s) rectngulos, d onde res el n -
mero de intervalos en X y s el de intervalos en Y. La base de esos rectngulos ser
la amplitud de los intervalos de X . y su altura la amplitud de los intervalos de Y.
En general, tendremos r intervalos en X, y s in tervalos en Y. Llamemos (], , !') Pues bien, sobre cada uno de esos rectngulos (inciden talmente cuadrados) levan-
al par de intervalos i de X y j de Y. A cada (/, , // ) le corresponder una frecuen- tamos un prisma cuya altura sea proporcional a la frecuencia correspondiente a
cia n;; (nmero de o bservaciones con puntuaciones dentro del intervalo i de X y dicho rectngulo. Es decir, dados el intervalo con punto medio X , y el intervalo
dentro del intervalo j de Y). Pues bien, llamaremos distribucin conjunta de fre - con punto medio Y1, la altura ser proporcional a la frecuenc ia de personas que,
cuencias al conjunto de pares de intervalos (11, Ji') y de sus correspondientes fr ecuen- a la vez, se encuentran dentro del intervalo primero y del segundo. En nuestro ejemplo
cias {proporciones o porcentajes). (vase tabla 9.1) tendramos nueve prismas con alturas proporcionales a 2, 8, 6, 3, 8,
9, 2, 7, 5. (En rigor, tendramos doce p rismas, aunque tres de ellos con altura nula.)

9.2. Representacin grfica


9.3. Distribuciones marginales de X e Y
Comencemos considerando las puntuaciones anteriores no agrupadas en in-
tervalos. En este caso a cada puntuacin de X (eje de abscisas) y a cada p untuacin Llamarnos distribucin marginal de X a la distribucin en X de todas las obser-
y (eje ~> o rdenadas), tomadas conjuntamente, les corresponde un punto en el vaciones, independientemente de sus puntuaciones en Y. Viene dada, en la tabla 9.1.
plano,.rpresentante de la persona que ha obtenido esas dos puntuaciones. En nues- por la lila situada en el margen inferior. Es decir, es la siguien te:
162 / Estadistica para Psiclogos Organizacin de datas e in dices de tendencia central y variabi lidad / 163

TABLA 9.2,, 9.4. Distribuciones condicionales de X e Y


X ni x1
--- Llamamos distribucin condicional de X, para Y = Y1, a la distribucin en X
19-22 8 20,5 de todas, y solas, las observa ciones con puntuacin Yk en Y (bajo la condicin de
15-18 17 16,5 tener puntuacin Yk en Y). En la tabla 9.1 te ndrem os tres distribuciones condicio-
11-14 15 12,5 nales de X, correspondientes a Y = 51, Y = 54, Y = 57. Son las siguientes:
7- 10 10 8,5

50 TABLA 9.3

Para Y= 5 1 Para Y= 54 Para Y = 57


Llamamos distribucin marginal de Y a la distribucin en Y de todas las obser-
vaciones, independientemente de sus puntuaciones en X. Viene dada, en la tabla 9.l , X n X; X 11; xi X n1 xi
por la columna situada en el margen derecho. Es decir, es la siguien te:
19-22 o 20,5 19-22 2 20,5 19-22 6 20,5
15-18 o 16,5 15-18 9 16,5 15-18 8 16,5
TABLA 9.2b I 1-14 5 12,5 11-14 8 12,5 11-1 4 2 12,5
7-10 7 8,5 7- 10 3 8.5 7-10 o 8,5
y 11 Y
-- 12 22 16
56-58 16 57
53-55 22 54
50-52 12 51 Llamamos distribucin condicional de Y, para X = Xk, a la distribucin en
Y de todas, y solas, las observaciones con puntuacin Xk en X (bajo la condicin
50 de tener puntuacin Xk en X).
De acuerdo con la tabla 9.1 tendremos cuatro distribuciones condicionales de
Y, correspondientes a X= 8,5, X = 12,5, X= 16,5, X = 20,5. Son las siguientes:
Con la distribucin marginal de X tendremos una media, X, y una varianza,
s;, que llamaremos media y varianza marginales de X.
Con la distribucin marginal de Y tendremos una media, Y, y una varianza,
s;, que llamaremos media y varianza marginales de Y.
TABLA 9.4

De acuerdo con los datos de las tablas 92a y 9.2b, tendremos : Para X = 8,5 = = 16,5
Para X 12,5 Para X Para X = 20,5
x= (10)(8,5) + (15)(12,5) + (17)(16,5) + (8)(20,5) = 717 =
14 34 y n1 Y; y n1
y
j
y n1 Y y n, Y,
50 50 ' - -- - - - - ~-- - - - - - -- - -~
56-58 o 57 56-58 2 57
s; = (10)(8,5)2 + (15)(12,5)2 + (17)(16,5) 2 + (8)(20,5) 2 _ , ) =
0 4 34 2 53. 55 3 54 53-55 8 54
56-58
53-55
8
9
57
54
56-58
53-55
6
2
57
54
50 50-52 7 51 50-52 5 51 50-52 o 51 50-52 o 51
056 5
-
10
-
= 21- 50
- - 205 636 = 15 494
' '
15 17 8

y= (1 2)(51) + (~2)(54) + (16)(57) = 2.712 = 54 24


50 50 ' Con las tres distribuciones condicion a les de X, tendremos tres medias y tres
varianzas que llamarem os medias y varianzas condicionales de X.
s2 = ~2 + (22)(54)2 + (16)(57)2 - (54 242 = 147.348 - 2.941 978 = 4 982 Con las cuatro distribuciones condicionales de Y, tendremos cuatro medias
' 50 ' 50 ' ' Y cuatro varianzas q ue llam aremos medias y varianzas condicionales de Y.
164 / Estadistica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 165

De acuerdo con la tabla 9.3, las tres medias y las tres varianzas condicionales 1 -
(5)(51)2 + (8)(54)2 + (2)(57)2 -(53,40)2 =
Sy,X=l2,S -
S-On las siguientes: 15
42 83 1
Xr =si = (7)(8,5) + (5)(12,5) + (0)(16,5) + (0)(20,5) 122
10, 167
_
-
-
15
_ 2.85 l ,56 = 3,84
12 12
2
x_ = 14318 (0)(5 l ) + (9 )(54 J2 + (8 )( 57 J2 _ (55,4 1J 8)2 =
r- 54
= (3)(8,5) + (8)02,5) + (9)(16,5) + (2)(20,5) = 315
22 22 ,
s;. x~ 16,5
17

x _ = (0)(8,5) + (2)(12,5) + (8)(16,5) + (6)(20,5) = 280 =


17 500
- 52.236 - 3.070,468 = 2,24
- 17
Y - 57 (6 16 ,

s2 = (7)(8,5)2 2 2 2
+ (5)(12,5 ) + (0)(16,5) + (0)(20,5) _ (IO )2 = 2 - (0)(51 )2 + (2)(54)2 + (6){57)2 -(56,25)2 =
Sy, X=l0 . 5 - ~
X, Y=5 1 12 , 167
25 26
87 = : - 3.164,06 = 1,69
= 1.2 - 103 37 = 3 88
12 ' '
Comprobemos ahora cmo la varianza m argin al de X es igual a la media de
s;, r~s 4
2 2
(3)(8,5) + (8)(12,5) + (9)(16,5)
2
+ (2)(20,5) 2 - ( 14 318)2 = las varianzas condicionales de X ms la varianza de las medias condicionales de X y
22 ' cmo la varianza marginal de Y es igual a la media de las varianzas condicionales de Y
ms la varianza de las medias condicionales de Y. Ntese que estas dos relaciones
= 4 -757 ,5 - 205 00 = l l 250 no son m s que una aplicacin de la propiedad 6.3.4.i) de la varianza, donde los
22 ' ' r grupos en que alh se descomponia el grupo to ta l son ahora, bien las distribu-
ciones condicionales de X, bien las distribuciones condicionales de Y .
2 -
Sx,Y - 51
= 2 2 2
(0)(8,5) 2 + (2)(12,5) + (8)(16,5) + (6)(20,5) - (17 500)2
,
= Hemos visto que la var ianza marginal d e X, s;,
vala 15,494. Pues bien :
16
2 ( 16)(17,5 )2
012 -(12)(3,88)
- -+-(22)(1
- --1,25) + d6)(7)
- ~ + -(12)(10,
-- 167)2 + (22)(14,318) +
- -- - - - - - -
= 5 16 - 306 25
'
=7 50 50

- {14 ,34) 2 = 15,496


y _ = (7)(51) + (3)(54) + (0)(57) = 519 = 51 90
10 10 '
X-8,5
Hemos visto que la varianza marginal de Y, s;. vala 4,982. Pues bien:
y = (5)(51) + (8)(54) + (2)(57) = 801 = 53 40
X =l2 ,5 (5 15 , - ~ l~(l_,8_9)~+_(1_5~)(3_,8_4~) _+~(_17~_.2_4~) +
_ ~(8_)_(
1_
,69
~ )+
50
y = (0)(51) + (9)(54) + (8)(57) = 942 = 55.4 118
2 2 2
X = l 6.5 17 17 (10)(51,9) + (1 5)(53,4) + (17)(55,4118)2 + (8)(56,25) _ (5424)2 = 4 983
+ 50 ' ' .
y = (0)(51) + (2)(54) + (6)(57 ) = 450 = 56 25
X = 20 ,5
8 8 ,
EJEMPLO 9.2. Consideremos las p untuaciones de 40 estudiantes de Educaci n
General B sica en dos pruebas de razonamiento (Garca M ndcz, 1976, comunica-
s;,X = 8 ,5 = (7)(51)2 + (3)~:4)2 + (0)(57)2 -(51 ,90)2 = cin personal). La primera (X) mide la capacidad de razonamiento espacial. En ella
se les proponan diversas sucesiones de imgenes, cada una de las cuales repre-
sentaba varias posiciones de un cuerpo geometr ico movindose en el espacio segn
.!' = 26JO955 - 2.693 61
'
= 1 89
, una ley determinada que ellos deban descubrir. La otra prueba ( Y ) era de razona-
166 / Estadistica para Psiclogos Organizacin de datos e mdices de ten dencia central y vari abili dad / 167

mien to abstracto y en ella les eran presentadas a los estudiantes distintas sucesiones Distribuciones condicionales de X.
de figuras planas, pidindoles que averiguaran en cada sucesin cul era la ley de
transformacin de unas figuras en otras.
Para Y= 12 Para Y = 21 Para Y = 30 Para Y = 39
-
X y X y X y X y X n, x, X n, X X n, x, X ,,, X
- - -- - - -- ---
7 22 14 31 9 27 11 29 )5-20 o 17,5 15-20 2 17,5 15-20 6 17,5 15-20 4 17,5
5 8 6 21 15 35 8 JU 9-14 1 11.5 9-14 I 11 ,5 9- 14 13 11 ,5 9-14 3 11,5
9 9 17 32 13 31 3 9 3-8 5 5.5 3-8 5 5,5 3-8 o 5,5 3-8 o 5,5
9 31 4 11 16 34 10 27 - --
13 30 8 12 16 31 14 36 6 8 19 7
16 35 11 37 16 35 18 22
12 29 12 36 19 37 18 33
12 31 14 34 6 17 16 34 Xr - 12 = 6,50 XY 21 = 9,25 Xr . ' = 13,3947 X,=, = 14 ,9286
20 25 13 20 16 29 14
10
29
26
s;,r "" 12 = 5.00 s;, Y ll = 26,44 s;, Y JO = 7,78 s;, Y 39 = 8,82
10 30 3 23 5 25
-- --
Elijamos para X los intervalos (3-8), (9-14), (15-20) y para Y los intervalos Distribuciones condicionales de Y.
(8- 16), (17-25), (26-34), (35-43).
Tendremos la tabla siguiente:
Para X = 5,5 Para X= 11.5 Para X = 17,5
X
y 11 Y, y 11 Y, y n, y
J
3-8 9- 14 15-20 - -- -- -
35-43 o 39 35-43 3 39 35-43 4 39
35-43 o 3 4 7 26-34 o 30 26-34 13 30 26-34 6 30
17- 25 5 21 17-25 l 21 17-25 2 21
26-34 o 13 6 19 8-16 5 12 8-16 l 12 8- 16 o 12
y - - - - - -- - -
17-25 5 l 2 8 10 18 12

8-16 5 I o 6
l\.,., = 16,50 yX= l 1, 5 = 30 >'x =n,, = 31 ,5
10 18 12 40 s;.hs., = 20,25 s;. X = ll ,5 = 36 s;,x. 11., = 38,25

Distribuciones marginales de X y de Y
Comprobemos cmo la varianza marginal de X es igual a la media de las va rian-
y zas condicionales de X ms la varianza de las medias condicionales de X y cmo
a) de X: X ", x, h) de Y: ", y
J la varianza marginal de Y es igual a la media de las var ianzas condicionales de Y
ms la varianza de las medias condicionales de Y.
15-20 12 17,5 35-43 7 39
9-14 18 11 ,5 26-34 19 30 Hemos visto que la varianza marginal de X, vala 19, 71. Pues bien: s;,
3-8 JO 5,5 17-25 8 21
8- 16 6 12 (6)(5) + (8)(26,44) + (19)(7,78) + (7)(8,82)
40 40 +
40
2 2 2
,.f' (6)(6,5)2 + (8)(9,25 ) + (19)(13,3947) + (7)(14,9286} - (] 1 80 )2 = 19 7 1
x= 11,80 s; = 19,7 1 Y = 27,075 s; = 70,42 + 40 ' '
168 / Estadistica para Psiclogos Orga nizacin de datos e in dices de tendenci a central y var iabili dad / 169

Hemos visto que la varianza marginal de Y, s;, vala 70,42. Pues bien: x, Y, X,Y, x, - i Y,- y {X, - X)(Y, - Y)
2
(10)(20,25) + (18)(36) + (12)(38,25) (10)(16,5)2 + (18)(30) + ( 12)(31,5)
2
11 7 77 0,53 -5,24 - 2,7772
40 + 40 - 26 23 598 15,53 10,76 167,1028
9 12 108 - 1,47 -0,24 0,3528
- (27,075) 2 = 70,42 3 14 42 -7,47 1,76 - 13,1472 178
13 10 130 2,53 - 2,24 -5,6672 x= 17
= 10 47
'
5 10 50 -5,47 - 2,24 12,2528
18 16 288 7,53 3,76 28,3128 208
15 12 180 4,53 -0,24 -1 ,0872 Y= = 12 24
17 '
9 .5. Covarianza de X e Y 13 14 182 2,53 1,76 4,4528
12 15 180 1,53 2 ,76 4,2228 348,1 176
12 15 180 1,53 2 ,76 4,2228 s,, = - 1- 7 - = 20,4775
9.5.1. Definicin o 3 o -1 0,47 -9,24 96,7428
9 12 108 - 1,47 - 0,24 0,3528 2.526 178 208
Media aritmtica de los productos entre la diferencia (X, - X ) y la diferencia 13
9
14
14
182
126
2,53
- 1,47
1,76
1,76
4 ,4528
-2,5872
= u - 1111
( Y, - Y) correspondientes a cada uno de los n elementos que componen un grupo. 7 11 77 - 3,47 -1,24 4 ,3028 = 20,4775
La designaremos por cov(X, Y) o por sxr Por tanto, 3 6 18 -7,47 -6,24 46,6128

n 178 208 2.526 0,01 0,02 348, 11 76

cov(X, Y)= s
X)' -
_ li (X, - X) (Y, - Y)
ll

n EJEMPLO 9.4. Calculemos s, 1 a partir de los siguientes datos:


I X;Y,
= _;-_i ~ - XY (9.l )
ll X y XY (X- X) (Y- Y) (X - X) (Y- Y)

tf
je 1 i=:. J
n (X. - X) ( Y, - Y)
2
4
4
10
9
10
20
36
40
- 3
-1
- 1
1
o
1
- 3
o
- 1
65
s,,. = 20 = 3,25
cov(X, Y) = sx,. n 2 7 14 -3 -2 6
965
8 13 104 3 4 12 = - (5)(9) =
' r
I 11,,X;Y, 4 5 20 -1 -4 4 20
_ gy 9 12 108 4 3 12
j = 11 a 1
(9.2) 4 11 44 -1 2 -2 = 4 8,25 - 45 = 3,25
n -2 - 1 2
3 8 24
8 10 80 3 1 3
La frmula (9. 1) es la apropiada para datos no agrupados en in tervalos y la 7 11 77 2 2 4
(9.2) es la apropiada para datos agrupados en intervalos. Se entiende que , es el 5 8 40 o - 1 o
nmero de intervalos en que ha sido clasificada la variable X, s el nmero de inter- 6 13 78 l 4 4
1 5 5 -4 -4 16
valos en que ha sido clasificada la variable Y y n,i es el nmero de observaciones 2 6 12 -3 - 3 9
dentro del intervalo i en la variable X y del intervalo j en la varia bl e Y. 8 9 72 3 o o
5 6 30 o - 3 o
5 ll 55 o 2 o
6 6 36 1 - 3 - 3
9.5.2. Clculo 7 10 70 2 1 2

Aplicacin de las frm ulas (9. l ) y (9.2). 100 180 965 o o 65


EJEMPLO 9.3 . Calculemos la covarianza entre el rendimiento en lectura y el
rendimiento en aritmtica a partir de los siguientes datos : X =5 Y=9
170 / Estadstica para Psiclogos Organizacin de datos e ndices d e ten den ci a central y variabi/Jdad / 171

Agrupemos en intervalos los datos anteriores del modo siguiente : En este caso podemos agrupar los da tos en intervalos de amplitud unidad del
modo siguiente:
X
X
1-3 4-6 7-9
2 3

9-13 l 5 6 12 x = (5)(2) + (9)(5) ~ ~)(8) = 103 =


Y 4-8 20 20
5 15
'
o 1 ~ 4
4 4 o 8
2 o 3- 3 -~ . (4)(1) + (1 0)(2 ) + (6 )(3 ) 42
(8)(6) + (12)(11) X = 20 = 20 = 2l
5 9 6 20
_ 180
Y =-'--'--'-----=- = - = 9 y --+-
20 20 2 6 o 1 8 y = (2)(0) + (8)(1) + (6 )(2) + (4)(3) = ~ = 16
20 20 '
o 2 o o 1 2
= (4)(2)(6) + (4)(5)(6) + (0)(8)(6) + (1)(2)(11) + (5)(5)(11) + (6)(8)(11 ) _ 5)(9) = 6 I 20
s,, 20 (5, 1 4 10

= 49,65 - 46,35 = 3,30

EJEMPLO 9.5. Calculemos s,,. a partir del cuadro siguiente :


~.= (0)(1)(3)+ ())(2)(3) + (3)(3)(3) + (0)( 1)(2) + (3)(2)(2) + (3)( 3)(2)
w +
(2)(1)(1) + (6)(2)(1) + (0)(3)(1) + (2)(1)(0) + (0)(2)(0) + (0)(3 )(0) -2 1( 1 6) =
+ 20 ' '
X y XY (X-X) (Y - Y) (X - X)(Y - Y)
= -77 - 3,36 = 3,85 - 3,36 = 0,49
o o - 1,1 -1,6 1,76 20
2 1 2 - 0, 1 - 0,6 0,06
2 1 2 - 0,1 - 0,6 0,06 Ahora el resultado es el mismo agrupando los datos que sin agruparlos porque
2 2 4 - 0,1 0,4 - 0,04 al tener los intervalos amplitud unidad, cada puntuacin coincidir con el punto
3 3 9 0,9 1,4 1,26
medio del intervalo (unitario) dentro del cual se encuentra.
1 1 - 1,1 - 0,6 0,66
2 1 2 -0, l - 0 ,6 0,06 9 80
s ,, =
20 = 049
'
3 2 6 0,9 0,4 0,36
3 3 9 0,9 1,4 1,26 9.5.3. Propiedades
77
=
20 - =
2 2 4 - 0 ,1 0,4 -0,04 (2, 1)(1,6)
2 3 6 - 0, 1 1,4 -0,14 a) Sean V, = aX, + b y W, = cY1 + d, siendo a, b, e y d cuatro constantes
2 1 2 - 0, 1 - 0,6 0,06 arbitrarias. Pues bien, s,."' = (ac) s,,..
- 1,J -0,6 0,66 = 3,85 - 3,36 = 0,49 En efec to:
2 1 2 -0,J - 0,6 0,06
3 3 9 0,9 1,4 1,26
1 o o -1 ,1 -1 ,6 1,76 l:(V - V ) (W, - W) !: [ (aX, + h) - (a X + b)][(c Y, + d) - (cY + d)]
3 2 6 0,9 0,4 0,36 S L' lll =
n
= n
=
2 1 2 - 0, 1 - 0,6 0,06
3 2 6 0,9 0,4 0,36
2 2 4 - 0, 1 0,4 - 0,04
= !: (aX , - a X) (c Y, - cY) = l:a (X, - X )c( Y, - Y ) =
n 11

o.o
42 32 77
-~ 9,80
= ac !: (X, - X) ( Y, - Y)
= (ac) s
x = 2,1 Y= 1,6
/1 X )'
172 / Estadistica para Psiclogos Organizacin de datos e indices de tend encia cen tral y var,abilidad / 173

9.6. Transformemos los datos de la tabla 9.5 mediante la transfor-


EJEMPLO
macin V = 2X, + 1, W, = 3 Y, - 8 y comprobemos cmo, en efecto, s.,,= (2)(3)s, ,. =!
n
[
j :; 1 i == 1
(X,, - i ) ( Y.; - Y;) +
j:::: I
(Xj - X) I(
i 1"1
Y,; -

~
TABLA 9.5 Y)+ r (Y - Y) (X,; - X) + Lr 11; (X - X) (Y; - Y)
]

X, Y,
-
X,Y, V, w, V1W
.
I I
.,
J :::: I

(X,; -
i== l

X) ( Y,; - Y)
. j =- 1

n1 (X, - X) (Y1 - Y)
' = 1 f:;;:. 1 + = 1
3 5 15 x = ~4 = 4 7 7 49 -
V=
36
= 9
4 n n
3 3 3 1 3
pues:
5 5 25 -
y = -
24
=6
11 7 77
W = ~ =IO
~, ;
7 11 77
4
15 25 375
4 L ( Xi} - X;)= L (}',; - Y)= o
i==-1 I= 1
16 24 120 36 40 504
para
j = 1, 2, . . . , r
120
s,, = 4 - (4)(6) =6 s,.,.., -_ 504
4 _ (9 )(10) = 36 Pero :
r
, - ) (Y - y) n(X1 - X) ( Y1 - Y)
Es decir :
L
i= l ( X,; - X ij J = COV;(X, Y) y =1

11 n
s,.~ = 36 = (2)(3)(6) = (2 )(3) s,, = cov(X;, 1\ )

b) Sean : Por tanto,




1
r
n cov1 (X , Y)
r
n1 (X - X) ( Y1 - Y)
X 11, X 21, , Xn, t e Y, 1 , Y2 1 , . , Y.,1 las puntuaciones de n 1 personas
en dos variables X e Y.
cov(X, Y) = = 1 + ~=~1- -- -- --
n n
X 12 , X 22 , . , x.,2 e Y 12, Y 22, , Y. , 2 las puntuaciones de n 2 personas
en dos variables X e Y. En conclusin, la covarianza del grupo total es igual a la media de las covarian-
zas, ms la covarian za de las medias .
X 1 ,, X 2 ,, , x ., e Y 1 ,, Y 1 ,, , Y.,, las puntuaciones de n, personas
EJEMPLO 9.6. Consid eremos el siguiente grupo total compuesto por los tres
en d os variables X e Y.
Sean ..\', X1 , . . , X, e 5\, Y2 , . , Y, las medias de cada uno de los, grupos subgrupos siguien tes:
en X y en Y.
Sean cov(X, Y), cov2 (X, Y), . . . , cov ,(X, Y) las covarianzas entre X e Y res- G rupo 1.0 n1 =4 G rupo 2.0 n2 = 3
pecto al grupo primero, al segundo, . . . , al r .
Sean X e Y las medias en X y en Y del grupo total. Sea cov (X, Y) la covarianza
1
x, Y, X 1 Y1 X2 Y, X2 Y2
entre X e Y respecto al grupo total. !
En este supuesto, 2 4 8 o 2 o
o 2 o 1 2 2
4 4 16 5 5 25
cov( X , Y) =-
J
n
'
i "" l i >= t
~
( X,1 - X) ( YiJ - Y) = -
n
J
'
i=l i = t
f [(X;; -

X) + 6
--
10 60
6 9 27
12 20 84 x, = 2 :92 =3
~.,-t"
+ (X1 - X)] [ (Y,1 - Y1) + (Y1 - Y)] =
x1 =3 :91 = 5
174 / Estadistica para Psiclogos Organizacin de daros e indices de rendenc,a central y variabi lidad / 175

Grupo 3.0 n3 =5 Grupo total 11 = 12 Comprobamos cmo, en efecto:

X3 Y, X3Y3 X y XY

o 2 o 2 4 , , - - - y - Y)
2 o o o 2
8
o ni cov,(X, Y) -~i n(X X) ( , _ 220 + 13 = 233 = cov(X, Y)
3 4 12 4 4 16
1
n + - n - 48 48 48
5 6 30 6 IO 60
5 8 40 o 2 o
1 2 2 NOTA
15 20 82 5 5 25
X3 =3 >\ = 4 o 2 o Si X = Y1 , X 2 = Y2 , , x. = Y., las covarianzas se convertiran en varan
1
2 o o zas y la propiedad acabada de demostrar para las covarianzas quedara traducida
3 4 12 as: la varianza del grupo total es igual a la media de las varianzas ms la varianza
5 6 30 de las medias, propiedad de las varianzas que ya conocam os (vase 6.3.4.i).
5 8 40

33 49 193
49
X =~ Y=- 9.6. Resumen: Definiciones y frmulas
12 12

Distribucin conjunta de f recuencias (dos varab/C's): Supuestas clasificadas n


observaciones en r intervalos (respecto a una variable X) y en s intervalos (respecto
193 33 49 233
cov( X, Y)= - - - - = (2.316 - 1.617)/144 = 699/1 44 = - a una variable Y), tendremos (r) x (s) pares de intervalos (/,, 1;). Pues bien, llama-
12 12 12 48 remos distribucin conjunta de frecuencias al conjunto de esos (r) x (s) pares de
84 intervalos U,, 1; y de las frecuencias (proporciones o porcentaJes) correspondien-
COV(X, Y)= 4 - (3)(5) = 21 - 15 =6 tes a cada uno de ellos.
Distribucin marginal de X: Distribucin en X de todas las observaciones, in-
27 dependientemente de sus puntuaciones en Y .
COV,z(X, Y) =- - (2)(3) = 9 - 6 = 3 A la media, X, y a la va rianza , s;,
de esta distribucin las llamaremos media
3
y varianza marginales d e X.
82 Dislribucin marginal dC' Y: D istribucin en Y de todas las observaciones,
COV3(X, Y)= -
5
- (3)(4) = 16,4 - 12 = 4,4
independientemente d e sus puntuaciones en X.
A la media, Y, y a la varianza, s;,
de esta distribucin las lla maremos media
' ncov(X, Y) y varian7,3 ma rginales de Y.
o (4)(6) + (3)(3) + (5)(4,4) = 55 = 220 Distribucin condicional de X (para Y = Y.): Distri bucin en X de todas, y
11 12 12 48 solas, las observaciones con puntuacin Y = Y1 .
A la media, Xr=r,, y a la varianza, .~;_r=r, las llamaremos media y varianza
' n(X - X) (Y - condicion ales de X (para Y = Y1 ).
= l
Y) = -1 [ (4) ( 3 - -33)
- ( 5 - -49) + Distribucin condicional de Y (para X= Xd: D istribucin en Y de todas, y solas.
n 12 12 12 las observaciones con puntuacin X = x .
s;.
+(3) (2-:~) (3-;n+ (5)(3_~~) (4 - ;~)J= A la media, Yx = x., y a la varianza,
condicion ales de Y (para X = X.).
x = x., las llam arem os m edia y varia nza

Cornrianza de X e Y: Media a ritmtica de los productos entre la diferencia


f = _I__ [132 + 35 1 - 15] = 468 = ~ (X, - X) y la diferencia ( Y, - f') correspondientes a cada \rno de los n elementos
que componen un gru po. La designaremos por cov(X. Y) o por s,,.. Por tanto:
12 144 l .728 48
176 / Estadstica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 177

cov(X, Y)= sx, = :t (X, - X)(Y, - Y)= :tX,Y, - XY X


n n
(para datos no agrupados en intervalos)
9,5. A partir del cuadro siguiente, calcular: 1-3 1 4-6 1 7-9
a) Las medias marginales de X y de Y. 9-1 l [ 15 20
X Y) _ _ :t :t nu (X, - X) ( Y - Y) _ :t :t nuX, Y, _ X y b) La media condicional de X para Y = 4. 1 o __s_ --:7
COV( ' = sx, - n - n e) La media condicional de Y para X = 8. 6-8 i 5 j 13 6 1 24
d) Las varianzas marginales d e X y de Y.
(para da tos agrupados en in tervalos) e) La varianza condicional d e X para Y = 4. Y ~ - s 1o ~-;-o-
/) La varianza condicional de Y para X = 8
g) La covarianza de X e Y. 0 -2 --;-; -1 6 o 16
EJERCICIOS
20 ! 34 1 26 1 80

9.1. A partir de los datos siguientes. construir una tabla de frecuencias tal que en la
variable X existan tres intervalos de amplitud 4 y en la variable Y existan dos inter-
valos de amplitud 5. Dibujar el correspondiente diagrama de dispersin . n "
9.6. Demostrar que (X, - X)(}, - f) = X,Y, - nXY.
,~ 1 r: = l

~
X y X y X y X y 9.7. Demostrarque ' n,;(X,-X) ( Y; - Y)= ' ;_J.
n,; X , Y1 - nXY.
--- Je 1 i= l j~ 1 i= I

8 15 12 14 8 10 7 7 9.8. Sea un grupo compuesto de n 1 personas con medias X1 e l' en dos variables
12 11 6 12 4 10 2 8
X e Y.
13 13 4 8 3 7 10 14
Sea otro grupo compuesto de n2 personas con medias i 2 e f 2 en dos varia-
8 13 3 6 12 15 5 9
9 14 JI 12 3 7 5 bles X e Y.
Sean cov,(X, Y) y cov2 (X, Y) las covarianzas de X e Y para el grupo prime-
ro y para el grupo segundo.
Sea cov(X, }') la covarianza de X e r para el grupo to tal.
9.2. A partir de los datos anteriores (sin agrupar), calcular la covarianza de X e Y. Esto supuesto, demostrar que
9.3. A partir de los datos anteriores (agrupados segn 9.1), calcular:
cov(X, Y)= _ l _ _ [n 1 cov, (X, Y)+ n2 covz( X, Y) +111n2(l\ - X2 ) (Y1 - l\ )]
a) Las medias marginales de X y de Y. 11 1 + 11 2 n 1 + 11 2
b) Las medias condicionales de X y de Y.
e) Las varianzas marginales de X y de Y.
d) Las varianzas condicionales de X y de Y. 9.9. Comprobar la propiedad an terior con el ejemplo siguiente :
e) La covarianza de X e Y.
X
Grupo l.0 Grupo 2. 0 Grupo total
2 4 X y X y X y
9.4. A partir del cuadro siguiente, calcular:
--- - -- --- -
a) Las medias marginales de X y de Y. 8 36 44 80 2 l 8 6 2 l
b) Las medias condicionales de X y de Y. y 6 3 14 10 6 3
e) Las varianzas marginales de X y de Y. 5 4 16 20 JO 5 --- 10 5
d) Las varianzas condicionales de X y de Y. 8 6
e) 1.a covarianza de X e Y. 40 60 100 14 10
178 / Estadistica para Psiclogos

9.10. Sabiendo que X = 6, f


tan en el cuadro siguiente:
= 8, cov(X, Y) = 13, poner los va lores que fa _
10
X y XY Relacin (lineal) entre dos variables
2 8
4
80
10

10.1. Idea general

Intentamos medir la posible relacin entre d os variables. Estudiaremos bajo


el ttulo correlacin los problemas referentes a la variacin conjunta de dos vana-
bles, su intensidad y su sentido (positivo o negativo ). Estudiarem os bajo el ttulo
<<regresim, los problemas refe rentes a la prediccin o pronstico de los resultados
en una de las dos varia bles, conocidos los resultados en la otra.
Diremos que existe correlacin entre dos variables. si cierta o ciertas modali-
dades de una de las dos variables estn ligad as a cierta o ciertas modalidades de la
otra. As, a nivel n ominal, diremos que existe correlacin entre el lugar de origen y la
carrera universitaria elegida si, sistemticamente, las personas de cierta o ciertas
provincias (diversas moda lidades de la variable lugar de origen) tienden a estudiar
cierta o cier tas carreras universitarias (diversas modalidades de la variable carrera
universitaria). As, por ejemplo, los de la regin A estudian preferen temente Econ o-
ma, los de la B Medicina, los de la C Filosola, etc. La idea de correlacin apa rece
ms clara a nivel de intervalos. Diremos que existe correlacin positiva entre el peso
y la altura, si los de mucho peso tienden a ser altos (y recprocamente): si los de
peso medio, tienden a ser medianamente altos (y recprocamente) ; si los de poco peso,
tienden a ser bajos (y recprocamente). Diremos que existe, tambin, correlacin
positiva entre un test de aptitud, X , y el rendimiento en cierta asignatura, Y, si los
.alumnos con puntuaciones altas en X, tienden a a ser altos en Y ; si los alumnos con
puntuaciones medias en X, tienden a ser medios en Y; si los alumnos con puntua-
ciones bajas en X, tienden a ser bajos en Y. Existe una correlacin negativa (per-
fecta) entre la velocidad media a la que hemos recorrido cierta distancia y el tiempo
empleado en recorrerla. A velocidad alta, corto tiempo ; a velocidad baj a, largo
tiempo.
Comenzaremos con variables cuantitativas. Ms adelan te consideraremos va-
riables ordinales y variables nomina les.
En este captulo vamos a introducir un ndice que nos mida el grado de corre-
lacin en tre dos variables, X e Y, pero limi tndon os a variables cuantita tivas y que,
adems, estn relacionadas linealmente. Es decir, ta les q ue los puntos del diagrama
180 / Estadistica para Psiclogos Relacin /lineal) entre dos vanables / 181

de dispersin correspondiente a X e Y estn situados aproximadamente a lo largo de van de O a 100. Supongamos ahora los dos cuadros siguientes, el primero bajo la
una lnea recta. Este ndice va a ser el coeficiente de correlacin de Pearson y que condicin a) y el segundo bajo la condicin h ). Ambos son equivalentes. Slo di-
designaremos por r,,. Histricamente, la regresin aparece antes que la correlacin fieren en la unidad de medida elegida.
y, desde luego, tiene sus ventajas definir r,i a partir de la regresin. Noso tros, sin
embargo, por razones didcticas, propondremos r,, antes de introducir las rectas
de regresin. Con todo, una vez introducidas dichas rectas, volveremos a redefi. y (X-X) (Y- Y) (X-X)(Y - Y) X r (X - X ) 1r - Y) (X - X )( Y - Y)
X
nir r,)', dentro del contexto de la regresin, para alcanzar una idea ms clara y ms
cabal del mismo. 8 9 1,5 2 3 80 90 15 20 300
6 5 -0,5 -2 1 60 50 -5 -20 100
7 8 0,5 1 0,5 70 80 5 10 50
5 6 - 1,5 -1 1,5 50 60 -1 5 - 10 150
10.2. Coeficiente de correlacin de Pearson
26 28 6 260 280 600

10.2.1. Definicin s,, = 6/4 = 1,5 s., = 600/ 4 = 150

Segn lo indicado, la correlacin entre X e res positiva cuando X e Y cavaran Teniendo en cuenta el cuadro de la derecha, s,)' vale 100 veces ms que consi-
en el mismo sentido, es decir, cuando a estar por encima de la media en X correspon- derando el de la izquierda, por el mero hecho de haber elegido unidades de medida
de estar, tambin, por encima de la media en Y, y cuando a estar por debajo de la distintas.
media en X corresponde estar, tambin, por debajo de la media en Y. La corre- En segundo lugar, es algo discutible la interpretacin de los n meros 6 y 600,
lacin entre X e Y es negativa cuando covaran en sentido opuesto, es decir, cuando como suma que son de productos cuyo par de factores representan cosas de natura-
a estar por encima de la media en X corresponde estar por debajo de la media en leza distinta.
Y, y cuando a estar por debajo de la media en X corresponde estar por encima de Para evitar estas dificultades, una tctica obvia es dividir (X - X ) por s, e
la media en Y. La correlacin es nula cuando no cavaran en ninguno de los dos (Y - Y) por s)'" Segn sabemos, (X - X) y s, vienen dadas en una misma unidad
sentidos, es decir, cuando a estar por encima de la meda en X corresponde tanto de medida. Por tanto, el cociente (X - X )/s, es el mismo, sea cual sea la unidad de
estar por encima como por debajo de la media en Y, e, igualmente, cuando a estar medida elegida para medir la variable X. As, es fci l comprobar cmo en el cuadro
por debajo de la media en X corresponde tanto estar por encima como por debajo de la izquierda s, = 1,118 y cmo en el cuadro de la derecha s, = 11, 18. De donde
de la meda en Y. Por todo ello, la covarianza parece ser un ndice apropiado para se deduce que 1,5/ 1,118 = 15/ 11,18, -0,5/l,118 = -5/11,18, etc. De modo an-
medir la correlacin. En efecto, en el caso de correlacin positiva, (X - .X)e (Y - Y) logo es fcil comprobar cmo en el cuadro de la izquierda si, = 1,581 y cmo en el
sern para todas o casi todas las observaciones del mismo signo y, por tanto, su cuadro de la derecha s, = 15,81. De donde se deduce que 2/J,581 = 20/ 15,81,
producto ser positivo ; consiguientemente, s,i = E (X - X)( r - Y)/n ser posi- -2/ 1,581 = - 20/ 15,81, etc. En conclusin, L (X - X ) (Y - Y)/s,sl' es invariante
tiva. Por el contrario, en el caso de correlacin negativa, (X - X) e (Y - Y) sern, frente a cualquier cambio de unidad de medida. As, en nuestro ejemplo,
para todas o casi todas las observaciones de distinto signo y, por tanto, su producto
(X - X) ( Y - Y) ser negativo ; consiguientemente, s,, = E (X - X) ( Y - Y)/n 6/ (1 ,118)(1,581) = 600/( 11.1 8)( 15,81)
ser negativa. Finalmente, en el caso de correlacin nula, aproximadamente, para
la mitad de observaciones, (X - X) e ( Y - Y) sern del mismo signo y para la Por otra parte, tanto (X - X) como s, son nmeros concretos q ue representan
otra mitad, lo sern de distinto signo; por tanto, ms o tnenos, la mitad de los pro- alguna caracters tica (ambos la misma) como peso, aprovechamiento en Es-
ductos (X - X) ( Y - f') sern positivos y la otra mitad sern negativos. Consiguien- tadstica, actitud frente a la guerra, etc., y ambos vienen dados en una misma
temente, s,l' ser nula o muy prxima a cero. En conclusin, a correlacin positiva, unidad de medida elegida arbitrariamente. Mientras que(X - X )/s, es un mero
negativa o nula, corresponde covarianza positiva, negativa o nula, respectivamente. nmero abstracto que se limita a indicar cuntas veces el numerador contiene al
Sin embargo, s,,, como indice de correlacin presenta algunos inconvenientes. denominador, independientemente de lo que stos signifiquen. Lo mismo sucede con
En primer lugar, el valor de s,l' es funcin de las unidades de medida elegidas (Y - Y)/s,.
para X e Y. Supongamos, por ejemplo, que X es aprovechamiento en gramtica . (X - X) (Y - Y) .
Finalmente, - - - - - - - es un numero abstracto, como producto de
e Y-,-ts aprovechamiento en aritmtica. Calculemos s,i bajo dos condiciones sx s,.
distintas : a) las puntuaciones posibles van de O a 10, h) las puntuaciones posibles dos nmeros abstractos.
182 / Estadistica para Psiclogos Relacin (lineal) entre dos var,ables / 183

Por todas estas razones, en vez de usar EJEMPLO IO. l. Calculemos rx,. a partir de los cinco pares de puntuaciones
siguientes:
:E (X - X) ( Y - Y)
sX)' = - - n

como indice de correlacin, usaremos X y xi y2 XY X y x' yl xy z, Z~ Z>,

o o o o o
r(X - X)(Y- >') U~_- X)(Y- >')
3
5 12
9 9
25
81
144
27
60
-1
l 3
l
1 9 3
-0,5
0,5 0,5 0,25
Sx S. - = n = ~
(10.1) 4 o 16 o o o -9 o 81 o o - 1,5 o
n s,s,. s,s,. 7 18 49 324 126 3 9 9 81 27 1,5 1,5 2,25
1 6 l 36 6 - 3 -3 9 9 9 - 1,5 -0,5 0,75
Le llamaremos coeficiente de correlacin de Pearson y le designaremos por,,,.
La frmula ( I0.1) adopta diversas versiones, todas ellas equivalentes: 20 45 100 585 219 o o 20 180 39 o o 3,25

r (X - X) ( Y - Y) L(X - X)(Y-Y) s,,. = 39/ 5 = 7,8 s, = .fios = 2 s, = Ji80/5 = 6


rxy - ~ - - - n_- - = s. s' = L Zxz,. (1 0.2)
s,s,. s,s,. n n

!: (X - X) ( Y - Y) Segn (10.1):

=~
n !: (X - X) ( Y - Y) = !: xy =
'xy s.s, = - - -SxSy
- -- - n s,s,
(10.3) 7,8 = 0,65
n Sxs, r,,. = (2)(6)

LX}' Segn (10.2):


(10.3')
./!: x2 fty2
3,25
,., = ~5~
= 0,65
:E(X-X)(Y- Y)
n :l:XY- nXY Segn (10.3 ):
y.X)'=~=
s,s, s,s, n,L~-~~,!: ~-~W 39 39
~ ~ r ,= - - = ~ = O 65
X) (5)(2)(6) 60 ,
nLXY- :l:X!: Y (1 0.4) Segn (10.3'):
./n r X 2
- (r X) 2
..jn !: Y 2
- (L Y) 2
39 39
, .,. = fioJIBO = 60 = 0,65
10.2.2. C lculo
Segn (10.4):
a) Daros no agrupados
r = (5)(219) - (20)(45 ) = 1.095 - 900 = -~ = O65
~ a aplicacin de las frmulas anteriores, a los datos originales, es decir, X )' ../(5)(100) - 202../(5)(585 ) - 452 Jtoofioo (10)(30 ) ,
considerando una a una las puntuaciones dadas.
184 / Estadistica para Psiclogos Relacin (lineal/ entre dos variables / 185

a) Datos agrupados en intervalos La fila nx est formada por las frecuencias marginales de X. (5, 5, 10, 6, 4). La
fila X est formada por los puntos medios de los intervalos en los que ha sido dis-
rxy -_ --;===n=L=I:
= n='
x'=.X
==Y= -=-
(!:-;=
nx~X=)==('=!:=n~,=Y=')= tribuida la variable X (1, 4, 7, JO, 13). La columna n, est formada por las frecuencias
(10.5)
Jn I: n,X2 - (!: nxXJ2 Jn !: n,.Y2 - (!: n, Y) 2 marginales de Y (10, 12, 8). La columna Y est formada por los puntos medios
Donde: de Jos intervalos en los que ha sido distribuida la variable Y (2, 7, 12).
nxX consta de los productos de la fila nx por la lila X; (5)(1 ), (5)(4 ), (10)(7),
n,: representa el nmero de observaciones o frecuencias marginales de X. (6)(10), (4)( 13).
11,. : representa el nmero de o bservaciones o frecuencias margi nales de Y. nxX2 consta de los productos de la fila nxX por la lila X: (5)( 1), (20)(4), (70)(7),
11,_.: representa el nmero de observaciones dentro de cada una de las casi- 1
(60)(10), (52)(13).
llas interiores de la tabla de frecuencias. Es decir, el nmero de observaciones n,Y consta de los productos de la columna n,. por la columna Y: (8 )(1 2), (12)(7),
que simultneamente pertenecen a un cierto intervalo de la variable X y a otro
de la variable Y. {10)(2).
n,Y2 consta de los productos de la columna n,.Y por la columna Y: (96)(1 2),
EJEMPLO 10.2. Calculemos r xy a partir de la siguiente distribucin conjunta (84)(7), (20)(2).
de frecuencias. En cada una de las 15 casillas interiores d e la tabla anterior tenemos tres nmeros.
X El central indica el nmero de observaciones o frecuencia de cada casilla. El situa-
do arriba a la derecha es el producto de los puntos medios de los dos intervalos
0-2 3-5 6-8 9- 11 12-14 11,. correspondientes a cada casilla : (1)(2), (1)(7), (1)(12), (4)(2), (4)(7), (4)( 12), .. . ,
(13)(2), (13)(7), (1 3)(12). El situado abajo a la izquierda es el producto de la fre-
10-14 o o 2 2 4 8 cuencia, n.,., de cada casilla por el XY correspondiente a la misma casilla : (2)(4),
(7)(1), (12)(0), . .. , (26)(0), (91)(0), (156)(4).
y
5-9 l 2 6 3 o 12
La columna n,,X Y consta de la suma de los nmeros n,,x >, los situados abajo
a la izquierda, pertenecientes a las casillas de la primera lila, (1.032 ), de la suma
0-4 4 3 2 1 o 10
de los nmeros nx,.XY pertenecientes a las casillas de la segunda lila (567), de la suma
n, 5 5 10 6 4 30 de los nmeros nx,.XY pertenecientes a las casillas de la tercera fila (80 ).
Por consiguiente, aplicando la frmula (1 0.5 ):

Para calcular rx, organicemos los datos anteriores del modo siguiente. r = (30)(1.679) - (207)(200) = 8.970 =
0 688
X xy )(30)(1.85 ]) - (207) 2 J(30)(1.780) - (200)2 13.035,5 '
f,
t 0-2 3-5 6-8 9-1 l 12-14 ", Y n, Y n,.Y2 n,..TXY
12 48 84 120 156
10-14 o o 2 2 4 8 12 96 1.152 1.032 10.2.3. Propiedades
o o 168 240 624
7 28 49 70 91 a) El coeficiente de correlacin de Pearson no puede valer menos que -1 ni
y 5-9 1 2 6 3 o 12 7 84 588 567 ms que l. Es decir, -1 ~ rx, ~ l.
7 56 294 210 o
t- - r-- - En efecto, sean u = zx + z,, u = Zx - z,., donde z, y z, son puntuaciones
2 8 14 20 26
-- tpicas.
0-4 4 3 2 o
8 24
1 10 2 20 40 80 Evidentemente, ii = f = O. Por tanto,
.-------- r-- - -
28 20 o
n, 5
1 - --

5 10 6
r----- --
4 30 200 J.780 1.679
X 1 4 7 10 2 _ !: (zx + z,)2 = L z; + 2 !: z,zy +~ 1 + 2r,,, + 1 = 2(1 + r, ,)
13 s. - n n n n
11,X 5 20 70 60 52 207
11.,,,x: :f.. s 80 490 600 676 1.851 2 _ L (zx - z,)
1
= !: z; _ 2 !: z,z,, + !-_5_ = 1 - 2r,,. + 1 = 2(1 - rx,l
Sv - n n n n
186 / Estadistica para Psiclogos Relacin (lin eal) entre dos var iables / 187

z,
Ahora bien, tanto s~ como s~ son esencialmente no negativos. Por tamo - + + +
(1 + ,,,) ~ O. Es decir, r,, ~ - l. Igualmente, (! - ,,, ) : O. Es decir, r,, $ 1'.
En conclusin, -1 ::; r,, ::; l.
El coeficiente '"' alcanza su valor extremo 1, cuando cada una de las personas
obtiene la misma puntuacin tpica en X y en Y, o sea, cuando z, ~ z, para toda z.
persona del grupo. Evidentemente, en este caso

r,y = 1: z,z,. = 1: z,z, - :E z; + -


n - - --
n n
sern positivos y grandes. En cambio, los productos del par de puntuaciones t-
,.,. alcanza su valor extremo -1, cuando cada una de las personas obtiene picas de la minora sern negativos y pequeos. En conclusi n, la suma de los n
la misma puntuacin tpica (pero con distinto signo) en X y en Y, es decir, cuando productos, 1: z,z,., ser positiva y, por tanto, ,., ser positiva.
z, = - z. para toda persona del grupo. Evidentemente, en este caso
a .2) La mayor parte de las personas estn situadas en el 2.0 y 4.0 cuadran tes,
es decir, las d os puntuaciones tpicas de cada u na de estas personas son una posi-
r _ L z,zr
xy - = 1: z.x (-zx = - L
~
22
X = - ] tiva y la otra negativa. Adems, bastantes de ellas tienen puntuaciones tpicas
n n n
mayores (en valor absoluto) que las personas del 1. 0 y 3.0 cuadrantes. Esto quiere
En el primer caso, los puntos que representan a las n personas estn sobre la
z,
diagonal de los cuadrantes J. 0 y 3.0 (figura A). En el segundo, sobre la diagonal - + + +
de los cuadrantes 2.0 y 4. 0 (figura B).

z, z, z,

+ -
z. z.
decir que los productos d el par de puntuaciones tpicas de la mayora de las personas
sern negativos y grandes. En cambio, los productos del par de puntuaciones t-
'* picas de la minora sern positivos y pequeos. En conclusin, la suma de los n
(A) (B) productos, L z,z, ser negativa y, por tanto, r,, ser negativa.
a .3) Aproximadamente la cuarta parte de las n personas estn situadas en cada
Siempre que r,, = 1 o ,,., = - 1, los puntos siguen estando sobre una lnea uno de los cuatro cuadrantes. Por tan to, la mitad de ellas tendrn puntuaciones
recta (no necesariamente las dos diagonales anteriores) si nos valemos de puntua- tpicas del mismo signo y la otra mitad de signo distin to. Adems, en los cuatro
ciones diferenciales o directas. Y siempre que los puntos estn sobre una lnea recta,
,., = 1 o r,, = - J. Estas afirmaciones quedarn legitimadas en el captulo 12.
Veamos ahora lo que sucede cuando los puntos no estn sobre una lnea recta.
- . z,
+ +

Consideremos tres casos suponiendo puntuaciones tpicas.


a. l) La mayor parte de las personas estn situadas en el 1.0 y 3.0 cuadrantes, z.
es decir, las dos puntuaciones tpicas de cada una de estas personas son ambas
positivas o negativas. Adems, bastantes de ellas tienen puntuaciones tpicas ma-
yores (t:?valor absoluto) que las personas del 2.0 y 4.0 cuadrantes. Esto quiere de-
cir qu los productos del par de puntuaciones tpicas de la mayora de las personas
188 / Estadistica para Psiclogos
Relacin /lineal/ entre dos var,ab/es / 189
cuadrantes tenemos puntuaciones tpicas (en valor absoluto) altas, medias y bajas
Esto quiere decir que los productos del par de puntuaciones tpicas d e la mitad 10.2.4. Mtodo abreviado para el clculo de r,,
de las personas sern positivos y los de la otra mitad sern negativos. Por otra
parte, la suma de los productos de la primera mitad ser aproximadamente igual Basados en la propiedad 10.2.3.b), vamos a obtener un mtodo que simplifica
(y de signo contrario) que la suma de los de la segunda. En conclusin, la suma de los 0
abrevia el clculo de r,,.
n productos, r zxz,, ser nula o, aproximadamente, nula. Supongamos n pun tuaciones agrupadas en r intervalos (en una variable X ).
todos ellos con la misma amplitud /, y, a su vez, agru padas en s intervalos (en otra
b) El coeficiente rx,., en valor absoluto, entre dos variables es invarian te frente variable Y), todos ellos con la misma ampli tud !,.. Sean X 0 e }'0 los puntos medios
a cualquier transformacin lineal de ambas.
de dos intervalos (uno en X y otro en Y) elegidos arbitra riamente y a los que llamare-
Esto quiere decir lo siguiente :
Sean X 1 , X 2 , . , X, ; Y 1, Y 2 , , Y. las puntuaciones ob tenidas por n personas mas intervaos on.gen. Hagamos A = -1 B = - -Xo C = - 1 D = - _, Yo .mtro-
/, !, I ,. I ,.
en las dos variables X e Y. Sean X, Y, sx, s, las correspondientes medias y desviaciones
tpicas. Formemos las nuevas puntuaciones : duciend o x , = -1 X - -Xo y , = - y - Yo D a d o que x e I, son siempre
- . ..
positivas,
lx !, I, ! ,.
V1 =AX 1 + B, V2 = A X2 + B, . . . , V. = AX. +B r,r = r,,.. segn 10.2.3.h).
Segn sabemos (vase 5.2.4) las transfor macio nes an teriores hacen correspon-
W, = CY, + D, W 2 = C Y2 + D, ... , W. = C Y. +D
der a X 0 el valor x' = O, a las puntuaciones superiores a X 0 los valores x = l.
donde A, B, C y D son cuatro constan tes arbitrarias. Supuesto esto, lr,.,j = /r,yj. x' = 2, . . . , y a las puntuaciones inferiores a X O los valores x ' = - J. x ' = -2 . . . .
A su vez, hacen corresponder a Y 0 el valor y ' = O, a las puntuaciones su periores
En efecto, segn ya sabemos, V= AX + B. s,. = /A /sx, W = CY + D, s~. =
j Cjs,. Por consiguien le: a Y 0 los valores y ' = 1, y ' = 2, . . . y a las pu ntuaciones inferiores a Y 0 los valores
y' = - 1, y ' = - 2, . . .
r rw En conclusin, las transforma ciones anteriores nos permiten calcular el coefi-
'J.' JC =- - = r (V - V)( W - W)
ciente de correlacin de Pearson valindonos de las puntuaciones x ' e y ' que son,
11s,s., ns,,s,.
ordinariamente, mucho ms manejables que las puntuaciones originales X e Y.
La frmula (10.5) tomar ahora la forma siguiente
r [ (A X+ B) - (AX + B)][(CY + D ) - (CY + D )]
= n/AjsxjCfs,. = n r !: n,,.x'y' - (:E 11,x')(I: n,.y') (10.6)
r., = Jnrnxx ' 2 - ('E n,x')2 J nr n,.y'2 - (:E n,.y' )2

LA(X - X)C(Y - Y) AC :E(X- X )(Y - Y) AC rxy


jAC jnsxs, = /AC/ ns,s1 = /A C/ ns,s, = EJEMPLO 10.3. Apliquemos la f rmula (10.6) a los datos del ejemplo 10.2.

{ = r,,. si el signo de A es igual que el de C

i
AC 12-14 y n,y n,.y'2 n)(_,,x'y'
0-2 3-5 6-8 9-11 n,.
= /A C/ rx, = - rx,- si el signo de A es distinto que el de C
10-14 o o 2 2 4 8 1 8 8 10
Por tanto, /r,,./ = /r,,./.
5.9 l 2 6 3 o 12 o o o o
De esta propiedad se infiere fcilmente que en (10.4) las pun tuaciones directas - 0-4 o -1 - JO 10 10
1

en X y en Y pueden ser sustituidas por pun tuaciones diferenciales o tpicas. El
resultado final es el mismo usando directas-directas, que diferenciales-diferenciales,
4 3 2 1 JO

18 20
n, 5 5 10 6 4 30 -2 1
directas-diferenciales, diferenciales-tpicas, etc. En efecto, x = (1 )(X) + ( - X),
X - 2 - 1 o 1 2

(2)x + ( - 1),y = =(..!.) y+ (- ~I ) con s, 1


z, = (l )(Y) + ( -Y). z1 y s,
o
~ ~ ~ ll;r'< - 10 - 5 6 8 - 1

1 posiliva,s:f nxx2 20 5 o 6 16 47

il
190 / Estadistica para Ps,c/ogos Relacin (linea l) entre dos var iables / 191

El procedimienlo para construir la tabla es anlogo al utilizado en el ejemplo 10.2. Intm l1vamente se puede apreciar que la nube de puntos cor respondien te a l
Aplicando la frmula ( 10.6) nos queda: grupo total es ms estrecha y a largada que las dos nubes correspondientes al grupo
G1 y al G2 .
=
---;==
(30)(20) - ( - I )( - 2)
=======~ =---'-:======='== = -
_ 598 _ O
- 68 8 Pues bien , para Gr, 'x, = 0,84
f X)'
)(30)(47) - (- J)2j(30)(18) - (-2) 2 869 ' para G 1 , , , ,, = 0,3 8
pa ra G 2 , , ,,. = 0,67
El resultado es el mismo que el obtenido media nte el mtodo no abreviado.
Ntese que este valor de , , ,, menor para G 1 y G2 que para Gr, no es debido
a que los dos subgrupos consten de menos personas que el grupo total. En e fecto,
10.3. Factores de los que depende rx, del grupo total podemos elegir slo siete personas, pero que formen un grupo de
gran variabilidad. Elijamos, por ejemplo, las tres ms bajas en X y las tres ms
a) Vuri,tbilidoJ ,le/ grupo altas en X.
Supongamos dos variables, X (capacidad intelectual) e Y (xito escolar), rela-
cionadas linealmente. Calculemos el coeficiente de correlacin de Pearson entre
ambas del modo siguiente. Consideremos, en primer lugar, el grupo total, Gr, y, X y xi y2 XY
luego, dos subgrupos del mismo: G 1 , compuesto de los bajos en X (que, dada la
relacin lineal entre X e Y, tendern a ser bajos, tambin, en Y) y G2 , compuesto 8 7 64 49 56
de los altos en X (que, por la razn ante rior, tendern a ser altos, tambin, en Y). 7 7 49 49 49 (7)( 188) - (32)(31)
7 6 49 36 42 r.,. >. = -
Es claro que la variabilidad en X y en Y d e las personas del grupo Gr ser mayor j(7)(2 l4) - 322 J(7)(173) - 312 -
que la de las personas tanto de G 1 como de G 2 . En efecto, Gr consta de personas 7 5 49 25 35
3 9 3 324
altas y bajas en capacidad intelectual (y en xito escolar). En cambio, G I slo consta = - - =0 94
2 4 2
de personas bajas y G 2 slo consta de personas altas. Pues bien , '>" es mayor en 1 1 l
344,238 '
Gr que en G 1 y en G2 Es decir, el coeficiente de correlacin de Pearson queda re-
ducido al restringir la variabilidad del grupo en una variable (o en las dos). 32 31 214 173 188
EJEMPLO 10.4. Consideremos un grupo total, Gr, con 25 personas. Vamos
a descomponerlo en dos subgrupos : uno, G 1 , con las diez personas ms bajas en
X, y otro, G 2 , con las 15 ms altas en X.
Para este grupo reducido, pero muy heterogneo, ' x; = 0,94, mayor q ue el
La representacin grfica es la siguiente:
coeficiente de correlacin de Pearson correspondiente a l grupo tota l compuesto de
X 25 personas .
Ntese, tambin, que por razn del aumento de variabilidad, un solo dato
alejado mucho de los restantes puede h acer que a umente espectacularmente el coe-
ficiente de correlacin de Pearson . As, por ejemplo, el alumno puede comprobar
G, cmo r,,. = O en la tabla A, y cmo r,_.. = 0,95 en la ta bla B que no es ms que
G,
la tabla A con un nuevo punto, el (12, 12) muy a lejado de los cuatro restantes.
I Aho~ r:n X I
TA BL A A TABLA B
-y
X y X
-- - -
3 3 12 12
3 1 3 3
G, 1
X 1 3 3
1Ba1~ en X )
l l 3
~:t 4 6 7
Altos en X
192 / Estadstica para Psiclogos Relacin //mea/) entre dos var iabl es / 193

Este influjo de la variabilidad del grupo sobre r, , debe ser tenido en cuenta negativa. Este alto coeficiente de correlacin entre peso y habilidad numenca es
al valorar sta. Contemplemos un caso muy ordinario en Psicologa . De modo ele- debido a la presencia de una tercera variable: la edad. D entro del margen de edades
mental diremos que un test es fiable cuando, aplicado en d os ocasio nes distintas a un propuesto, al ir aumentando la edad aumentan simultneamente el peso y la habilidad
mismo grupo, da lugar a dos sucesiones de puntuaciones muy parecidas. Ms concre- en operar con n meros. Un modo de eliminar el influjo de la edad es dividir el grupo
tamente, llamaremos coeficiente de fiabilidad o, si mplemente. fiabilidad de un test total en subgrupos, tales que los nios de cada uno de ellos tengan la misma edad y
al coeficiente de correlacin de Pearson, r 12 , entre las puntuaciones obtenidas e~ calcular r,,. dentro de cada uno de dichos subgrupos. Pues bien, siguiendo esta tcti-
la p rimera ocasin y las obtenidas en la segunda. Pues bien, segn lo dicho anterior- ca veremos que el coeficiente de correlacin de Pearson entre peso y habilidad num-
mente, r 12 ser funcin de la variabilidad del grupo en aquella variable medida por rica es muy bajo, por muchos nios que elijamos de cada subgrupo de la misma edad.
el test. Si se trata de un test de inteligencia y aplicamos el test a un grupo de nios Ms adelante propondremos una manera de controlar estadsticamente el in-
muy homogneos (o todos muy inteligentes, o todos medios, o todos poco in teli- flujo de la tercera variable de que se trate, sin tener que dividir el grupo total en va-
gentes) obtendremos un valor para r 12 mucho menor que si lo hubiramos aplicado rios subgrupos, de acuerdo con lo indicado.
a un grupo muy heterogneo (compuesto de nios, unos muy in teligentes, otros La situacin presente quedara representada grficamente segn se ve en la
de inteligencia media y otros poco inteligentes). En otras palabras, el mismo test figura de la pgina anterior.
aplicado a un grupo muy homogneo puede dar lugar a r 12 = 0,75, por ejemplo, y Dentro de cada edad, r,, es prcticamente nula (una circun ferencia limita lo s
aplicado a un grupo heterogneo puede dar Jugar a r 12 = 0,93, por ejemplo. puntos representativos de las personas de cada edad). Pero consideradas conjunta-
mente todas las edades, es decir, sin controlar el influjo de la edad, r " >' crece sensi-
b) Influjo de una tercera w riab/e blemente (una elipse estrecha y alargada limita los puntos representativos de las
personas de todas las edades).
Si calculamos el coeficiente de correlacin de Pearson entre el peso y la habi- Vemos ahora una situacin en la que el influjo de la tercera variable tiende
lidad en realizar operaciones aritmticas para un grupo de nios cuyas edades os- a reducir la correlacin entre d os variables. Consideremos la capacidad intelectual.
cilen aproximadamente entre los cuatro y los doce aos, veremos que r,,. suele X, y el rendimiento escolar en cierta disciplina, Y. Consid eremos, adems, la moti-
ser positivo y alto. Quiere decir esto que, en general, los nios de ms peso tienen vacin como tercera variable, Z. Si controlamos Z, r,.,. ser, en general, alta . Pero
mayor facilidad para el clculo numrico que los nios de menor peso? A primera sin este control es posible q ue alumnos con gran motivacin logren alto rendimiento
vista y atenindonos al valor de r,,, parece que s. Sin embargo, la respuesta es escolar, a pesar de tener capacidad intelectual media y aun baja. Por el con trario,
otros alumnos, poco motivados, pueden lograr un bajo rendimiento esco lar, a pesar
de estar dotados de gran capacidad intelectual, y es probable que descienda r,, si
dejamos actuar a Z.
La situacin presente quedara grficamen te representada asi:

motivacin alta
(baja capacidad , alto rendimiento)

motivacin medfa, normal


~

o"'
~ motivaci n baJa
"o (alta ca pacidad. bajo re ndimiento)
j
g
:ae:
ii!

Habilidad numrica Capacidad inlelectual


194 / Estadistica para Ps,clogos Relacin //mea!) entre dos varia bles / 195

Si eliminamos los alumnos con motivacin alta y escasa capacidad intelectual y 10.4. Condicin esencial para poder calcular ,,r
los alumnos con motivacin baja y gran capacidad intelectual, rx, ser alta. (Una
elipse estrecha y alargada limita los puntos representativos de las personas no A nivel meramente descriptiro (en el cual nos movemos por ahora) la condicin
eliminadas.) Pero si no los eliminamos, rx,. puede descender sensiblemente (una cir- esencial para poder calcular r,,. es la linealidad de los puntos que representan a
cunferencia limita los puntos de todas las personas, sin eliminacin de ninguna). Jas n personas. Es decir, estos puntos deben estar situados prximos a una lnea
Consideremos un ltimo caso hiptetico. Supongamos que la relacin entre recta. No es necesario.que las dos variables se distribuyan normalmen te. Cualquier
dos variables, X e Y, es alta y positiva para las mujeres y alta y negativa para los tipo de distribucin es vlido, a condicin de que los puntos se siten cercanos a una
varones y es nula para el grupo total. En otras palabras, si prescindimos del influjo recta. Y esto es posible aun cuando las dos distribuciones sean asimtricas. Por
del sexo, rx, = O. Pero si tenemos en cuenta dicho influjo, rx, es alta y positiva 0
alta y negativa. ejemplo,
La situacin presente quedara representada grficamente as: X: l, 1, 1, l , l, 1, l, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5.
Y: 2, 2, 2, 2, 2, 2, 2, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 8, 8, 10.

son francame nte asimtricas. Sin embargo, los puntos (1 ,2), (1,2). .. . , (4,8), (5. 10)
se encuentran sobre la recta Y = 2X y 'x, vale l.
Advirtase que r,, puede ser calcu lado materialmente, siempre que tengamos
n pares de nmeros. Nuestro problema presente no es si puede ser calculado o no
mujeres
materialmente, sino si el resultado obtenido admi te una interpretacin razonable
como coeficiente de correlacin, es decir, como indicad or de la relacin existente en-
tre las d os variables. Pues bien, la interpretacin es razonable solamente cuando se
verifica la condicin de linealidad. Si los puntos representantes de las personas
y (es decir, de los pares de puntuaciones de cada persona) estn sobre una lnea curva,
r",. no sera recomendable, pues detectara muy p obremente la relacin curvilnea
entre las d os variables. Ms an, a una perfecta relacin curvilnea entre dos va-
varones
riables, puede corresponder rx,- = O. Vase el ejemplo siguiente:

X y
-- - - -- r (0,2)
2 o
/2 J2
X
o 2
,l 1
:j/2.0) X
- J. ../2 ( - 2,0)

Considerado el grupo formado simultneamente por varones y mujeres, rx, - 2 o


seria prcticamente nula (una circunferencia limita los puntos representativos de
dichas personas). Pero considerado exclusivamente el grupo de las m ujeres, rx,
- Ji - Ji ~ (--.,,-2.
(- , I 2. - , 2) - ,,1r.;2)

sera alta y positiva (una elipse estrecha y alargada que va del 1. 0 al 3." cuadrante o - 2 (O, - 2)
limita los puntos represen tativos de las mujeres), y considerado el grupo de los va- ,./2 -/ 2
rones, 'x, sera alta y negativa (una elipse estrecha y alargada que va del 2.0 al 4.0
cuadrante limita los puntos represen tativos de los varones).
De estas y otras consideraciones que pasamos por alto se infiere la gran uti-
lidad de d_ibujar el diagrama de dispersin antes de calcular el coeficiente de co- Los ocho pu ntos anteriores estn situados sobre la circunferencia X 2 + Y2 = 4.
rrelacir de Pea rson, para luego poder interpretar ste de modo apropiad o. Existe una correlacin (curvilnea) perfecta entre X e Y y, sin embargo, rx, = O.
196 / Estadistica para Psi clogos Rel;mn (lineal / en tr e d os variabl es / 197

Por tanto, si no existe relacin alguna entre dos variables, r,, = O. Pero si Lo cual no quiere decir que la abundancia de telfonos sea la causa de los accidentes.
r,,. = O, no se puede concluir que no exista relacin alguna. Ciertamente no existe Obviamente, a mayor nivel de vida corresponde simultneamente mayor n mero
relacin lineal, pero puede existir una relacin no lineal. En resumen, r, ,. mide la de telfonos y mayor nmero de coches y, como consecuencia, ms accidentes.
relacin lineal entre dos variables. Pronto veremos que r,,, = 1 si los puntos Pero a nadie se le ocurrira reducir el nmero de telfonos pensando que as iba
estn sobre una recta y, recprocamente, que si ,,, = 1, los puntos estn sobre a evitar muchos de los accidentes.
una recta. De aqu que volvamos a inculcar la importancia de dibujar el diagrama La correlacin indica una mera covariacin en tre dos variabl es y nada ms.
de dispersin antes de calcular 'Y para comprobar si los puntos siguen una tra-
yectoria ms o menos rectilnea. Slo bajo esta condicin ser recomendable r.,.
como ndice de correlacin.
10.7. Resumen : Definiciones y frmulas

Coeficiente de correlacin de Pearson entre X e Y, r,,. ; Cociente en tre la cova-


10.5. Interpretacin de,.,
rianza de X e Y y el producto de la desviacin tpica de X por la desviacin tpica de Y.

Sabernos que r,,. = 1 indica correlacin lineal perfecta, y que ,., = O indica
correlacin lineal nula. Esto supuesto, qu significa 0,65?, correlacin alta, media
r,..), = .!.,g__
S.xSy
o baja? Esta pregunta no tiene sentido considerada absolutamente. Depende de las
circunstancias. Es baja si se trata de la fiabilidad de un tes1. y es aJta si se trata de la
Otras frmulas equivalentes son :
validez del mismo. Ser baja si se trata de la correlacin entre dos tests de inteligencia
espacial parecidos, pero ser alta si se trata de la correlacin entre dos variables
sociales como, por ejemplo, patriotismo y prejuicio religioso. En general, la nica
valoracin razonable de un coeficiente de correlacin, es compararlo con los coefi-
= (
rX)' = LZn Z , don
d .
e z., y z , son puntuacmnes ,. )
llp1cas

cientes de correlacin encontrados por otros investigadores entre las mismas va-
riables y en circunstancias semejantes. El coeficiente de correlacin encontrado
por nosotros ser bajo, si es inferior al encontrado por otros investigadores; ser
= ns,,s,
L xy = ~/f~<r?:E x 2 L y2
(donde X e y son pun tuaciones diferenciales)

alto, si supera a los coeficientes obtenidos por estos. As, por ejemplo , si se trata
de las variables prejuicio antiprotestante y religiosidad utilitaria)), r.,. = 0,65 n:EXY-:EX:E Y
sera alto, pues no suelen alcanzar dicho valor los coeficientes encontrados por 2
(donde X e Y son puntuaciones di-
otros investigadores entre estas variables u otras muy semejantes corno prejuicio jn "J:,X - (LX) 2 j nT, Y 2 - (T, Y) 2 rectas)
racial)) y religiosidad utilitaria.
Por estas razones, son muy equvocas las tablas en las que se valoran los coefi-
n T, :E n,1.XY - (L n, X )(T, 11,. Y )
cientes de correlacin como bajos {por ejemplo, entre Oy 0,30), medios (por ejemplo, (donde X e Y son p untua-
entre 0,30 y 0,70), altos (por .ejemplo, entre 0,70 y 1), o segn otras categoras seme- J n L n,x2 - (L n,X)2 J n L n,. Y 2 - CE n,. Y)2 ciones directas y los da-
jantes. Es evidente que el nmero 0,40 es menor que 0,50. No obstante, la relacin tos se encuentran agrupa-
expresada por 0,40 puede significar ms que la expresada por 0,50. Depende de las dos en intervalos )
variables en cuestin.

10.6. Correlacin y causalidad

Por el hecho de que exista una alta correlacin entre dos variables, no- podemos
decir que una de ellas sea causa de la otra. Es claro que hay correlacin positiva entre
el nmero <!(!'accidentes de trfico y el nmero de telfonos en las viviendas. En las
regiones on mayor nmero de telfonos suelen darse ms accidentes de trfico.
198 / Estadistica para Psiclogos Relacin /lineal) entre dos variabl es / 199

EJERCICIOS 10.7. Se verifica necesariamente X = Y y s, = s 1. siempre que valga I el coefi-


ciente de correlacin de Pearson entre X e n
10.1. Calcular el coeficiente de correlacin de Pearson entre las variables X e Y, 10.8. Demostrar que si slo tenemos dos personas, con pun tuaciones en X y e n
a partir de los siguientes datos no agrupados en intervalos. Y, ,,, =1 ,,,. = - 1 r,, = O. ( En qu nicos casos se verificar ,, 1. = O?)

t0.9. Deseamos calcular r,, entre los resultados en u na prueba de aritm tica (X)
a) X y b) X y e) X y d) X y e) X r f) X y y otra de gramtica ( Y). Nos valemos de un o rdenador en cuya memoria se encuentra
- - - -- - - - - - --- - la frmula de , .,. en puntuaciones directas. Por distraccin introducimos en el or-
1 1 2 5 1 1 4 1 1 4 1 5 denador pu ntuaciones diferenciales en gramtica y tpicas en aritmtica. En este su-
2 2 4 7 2 3 6 1 2 2 3 2
puesto, a) Tendr algn sen tido el resultado que nos ofrezca la mquina ? b) Ser
4 5 5 4 6 2 2 2 3 6 4 4
este resul tado el mismo que el que hubiramos obtenido introduciendo p untua-
5 4 6 1 3 2 3 2 5 18 6 1
o 4 ciones directas en aritmtica y en gramtica?
8 3 --- 9 10
-- --- - -- JO. JO. Sean Xi, X 2 , . . , X. las puntuaciones directas obtenidas por II estudiantes
en la p rimera mitad de un examen de Estadistica, valiendo 4 la correspondiente
10.2. Calcular el coeficiente de correlacin de Pearson entre las variables X e Y, desvia cin tpica. Sean Y, , Y2 , , Y. las puntuaciones directas obtenidas por esos
a partir de los siguientes datos agrupados en intervalos. mismos estudiantes en la segunda mitad de dicho examen, va liendo 5 la correspon
diente desviacin tpica. Como notas finales en Estadstica aceptamos las siguientes:
3%1 + 2Y1 , 3X2 + 2Y2 , . , 3X. + 2Y. En este supuesto, cunto valdr la va-
a) 2-4 5.7 b) 6-9 10-13 e) 55-60 61-66 67-72 rianza de estas notas finales, a) si r,1 = O, b) si r,1 = 1, e) si ,,,. = -1 ?

4-6 4 10 13-17 3 o 94-100 1 2 6 10.11. Sean z 11 , z, 2 , . . . , z 1 las puntuaciones tpicas o btenidas por II estudiantes
1-3 4 2 8- 12 1 2 87-93 2 5 3 en Psicodiagnstico de nios y sean z 2 1 , z 22 , . . . , z 2 las pun tuaciones tpicas
3-7 o 4 80-86 6 4 1
obtenidas por esos mismos estudian tes en Psicodiagnstico de adultos. Como
nota fina l de Psicodiagnstico atribuimos a cada persona i la puntuacin
(zu + z 2 ,)/2. Demostrar que vale O la m edia de esas puntuaciones finales y que
18-20 21-23 24-26 27-29 vale ( 1 + r 12 )/2 la varianza de las mismas.
d) 62-66 67-71 72-76 e)
10.12. Sean X e Y dos variables tales que X = 40, Y = 15, s; = 25, r_
,,. = 0,125.
35.39 4 2 l 40--44 6 4 2 o
1 35.39 2 4 4 2 CV, = 10. Calcular la desviacin tpica de las puntuaciones W, = X, - Y; ,
30-34 l 3
25-29 l 4 3 30-34 o 3 6 6
10.13. Consideremos las puntuaciones X 1 , X2 , , x. e Y1 , Y2 , , Y. Intro-
20-24 o 1 4 25-29 o 1 3 7
duzcamos la n ueva variable V, = X; - Y, . Calcular el coeficiente de correlac in
de Pearson en tre X y V. y entre Y y V. en funcin des,, y s,. r,,,..
10.14. Calcula r el coeficien te de correlacin de Pearson introduciendo en la ecua-
10.3. D emostrar que la varia nza de V =X + Y es igual a la varianza de X ms
cin der.,. en puntuaciones directas, las puntuaciones dife renciales (1, - 1, O, - 3.
la varianza de Y, si r,y = O. 3) en X, y las p untuaciones tpicas (0.5, O, ~ 1,5, - 0,5, 1,5) en Y. Comprobar.
10.4. D emostrar que la varianza de V = X - Y es igual a la varianza de X ms adems, cmo ese resultado coincide con el obtenido median te I: z, z,/11, una vez
la varianza de Y, si,%, = O. transformadas en tpicas las puntuacion es diferen ciales en X.
10.5. Sean X e Y las medias de X,, X 2 , . , x. y de Y,, Y2 , , Y0 , respectiva-
10.15. Siendo z,, , z,,. . . . . z,. puntuaciones tpicas en X . y siendo Y1 , Y2, . Y.
mente. Form emos las nuevas puntuacion es X 1 Y, , X 2 Y2 , , X. Y . Supuesto esto,
demostrar que la media de estas nuevas puntuaciones es igual a XY si 'xr = O. . d. y I I: (}' - z )2
puntuaciones 1Tectas en , ca cular el valor de ' ' para r,,. = 1, r,,. = O.
10.6. ;Vale necesariamente 1 el coefi ciente de correlacin de Pearson entre X e Y n
si X = Y y s, = sy?
r,,, = - l. suponiendo que s,. = 2, Y = 6.
200 / Estadistica para Psiclogos

l0.16.Consideremos las puntuaciones X 1 , X 2 , . , x. e Y1 Y2 , . . Y. Sean


r,,. = 0,25. Calcular el coeficiente de correlacin de Pearson entre
s, = 4, s,. = 2.
X y V = X - Y.
11
l0.17. Sean W = X - V, I X 2 = 318, IX = 42. s,. = 3. n = 6. Calcu lar el Ecuaciones de regresin
valor de s~. cuando r,., = O y cuando r..- = 1.
10.18. Sabemos que el potencial excitatorio (E) se relaciona con la fuerza de h-
bito (H) y el drive (D) mediante la siguiente ecuacin: E = (H)(D). En un experi-
mento con cinco personas hemos obtenido E = 30, i5 = 6, ii = 5. Calcular el
coeficiente de correlacin de Pearson entre D y 1/.

11.1. Regresin y prediccin

Regresin equiva ldr a prediccin. La palabra regres1on se debe a Galton.


Estudiando la relacin en lre las caractersticas de los padres y las de sus hijos ob-
serv que a padres altos correspondan hijos altos, p ero que, en general, se acer-
caban ms a su media que los padres a la suya . Igualmen te, a padres bajos corres-
pondan hijos bajos, pero que, en general, se acercaban a su m edia ms que los
padres a la suya. Es decir, pareca darse cierta regresin hacia la media. Segn
este modo de pensar, los hijos seran ms iguales, ms h omogneos entre s que
lo eran sus padres. Pasamos por al to la discusin de esta interpretacin y nos limi-
tamos a constatar que el trmino regresin fue in troducido con ocasin de estos
estudios de Galton sobre la herencia y que hoy para nosotros equivale a predic-
cin, pronstico, estimacin. Es d ecir, ecuacin de regresin equivaldr a ecua-
cin de prediccin, de pronstico, de estimaci n.

11.2. Ecuacin de una recta en el plano

Es de la forma Y = a + bX, o sea, de primer grado en X y en Y. Las cons-


tantes a y b son propias de cada recta. Al variar a y/o b, vara la recta; y
al variar la recta, varan a y/o b. La constante a es llamada ordenada en el origen,
pues representa el valor de Y (ordena da) cuando X = O (es decir, cuando en el
eje de abscisas n os encontramos en el origen), La constan te b es llamada pen-
diente de la r ecta, y representa la inclinacin mayor o menor de la misma .
.f Veamos algunas ecuaciones de rectas y sus corr espondientes representaciones
grficas.
202 / Estadistica para Psiclogos Ecuaciones de regresin / 203

y y Las dos rectas anteriores tienen la misma ordenada en el origen (a = - J ),


es decir, cortan al eje O Y en el mismo punto (O, - 1). Tienen la misma pendien-
te, pero con distinto signo ( - 4 y 4 ).
Y= 2 + 3X
y y
y

X X
o

Para X= O, Y= 2; para X = 1, Y= 5. Por Para X = O, Y = - 1; para X = 1, Y = 2. y= JX


tanto, la recta pasar por los puntos cuyas Por tanto, la recta pasar por los puntos
coordenadas son: (0,2) y ( 1,5). cuyas coordenadas son: (O, - 1) y ( 1,2).
-'----9Ll.-'--'--'-....1....- X
Las dos rectas anterior es son paralelas. Coinciden en tener la misma pendien- I X O X
te (b = 3). Tienen distinta ordenada en el origen (2 y - 1), es decir, cortan al eje
O Y en distintos puntos.
y y
Las tres rectas anteriores tienen la m isma o rdenada en el origen (a = 0), es
decir, cortan al eje O Y en el mismo punto (O, O). En otras palabras, las tres carecen
de trmino independiente y pasan por el origen.
Y = 1+2X Y = l +SX

11.3. Ecuaciones de las rectas de regresin de Y sobre X


__._...,_..~_,__.___~~ X ~---~~~~~x
segn el criterio de mnimos cuadrados

Para X= O, Y = l; paraX = 1, Y = 3. Por Para X = O, Y = l; para X = 1, Y = 6 . Por Distinguiremos entre construccin y aplicacin. Comenzamos con la construc-
tanto, la recta pasar por los puntos cuyas tanto, la recta pasar por los puntos cuyas cin. Intentamos determinar una fun cin matemtica (una ecuacin) que nos
coordenadas son: (0,1 ) y ( t.3). coordenadas son (0, 1) y (1 ,6) . permita pronosticar la puntuacin de cada persona en una variable Y (cri terio ),
conocida su puntuacin en otra var iable X (variable predictora ). Entre todas las
Las dos rectas anteriores tienen la misma ordenada en el origen (a = 1), es funciones elegimos una m uy sencilla: la funcin lineal, la ecuacin de la lnea recta.
decir, corlan al eje O Y en el mismo punto (0, 1). Tienen distintas pendientes (2 y 5).
No son paralelas.
y {7 ,10)
y
10 - --- - - --- - ----- - - 1
X y Y, - Y', { 1

},,
Y = - l - 4X Y = -l + 4X
3
7 10 Y,
--'-++--'--'--'--'--'- X 10 8
X
o 1 2
4 9
_______0.:.l~i Y,
j Y',

Para X '.;. O, Y = - 1; para X = - 1, Y = 3. Para X = O, Y = - 1; para X = 1, Y = 3. ~ 5


Por t,mro. la recta pasar por los puntos Por tanto , la recta pasar por los puntos X,
cuyas coordenadas son: (0 ,- 1) y ( - 1,3). cuyas coordenadas son: ( 0,- 1) y (t.3).
204 / Estadistica para Psiclogos Ecuaciones de regresin / 205
Pues bien, deseamos construir una lnea recta tal que haga mnimo el error medio a) Expresada en puntuaciones directas
cometido en los pronsticos. Esta minimizacin del error la entendemos de la
siguiente manera. Comenzamos con la ecuacin
Supongamos un grupo de personas cuyas puntuaciones en X y en Y nos son
dadas. Por ejemplo, consideremos las cinco personas de la tabla anterior. Y'= A+ BX (l 1.1 )
En el grfico anterior llamemos Y/ a la ordenada del punto (sobre la recta r)
cuya abscisa es X,. En otras palabras, Y,' es la puntuacin pronosticada en Y me- Nuestro propos1to es determinar A y B, de modo que </J "" r (Y - Y')2 =
diante la rectar a la persona cuya puntuacin en X es X,. Es decir, Y, es la puntua- = r (Y - A - BX) 2 sea mnima. Segn se demuestra en Clculo, ello equivale
cin obtenida en Y e Y es la pronosticada. a resolver las dos ecuaciones
Es claro que con cada recca tendremos en nuestro caso cinco diferencias:
Y1 - Y{, Y2 - Y, Y3 - Y3, Y4 - Y, Y5 - Y5 o errores entre la puntuacin 8</ = O, o</J =o donde ?P. y
c</J
obtenida y la pronosticada. (En la figura adjunta tenemos las diferencias corres- oA cB cA ?B
pondientes a las dos primeras personas.) Si elevamos al cuadrado estos errores
y sumamos estos cuadrados, tendremos una suma de errores cuadrticos. Pues son las derivadas parciales de </J respecto a A y a B. Es decir,
bien, de todas las rectas posibles del plano pretendemos elegir aquella respecto
a la cual sea mnima dicha suma. En esto consiste la construccin de las rectas de a r (y - A - BX 2 = - 2 L ( y - A - BX ) = o
regresin de Y sobre X, segn el criterio de mnimos cuadrados. oA
En conclusin, la recta de regresin de Y sobre X es una recta tal que, en nues-
0 r (y - A - BX)2
tro ejemplo, haga mnima la suma: - 2!: (Y-A-BX)X=O
iJB

(Y, - r; 2 + (Y2 - Y) 2 + (Y3 - Y3)2 + (Y4 - Y1)2 + (Y5 - Y5)2 O, lo que es equivalente,

En general si tenemos n personas, intentamos construir una recta tal, que haga L ( Y - A - BX) = O, de donde, L Y= nA + B!: X ( 11.2)
mnima la expresin !: ( Y - A - BX )X = O, de donde, L XY = A L X + B !: X 2 ( 11.3)

Las ecuaciones (11.2) y (l 1.3) suelen ser llamadas normales . Ellas nos permi-
!: ( Y, - Y,') 2 donde i = 1, 2, ... , n.
ten despejar A y B. En efecto, dividiendo (1 1.2) por n nos queda

Ntese que para construir la recta de regresin necesitamos un grupo de per- Y= A+ BX ( 11.4 )
sonas cuyas puntuaciones en X y en Y conozcamos. En cambio, la aplicaremos de donde
a otras personas, semejantes a las anteriores, de las que slo conoceremos sus pun- A= Y- BX (11.5)
tuaciones en X. Supongamos que X es un test de aptitud para la Estadstica e Y el
aprovechamiento en la misma manifestado mediante un examen. Queremos cons- Multiplicando ( 11.4) por nX y restando de (11.3) nos queda,
truir una ecuacin que nos permita pronosticar del mejor modo posible el aprove-
chamiento, conocido el resultado en el test. Pues bien, para construir esa recta,
necesitamos unas personas cuyas puntuaciones en el test y en el examen nos sean !:XY- nXY = (A!:X + B!:X2 ) - (AnX + BnX2 ) =
conocidas. Una vez construida, la aplicaremos a otras personas, semejantes a = A(!: X - nX) + B(!: x i - nxi =
las anteriores, de las que slo conoceremos sus puntuaciones en el test de aptitud.
Dada la semejanza entre los dos grupos de personas, es de esperar que la recta
= O + B(!:X2 - nX2 )
de regresin que fue ptima en reducir los errores cuadrticos respecto al primer
Por tanto,
grupo, ser, tambin, razonablemente buena en reducir los errores cuadrticos
respecto al segundo.
Ex.J"llestas estas consideraciones previas, veamos cul es la recta de regresin B=!:XY-n~ ~ (1 1.6)
de Y sobre X. !: xi - n X2
Ecu aciones de regresin / 207
206 / Estadistica para Psiclogos
b) Expresada en puntuaciones diferencia/es
:EXY- n:EX ~ Comenzamos con la ecuacin
B = n n _ n :E XY - :E X :E y (11.7) (1 1.12 )
:E xi - n (r,/) i - n :E xi - (:E X)2 y'= a+ hx
2
Nuestro propsito es determinar a y b de modo que :E (y - y') = r. (y - a - bx )2
sea mnima. Segn un razonamiento an logo al seguido en el caso de puntuacio-
En resumen,
(11.S) nes directas, llegamos a las dos ecuaciones normales
A= Y- BX
(1 1.13)
:E y= na+ b :Ex
B = nr.XY - :EX:E Y (11.7) :E (y - a - bx) = O, de donde, 2
n :E X 2 - (:E X) 2 :E( y-a-bx )x=O, dedonde, :Exy =a :Ex +b :E x ( 11.14)

Teniendo en cuenta (11.1) y (11.5), Ahora bien, :Ex = :E y = O. Por consiguiente, las dos ecuaciones normales

Y' = A + BX = (Y - BX) + BX (11.8) quedan reducidas a


O= na + O, de donde, na = O, a= O
sta es la recta de regres1on de Y sobre X expresada en puntuaciones direc-
de donde , b = ~![2
tas, con B dada por (11.7)
De (11.8) se infieren inmediatamente las siguientes consecuencias:
:E xy = b :E x 2
, :E x

1) - :E Y ' - - :E X - - - - (11 .9) En conclusin,


Y '= - = (Y - BX) + B - = Y - BX + BX = Y (l 1.15)
n n a= O
Es decir, son iguales la media de las puntuaciones directas pronosticadas, Y', (1 1.lj
b=r, 0
x2
y la media de las puntuaciones directas obtenidas, Y.
(11.1 7)
= nrxysxs: =,. ~
2) s;, = B s; =
2 (teniendo en cuenta (11.8) y 6.3.4,a) 2
nsx
X)'
Sx

= [:E X Y - n X
L xi - n g2
Y] s 2
2
X
= (teniendo en cuenta 11.6) Ntese que

b = :E xy = :E (X - X)(Y - Y) = :E XY - n XY = B (11.18)
2
= [:E (X:E(X
- X)( Y -
- X)2
Y)] s: = [l:ns;xy]
2
x
2
2
Sx
= [n fxysxsr]
ns;
2
.2
s..
= r..2ys,.2 (11,10) r. x 2 :E (X - X) 2 L X 2 - 11 X

En otras palabras, la recta de regresin en puntuaciones directas y la recta de


Es decir, la varianza de las puntuaciones directas pronosticadas, es igual s;,, regresin en puntuaciones diferenciales tienen la misma pendiente, son paralelas.
o menor que la varianza de las puntuaciones directas obtenidas, pues 1. s;, r;y ::; Teniendo en cuenta (11.12) y (1 1. 15),
(11.19)
3) Sustituyendo X por X en (11.8), y '= bx

Y ' = (Y - BX) + BX = Y (11.11) sta es la recta de regresin de Y sobre X expresada en puntuaciones diferen-
" 1 1/;.\" 111 17 ).
208 / Estadistica para Psiclogos Ecu aciones de regresin / 209

1) En conclusin,
Y = ~ -= b~x = O (11.20)
n n a*= O (11.26)

Es decir, son iguales (valiendo ambas cero) la media de las puntuaciones di- b* = r,y (l 1.27)
ferenciales pronosticadas, y', y la media de las puntuaciones diferenciales obteni-
Teniendo en cuenta (11.23), (11.26) y (11.27),
das, y.
z;, = f x -, Zx (11.28)
2) s;, = b s; 2 (teniendo en cuenta (11.19) y 6.3.4 .a)

Esta es la recta de regresin de Y sobre X expresada en puntuaciones tp icas .


_
-
Z
rX)'
5_2 Sx2 (teniendo en cuenta (1 J.l 7)) De (11.28) se infieren inmediatamente las siguientes consecuencias :
Sr
1)

= r;, S:, (11.21) -,


z,. -- ~
n
-- rxy n
r =, -- o (11.29)

Es decir, llegamos al mismo resultado conseguido en (11.10).


Es decir, son iguales (valiendo ambas cero) la media de las puntuaciones tpi-
3) Sustituyendo x por x = O en (11.19), cas pronosticadas, z;,y la media de las puntuaciones tpicas obtenidas, z,.
y'= o (1 1.22)
2)
Es decir, la recta de regres1on de Y sobre X , en puntuaciones diferenciales, s;~ = r;},s;x (teniendo en cuenta (11.28) y 6.3.4a )
pasa por el origen (.x = O, y = 0), (Lo mismo sucede con la recta de regresin
de X sobre Y.)
~; = r;, (teniendo en cuenta 8,2 .b ) (11.30)

e) Expresada en puntuaciones tpicas Es decir, la varianza de las puntuaciones tpicas pronosticadas es igual o menor
que J. Esto significa que las puntuaciones z;.
no cumplen con una de las propie-
Comenzamos con la ecuacin dades esenciales de las puntuaciones tpicas, a saber, que su varianza vale nece-
sariamente J. Por esta razn, estas puntuaciones z;. deberan ser llamadas pseudo-
z; = a* + b*zx (11.23)
tpicas en vez de tpicas.

Nuestro propsito es determinar a y b* de modo que I: (z, - z;l2 = 3) Sus tituyendo : , por z, = O en ( 11.28),
= :!: (z, -a* - b*z,Y sea mnima. Segn un razonamiento anlogo al seguido
en el caso de puntuaciones directas llegamos a las dos ecuaciones normales z; = O
I: (z, - a* - b*zx) = O, de donde, I: z, = na* + b* I: Zx (11.24) O sea, la recta de regresin de Y sobre X, en puntuaciones pseudotpicas p asa
por el origen (z~ = O, :iy = O). (Lo mismo sucede con la recta de regresin de X
I: (z,, - a* - b*zx)Zx = O, de donde, I: ZxZy = a* I: Zx + b* I: z; (11.25) sobre Y.)
EJEMPLO 11.1. Comen zaremos in troduciendo un min iejemplo que ayude al lec-
Ahora bien , I: z, = I: zy = O, I: z; = n. Por consiguiente, las dos ecuaciones tor a comprender mejor la a plicacin de las frmulas anteriores. Despus, o fre-
normales quedan reducidas a ceremos otro ejemplo algo ms largo con unos datos ob tenidos en la vida real.
Supon gamos cinco personas con pun tuaciones en una variable predictora (X )
O = na* + O, de donde, na*= O, a * = O Y en un criterio ( Y), segn la tabla I l.l. (De acuerdo con la costumbre seguida
,!"
I: z,z,. = b*n, d e donde, b* = I: z, z,/n = r,, anteriormente, (X - X )= x, e (Y - f) = y .)
21 O / Estadstica para Ps,clogos
Ecuaciones de r egresin / 211
TABLA 11. l Por consiguien te,
X y X' r' xr X _1' x' r' xy -, =)' -x .. .r
y y _,
- y
y,' = 1,95 X , segn (11.19).
3 9 9 81 27 - 1 o 1 o o
- 0.5 o.o 0,00 7,05 - J ,95- 0.325
5 12 25 144 60 1 3 1 9 3 0,5 0,5 0,25 10,95 1,95 0,325 Aplicando esta ecuacin a los cinco puntos diferenciales en X (- 1, 1, O, 3, - 3),
4 o 16 o o o -9 o 81 o obtenemos la columna encabezada por y ' en la ta bla 12. l.
7 18 49 324 126 3 9 9 81 27
0,0
1,5
- 1,5
1,5
0,00 9,00
2,25 14,85
5,85
0,000
0,975 Ntese cmo :Ey = :Ey ' = O, o _v =Y= O.
6 1 36 6 -3 - 3 9 9 9 -1,5 - 0,5 0,75 3.15 - 5,85 -0,975
e) Recta de regresirn a partir d<' puntuaciones tpicas
20 45 100 585 219 o O 20 180 39 o.o o.o 3,25 45,00 0,00 0,000
Segn (11.27):
- 20 45 3,25 b* = 0,65
X= S = 4, f = - - = 9 s, = J205 = 2, s, = ~ = 6, r,,. =- - = 0,65 Segn (11.26):
5 ' 5
a* = O
Por consiguiente,
a) Recta de regresin a partir de puntuaciones directas
.,. = 0,65 ::, , segn (11.28 ).

Segn (11.7): Aplicando esta ecuacin a las cinco puntuaciones tpicas en X ( -0,5 ; 0,5; 0,0 ;
1,5; -1,5), obtenemos la columna encabezada por en la tabla 11.1. z;.
B = (5)(219) - (20)(45) = 195 = I
95 Ntese cmo :E z,. = :Ez;. = O, o, z,. = z;. = O.
(5)(100) - (20) 2 100 '
Segn (11.5): La representacin grfica de las tres rectas de regresin an teriores es la si-
guiente:
A = 9 - (1,95)(4 ) = 9 - 7,80 = 1,20
Por consiguiente,
y
Y= 1,20 + 1,95 X, segn (l 1.8).

Aplicando esta ecuacin a las cinco puntuaciones directas en X (3 , 5, 4, 7, 1),


o btenemos la columna encabezada por Y' en la tabla 11.l.
Ntese cmo :E Y = L Y'= 45, o, Y= Y' = 9.
,__t.., '1..-,.
b) Recta de regresin a partir de puntuaciones diferencia/es e1:a
-1<
... ,
Segn (11.16):

b =~= l 95
20 '
Segn (1 1.17):

b = O 65 ~ = 1 95
' 2 '
Seg.~ ( 11.1 5):
a =O X
212 / Estadistica para Psiclogos Ecuaciones de regresin / 213

EJEMPLO J 1.2. La tabla 11 .2 nos presenta las puntuaciones obtenidas por 22 l: XY = (2)(4,3) + (20 )(7,5 ) + + (16)(4,3 ) = 2.217,8
alumnos de Enseanza General Bsica de la ciudad de Oviedo en un tes! de ra.
= i/22)(5.972)~5O)' = 4 2843
zonamiento abstracto, X, y las notas alcanzadas por los mismos en rendimiento s, (22) 2 '
escolar, Y, a fin de curso (promedio de sus calificaciones en todas la s ma terias
cursadas). Los datos han sido ofrecidos por M . C. Garca Mndez. (22)(871 ,62) :_ (133,6)2
s). = (22)' = 1,6556

TABLA 11.2 (22)(2.217,8) - (350)( 133,6)


r,,. = -,=-:====:=:=::==;===c~~r:====.:======c=~ = 0,5918
j(22)(5.972) - (350)2 )(22)(871,62) - (133,6) 2
X y Y' y .. ,,
2 4,3 2,891 7 -3, 18 10 - 1,9214
20 7,5 7,0083 0,9356 0,5651 a) Recta de regresin a partir de puntuaciones directas
12 5,0 5,1787 -0,8940 - 0,5400
21 6,9 7,2370 1,1643 0,7032
Segn (11.7):
19 5,2 6,7796 0,7069 0,4270
17 4,4 6,3222 0,2495 0, 1507
14 6,3 5,6361 - 0.4366 -0,2637 B = (22)(2.217,8) - (350)033,6) = O
2287
13 5,6 5,4074 - 0,6653 - 0,4018 (22)(5.972) - (350) 2 '

21 8,7 7,2370 1,1643 0,7032 Segn (11.5):


19 7,6 6,7796 0,7069 0.4270 A= 6,0727 - (0,2287)( 15,909 1) = 2,4343
14 7,0 5,6361 -0,4366 - 0,2637
20 9,2 7,0083 0,9356 0,5651 Por consiguiente,
16 6,5 6,0935 0,0208 0,0126
17 6,3 6,3222 0,2495 0,1507
18 8,8 6,5508 0,4782 0,2888
Y,' = 2,4343 + 0,2287 X,
21 7,9 7,2370 1,1643 0,7032
11 5,0 4,9500 - 1,1227 -0,6781 Ntese cmo en la tabla 11.2 r: Y, = r: Y = 133,6
17 4,2 6,3222 0,2495 0,1507
16 4 ,1 6,0935 0,0208 0,0 126
13 5,2 5,4074 -0,6653 - 0,4018 b) Recta de regresin a partir de puntuaciones diferenciales
13 3,6 5,4074 - 0,6653 - 0,4018
16 4 ,3 0,208 0,0208 0,0126 Segn (11.1 8) :
b = B = 0,2287
350 133,6 133,5996 0,0002 0,0002 Segn (11.15):
a= O
Por consiguiente,

:!: X = 2 + 20 + + 16 = 350 y; = 0,2287 x,


350
X =
22 = 15,909 1 Ntese cmo en la Labia 11 .2 r: y = 0,0002 :o: 0,000 .

:!: Y = 4 ,3 + 7,5 + + 4,3 = 133,6 c) Recta de regresin a partir de puntuaciones tpicas

Y=!~~=60727 Segn (11.27):


22 ' b* = 0,5918
:!: X ' = (2) + (20) 2 + + (16 )2 = 5.972
2 Segn (11.26):
~:t
a* = O
:!: t 2 = (4 ,3)2 + (7,5) 2 + + (4,3)2 = 871,62
Ecuaciones de r egr esi n / 215
214 / Estadistica para Psiclogos

a) Expresada en puntua ciones directas


Por consiguiente,
Segn (11.32):
z;. = 0,5918 z, B = (5)(219) - (20)(45) = 195 = O 2 167
(5 )(585 ) - (45) 2 900 '
Ntese cmo en la tabla 11 .2 L z; = 0,0002 :,e 0,000. Segn (J 1.31 ):
A = 4 - (0,21 67)(9 ) = 2,0497

11.4. Ecuaciones de las rectas de regresin de X sobre Y, segn Por consiguiente,


el criterio de mnimos cuadrados
x = 2,0497 + 0,2167 Y,

Junto a las ecuaciones de regresin de Y sobre X, te nemos las ecuaciones de b) Expresada en puntuaciones diferenciales
regresin de X sobre Y. Mediante ellas intentamos pronosticar X a partir de Y.
Para ello nos valemos de una recta que haga mnima la expresin L (X, - X;2 . Segn (11.34 ) :
De acuerdo con un razonamiento anlogo al seguido en el caso de las rectas 39
b = -- = O 2 167
de regresin de Y sobre X, es fcil demostrar que ahora es: 180 '
Segn (1 1.33 ):
a=0
a) Expresada en puntuaciones directas Por consiguiente,
(1 1.31 )
A = X - BY x; = 0,2167 y,
B =nL YX - "!: Y LX (11.32)
e) Expresada en puntuaciones tpicas
2
n "!: Y 2 - (L Y)
Segn (11.3 7):
b* = 0,65
Segn ( 11.36):
b) Expresada en p11nt11aciones diferencia les
a= O
a=0 (11.33) Por consiguiente,

=~ = 0,65 z>'
b = LYX (1 1.34)
"!: y2 Las ecuaciones anteriores dan lugar a los siguientes valores pronosticados :

s, Puntuaciones directas pronosticadas : 4, 4,65, 2,05, 5,95, 3,35


b = r,r~
(11.35)
Puntuaciones diferenciales pronosticadas:
Puntuaciones pseudo tpicas pronosticadas:
0,65, - 1,95, 1,95, -0,65
O, 0,325, - 0,975, 0,975, -0,325

En adelante, h ablaremos slo de ecuaciones de regresin de Y sobre X. Con


c) Expresada en puntuaciones tpicas
ellas podemos resolver los problemas que se nos presenten . Basta con llamar X a
(11.36) la variable que har oficio de predic tora y lla mar Y a la que h ar o ficio de crite-
a = O
rio, es decir, a la que ser pronosticada a partir de la predic lora . Por ejemplo, si
(11.37)
b* = r,y intentamos pronosticar el peso a partir de la altura, llam ar emos X a la altura e
~!:" Y al peso. Pero si inte ntamos pronosticar la altura a partir del peso, llamaremos X
EJEMPLO 11.3 . Apliquemos estas ecu aciones a los datos del ejemplo J 1.1. al peso e Y a la a ltura.
216 / Estadistica para Psiclogos Ecuaciones de regresin / 217

11.5. Aplicacin de las rectas de regresin NotA l.


Las puntuaciones diferenciales y tpicas no son ms que las d irectas sometidas
Una vez construidas las rectas de regresin, las podemos aplicar a otras perso- a ciertas condiciones restrictivas. Por tanto, las relaciones vlidas entre las direc-
nas con tal que sean semejantes a aquellas con las que las hemos construido. En tas, sern, tambin, vlidas entre las diferenciales y tpicas, con tal que impon-
realidad, suponemos que tanto el grupo con el que hemos construido las rectas, gamos a las directas las restricciones requerid as.
como el grupo al que se las aplicamos no son ms que dos muestras de la misrna Ahora bien, introducir puntuaciones diferenciales equivale a imponer L x =
poblacin. = L y = .i = ji = O. Consiguientemente, (l 1.5) y (l 1.7) quedarn convertidas en
Sea X un test de aptitud y sea Y el aprovechamiento escolar o notas en el exa-
men de fin de curso. Supongamos que para las personas del grupo primero (me- =
(0)(0) = L xy
B n L xy -
diante las cuales construimos las rectas) X = 25, Y = 35, s. = 4, s,, = 6, r.,. = 0,80. A = O + (B)(O) = O y
n L x 2 - (0) 2 L x2
No olvidemos que de este primer grupo de personas conocemos sus puntuacio-
nes en X y en Y. A partir de estos datos tendremos las siguientes ecuaciones de que no son ms que (11.15) y (l l.J6), respectivamente.
A su vez, introducir J;>Untuaciones tpicas equivale a imponer L z. = L z,, =
regresin :
= z, = z,. = O, L z; = n, L z,z,, = nrX>.. Consiguien temen te, (11.5) y (ll.7) que-
darn convertidas en
Y' = 5 + (1,2) X (11.38)
L z z - (0)(0 )
y'= (l,2)x (11.39) A = O + (B)(O) = O y B
=
/l
.x >'
(n)(n ) - (o)2
= L Zxz,.
11
_
- 'x,
z,,. = (0,80) Zx (11.40)
que no son ms que (11. 26) y (11.27), respectivamente.
Un nuevo alumno (semejante a los primeros) hace el test de aptitud y obtiene
una puntuacin directa igual a 30. Qu puntuacin directa, diferencial y tpica NOTA 2.
le pronosticaremos como nota de fin de curso?
Aplicando (11.38), 5 + (l ,2)(30) = 5 + 36 = 41. Es decir, le pronosticaremos la Segn (11.1 2 ), (1 l.l 5) y (1 1.1 7)
puntuacin directa 41. y ' -- r,r ~ X
Para el pronstico de su puntuacin diferencial podemos seguir dos caminos: s,
1) Transformar su puntuacin directa pronosticada en diferencial. Es decir,
Dividiendo ambos miembros por s,, nos queda
Y' - Y' = Y' - Y = 41 - 35 = 6.
2) Obtener su puntuacin diferencial en X y aplicar (1 1.39) a esta puntuacin
diferencial. Es decir, x = X - X= 30 - 25 = 5; y'= (1 ,2)(5) = 6. Como se ve v' X
~ = rx) - = r;q=x
llegamos al mismo resultado que antes. S>, Sx

Para el pronstico de su puntuacin pseudotpica podemos seguir dos ca-


minos: Ahora bien, z;. = rx,zx, segn (11.28). Por tanto, z; = L. Esta igualdad nos
s,.
1) Transformar su puntuacin directa o diferencial pronosticada en pseudo- vuelve a recordar algo que ya conocamos, a saber, que z;. no es autntica puntua-
tpica. Es decir, ( Y' - Y)/s,. = y'/s,. = (41 - 35)/6 = 6/ 6 = l. cin tpica, por ser cociente entre una pun tuacin diferencial pronosticada (y ')
2) Obtener su pu!_ltuacin tpica en X f aplicar (11.40) a esta puntuacin tpica. y la desviacin tpica de las puntuaciones ob1enidas (s,.), Es decir, las puntuacio-
Es decir, Zx = (X - X )fsx = x/s, = (30 - 25)/ 4 = 5/4 = 1,25; z,. = (0,80)(1 ,25) = l . nes z;. son puntuaciones pseudo lpicas y no puntuaciones autnticamente tpicas.
Como se ve, llegamos al mismo resultado que antes.
Evidentemente, este nuevo alumno no pertenece al grupo primero mediante
el cual hemos calculado X, Y, s, , s,.. Sin embargo, podemos referir sus pun tua- 11.6. Resumen : Definiciones y frmulas
ciones directas a esas medias y desviaciones tpicas (para calcular sus puntuacio -
nes dif~renciales y tpicas) porque suponemos que pertenece a la misma po bla- Recta de regresin de Y sobre X : recta que nos permite hacer pronsticos en
cin:a la que perteneca el grupo primero. la variable Y a partir de las puntuaciones obtenidas en la variable X.
218 / Estadistica para Psiclogos Ecu aciones de regresin / 219

Ecuacin de la recta de regresin de Y sobre X : A.2. Funcin cuadrtica, Y' = a + bX + cX 2

a) Expresada en puntuaciones directas


De acuerdo con el pr incipio de mn imos cuadrados, d erivaremos rj) = I: ( Y -
= I: ( Y - a - hX - cX 2 ) 2 respecto a a, b y e, y an ulando estas den-
Y' )2
Y'= A+ BX
vadas, obtendremos las tres ecuaciones normales siguientes:
donde
i)q= - 2I:( Y-a - bX - cX 2 ) =0, de donde. I: Y = na+b l: X + c I: X 2
Y-
A=
B=n:EXY-I:X:EY
BX

i)q = - 2 :E ( Y -a-bX- cX 2 )X = O, de do nde, I: X Y=ll LX + b I: X 2 +c I: X'
n ; X 2 - (:E X) 2 i)b

b) Expresada en puntuaciones diferenciales oq>= - 2I:( Y- a -bX - cX 2 )X2 = 0, de donde, I:X2 Y= a:E X 2 + b I:X' + c I: X 4
Jc
y ' = a + bx
donde Despejando a, b y e en las tres ecuaciones anleriores, podemos determinar la
ecuacin Y' = a + bX + cX2
a= O EJEMPLO 11.4. Comenzamos con un miniejemplo que aclare la lctica a se-
guir. Luego propondremos otro extrado de la lileratura psicolgica.
b = LX.Y Construyamos la ecuacin cuadrtica Y' = a + bX + cX 2 a par tir de los
xz datos siguientes:
b -;:::: rX)'
31 TABLA 11.3
s,.
Funcin cuadrtica Funcin lineal
c) Expresada en punruaciones tpicas X Y x2 X' x XY X
2
Y I Y' ( Y- Y' ) (Y - }")2 }" (y - Y ') (Y - Y')2

z;, = a* + b*zx o o o o o (1 o 1 0,5 -0,5 0,25


8 8 64
11 11 121
donde
8 3 9
o 1 u o o o o 1 0,5 0,5 0,25 1 --
11 11 121
a* = O
b* = r,, 2 1 l 1 2 2 1 2,0 o.o O.O 1 !211 10 100
11 12 1
5 25
AP~NDICE 2 1 4 8 16 2 4 1 1,0 o.o o.o 1 1~
11
-
11 12 1

A.1. introduccin 198


3 4 5 9 17 4 6 1 4,0 o.o 0,50 o 121 =1,6364
1 4

Hasta ahora hemos presentado lneas de reg resin de la forma Y ' = a + bX,
es decir, en las que era lineal la relacin entre X e Y '. Existen, sin embargo, en Psico-
loga situaciones en las que no es el ms adecuado este tipo de funcin lineal. Vamos
ahora a presentar otras funciones no lineales de aplicacin en las investigaciones
psicolgi~s. En todos los casos siguientes nos valdremos del principio de mnimos
(1 )
(II )
+ Jb
4 - 4,
4 = 3a + 5b
(lll) 6 = 5a + 9b
+ 5,
+ 9c
+ 17e
l
Las tres ecuaciones norm a]Ps. sern :

M, ltiplicaodo (1) poc 3 y ,es~odo (111 ) d, (3 )(1), om


qued a: 6 = 7a - 2c.
Multiplicando (1) por 5, (ll ) por 3 y restando (3 )(II )
cuadra'6s. de (5 )(1), nos queda: 8 = ! la - 2c.
220 / Esradistica para Psiclogos Ecuaciones de regresin / 221

De aqu se deduce inmediatamente, a = O,ti, e = - 1,25. Sustituyendo estos Como se ve, es mucho mayor la suma de errores cuadrticos obtenida median-
valores de a y e en (1 ) deducimos b = 2,75. te la funcin lineal, que la obtenida mediante la funcin cuadrtica. sta se apro-
Por consiguiente, la ecuacin buscada es la siguiente: xima mejor que la funcin lineal a los cuatro puntos d ados. Esta a proximacin
puede ser observada en la figura de la pgina anterior.
Y' = 0,5 + 2,75 X - 1,25 xi EJEMPLO 11.5. Kitterle y Helson (1 972) llevaron a cabo un experimento par a
probar que el tiempo de reaccin ante un estmulo luminoso es funcin cuadr -
Sustituyendo en esta ecuacin los valores (0, O, 1, 2) de X , obtenemos los pro- tica del intervalo de tiempo transcurrido entre la aparicin de ese estm ulo y la
nsticos (0,5, 0,5, 2, 1). aparicin de otro estmulo perturbador, tambin luminoso. En la columna X de
La correspondiente suma de errores cuadrticos vale 0,50. {Vase tabla 11.3.) la tabla 11.4 tenemos, en centisegundos, el tiempo transcurrido en tre la aparicin
Calculemos ahora , para estos mismos datos, la ecuacin Y' = a + bX: del primer estmulo y la aparicin del estmulo perturbador ; en la columna Y se
.encuentran los tiempos de reaccin correspondientes.
b = (4)(4) - (3)(4) =~ a = 1
3 8
(4)(5) - (3)2 11 11 11
TABLA 11.4
---
_ 8 4 V
Cuudr1. Lineal
Por tanto. Y - - +- ... X y y y
11 11
2 17,3 17,4000 17,9182
Sustituyendo en esta ecuacin los valores (O, O, L 2) de X, obtenemos los pro- 4 17,7 17,6836 17,8564
nsticos (8/ 11 , 8/11, 12/ 11, 16/ 11 ). 6 17,9 17,8808 17 ,7945
La correspondiente suma de errores cuadrticos vale 1,6364. (Vase tabla 11.3.) 8 18,2 17,9916 17,7327
10 18,2 18,0160 17,6709
12 17,6 17,9540 17,6091
y 14 17,8 17,8056 17.5473
16 17,5 17,5708 17,4855
2 ~ - -- r---::;.....----=::::::------J----;-- -
18 17,3 17,2496 17 ,4236
20 16,9 16,8420 17,3618

110 176,4 176,3940 176,4000

El lector puede comprobar cmo:

r x 2 = J.540, r x 3 = 24_200, r X 4 = 405.328, rx Y = 1.930,20, r xi Y= 26.850


Las tres ecuaciones normales sern :

176,4 = 10 a + ! JO b + l.540 e
1.930,20 = 110 a + 1.540 b + 24.200 e
26 .850 = 1.540 a + 24.200 b + 405.328 e
De aq u se deduce,

ef X a = 17.03, b = 0,2066, e = -0,0108


222 / Estadistica para Psiclogos Ecuaciones de regresin / 223

Por consiguiente, la ecuacin cuadrtica buscada es la siguiente: TABLA 11.5


1
F . potencial F . lineal
2 X y logX log Y {log X)' llog X )IJog Y) y
Y '= 17,03 + 0,2066X - 0,0108 X Y'

1 0.2 0,0000 -0,6990 0,0000


2 l,5 0,3010 0.]76 1 0,0906
0.0530
0, 1935
1,5568
-3,28
2,83
Sustituyendo en esta ecuacin los valores (2, 4 , . .. , 20) de X, obtenemos 3 5.0 0,4771 0,6990 0,2276 0,3335 5.2718 8,94
los pronsticos (17,4000, 17,6836, . . . , 16,8420). (Vase tabla 11.4. ) 4 13,0 0,6021 1.11 39 0,3625 0,6707 12.5256 15,05
La correspondiente suma de errores cuadrticos, L ( Y - Y ')2, vale 0,2242 5 25,0 0,6990 1,3979 0,4886 0,9771 24,5088 21 , 16
como puede comprobar el lector a partir de la tabla 11.4. '
Calculemos ahora, para estos mismos datos, la ecuacin Y' = a + bX. l5 44,7 2,0792 2,6879 1,1 693 2,0343 44,0565 44,70

(5)(2,0343) - (2,0792)(2,6879)
b = (10)(1.930,20) - (110)(176,4) = - 00309 b = (5)( 1,1693) - (2,0792) 2 = 30082
(10)(1. 540) - (110)2 '
2,6879 2,0792
a = 17,64 - ( - 0,0309)(11) = 17,98 log o = - - - (3,0082) -
5 5
- = - 0,7133

Por tanto, a = antilog (-0.7 133 ) = 0, 1935

Y' = 17,98 - 0,0309 X


Por consiguien te, la ecuacin potencia l buscada es :

Sustituyendo en esta ecuacin los valores (2, 4, ... , 20) d e X, obtenemos Y' = (0, 1935) X 3 2
los pronsticos (17,9 182, 17,8564, .. . , 17,36 18). (Vase tabla 11.4.)
2
La correspondiente suma de errores cuadrticos, L (Y - Y' ) , vale 1,209, Sustituyendo en esta ecuacin los valores ( l. 2. 3, 4, 5) de X. obtenemos los
como puede comprobar el lector a partir de la tabla 11.4. pronsticos expuestos en la tabla 11.5 (O, 1935, 1,5568, .. . ).
Como se ve, es bastante mayor la suma de errores cuadrticos obtenida m e- La correspondiente sum a de errores cuadrticos, L ( Y - Y') 2 , vale 0,5435,
diante la funcin lineal que la obtenida mediante la funcin cuadrtica. sta se como puede comprobar el lector a p arti r de la tabla I 1.5.
aproxima mejor que la funcin lineal a los diez puntos dados. Calculemos ahora, p ara los datos d irectos en X y en Y, la ecuacin Y ' = a + bX.
De la tabla 11.5 se deduce:

LX = 15. LY = 44,7, LX 2 =55, IXY = l95,2

P or tanto,
A.3. Funcin potencial : Y'= ax
b = (5)( 195,2) - (15 )(44,7) =6 11 44,7 15
(5)(55) - (15) 2 '
a = -
5 - (6 ll ) -
' 5 = - 939
.
Es claro que, tomando logarit mos, la ecuac10n Y = ax
se transforma en
log Y = log a + b log X, ecuacin lineal en log X y log Y. Mediante esta lti- Consiguientemente,
ma ecuacin, podemos determinar log a, y b, siguiendo la tctica ad optada al tratar
de las rectas de regresin. Una vez calculado log a, basta con encontrar su anti- Y ' = -9,39 + 6,1 1 X
logaritmo, para determinar a.
ErnMl'LO 11 .6 . Calculemos a y b, en la ecuacin Y' = ax a partir de la tabla Sustituyendo en esta ecuacin los valores ( ! , 2, 3, 4, 5) de X, obtenemos los
pronsticos expuestos en la tabla 11.5 ( - 3,28, 2,83, .. . ).
siguiete:
224 / Estadistica para Psiclogos Ecuaciones de regresin / 225
2
La correspondiente suma de errores cuadrticos, :E (Y - Y') , vale 48,3510 (16)(6,5597) - (10,3155)(8,4607)
como puede comprobar el lector a partir de la tabla J 1.5. ' b = (16)(8,6290) - (10,3155)2 = 05585
Como se ve, es enormemente superior la suma de errores cuadr ticos o btenida
mediante la funcin lineal que la obtenida mediante la fun cin potencial. sta 8,4607 10,3155
loga = - - - {0,5585) - - - = 0,1687
se aproxima mucho mejor que la funcin lineal a los cinco puntos dados. 16 16
EJEMPLO 11.7. Amn (1972) estudi los valores atribuidos a 16 frases acerca
del divorcio, teniendo en cuenta el mtodo seguido en la evaluacin de las mismas. a = antilog (0, 1687) = 1,4747
A continuacin se exponen los valores atribuidos a dichas frases segn el m todo
de las comparaciones apareadas (decir cul de las dos frases de cada par favorece Por consiguien te, la ecuacin potencial buscada es :
ms al divorcio) y segn el mtodo de la estimacin de razones (decir cuntas ve-
ces favorece ms al divorcio una frase del par que la otra). La variable X repre- y= 1,4747 X5585
senta la estimacin de razones y la variable Y las comparaciones apareadas. Los
resultados obtenidos fueron los siguientes: Sustituyendo en esta ecuacin los valores (1, 1.44, . . . , 14,72) de X , obte-
nemos los pronsticos (1,4747, 1,8078, . . . , 6,62 19) expuestos en la tabla 11.6.
La correspondiente suma de errores cuadrticos, :E ( Y - Y' )2, vale 2,5071,
como puede comprobar el lector a par tir de la ta bla 11.6.
TABLA 11.6 Ca lculemos ahora, para los datos directos en X y en Y, la ecuacin
F. potencial F. lineal
X y y y Y' = a+ bX

1,00 1,00 1,4747 2,1985 De la tabla 11.6 se deduce :


1,44 1,71 1,8078 2,3336
1,68 2,09 1,9703 2,4073 :E X = 94,88, :E Y= 59,4, :E X 2 = 853,5168, :E XY = 44 1,5728
2,01 2,34 2,1779 2,5087
2,19 2,75 2,2848 2,5639
3,26 3,11 2,8532 2,8925 Por tan to,
3,89 3,66 3, 1491 3,0860
4,20 3,65 3,2869 3,1812 h = (1 6)(441,5728) - (94,88)(59,4) = O3071
4,96 3,76 3,6069 3,4146 (16)(853,5 168) - (94,88)' '
6,28 4 ,35 4,1149 3,8200
6,82 4 ,45 4,3090 3,9858
59 44 4
8,21 4,83 4 ,7793 4,4127 a =
16 ' 16
2
- (O 3071) ,SS = 1 8914
'
8,78 4,91 4,9619 4,5877
12,54 5,42 6,0548 5,7424
12,90 5,63 6,1513 5,8530 Consiguien temente,
14,72 5,74 6,6219 6,411 9
Y'= l,89 14 + 0,3071 X
94,88 59,40 59,6047 59,3998

Sustituyendo en esta ecuacin los valores (l, 1,44, . . . , 14,72) de X, obtene-


mos los pronsticos (2,1985, 2,3336, ... , 6,4119).
El lector puede comproba r cm o : La correspondiente suma de errores c uadrticos, :E ( Y - }" 2, vale 4,0844,
como puede comprobar el lector a partir de la tabla 11.6.
X: lag X = 10,3155, :E log Y= 8,4607 Como se ve, es superior la suma de errores cuadrticos obtenida mediante
--~. la funcin lineal, q ue la obtenida mediante la funcin potencial. sta se aproxi-
:E (lag X) 2 = 8,6290, r (lag X)(log Y) = 6,5597 ma mejor q ue la fun cin lineal a los 16 puntos dados.
Ecuaciones de regresin / 227
226 / Estadistica para Psiclogos
De la tabla 11. 7 se d educe :
A.4. Funcin exponencial; Y' = abx LX = 146,6, L Y= 95, L X2 = 6 .137,56, LX Y = 3.722,2.
Por tanto,
Es claro que, tomando logaritmos, la ecuac1on Y = obx se transforma en
= (5)(3.722,2) = =~-
log Y= log a + (log b) X, ecuacin lineal en X y log Y. Mediante esta ltima b - (146,6)(95 ) O 50934 146 6
a O50934 = 4 0662
ecuacin podemos determinar log a y log b, siguiendo la tctica adoptada al tra- (5)(6.1 37,56) - (146,6)2 ' ' 5 ' 5 '
tar de las rectas de regresin. Una vez calculados log a y log b, basta con encon- Consiguientemente,
trar sus antilogaritmos, para determinar a y b.
EJEMPLO 11.8. Los datos siguientes, propuestos por Ebbinghaus, estn to- Y' = 4,0662 + 0,50934 X
mados de Lewis (1960). La variable X representa el nmero de slabas sin sentido Sustituyendo en esta ecuacin los valores (1, 16,6 , 30, 44, 55) de X, obtenemos
que deben ser memorizadas. La variable Y representa el nmero de repeticiones los pronsticos expuestos en la tabla 11.7 (4,5755, . , .).
necesarias para memorizarlas. La correspondiente suma de errores cuadrticos, 1: (Y - Y')2 , vale 38,8519,
como puede comprobar el lector a partir de la tabla 11.7.
Como se ve, es mucho mayor la suma de errores cuadrticos obtenida median-
TABLA 11.7 te la funcin lineal que la obtenida mediante la funcin expon encial. sta se apro-
F. cxponenc. F. lineal xima mucho mejor que la funcin lineal a los cinco puntos dados.
X log Y Y' Y'
X y X' log Y

1,0 7 1,00 0,845 1 0,8451 7, 1267 4 ,5755 A.5. Funcin logartmica: Y' =a +b log X
17,9147 11,2505 12,5212
16,6 12 275,56 1,0792
36,1230 16,6532 19,3464 Como esta ecuacin es lineal en Y y en log X, segui remos la tctica adoptada
30,0 16 900,00 1,2041
60,7288 25,0869 26,4772
44,0 24 1.936,00 1,3802 al tratar de las rectas de regresin .
85,5965 34,6150 32,0799
55,0 36 3.025,00 1,5563 EIEMPW 11.9. Doce alumnos de la Universidad Complu tense de Madrid,

94,7323 95,0002 aceptando como criterio un estmulo luminoso, L, evaluaron la intensidad lu-
6.137 ,56 6,0649 201,2081
146,6 95 minosa de otros respecto a L. La variable X representa la intensidad luminosa,
medida en unidades arbitrarias. La var iable Y representa las estimaciones de di-
cha intensidad ofrecidas por los sujetos experimentales *.
(5)(201 ,2081) - (146,6)(6,0649) = 0, 012715 , b = antilog (0,0 12715) = 1,0297 TABLA 11.8
log b = (5)(6.137,56) - (146,6)2
F. logarit. F . lineal
6,0649 146,6
log a= - - - 0,012715 - - = 0,840176, a = antilog (0,8401 76) = 6,92 11 X y log X (log X)' (log X)(Y) Y' Y'
5 5
0,1 0,3 - 1,0000 1,0000 -0,3000 0,1517 11,2236
0,4 4 ,5 - 0,3979 0, 1583 -1 ,7906 5,4380 11 ,261 1
Por tanto, la ecuaci n exponencial buscada es:
9, 1 18,0 0,9590 0,9197 17,2620 17,3527 12,3495
18,2 19,7 1,2601 1,5879 24,8240 19 ,9958 13,4879
Y' = (6,9211 )(1,0297l 36,4 25,0 1,5611 2,4370 39,0275 22,6389 15,7647
145,5 26,0 2, 1629 4,6781 56,2354 27,9226 29.4132
Sustituyendo en esta ecuacin los valores (1, 16,6, 30, 44, 55) de X , obtenemos
los pronsticos expuestos en la tabla 11.7 (7, 1267, . . . ). 209,7 93,5 4 ,5452 10,78IO 135,2583 93,4997 93,5000
La correspondiente suma de errores cuadrticos, 1: ( Y - Y' )2, vale 4.1042,
como puede comprobar el lector a partir de la tabla 11.7 . (6)(135,2583 ) - (4,5452)(93,5) 93,5 4,5452
b =- - -- - = 87803 a =- -- 8,7803 - - = 8,9320
(6)(10,7810) - (4,5452) 2 ' ' 6 6
C_~ulemos ahora, para los datos directos en X y en Y, la ecuacin
Los datos han sido ofrecidos por L. Jez.
Y '= a+ bX
228 / Estadistica para Psiclogos Ecuaciones de regresin / 229

Por tanto, la ecuacin logartmica buscada es : tt.3. Sean X = 10, Y = 3X, s,. = 2sx. Esto supuesto , qu p untuacin directa
se podra pronosticar, mediante la recta de regresin de Y sobre X, a una persona
Y' = 8,9320 + 8,7803 log X con p untuacin directa igual a 5,

Sustituyendo en esta ecuacin los valores (0,1, 0,4, ... ) de X , obtenemos los a) si r,>' = 1, b) si r,>' = O, e) si r, ,. = - J?
pronsticos (0,1517, .. .) expuestos en la tabla 11.8.
11.4. Calcular la ecuacin de regresin de Y sobre X, en puntuaciones directas
La correspondiente suma de errores cuadrticos, r ( Y - Y')2, vale 10,6795,
y diferenciales, sabiendo q ue dicha recta debe hacer corresponder a X = 10,
como puede comprobar el lector a partir de la tabla 11.8.
Y ' = 25 y que X = 20 e Y = 45.
Calculemos ahora, para los datos directos en X y en Y, la ecuacin
11.5. Supongamos que la recta de regresin de Y sobre X hace corresponder
Y'= a + bX a las puntuaciones directas X 1 = 2 y X 2 = -1, las puntuaciones directas Y; = 2,2
e Y'2 = - 2,6, respectivamente. Supon iendo, adems, que X + Y = 12, calcu-
De la tabla 11.8 se deduce : lar cunto valen X e Y'.
11.6. Sabiendo que s, = 6, s, = 5 y s,.. = 3, calcular la recta de regresin de
l: X = 209,7, l: Y = 93,5, l: X 2 = 22.909,43, l: X Y = 5.217,1 7 Y sobre X, en puntuaciones diferenciales, suponiendo que es positiva la correla-
cin en tre X e Y.
Por consiguiente,
11.7. Suponiendo que X = 5, que Y= 10 y que y = 0,8x, calcular la ecuacin
b = (6)(5.217,17) - (209,7)(93,5) = O1251 93 5 209 7 de regresin de Y sobre X, en puntuaciones directas.
a= - O 1251 = 11 2111
(6)(22.909,43) - (209,7)2 ' '
6 ' 6 '

Consiguientemente,

Y '= 11,2111 + 0,1251 X

Sustituyendo en esta ecuacin los valores (0,1, 0,4, . . .) de X, obtenemos los


pronsticos (11 ,2236, ... ) expuestos en la tabla 11.8.
La correspondiente suma de errores cuadrticos, r (Y - Y')2, vale 332,4966,
como puede comprobar el lector a partir de la tabla 11.8.
Como se ve, es mucho mayor la suma de errores cuadrticos o btenida median-
te la funcin lineal que la obtenida mediante la funcin logartmica. sta se apro-
xima mucho mejor que la funcin lineal a los seis puntos dadqs.

EJERCICIOS

11.1. Calcular las ecuacio nes de regresin de Y sobre X y de X sobre Y, en pun-


tuaciones directas, diferenciales y (pseudo )tpicas, a partir de los d atos conteni-
dos en el ejercicio 10. 1 del captulo anterior.
11.2. A partir de los datos : X (2, 8, 14, 6, 1O) e Y (6, 1O, 22, - 2, 14 ), calcular las
pun~uciones directas ( Y' ), diferenciales (y') y pseudolpicas (z~) pronoslcadas
mediante las correspondientes rectas de regresin de Y sobre X.
El coef1c1ente de correlac,n de Pearson / 231

12 pues I. ( Y - Y')( l" - Y)


ejercicio 12.6.
.
Ah ora b1en, I, ( y - y )2
-
= O,

-- - . , que h emos d es1gna


n
.
segn se encargar de comproba r el lector en el

d o por s,2.. es el error cuad rat1


' co

El coeficiente de correlacin de Pearson, r x>'' medio, E:,. cometido al atribuir a cada persona, como puntuacin. la media Y.
y las rectas de regresin I. ( Y- Y') 2
A su vez, - -- .. , que designaremos por
n
es el cometido al atri- s;.., E;,
buir a cada persona la puntuacin Y' obtenida mediante la recta de regresin.
. , I.(Y ' - Y)2 '.E(Y- Y)2 I.(Y- Y') 1
Fmalmente, segun ( 12.1 ), - -- - ~ = -- -- -~ - - .. --- - - , que de-
n n n
signaremos por s;-,
no es ms que la diferencia entre el E;, cometido valindonos
de Y y el E;, cometido valindonos de Y' . En otras palabras, es aquella parte del
E;, que dejamos de cometer por el hecho de atribuir Y' a cada persona en vez de
atribuirle Y.
12.1. r;r como ndice de reduccin de error en los pronsticos Por consiguiente,
5: __ sL_ _ parte de E;, eliminada
Vamos a considerar, en concreto, la recta de regresin de Y sobre X. Algo
anlogo valdr para la recta de regresin de X sobre Y.
s; - s;. + s;. - parte de E;, eliminada + parte de E;, no eliminada
= proporci n de E;, eliminado
o, de otro mod o, proporcin en que reducimos el E;, primitivo, el que co-
Y,
y
metamos valindonos de Y. Si, por ejemplo, ese cociente fuera igual a 0,65,

'}
1
Y, - Y,
'
Y'
ello significara que habamos reducid o el E;, en un 65 por 100, es decir, que,
valindonos de Y', slo cometeramos un 35 por 100 del que habramos co-
metido valindonos de Y.
Y, - y 1
1r]! -
Pero,

xy) s.2 2
Y ', - y

y
5:
s;
I, y 2 /n
s;
2
b I, x /n
- - 2- -
.s,.
2
_ b s;
--2
2

.s,,,
(
I,

= L Xs2
2

y
2

=
es;
:::1:)
2
Sx
2
s,

-- ~ - -- ( ~ ) : .- . 2 (12.2)
X s~ s; SXS}'
rX)'

Por tanto, r;,. no es ms que la proporcwn en que ha sido reducido el error


cuadr tico primitivo, el que habramos cometido si nos hubiramos valido de
Y como puntuacin pronosticada .
Sea Y, la puntuacin directa obtenida por la persona i e r; la puntuac1on
En conclusin,
directa pronosticada a esa misma persona, mediante la recta de regresin de Y
sobre X. El error cuadrtico cometido en ese pronstico individual valdr
(r, - Y/) 2 y I, ( Y, - Y/) 2 ser la suma de errores cuadrticos respecto a todas 2 --
YX)' 5: - 5- ~-~ - - ~
2 - - 2 - (12.3)
las personas de la muestra. Por otra parte, la suma I. ( Y - Y )2 queda descompuesta s,. s,. s;.
en dos sumas de trminos cuadrticos. l:.n efecto,
!' Consideremos los dos casos extremos posibles: s; . = O (equivalen te a s;. = s;)
r.1i - r) 2 = I.[tY - n+tY' - Y)J 2 = rtr- n 2 +r.1r- >')2 r12. 1) Y s;.= O (equivalente as;. , = s; ).
232 / Estadistica para Psiclogos El coef1CJente de correl acin de Pearson / 233

El primero nos indica que, valindonos de la recta de regresin , hemos eli- Como ejercicios (ta mbin se encuentran propuestos al final del captulo ), el
minado o reducido por completo el E;
primitivo, el que ha bramo s cometido lec tor se encargar de proba r que
atribuyendo Y, como puntuacin en Y, a cada una de las personas d e la muestra.
Ahora bien, s s;.,
= O, entonces, segn (12.3), r;,
= l; luego a reduccin total L y2 = :E (y _ y 2 + L y 2 112.7)
del E;, corresponde r;>
. = J. Recprocamente, si r;y = l , entonces, segn (1 2.3 ), L z; = L (z,. - z;J2 + L :;2
s;., r;,
= O; luego a = 1, corresponde reduccin total del pri mitivo . E; (12. 8 )
El segundo caso extremo nos indica que, valindonos de la recta de regresin,
EJEMPLO 12. 1. Comprobemos las rela ciones aca badas de exponer , recordan-
no hemos reducido en nada el E;
que cometamos atribuyendo Y, como pun tua -
do la tabla 11.l del ejemplo 11. 1. Valindonos de esta ta bla for memos la siguiente :
cin en Y, a cada una de las personas de la muestra. Ahora bien, si = O, en- s;-
tonces, segn (12.3), r;,
= O; luego a reduccin nula del E;
pr imitivo , correspo n-
de ,;,. = O. Recprocamente, si r;>. = O, entonces, segn (1 2.3), = O; luego a s;, (Y - f)' 1 ., 1 y ty - y) --
..- i", -,,,' f )" ...
, ;>, = O, corresponde reduccin nula del E;, primitivo.
t) -
J :, 'y - y 1' -
-= I r - l 1 1, - 1 l ,'
En conclusin, 0 .00 7,05 - 1.95 - o.ns 1.95 0 .3~ ~ .l 8025 o JCJ St.:'S J ~02'.'i
a ,;>, = 1, corresponde reduccin total del E;, primi tivo y recproca mente.
8)
0 .25
2,2l
I 0.9S 1.95 0.325 IOS O t7S 1 1025 O.Ol06JS i im2~
1 o 1056:.\
!J HJ562,

I"""""'"
9 .00 0.00 0.000 - uoo
a r;,. = O, corresponde reduccin nula del E; primitivo y recprocamente. SI
9
2.25
o.is
14.85
J .l S
5.8 5
- 5.8 5
0.975
-0.975
- 9.00
.ll S
l.i l
0.5 25
0.4 7S
8 1.0000
9 9)2~
k.i 22 5
21 50000
02 15fr2)
0.225&'!!
OIIOIKI
14 :!.:'.:'~
l -1,! 225
O Q50t, 2'i
O.'lSOb.:' 5
180 .\.00 4 5.00 O 00 0 000 0 .00 "000 JO l <J<.tJ< I 2 ~X i ~Ol 7t,IJSOO 2 112 ~00
El valor s )' .x sue le ser llamado error tpico de estimacin . 1

Teniendo en cuenta ( 12.3 ), nos queda


s;., = s;(l - r;>.) (12.4) Comprobacin de (12.1 ):
Ntese que para ,,,. = 0,20, hemos reducido el E;,
primitivo en un 4 po r 100
2 L (Y - Y')
2
+ :E ( Y' - Y) 2 = 103,95 + 76.05 =I P)2
(0,202 = 0,04) ; y parar,,, = 0,50, lo hemos reducido en un 25 por 100 (0,50 = 0,25). 180 (Y -
2
En cambio, para r,,. = 0,65, lo hemos reducido en un 42 por 100 (0,65 = 0,42);
2 Comprobacin de (12.7):
y p ara rx, = 0,95, lo hemos reducido en un 90 por 100 (0,95 = 0,90). E s d ecir,
la diferencia en la proporcin de E;,
reducido es mayor (0,90 - 0,42 = 0,48) en
:E (y - y') 2 + r y' 1 = 103,95 + 76,05 = 180 = :E y 2
el segundo caso que en el primero (0,25 - 0,04 = 0,21 ), a pesa r de que en ambos
la diferencia entre las correspondientes correlaciones es la misma (0,95 - 0,65 =
= 0,50 - 0,20). En otras palabras, el paso de 0,20 a 0,50 no significa lo m ismo Segn vim os en el ejemplo l 1.1 , r;,. = (0,65) 2 "' 0,4225.
que el paso de O,5 a 0,95, en cuanto a reduccin de E;,. 2 Comprobacin d e (1 2.2) :
De acuerdo con (12.2 ) vemos que, definiendo rx, como 2L, llegam os a r; ,.= ~-
sxs}. S>,
2 s1.s2 = (76,05)/(5) = O 4225 = r2
Recprocamente , vemos que , definiendo r; >. como ~. llegam os a rx, = !9_. y y (180)/(5) ' X}

Sy s,.s,,
La de finici n de r;,. como Comprobac in de (12.3) :
s_r _ :E ( Y' - Y)2 ( 12.5 )
s; - :E ( Y - Y)2 1 - s; x/s; =1 (1 03,95 )/ (5) = _ 0,5775 = 0,4225 "'
(180)/ (5)
1
-:r
:E (Y - Y' ) 2
= l - ---'--,..C. (12.6)
:E ( Y - Y)2
tiene la ventaja de su paralelismo con la de fini cin de o tros coeficientes de corre- _ " En el captulo an tcrjor, en (l 1.30) hemos visto que r~1 = s;,, . Ahora vemos comprobada esta
lacin como ndices de re duccin de error. Unos diferirn de otros en diversos igualdad. En efecto,
aspe,ctl s accidentales, pero todos ellos c oincidirn en ser ndices de reducci n
de error.
1
, ., =
2. 1125
O, 4225 = - - = l:
5
.,
,,,, ,
= -';
El coeficiente de corre/ac,n de Pearson / 235
234 / Estadstica para Psiclogos

A pesar de lo acabado de exponer, si todos los puntos se encuentran sobre una


Comprobacin de (12.4): recta paralela al eje OX, r.,.
= O. Vea el lector lo dicho sobre este caso particular
3 95 en la NOTA del prrafo anterior.
2
S,,2
(1 - r X)'
2 ) = ISO
5 (1 - O' 4225) = (36)(0' 5775) = 20' 79 = J0 5, = Sy.x

Comprobacin de (12.8):
12.3. r;rcomo proporc1on de la varianza
de Y asociada a la variacin de X
:E (z,. - z;.)2 + :E z;.2 = 2,8875 + 2,1125 = 5 = }.: :;
La relacin Y= Y ' + {Y - Y') es una pura identidad que p uede ser inter-
NoTA. A pesar de Jo expuesto, es posible que = O, valiendo r;,.
= O. s;., pretada aceptando que la p untuacin directa obtenida es igual al pronstico ( }" )
Esto sucedera si todos los puntos estuvieran situados sobre la recta de regresin ms el error en dicho pronstico {Y - Y').
y sta fuera paralela al eje OX. Ciertamente, s;.x
= O. Adems, .s; = O. Por tan- Sabemos que Y' = a + bX. Esto nos indica que Y' depende, es funcin de,
to, s;.= O - O = O. Consiguientemente, ,;,. = s;,/s;
= OJO, quedara indetermi- est asociada a, X. Ms concretamen te, dado que a y b son dos constantes, valdr
nado. Sin embargo, tiene sentido admitir rx,. = O, ya que en esta situacin, tanto 1 el coeficiente de correlacin de Pearson entre X e Y' (es decir, entre X y a + bX).
a puntuaciones altas como medias y bajas en X, corresponde una misma puntua- segn lo dicho en 10.2.3. b. Puesto que Y' = u + bX, si suponemos que r., es po-
cin, Y, en Y y, por tanto, la covariacin entre X e Y es nula . sitiva, a puntuacin baja en X, corresponder pronstico bajo en Y ; a puntuacin
media en X, corresponder pronstico medio en Y; a puntuacin alta en X, co-
rresponder pronstico alto en Y. Adems, siempre y slo cuando hay variacin
12.2. r;,.como ndice de aproximacin de los puntos en la variable predictora X, la habr en el pronstico Y'. Todas las personas que
a la recta de regresin no difieran en X, tampoco diferirn en Y '. A su vez, todas las personas que difieran
en X, diferirn, tambin, en Y' .
Por el contrario, Y - Y' no depende, no es fun cin de, no est asociado a,
Hemos visto en el prrafo anterior que r;,.
= l - :E ( Y - Y' ) / }.; ( Y - Y)2. 1
X. De hecho, rx,,-,. = O. A puntuacin baja en X , puede corresponder error
De aqu se deduce inmediatamente lo siguiente: bajo, medio o alto en Y. A puntuacin media en X , puede corresponder error bajo,
a) Si todos los puntos (representantes de las puntuaciones obtenidas) se en- medio o alto en Y . A puntuacin alta en X, puede corresponder error bajo, medio
cuentran sobre la recta de regresin de Y sobre X, entonces, Y = Y' para 2toda o alto en Y. Como se ve en la figura adjunta, ta nto entre las perso nas con X = X,
persona de la muestra. Por tanto, Y - Y' = O. Consiguientemente, :E ( Y - Y') = O. (puntuacin baja en X), como entre las personas con X= X 2 (puntuacin media
Es decir, r;,r;,.
= l. en X), como entre las personas con X = X 3 (puntuacin alta en X) , a unas les
b) Si = 1, entonces, :E (Y - Y')2 = O. Ahora bien, como los sumandos n corresponden errores grandes (a las que se alejen bastante de la recta de regresin ),
son no negativos (por ser cuadrticos), si su suma es cero, quiere decir que cada a otras medios (a las que se alejan moderadamente de la misma), y a otras peque-
uno de ellos tiene que valer cero. Por consiguiente, Y - Y' = O, es decir, Y = Y', os (a las que se alejan muy poco de dicha recta).
para toda persona de la muestra. En otras palabras, todos los puntos se encuen-
tran sobre la recta de regresin de Y sobre X.
En conclusin:
Si todos los puntos se encuentran sobre la recta de regres10n, = 1. r;,.
Si r;,,
= 1. todos los puntos se encuentran sobre la recta de regresin.
Por consiguien te, r;,
nos mide la aproximacin de los puntos a la recta de re-
gresin. Ntese, por tanto, que lo que mide r,,. es la aproximacin de los pun tos Y' = j
a una lnea recia. Es posible que todos los puntos se encuentren exactamente sobre
una lnea curva, que exista una relacin funcional (no lineal) perfecta entre X e Y
que n,s permita pronosticar un valor exacto de Y para cada valor dado de X, y
que (,,. valga cero. Recurdese a este respecto el ejemplo propuesto en el aparta-
X=X, X = X, X = X,
do 10.4.
236 / Estadstica para Ps,clogos El coef,c,ente de correlac,n de Pearson / 237

Por otra parte, hay variacin en los errores, cuando no la hay en la varia ble ticular, salud, motivacin, tiempo dedicable al estudio) que hacen diferenciarse
predictora, X. Es decir, a las personas con una misma puntuacin en X, les co- sistemticamen te a los estudiantes en el rendimiento escolar, pero no en el test
rresponden, en general, distintos errores en los pronsticos (a unas, pequeos; de aptitud. No por poseerlos en alto grado se obtendrn sistemticamente pun-
a otras, medios; y a otras, altos). tuaciones altas en el test de aptitud , ni por poseerlos en bajo grado se obtendrn
Sabemos, adems. que necesariamente puntuaciones bajas. Naturalmente, a nosotros nos in teresa en-
contrar tests cuya correlacin con el xito escolar sea muy grande, es decir, que
i:; (y _ Y)2 i:; ( y _ yi i:; (y _ Y')2 sea muy grande la proporcin de varianza del xito escolar que se encuentre aso-
~ -- = n
+- - n ciada a la variacin en los tests predictores.
n

s; = s2y + s;.:x NOTA l. Dado que s; = s;.- + s;.x, necesariamente _s;. 5 s;. Por otra parte,
2

En otras palabras, la varianza total de Y (s;) se descompone en dos parles adi- ,;, = ~- Consiguientemente,
s,,
r;, :,; l . De donde, - 1 :,; rx,. :,; l. As vemos com-
tivas. Una, s;., asociada a, dependiente de, explicada por, la variacin de X, ya probada de otro modo la propiedad -1 :,; ,.,. :,; l.
que Y ' estaba asociada a, dependa de, era explicada por, la variacin de X . Otra,
s;..,, no asociada a, no dependiente de, no explicada por, la variacin de X, ya NOTA 2. Ntese que s,. = Js;, + s;., j s,.. + s,.x Es decir, la desviacin
que ( Y - Y') no estaba asociada a, no dependa de, no era explicada por, la va- tpica total de Y no es la suma de dos desviaciones tpicas, una asociada y otra no
riacin de X. asociada. De aqu que no podamos decir que 'xy es la proporcin de desviaci n
Por estas razones, llamaremos a s;, varianza asociada, y a s;..x la llamaremos tpica asociada a la variacin de X.
varianza no asociada. NOTA 3. Es claro que la correlacin entre puntuaciones obtenidas (y) y pun-
s2 s2 si
Ahora bien, sabemos que r;, = 1
s,,
Pero, 1 = 2 2 ,
s, s, + s,..x
dentro de este con- tuaciones pronosticadas (y' ) indicar la precisin del pron stico. ste ser tanto
ms preciso, cuanto mayor sea dicha correlacin. Ahora bien,,,,. = :E yy'fns,s,.. =
texto, no es ms que la proporcin de varianza asociada (cociente entre la varianza = :Ey bxfns,lblsx = l:E xyl/nsxs,. = lrx,-1- Por tanto, lrx,-1aparece claramente como
asociada y la varianza total de Y). Por tanto, r;,
representar esa proporcin de va- ndice de precisin en el pronstico.
rianza asociada. Si, por ejemplo, ,.,. = 0,70, diremos que 0,49 es la proporcin de 2 2

varianza asociada y que 0,51 es la proporcin de varianza no asociada. De otro NOTA 4. La definicin r;, = ~s,. =
1 - ~ nos puede ayudar a comprender
s,,
modo, diremos que el 49 por 100 de las diferencias individuales en Y est asocia- cmo la variabilidad de las puntuaciones en dos variables correlacionadas influ-
do, depende de, es explicado por, es atribuible a, las diferencias individuales en X
ye en el valor del coeficiente de correlacin de Pearson entre dichas variables.
y que el 51 por 100 restante no est asociado a, no depende de, no es explicado por,
Consideremos el grupo siguiente, compuesto de diez observaciones y dividid o
no es atribuible a, las diferencias individuales en la variable predictora, X. en dos subgrupos, cada uno de ellos compuesto de cinco observaciones.
La idea de r;,
como proporcin de varianza asociada puede quedar aclarada
as. Sea X un test de aptitud y sea Y el rendimiento a fin de curso. Este rendimien-
to depende de varios factores. Quien los posee en alto grado, obtiene puntuacio- y
X subgrupo 1. 0
nes altas a fin de curso, quien los posee en bajo grado, obtiene puntuaciones bajas - -

l
a /in de curso. De estos factores, unos son tales que quien los posee en alto gra- 1 12,80
do, obtiene, tambin, puntuaciones altas en el test de aptitud y quien los posee en 3 2
5 )'.X = - 5 - = 2,56, S2 = ~ = 4
y 5
bajo grado, obtiene, tambin, puntuaciones bajas en dicho test. En cambio, exis- Subg. 1.0 5
ten otros factores tales que quien los posee en alto grado (y obtiene altas puntua- 4 2 56
ciones a fin de curso), obtiene bien puntuaciones altas, bien medias, bien bajas 7
,2
X)
= t _ 4 = 1 - 0,64 = 0, 36
en el test de aptitud ; sucediendo algo parecido con los que los poseen en bajo grado. Grupo total ~ subgrupo 2.0
Por consiguiente, la varianza total del rendimiento escolar (es decir, la diferen- 11

!"
ciacin de los alumnos en buenos y malos a fin de curso) queda descompuesta en 12 9
dos partes: una debida a los primeros factores (varianza asociada) y otra debida Subg. 2.0 14 7 s2
y.x
= 12,80
5
= 2,56, s; = 520 =4
a 1os segundos (varianza no asociada). La primera es debida a unos factores que 16 13
hacen v;friar, diferenciarse sistemticamente, a los estudiantes en el test de aptitud 15 10 2 56
y en l rendimiento escolar. La segunda es debida a otros factores (profeso r par-
,2
.,. = l _ ,4 = 1 - 0,64 = 0,36
238 / Esradisuca para Psiclogos
El coeftCtente de correlacin de Pea rson / 239

~r~o t~al 12.4 . Resumen: Definiciones y frmulas

2 25,6 130
S,,
.X = ~
10 = 2' 56 '
2
\ ,. 13
10
L Y - Y)2
,.2 = 2,56
1 - 0,197 = 0,803
s; 11
error cuadrtico medio cometido al atribuir a cada perso-
na, como puntuacin, la media l'. (Bajo otro pun to de vis-
,'Y
13 ta, varianza total de Y.)
2
2 !: (-y-- - Y'l- error cuad rat1co
me d 10
. que aun cometemos a1 a tn' b mr
. a ca d a
5 .x -

,. n persona la p un tuacin Y. (Bajo otro punto de vista, varianza


l
1 1 1 1 :
y de Y no asociada a la variacin de X.)
1
! 1 1 1 1 v ! 2
1 1 1
! ! /'T i -',
2
= -L -
( Y '--
- Y)
- error cuad r l!co
med'10 que deJarnos
. d e cometer a 1 atn'b u1r
.
i 1
)
1
__....,, 1 n a cad a persona la puntuacin Y '. (Bajo otro punto de vista,
~
1 i .... ' 1 1 i varianza de Y asociada a la variacin de X.)
i 1 ' V! 1 1 1 1
s; = s;.x + s;.
l ..,....,.,, 1 I
1
1 ' i 1 1
7
) i l v 1
1
: 1
'
1 Y'= 1 + 0.60 X 2 = 2'=
f XJ 2
2
] -1"
2
2

i 1 v : i '
1 i 1 1 1 s,. s,.
5
l
1 1 , 1 :Y. 1
1 1
1
1
1
1
1 1
1
1 1
' ;
l
1 1 ! ./' 1 1
i 1 1
1 1 1 l
7. V, i 1
1
'
1
l ! i 1
'
1
l i 1
EJERCICIOS
!
J : l 1
1
1 1 ! 1 1 1 : i 1
...... ! T l 1 : : 1 1 1 1
2 3 4 5 6 7 8 9 JO 11 12 13 14 15 16 17 18 19 20 12. 1. Sean b,., y bxy las pendien tes de la recta de regresin de Y sobre X y de X
Grupo l. Grupo 2.0 sobre Y, respectivamente. Demostrar que (b,., )(b,,.) = r;,..
12.2. Demostrar que el coeficiente de correlacin de Pearson (al cuadrado) vale
1 entre las puntuaciones obtenidas en la variable predictora y las puntuaciones
La recta dibujada es de regresin (de Y sobre X ) tanto para cada uno de los d os
subgrupos. corno para el grupo total. La situacin acabada de exponer es artificial,
pronosticad as en el criterio. En otras palabras, demuestre que = l. r;,..
pero bas tante de acu erdo con lo que suele suceder en la realidad. El error cuadr- 12.3. Demostrar que el coeficiente de correlacin de Pearson vale O entre las
tico medio cometido en los pronsticos mediante dicha recta, es el mismo (2,56) puntuaciones obtenidas en la variable prcdictora y los errores cometidos en los
en cada uno de los dos subgrupos y en el grupo to tal. En lo que difieren ambos pronsticos. En otras palabras, d emostrar que r,t,- ,-, = O.
subgrupos es en la variabilidad o dispersin . M ientras q ue = 4 en cada uno s;
de los dos subgrupos, s;
= 13 en el grupo total. Ello hace q ue = 2,56/4 = 0,64 s;.xfs; 12.4. Demostrar que el coeficiente de correlacin de Pcarson vale O en tre las
(para cada subgrupo) sea mayor que s;.xfs;
= 2,56/ 13 = O, 197 (para el grupo total). puntuaciones prono'sticadas en el criterio y los errores cometidos en los prons-
ticos. En otras palabras, demostrar que r,..1,.. ,, = O.
Consiguientemente, r;,.
= 1 - 0,64 = 0,36 (para cada subgrupo) ser menor que
r;,.= 1 - O, 197 = 0,803 (para el grupo total). 12.5. D emostra r que Y - Y' =y - y '.
12.6. D emostrar que I: ( Y - Y ' )( Y' - Y) = O.
12.7. Si y ' = (- 0,25)x, r ,,. tiene que ser negativa. S ( ). No ( ).
12.8. Si en un grupo es y' = 0,30x, y en otro grupo es y ' = 0,20x , r,,, valdr ne-
f'
cesaria mente ms en el pri mer grupo que en el segundo. S ( ). No ( ).
240 / Estadistica para Psiclogos El coeficiente de correlacin de Pearso n / 241

12.9. Sabiendo que vale 5,76 el error cuadrtico medio cometido al pronosti- que X = 4 y que s,.
= 2. En este supuesto, poner las puntuaciones directas que
car las puntuaciones tpicas en un criterio, Y , a partir de las puntuaciones tpicas faltan en el cuadro adjunto.
en un test predictor, X, calcular la desviacin tpica de Y, teniendo en cuenta el
cuadro adjunto.
X y
- - -
6
X y \ 10
- - -
- 1
4,8 j - 5 4
8
-3
l
o
12.15. Sea X un test de habilidad manuiJ e Y la habilidad manual manifestada
en un oficio determinado. Sea 12,96 la parte de la varianza de los operarios en Y
que no est asociada a su variacin en X. Calcular rx,. teniendo en cuenta el cuadro
adjunto y sabiendo que :I: xy = 96. (Suponemos que las cinco puntuaciones di-
12.10. Demostrar que :I: Xy' = :I: Yx' = :E X 'y = :E Y 'x = nrx,sxsy.
ferenciales en X son valores enteros. )
12.11 . Demostrar que :I: Xx' = I: X'x' = I: X'.~ = nr;ysi .
12.12. Demostrar que I: Yy' = :I: Y'y' = :I: Y'y = nr;ys;.
x' y'
12.13. Supongamos:
a) X es un test de inteligencia numrica e Y un examen de aritmtica.
36
b) Sx = 4, S1 = 8. 4 - 2,4
c) Valindonos de Y ' (puntuaciones pronosticadas mediante la recta de re-
gresin de Y sobre X) reducimos en un 56,25 por 100 el error cuadrti- 7,2
co medio que habramos cometido valindonos de Y.
Bajo estas condiciones, poner los valores que faltan en el cuadro siguiente.
(Suponemos que las cinco puntuaciones diferenciales en X son valores enteros.) 12.16. Demostrar que el cuadrado del coeficien te de correlaci n de Pearson
entre las puntuaciones obtenidas en Y y los errores cometidos en los pronsticos,
mediante la recta de regresin de Y sobre X, es igual a 1 - r;,..
En otras palabras,
y'2
demostrar que r; _
, = 1 - r;,..
X y'
12.17. Comprobar cmo se verifica la anterior propiedad en el ejemplo siguiente :
- 6
-3 X y

o 4 7
9
3 l
5
5 9
7 13
12.14. .,.,Supongamos que la pendiente de la recta de regresin (en puntuaciones
directs) de Y sobre X vale 1/ 3, que z. = z,.
(para toda persona de la muestra),
242 / Estadistica para Ps,clogos

12.18.

12.19.
Calcular la pendiente de la recta de regresin de Y sobre X sabiendo que
r,y- = 0.6, s; = 4 y s;..x = 10,24.
Demostrar que L y 2 =L (y - y ')2 +L y'
2

13
12.20. Demostrar que L z; = L (:,. - z;.)2 + L z;,2. Relacin (curvilnea) entre dos variables :
12.21. Sabiendo que para cinco personas la pendiente de la recta de regresin Razn de correlacin
(en puntuaciones directas) de Y sobre X vale 0,2, sx vale 8 y s;.x/s;.- vale 9/ 16, ca lcu-
lar el error cuadrtico medio que an seguimos cometiendo al valernos de dicha
recta de regresi n, en vez de atribuir a cada persona, como puntua cin, la media Y.
2
12.22. Demostrar que I: y (y - y') = :E (y - y ') .

12.23. Comproba r cmo se verifica la propiedad anterior con los datos del ejer-
cicio 12. 17.

13.1. Introduccin

Cuando la relacin entre dos variables. X e Y. es c urvilnea. no es razonable


ca lcula r rx,- Este coeficiente, segn ya sabemos. m ide la relacin lineal en tre dos
variables y es poco apto para detectar relaciones curvilneas. Es posible obtener
'x, = O, o m uy bajo, existiendo una a lta relacin entre X e Y. pero de tipo cur-
vilneo.
Suele ser curvi lnea la relacin existente en tre bastan tes caractersticas fisi cas
y la edad, con ta l que el perodo temporal con siderad o sea suficien temente amplio
(en periodos cortos la rela cin puede ser aproxima damente linea l). Considere-
mos, por ejemplo, la relacin entre la fue rza fsica y la edad. El nio al nacer carece
prcticamente de fuerza fsica. Al ir creciendo, su fuerza fsica se va desa rrollando
progresivamente hasta a lcan zar un m ximo en cierta eta pa d e su vida. A parti r
de este momento , la fuerza fsica va decreciendo al ir a umen ta ndo la edad . E n estos
casos es basta nte razon a ble calcula r la razn de correlacin.

<
~
"'
;:
<
N ,
..
, +
+
1- ~
, ,. < : : \~ ~ ~. > ~
.)(XIII(
K X
~

.W
,<

"'
..... .
,+,
;J
;:)
;..
+ +

....
.+. f
+

- EDA D
244 / Estad,sr,ca para Psiclogos Relacin (curv,lmea) entre dos vanables: razn de correl aci n / 245

13.2. Fundamento y definicin (razn de correlacin medias particul ares, 5' = 8, 5'2 = 1O, l\ = 6 de cada uno de los tres grupos,
de Y sobre X) . pronosticaremos a cada persona, como puntuacin en Y, la media del grupo a
que pertenece de acuerdo con su edad. As, por ejemplo, si sabemos que una per-
Comencemos con un caso particular. Sea X la edad e Y una prueba de habili - sona tiene dieciocho aos, le atribuiremos JO como puntuacin en Y, por ser JO
dad mecnica. Supongamos 50 personas distribuidas segn la tabla siguiente: la media de las personas cuyas edades oscilan entre quince y veinticuatro aos.
Esperamos que, valindonos de la media del propio grupo, en vez de valernos de
TABLA 13.l la media del grupo total, mejoraremos nuestros pronsticos en Y.
Pasemos ahora al caso general. Sea una variable X descompuesta en s cate-
X goras (en el ejemplo anterior, s = 3). Sea n, el n mero de personas pertenecientes
EDAD a la categora e ; es decir, sea 11 1 el nm ero de personas pertenecientes a la catego-
25-34
ra l, sea n2 el nmero de personas pertenecien tes a la categora 2, . .. , sea ns el
5-14 15-24
nmero de personas pertenecientes a la ca tegora s (en nuestro ejemp lo, 11 1 = 15,
to 10 7 n 2 = 25, n3 = JO).
8 8 7
7 8 6 TAB LA 13.2
6 14 4
9 12 6 Categora l Categora 2 1 .. . Categora e ... Categora s
10 12 7 1

7 6 6 Persona t. Y11 Y, 2 I . . . Y,, Y,,


9 8 5 Persona 2. Y2 1 Y22 Y2 , . Y2 ,
u-< ll 10 6 Persona 3. Y,, Y32 1 . . . Y3 , . Y3 ,
z
-<
7 8 6
uw 5 10
9 8 persona i Yn Y,1 . . . 1 Y.r . .. >' 5
::E = 25
y o n, = 15 8 n2 10 113 = 10
9 14
o-< 5 10 Y,.I 1 >'11 : 2 Y,,~, Y,,.~
:J 12
;: n . 1 n 1 1 " "
-< 14
8
I r., I r,2 I r., I Y.,
:i:: -_ 1= 1 y-- j c ) )~. _ l "' I }; _ i =I
Y, - -- 2~ - - - s - --
8 ~ ~
11 .. . , - - -

~
. . .

~
10
10 y = n, Y, + n2 Y2 + + n, Y, + + n, Y,
12
n 1 + n1 + + n, + + n,
12
8
8 En la tabla J 3.2,
120 250 60
Y;,: puntuacin directa de la p ersona i p erteneciente a la ca tegora c.
- 120 . 250 . 60
l', = 15 = 8 ) l = 25 = 10 ), = 10 = 6 Y, : media en Y de las 11, personas pertenecientes a la categora c.
5': m edia en Y de las n personas pertenecientes a todas las categor as, es de-
cir, media total.
120 + 250 + 60 430 Bajo estos supuestos, LL p " - 5' )2 ser la suma de errores cuadrticos (que
f 15_+_2_5_+_ 10_ = 50 = 86 designaremos por E 2 ) cometida al atrbuir a cada persona con puntuacin Y" la
media d el grupo total, Y.
Si s9,lo conocemos la media del grupo total, Y = 8,6, pronosticaremos a cada 1:1: (Y,, - i\ )2 ser la suma de errores cuadrticos (E 2 ) cometida al atribuir
una de -~sas 50 personas 8,6 como puntuacin en Y. Si conocemos. adems. las a cada persona con puntuacin Y;, la media. Y,, de la categor a e a la que pertenece.
246 / Estadistica para Ps,clogos Relacin /curvilinea) entre dos var,ables: razn de correl ac,n / 247

Ahora bien , En la segunda frm ula, Y; es el pu nto medio del intervalo j de la variable Y,
n1 es el n mero de personas dentro del mismo intervalo j. El ndice j va de I a r ,
II ( Y" - i' )2
= II (Y" - Y,) + 15', - f )l2 = Ir ( Y" - 9,)2 + siend o r el nm ero de inter valos.
+ In,lf~ - 9)2 ( 13. I ) Observemos el gran paralelismo entre ,;, y r;,. Segn la ecuacin (12.l ),

pues
I ( Y, - 9) 2 = I ( Y, - l',')2 + I ( Y/ - l1 )2
2 II ( Y,, - i', )( i', - Y) = 2 I ( f, - i') I ( Y" i', ) = o
' Llamemos Y,, a la puntuacin en Y de cada persona i cuya puntuacin en X
ya que p ara categora c. es decir. para cada valor fijo de e, es X, . Sean n, las personas con X = X, . A todas ellas las deberemos atribuir el
mismo pronstico, que llamaremos r;. Su puesto esto, la anterior igualdad q ue-
dar as:
:E ( Y;, Y,l = o

de acuerdo con 5.2.3.a. II ( Y., - 9)1 = II ( Y., - Y; )' + In,( Y,' - 9) 2 (13.4 )
Por consiguiente,
In,(9, - 9)2 = II(Y" - 9)2 - II ( Yic - i',)2 Pues bien. en la pgina anterior veam os:

no es ms que: II ( Y" - Y)2 = II (Y" - 9, )2 + rn,(f, - f )2


(suma de E 2 cometida atribuyendo a cada persona la m edia total, 9) - (suma
de E 1 cometida atribuyndole la meda de su propia categora, 9,).
Es decir, no es ms que la parte en q ue ha sido reducida la suma de E 2 primitiva . La nica diferencia est en que en el apartado 12.1 atribuamos a cada perso-
Consiguientemente, na, en vez de Y, la puntuacin r; pronosticada mediante la recta de regresin.
Aqu atribuimos a cada p ersona, en vez de 9, la media 9, de su propia categora.
I n,(Y, - 9)2 Considerando la ecuacin (13.4 ) y la ecuacin (12.5) con los retoques acaba -
II(Y" - Y)' dos de indicar, tendremos :

2 In,( Y; - 9) 2
representa la proporcin en que ha sido reducida la suma de E pr imitiva (la co-
metida mediante Y) al valernos de Y,. S, por ejemplo, este cociente valiera 0,60,
r;,. II ( Y., - 9 )2
(1 3.5)

quiere decir que la suma de E 1 primitiva ha sido reducida en un 60 por IOO. Es I n,(Y, - f) 2
2
decir, que atribuyendo a cada persona la media , f,, de su propia categora, slo ,,.. = II I Y.,- 9) 2
(1 3.6)
cometemos un 40 por 100 de la suma de E 2 que cometamos atribuyndole la me-
dia total, Y. Pues bien, por definicin, llamaremos razn de correlacin (de Y
Las expresiones (13.5) y (13 .6) representan lo mismo: proporc1on en que re-
sobre X), o 1, , , a ducimos la suma de errores cuadrticos primitiva (la cometida valindonos de
In,( f, - Y) 2 f) al valernos bien de la puntuacin dada por la recta de regresin (13.5 ), bien
IJp = (13 .2) de la media de cada una de las categoras (13.6 ).
I I (Y;, - f )2
cuando los da tos no estn agrupados en intervalos en la variable Y.
13.3. Clculo
I 11, ( f, __: fJ 2 (13.3 )
IJ.-x = LIIJ(YJ - >' )
2
a) Datos no agrupados en in/erra/os
f" .
cundo los datos estn agrupados en intervalos en la variable Y. Es una mera aplicacin de (13. 2 ).
~

248 / Estadistica para Psi clogos Relacin /cur vlirnea) en tr e d os varia bl es: razn de correlac,n / 249

EJEMPLO 13.1. Calculemos la razn de correlacin, de Y sobre X , (de la ha- Ntese cmo ( 3 )( 11 - 8)2 + (9)(8 - 8)2 + (3 )(5 - 8)2 + (3 )(14 - 10,04) 2 +
bilidad mecnica sobre la edad) a partir de la tabla 13.1. + (12)(11 - 10,04) 2 + (9)i!l- 10,04)2 + ( 1)(5 - 10,04) 2 + (31(8 - 5,9 )2 +
2
+ (7)(5 - 5,9)2 = 193,86.
I:I: (Y;, - Y) 2 = (10 - 8,6) 2 + + (5 - 8,6) 2 + (10 - 8,6) + +
8,6)2 + (7- 8,6)2 + + (6 - 8,6)2 = 51,4 + 169 + 75,6 =
+ (8 - Ntese, consiguientemente, cmo 324 = 193, 86 + 130.14
La interpretacin de la tabla anterior es la sigu iente:
= 296
I:I: ( Y;, - Y,)2 = (10 - 8) 2 + + (5 - 8) 2 + (10 - 10) + + (8 -
2
10)2 + n 1 : personas de ntro del intervalo j en la variable Y. En los cuatro in -
+ (7 - 6)2 + + (6 - 6)2 = 46 + 120 + 8 174 = tervalos de nuestro ejemplo tenemos 3 + 1 + 7 = IJ; 9 + 9 + 3 =
2 = 21 ; 3 + 12 +O = 15 ; O + 3 + O= 3.
I: n,( Y, - Y) 2 2
= (15)(8 - 8,6) + (25)(10 - 8,6)2 + (10)(6 - 8,6) =
= 5,4 + 49 + 67,6 = 122 Y1 : punto medio del intervalo j en la vara ble }'; los cuatro puntos me-
do s son 5, 8, 1 1, 14.

Por consiguiente, Y: meda de todas las personas en Y ; es decir, 430/50 = 8,6.

Y, - Y: puntuaciones diferenciales, 5 - 8,6 = - 3,6 ; 8 - 8,6 = - 0,6; 11 -


2
1/,.. -
_ I~
296
= 0.412 11,x = 0,642 - 8,6 = 2,4 ; 14 - 8,6 = 5,4.

(Y; - Y)2 : ( - 3,6)2 = 12,96 ; (-0,6) 2 = 0,36 ; (2,4) 2 = 5,76 ; (5,4)2 = 29, 16.

Ntese que 296 = 174 + 122. n1( Y; - Y) 2


(l I )( 12,96) = 142,56 ; (21 )(0,36)= 7,56; (15)(5,76)= 86,40 ; (3)(29 , 16 )=
= 87,48.
b) Datos agrupados en interr:alos n,: personas dentro de la categora e en la vara ble X (eda d ). Dentro
de cada una de las tres categoras de nuestro ejemplo tenemos
Es una mera aplicacin de (13.3). 3 + 9 + 3 = 15; 3 + 12 + 9 + 1 = 25; 3 + 7 = 10.
EJEMPLO 13.2. Calculemos la razn de correlacin, de Y sobre X (de la habi- Y, : meda en Y de las personas dentro de la categora c.
lidad mecnica sobre la edad) a partir de la tabla 13. 1, agrupando los datos se-
gn la tabla 13.3. (3)(5) + (9 )(8) + (3)(11 ) =
8
15
TABLA 13.3 (1 )(5) + (9)(8 ) + (12)(11 ) + (3)(14) 10,04 ; (7H5l + (3)(8)
25 -- = 5,9
X
5- 14 15-24 25-34 n, Y; niYj (Y; - Y) (Y, - Y)2 n{ Y; - i' )' ( Y, - Y) : 8 - 8,6 = - 0,6 ; 10,04 - 8,6 = 1.44 ; 5,9 - 8,6 = - 2,7.
13-15 o ) o 3 14 42 5,4 29,16 87,48 (Y, - Y f : ( - 0,6) 2 = 0,36; (1.44) 2 = 2,0736; ( -2,7)2 = 7,29.
l'
10-12 3 12 o 15 11 165 2,4 5,76 86,40
7-9 9 9 3 21 8 168 - 0,6 0,36 7,56 n,( Y, - Y)2: (15)(0,36) = 5,4 ; (25)(1,44) = 51,84; (10)(7,29) = 72,9.
4 -6 3 1 7 11 5 55 - 3,6 12,96 142,56
Ntese que la variable X puede ser cuantitativa o no serlo. Si es cuantitativa,
n, 15 25 10 430 324,00 sus valores numricos no aparecen para nada e n el clculo d e 17,., .
Y, 8 10,04 5.9 ~
En lugar de utilizar _!a~ . puntuaciones Y, , podamos haber introd ucido las
(Y, - f) - 0 ,6 1,44 -2,7 puntuacio nes y1, de acuerdo con lo visto en el caso de la media , de la desviacin
(f', - f) 2 0 ,36 2,0736 7,29 tpica y del coeficiente de correlacin de Pearson, cuando usbamos el mtodo
130, 14 ,.
,,.,2 = -324 = 0.40, . 1/,-, = 0.634
abreviado . El resultado obtenido con estas nueva s puntuaciones es e l mismo que
,,,( f', ,....,} ')' 5,4 + 51,84 + 72,9 = 130,14
el obtenido con las Y,.
1
250 / Estadistica para Psiclogos Relacin (curvtlin ea ) entre dos variables; razn de correlacin / 251

13.4. Propiedades
que respecto a cualquier otro valor, en particular que l',', sa lvo el caso Y, = r;
en el cual ambas sumas seran iguales. Por consiguiente,

11) 11;, es igual o mayor que cero e igual o menor que l. 2Es decir, O :; 11;" :; :E:E ( Y, - Y,')2 rr ( Yir - Y,- )2
En efecto, segn (13.l), :En,( Y, - Y)2 :; :E:E (Y;, - Y) Por tanto, teniendo ==:-:-:=---:--':- >
:E:E ( y" _ y2 - :E:E ( y" _ y2
en cuen!a (13.2), 11;, $ 1.
Por otra parte, 11;" es el cocien te de dos expresiones no negativas y, por tanto, Es decir,
no negativo. Es decir. 11;, O.
Consideremos ahora los dos casos extremos posibles : 11;, = 1, 11;, = O.
En primer lugar, teniendo en cuenta (1 3.2) y (13.1), podemos escribir: (
1 _ n (Y,, -
:E:E(Y,,- Y)
~ ): ) 5 (i _n (Y;, -
1::E( Y., - Y)
~l: ) o r;x-5 '1:x

n: (Y., - Y)2 - :E!: ( Y,, - Y,)2 :E:E ( Y;, - Y,) 1


(13.7)
La diferencia 11;, - r;, nos puede medir el alejamiento mayor o menor de unos
2 datos de la linealidad.
11ix = :E:E ( yic _ y2 !::E ( Y;, - Y) 2
e) La razn de correlacin 11,-x es tomada como positiva ; nos mide la apro-
Por tanto, si r;,
= 1, teniendo en cuenta (13 .7), :E!: ( Y., - Y,)2 = O. Aho- ximacin de los pu ntos a la lnea que une las medias 91 , Y2 , , 9, , es decir,
ra bien, al tratarse de una suma nula compuesta de trminos cuadr ticos (es la intensidad de la relacin , sin indicarnos el sentido de esta ltima . El signo de la
decir, no negativos), todos ellos tienen que ser nulo s. En otras palabras, Y., = Y" relacin entre X e Y lo tenemos que inferir del diagrama de dispersin. As, en (A)
para toda persona de la muestra. Esto significa que, valindonos de Y,, no co-
metemos error alguno en nuestros pronsticos, que reducimos a cero la suma de
errores cuadrticos primitiva, la que habramos cometido si nos hu biramos va-

L w m
lido de Y. Recprocamente, si reducimos a cero la suma de erro res cuadrticos
primitiva, si no cometemos errores en nuestros pronsticos, quiere decir que
2
Y;, = Y, para toda persona de la muestra y, consiguientemente, !::E ( Y,, - Y, ) = O.
Pero si esto sucede, 11;, = 1, de acuerdo con (13.7).
En conclusin, a ,;,
= 1, corresponde reduccin total del error primitivo y
a reduccin total del error primitivo corresponde = 1. ,;, ( A) ( B) (CJ (D)
Si 11~, = O, teniendo en cuenta (13. 7), :E:E ( Y,, - Y, )2 = 1::E ( Y,, - Y)2.
Esto significa que nos da lo mismo usar Y, que Y en nuestros pronsticos, ya que
valindonos de Y,, seguimos cometiendo la misma suma de errores cuadrticos la relacin ser positiva, en (B) negativa, en (C) y en (D ) no tiene sentido hablar
que cometamos valindonos de Y. Recprocamente, si la suma de errores cua- de signo, a no ser que consideremos por separado la parte izquierda y la parte
drticos sigue siendo la misma valindonos de Y, que valindonos de 9, tendremos derecha de cada una d e las dos curvas. Para cada una de estas dos mitades pode-
:E:E (Y;, - 9,)2 = :E:E (Yic - 9)2 y, teniendo en cuenta (1 3.7), 11;:. = O. mos- atribuir signo tanto en (C) como en (D).
En conclusin, a ,;,
= O, corresponde reduccin nula del error primitivo y
a reduccin nula del error primitivo, corresponde = O. ,;, d) ,;xes funcin del nmero de categoras. En general, ,;,
tender a ser ma-
yor, al aumentar el nmero de categoras en la variable X . Sin embargo, si stas
b) Para unos mismos datos, $ r;, ,;x son muchas, la media en Y dentro de cada una de las categoras ser poco fiable
En efecto, recordando (13.1), (1 3.4), (13.5) y (13.6), por estar calculada con pocas personas. En general, tender a ser menor, al dis-
minuir el nmero de categoras en X , pero en este caso la media en Y de cada ca-
J _ :E!: ( Y,, - Y:)2 , :rr (yic - Y,)2 tegora ser ms fiabl e. Esta fiabilidad tiene importancia a nivel inferenc!I. Algu-
r;:,; =
!::E ( Yic - Y) 2
r ,., = - :E:E(Yic - 9)' nos autores sugieren que para 100 o ms datos sean elegidas entre 6 y 12 categoras.
Si hiciramos una sola categora, 11;. = O, tendramos Y, = Y. Si todas las
personas tuvieran distintas puntuaciones e hiciramos tantas categoras como
AWora bien, :E:E ( Y,, - r; 2 :E:E ( Y,, - 9,)2, d ado que para cada valor de e
(1, 2. . .. , s) la suma de errores cuadr licos respecto a la media (Y,) es meno1
personas, ,;,
= !, tendra mos en ese caso Y" = 9,.
Relacin /curvilinea) entre dos vaflab/es: razn de correlac,n / 253
252 / Estadistica para Psiclogos

13.7. Resumen : Definicin y frmulas


13.5. Razn de correlacin de X sobre Y
Razn de correlacin (al cuadrado): propo rcin en que reducimos la suma
En el coeficiente de correlacin de Pearson, r.,. = r,,. Aqu . en general , de errores cuadrticos come tida atribuyendo a cada persona la puntuacin del
grupo total , al atribuirle la media de su propio grupo.
+
17,,. IJ,.,. Anteriormente tenamos para calcular 1,., :

Y, : media en habilidad mecnica de las personas cuya edad estaba dentro de la 2 r 11,( Y, - Y)2
(para d atos no agrupados en intervalos)
'lrx = rr f ric - 9 )2
categora c.
Y: media en habilidad mecnica de todas las personas. 2 r n,( 9, - 9 )2
r;,: proporcin en que quedaba reducida la suma de errores cuadrticos por el r,, = I: n( Y. - 9)2 (para datos agrupados en intervalos )
hecho de pronosticar Y, a cada persona de la categora e en vez de pronos- } }

ticarle Y.
Ahora tendremos, para calcular 17,,. :
EJERCICIOS
X,: media en edad de las personas cuya habilidad mecnica est dentro de la
categora c. 13.l. Calcular la razn de correlacin '1,-x entre las variables X e l', a partir de
X: media en edad de todas las personas. los siguientes datos no agrupados en intervalos (en la variable Y).
17;,.: proporcin en que queda reducida la suma de errores cuadrticos por el he-
cho de pronosticar X, a cada persona de la categora e en vez de pronosti- Los valores numricos dentro de las tablas siguientes represen tan puntuacio-
nes obtenidas en la variable Y.
carle X.
El clculo de 17,,. es anlogo al expuesto para 17,.,. La diferencia est en poner
como puntuaciones X( Y) las que antes ponamos como puntuaciones Y(X). Es a) X h) X c') X
decir, poniendo como intervalos en Y las que antes eran categoras en X, y como
categoras en X los que antes eran intervalos en Y. En particular, en nuestro ejem-
plo, la habilidad mecnica sera la variable X con 4 categoras y la edad sera Y y 1 ~
3
6
8
7
~1
5
1
2
3
5
4
2
4
1
2
5
b
7
6
1
2
con tres intervalos que antes no habamos explicitado (porque no era necesario 3 1 4 4 8 4
2 2 5 5 l 6 7 1
para calcular IJ,,,) y que ahora tendramos que expresar de modo explicito d e acuer- y l 3 3 y 2 4 7
do con los datos en cuestin. Supongamos que stos fueran 5-14 aos, 15-24, 25-34.
2 3 1 8
Pues bien, calcularamos en primer lugar la edad media de todas las personas. 3 3 6
Despus la edad media de las personas con habilidad mecnica (4-6), la de las per- 2 9
sonas con habilidad mecnica (7-9), ... , la de las personas con habilidad me- 2 5
cnica (13-15). Con este esquema previo es ya fcil calcular rfw

13.2. Calcular la razn de correlacin IJ,,. entre las variables X e Y. a partir de


13.6. Interpretacin de r:x o de r;, los siguientes datos agrupados en intervalos (en la variable Y).
Los valores numricos dentro de las tablas representan , ahora, frecuenc ias.
Aqu vale lo dicho respecto a la in tcrpretacin de rx,-- La valoracin de una
rfx (or;, ) determinada como alta, media o baja, slo puede ser hecha en fun cin a) X b) X
de las variables en cuestin. Para un par de variables, ri;,
(o 17;, ), igual a 0,35, puede
significar una gran relacin y para otro par de variables distintas puede significar 10-12 1 o J o o 2
una relacin baja. El nico juicio valorativo razonable es compararla con las rf, y 1 7-9 1 o 5 o Y 1 8-IO
5-7 1 11 1 2
(o ,;;J. obtenidas por otros investigadores entre las mismas o semejantes varia- 4-6 4 2 3 2-4 O 3 o
ble~. Pueden ser engaosas las tablas en las que se clasifican las r;, (o ,;,.) como 1-3 4 o
bajas, medias y altas en sentido absoluto.
254 / Estadisr,ca para Psiclogos

e) X d) X
14
l'
1 8-12 18
3-7 2
1
4 ~1 )'
9-11
6-8
3-5
4
7
4
o o 2
J
8
o 8
1 o Relacin entre variables ordinales
0-2 o 11 4 o

13.3. Demostrar que 11;,. (razn de correlacin, al cuadrado, de Y sobre X) es


la misma que 17;, (razn de correlacin, al cuadrado de V= AX + B sobre
W = CY + D), donde A, B, C, D son cuatro constantes arbitrarias, con A y C
distintas de cero .
Ntese que con este ejercicio queda legitimado el mtodo abreviado.
13.4. Sabiendo que 11;, = O, completar la tabla adjunta, donde X y x represen- 14.1. Idea previa
tan puntuaciones directas y diferenciales, respectivamente, en una variable pre-
dictora X e Y' representa puntuaciones directas pronosticadas mediante la recta Segn sabemos, una variable es llamada ordinal cuando a lo largo de ella ni -
de regresin de Y sobre X. Decir cul es la pendiente de dicha recta. camente podemos ordenar un conjunto de objetos, es decir, solamen te podemos
decir cul es el primero, cul es el segundo ... . , cul es el ltimo. pero no pode-
mos atribuirles autnticos nmeros que nos permitan establecer qu distancias
X X y existen entre el primero y el segundo, entre el segundo y el tercero, etc. Pues bien.
en este captulo vamos a proponer algunos ndices de correlacin entre dos va-
riables de tip o ordinal.
2
4 O 5
5
14.2. Coeficiente de correlacin de Spearman, r,

14.2.1. Fundamento y frmula

Comencemos considerando algunos ejemplos a los que es aplicable d icho


coeficiente.
u) Dos directores de orquesta ordenan 15 canciones segn su valor artstico.
b) Un capataz ordena a unos operarios segn su puntualidad y su respon-
sabilidad.
e) Conociendo las puntuaciones de un grupo d e nios en aritmtica y en
geometra, consideramos nicamen te sus posiciones o valores o rdinales en am-
bas asignaturas.
d) Conociendo las pu ntuaciones de los al umnos en aritmtica y sus posicio-
nes o valores ordinales en laboriosidad, convertimos las primeras pun tuaciones
en valores ordinal es, teniendo en cuenta nicamente los valores ordinales en arit-
mtica y en laboriosidad.
.,-f' . En todos estos ejemplos nos encontramos, en defin itiva , con dos sucesiones
de valores ordinales. Pues bien, el coeficiente de correlacin de Spear man no es
256 / Estadistica para Ps,c/ogos
Relacin entre variables ordinales / 257
ms que el coeficiente de correlacin de Pearson entre estas d os sucesiones de Ntese que en el caso de empates obtendr emos, en general, distin to resu ltado
valores ordinales. Para que tenga sentido la aplicacin de Pearson, consideraremos aplicando (14.1) a los valores ordinales, conseguidos segn lo acabado de indicar,
el valor ordinal l O como puntuacin l, el valor ordinal 2. 0 como puntuacin 2, etc. que aplicando 'x, a esos mismos valores. Si el nmero de empates es grande, con-
Suponiendo que no hay empates (o sea, que dos o ms objetos no ocupan una viene usar otra fr mula distinta de (14.1 ). (Vase Kendall, 1970.)
misma posicin. no obtienen un mismo valor ordinal), tendremos tantos valores Tngase en cuen ta q ue r, ms que la relacin entre X e Y lo que nos mide es
ordinales, en cada una de las dos variables, como objetos. En otras palabras, ten- la relacin en tre el orden de los objetos en una variable y su orden en la otra.
dremos dos columnas de nmeros, cada una de las cuales constar de los II prime-
ros nmeros naturales (1, 2, ... , 11). En conclusin, r, no es ms que r,,. entre los
11 primeros nmeros naturales (dados en un cierto orden) y esos mismos nmeros 14.2.2. Clculo
naturales (dados en el mismo o en distinto orden).
E.Jr:MPLO 14.1. Cinco personas han quedado ordenadas segn su laboriosi- Es una mera aplicacin de (l 4. l J.
dad (X) y su responsabilidad ( Y} de acuerdo con la tabla siguiente: EJEMPLO 14.2. La tabla adjunta n os muestra el orden de preferencia, segn
el cual, por trmin o medio, un grupo de nios y un grupo d e nias entre diez y
once aos colocaron diversos objetos ofrecidos como premio. (Bsset y Rieber, 1966.)
X r
--~
Antonio 2 . 3. Ni os Nias
Objetos y
Carlos
Pedro
5.
J. o
4.f)
2.
X d,
"]
Juan 3. 1. Joyas 3 J 2 4
Luis 40 5. Monedas de poco valor 2 2 o o
Coches t 4 - 3 9
Cartas pequeas 5 3 2 4
Dijes 4 5 -1 1
El coeficiente de correlacin de Spearman, r,, no es ms que,.,. entre los cinco Canicas 7 6 I
primeros nmeros naturales, dados en el orden 2, 5, 1, 3, 4 y esos mismos n me- Ara ndelas 6 8 -2 4
Clips 8 7 1 1
ros naturales, dados en el orden 3, 4, 2, l, 5.
Se demuestra (vase 14.6. Apndice) que la frmula de rx, aplicada a estas ---
dos series de los II primeros nmeros n aturales (es decir, r,) viene expresada del o 24
modo siguiente:
(6)(24) 144
r, = J _ 6- -,r- d2.,
,, = l -
(8)(82 - 1)
=l - -
504
=1 - 0.2857 = 0.7 143
(1 4.l)

donde d, es la diferencia entre el valor ordinal en X y el valo r ordinal en Y del ob- Es claro que r d, = O, p ues no es ms que la diferencia entre la suma de los
jeto i. n primeros nmeros naturales y la suma de esos mismos nmeros.
Para el caso de empates hay otra frmula distinta de (\4.1 ). Sin embargo, con EJEMPW 14.3. En el primer cuadro de la pgina siguiente tenemos las puntua
frecuencia (sobre todo. si el nmero de empates es reducido) suele ser aplicada ciones en nivel de lectura (X) y la conducta en clase ( Y) de diez nios de clase media,
(14. 1), atr ibuyendo como valor ordinal a cada objeto empatado con o tros la media con problemas en ambas variables, sometidos a un programa de recuperacin cuyo
aritmtica de los valo res ordinales que hubieran ocupado esos objetos en caso fin era manifestar la eficacia de las tcnicas de modificacin de conducta en la
de no haber es tado empatados. Por ejemplo, si un objeto ocupa el lugar p rimero, superacin de dichos problemas (Wadswo rth, 1971).
cuatro quedan empatados detrs de l y otros tres quedan empatados detrs de los Es indiferente at ribuir en ambas variables el valor l a la persona con mxi -
anteriores, los valores ordinales de estos ocho objetos seran: 1 para el primero, ma puntuacin , el 2 a la inmediatamen te inferior, etc., que atr ibuir en ambas va-
(2 + >ft 4 + 5)/4 = 3,5 para los cuatro siguientes, (6 + 7 + 8)/3 = 7 para los riables el valor 1 a la persona con mnima p untuacin, el 2 a la inmediatamente
tres l timos. superior, etc. El valor de r, ser el mismo en uno y otro caso.
Relac,on entre variables ordinales / 259
258 / Estadistica para Psiclogos

pero sta era cada vez ms escasa y tardaba ms en aparecer (mayor latencia }. Los
Nivel Conducta
datos sobre la latencia (X) y las gotas de saliva segregadas ( Y) correspondientes
lectura en clase rdenes
y X y d, d.' a siete ensayos de extincin, se hallan en la tabla anterior. Calculemos r, entre
X
X e Y. Tendremos que transformar los valores cuantitativos en valores ordinales.
2,7 40 4 1 3 9 La relacin es nega tiva, indicando que a mayor latencia en la segregacin de
2.2 14 8 9 -1 1 saliva, menor nmero de gotas segregadas.
2,3 18 7 7 o o
2,6 20 5 5 o o
3,1 22 3 4 - 1 14.2.3. Propiedades
3,4 36 2 3 - 1
1,9 17 10 8 2 4
a ) El coeficiente de correlacin de Spearman no puede valer menos que - 1
2,1 13 9 10 - 1 1
16
ni ms que 1. Es decir,
2,4 39 6 2 4
3,9 19 1 6 -5 25
- l :s; r, :S 1
o 58
En efecto, basta con advertir que r, no es ms que un caso particular de r.,.
(6)(58) (a saber, r,, aplicado a unos valores ordinales considerados como puntuaciones).
r, = 1 - (I0)(l0' _ I) = l - 0,35 = 0,65 Esta propiedad puede ser comprobada, tambin, a partir de la frmula (14.l }.
Es claro que los dos casos extrem os de correlacin son los siguientes:
Cada objeto ocupa el mismo lugar ordinal en ambas variables (el que es pri-
Distngase claramente entre r xy aplicado a las autnticas puntuaciones (cuan-
mero en X, es primero en Y; el que es segundo en X, lo es, tambin, en Y; .. . ; el
do stas nos sean dadas), y rxr aplicado a los rdenes originados a partir de dichas
que es ltimo en X, lo es, tambin, en Y).
puntuaciones (es decir, ,, ). Ambos valores, en general, sern distintos.
Cada objeto ocupa un lugar opuesto en am bas variables (el que es primero
EJEMPLO 14.4. Pavlov (1929) haca sonar el tic-tac de un metrnomo en la
en X, es ltimo en Y; el que es segundo en X, es penltimo en Y; .. . ; el que es
habitacin donde se hallaba un perro y, a continuacin, le presentaba comida.
ltimo en X, es primero en Y).
Tras varios ensayos consigui que la puesta en marcha del metrnomo provocase
Como ejercicio, verifique el lector cmo, efectivamente, en el primer caso
r pidamente la secrecin de abundante saliva, como respuesta condicionada . Pos-
r, = l y cmo en el segundo r, = - 1.
teriormente procedi a la extincin de dicha respuesta haciendo sonar el metr-
nomo, sin presentar comida, con lo cual el perro, al orlo, segregaba an saliva, b) Su clculo es ms sencillo que el de r,,. para unos mismos datos, si stos
no son muy numerosos y son escasos los empates.

rdenes
Ensayo X y X y
(segundos) (gotas) d, d,2 14.3. Coeficiente de correlacin de Kendall, T

Jy 3 10 7 l 6 36
7 3 3,5 - 0,5 0,25 14.3.1. Fundamento y definicin
2. 7
3. 5 8 4,5 2 2,5 6,25
4. 4 5 6 5 1 1 Se diferencia de r, en que no se funda en rx, Kendall (1970) considera el orden
5. 5 7 4 ,5 3,5 1 1 de n objetos en una variable y su orden en otra e intenta medir el grado de co-
6. 9 4 2 6 -4 16 rrespondencia entre estos dos rdenes" (pg. 3 }.
7. 13 3 1 7 -6 36 Supongamos n personas y dos variables X e Y. Elijamos dos personas, A y B.
Si A es superior a Ben X e inferior a B en Y o inferior a B en X y super ior a B en
96,5
Y, diremos que se da una inversin. Si, por el contrario, A es superior a Ben X y
+j" superior a B en Y o inferior a B en X e inferior a Ben Y, diremos que no se d a in-
(6)(96,5) 579
r = 1- - ~-- = 1 - - = l - l 72 = - 072 versin alguna o que se da una n o-inversin . H agamos la m isma comparacin
' (7)(72 - 1) 336 ' '
260 / Esu,disuca para Psiclogos
Re/ac,n entre variables ordinal es / 261

con todos los pares posibles, es decir, con los n(n - l )/2, ya que ste es el nmero en segundo lugar la que supera a todas menos a la anterior, etc. Siemp re que en
de pares que se pueden formar con n elementos de manera que cada p ar difiera la tabla una persona tenga por debajo de s alguna persona superior a ella en Y,
de los restantes en uno, al menos, de sus elementos. Llamemos P al nmero de tendremos inversin, pues todas las situadas debajo de eJla en la ta bla son infe-
no-inversiones y Q al de inversiones. Bajo estas premisas, por definicin : riores en X. En el ejemplo acabado de exponer intercambiemos las cinco personas
de modo que en primer lugar se encuentre la que es superior en X a las cuatro res-
P - Q P - Q tantes, en segundo lugar la que es superior en X a las tres restantes. etc. Segn este
r= - - = - -- (14.2)
p + Q l)
n{n - criterio, la tabla anterior quedar reorgani7.ada as:
2

rdenes
14.3.2. Clculo X }'
- --
Es una mera aplicacin de (14.2). B 1 3
EJEMPLO 14.5. Bingham, Moore y Gustad (1959) hicieron que 22 personas e 2 2
que solicitaban un empleo fueran entrevistadas por distintos jueces, cada uno D 3
A 4 4
de los cuales deba ordenarlas segn la presumible aptitud de cada una para el
E 5 5
empleo en cuestin. Por sencillez en los clculos hemos elegido 5 de las 22. En la
tabla adjunta aparece el orden relativo de estas 5 personas propuesto por dos de
los jueces. Comparemos B con las cuatro restantes, fijndonos en la variable Y:

BC(3 - 2) : / , BD (3 - 1) :/, BA{3-4 ):NI. BE(3 - 5) : NJ


Personas Juez 1 Juez 2
rdenes Comparemos C con las tres restantes, fijndonos en la variable Y :
X y

CD(2 - l ) : / , CA{2 - 4) : Nl , CE(2- 5) : Nl


A 4 4
B 1 3
e 2 2
Comparemos D con las dos restantes, fijndon os en la variable Y:
D 3 1
E 5 5 D A (1 - 4) : N i , DE (1 - 5) : NI

Comparemos A con la nica restante, fijndonos en la variable Y:


Hagamos las (5)(5 - 1)/ 2 = 10 comparaciones posibles : AB, AC, AD, AE, AE (4 - 5) : NI
BC, BD, BE, CD, CE, DE. Los pares BC, BD y CD nos ofrecen inversin. Los
pares restantes nos ofrecen no-inversin. Consiguientemente, P = 7, Q = 3. Por En conclusin, tenemos 2 + 2 + 2 + 1 = 7 no-nvcrsones ( N [) y 2 + l + O+
tanto, + O= 3 inversiones (/).
7 - 3 4
7 + 3 = 10 = .9,40 14.3.3. Propiedades

En la prctica, la manera ms sencilla de calcular el nmero de inversio nes a) El coeficiente de cor relacin de Kendall no puede valer menos que - 1
es la siguiente. Las personas son intercambiadas entre s de manera que en una ni ms que l. Es decir, - I :o; r :5 l.
de las dos variables queden colocadas de superior a inferior (o de inferior a su- En efecto, los dos casos extremos posibles son o q ue no haya inversin algu na,
perior).jlupongamos que estn colocadas en X de superior a inferior. Es decir, o que todos los pares sean inversos. En el primer caso Q = O y, por tanto,
en la fabla est situada en primer lugar la persona que es superio r a todas en X , t = P/P = l . En el segundo caso, P = O y, po r tanto, r = - Q/Q = - 1.
262 / Estadistica para Ps,clogos Relacin entre vanab/es ordinal es / 263

b) A partir de -r pueden ser calculados coeficientes de correlacin parcial, jan te o i nverso si la primera persona es superior a la segunda en X e inferior
semejantes a los que calcularemos ms adelante a partir de r x> a ella en Y o si es inferior a la segunda en X y superior a ella en Y. D iremos que
r) Segn Kendall ( I970, pg. 12 ), en la prctica encontramos frecuente- un par est empatado o es un empate si la p rimera persona es igual que la
mente que, cuando ninguno de los dos coeficientes se acercan a la unidad, r. es apro- segunda bien slo en X , bien slo en Y, bien sim ultneamente en X y en Y.
ximadamente un 50 por 100 m ayor que r en valor absoluto, pero esta r egla no es Veamos ahora cuntos de los 990 pa res son semejan tes. Para ello conside-
invariable. Es decir, r, " (3/2),. Conviene, no obstante, advertir que esta regla rem os las tablas siguientes. tod as ellas extradas de la tabla 14.1.
no es invariable .
NOTA . Para el caso de empates existe una frmula especial que no propo- TABLA 14.2 TABLA 14.3 TABLA 14.4 T A BLA 14 .5
nemos porque slo aplicaremos el coeficiente de correlacin de Kendall en situa-

~
ciones en las que no aparezcan empates. Para un estudio ms detallado de pro- X X
blemas relacionados con este coeficiente, vase Kendall (1970).
1
B M A B M IA

14.4. Coeficiente de correlacin de Goodman y Kruskal

14.4.1. Introduccin
Ai
Y/MI
1 fi+~f
\ ''j ' ;,
B 3
y
-
A

B
6
-
4., 8 '

-- ,-
y
A

B
9,
18 '
1
j
.,. _
1

Cuando la muestra consta de muchas observaciones y son muy p ocos los va-
En la ta bla 14.2 son semejantes todos los pares en los que una de las dos per-
lores ordinales alcanzables por ellas, ser muy grande el nmero de empa tes. En
sonas del par pertenezca a la casilla a y la otra a una cualquiera de las cuatro
este caso es recomendable la gamma de Goodman y Kruskal.
casillas e, f, h, i. En efecto, consideremos las casillas a y f, por ejem-
EJEMPLO 14.6. Supongamos dos variables: nivel social (X ) y nivel eco-
plo . Toda persona P., perteneciente a a, es baja en X y baja en Y. Toda
nmico {l'). Consideremos divididas ambas variables en tres categoras: nivel
persona P1 , perteneciente a fo es <mita en X y media en Y. Es decir, P. es in-
bajo (B) . nivel medio (M). nivel alto {A). Esto significa que tanto en X como
ferior a P1 tanto en X como en Y. Por anlogo razonamiento, toda persona P, es
en Y slo son posibles tres valores ord inales distintos. Supongamos que 45 per-
inferior a toda P, , a toda Ph y a !oda P, tanto en X como en Y.
sonas se encuentran distribuidas, segn la tabla 14. 1.
En la tabla 14.3 son semejantes todos los pares en los que una de las do s per-
sonas del par per!cnezca a la casilla b y la otra a una cualquiera de las dos casi-
TABLA 14.1 llas f o i>i. En efecto, toda persona P. es inferior a toda persona P1 y a toda
A persona P, tanto en X como en Y.
En la tabla 14.4 son semejantes todos los pares en los que una de las dos per-
B 1 M A
! sonas del par pertenezca a la casilla <<d y la otra a una cualquiera de las dos ca -
A 1 ! 4 8 ; 13 sillas h o i . En efecto, toda p ersona Pd es inferior a toda p ersona Ph y P, tanto
en X como en Y.
1
y M 6 1 9 < 5 f 20 En la tabla 14.5 son semejantes lodos los pares en los que una de la s dos
' personas pertenezca a la casilla e y la o tra a la casilla i. En efecto , toda per-
B 7 3 b 2 ' 12 sona P, es inferior a toda persona P, tanto en X como en Y.
Por consiguiente, el nmero de pares semejantes ser
14 16 15 45
(7)(9 + 5 + 4 + 8) = 182 (ta bla 14.2)
(3)(5 + 8) = 39 {ta bla 14.3)
Con estas 45 person as podemos formar (44)(45)/2 = 990 pares que difieran (6)(4 + 8) = 72 (tabla 14.4)
en uno, al menos, de sus elementos. Diremos que un p ar es semejante o no =
(9 )(8) 72 (tabla 14.5)
inversif si la primera persona es superior a la segunda tanto en X como en Y o
365
si es inferio r a la segunda tanto en X como en Y. Diremos que un par es deseme-
264 / Estadsttca para Psiclogos Relaci n entre variables ordinal es / 265

De modo anlogo, consideremos ahora las tablas siguientes. todas ellas ex- Veamos, fina lmente, cuntos son los pares empatados:
tradas de la tabla 14. l. a) Las dos personas del par pertenecen a un mismo nivel en X:

TABLA 14.7 TABLA 14.8 TA BLA 14.9


TABLA 14.6 (7)(6 + l) + (6)( 1) + (3)(9 + 4) + (9)(4) + (2)(5 + 8) + (5)(8) = 196

X X X h) Las dos personas del par pertenecen a un mismo nivel en Y:


X

B M A B M A B M A B M A (7)(3 + 2) + (3)(2 ) + (6)(9 + 5) + (9)(5) + () )(4 + 8) + (4 )(8) = 214


A 19 4 A 1 A 1 4 IA 1
e) Las dos perso nas del par pertenecen a un mismo nivel en X y en Y. Se
51 y M 9'
trata de todas combinaciones binarias formadas con las personas de cada una
y 6' 9 ' y M 6' y M
M de las nueve casillas :
2' B 3 B B
B
G) + G) + G) + G) + G) G) + G) + G) + G) +
En la tabla 14 .6 son desemejantes o inversos tocios los pares en los que 21 + 3 + + l5 + 36 + 10 + O + 6 + 28 120
una de las dos personas del par pertenezca a la casilla c y la otra a una cualquie-
ra de las cuatro casillas d, e, g, h. En efecto, consideremos las casillas Por tanto,
c y h, por ejemplo. Toda persona P" perteneciente a la casilla c, es alta
en X y baja en Y. Toda persona Ph , perteneciente a la casilla h, es media>) en p ares semejantes = 365
X y alta en Y. Es decir, P, es superior en X a toda persona P y es inferior a ella pares desemejantes o inversos = 95
en Y. Por anlogo razonamiento, toda persona P, es superior en X a toda perso- { (slo en X) = 196
na Pd, P, y P9 , y es inferior en Y a ellas. pares empatados (slo en Y) = 2 14
En la tabla 14.7 son desemejantes o ,(inversos todos los pares en los que (en X y en Y) = 120
una de las dos personas del par pertenezca a la casilla b y la otra a una cualquie- 990
ra de las dos casillas d o g. En efecto, toda persona Ph es superior en X a toda
persona Pd y P9 , y es inferior en Y a ellas. Como era d e esperar, la suma to tal (990) equivale al nmero de pares posibles
En la tabla 14.8 son <<desemejantes o inversos todos los pares en los que distintos que podamos formar a base de la tabla 14. 1.
t.na de las dos personas del par pertenezca a la casilla f y la otra a una cualquie- En conclusin, obtendremos los pares semejantes haciendo que la segun -
ra de las dos casillas g o h. En efecto, toda persona PI es superior en X a toda da persona de cada par pertenezca a una casilla cualquiera situada por encima
persona P9 y P y es inferior en Y a ellas. y a la derecha de la casilla a la que pertenece la p rimera persona. Obtendremos
En la tabla 14.9 son desemejantes o inversos todos los pares en los que los pares desemejantes o inversos hacien do que la segunda persona de cada
una de las dos personas del par pertenezca a la casilla e y la otra a la casilla <(g. par pertenezca a una casilla situada por encima y a la izquierda de la casilla a la
En efecto, toda persona P, es superior en X a toda persona P9 y es inferior en Y a que pertenece la primera persona.
la misma. Por supuesto, esto es vlido si las categoras o niveles se encuentran ordena-
Por consiguiente, el nmero de pares desemejantes o inversos" ser: dos de acuerdo con la tabla 14.l , es decir, con el nivel Ben X a la izquierda de la
tabla y con el nivel B en Y en la parte baja de la misma.

(2)(6 + 9 + 1 + 4) = 40 (tabla 14.6)


(3)(6 + 1) = 21 (tabla 14.7) 14.4.2. Definicin
(5)(1 + 4) = 25 (tabla 14.8 )
(9)(1) = 9 (tabla 14.9) Llamemos n,, nd y n, al nmero de pares semeja ntes o no inversos, dese-
-
:" 95 mejan tes o inversos y empatados, con n, + nd + n, = n. Supuesto esto,
n,/(n - n,) = n,/(n, + nd) ser la proporcin de pares semejantes dentro de
Relac,n entre vartabl es ordinales / 267
266 / Estadistica para Psiclogos
14.4.4. Propiedades
los pares no empatados. A su vez. n,/(11 - 11,) = 11,/ (11, + 11J) ser la propor-
cin de pares desemejantes dentro de los pares no empatadosn. Pues bien. a) Si la proporcin de observaciones dentro de cada casilla se mantiene cons-
por definicin. tante, la gamma de Goodman y Kruskal se mantiene, tambin , constante, sea
cual sea el tamao de la muestra.
~ ~ ~-~ h) La gamma de Goodman y Kruskal es igual o mayor que - 1 e igual o me-
,-~+~ ~ + ~ =~+~ nor que 1. En efecto, si todos los pares no-empatados son semejantes o no-inver-
(n, -
sos, ,' = - - -
O) = 1. s1 tod os los pares no-empata dos son desemeJantes
. .
o m-
(n, - O)
versos, .,, = -
(0 -
- n,)
- = - . En cua 1quier
. caso, (n, - n,) < (11, + n, ), ya que n, y
14.4.3. Clculo (O+ n.)
n, son nmeros esencialmente no-negativos y, por tanto, (n, - 11. )f (n, + nd ) ser
Basta con aplicar la frmula anterior al nmero de pares semejantes> y al de
(en valor absoluto) menor que l. Su signo depender de que n, sea mayor o menor
pares desemejantes o inversos", obtenidos de acuerdo con las indicaciones
expuestas en 14.4.1. Asi. con los datos del ejemplo 14.6 (tabla 14. l) h emos ob- que nd . Para n, = n d, ; = O.

tenido

11, = 365 11d = 95 14.5. Interpretacin de los coeficientes de correlacin ordinal

Por tanto,
Ver los conce ptos expuestos en el apartado l 0.5 .
; = 365 .- 95 = 270 _ O 587
365 + 95 460 '

EJEMPLO 14.7. Amn (1969) estudi la relacin entre el prejuicio antipro- 14.6. Apndice: Deduccin del coeficiente
testante y la religiosidad utilitaria (es decir, usada como instrumento para conse- de correlacin de Spearman
guir beneficios bien materiales, bien espirituales) en un grupo de 223 estudiantes
varones de edades entre quince y veinte aos. Los resultados obtenidos fueron Segn sabernos, el coeficiente de correlacin de Spearman no es ms que e l
los siguientes: coeficiente de correlacin de Pearson aplicado a dos series de valores ordinales,
cada una de ellas compuesta por los n primeros nm eros naturales.
Prejuicio a.p. Tambin sabemos que el coeficiente de correlacin de Pcarson. r x, , viene dado por
Bajo Alto

73 69 t42 :E (X - X)(Y - Y ) (1 )
Alta
-- - Jr. (X - Jr. (Y -
,. ;X \
Rel. util. -- - - X)2 9) 2
Baja 64 17 81
-- ~ - - .. - 223
Por otra parte.
137 86
(:EX )2
:E (X - X)2 = r. X 2 (2)
11
.. = (64)(69) - ( 17)(73) _ 4.416 - _ 1.24 1 = 3.175 = 0,56
' (64)(69) + (17)(73) 4.416 + 1.241 5.657

(I. }')2
._!" r. ( y - y )2 = r. , 2 (3)
Una 1' = 0,56 es bastante alta, si nos atenemos a los resultados obtenidos or- n
dinariamente con varia bles de este tipo.
268 / Estadstica para Psiclogos Relacin entre variabl es ordinal es / 269

Puesto que los valores de X (y de Y) son l, 2, 3, ... , n, calcular LX (I Y) 14.7. Resumen: Definiciones y frmulas
y IX 2 (I Y 2 ) equivale a calcular la suma de los n primeros nmeros naturales y
la suma de sus cuadrados. Ahora bien, se demuestra que :
Coeficieme de correlacin de Spearman: Coeficien te de correlacin de Pea r-
son aplicado a dos sucesiones de valores ordinales, considerados estos l timos
1 + 2 + 3 + + n = n(n + 1)/2
como autn ticas puntuaciones:
J2 + 22 + 32 + + n 2 = n(n + 1)(211 + 1)/6

Por tanto, r=l- 6 Id,2


' (11)(11 2 - 1)

I (X - X) 2 = I xi _ (I X)2 /n = 11(11 + 1)(211 + ) _ 112(11 + 2 Coeficiente de correlacin de Kenda/1: ndice que nos mide el grado de seme-
6 411
janza entre los valores de dos sucesiones .ordinales. Ms concretamente, siendo
4n 3 + 2n 2 + 4n 2 + 2n - 311 3 611 2 311
P el nmero de no-inversiones y Q el nmero de inversion es, por definicin,
12
3 2
= 11 - 11 = 11(n - l) (4 )
12 12
P-Q
T= P+Q
Por anloga razn,
2
11(11 - !)
I(Y - Y) 2 (5 ) Gamma de Goodman y Kruska/ : Proporcin de pares semejantes o no-inver-
12
sos, dentro de los no empatados, menos proporcin de pares desemejantes o in-
versos, dentro, tambin, de los no empatados :
Llamemos d = X - Y a la diferencia entre el valor ordin al en X y el valor
ordinal en Y de la persona i. Advirtiendo que X = Y es decir, X - Y = O, y, te-
niendo en cuenta (4), nos queda:
.., ns lld ns ~ n4
, = - - - - - =--
I d 2 = I [(X - Y) - (X - Y)]2 = ;[(X - X) - (Y - Y)]2 = n, + nd n, + nd n, + nd
= ;(X - X) 2 - 2I (X - X)(Y - Y)+ :E (Y - Y) 2 =
2
1
= 2 n(n - l - u: (X - X)( Y - Y)
12

De donde,
2
I c/2 EJERCICIOS
L (X - X)(Y _ y= n(n - J) (6)
12 2
14.1. En un colegio femenino socioeconom1camente medio-alto, siete alumnas
fueron ordenadas de 1 a 7 segn el mayor o menor grado en el que crean haber
En conclusin, teniendo en cuenta ( 1), (4 ), (5 ) y (6 ), nos queda:
alcanzado las cosas deseadas. Cada a lumna lleva asignados los ingresos fami -
liares mensua les. Los datos son los siguientes: J. F . (250.000 p tas. o ms ), L. P.
n(n 2 - 1) :I: d 2 n(n 2 - 1) - 6 :I: d 2
- - (210.000), M. A. (115.000), P. E. (72.000 ), A . Q. (78 .000), E . R . (143.000),
12 2 12 6 I d2 V. G. (85.000). Calcular el coeficiente de correlacin de Spea rman .
r = 2
=
n(n 2 -
= ! - -2- -
' /' /11(11 - 1) n(n2 - 1) 1) n(n - 1)
14.2, A p artir de los datos del ejercicio anterior, calcula r el coeficiente de co -
12 12 12 rrelacin de Kendall.
Relacin entre vanables ordinales / 271
270 / Estadistica para Psiclogos

14.7. En un grupo de 20 personas vali 0,60 el coc!iciente de correlacin de Kendall


14.3. Dos profesores, A y B, ordenan los ensay,os literarios sobre la democracia
entre responsabilidad y rendimiento escolar. Se pide calcular el nmero de
escritos por 8 estudiantes. A partir de los datos del cuadro, calcular el coeficiente
inversiones y de no inversiones que tuvieron lugar en dicho grupo.
de correlacin de Spearman, siendo las dos ordenaciones:
14.8. Calcular la gamma de Goodman y Kruskal a partir de los cuadros siguien-
A 8 tes. En todos ellos suponemos que las categoras estn ordenadas, es decir,
X 1 < X 2 < X 3 < . . . , Y1 < Y2 < Y3 < . . .
1 3
2 2
3 5
4 1
a) x, x, b) X, x, 1 x, e) X, / X, jX,
5 4 ,- .----+---,- - -----+ - .

8
6
7
8
7
6
Y, 6 16 Y, JO
-~ ~- ~- --
Y, 1 8 i 4

-~~~-~
Y1 20 8 yl 2 41 8 2

14.4. A partir de los datos del ejercicio anterior, calcular el coe!iciente de co- Y, i 2: 4 6
rrelacin de Kendall.
14.5. Calcular el coeficiente de correlacin de Spearman entre X e Y a partir
de los cuadros siguientes. (Los nmeros dentro de cada cuadro son puntuacio-
nes en las variables X e Y. Como se sabe, estas puntuaciones deben ser transfor- x, 1 x, x, X, x.
d) x, x, x, e) f) X,
madas en sus correspondientes valores ordinales.)
y 4 3 3
y y d) X y
Y, 2 10 12 Y, 1 3 I 7 --6 -
a) X y b) X e) X
- - - - -- --- - -- Y, 3 6 4 Y2 1 61 5 r, 3 4 2 2
6 10 48 28 25 18 18 15 - - -
2 33 37 24 15 14 15 Y, 5 5 2 Y1 1 8 I 4 rl 2 1
- - --- -- . -~ ' 4
4 7 51 34 20 14 24 19
24 6 1 yl 2 2 3 5
2 9 12 46 20 10 28 Y1 J 10
5 8 43 42 18 12 26 15
20 7 14 30
28 32
---

14.6. Calcular el coeficiente de correlacin de Kendall entre X e Y a partir de


los cuadros siguientes. (Los nmeros dentro de cada cuadro son puntuaciones
en X y en Y.)
- -- --- - --y y
a) X y b) X y d X d) X
--- --- - -- --
2 4 18 14 74 27 72 31
5 3 35 7 80 32 62 28
6 5 42 9 65 28 54 32
2 6 13 82 29 42 35
24 15 69 35 70 33
~.t --- 81 34 48 34
57 30
Relacin entre vanables nomin ales / 273

15 (A 2B 1 ) : nmero de protestantes
latin os .
(A 1 ): nmero de catlicos.
( A 2 B 2 ) : nmero de protestantes
sajones.
(A 2 ): nmero de protestantes.
(B, ): nmero de latinos. (B 2 ) : nmero de sajones.
Relacin entre variables nominales
n: nmero total de personas.

Supuesto esto, no existir relacin entre raza y religin, si la proporc10n de


catlicos es la misma entre los latinos que entre los sajones. Es decir, si

(A 1 B 1 ) = (A ,B2 )
(15.1 )
(B,) (B2 )

15.1. Idea previa


Ahora bien,
Segn sabemos, una variable es nominal, cuando a lo largo de ella slo es po-
sible establecer categoras no ordenadas, es decir, categoras cuyas posiciones (A B ) (A B) (B , ) (A2B.J = 1 - (A , B , )
-1 -
1 2
+ -- =~ de donde,
pueden ser intercambiadas arbitrariamente. (B) (B) (B) (B1) (BJ
(A B 2 ) (A B ) (B ) (A2B2 ) = 1 - (A1B2)
- 1- + -2 -
2
= ~2 de donde,
15.2. Coeficiente Q de Yule (B2) (B2) (82) (B2) (BJ
Por tanto, si
15.2.1. Fundamento y frmula
(A 1 B) = (A 1 8 2 ) (A 2 8) = (A 2 B 2 )
Este coeficiente es aplicable cuando tenemos dos variables nominales, cada una (B 1 ) (B 2 ) (B,) (B2 )
de ellas con slo dos categoras. Por ejemplo, las variables nominales religin
(con las dos categoras: catlico-protestante) y raza (con las dos categoras:
Es decir, si no existe relacin entre raza y religin, debe verificarse, tam bin.
latino-sajn). Consideremos el cuadro siguiente:
(A 2 B, ) (A2 B2 )
(1 5.2)
RELIGJON (B,) (B2)

A 1 (catlicos) A 2 (protestantes)
Esto es obvio, pues si no existe relacin entre raza y religin , la proporcin
B 2 (saj.) (A,Bi) (A2B2) (B 2) de protestantes entre los latinos debe ser la misma que entre los sajones. Las re-
RAZA - laciones (15. 1) y (15 .2) se implican mutuamente. Si es verdadera una cualquiera
B 1 (}al.) (A 1B 1 ) (A 2 B 1 ) (B, ) de las dos, tiene que serlo, tambin, la otra.
Si, adems, tenemos en cuenta una conocida propiedad de las proporciones,
(A, ) (A 2) n (15.1) y ( 15.2) llevan consigo

Segn la terminologa de Yule (1960) : (A 1 B 1 ) (A 1 B 2 ) (A,B,) + (A 1 B 1 ) (A)


(1 5.3)
~ = TB;i = (B 1 ) + (B 2 ) =-;-
(A 1 B 1 ): nmero de catlicos (A 1B 2 ): nmero de catlicos
.,.. latinos. sajones. (A1B1) (A 2 B 2 ) (A 2 B 1 ) + (A 2 B 1) (A 2 )
,
(15.4)
(.8) = ~ = (B )1
+ (B 2 ) = - 11-
274 / Estadistica para Psiclogos Relacin entre variables nominales / 275

En conclusin, de acuerdo con ( 15.3) y ( 15.4 ). la indepen dencia entre raza y sustituimos en ( 15.9), (A 1 ) . (B 1 ) y n por sus correspondientes valores, llegamos
y religin implica (y es impl icada por) las siguientes relaciones: fcilmente a

(A,8 1) = ~ ~ el~ (A 1 B,)(A 2 B2 ) - (A 1 B2 )(A 2 B 1 1


IA B)
1
= (A,)(B,) 115.511). o sea. (15.5h ) (15.10)
ll ll 11 11
11

(A1B2l = ~ (B2) (15.6/,) que valdn cero en caso de independencia y que ser distinto de cero si existe al-
(ABz) = (A 1)(B2 ) (15,611). o sea ,
11 11 11 11 guna dependencia o relacin en tre las dos variables de q ue se trate, segn lo aca-
bado de ver hace unos instantes .
(A 2B)=~(_!!..!.!_ 115 .71,J As. por ejemplo. en la ta bla 15.1. existe independencia entre raza y r eligin.
(A2B,) = (A2)(B1) (15.7u). o sea.
n 11 11 11 Por el contrario. en la tabla 15.2. existe una gran relacin entre a mbas variables,
pues la mayora de los catlicos tienden a ser latinos, la mayora de los latinos
(A 2B2) = (Az) ~ (15.8h) tienden a ser catlicos, la mayora de los protestan tes tienden a ser sajones y la
(A2B2) = (A2HB2) (15.8a). o sea.
11 11 n mayora de los sajones tienden a ser protestantes .
11

Si es cierta una cualqu iera de las relaciones (1 5.511). (1 5.6a), ( 15.711) y (15.8a), TA BLA 15.1
lo son, tambin, las tres restantes. Consiguientemente, si es verdadera una cual-
quiera de las relaciones (15 .5h), ( 15.61!), (15.7b) y (15.8b), lo son, tam bin, las tres Catlicos Pro testantes
restantes. En otras palabras, la independencia entre raza y religin puede venir
expresada p or una de las cuatro proposiciones : la proporcin de catlicos lati- SaJones 78 52 130
nos es igua l a la proporcin de catl icos por la pro porcin de latinos, la propor-
Latinos 42 28 70
cin de protestantes latinos es igual a la proporcin de protestantes por la pro-
porcin de latinos. la proporcin de catlicos sajones es igual a la proporcin 120 80 200
de catlicos por la proporcin de sajones, la proporcin de pro testantes sajo-
nes es igual a la proporcin de protestantes por la proporcin de sajones.
Por tanto, la independencia puede ser introducida mediante (1 5.5h) o, lo que (42)(52) - (78)(28) 2.1 84 - 2.184
,/ = - -- -- - = - - - - = ()
es equivalente, m ediante ( 15.5a ). Ahora bien, esto es lo mismo que aceptar como 200 200
criterio de independencia,

ti= (A 1 B 1 ) - (A-' )(B


- __ ., ) = () TABLA 15.2
11

Catlicos Protestantes
Si d = O, tendremos independencia. En cambio, si d 4' O, existir alguna depen-
dencia o relacin entre raza y religin. En otras palabras, Sajones 10 75 85

Latmos 100 15 115


el= (A B J - (A)(B) = n(A B) - (Ai)(B 1 ) ( 15.9)
1 1
11 n 110 90 200

puede ser introducido como indice de correlacin .


(100)(75) - (10)( 15) 7.500 - 150
Si advertimos q ue d = - - - - - - = - - - - = 36.75
200 200
(Ai) = (A 1 B 1 ) + (A 1 B 2 )
.!' (B1 ) = (A 1 Bi) + (A 2 Bi) No o bstante, este nd ice d ta l como ha sido definido, presen ta dos inconve-
n = (A,8 1 ) + (A,B2 ) + (A 2 B) + (A 2 B2 ) nientes notables:
276 / Estadistica para Ps,clogos Relacin entre variables nominales / 277

a) No existe un valor numenco mximo al cual podamos referir el d obte- Sin em bargo, aunque Q = 1 Q = - 1, la relacin no es necesariamente
nido en un caso concreto. Por consiguiente, no podemos hacernos una idea apro- perfecta. Por ejemplo, en el cuadro siguiente, ni todo catlico es latino, ni todo
ximada sobre la magnitud del d encontrado en una situacin concreta. Ms an, sajn es protestante. A pesar de ell o. Q = 1.
manteniendo constantes los porcentajes de las cuatro casillas interiores, pode-
mos hacer que d aumente tanto como queramos, con tal de aumentar el tamao
de la muestra . Asi, por ejemplo, si en la tabla 15.2 multiplicamos por 10 todas las
casillas, d pasar a valer 367,5; y si las multiplicamos por 100, d pasar a valer Catlicos Protestantes
3.675. Y, sin embargo, la contextura intrnseca del cuadro es la misma en los tres - ----~ - - -
Sajones 30 40 70
casos:
Latinos 75 o 75

Catlicos Protestantes
- --
105 40 145

Sajones 5% 37,5 % 42,5 %


(75)(40) - (30)(0) 3.000
Latinos 50% 7,5 % 57,5 % 1
Q = (75)(40) + (30)(0) = 3.000 =
55 % 45,0 ~~ 100.0 %

b) Existiendo relacin perfecta entre las dos variables (por ejemplo, todo
15.2.2. Clculo
catlico es latino, todo latino es catlico, todo protestan te es sajn y todo sajn
es protestante), d puede tomar valores muy distintos. As, por ejemplo, consi- Basta con aplicar la d efini cin dada.
deremos los dos casos siguientes: EJEMPLO 15. l. Calculemos Q entre raza y religin a partir de la tabla l 5.3.

Catlicos Protestantes Catlicos Protestantes


TABLA 15.3
Sajones o 1 1 Sajones o 50 50 Catlicos Protestantes

Latinos 99

99
o
1
99

100
Latinos 50

50
o
50 - 50

100
Sajones

Latinos
20

100
70

10
90

JJO

120 80 200
(99)( 1) - 0 99 (50)(50) - O 2.500
d = - - -- = - = O 99 d = --'- - =- = 25
100 100 ' 100 100
Q = (100)(70) - (20)(10) = 7.000 - 200 = 6.800 = 0,944
Para evitar estas dificultades, Yule (1965) propone el coeficiente Q definido as : (100)(70) + (20)(10) 7.000 + 200 7.200

Q = (n )(d) = (At B 1 )(A 2 B 2 ) - ( A 1 B 2 )(A2B,) (IS .l l)


(A 1 B1 )(A 2 B 2 ) + (A 1 B2 )(A 2 B 1 ) (A 1 B)( A 2 B 2 ) + (A , B 2 )(A 2B 1 ) El signo de Q es fun cin de la organizacin del cuadro de frecuencias, supues-
tos unos mismos datos. Por ello, la tctica ms sensata para interpretar dicho
Si la relacin es nula, d = O y, por tanto, Q = O. signo, es obser var el cuadro de frecuenc ias. Cualquier otra norma rgida puede
Si,1a relacin es perfecta, (A 1 B2 ) = (A 2 Bi) = O, , (A 1 B1 ) = (A 2 B 2 ) = O. llevarnos a interpretaciones equivocadas. As, por ejemplo, los mismos datos de
En el primer caso , Q = 1. En el segundo, Q = - 1. la tabla 15.3 pueden legtimamente aparecer o rganizados d el modo siguiente:
278 / Estadstica par a Ps iclogos Relacin entre vanables nominales / 279

TAB LA 15.4 15.2.3. Propiedades

Catlicos Protestantes a) El coeficiente de correlacin Q no p uede valer menos que - 1 ni ms que l.


Es decir, - 1 ~ Q ~ 1.
Latinos 100 10 110
Ha q uedado demostrado en el prrafo anterior.
- h) Multiplicando los dos elementos de la primera fila de la tabla de frecuen-
Sajones 20 70 90
cias por una constante cualquiera, los dos de la segunda fila por otra, los dos de
80 200 la primera columna por otra distinta y los de la segunda por otra cualquiera, Q no
120
vara. La razn est en que en cada uno de estos productos multiplicamos nume-
rador y denominador de la frm ula de Q por una m isma constante y, por tanto ,
. (20)(10) - (100)(70) 200 - 7.000 - .800 el cociente, Q, no vara .
Q - --'----- = - - = -0.944
(20)( 10) + ( 100)(70) 200 + 7.000 7.200 As, por ejem plo, de la tabla 15.5 pasamos a la l 5.6 m ultiplicando 4 y 3 por 2.
De la tabla !5.6 pasamos a la 15.7 multiplicando 1 y 2 por 4. De la tabla 15.7 pa-
samos a la 15.8 multiplicando 8 y 4 por 5. De la tabla 15.8 pasamos a la 15.9 mul-
Es evidente q ue en ambos casos la relacin entre raza y religin es la mism a. tiplicando 6 y 8 por 3. El lector puede comprobar cmo en las cuatro tablas
El signo ha cambiado por el mero hecho de haber trastocado el orden de las filas. Q= -5/ 11.
colocando la fila de los latinos por encima de la de los saj ones (tabla 15.4) en vez
de dejar la fila de los latinos por debajo de la de los sajones (ta bla 15.3). Sin em- TA BLA 15.5 TABLA 15.6 TABLA 15.7 TA BLA l 5.8 TABLA 15.9
bargo, ambas tablas manifiestan una misma relacin entre raza y religin, a saber :
aparece una clara tendencia entre los catlicos a ser latinos y ent re los latinos a
ser catlicos; entre los protestantes a ser sajones y entre los sajones a ser protes-
tantes. En otras pala bras, existe una clara relacin positiva ent re ser catlico y
ser latino y entre ser latino y ser catlico; entre ser protestante y ser sajn y entre
ser sajn y ser protestan te. Es claro que esta misma relacin puede ser traducida
l'I7
~
8

1
6

2 QJ -

8
40

20
6

8
40 1 18

-;o-- 24
!

as : existe clara relacin negativa en tre ser catlico y ser sajn y entre ser sajn
15.3. Coeficiente x
2

y ser pro testan te; entre ser protestante y ser latino y entre ser latino y ser protes-
tante. 15.3.1. Fundamento y frmula
EJEMPLO 15.2. Getzels y Jackson (1962) distinguieron entre los adolescentes
dos tipos de talento : inteligentes y creativos. Estudiando la relacin entre el tipo Mejor sera llamarle X 2 u otro simbolo distinto d e x2 En realidad, lo que aqu
de talento y la profesin del padre de los adolescentes considerados, llegaron al vamos a llamar ,..2 no es ms que un estad stico cuya distri bucin de probabilidad
siguiente resultado: se aproxima a la distribucin de p robabilidad llamada x2 , a med ida que aumenta
ms y m s el tamao de la muestra. Sin embargo, le llamarem os x2, dada la uni-
Profesin del padre
versalidad de esta designacin en los libros de Estadstica para psiclogos.
El coeficiente x2 lo proponemos aqu pri ncipalmente como medio para poder
Prof. univcrs. Negocios calcular el coeficiente de contingencia C, d el q ue hablaremos inmediatamen te
despus.
Creativos 7 11 18 Recordemos que el coeficiente Q exiga q ue las dos variables constaran de slo
Tipo de talento dos categoras. Ahora bien, cada una de las d os variables puede constar de dos o ms
Inteligentes 15 4 19 categoras. No o bstante, el modo de razonar es el anlogo al seguido al tratar del
-- - -- - --~ --- coeficiente Q. Supongam os, por ejemplo, la variable religin (con tres categoras)
22 15 37
y la variable raza (con dos). segn el cuadro de la pgina siguiente.
(A;) y (B;) represen tan el nmero de personas dentro de las categoras A, y B,,
respectivamente. (A ;B;) representa el nmero de p ersonas que pertenecen simul-
.,,.; (15)( 11) - (7)(4 ) 137
0 71
tneamente a la categora A , (de la var iable A : religin) y a la categora B1 (de la
Q = (15)(11) + (7)(4) = 193 = varia ble B: raza).
280 / Estadistica para Psiclogos Relacin entre variables nominale s / 28 1

A, A1 A, A y B no son independientes para ese grupo, es decir, que existe cierta relacin
(catlicos) (protestantes) (Judos) entre A y B. Esta no independencia (o relacin) tender a ser mayor a medida que
las frecuencias empricas se alejen ms y ms de las tericas. P ues bien , llamando
B 1 (sajones) (A,B 2 ) (A 2 B 2 ) (A,B1 ) (B,l J. a las frecuencias tericas y f. a las frecuencias empricas, definiremos 7. 2 del modo
siguiente:
B 1 (latinos) (A,B) (A 1 B,) (A 3B 1) (B, )

(A,) (A,) (A3} n x2 = I: u~- r,' (15.1 2 )

El signo de sumar, l:, va de I a (r)(s), siendo r el nmero de categoras en la


Si no hubiera relacin entre A y B, encontraramos la misma proporc10n de
variable A y s el nmero de categoras en la variable B, o sea, siendo (r)(s) el n-
catlicos entre latinos y sajones, de protestantes entre latinos y sajones, de judos
mero total d e casillas en la tabla de frecuencias.
entre latinos y sajones. Es decir,

(A 1 B) (A 1 B 2 ) (A 1B 1 ) + (A 1 B 2 ) (A 1 )
15.3.2. Clculo
(E) = (BJ = (8
1
) + (B )
2
= -n-
Es una mera aplicacin de la frmula anterior.
Por consiguiente, EJEMPLO 15.3. Con el fin de estudiar el influjo de las condiciones ambienta -
les en que se desarrollan los gatos sobre su tendencia a cazar ratones, Kuo (] 930)
(A,B ,) = (A,)(B 1 ) (A B
1 2
) = (A)(B2 ) cri gatitos en distintas condiciones: 20 fueron criados en aislamiento; 21 con
n n sus madres, vindolas cazar ratones y 18 fueron criados con ratones. Despus
del perodo de crianza, a cada gatito se le presentaba un ratn para ve r si lo ma-
(A 2 B) (A 2 B 2 ) (A 2 B 1 ) + (A 2 B 2 ) (A 2 ) taba o no. Pues bien, encontr los siguientes resultados :
(E)=~ = (B 1 ) + (B 2 ) =-;;-
Por tanto,
Forma de crianza
(A B)
2
= (A 2 )(B 1 ) (A B,)
2
= (A 2 )(B2 )
n En aislamiento Con sus madres Con ratones
"
Respuesta Matarlo 9 (10,1 7) 18 (10,68) 3 (9, 15) 30
(A 3 B) (A 3 B 2 ) (A 3 B 1 ) + (A 3 B 2 ) (A 3 ) ante el
(E)=~= (B )
1
+ (B2 ) = -n- roedor No matarlo 11 (9,83) 3 (l0,32) 15 (8,85) 29
-
Por consiguiente, 20 21 18 59

(A 3B1) = (A3)(B1) (A B )
3 2
= (A3 )(B 2 )
En cada una de las seis casillas hay dos nmeros, uno sin parntesis (la fre-
11 n
cuencia emprica, la encontrada, de hecho ), otro dentro de un parntesis (la fre-
cuencia terica, la que debera aparecer en caso de independencia). Segn lo dicho,
Ntese que la independencia implica que la frecuencia de cada casilla sea igual
estas frecuencias ter icas se calculan as:
al producto de sus dos frecuencias marginales dividido por el nmero total de
personas. Llamemos frecuencia terica a esta frecuencia que debera aparecer
en cada casilla en caso de independencia. Si observando un grupo de personas, (20)(30) = 10,17 (21 )(30) (18)(30) = 9,15
10,68
las frecuencias encontradas, de hecho (que llamaremos empricas) coinciden con 59 59 59
las terk,as, diremos que no existe relacin entre las dos variables en cuestin , (20)(29) = 9,83 (21)(29) (18 )(29) = 8,85
A y B / para ese grupo de personas. Por el contrario, si no coinciden , diremos que 59 -59 = 10,32 59
282 / Estadistica para Psiclogos Relacin en/re var,ab/es nomina l es / 283

Por consiguiente. Segn (15 .12):


2 2
2 (9 - 10,17)2 (18 - 10,68)2 (3 - 9, 15)2 (11 - 9,83) (3 - 10,32) 2 (- 1,6)2 (1,6)2 ( 1,6) 2 (- 1,6) 2
X = - - - - + ----'--- + - - - - + - - - - + - - -'------'-- + X = -- - + --- - + - -- - + - - - - =
. 10,17 10,68 9, 15 9,83 10,32 . 3.6 8,4 2,4 5,6

+ ( I5 - 8,85): = ~_22_ + 53,58 + 3?_,_8_3 + 1,37 + ?3,58 + ~2_:8} = O, J3 + = (1,6) 2 (0,2778 + 0, 119 1 + 0,4167 + 0,1786) = (2,56)(0,9922) = 2,54
8,85 10,1 7 10,68 9,15 9,83 10,32 8,85
Segn (15.13):
+ 5.02 + 4, 13 + 0, 14 + 5,19 + 4,27 = 18,88
2
2 = (20)(40 - 8) = 20.480 = 2 54
En el caso en que cada una de las dos varia bles conste de slo dos categor as,
X. (12)(8)(6)(14) 8.064 '
tendremos la tabla siguiente:
Como vemos, tanto ( 15.12) como (15.13) nos llevan a l mismo resultado.
Con tablas de frecuencias de dos fil as y dos columnas es recomendable la co-
1 (u+ h) rreccin de Yates, especialmente cuando una o ms de las frecuencias tericas
h
" 1 en las cuatro casillas es pequea . (Por pequea se suele entender menor que 5 y
e d 1 (e+ d) aun menor que I O.) Mediante ella,

(a+ e) (b + d) \ 11 x2 = I (IJ, - 1,1- o,5)2 n(I cb - adl - n/2)2


r, (11 + h)(c + d)(a + c)(h + d)

Calculemos en el ejemplo siguiente x2. primero sin la correccin y luego con ella.
En l, a, b, e y d son las cuatro frecuencias empricas y n = a + h + e + d.
Las cuatro frecuencias tericas sern:

(e+ d)(a + e), (e+ d)(h + d) 1 (1 ,2) 2 (1,8) 3


(a + b)(a + e) (a + b)(b + d)
>-- -- - - 4- ~ - - - --
n n n n 3 (2,8) 4 (4,2) 7
- ---
Pues bien, es fcil probar que, bajo estas circunstancias, 4 6 10

(n)(ch - ad) 2 (1 5.13)


r.2 (a + b)(c + d)(a + c)(b + d) (-0,2)2 (0.2)2 (0,2) 2 ( - 0,2)2
X2 = - - - + -- + -- + - - =
1,2 1,8 2,8 4,2

EJEMPLO 15.4. A partir de la tabla siguiente calculemos/, apl icand o (15.12) = (0,2) 2 (0,8333 + 0,5556 + 0,357 1 + 0,2381) =
y (15. 13). = (0,04 )( 1,984 1 ) = 0,079364

2 (3.6)
1
1 ' (8.4) 12 Con correccin y usando la primera fr mula :

2 2
4 (2,4) 1 4 (5,6) 8
X2 = ~(0,2-- -~
0,5)
+ -(0,2 -~--
- 0,5)2
+ (0,2
- -- -0,5)2
--- + (0,2 - 0,5)
-'---'----'--- =
f" L 1,2 1,8 4.2 2.8
6 1 14
'
20
(0,3)2(1,9841) = 0, 178569
284 / Estad is tica para Psiclogos Rel ac,n entre var,ab/es nominal es / 285

Con correccin y usan do la segunda frmula: podemos hace que 7. 2 au mente, a pesar de que las proporciones de todas las casi-
llas sean las mismas an tes y despus de dicha multiplicacin . Pues bien, una ma-
2
2 = ( 10)( j6 - 4 1 - I0/ 2 ) = (I0)( - 3)2 = _2.Q_ = O 178570 nera de evitar este incon veniente es uti lizar C. defin ido d e la siguiente manera :
X (3)(7)(4 )(6 ) 504 504 ,

Como se ve, el valor de x2 vara a l usar la frm ula sin correccin y la f rmula
corregida. Es d ebido a lo pequeas que son las frecuencias tericas. La importan-
C =
ffi .
cia de esta diferencia se ver mejor al estudiar Estadistica In ferencia!.
C uando la ta bla es de dos lilas y d os columnas, la diferencia lf. - ; (es decir,
15.4.2. Clculo
tomada en valor a bsoluto) es la misma en las cuatro casil las. El lector se encar-
gar de demostrar esta afirmacin en el ejercicio 15. 7. Es una mera ap licacin de la frm ula anterior.
EJEMPLO 15.5. Calculemos C a partir de x2 = 18,88 o btenido en el ejem -
p lo 15.3.
15.3.3. Propiedades

a) Al multiplicar por una constante k las frecuencias de todas las casillas


de un cuadro de frecuencias (con cualquier nmero de fi las y cualquier nmero
de columnas) x2 q ueda multiplicado por esa co nstante.
e= F, 18,88
oo = V02424
~ -o -
1 ,
-
u ,.L<t..:: = 0' 49

En efecto, llamemos xi al valor de x. 1 antes de la multiplicacin y ;d al valor


de x2 despus de multiplicar todas las frecuencias por k . Tend remos,
15.4.3. Propiedades

2 =I (k l. - k lrJ2 = ~ I y; =1;i2 = k x.2 a) El coefi ciente de contingencia C no valdr menos que cero n valdr uno
x. k (, k (, 1
o ms. Es decir, O :;; C < l.
Basta con mirar la f rmula de C para convencerse q ue nunca podr llega r
Compruebe el alumno cmo, en efecto, el valor de _2 es 10/3 a partir de la ta a valer u no, pues el numerador ser siempre menor que el denomin ad or, para todo
bla 15.10 y 40/3 a partir de la ta bla 15.1 l. valor fi nito de n. Por otra parte, de las d os races posibles aceptam os para C la
TABLA 15. 11 p osi tiva, con lo cual no tiene sen tido hablar de valores nega tivos de C. Por con-
TAB LA 15. 10
siguiente, C nos indica la magnitud de la relacin entre dos variables. El significado
8 4 32 16 48 positivo o negativo de la misma lo tendremos que inferir a base de la tabla de con
tingencia, considerando cmo se encuentran distribuidas las frecuencias en las di-
A) 2 6 8) 8 24 32 versas casillas. Incluso a veces, ni tendr sentido hablar del signo positivo o nega
tivo de C, sino m eramen te de la intensidad de la relacin entre las dos variables
10 10 40 40 80 en cuestin . Esto suceder cuando la ta bla de contingencia tenga ms de dos filas
o/y ms de dos colum nas.
NoTA . En bastantes textos las tablas de frecuencias de que hem os venido b) Es fu ncin d el nm ero de lilas y columnas. De aqu que dos C's (entre
hablando suelen ser denominadas tablas dt' contingencia (con tingency tables). las mismas variables, X e Y) slo son comparables si la primera C y la segunda .
amba s han sido calculadas a partir de dos tablas de con tingencia tales que la pri-
mera tiene el mismo nm ero de filas que la segunda y la primera tiene el mismo
15.4. Coeficiente de contingencia, C nmero de columnas q ue la segun da. As, por ejemp lo, sern comparables dos
C's si la primera ha sido calculada a par tir de una tabla de co ntingencia con cinco
15.4.1. Fundamento y frmul a fil as y dos col umnas y la segunda a partir de o tra tabla, tam bin, con cinco lilas
y dos colu mnas. (Suponemos, n aturalmente, que son las mismas las variables
Aca~.mos de ver que x2 es funcin den. Hemos visto, en efecto, que mul tipli estudiadas en ambos casos .) En cambio, no sern comparables dos C's, si una tabla
cando 01as frecuencias de todas las casillas por una constante sulicientemente alta. tiene cuatro lilas y dos columnas y la otra tiene siete fi las y tres columnas.
Relac16n entre v anabtes nommales / 287
286 / Estadistica p ara Ps ,clogos

e) Si la tabla de contingencia, a partir de la que obtenemos C , tiene igua l Po r consiguiente.


nmero de lilas que de columnas (\lamemos a ese nmero, k ) se demuestra que
el valor m ximo que puede alcanzar C viene dado por J k - 1 )/k . As, e= J 201120 + 20 = J/2 = 0.107

para k =2 Cm;, = J2---= 1)/2 = fe = 0,707 d ) Las distribuciones de am bas variables pued en ser de cualquier forma .
C puede ser calculad o y tiene sentido sea cual sea la fo rma de a m bas distribuciones.
k =3 cm... = J3=-i" )/3 = ./2/3 = 0,816 e) Puede ser calculado a cualq uier nivel d e medid a. Si la s var iables son cuan -
tita tivas, C puede ca lcula rse y tie ne sen tid o, sea cua l sea el diagrama de dispersin .
k =4 cm,, = fe-=- )/4 = J 34 = 0,866 /) N o es comparable directamen te con otros ndices de correlacin como
. ' . .. ..... .. .. . . .. . . . . ... . .. .. . . . . rx, r,, etc. De a qu q ue no parezca muy recomendable in terpretar como r,,. el co-
c iente C/Cm;, .
k = 10 cm = J- 1)/ 10 = )9110 = 0,949
. . . . . .. . . . .. ' . . .. . . . . . . . . . .. . ... . . . . . .. ' . . .
Esto quiere decir, que el C.,,;, no alcanzar el valor 1, para va lores fin itos de 15.5. Interpretacin de Q y C
k por grandes que sean . Solamente en el lmite alcanzara ese valor. Es decir.

lm
11 -a::
J:"= 1)/k = lm J 1- ~1/k ) = .1
1 - a::
Como en ocasiones anterio res, la nica mterpretac10n razonable de un valor
determinado de Q y de C es compararlo con los valo res enco ntrados p or otros
inves tiga dores trabajando con las mismas variables o va riables semejantes. /\de-
Vamos a comprobar el valor del Cm, para el ca so de una tabla de contingen-
m s, en el caso de C, para q ue sea sensata la com paracin, es necesario que nues-
cia de dos fil as y d os columnas. tro coefcien te C haya sido calcula do a partir de una tabla de contingencia con
Las dos tablas de contingencia siguientes implican m xima correlacin. Com-
el mism o nmero de lilas y de col umnas que tenan las ta blas de contingencia de
probemos cmo en ambos casos C = fir2 = 0,707 . los otros investigadores o con un n mero muy parec id o.

1 (0,1) O (0,9) 1
15.6. Resumen : Definiciones y frmulas
O (0,9) 9 (8.1) 9

1 9 10 Coeficient e Q

Q _ (A , B , )(A 2 B 2 ) - (A 1 B 2 )(A 2 B 1 )
(0,9 )2 (0,9)2 (0,9)2 (0 ,9)'
/ = - - + - + -- + - - = 8, 1 + 0,9 + 0,9 + 0. 1 = 10 - (A , B )(A 2 B2 ) + (A 1 B 2 )(A 2 B 1 )
0. 1 9 9 8. 1

Por consiguiente,

c=J 1010 0 + 10 = J12 = 0.101 Coe/icirnh' ,.'

O (3.2 ) 4 (0.8) 4 x2 = I i& -r, _r,2


--
16 (12.8) O (3.2 ) 16
Coeficiente C
16 4 20

Y/7
2
! "
l.
,
= u(3.2) 2 {J,2)2 13.2)'
+ o.8- + ti ll + "3,2
(3.2)
= 3.2 + 12,8 + 0.8 + 3.2 = 20 e= ~ --,.2
288 / Estad1st1ca para Ps iclogos

15. l.
EJERCICIOS

Ca lcular el coeficiente Q de Y ule a pa rtir de los c uadros siguien tes:


16
Relacin entre variables dicotmicas
o dicotomizadas
<t)~ b)~ ,)~ d)~

~ ~ ~ ~
15.2. Calcular el coeficiente x2 a pa rtir de los cuadros siguientes:

<t)~

~
h) 6

10
14

26
10

14
e)~

~
d) i5 3 3
16.1. Conceptos previos

16.1.1. Variables dicotmicas


7 2
Aquellas que por su propia naturaleza slo pueden manifesta rse segn dos
modalidades : sexo (varn-mujer). nacionalidad (n acional-ex1ranjero ). estado vi-
tal (vivo-muerto), etc.
e) 10 6 4 f) 1 22 19 7
- .
5 12 3 3 1 2 16.1.2. Variables dicotomizadas
~ -~ - >---- -.---------
o 2 8 o 41 Aquellas que por su propia natura leza pueden ma nifeslarse segn muchas
1
modalidades (al menos. segn tres ), pero que, de hecho, slo se las perm ite mani-
fest a rse segn dos: aprovechamiento escolar (aprobado-suspenso), a ltura (alto- ba-
jo), nmero de hijos (menos de tres hijos-tres o ms hijos). e tc.
15.3. Calcular el coeficiente de contingencia C, a pa rtir de los cuadros expues-
tos en 15.2.
15.4. Sabiendo que vale 0,4 el coeficiente de contingencia respecto a un grupo 16.2 . Coeficientes d e correlacin que son mera aplicacin de r,.,
de 126 personas, cunto valdr x2 para ese mismo grupo ?
2
15.5. Sabiendo que ( ~ ) = 0,90 y que la tabla de contingencia es de 5 por 16.2.1. Coeficiente de correlacin biserial puntual r "
crnax
5, calcula r el valor de C. a) Fundamento y frmula
15.6. Demostrar que en cualquier tabla de contingencia la suma de las frecuen -
Introduzcamos una variable X, cuantitativa continua (eventualmente, discreta )
cias tericas tiene que ser igual que la suma de las frecuencias empricas.
y otra variable Y, u1cotm1ca. sta slo admite d os moda lidad es a las cuale~ vamos
15.7. D emostrar q ue en una tabla de contingencia de 2 p or 2, la d iferencia a atribuir dos nmeros cualesquiera distintos que, por sencillez, suelen ser el O y
Jf, - J.J (es decir, tomada en valor absoluto) tiene que valer lo mismo en las cua- el 1. Consideremos estos dos va lores como autn ticos n meros. Supuesto esto,
tro cas\_as . tendremos dos colum nas de nmeros. La primera, referida a la var iable X, que cons-
15.8. D ed ucir la frmula (15.13) a partir de la (15. 12). ta r de bastantes nmeros distintos y la segund a. referida a la va riable !', que slo
290 / Esrad,st,ca para Ps,c/ogos Relacin entre var,ables d1cotm1cas o d,cotomaadas / 291

constar de ceros y unos. Pues bien, la frmula del coeficiente de correlacin bisc-
X
., n, x 1
rial puntual no es ms que la frmula del coeficiente de correlacin de Pearson "r 11, rr, X X li:X nP" n"''
aplicada a estas dos columnas de nmeros. 24-28 6 1 7 2 4 14 28 12 2
Se demuestra (vase 16. 7. Apndice), que el coeficiente de correlacin de Pearson 19-23 6 2 8 1 1 8 8 6 2
baJo estas condiciones, es decir, el coeficiente de correlacin biserial puntual, 14-18 5 4 9 o o o o () o
rhp viene dado por 9-13 4 4 8 -1 1 -8 8 -4 - 4
. -
-
~.i
x . ,/pq 116.l )
4-8 1 7 8 - 2 4 - 16 32 - 2 - 14
J hp - S J.
22 18 40 - 2 76 12 - 14

= ?l'_=- -~
s, yq,_ 116.2 )

(26, 1), (26, 1 ), (26. 1), (26, 1), (26, 1), (26, 1), (26.0); las ocho siguientes : 121, 1). (21, J ),
X es la variable cuantitativa con!nua e Y es la dicotmica . (21 , 1), (21,1 ), (21,1 ), (21 , 1), (21,0), (21,0); ... ; las ocho ltimas : (6,l ), (6,0), (6,0 ),
p es la proporcin de personas con una de las dos modalidades posibles en la (6,0), (6,0), (6,0), (6,0), (6.0). Pues bien, ri,p no es ms que r , , aplicado a estos cua-
variable F. renta pares de nmeros.
q es la proporcin de personas con la otra modalidad. Calculemos previa men te los elementos que aparecen en las dos frmulas
XP es la media en X de las personas cuya proporcin es p . de rbp
l\ es la media en X de las personas cuya proporcin es q.
X es la media en X de todas las personas. x = 16 + (5)( - 2/40) = 16 - 0,25 = 15. 75
sx es la desviacin tpica en X de todas las personas. x. = 16 + (5 )( 12/22) = 16 + 2,73 = 18.73
N tese que (16.1) admite una interpretacin muy razonable. Supongamos. x. = 16 + (5)( - 14/ 18 ) = 16 - 3.89 = 12, 11
en efecto, que X representa agresividad, Y representa sexo, p es la proporcin s, = (5))76/40 - 4/ 1.600 = (5)JI.9 - 0,0025 = (5 ),/1-:8975
de varones, q la de mujeres y que los varones de nuestra muestra son ms agresivos = (5 )( 1,378) = 6,89
que las mujeres. Bajo estas condiciones, XP (agresividad media de los varones ) p = 22/40 = 0,55 q = 18/ 40 = 0.45
ser mayor que x. (agresividad media de las mujeres) y x. - x.
ser tanto mayor
cuanto ms difieran en agresividad los varones de las mujeres, cuanto ms estrecha De acuerdo con la tabla B (Apndice 111. al final del libro):
concomitancia o correlacin exista entre ser varn y alta agresividad y entre ser
mujer y baja agresividad. Ahora bien, segn (16. l ), rbp tender a crecer con x. - 1\, , /pq = J o,55)(0.45l = o,4975 ,/piq = .,./(0.55)/(0,4 5 ) = 1.106
es decir, con la correlacin entre el sexo y la agresividad. Por consiguien te, rbp apa-
rece como ndice idneo de correlacin. Algo parecido poda decirse sobre (16.2).
Entonces, aplicando (16. 1).

b) Clcufo r bp = l 8, 73 - 12.11 0.4975 = 6,62 0.4975 = 3.29345 = 0.48


6.89 6,89 6,89
Apliquemos (16.1) y (16.2) al siguiente ejemplo.
-:V EJEMPLO 16.1. Un grupo compuesto por 22 varones y 18 m ujeres han ob- Y aplica ndo (16.2)
tenido las puntuaciones que se muestran en el cuadro de la pgina siguiente, en
un test de inteligencia espacial. rbp = 18.73 - 15. 75 1.106 2.2~ 1.106 = 3.29588 = 0,48
En este cuadro la variable X, inteligencia espacial, es contin ua. La variable 6,89 6,89 6,89
Y, sexo, es dicotmica .
Por su parte, llv representa el nmero de varones (a los que atribuimos un 1 Usando la frmula y el esquema anterior , es claro que r
ser positivo (negativo)
en Y); nq representa el nmero de mujeres (a las que atribuimos un O en Y) ; n, re- siempre que x.
sea mayor (meno r) que x.
Esto significa que si rhp es positivo. a
presen~ ] nmero total de personas. Por tanto, las siete primeras personas (co- ser alto en X corresponde pertenecer a la categora cuya proporcin es, y a ser
m enzando ppr arriba) han obtenido en X y en Y los siguientes pares de puntuaciones : bajo en X corresponde per tenecer a la ca tegora cuya proporci n es ,. Si ,-b p es ne-
292 / Esradist,ca para Psiclogos Relacin entre variables dicotmicas o d1c otom1za das / 293

gativo. a ser alto en X corresponde pertenecer a la categora cuya proporcin es q Es decir, a, h. e y e/ representan el nmero de personas cuyas p untuaciones
y a ser bajo en X corresponde pertenecer a la categora cuya proporcin es p. en X e Y son respectivamente : (O, 1), (1, 1), (0,0), (1,0 ). Asimismo, (a + h) representa
El esquema anterior es arbitrario. Otros serian posibles. Sin embargo, le segui- el nm ero de personas con puntuacin igual a I en Y (o. mejor an, el nmero
remos siempre para evitar confusiones. No obstante, conviene que el alumno se de personas pertenecientes a la categora de Y a la que hemos atribuido el valor 1 ),
acostumbre a considerar la tabla de frecuencias y, a partir de la misma, interprete (e + d) representa el nmero de personas con pun tuacin igual a Oen Y, (a + e)
oportunamente el valor posi tivo o negativo ofrecido por la frmula. En nuestro el de las personas con puntuacin igual a O en X, (h + d ) el de las personas con pun-
ejemplo, rb, = 0,48 es positivo. Esto quiere decir que a ser alto en X corresponde tuacin igual a I en X.
pertenecer a la categora de los varones y a ser bajo en X corresponde pertenecer Usando el esquema anterior, si <P es p ositivo (negativo) quiere decir que es
a la categora de las mujeres. positiva {negativa) la relacin entre la categora O en X y la categora O en Y, o entre
Desde luego, no es necesario atribuir unos y ceros. Bastara con llamar X, la categora 1 en X y la categora l en Y. Con todo, lo mejor es estudiar el cuadro
a la media del grupo de personas cuya proporcin es p y 1\ a la media del grupo de frecuencias para asegurarse del signo de la relaci n.
cuya proporcin es q. Hemos atribuido ceros y unos para hacer ver cmo ,.bp no es
ms que una aplicacin de r,,, al caso de dos variables, una cuantitativa continua y
la otra dicotmica . Compruebe el alumno cmo r, ,., aplicado a los 40 pares de que b) Clculo
hemos hablado ms arriba, vale 0,48.
Apliquemos (16.3) al ejemplo siguien te :
EJEMPLO l 6.2. Calculemos la relacin posible entre poseer coche y poseer
16.2.2. Coeficient e de correlacin, e, piso a partir de los datos que proponemos a continuacin . Se trata de dos variables
dicotmicas: o se tiene o no se tiene coche, o se tiene o no se tiene piso. A tribuyamos
a) Fundllmcn/0 y frmulll un O a las categoras no coche y no piso; atribuyamos un J a las categoras
coche y piso>: . Supongamos que tenemos la siguiente labia de frecuencias :
Introduzcamos dos variables dicotmicas, X e Y. Cada una de ellas admite
slo dos modalidades a las que vamos a atribuir dos nmeros distintos que, por
sencillez suelen ser el O y el J. Consideremos estos dos valores como autnticos
X
nmeros. Esto supuesto, tendremos dos columnas de nmeros, cada una de las cua
les consta nicamente de ceros y unos. Pues bien, la frmula del coeficiente cp no
No coch e Coche
es ms que la frmula del coeficiente de correlacin de Pearson aplicada a estas o 1
dos columnas de nmeros.
Se demuestra (vase 16.7. Apndice), que el coeficiente de correlacin de Pearson Piso
bajo estas condiciones, es decir, el coeficiente cp, viene dado por : 1 30 60 90
)'
ch - ad (16.3)
<P = -;== = = = = = = == No piso
j(ll + h)(c + d)(a + c)(h + d) o 70 40 J 10

Donde 11. h, e, y d tienen el significado expuesto en el cuadro adjunto : 100 100 200

X
Aplicando la frmula (16.3):
o l

1 (/ b {CI + h) cp == _{';=70=)=(6=0)=-====(3=0=)(4=0=) 4_.,20=0=-= J.=


2= = ._1._00_0 = O 30
}'
) (90 )( l l 0)(1 00)( 100) ./99.000.000 9 950 '
o e d k + d)
.;- cp = 0,30 es positivo. Ello quiere d ecir que es positiva la relacin entre tener
(a + e) (b + d) n
coche y tener piso o entre n o tener coche y no tener piso. A esta misma
294 / Estadisoca para Psiclogos Relacin entre vanab/es dicormi cas o di cotom,zadas / 295

conclusin llegamos observando el cuadro de frecuencias. En l son mayora los 16.2.3. Propiedades de ' y q,
que poseen simultneamente ambas cosas o carecen simultneamente d e ellas ;
en cambio, son minora los que poseyendo una de ellas, carecen de la otra. a) Ninguno de los dos coefi cientes puede valer meno~ que - 1, ni ms q ue l.
No es necesario atribuir expresamente los unos y ceros. Basta con poner las Es decir, - l ~ rbp ~ 1, - 1 ~ <p ~ 1.
frecuencias. Hemos atribuido los unos y ceros para q ue el alumno vea cmo rp es En efecto, basta con tener en cuen ta que a mbos son aplicaciones par ticulares de r,,.
un caso particular de r, En este ejemplo tenemos 30 personas cuyas puntuaciones r bp = 1 cuando toda s las persona s con I en Y (va r iable dicotmica), oblen-
en X e Y seran (O. l ), 60 cuyas puntuaciones seran ( 1. 1 ), 70 cuyas puntuaciones gan la misma puntuacin en X (variable cuantitativa contin ua) y cuan do todas las
seran (0,0) y 40 cuyas puntuaciones seran ( 1,0). Tendramos, por tanto , 200 pares personas con O en Y, obtengan la misma puntua cin en X.
de puntuaciones. Compruebe el lector cmo, de hecho, al aplicar el coeficiente En par ticular, valdr 1, c uando la nica puntuacin en X de los que obtienen 1
de correlacin de Pearson a estos 200 pares de nmeros se obtiene r., = 0,30. en Y sea ma yor q ue la nica pun tuacin en X de los que obtienen O en Y. Valdr
EJEMPLO 16.3. Dement y Kleitman (1957) se plantearon la hip tesis de que -1 , cuando la nica puntuacin en X de los que obtienen I en Y sea menor q ue la
cuando una persona est soando. sus ojos se mueven rpidamente . Para verificarla, de los que obtienen O. N tese que en ambos casos los puntos representativos d e las
hicieron que un grupo de personas durmieran en un laboratorio y durante la noche personas estn so bre una lnea recta. Veam os dos ej emplos :
les despertaban varias veces. Unas veces, cuando presentaban movimientos oculares a ' ) T odos los va rones (1 en Y) obtienen 7 en X ; todas las mujeres (O en Y)
rpidos (M . O. R.), y otras, cuando no los presentaban. En ambas ocasiones les obtienen 2 en X ; r bp ser positivo.
preguntaban si recordaban algn sueo. Pues bien, encontraron los siguientes a ") Todos los varones (1 en }') obtienen 3 en X : todas las mujeres (O en Y)
resultados. obtienen 6 en X; ' ser nega tivo.
He aqu las correspondientes representaciones gr ficas:
X a) b
1
Despertados 1
Despertados
sin M.O.R. con M.O. R.
(7.1 ) (3 ,1
o 1 y y

Recuerdan ( 2.0)
algn sueo 1 11 152 163 o~-~.,....-~_ _,__~_ _,____ _.__ o " ( 6 ,0)

1 X
X -
y
No recuerdan
<p = 1 cuando todas las personas co n I en X obtienen l en Y, y todas con O e n
sueo alguno 149 39 188
o X obtienen O en Y.
rp = - 1 cuando toda s las perso nas con I en X obtienen O en Y. y todas con O
160 191 351 en X obtienen J en Y.
H e aqu lo, c uadros q ue rep resenta n estas dos situaciones extremas :

Aplicando la frmula (16.3). X X


1
o 1 o 1
1 cb - O
rp = - ;c.-._ __ - --
ch

22.2 19
.. - ,/(h)f<')(h)(r) d,
(f)
(149)(152 ) - (l 1)(39)
..j(l 63)(1 88)(160)(191)
22.648 - 429
J936.480.640 30.60 1,97
0,73
y
1 o /, h
y
i
1
1 ti io " O - ad
,P =----:--=-.-::=- ..
o (' o e i o l o 1

' d d ..j(11)(d)(11)(d )
1 ' 1 1
1 -ad
" d
El resitado obtenido apoya la hiptesis propuesta. (' b 11 ll = -1
mi
296 / Estadistica para Ps,clogos Rela cin entre var,ables d1co tm1cas o d1coto m1zadas / 297

Estas dos situaciones extremas quedan representadas grficamen te as: Este valor mximo es a lcanzable. por eJemplo. co n los dos cudros siguientes

(1.1)
(0. 1) 2 28 30 20 o 20
20 o 20 con lf! = 0,92 2 28 JO con lf! - - 0.92

y 22 28 50 22 28 50
y

e) Para una tab) de contingencia de dos fi las y dos columnlls. / "" nlf) 2
En efecto, basta con comparar la frmula ( 15.13) de /, con la frmula ( l 6.3 )
( 1.0) de <P (elevada al culldrado).
(0,0) X X

b) Dada una tabla con las cuatro frecuencias marginales fijas, el valor mximo 16.2.4. Interpretacin de rP y de <>
alcanzable por <P es funcin de ellas.
Acabamos de ver que <P = l slo cuando las cuatro frecuen cias marginales Segn lo dicho en ocasiones semejantes. el nico modo razonable de interpretar
son (b, e, h. e) o (a, d, a, d). En cu alquier otro caso l<P I < l. Ahora bien, fijadas un valor determinado der., o de ({) es compararlo con los va lores de rP y lf' o bte-
las cuatro frecuencias marginales, pueden variar las cuatro frecuencias interiores y, nidos por otros investigadores trabajando con las mismas o parecidas vana blcs.
consiguientemente, ({) puede ir tomando diversos valores. Lo que a hora nos interesa Conviene, adems, que sean iguales o parecidas las proporciones marginales de X en
es determinar cul de esos valores posibles es el mximo. Se demuestra que, fijadas sus tablas de contingencia y en la nuestra , y que ocurra lo mismo con las proporcio-
las cuatro frecuencias marginales, ese valor mximo viene dado por la siguiente nes marginales de Y.
expresin :

- 16.3. Coeficientes de correlacin que son estimacin de r,.


(/Jmax
i n n'.
-.:.J --';
n, nj
(en valor absoluto)
16.3.1. Coeficiente de correlacin biserial, ,.
Donde :
a) Fundamenro y frmula
n, es la frecuenc ia marginal mxima de las cuatro.
ni es su complemento, es decir, n - n;.
n; e s la frecuencia mayor de las dos restantes. Supongamos dos variables, X e Y, a mbas continuas. Una de e llas (X ) aparece
nj es su complemento, es decir, n - n;. como continua . La o tra ( Y ) aparece dicotomizada artificialmente. Por ta nto, en
Y slo tenemos, de hecho. dos categoras ; es decir, unos y ceros. Pues bien. el coefi-
Por ejemplo. el valor mximo para ciente de correlacin biserial, r., es una estimacin de r,. si Y se hubiera mantenid o
con tinua y se h u bieran c umplido las dos condiciones siguientes :
11) La distribucin d e Y. considerada como continua. es normal.
30 20 b) La relacin entre X e Y (consideradas a mbas como con tinuas) es lmea l.
20 )' 30 Se demuestra que esta estimacin. bajo las dos condiciones a ca badas d e ex-
-- poner. viene dada por:
22 28 50 22 28 50
l
. x -
" = ~ P!J. =
x-
() 6.4 )
r ,\:t
es X -
-,t-
- ~ = 0.92 =~ /! (1.5)
Y30 22 \' x ~
298 / Estad1st1ce para Psiclogos Relacin entre var,ables d1cotm1 cas o d1coto m,zedas / 299

En estas frmula s XP. X9 , X.,. e tienen el mismo signifcado que en 16.2. 1. nidos coinciden con los <latos del ejemplo 16. I a partir de los cuales hemos calculado
Por otro lado. el significado de y es el siguiente : Supongamos una distribucin rpLo hacemos as para poder comparar luego los resultados numricos alcanzados
normal con rea unidad. Sea : la abscisa que deja a uno de sus lados un rea igual en uno y otro caso. Llamemos 11P al nmero de buenos relojeros. 11 al de malos
a p y al otro un rea igual a q. Pues bien. y es la ordenada correspondiente a dicha relojeros y II al nmero total de relojeros de nuestra muestra. Sup uesto esto. apli-
abscisa :. quemos (16.4) y (16.5) al cuadro de la pgina anterior.
Recordemos los resultados previos obtenidos en 16.2. 1.

x = 15.75 xp = 18.73 f;q = 12.11 s, = 6.89


p = 0,55 q = 0.45

De acuerdo con la tabla B (Apndice lll) pq/y = 0.6253, p/y = 1.390.


Supuesto esto. aplicando ( 16.4)

No tenemos que preocuparnos por el clculo de y. pues en la tabla 8 (Apndice


111 ) podemos encontrar directamente lo que vale p/y y pq/y. sabiendo lo que vale p. ,.b = 18.73 - 12.11 0.6253 = 6.62 0.6253 = 4.1395 = 0.60
6.89 6.89 6.89
La deduccin de las frmulas a nteriores puede verse en Magnusson (1967) o en
Lord y Novick (1968).
Por no alargarnos no repetimos las o bservaciones hechas al fnal de 16.2. l, al y aplicando ( 16.5 )
tratar de rhp Dichas obse rvaciones, mutatis muwndis, pueden ser tiles, tambin ,
aqu. 18,73 - 15,751,390 = 2.98 1.390 = 4.1422 = 0.60
,.b =
6.89 6,89 6.89

b) Clculo
Esto nos indica que a ser altos en la prue ba de agudeza visu al, corresponde ser
Apliquemos (16.4) y (16.5) al siguiente ejemplo. buenos relojeros ; y a ser bajos en la misma, corresponde ser malos relojeros. No
Em,tPLO 16.4. Llamemos X a la agudeza visual e Y a la habilidad para el todo el que es alto es buen relojero. ni todo el que es bajo es mal relojero, pero , e n
oficio de relojero. Un comit de expertos califica como buenos o como malos general, los a ltos en la prueba, tienden a ser buenos relojeros y los bajos en la misma .
profesionales a un grupo de relojeros. stos. a su vez, realizan una prueba de agudeza tienden a ser malos relojeros.
visual que les permite a lcanzar puntuacion es que van de O a 30. X e Y son variables Recurdese aqu las ohservaciones hechas en este mismo contexto al tratar del
con tinuas, pero la segunda ha quedado dicotomizada anilicialmente, ya que en ella clculo de rbp al fina l de 16.2. l .
~lo son posibles dos p untuaciones: una correspond iente a buen relojero y la otra
correspondiente a mal relojero. En estas circunstancias parece muy oportuno
el uso de la correlacin biserial. Supongamos ahora que los datos numricos obte- 16.3.2. Coeficient e de correlacin tetracrica, r ,

X n, 11 a) Fundamt'nto y fm1ulas
"
24-28 6 1 7
Supongamos <los variables. X e r. ambas cominuas. Las dos aparecen d ico-
19-23 6 2 8
tomizadas artificia lmente. Por tanto, en X y en Y slo tenemos. de.- hecho, dos
14-18 5 4 9
4 4 8
categoras. Pues bien. el coeficiente de correlacin tctracrica. r,. es una estimacin
9-JJ
4-8 1 7 8 de r,,. si tanto X como Y se hubieran mantenido continuas y se hubieran cumplid o
f" las dos condiciones siguientes:
22 18 40
a ') Las distnbucioncs de X e Y. consideradas como continuas. son norma les
300 / Estadistica para Ps,clogos Relacrn entre variables d1cotm1cas o dicorom,zadas / 301

b La relacin entre X e Y, consideradas ambas como continuas, es li- X


neal.
Se demuestra que esta estimacin viene dada por el siguiente desarrollo en serie o 1
de potencias e,1 r, que, por sencillez. llamaremos r en este desarrollo.
1 60 (b) 90
}' 30 '" '
~ - 0 ~ 0 +
,,]
__ 2_:._ = ,. + ==?- + (:1 - 1)(: ' 2 - l) - + (:J - 3:)(:'3 - J:') - o 70 (< 1 40 (di 110
n ry' 2 6 24
100 )00 200
En este desarrollo a, b, e y d tienen el mismo significado que el presentado al
tratar d e cp (vase 16.2.2):
es una puntuacin tpica tal, que divide el rea (de valor unidad) bajo la curva
normal en dos reas iguales a las dos proporciones (a + c)/n y (b + d)/ n. Vamos a calcular r, valindonos del desarrollo en serie de potencias, y de la ta-
bla C (Apndice 111 ).
es una puntuacin tpica tal, que divide el rea (de valor unidad ) bajo la Utilizaremos slo los dos primeros trminos. P a ra ello necesitamos calcular
curva normal en d<'S reas iguales a las dos proporciones (e + d)/ n y z, ::', y e y ' .
(a + h)/n. En p rimer lugar.
_re y': son las ordenadas que la curva normal hace corresponder respectivamente
a las puntuaciones tpicas : y:'. (u + c )/11 = l 00/200 = 0,50
(h + d)/11 = 100/200 = 0,50
El clculo de r, mediante el anterior desarrollo en serie de potencias es labo- (e + d)/11 = l 10/ 200 = 0,55
rioso, especialmente cuando r, es alto. En este caso no ser muy aceptable la apro- (a + b )/ 11 = 90/ 200 = 0,45
ximacin obtenida valindonos slo de los dos primeros trminos, es decir, mediante
una ecuacin de segundo grado en r,. Necesitaremos tres o ms trminos, debe-
z = O, pues esa puntuacin tpica divide el rea (de valor unidad ) baj o la
remos resolver una ecuacin de grado superior al segundo. Debido a la dificul tad
curva normal en dos reas, ambas iguales a 0,50.
de estos clculos se ha n buscado otras frmulas que ofrezcan buenas aproximaciones
de r, y cuya aplicacin sea sencilla. Afortunadamente, no tenernos que p reocupar-
z' = 0,1257, p ues esa p untuacin tpica [de acuerdo con la tabla de la s reas bajo
la curva normal) divide el rea (de valor unidad ) en d os reas iguales
nos ni por el desarrollo en serie de potencias, ni por las otras frmulas subsidiarias.
a 0,45 y 0.55.
Existen tablas y diagramas que nos permiten calcular r, de modo muy sencillo
y, a la vez, bastante fiable en la mayora de los casos. Entre ellos son muy conocidos Las o rdenadas correspondientes a ;: y = son, respectivamente, 0,3989 y 0,3958.
los diagramas de Chesire, Saffir y Thurstone. Nosotros utilizaremos la tabla C Vase la tabla B, columna F (Apndice Ill). All 0,3989 corresponde a la pro-
(Apndice 111) que nos permitir calcula r r, en unos momentos, conocidas las porcin 0.50 y 0,3958 corresponde a la proporcin 0,55.
cuatro frecuencias a, h, e y d. En este supuesto,

(70)160) - (30)(40) ,.2


b) Clculo r, + (0 )(0, 1257) ----'- = r, + O
{200)2 (0,3989 )(0,3958 ) 2

Llamemos X a la variable rendimiento en aritmtica e }' a la variable ren-


Es decir:
dimiento en gramtica. Atribuyamos un I a las personas que en aritmtica y en
gramtica obtienen puntuaciones iguales o superiores a dos valores, uno en arit-
mtica y otro en gramtica . Son los aprobados. Atribuyamos un Oa las personas 3.000 = 0,47 = r,
que en ambas asignaturas obtienen puntuaciones inferiores a los dos valores ante- 6~3 15,4
riores. Son los suspensos. Por consiguiente, las dos variables, en s continuas,
aparecen dicotomizadas. o sea:
EJEMPL<f' 16.5. Supongamos que 200 personas se encuentran repartidas se-
gn el cuadro siguiente :
r, = 0,47
302 / Esrad1st1ca para Psiclogos Relacin entre vanables d1cotm1cas o d1eotom1Zadas / 303

Usando la tabla C. tenemos: Ahora bien, de acuerdo con la tabla B. (Apnd ice 11 ), ..Jqr va de 3,733. p ara
p = 0,99 ( p = O.O! ). a 1,253, para p = 0,50. Por consigu iente /pq ,y es siempre
i:ll"J = (70)(60) = 4.200 = 3,5 mayor que uno y, en consecuencia, r. ser siempre mayor que r,r para unos mismos
(u)(,/) (30)(40) J.200 datos.
Recordemos cmo para los mismos d atos del ejem plo 16. l. rr vala 0,48 y,.. va lia
En la tabla C vemos que a iodos los valores comprendidos entre 3,461 y 3.571 0.60 (ejemplo 16.4).
les corresponde r, = 0,46. e) Para unos mismos datos, r, :e (3/2)(,p) (vase Lord y N ov1ck. 1968 ). Esta
La tabla de frecuencias nos dir qu signo debemos a1ribuir a u n r, detenni- aproximacin es tanto mej or, cuanto ms se aproximen a la media na los puntos de
nado. Recurdese a este respecto las consideraciones hechas al fina l de 16.2.1 . dicotomizacin en ambas variables y cuando r, es igual o menor que 0,50. As, por
EJEMPLO 16.6. Vamos a analizar los datos presentados por Woodworth ejemplo, compr uebe el alumno cmo se verifica esta relacin en el cuadro siguiente :
( 194 I ) sobre 19 pares de gemelos univtelinos. Los dos elemen1os de cada par son
educados en ambientes diferentes. Consideremos la diferencia en educacin (X)
enlrc los dos elementos de cada par y su diferencia en cociente intelectual ( Y). JO 20 30
Tendremos 19 diferencias en educacin y 19 diferencias en cociente intelectual. r, = 0,61 (con sul1ando tahla C del Apndice 11 )
Calculemos r,. habiendo dicotomizado X e Y del modo siguiente : 15 5 20 <f! = 0.408 (mediante f rmula J
{] /2)((/)) = (3/ 2)(0.4 08) = 0.6 12 ::,, 0,61 ~ , ,
25 25 50
X: Diferencia en educacin

BaJa O Alta 1 d) Siempre que una de las cuatro frecuen cias interiores sea nula . r, = 1.
En efec to, si uno de los cuatro valores a, b, e o des nulo, claramente ad ch
X: Alta 1 1 (a) 8 (h) 9 sern nulos. Consiguientemente valdr cero uno de los dos cocientes ch/"d ad/ch.
1
[)ifcrcncia -----r-- En ambos casos, al cociente nulo le corresponde en la tabla C. (Apndice lll ) r, = 1.
en CI Baja O 1 8 (e) 2 (d) 10
1 1 El signo positivo o negativo depender de cul de los cuatro valores es nulo.
9 JO
1

1
19
'
16.3.4. Interpretacin de r y de r,
(8 H8 I = 32. En la la bla C (Apndice III) vemos que a 32 le corresponde r, = 0,89.
(1 )(2)
Esto significa que el cociente intelectual es funcin de la educacin recibida, La in1erprctacin razonable es compararlos con los valores de rb y r, obtenidos
ya que los elementos de cada par no difieren cnlre s genticamente, al ser univi por otros investigadores trabajando con iguales o parecidas variables. Conviene.
telinas, sino slo por razn del entorno distinto dentro del cual uno y otro han sido adems, t ener en cuen ta los pu ntos de dicotomizacin usados por noso1ros y
educados. por ellos.

16.3.3. Propiedades de' y de r, 16.4. Comparacin de ' J' y de'

a) El coeficienlc de correlacin biserial, rb , puede valer ms que uno (o menos 11)El coeficiente rb, es una aplicacin de r,, El coeficie nte r, es una es11maci11
que - 1). de r,,.
bajo cie rtas condiciones.
h) Para unos mismos datos, lr"Ies siempre mayor que jr.pj. b ) El coeficienle lrbpl es siempre menor q ue rl cod cicnte hl-
para uno; m is -
En efecto: mos datos .
e ) El coeficienle Ir.PI es siem pre igual o menor que l. El coefc,entc lr.l puede
:'" . ' = ! ~t pq = !__p_ - xj ;q Jpq = ,." /j,q supe rar ese valor.
el) Ambos coeficientes son usados en teor a de tests. Cada uno tiene s us ven-
Sx .V Sx y P y
304 / Estadistica para Psic logos
Rela cin entre variabl es dicotmicas o d icotomizadas / 305

tajas e inconvenientes. segn sean las situaciones concretas en que van a ser usados rh = ;__-__,__ X vr.:
X -_ __:_:_j i - X~p-
PC/ = ::_.e__:_:_
y el aspecto que desea ser considerado. Esta discusin. en si muy interesan te, no p sx sx q
la creemos oportuna ahora . El lector preocupado por este tema puede consultar Lord Coeficiente tle correlacin <p: Aplicacin de r,,, a dos varia bles, ambas dico-
y Novick (1968). tm icas.
cb - ad

16.5. Comparacin de <> y de r,


({J
J,;-;=-~~h)(c ~ d)(a + c)(b + d)
Coeficiente de correlacn biserial: Estimacin de lo q ue habra valido r,i entre
u) El coeficiente <pes una aplicacin de r,,. El coeficiente r, es una estimacin dos variables continuas, obtenidas a partir de dichas varia bles mantenindose
de r,,. bajo ciertas condiciones. una de ellas continua y ha biendo sido d icotomizada la otra.
h) El coeficiente l1PI es igual o menor que )r.l para unos mismos datos. La
diferencia tiende a aumentar a medida que los puntos de dicotomizacin en una
'. = __
x -i
__ _g -
pq =x -
:_:_,_ __
xp
- -
o en las dos variables se van alejando de la mediana . s, y s, y
e ) El valor mximo de l1P I es funcin de las frecuencias marginales y slo
puede valer 1, cuando las frecuencias marginales en X son iguales a las frecuencias Coeficiente de coll'eiacin 1e1racrirn : Estimacin de lo que habra valido r , ,
marginales en Y. Por el contrario, ir,I puede valer 1 con cualquier cuaterna de fre- entre dos variables continuas, obtenidas a partir de dichas variables d icotomizadas
cuencias m arginales. En efecto, r, = 1 con tal que sea O una cualquiera de las cuatro ambas artificialmen te.
frecuencias interiores, lo cual es siempre posible, sean cualesquiera las cuatro fre-
cuencias marginales. (Naturalmente, suponemos que estas frecuencias marginales ch - ad
,.2 ,-3
r, + zz..!.__ + (; 2 - 1)1:' 2 - J) __.!... +
son todas distintas de cero.) niy_;::- 2 6
d) El coeficiente <pes el ms apropiado cuando las variables son estrictamente
dicotmicas. El coeficiente r, cuando, siendo continuas, se encuentran dicotomi-
zadas. 16.7. Apndice : Deduccin de las frmulas
e) Si las variables continuas aparecen como tales. calclese r,,. y no se in tro-
duzca dicotomizacin alguna. Es verdad que dicotomizando simplificamos mucho de r hr y de <> a partir de,.,
los clculos, pero, a la vez, desaprovechamos mucha informacin que teniamos
en nuestras manos. Utilicemos esta informacin. Hoy disponemos de pequeas 16.7.1. Deduccin de la frmula de' a partir de r,,.
mquinas electrnicas de bolsillo que nos permiten calcular r.,. de modo muy
sencillo. Sea Y la variable dicot mica. S lo son posibl es dos puntuaciones: O y l. (Tan
g) Ambos coeficientes son usados en teora de tests.
legtimo hubiera sid o olro par cualquiera de nmeros distin tos.)
'1) No parece recomendable calcular el cocii;:nte entre el <p obtenido y el <p
Llamemos p a la proporcin de personas con I en Y, q a la proporcin de perso-
mximo e interpretar dicho cociente como r,i-- nas con O en Y, n al n mero total de personas. Por consiguiente, tendremos np
personas con 1 en Y, y nq personas con O en Y. De aqu son inmediatas las siguien-
tes relaciones :
16.6. Resumen: Definiciones y frmulas
p +q = q= l - p np + nq = n(p + q) =n
Variable dicotmica: Aquella que slo puede manifestarse segn dos nicas
modalidades. Calculemos }' y s,..

Variable dicotomi;ada: Aquella que puede manifestarse segn tres o ms mo- y _ (np)( I ) + (nq)(O) _ np _ p
dalidades, pero a la que, de hecho, slo se le permite manifestarse segn dos m oda- n n
lidades. 2 +
,.. (np)(I - p)2 _+__J_n_11_)(0 -~Ji = _llf!lf _ _ ll__lfl'_ = pq2 + qp2 = pq(p + q) = pq
2 1
Coefic:frr1e de correlacin biserial puntual : Aplicacin de r" a dos variables . s2
,.
= ~----- n n
una continua y la otra dicotmica.
306 / Estadisuca para Psiclogos Relac,n entre var,ables d 1coton11cas o dico tom,zadas / 307

En conclusin: 16.7.2. Deduccin de la frmula de <p a partir de r,,

Y=p s,. = J11q (] )


Las d os variables. X ~ Y. so n dicotm icas.

Sea XP la media en X de las np personas con I en Y. Sea p_, la proporcin de personas con puntuacin I en X.
Sea X la media en X de las nq personas con O en Y. Sea q_, la proporci n de personas con puntuacin Oen X.
9
Seas, la desviacin tpica en X de las personas. Sea p,. la proporcin de personas con puntuacin I en }'_
Es claro que : Sea q, la proporci n de personas con puntuacin O en Y.
Hemos visto en 16.7.1 que la media y la desviacin tpica de la variable dico-
L XY = (X 1 )(1) + + (X.P)(l) + (X,.p+iHO) + ... + (X.,)(0) = L X+ O =
= L X , donde L va de 1 a np
tmica. Y. valan f" = p. s, = jpq. Como a hora X e Y son dicot m1cas,
X = Px S;r = . . . _/ pxqx y= P, s ,. = "/ p,.tf,
Por consiguiente,
L XY = LX = X Es claro q ue, siendo np.,. el nmero de perso nas que obtienen I en X y 1 en J'.
np np
!:XY = {(1)(1) + +(1)( 1): + : (1)(0) + + 11)(0): + ((())(1) + +
o sea, + (0)11 ): + liO)(O ) + + (0)(0) : = 11)(1) + + (1)11) +O + O +
L XY = 11pX (2) + O = n,, ,

Bajo este supuesto,


Con estas condiciones y teniendo en cuenta (1) y (2),
LXI' !: XY - nXY IIP,,- - 11p,p,. _ P,, - PxP,- (3 )
L xy r (X - X)( Y - Y) L X Y - HX Y _ npXP - npi r ;n = -- = 11,r;;:,,Jp7, - .jp,q,p,.q,
rxy = -- ns xs_i ns_./ i,
IIS,:Sy llS,:Sy ns,s,, - ns,Jpq
Recordando la tabla en 16.2.2.a .
= e!i,_- pX = !__p__ -:= !_ L = &_- X Ip/q h+d a + e I' ' -- a . +- h t, = <_:+__i!
h
s, ,/pq s, ,(pq s, p = - - </., = - 11- ll 11
Px ,
11
X "

Observamos que esta frmula es la (16.2). Su~tituycndo estos vlores en 13 ).


Por otra parte : b (h + d) la + h1
11 11 11 nh - h 2 - cth - ad - bd
X = npXe + nqXq = pX + qX r.xr = ,============
n (/, + d) la + e) (a + /,) le + d) 'ra + /,)(e + d)(u + c)lh + ,/)
- -- - -- - - - -- -
11 11 11 11
Consiguientemente:
1
(a + h + e + el)(/,) - h - ah - wl - /u/ =
x. - X = x. - pi. - qx. = (1 - p)X, - qX. = qX, - qXq = q{Xp - x.) /lu + b )lc + d)(u + c)(h + d)
Sustituyendo q(X - x.) por X, - X en la frmul a d e rb, acabada de obtener. ah +h + 1
ch + /,,/ - h 2
- " " - ut! - he/
nos queda : ,j(u + h)(c +,/)(a+ c)lh + d)

r.,. = xP -- x- vr.p/q- = q!Xe - xq )vr.I.


p/q = x - _!!_ __
X'.IVr.PiJ-
_
ch - ad
. ~ ~ ~ fo+ h)(c + t!)(a + c )(h + d)
f
Observa~os que esta frmula es la (16.1 ). que es precisa mente la frmu la ( 16.3)
308 / Estad,st,ca para Ps ,cologos
Relacin entre var,ab/es d1cotm1cas o d1co to m1zadas / 309

EJERCICIOS 16.4. Calcular el coeficiente q> a partir de las tablas de frecuencias siguientes:

16.1. Calcular el coeficiente de correlacin biserial puntual. a parti r de los siguientes


d,1tos no agrupados en intervalos (en la variable continua X) .
a) b) 36 l 30
'
e) 15 10 e/) 1 70 1 100 ,) B
LJ
1
80 10 24 30 10 15 130 1 100
1

X d) X
a) X
"- - -
" b) X " ", e)
" 11,
" "
16.5. T eniend o en cuenta lo exp uesto en 16.2 .2. compr ue be el lector cmo. en
4 1 4 5 6 2 5 3 o 5 4 ()
efec tos, los valores de q> ob tenidos en todos los casos del ejercicio anterior no son
3 3 4 4 6 4 4 3 l 4 6 2
3 6 6
ms que una aplicacin del coeficiente de co rrelacin de Pearson .
2 5 3 3 8 10 3 2 3
4 1 2 2 6 2 o 4 2 2 8 16.6. Calcula r el coeficien te de correlacin biserial, teniendo en cuenta los mis-
2 4 1 o 4 1 2 4 mos c uadros a partir de los cuales ha calculado rbp en el ejercicio 16.1. Ahora su-
ponemos que X e Y son continuas, aunque Y aparece dicotomizada. Ntese cmo
rb es ma yor (en va lor absoluto) que rbp pa ra unos mismos datos numricos .

16.7. Calcular el coeficiente de correlacin biserial , teniendo en cuenta los mismos


16.2. Calcular el coeficiente de correlacin biserial puntual, a partir de los si- cuadros a pa rtir de los cuales ha calculado rbp en el ejercicio 16.2. Ntese, de nuevo,
guientes datos agrupados en intervalos (en la variable con tinua X ). cmo rb es mayor (en valor absoluto) que rhp para u nos mismos datos nmricos .
16.8. Calcular el coeficiente de correlacin lctracrica, teniendo en cuenta los
-
mismos cuadros a partir de los cuales ha calculado cp en el ejercicio 16.4. Ahora
,n X 11,
" h) X
" " e) X
" " suponemos que X e Y son continuas, aunque am bas apa recen dicotomizadas.
--- 15- 17 4 2 Comprubese cmo r, es mayor (en valor absoluto) que cp pa ra unos va lo res nu-
45-51 2 o 15-18 3 1
~ l<Pl-
11-14 5 2 12- 14 6 4
38-44 5 3
7- 10 1 3 9- 11 7 5 mricos y, adem s, cmo se veri fica la relacin ir,I :e
31-37 6 4 2
24-30 5 7 6-8 5 5
17-23 5 8 3-5 3 5
10- 16 1 4 0-2 o 4

d) X
" ",
17-2 1 o 4
12-16 4 12
7-11 6 8
2-6 4 2

16.3. Teniendo en cuenta lo expuesto en 16.2. l. compruebe el leclor cmo .


en efecto. los valores de rhp obtenidos en todos los casos de los dos ejer-
cicios Jtl'fcriores. no son ms que una aplicacin del coeficiente de correlacin
de Person.
o Q)
(/)
.....
5..c
e-~
> o ....
u~
.5: (/)
"O Q)
.s !:;
(/)
W-o
Q)
17
Correlacin y regresin -----
/

(:
\ (~

. (

17.1. Introduccin

Desde ahora estudiaremos conjuntamente tres variables. En el presente cap tulo


vamos a ex poner tres tema s:
o) Correlacin existente entre dos va riables. eliminando e l inl uj o de la ter-
cera (correlacin parcial ).
b) Pronstico de las puntuaciones en una de ellas. conociendo las puntua ciones
en las otras dos (regresin mltiple).
e) Correlacin de una de ellas con las o tras dos co nsideradas conj unt amente
(correlacin mltiple).

17.2. Correlacin parcial

17.2.1. Fundamento y frmula

En el capitulo 10. apartado I 0.2.5b. considerbamos un grupo de nios cuyas


edades oscilaban en tre cuatro y doce aos. plantendonos el problcma de calcular
el coeficie nte de correlacin dc Pcarson. respecto a dicho grupo. entre el peso y
la habilidad en realizar o peracioncs antmticas. Es claro que a l ir a umentando
su eda d. van aumen tando. simultn camentc, el peso y la habi lidad nu mrica . En
general , los nios de corta eda d (de cuatro a seis aos. por ejem pl o) pesarn poco
y mostrarn escasa hahilidad en el manejo de nmeros. En cambio. Jos ms mayo rc~
(de diez a doce aos. por ejemplo) pesar n ms, ordinaria mente, q ue los primeros
y, a la vez. sern ms hbi les que ellos en o pera r ar itmticamente. Ello hace que el
coeficien te de correlacin de Pearson entre peso y habi lidad numr ica sea a lto y po-
sitivo po r culpa de la edad. Es, pues. necesa rio elimi nar el influjo de sta s deseamos
captar la ver dadera relacin entre el peso y la habilidad en reahwr operaciones
.f"
a ritmticas. ,Cmo llevar a cabo esta eliminacin'>Vamos a presentar dos ca mmos
posibles :
314 / Estad1st1ca para Psiclog os Correlaci n y regres,on / 315

a) Eliminacin emprica. Es decir. empricamente formamos sub!rupos. cada Segn lo visto en I l. l. tendremos ahora :
uno de ellos con nios de la misma o parecida eda_d y calculamos r,, dentro de cada
grupo . As, la correlacin entre peso y clculo numrico quedar libr e d.:I in!lujo o)
de la edad. Esta eliminacin, no obstante, presenta dos inconvenientes . En primer
lugar, deberemos calcular varios coeficientes de correlacin (uno para cada sub- :E (.\ .,; )2 :!!
grupo). En segundo lugar, cada uno de estos coefcicntcs habr sido calculado con ,.~ .\ 1- 1
muy pocas personas y scr: poco fiable.

h) Eliminacin estadstica. Es decir, utilizamos los datos del grupo total 2


de nios y eliminamos el inlujo de la edad valindonos del siguiente razon;uniento . ., ) = -L (X 1 - X;) _
--'-----'"-- - .2 .2 ) d . . .2
d e don d e. var (., 1 - .\ 1 .1 1( - , 1 .1 que es1gnaremos por .1 1 -'
estadstico. 11

Dentro dr las edades propuestas, podemos suponer razona blemente que son
lineales las relaciones entre peso y edad y entre habilidad numrica y edad. Po r b)
tanto. utilizando puntuaciones d iferenciales. tendremos:
2
.2 _ ( L (X2 - _,; ) /n
1 2 .\ - - , ...
s:;

~
E 2
~
e:: de donde , var (Y
2 _ ,.)_
2 - :E (x2 -
--=-- .1 )2
~..:___ s~ (I - d 3 ) que designa remos por s~ 1
11

T eniendo en cuenta estas considera ciones previas. el coefic1ente de correlac in


d e Pearson entre el peso IX 1) y el c lculo numrico (X 2 ), eliminado el inluj o de la
X , ( edad) X, edaJ ) edad (X3 ). (y q ue designaremos por r 1 2 _,). vend r dado por

.\; r 13
.\'1
- x .\
.\ '
(pronstico del peso, mediante la edad)
L (x 1 - x ; )(x 2 - x; )
"<'(.
t- .\ 1 -
--
.
I 1 .\ S
~ '( J)
' J
( ., ;z - I . 1.\ .1"2
s.}
\)
- J

r , 2 ..'\ = f(.x: - .x l(x: - .x]) =


.,; .\2
r23 ~ -'" ., (pronstico de la habilidad numrica. mediante la eda d). 11 J 1 3 S2 3 n S 1 :\ S2 J

-" .1

Dondes ,. s 2 , .1, son las desviaciones tpicas del grupo tota l de nios en peso.
habilidad numrica y eda d, respectiva mente; r1 , y r 23 son los coeficientes de co - L x 1x 1 - r2 _, \; I x ,x., - r1.,
11I x x, + r 1.,r, ., 51:12 L x~
- 2
rrelacin de Pearson obte nidos a partir del grupo total entre peso y edad. y entre SJ .\J S 3., .~
r - --- - ,- --
ha bilidad numrica y edad, respectivame nte. 11 S 1 S2 ,j l - r _, ./ l - /} l
Segn ya sabemos (vase 11.3), x 1 - x; y x2 - x; (errores en los pronsticos)
no dependen de la variable pred ictora (edad).
Pues bien . calcular la correlacin entre peso y habilidad numrica. indcpcndien -
tementt: de la edad, equivaldr a calcular la correlaci n entre aq uella parte del + r 1.\"1J r r 1 _\r} .\
r Ll - r 2 .\ r13 - f13f2J 12 -
peso y aqueij,i pa rte de la habilidad numrica que no depen den de la edad. o sea. ( 17. l )
e ntre x 1 ___: x ; y x 1 - x;. /1 - r_, ,/ 1- r~ ., ,/1----=- ,.T, ,/ 1 - ,."
316 / Estadistica para Psiclogos Correlacin y r egr esm n / 317

17.2.2. Clculo de errores cua drticos. :E (X, - X j )2 es decir. la suma de la s diferencias c uadr-
ticas entre las puntuaciones obte nidas, de hecho, en el criterio y las puntuaciones
Es una mera aplicacin de (17. 1) pronoslicadas en el mismo med iante dicho plano.
EJEMPLO 17. 1. Supongamos que hemos calculado, de modo ord ina rio, ,-" Hablaremos de regresin mltiple, siempre que apa rezcan dos o ms var iables
entre el peso (X,) de un grupo de ni os y su habilidad en el manejo de smbolo~ predictoras. Por ahora nos limitaremos a l caso de slo dos variables.
numricos (X1 ). obteniendo r 1 2 = 0,50. Calculemos, ahora. r, ., entre peso (X 1 )
y edad (X 3 ) y r 23 entre habilidad numrica (X 2 ) y edad (X3 ). Los siguientes valores
hipotticos son muy razonables: r 13 = 0,80, r 2 .1 = 0.60. Esto supuesto, veamos 17.3.2. Ecuacin del p lano en un espacio tridimensional
lo que sucede aplicando (17. 1).
La ecuacin de la recta en el plano (espacio bidimensional I era Y = " + b X
( X , =" + b2 X 2 ). La ecuacin del plano en un espacio tr idimensional viene
0.50 - (0,80)(0,60) 0,02 dada por X , = a+ h2 X 2 + b.,X.,. donde " b2 y h3 son tres constantes ca racte-
r,u = -,/! - 0,64~36 = (0.60 )(0,80) = 0,042 rsticas de cada plano. La constante u nos determ ina el punto en q ue el plano corta
el eje OX, . o sea. el pu nto de coor denadas (a, O.O). Cuando a = O. el plano pasar
por el o rigen de coordenadas ((),0,0) y recproca mente. Las cons1antes /J 2 y /J 3 nos
En conclusin, el coeficiente de correlacin de Pearson entre peso y habilidad determinan la incl in acin del plano.
numrica, en vez de va ler 0,50, es prcticamente nulo, en cuanto hemos elim inado
el influjo de la edad.
Este y otros muchos eJemplos nos ensean con qu ca utela debemos proceder e n 17.3.3. Ecuaciones de los plan os de regresin de X, sobre X, y X ,
algunos casos a l analizar el valor de rx,. encontrado entre dos variables. Es p osible segn el criterio de mnimos cuadrados
una relacin verdadera entre las mismas. Pero, tambin, es posible que esa relacin
sea slo aparente y se deba lotalmente o. al menos, en gran pa rte, al in fl ujo de otra Supongamos un grupo de 11 pe rsonas de las que conocem os sus pu ntuaciones
u otras varia bles. en las dos variables predictoras. X 2 y X.,. y en el cri terio. X 1 . Po r ejemplo, en dos tests
de aptitud y en el examen final de curso. Consideremos tres ejes ortogonales. OX ,.
OX 2 y OX.,. (Vase fig ura 17. 1. l Cada persona i viene represeniada por un punto
17.2.3. Propiedades
X,
Sealar emos como nica propiedad del coeficiente de correlacin pa rcial, q ue
no pu ede valer menos que - 1, ni ms que l. En efecto, dicho coeficiente no es ms
q ue un coeficien te de correlacin de Pearson . e
\ .,

1/'
17.3. Regresin mltiple
x:,
17.3. 1. Introduccin

Recordemos el caso de dos variables. All tenamos una variable predictora,


X. y un criterio, Y, que ahora nos conviene designa r por X 2 y X 1 , respectivamen te. A
La recta de regresin de X 1 sobre X 2 era una recta tal que haca mnima la suma
de e rrores cuadrticos, :E (X, - x; )2, es decir, la suma de las difere ncias cuadr-
ticas entre las puntuaciones obte nidas, de hecho, en el cri terio y las pronosticadas X,
en el mismo mediante dicha recta. Ahora tenem os d os variables predictoras, X 2 y ,\ ,,

X 3 y un ~rlferio, X, . Pues bien, en vez de la recta de regresin de X , sobre X 2


l'l~ura 17. 1
lrndremos un plano de regresin de X, sobre X 2 y X 3 tal que haga mnima la sum a
318 / Estad1s1,ca para Ps,clogos Correlac,n y reg r es ,on / 319

cuyas coordenadas (X,.. X, 2 X, 3 ) no son ms que las puntuaciones obtc111das en il<J) <~ <I) (~(}) r'<t> 11(}> Q,
las dos variables predictoras y en el criterio. El grpo total de las n perso nas vcn dr
resolver las t res ecuaciones -: - = O. -- = O. e;- = O donde - , ~ - -- son
,A ,B1 1-B.1 r' A ,~B2 ?B.,
representado por una nube de puntos que ser de forma elipsoidal !algo as como las derivadas parciales de <11 respecto a A, a Bi y a B.,. Es decir.
un baln de rugby) si existe correlacin entre las tres variables. Sea un phrno ABCD.
Hagamos pasar por el punto (X,1. X ,2 , X,.,) una perpendicular al plano determinado r' I (X 1 -A - B1 X 2 - B.1X ,)2
- 2 I fX 1 - A BiX, - B, X, ) =O
por los cJes OX, y OX.,. Esw perpendicular cortar al plano ABCD en un u n punto ,'A
(X;,. X,i X,_i ). Si a la persona i que ha obtenido. de hecho. la puntuacin X,, en el
<' I (X, - A - B2X 2 - B_1 X _d 2
criterio le atribuimos la puntuacin X,', (dada por el plano ABCD ). cometeremos - 2I IX , - A - 8,). 1 - B_
, x_.ix , = {)
el error (X,1 - x;,) y, consiguientemen te, el error cuadr tico (X11 - x;, )2 . Haciendo <'B2
lo mismo con las restantes personas, tendremos 11 errores cuadrticos y. por tanto. t I (X, - A - B 2 X 2 - B.,X1 )2
una suma de errores cuadrticos expresada por I (X;, - x;, ) .
2 - 2 I (X, - A - l/ 2 ). 1 - B_, X_.} ). _, = O
<'B
Con cada plano del espacio ir asociada una suma de errores cuadrticos. Pue, '
bien. el plano de regresin de X I sobre Xi y X .1 es aquel plano cuya suma de errores O, lo que es equivalente:
cuadrticos asociada. I (X11 - X,\ )2, es ms pequea que la suma de errores cua- I (X, - A - B 2 X 2 - B.1 Y.1 ) = O. de donde.
drticos asociada a cualquier otro de los infinitos planos del espacio. Ms breve- I X 1 = nA + B2 I .\'2 + B.1 I X.1 ( 173 )
mente. es aquel plano que hace mnima la suma de errores cuadrticos I (X., -
L (X , - A - Bi X 2 B.,X_iJXi = O, d e donde,
-
- x;,)2 . IX ,X2 = A IX 2 -t B2 I X~ + B., IX2 X 3 ( 17.4 )
Ntese que para construir el plano de regre~in necesitamos un grupo de personas
cuyas puntuaciones en X,. en Xi y en X 3 debemos conocer. En cambio. lo aplicare- I (X 1 - A - B2X 2 - B.1 X.i JX., = O. de donde.
mos a otras personas, se111eja111,s a las anteriores. de las que slo conoceremos sus I X , X , = AL X_, + Bi I X 2 X.1 + B.1 I X3 ( 17.5 )
puntuaciones en Xi y en X 3 . Supongamos que Xi y X 3 son dos tests de aptitud para
la Estadstica y X 1 el rend;miento en la misma. manifestado mediante un examen. Las ecuaciones ( 17.3 ). ( 17A ) y ( 17.5) suelen ser lla madas normales. Ellas nos
Queremos construir la ecuacin del plano que nos permita pronosticar del mejor permiten despejar A, Bi y B 3 (vase NtnA 3. al fin al de este capt ulo). Sus valores son :
modo posible el rendimiento, conocido el resultado en ambos 1ests. Pues bien . A = X, - Bi Xi - B_1X., (l 7.6 )
para c onstruir ese plano, necesitamos unas personas cuyas puntuaciones en los dos
tests y en el examen nos sean conocidas. Una ve7 construido. lo a plicamos a otras B _ [11 :l.: X1 X2 - LX 1 IX2 ]l11 I X1 - t:l.: X.1) 2 J
personas. se,11,/0111,s a las anteriores. de las que slo conoceremos sus puntuaciones i - [n I Xi - (I Xz}2 l[ 11 LX~ - (:l.: X,)21 - (11 l: X 2 X., - I X 2 L X.1)2
en los dos tests de aptitud. 11 7 7 )
Dada la semejanza entre los dos grupos de personas. es de esperar que el plan o [11 I X, X.1 - IX , I X.1][ 11 L Xi X.1 - I X 2 L X3J
de regresin que fue ptimo en la reduccin de los errores cuadrticos respecto a l [11 LX - (I Xi )1 J[n I Xi - (I X j] _y,;I X2X.1 - I X2 I X_,] '
pnmer grupo. ser . tambin. razonablemente bueno en la rcdw.:cin de los er rores
[nIX 1 X 3 - IX, IX 3 ]lnIX~ - (LX2 )2 J
cuadrticos respecto al segundo. B3
Expuestas estas consideraciones previas. vea mos cul es el plan o de regresin de [n I X3 - (I X_,)2][11 IX~ - (I X2 )2 ] - (n I X.,X 2 - L X _, L Xi) 2
l J7 8 )
X, sobre X i y X.,.
--~ [,_, I_ X,X 2 - I X1 LX2 )[11 I X.1X 2 - IX.1I Xi ]
- [;, L X3 - (I X_,)2 )[11 IX~ - (I Xz}2 ] - [11 I X1 X2 - IX., rA;;p
a I E rprnado <'11 nm111aci1111es direc/a.,
T eniendo en cuenta ( 17.2) y 117.6). nos queda
Comenzamos con la ecuacin x; = A + BiX 2 -1 B.1X.1 = (-\\ - B, X, - B., X.1 1 + B2 X 1 + B_,X, () 7.9 )
De (1 7.9 J se m fi eren rnmediatamcntc las s1gu1cntes consecuencias :
X; = A . B2 Xi + B.1X., (17.21
-,. I x; , - -. I ). I >. .1
11 .\ , = - - = (.,\, - B,Xi - H,A.1 ) + B - --2 + B, - -
11 11 11
Nuestro pto psito es d eterminar A . Bi y B 3 de modo que cti = I IX, - A -
B2 X 2 - B.,X., )2 sea mnima. Segn se demuestra en Clculo. ello eq uivale a = X, - B 2 X2 B_,f _. + B2 X1 + B..X., = f, f 17.10)
r.

320 / Es tadistica para Ps, clo g os Correlac1 n y r egr esin / 321

Es d~cir. so n iguales la media de las puntuaci ones directas pronosticadas. x;. Tenien do en cuenta (17.12) y (1 7. 16). nos q ueda
y la media de las puntuaciones directas obtenida s. X,.
x; =U + b2X2 + h3X3 = + h 2X2 + b _X _ ( 17.21)

2 ) Sustit uyendo X 2 po r X1 y X ., por X., en (1 7.9 ).


D e (17.21 ) se dedu cen inmediatamente las siguientes consecuencias
x; = X, - B2 X2 - B)i .1 + B2i 2 + B.,i., = i, (17. 11 )

]) x-,1 = l1 2 -L Xi- + l1 3 -L .\3- = (h 2 )(0) + (b 3 )( 0J = O (17.22 )


Es decir. el plano de regresi n de X, sobre X 2 y X.1, en punt uaciones directa s. n 11
pasa por el pu nto (X,. A\. X.1). (Lo mismo les suced e al plano d t' regresi n d e X 2
sobre X 1 y X 3 y a l plano de regresin de X ., so b re X, y X 2 .) Es d ecir, la media d e las puntuaciones diferenciales pronosticadas. .r;, vale O.
lo mism o que la media de las puntuaciones diferencia les o btenida s..i' = O.

b) ExpreJ11do 111 pu11 1u11cioncs i/ifenm u,les 2) Sustit uyendox 2 porx2 = O y x, por .i ., = O e n (17 .21). x; = O (17.23 )

Comenzamos co n la ecuacin Es d ecir, el pla no de regresin de X 1 sobre X 2 y X 3 , en punt uaciones diferen-


ciales, p asa por el origen (0,0,0). (Lo mismo les sucede a l plano d e regresin de X 2
.,; = 11 + b1 x 1 + h_,x_, ( 17.12 ) so bre X 1 y X 3 y a l plano de regresin d e X 3 sobre X 1 y X 2 . )
Ntese q ue :
N uestro propsito esdeterm inara. h 2 yh 3 demodo quc I (x, - u - b 1 x 2 - b 3 x ., ) 2
sea mnima . Segn un razonamiento a nl ogo al seguid o en el caso d e las puntuacio - 11 :!: x ,x 1 = n r (X, - X )(X 1 - X) = n I X,X - n2 X,i i = 11 :E X,X, - I X, L X,
nes directas, llegamos a:
D e dond e.
I x1 = + b2 I x 2 + h, I x,
na ( 17. 13)
L X X2 = O L x, + b2 LX~ -r b.1 L X2X.1 ( 17.1 4) 11 L x; = 11 I x: - (L X,)2
I x 1x 3 =aI x-' + h2 I x 1 ., -' + h3 I x~ ( 17. 15)
P or tanto, tenien do en cuenta estas relacion es en ( 17.7) y en (17.8), y recordando
Las ecuac iones (1 7.13 ), (17.14) y (1 7. 15) suelen ser lla madas normales. Ella s ( 17 .1 7) y ( 17. 18), nos q ued a
nos permiten despejar a. b 2 y b 3 (vease NOTA I al final de este capt ulo ). S us valo -
res son:
11 r. x 1 x 1 11 :i:: x ~ - n :i:: x 1x.1 r r -"2 '3 = h, (17.24)
a = O ( 17. 16) B2
11 I x317 L x~ - y (I x 2x 3 ) 2

L -"1-"2L X~ - L x , ., 3 L -'2-'3 B _ r, 1:x 1 x 3 (1 L x ~ - lI: x 1x 2 r, I x3 x2_ _ b


h, (17. 17 ) (17.2 5)
L X~ LX~ - (I X2X3) 2 J - 17 L x~r r .\~ - ,y (I x,x, )2 - '

h.1
I x,,., I xi - I x x 1 2 I -".1'2
(17. 18)
IX~ I \'~ - (I X.1 Xd Las igualdades ( 17 .24 ) y ( J 7.25 J nos indica n que son paralelos el pla no de regre-
sin en p un tu aciones di ferencia les y el correspondiente plano de regresin en
Recorda ndo q ue L x ,x 1 = nr,1ss1 y que r ;, = 1, nos q ueda r : p untuaciones d irectas.

h2
n r,,s 1S2l1S ~ - 111'13S 1S.,nr13S2S3 = \'_,_ (1'12- 1'131'23 ) ( 17.1 9 ) c) Ex presado en pu111uaciv11es 1ipirn.1
ns1ns~- (nr 2 _,.12 s3 )
2
s2 1 - r ,
Comenzamos con la ec uacin
h9= lll'1.1S 1S3l1.\ ~ - _nl'1 2-'1S 2111'13S2.\3 = .11 ( 1' 1 3 - f 12~2 3)
(1 7.20)
, ns~n.1i - (111'2.1-1'2 .1.J s, 1- rL ::; = a* + h!=2 + b!= 3 ( 17.26)
322 / Estadstica para Psiclogos Correla c1n y regresin / 323

Nuestro propsito es d eterminar a*, b! y bj de modo que r (z 1 - a - h!: 2 - r -2

- h!: 3 ) 2 sea mnima. Segn un razonamiento anlogo a l seguido en el caso d e En el capiulo siguicn1c veremos que s;. = z~ :,;
. 11
1. En olras palabras. las
las puntuaciones directas llegamos a puntuaciones z; no cumplen con una de las condiciones necesarias con las que cum-

r : 1 = na* + b! r Zz + b! r :3 (17.27) plen las autnticas puntuaciones lpicas, a saber. q ue su varianza vak siempre 1.
Por esta razn, las puntuaciones z; deberan ser llamadas pscudotpicas .
r =,=1 = a* L =2 + b! L =~+ b! L =1=3 (17.28)
EJEMPLO 17.2. Comenzaremos introduciendo un min icjemplo que ayude a l
r :,;:3 = a* r ;:3 + /J! r Z2Z3 + /Jj r :i (17 .29 )
lector a comprend er mejor la aplicacin de las frm ulas an teriores. Despus ofre-
Las ecuaciones (17.27), (17.28) y (17.29) suelen ser llam ados normales. Ellas ceremos otro ejemplo a lgo ms largo, con unos datos obtenidos en la vida real.
nos permiten despejar a*, hJ y h'.\. (Vase NoTA I al final de este capitulo.) Sus Supongamos cinco personas con puntuaciones en dos va riables predictoras.
X 2 y X 3 y un criterio X, . segn las tres tablas siguien tes:
va Iores son :

a* = O (17.30)

b2
*_ r, 2 - r ,3 r23
(17.31) TABLA 17. 1
-
1- rt (pun!Ulll'UIIC'.\ dl/"l'C[t/S)

b* - r,3 - r,1r23
.\ - 1 - d3
(17.32)
X, x, X, x,x, x,x, x,x, X'1 xf x; ,. x;
5 9 8 45 40 72 25 KI 64 4.2
Teniendo en cuenta (17.26) y (17.30), nos queda 1 o 4 o 4 o 1 o 16 1: 1.4
3 b o 18 o o 9 36 o 2.6
7 18 12 126 84 211> 49 .124 144 1: 7.0
:; = a* + h!z2 + h!: 3 = O + h!z1 + hjz 3 ( 17.33) 4 12 6 48 24 72 16 144 36 I 4.8
1

De ( 17.33) se deducen inmediata mente las siguientes consecuencias: 20 45 JO 237 152 360 1O{) 585 260 ;i 20.0
1

1) :; = r :; = h! r = 2
+ b'; r .: = (b!HOJ
3
+ (b!)(Ol = o (17.34)
n n n

Es decir. la media de las puntuaciones tpicas pronosticadas.=;. vale O, lo mismo


que la media de las puntuaciones tpicas obtenidas, : 1 = O. TA BLA 17.2
(JIWI/Ul/( "OIIC'S dif<'f'<'lll'ia/1.'s)
2) Sustituyendo : 2 por : 2 =Oy : 3 po r .: 3 = O, nos q ueda .:; = O.
,, ,, '1 ,, '",x~ ~ rj ,,
. ., \;
f]I;
X3 11 t .z.t ., _"( 11
Es decir, el plano de regresin de X, sobre X 2 y X 3 , en puntuaciones tipicas.
pasa por el origen (0,0,0). (Lo mismo les sucede a los planos de regresin de X 2 () 2 o 1 o 4 tf = 4 ,, = 2 : 0.2
sobre X 1 y X 3 y d e X 3 sobre X 1 y X 2 .) ! - 2,6
3 - 27 6 18 9 81 4 .11 = 36 ,, = 6
Ntese que, segn (17 . 19), (17.20), (17.31 ) y (17.32), - 1 -3 -6 1 3 b 18 1 9 36 1i = 16 ,, = 4 " - 1.4
3 9 6 11 27 18 54 9 81 36 ;! 3,0
o 3 o ! o () o o 9 ()

b2 = -:J. b! (17.35)
1~
Sz o o o , 57 .12 90 20 IKO 80 1 o.o
f b3 = :f_i b! (1 7.36)
S3
324 / Estadis11ca para Ps,clogos
Correlac,n y r egresin / 325
TABLA 17.3 Ntese cmo:
lp1111111acio11es tpicas)
r x, = r x ; = 20. . x, = x; = 4
z, Z z, 1i Z1Z1 z 1 z ., z1 z.l 11 z; 1 1
1
y cmo:
0.5
-1.5
o.o
- 1.5
0.5 1
- 0 .5 1 2.25
0,25
0,75
0,75
'
1
1 - U
0,1 0.0 1
1,69
x; = 0,997 + 10.267)(,\\ ) + (O. t )(X,1 = 0,997 + (0,26 7)(9 ) + 10. 1)(6) = 4 = x,
- 0.5 -0.5 - 1.5 1 0.25 0.75 0,75 - 0.7 0,4,
1.5 1.5 1.5 11 2.25 2.25 2.25 1,5 2.25 h) Plano de rt'J(f<'.W/1 ti partir de p u11tuacioncs d1f,,r,11cwle.,
1
O.O 0.5 o.o 0.00 0.00
1
0,4 1(:
Segn (1 7.24 ): h1 = B2 = 0.267.
O.O O.O O.O 1- 4.75 4.00 3,75
li O.O 4.60 Segn (17.25): h-' = B-' = 0. 100.
1
Segn (17.16): a = O.
4
1'11 = -4.7s
5 = o 95. ,. 1] = 5= 0.80. ,., _, = -3,75
5 = 0.75
Por consiguiente,
x; = (0.267)x 2 + (0, 100) .\J
a) Plano de l'<'f!l'<'si,n a partir de prmtuaciones direct,.1
Aplicando esta ecuacin a los correspondien les valores de x 2 y \'.,, obtenemos
Segn (17.7 ): la columna encabezada por x; en la tabla 17.2.
Ntese cmo:
B _ [(5)(237) - (20)(45))((5)(260) - (30)2) _ !: x , =r x; = O, . .f , = t; = O
1
- [(5)(585) - (45 )2 )((5 )(260) - (30)2] - [(5)(360) - (45)(30)] 2
y cmo
[(5)( 152 ) - (20)(30)][(5)(360) - (45)(30)]2
- [ (5 )iss5T =- !4WJ[l5J(260J - (30)2J - [(5)(360J - (45H30JJ 2
x; = (0.267)(.i 2 ) + (0,I)h\l = (0.267)(0) + (0.1 )(0) =O = \' 1

= -~
157.500
= 0.267
.
c) Plano de regre.~in a partir de p11111uucio11es tipirns

Segn (17.3 1): M = o. 9 5 - (0.80)(0,75) 0,35 ,


Segn ( 17.8) :
I - (0,75) 2 = 0,4375 = 8
B _ [(5 )(152) - (20)(30))( (5)(585 ) - (45)2 ) Segn (17.32): h! = 0, 80 - 10.95)(0:!5) 0,0875
3
- 157.500 - 1 - (0,75)2 = 0,4375 = 0,2
_ [ (5)(237) - (20)(45)] [(5)(360) - (30)(45)] = 15.750 = O 100
Seg n (17.30) : a= o.
157.500 157.500 '
Por con siguiente:
Segn (17.6):
=; = (0.8) =2 + (0,2) ='
A = 4 - (0.267)(9) - (0, 1)(6) = 0.997
Aplicando esta ecuacin a los correspo ndientes v~lorcs : 2 y :-'. obtenemos l.!
columna encabezada por z; en la tabla I 7.3.
Por consiguien le. Ntese cmo:
x; = 0.997 + (0,267)%2 + (0.JOO)X_, !: : , = L:-; = O, , 1 . , = ()
y cmo:
Aplica ndo est~cuacn a los correspondiemes valo res X 2 y X , o bte nemos la co-
lumna enca bezada por X en la tabla 17.1. I = 10,8)(_:lJ + (0,2)(.:,) = () = I
336 / Eswd,stica para Ps,clogos
.,.
Correlacin y regresin / 331
Dividiendo ambos miembros por s, y teniendo en cuenta ( 17.33 ). nos queda Bajo este supuesto. ( 17.48 ) y 117.49 J vend rn e,presadas as:
\;_
- , \ z
2 + \
'.1 3- -- h*
2-2 +
h*- --
1 3 - .,. _, -_ x;
P or tanto. .. - E ldd
sta 1gua a nos
S Sz S\ S1 H 12 = B1 H 22 + B,H 2 _, (17 .51 )
vuelve a recordar a lgo que ya conocamos, al saber que :; no es autntica puntua -
cin tpica. por ser cociente en tre una puntuacin diferencial pronosticada (x;)
H ,., = 8 2 112.1 + B,Ji-'-' 117.52)
y la desviacin tpica de las puntuaciones obtenidas (s , ). Es decir, las puntuaciones Multiplicando ( 17. 5 1) por H13 117.52 J por II i; y resta ndo
: , son puntuaciones pseudotipicas y no puntuaciones autnticamente tpicas.
NOTA 3. Ded11cci,11 de los COlficicntes de los p/11nos de regresin, 11 partir de H 11 fl .1.1 - H ,., H 2, = B 2(H 11 H.,.\ - HLI
,1111/uaci<mes direc1111.
De donde :

Recordemos las tres ecuaciones normales: H , 2 H 33 - H ,.1 H n


B,
H 11 H.1.1 - 1n.,
E X, = 11A + B2 E X 2+ 8 3 E X3 (17.3)
E X 1 X1 = A E X2 + 8 1 E Xi + 8 3 E X 1 X 3 ([ 7.4)
que, teniendo en cuenta ( 17. 50). no es ms que ( 17.7).
E X,X 3 = A E X3 + B2 E X 2 X 3 + 8 3 E X~ (17.5) Multiplicando (17.51) por l/1 .1, (17.52) por f/ 22 y restando ,

Dividiendo (17.3) por n, nos queda ll , 2 111.1 - H ,.1 H 12 = B .1(flL - l/_._J/ 2 2 )


A\ = A + 8 2 X1 + 8 3 X3 (17.47) De donde:
A = X, - 8 2 X2 - 8 3X 3 , que es (17.6) _ H, 3 H 22 - H,iHi3
B.1 - ,
Multiplicando (17.47) por nX2 y restando este resultado de (17.4).
ff21 l/3J - 1/i _,
que, teniendo en cuenta ( I 7.50), no es ms que ( 17.8 ).
E X,X 1 - nX1 X 2 = (A E X 1 + B 1 E Xi + B3 E X 1 X 3 ) - Recordando la NOTA l. podemos deducir inmediatamente los coeficientes
- (AnX2 + B 1 ni~ + 83 nX2 X3 ) = correspondientes a las ecuaciones de regresin en pun tuaciones di/re11ci11/cs y en
= A(E X 2 - 11%2 ) + 8 2 (1: X~ - nXi) + 8 3 (!: X2 X 3 - nX2 X3 ) puntuaciones tpicas, a partir de A 1 8 2 y 8 3 imponiendo las condiciones restric-
tivas propias de las puntuaciones diferenciales y de las tpicas. respectivamente.
Esta igualdad puede ser escrita del modo siguiente:

n E X,X1 - E X, E X (A)(0) 8 (11 E XJ - (E X,2)


--- - - - -2 = - - + --1 - - -- - +
/ / / EJERCICIOS
8 3 (n E X 2 X 3 - E X1 E X 3 )
+ - - - - - - --- - - - (17.48) 17.1. Calcular r , 2..1 sabiendo que
/
a) ru = 0,80 : ' " = 0,60: 1'23 = 0,50.
De modo anlogo. multiplicando (l 7.47) por nX3 y restando este resultado h) r 12 = 0,30; r1., = 0.40: r 1 ., = 0,60.
de (17.5), . e ) r1 2 = 0,80 : r, 3 = 0.70: r23 = 0,60.
n E X,X3 - E X, E X 3 = (A)(0) + B2 (n E X 2 X 3 - E X2 E X 3 ) + 17.2. Calcular el valor de r 12 , sa biendo que r,u = 0,60: r 13 = 0,80 ; r 2 3 : 0,60.
+ 8 3 (11 E X~ - (E X3 ) 2 ) (1 7.49) 17.3. ,Cunto valdr r 12 _3 si r 13 = 0 y r2 , = 0''

Hagamos 17,4. Supongamos que r 12 , r 13 y r23 tienen un mismo valor que llamaremos r.
Con estas condiciones. demostrar que r 12 _3 = r 13 , = r 13 _2 = r/(1 + r ).
n E X,X 1 - E X, E X, = H,, (1 7.50) 17.5. Comprobar lo demostrado en 17.4, para r = 0,60.
328 / Estad,srica para Ps,cologos Correl acin y r eg resin / 329

y cmo: x; 1.50 + (0.60) X 2 + (0,50 ) X_, ( 17 37)


x; (0.60) .~, + (0.50).\,1 ( 17.38)
x; (0, 1977)10) + (0, 1642)(0) =O = ,, ., = (0.75) =2 + (0,25) :; ( 17.39)

U n nuevo alu mno (semeJante a los primeros) hace los dos tesis de aplitud y
e) Plano de regrl'sin II partir de pw11uaciones tpirn.1 obliene las pun luaciones directas X 2 = 30. -".1 = 20. ;. Qu puntuacin di recta.
dife rencia l y tpica le pronosticaremos como nota de fi n de curso 9
Segn (17.31): /,! = 0,5918 - (0,54 11)(0,1779) Pa ra obtener la puntuacin directa pronosticada, basta con apl icar ( 17.37 ).
1 _ (0,1779)2 = 0,5117 Es decir:
x; = I,50 + (0,60)(30) + (0,50)(20) = uo + 18 + 10 = 29.50
Segn (17.32): b'j = 0,54 11 - (0,59 18)(0,1779) 0,4501
1 - (0, 1779)2
Para obtener la puntuacin d iferencial pronosticada podemos seguir dos ca-
minos:
Segn (17.30): a* = O
a) Transformar 30 y 20 en d iferenciales y a plicar (17.38). Es decir :
Por consiguiente,
x; = (0,60)(30 - 25) + (ll.50)(20 - 15) = 3 + 2.5 = 5,5
:; = (0.5 117) =, + (0,4501) =.,
h) Transformar la puntuacin directa pronosticada. 29,50, en diferencial pro -
A plicando esta ecuac1on a lo s correspondientes valores :::2 y : 3 , obtenemos la
nosticada. Es decir :
columna encabezada por:; en la tabla 17.4.

Ntese cmo: x; = 29.5 - 24 = 5,5

L =1 = :l: :::; = o, , Z .: = o el mismo resultado que en u).

y cmo: Para obtener la punt uacin tpica pronosticada podemos seguir dos caminos :

T ransformar 30 y 20 en tpicas y aplicar (17.39 ). Es decir :


=, (0,51 17)(0) + (0,4501 )(0) = O = =, a)

:::; = (0,75)(30 - 25 )/(5 ) + (0,25 )(20 - 15)/ (2) = 0,75 + 0.625 = 1,375

17.3.4. Aplicacin de los planos de regresin b) Transfor mar la puntuacin directa (o diferencial) pronosticada en tpica
pronosticada. Es decir :
Una vez construidos los planos de regresin, los podemos aplicar a otras per-
sonas con tal que sean semejantes a aquellas con las que los hemos construido. ::: 1 = (29,5 - 24)/(4) = (5,5)(4) = 1.375
En realidad, suponemos que tanto el grupo con el que hemos construido los p la-
nos como el grupo al que se los aplicamos, no son ms que d os muestras d e la el mismo resultado que en a).
misma poblacin.
Sean X 2 y X 3 d os tests de aptitud y sea X I el aprovechamiento escola r o notas Evidentemente. este n uevo alumno no pertenece a l gru po p nmcro median te
en el examen de fin de curso. Supongamos que para las personas del grupo pri- el c ual hemos calcula do X,. ,\\. X.1 . s, . .1,. 1_,. Sin embargo. podemos referir sus
mero (mediante las cuales hemos construido los planos) X1 = 24, X2 = 25, X3 = 15. punt uaciones directas a esas medias y desviaciones tpic,1s (pa ra calcular sus pun-
s1 = 4, s2 =.f.>, s3 = - 2, r, 2 = 0,80, r, 3 = 0,40, r2 , = 0.20. A partir de estos tuaciones diferenciales y tpicas) porq ue suponemos que pertenece a la m isma
da tos tendremos las sigui en tes ecuaciones de regresin : pobla cin a la que perteneca el grupo primero.
330 / Estadistica para Ps1cvlogos Correlacin y regresin / 331

17.4. Correlacin mltiple En segundo lugar, veamos lo que vales;,. es decir, la varianza de las puntuaciones
pseudotpicas pronosticadas, z; .
17.4.1. Definicin '<' - ' '<' (b* z + h*3 -3 2 '<' ,2 '<' " " "<' ,2
.2
.1, , =- - = ..._ _::-=.
... . , 2 2
_
4
____;:.....=e_ -
- h*' ...
2 --
2
+ 2b*b* ... 2-3 h*' ... J
2 3 --- + 3 --
-
-
El coeficiente de correlacin mltiple es un ndice que nos mide la relacin 11 n n n 11

existente entre una variable, X,. y otras variables. Xi, X 3 X 4 . consideradas = h!' + 2h!h!r 23 + hf = hf + h!h1r23 + hf + h!h!r 23
conjuntamente. Por ahora slo consideraremos tres variables. Por tanto. ser un
ndice que nos mide la relacin existente entre X , y las dos variables Xi y X3 consi- = h!(h! + htr23 ) + h!(h! + h!r 23 ) = b!r, 2 + h!ru
deradas conjuntam ente. Definamos este ndice de un modo ms preciso. De las
varias definiciones posibles (equivalentes entre s) elegimos la siguiente: (de acuerdo con ( 17.41 ) y ( 17.42).
Sean X 11 , X 2 1, . .. , X,, 1 las puntuaciones directas obtenidas por 11 personas Por consiguiente,
en el c riterio, X 1.
Sean x; 1 x; 1 . x;, 1 las puntuaciones directas pronosticadas a esas II per-
sonas mediante el plano de regresin de X 1 sobre X 2 y X3 s,; = .Jh!r12 + h!r , 3 (17.43 )
Pues bien, definimos el coeficiente de correlacin mltiple de X, con X 2 y X 3
(designndolo por R, _23 ) como el coeficiente de correlacin de Pearso n entre (X 11. En este supuesto, aplicando la definic in de correlacin propuesta;
X21 . . . X,, 1 ) y (X; 1 x; 1 , x,; 1 ). Es decir:
L z 1 z; = Lz 1 z; = L z1 (b!z2 + b!z 3 )
R 1 _2 _1 = rz1:i
() 7.40) nsz,sz nsz. ns::'1
R,.23 = J'X!X'i

1 2
= -l (h*2 -I z- z + b*3 -
I
-
Z1Z3)- -
h!r12
/ *
+ h!r1J
* = '\/h*r
2 12
+ h!r 1 3 (17.44 )
Aceptamos esta definicin de Ru 3 por dos razones. En primer lugar, x ; es fun - s,., 11 ll V h2 r1 2 + h3r1.,
cin conjunta de X 2 y X3 (recurdense las ecuaciones de regresin ). Por tanto.
correlacionar X 1 con x; es correlacionar X 1 con una funcin conjunta de X 2 y X 3 Por consiguiente, teniendo en cuenta (17 .44) y ( 17.43 ).
es decir, es correl acionar X 1 con X 2 y X3 consideradas conjuntamente. En segundo
lugar esta definicin es muy parecida a la del coeficiente de correlacin de Pearson
entre dos variables, X 1 y X 2 . En efecto, sabemos que el coeficiente de correlacin Rf.23 = s;, ( 17.45)
de Pearson entre un criterio, X 1 y la variable predictora, X 2 , no es ms que el mismo
coeficiente entre las puntuaciones obtenidas en el criterio (X 1) y las puntuaciones Si en (17.44) sustituimos b! y h! por sus valores en (17.31 ) y (17.32),
pronosticadas en el mismo (X;), es decir, r,,,, = rx,x,
Dada esta definicin, como coeficien te de correlacin de Pearson, es claro
que R1.2 3 valdr lo mismo tanto si lo calculamos a partir de puntuaciones directas, r,2 - '13f2.3 r 13 - '12r23 rf2 - 2r, 2r 13r23 + rf J
como si lo hacemos a partir de puntuaciones diferenciales o tpicas. Ms an, no
R~ 23 2
1 - 1'23 'u + 2
1 - /'23 '1 3
- rJ3
(l 7.46)

tienen por qu ser del -mismo tipo las puntuaciones obtenidas y las pronosticadas .
As, por ejemplo. las obtenidas en el cri terio pueden ser directas y las pronosticadas
en el mismo, diferenciales. 17.4.2. Clculo
De la definicin expuesta, R1.2 3 = r,,,, se deducen otras frmulas ms aptas.
tal vez. que ella misma para el clculo efectivo de R 1.2J Vamos a deducir dos. Es una aplicacin de las frmulas anteriores.
una de las cuales suele ser presentada, con frecuencia, como dehmc1n de R1.2_,. EJEMPLO 17.4. Calculemos R 1 _23 a partir de los datos contenidos en la tabla 17.5
Pero antes hagamos algunas aclaraciones introductorias que creemos necesar ias. El lector se encargar de comprobar que:
En primer lugar, dividiendo por n (1 7.28) y (1 7.29). nos queda

X,= 3; X2 = 4 ; X3 = 6; = 2 ; S2 = 2; S 3 = 4 ; 1' 12 = 0,85; !' 13 = 0,55; 1'23 = 0,45


S
f' b! + h!r23 = r, 2 (17 .41)
h! + h!r 23 = r1., (1 7.42) h! = o. 755; b! = 0,21 o; s,, = ,/841/5 = "/o. 75682 = 0.87
332 / Estadistica para Psiclogos Correlac,n y regr esin / 333

TABLA 17.5 17.4.3. Propiedades


X, x, x, =, -J
_., =1=1
- l
u) El coeficiente de correlacin m ltiple, R 123 , a l cuad rado. no puede ser
o 1 4 -1 ,5 - 1,2375 1.53140625 1.85625
menor que cero ni mayor que uno. Es decir, O ~ Rt_ 23 ~ l.
4 3 6 0,5 -0,3775 0,1 4250625 - 0, 18875 En efecto, ser no negativo por ser una expresin elevada al cuadrado. Ser~
3 5 o o.o 0,0625 0,00390625 0,00000 igual o menor que uno por su propia definicin como coeficiente de correlacin
2 4 8 -0,5 0.1050 0,01 J02500 - 0.05250 de Pearson.
6 7 12 1,5 1,4475 2,09525625 2. 17125 b ) Rf. 23 es igual o mayor que r 2 y que rh Es decir, la correlacin mltiple
(al cu adrad o) del cri terio con las dos va ria bles predictoras es igual o mayor que la
15 20 30 o.o 0.0000 3,78410000 3.78625 correlacin simp le (al cuadrad o) del mismo con cada una de las dos variables pre-
dictoras consideradas por separado. As, en el ejemplo 17.4. Rf.i 3 = (0,87)2 = 0,76
es mayor que r 2 = (0, 85) 2 = 0,72 y que rL = (0,5_5)2 = 0,30. Lo mismo sucede
Tendremos, por tanto : en el ejemplo 17.5, donde Ri.23 = (0,74 )2 = 0,55 es mayor que (0,0918)2 = 0,35
y que (0,541 J )2 = 0,29. En otras p alabras, es mayor la correlacin entre el rendimien-
to escolar y los dos tests predictores (razonamiento abstra cto>> y comprensin
. 40) 3, 78625 O 87
segun (17. : Ru 3 = ( )( , )= , verba l) considerados conjuntamente, que la correlacin del rendimiento escolar
5 0 87
tanto con el razonamien to abstracto. considerado solo, como con la compren-
sin verbal, considerada sola.
segn (17.44): Ru 3 =/ (0,755 )(0,85) + (0,210)(0,55) = 0,87 e ) El coeficiente R u 3 es aceptado siempre como positivo. En r ealidad. casi
segn (1 7.45) : R1.2 3 = ./3,7841/ 5 = 0,87 ni tiene sentido hablar del signo de R u 3 ya que es funcin de varas correla-
ciones simples con signos posiblemente distintos. Nos mide, sin ms, la intensidad
se n (17.46) : R = f(!}~) )2 - (2)(0,85)(0,55)(0,45) + (0,55)2 = O 87 de la relacin entre el c riterio y una combinacin lineal de variables predictoras.
g 123
Y l - (0,45)2 ' d) En general, R 1 _23 tiende a aumentar cuando aumentan r 1 2 y r 1 3 y dismi-
nuye r 2 3 Sin embargo, esta afirmacin necesitara ser matizada algo ms. Las
EJEMPLO 17.5. Calculemos Ru 3 a partir de la tabla 17.4. relaciones entre Ru 3 , , 12 , r 1., y r 2 ., no son tan sencillas como puede aparecer
Recordemos que: a primera vista.
e) R 1 _23 ser mayor para la muestra media nte la cual hemos construido las
r, 2 = 0,5918, r 13 = 0,541 1, r 23 = 0, 1779, h1 = 0,5117, h', = 0,4501 ecuaciones de regresin, que para o tra m uestra a la que aplicamos esas mismas
ecuaciones.
Compruebe, adems, el lector que:
NOTA. No hemos credo necesario hablar expresamente de r 13 _2 y r 23 _1 : de
los planos de regresin de X 2 sobre X 1 y X 3 , y de X 3 sobre X, y X 2 ; de R 2 _1 3 yR 3 _12 .
I: z;2 = 12,0201 , s,; = J12,020I /22 = 0,74 Np son nada n uevo y ni aun necesario. Basta con llam ar siempre X 3 a la variable
:E ZZ( = 12,0196 que deseamos mantener constante y calcular r 12 .3 . Basta con llamar siempre X,
a la variable que actuar como' criterio y calcular las ecuaciones de regresin de
X 1 sobre X 2 y X 3 Es decir, llamar siempre X 1 a la variable que deseamos c01re-
En este supuesto:
lacionar con las otras dos tomadas conj untamente y calcular R, _23 . Con todo, puede
. ser un ejercicio til para el lector intentar calcular r 13 _2 r 23' , . y las ecuaciones
segun (17.40): R 1 = - 12,0196
'---- = 0,74 de regresin de X 2 sobre X, y X3 y las de X3 sobre X, y X 2 y R2 _1 3 , R 3 12
. 23 (22)(0,74)

segn (17.44): Ru 3 = ./(0,5117)(0,5918) + (0,4501)(0,54 11) = 0,74 17.5. Resumen : Definiciones y frmulas
segn (17.45): Rr. 23 = ./12,0201/22 = 0,74
Co,jicienh' de correlacin parcal,r1 , .., : Coefic iente de correlacin de Pca rson
segn 117 _4_6 V'Ru 3 = ro,59_18~ {2 (oj918)(0,54I I)(0, 1779) + (0,54112 = 0 74 entre aquella parte de X 1 q ue no depende de X3 y aquella par le de X 2 q ue ta mpoco
1 - (0,1779)2 ' depende de X 3
334 / Estadistica para Psiclogos Correl acin y r egr esin / 335

r12 - 1'13"23 NOTA l. Las puntuaciones diferenciales y tpicas no son ms q ue las direc-
r12.3
tas sometidas a ciertas condicion es restrictivas. Por tanto, las relaciones vlidas
~~ entre las directas, sern tam bin vlidas entre las diferenciales y tpicas, con ta l
que impongamos a las directas las restricciones requeridas.
Ecuaciones de regresin mltiple de X 1 sobre Xi y X3 : Ecuaciones que nos per-
Ahora bien, in troducir puntuaciones diferenciales equivale a imponer r: x, =
miten pronosticar las puntuaciones en X, a partir de las puntuaciones obtenidas = i, = O, (i = J. 2, 3). Consiguientemente, (17.6), (17 .7) y (17.8 ) quedarn con -
en X 2 y en X3
vertidas en
a) Supuestas puntuaciones directas: x; = A + B2 X 2 + B 3 X _1
A = O + (B 2 )(0) + (B 3 )(0) = O, o sea, (17. 16)
A= X, - B2 X2 - B 3 X3
B _ (n r: x 1 xi - 0) - (n r: x x
0)(11 r: x~ - 0)(n I x 2 x_, 1 3 - - 0) _
_ [n ~ -~\X2 - LX, r: Xi][n :E X5 - X3 )2J _
B
2 - Ji
(I: 2
- (11 - 0)(11 L xs - O) - (n r: Xz X 3_ - OJ2
r: x -
[n r: X 1 X 3 - r: X 1 r: X 3 ][n r: X2 X3 - r: Xi~ ~J ,1 (!: X X2 r: x1 - :r: X X_, r: X2x ..J o sea, (1 7. 17)
JI
= JI (L x} L x~ - (!: x2 x 3 )2) ,
B = [n :E_X ,X3 - :E X 1 :E X 3 ] [n :E XJ _::- (!: X2 )2l _ B _ (n r: x 1 x 3 - 0)(11 I x }_- !!_L-=. !:1..~ x 1x 2 --:__0)!_n__I ...:'i:.'Z_ -:-__Q_) _
3
Ji 3
- (11 I x3 - O)(n L x - 0) - (n L X 3X z - OJ2 -
[n r: X 1 X 2 - r: X 1 r: X 2][ n r: X 3 X 2 - r: X3 r: X 2 ]
Ji
I (LXX3LX~ - L X Xi LX3X2)
o sea, (17.18 )
= - - 4 r ;s r:x~ - Cix3x,)2) _ _ ,
siendo:
A su vez, introducir puntuaciones tpicas equivale a imponer r: :, = z, = O,
ll = [n r: X} - (:E X2)2 ][n r: Xi - (1: X3 )2] - [n r: X 2 X 3 - r: X2 :E XJ 2 r: z,z1 = nr,, (i,J= 1, 2, 3), con r.. = l. Consiguientemente, (1 7.6), (17.7) y (17.8)
quedarn convertidas en
b) Supuf'stas puntuacion<'s diferencia/es: x; = b2 x 2 + b3x 3
A = O + (B 2 )(0) + (B 3 )(0) = O, o sea, (17.30)
h2 = B2 b3 = B1
B _ illl_!!.1_~ - 0)(1111 - O) - (nnr 13 - O)(nnr 23 _-_ Q_) _
c) Supuestas punluaciones tpicas: z; = b!z2 + b!z3 2
- (nn - 0)(nn - O) - (nnr2 _1 - 0)2 -

b! = '!.J_ b2 b! = ~ b3 = l,_f !:..!.21 -- ,.d3r


13 2 3 , o sea (173 1)
S s, , ..

Coeficiente de correlacin mltiple, Ru 3 : Coeficiente de correlacin de Pearson


B _ (mir 13 - O)(nn - 0) - (nnr 12 - O)(n11r23 - O)
entre X 1 , y X{, donde X{ es el pronstico ofrecido por el plano de regresin de X 1 3
sobre X 2 y X3. - (nn - O)(nn - 0) - (n11r 2 ., - 0)2
Ri. n = rx,x _ ~ r 13 - Y12r 2.,
o sea, (17.32)
= Jhfr, z + b'jr, 3
-? - t - rL

= vr: =;2 Nm A 2. Segn (17.21), (17.35 ) y ( 17.36):


---~---+_~f~
..f =
f 2 - 2r12r13r23
1- ,ti
x; = ~ b!x 2 + ~ b!x 3
S2 S3
336 / Estadistica para Psiclog os
Correlacin y reg resi n / 331
Dividiendo ambos miembros por .1 1 y teniendo en cuenta (17.33), nos queda Bajo este su puesto. (1 7.48) y 117.49) vendrn ex presadas as:
-x; = h*
1 --
' 1 + / 1_,* -Y_, = h*1 : 1
x; Esta 1gua
+ h*3 : 3 = : 1' . Por tanto, : 1' = -- Idad nos
S1 S1 s .1 S1 H, 2 = B 2 H 22 + 8 3 H 1 .1 (l 7.5 1)
vuelve a recordar algo que ya conocamos, al saber que : ; no es autntica puntua-
c in tpica, por ser cociente entre una puntuacin diferencial pronosticada (x ; )
H 11 = 8 2 11 2 .1 + 8 3 11_0 (17. 52)
y la desviacin tpica de las puntuaciones obtenidas (s 1). Es decir, las puntuaciones Multiplicando (17.5 1) por H 33 , ( 17.52 ) por /1 2 _1 y resta ndo
:; son puntuaci ones pseudotpicas y no puntuaciones autnticamente tpicas.
NOTA 3. Deduccin de los coeficientes de los planos de regresin. a partir de li, 111.l-' - H,.,H, 3 = 8,(H,, H.1.1 - H L)
puntuocio11es direcras.
De donde :

Recordemos las tres ecuaciones normales : _ H , 2 H 33 - H1.,H2.1


82 - ,
H2 1H-'-' - Jli -'
I X1 = nA + B 2 I X 2 + B 3 I X 3 (17.3)
I X 1X2 = A I X2 + 8 2 IX + B 3 I X 2 X 3 (17.4 ) que, teniendo en cuen ta (17 .50). no es ms que ( 17. 7).
I X,X 3 = A I X 3 + B 2 I X 2 X 3 + B3 E X~ (17.5) M ul tiplicando (17.51) por H 2 _1 , ( 17. 52 ) por 1121 y resta ndo.

Dividiendo (17.3) por 11, nos queda H, 2 ll 1 ., - 1/ 13 11 12 = B _,(Jli.- - ll_,_J/ 1 1 )

X, = A + B 2 X2 + B 3 X3 (17.47) De donde :
A = X, - B 2 x2 - B 3 X 3 , que es (17.6)
_ H, 3H22 - H 1, H 1.1
8
Multiplicando ( 17.4 7) por nX2 y restando este resultado de ( 17.4),
-' - l/11 H .1.1 - J/L,
que, teniendo en cuenta ( 17.50), no es ms que ( 17.8 ).
I X,X 2 - nX,X 2 = (A I X2 + B 1 I Xi + B 3 I X2 X3 ) - Recordando la NOTA l. podemos deducir inmediatamente los coeficientes
- (AnX 2 + B2 nx~
+ 8 3nX2 X3 ) = correspond ientes a las ecuaciones de regresin en punt ua ciones tlif,,wiaks y en
= A(I X 2 - nX2 ) + B2 (:E X~ - nXi) + 8 3 (:E X 2 X 3 - 11X2 .\\)
pun tuaciones tpicas, a partir de A,. 8 2 y B., imponiendo las condiciones restr ic-
tivas pro pias de las puntuaciones diferencia les y de las tpicas. respectivamente .
Esta igualdad puede ser escrita del modo siguiente:

I X,X 2 2
11
~ - -I X-2 = {A)(0)
-. ---- IX, - - + ~B 2 (n- IX; - (I X2 ) )
--=-"-' -- +
r r tz EJ ERCICIOS
B3 (n I X 2 X 3 - I X 1 I X3 )
+- - -- ---- - (17.48) 17.1. Calcu lar r 12 __, sabiendo q ue
!
a) r1 2 = 0.80: r 13 = 0,60: ri, = 0.50.
De modo anlogo, multiplicando (17.47) por nX3 y restando este resultado h ) r 12 = 0.30: r 1., = 0,40: r 2 , = 0.60
de (1 7.5). e) r 11 = 0,80: ri., = 0, 70: rv = 0.60.

11!: X,X.1 - IX 1 IX 3 = (A )(0) + B 1 (nIX 2 X 3 - IX 2 IX 3 ) + 17.2. Calcular el valor de ru, sa bi endo q ue r,, .., = 0.60 : r,., = 0,80 : ,-2 _1 = 0,60.
+ 8 3 ( 11 I Xi - (I X 3 ) 2 ) (17.49) 17.3. ,Cun to valdr r 12 3 si r ,3 = O y r23 = 0 ''

Hagamos 17.4. Supongamos que r 1 2 r, ., y r2 3 tienen un mismo valor que llamaremos .-.
Con estas condiciones, d emostrar que ru -' = r 2 .1 . 1 = r13. 1 = r ( 1 + r ).
:!'"
11 L x,xj - L X, L x, = H,, ( 17.50) 17.5. Comprobar lo demostrado en 17.4. para r = 0,60.
338 / Estadistica p ara Psiclog os

17.6.
17.7.
y 1'3
Demostrar que r 23

=.l.
= 1. ta nto si r 12 = r 13 =
Demostra r que r 23 = -1, tanto si r12 = 1 y r 13 = - 1, como si r 12 = - 1
1, como si r 12 = r 13 = - 1.
18
17.8. Demostrar que r 13 _2 = r 12 . 3 si r 13 = r 12 El coeficiente de correlacin mltiple
17.9. Comprobar lo de mostrado en 17.8. p ara r1 2 = r1 3 = 0,80. y los planos de reg resin
17.10. Suponiendo s, = 6, s 2 = 3, s 3 = 3. r, 2 = 0.50, r 13 = 0,40, r 23 = 0,20,
calcular las ecuaciones de regresin de X 1 sobre X 2 y X 3 , en puntuaciones diferencia -
les y tpicas.
17.11. Suponiendo s 1 = 4, s 2 = 5, s 3 = 2, r, 2 = 0,80, r 13 = 0,40, r 23 = 0,20,
calcular las ecua ciones de regresin de X 1 sobre X2 y X 3 , en puntuaciones diferen-
ciales y tpicas.
17. 12. Calcula r las ecuaciones de regresin de X 1 sobre X2 y X 3 a partir de los da-
tos siguie ntes : 18.1. R~23 como ndice de reduccin
de error en los pronst icos
--
a) X, x, x, h) X, Xi x, e) X, x, X3 d) x, X, x,
Vamos a considerar, en concreto, el pla no de regresin de X, sobre X 2 y X 3 .
o 2 1 2 1 1 3 9 12 1 1 o Algo parecido va ldr p ara los planos de regresin de X , sobre X , y X 3 y de X ,
4 o 9 6 3 7 5 12 8 1 o 1 sobre X 1 y X 2 .
8 4 5 10 4 5 4 o 4 o l l Sea X 1 la puntuacin directa obtenida por una persona i en el criterio X 1 y
6 6 13 8 5 3 7 18 6 2 2 2 sea x; la puntuacin directa pronosticada a esa misma persona media nte el pla -
12 3 7 14 7 4 1 6 o no de regresin de X 1 sobre X2 y X3 El error cuadr tico cometido en ese prons-
tico individual valdr (X, - x; )2 y .t (X, - x; 2 ser la suma de errores cua -
drticos respecto a todas las personas de la muestra. Por su parte, la suma .t(X ,- %1 ) 2
17.13. Calcular las puntu aciones directas, diferenciales y pse udotp icas pro- queda descompuesta en dos sumas de trminos c uadrticos. En efecto :
n osticadas en el criterio X 1 , mediante las ecuacio nes de regresin d e X 1 sobre X 2
y X 3 , tenie ndo en cuenta los datos del ejercicio 17. 12. .t(X, - A\)2 = :E [(X, - x;) + (X ; - ..\"'i)]2 = :E(X1 - x ;)2 + .t x; - A')2 (18.1)
17.14. Sea n X 1 , , x;,, x 1,, x;, las puntuaciones directas (obtenida y pronosticada ) pues:
y diferenciales (obtenida y pro nosticada) de la persona i. Demostrar que para toda
persona i se verifica: X 11 - x;, = x 1 , - x;,. .t x 1 - x;)(x; - X)= o
17.15. Calcular el coeficiente de correlacin mltiple, teniendo en cuenta los segn se encargar de com probar el lector en el ejercicio 18.4.
datos del ejercicio 17. 12. Ahora bien:
:E (X1 - .%\ )2
n

que solemos designar por s s~,. es el error c uadr tico medio (E,;; ) cometido a l
atribuir a cada persona, como pu ntuacin , la med ia X1
A su vez:

.!" :E (X1 - x; )2
11
340 / Estadistica para Psiclogos El c oeficiente de correlacin mltiple y los planos de r egresi n / 341

que designaremos por sf, 23 , es el E;,


cometido al atribuir a cada persona la puntua- El segundo caso extremo nos indica que. valindonos del plano de regresin,
cin x; obtenida mediante el plano de regresir1. no hem os reducido en nada el E;;, que cometamos atribuyendo ..\\ , como puntuacin
Finalmente. segn (18. l ): en X 1 a cada una de las personas de la muestra. Ahora bien, sis;., = O, en tonces,
segn (18.3), R_ 2 3 = O; luego a reduccin nula del primitivo, corresponde E;,
r ix; - x 1 2 L (X 1 - X1 ) 2 L (X 1 - x;2 Rt 13 = O. Recprocamente, si RL
3 = O, entonces, segn (18.3). = O; luego a s;;
n 11 n R _23 = O corresponde reduccin nula del E! primitivo.
En conclusin , a:
que designaremos por s;..
no es ms que la diferencia entre el E,;, cometido valin-
donos de XI y el E;,, cometido va lindonos de x; . En otras palabras. es aquella Ri_ 13 = 1, corresponde reduccin total del E! primitivo y recprocamente.
parte del E;:,, primitivo que dejamos de cometer por el hecho de a tribuir x; a cada Rf. 23 = O, corresponde reduccin nula del E! primitivo y recproca mente.
persona en vez de atribuirle X1
El valor s 1 13 suele ser llama do error tpico de estimacin.
Por consiguiente:
Teniendo en cuen ta (18 .3). nos queda
s;.-t . = -2--,
s_;. parte de E;., eliminada
5\ s~-. + s, .23 parte de E;, eliminada + parte de E;, no eliminada si_ 1 3 = s;, (l - R_i_,) (1 8.4 )

= proporcin de E;,
eliminado o. de otro modo, proporcin en que reducimos el De acuerdo con lo dic ho en el apartado 12.1, el paso de R 1.23 de 0,20 a 0,50,
E! primitivo, el que cometamos valindonos de i'. por ejemplo, significa mucho me nos que el paso de 0,65 a 0,95, en cuanto a reduc-
Si, por ejemplo, ese cociente fuera igual a 0,60, ello significara que habamos cin de E!.
reducido el E! en un 60 por 100, es decir, que, valindonos de x; slo cometeramos Segn (1 7.37), (17.44) y (1 8.2), vemos que, definiendo R 23 como rJ,,., = sJ;,
un 40 por 100 del E! que habramos cometido valindonos de .X 1 . llegamos a que Ri .v = s;/s;, y vemos, tambin, que, definiendo Rf. 23 como
Pero s;;fs;,, llegamos a que R_ 23 = = ,~,,; s;,
s;. x;2 (x;Jsx, )2 La definicin de R_ 1 3 como s;Js;, = L (X; - X1 ) 1 /L (X , - X, )2 = I -
L 1 L : ::;2 = s;; Rf.13 (l8.2) - r (X 1 - x ;2J (X 1 - %)2 tiene la ventaja de su paralelsmo con la definicin
s!: = n s; . = n n
de otros coeficientes de correlacin como ndices de reduccin de error. Unos d i-
ferirn de otros en diversos aspectos acciden tales, pero tod os ellos coincidirn
segn (17.44 ).
en ser ndices de reduccin de error.
Por tanto, Rf. 23 no es ms que la proporcin en que ha sido reducido el error
En los ejercicios 18. 12. y 18. 13, al final del capitulo, el lector se encargar de
cuadrtico primitivo, el que habramos cometido si nos hubiramos valido de X 1
probar que
como puntuacin pronosticada.
En conclusin:
1: xf = !: (x 1 - x; )2 + L x;1 (18.5)
2 2 2
Rf2 3
r
=~ s
= -~r~~ = -
Si.2J
- -1- ( l 8.3) 1: zf = 1: (z1 - z;)2 + L z;1 (18.6)
\';I .\';l sx,
EJEMPLO 18. l. Comprobemos las relaciones aca badas de exponer con los da-
Consideremos los dos casos extremos posibles : sf. 23 = O (equivalente a s;, = tos siguientes:
= s;, ), y s:-, = O (equivalente a sf. 13 = s;, ).
El primero nos indica que, valindonos del plano de regresin, hemos elimi- x T 't 1' 1 :C 1-"J "1), J :,:i :,:1 : l :)
nado o reducido por completo el E;. primitivo. el que habramos cometido a tribu- . - - - - -
9 12 - 1 o 6 1 o 16 o - 6 o - 0.5 o.o 1.5 0.00 - 0. 75 0,00
yendo X 1 , como puntuacin en X 1 , a cada una de las personas de la muestra. Ahora 12 K 1 ) 2 1 9 4 J 2 6 05 05 0.5 U.25 0.25 0 .25
o o -9 o KI o o o.o
bier., si sf. 23 = O. entonces, segn (18 .3), Rf. 23 = 1; luego a reduccin total del
4 - 2 4 IK - 1 5 - 0,5 0,00 0,00 0 .75
18 6 1 9 o 9 KI o 27 o o 1. 5 u o.o 2.25 0,00
E;, primitivo, corresponde Rt 2 3 = l. Recprocamente, si R ,.. = l. entonce< 6
2045~- . o
O -) -) - 6
--
9
20-180
9 '6 9 18 18 - 1.5 - 0.5 -1.5 0,15 2.25 0,75
segn (18.3).~{ 23 = O; luego a R _23 = l, corresponde reduccin total del E;, KO w 14 42
o.o 3.25 1,7 5 1,75

primitivo.
342 / Estadistica para Ps,clogos El coef1c1ente de correl ac,n m l t,p l e y l os p lanos d e r egr esi n / 343

D el cuadro anterior es fcil construir las euaciones de regresin. NOTA. A pesar de lo expuesto, es posible que R 23 = O, valiendo sf. = O.
23
Esto sucedera si todos los puntos estuvieran situados sobre el pla no de regresin
x; = 1,77778 + 0,20038 X 1 + 0,06980 X 3 x; = 0,20038 X + 0,06980 x 3
y ste fuera paralelo al plano X 2 0X 3 . Ciertamente, s_ 23 = O. Adems, s;, = O.
:; = 0,60114 Z2 + 0,13960:3
Por tanto, s;,
= O - O = O. Consiguientemente, R_ 2 _, = s;Js~, = 0/0, quedara
Con estas ecuaciones podemos formar el cuadro siguiente : indeterminado. Sin embargo, tiene sentido admitir R, .23 = O, ya que en esta situa-
ci n, tanto a pu ntuaciones altas, como medias y bajas en X 2 y X 3 , co rresponde una
misma puntua cin. i\, en X, y, por tanto, Ja covan aci n entre X , y X 2 y X., es nula.
IX, - id 1
-,: ,1 -
j,\' 1 - -~\
1, X - .r;
- -'r - x j
l - ;
(X 1
- 1A 1
- X; )1 r
- xY
li, - :)
1
- .r ;J
..

0 .25
O.lS
4.41880
4.74074
04l8M0
0. 740 74
0,20940
0 370H
- 1_41880
0.25926
- 0.70940
0,1296J
2,0 119'}
0.06122
0.SUJJS
0.0 161<0
O 175.'"1
0 ,~4~70
U.0-08S
OJ .'717
18.2. R;n como ndice de aproximacin
0.00 2.0~6')11
S.80324
- J 94] 02 - 0.97I.S I
0.90171
1/H)Ol
1, 196.58
0,971.51
0.59829
3.77SB
J.4) 180
0.94l8 ~
0 .].5 79 5
J .77.5U
3 .25:.'.'12
0.94Ul3
oxnox
de los puntos al plano de regresin
l .2~ 1.804J2
2.25 2.98006 - 1.01994 - 0. .50997 - 1.98006 - 0.9900.l 3.92064 0 980 16 I J) 402t! 0.l007
lU S 00 20.00000 0.00000 0.00000 0.00000 0.00000 11.20798 2.80199 K,79202 2 19 800 Hemos visto en el prrafo anterior que Rf 23 = 1 - r (X , - x; )2 1:E (X, -
- l\ )2. De
aqu se deduce inmedia tamen te lo siguien te:
Comprobacin de (18. 1) : a) Si todos los puntos (represen tantes de las puntuaciones ob tenidas) se en-
cuentran sobre el plano de regresin de X, sobre X 2 y X 3 , X, = x; para toda per
:t (X 1 - x; )2 + :E (X; - .\')2 = 11,20798 + 8,79202 = 20,00000 = :E (X 1 - X, )2 sona de la muestra. Por tanto, x, - x; = O. Consiguientemente, :E (X, - x; )2 = O.
Es decir , Ri, 23 = l.
Comprobacin de (18.5): b) Si Rt_ 3 = 1, :E (X , - x;)2 = O.Ahora bien , como los 11 su mandos son
no negativos (por ser cuadrticos), si su suma es cero quiere decir q ue cada uno
:E (x, - x; )2 + :Ex; 2 = 11,20798 + 8,79202 = 20,00000 = :Ex de ellos tiene que valer cero. Por co nsiguiente, X, - x; = O, es decir , X 1 = x ;.
para toda persona de la muestra. En otras palabras, todos los puntos se encuentran
Segn sabemos, sobre el plano de regresin de X 1 y X 3 sobre X, ,

R 21 23 = s~. = 2,19800 = O 4396 En conclusin :


. ~J 5 ' S todos los puntos se encuentran sobre el p lano de regresi n, R_ 23 = l.
Comprobacin de (18.2): Si R_ 2 3 = 1, todos los puntos se encuentran sobre el plano de regresin.
Por consiguiente, R _ 23 nos mide la aproximacin de los puntos al plano de
regresin. Ntese, por tanto, que lo que mide Ru 3 es la aproximacin de los puntos
s2,s2 = (8,79202)/(5) = O4396 = R2 a un plano. Es posible que todos los puntos se encuentren sobre una superfi cie
x, x, (20,0000)/(5) ' 1.1)
no lineal (una superficie esfrica, por ejemplo), que exista una relacin funcional
perfe cta entre X 2 y X 3 con X, que nos permita pronosticar un valor exacto de X 1
Comprobacin de (18.3) :
para cada par de valores dados de X 2 y X _,, y que R 1.2 3 valga O. As, por ejemplo,
los seis puntos siguientes estn situados sobre la superficie esf rica de ecuacin
_ /s2 = 1 _ (11,20798)/(5) 1 - 0,5604 = 0,4396 = R1. 23 X + X! + X; = 4. Sin embargo, R, 23 = O.
1 52
3
1.2 x, (20,00000)/ (5)

Comprobacin de (l 8.4): x, x, x,
s_;, (1 - R f.23) = ~ (1 - 0,4396) = 2,2416 = 11 2 t 98
= s 23 o
o
o
o
2
o
2
o
- 2
Comprobacin de (18.6): u - 2 o
,; 2 o o
:E (2 1 - :i) 2 + r ;:2 = 2,80 199 + 2,19800 = 4,9999Q e:: 5 = :E z - 2 o o
344 / Estadstica para Psiclogos El coeficiente de correlacin mu/tiple y los planos de r egresi n / 345

Ntese que R} 23 no es slo funcin de sf 23 , sino, tambin de s; .. Eslo quiere errores grandes (a las que se aleja n bastante d el plano de regresin). a otras medios
dccr que para un mismo error cuadrlico medi (sL 3 ) , R 13 puede ser mayor o (a las que se alejan moderadamente del mismo) y a otras pequeos (a las que se a le-
menor segn que sea mayor o menor s~.- jan muy poco de dicho plano).
Por supuesto, s operamos con puntu~ciones tpicas :

s;, = 1 X,
Por tanto,
>< x. , ~
I: (= - :;)2 X
"
R_H -~'
s;I - s;i u n
)(
X
)(
)(
/ ../ X 1

X )(
X X '12: _ x_ )(

Es decir, operando con puntuaciones tpicas, siempre que aumenta (disminuye) X )(


X )(

r (z 1 - z;)2, disminuye (aumenta) R_ 23 y recprocamente. Por consiguien te , X


)(
)(

a mayor (menor) aproximacin de los puntos a la recta al plano de regresin. co- X ' ,, -X- )( .,,'/.,"'
,,
rresponde siempre mayor (menor) valor de R_ 23 . , ....-'
)( _ /

18.3. R ~.23 como proporcin de la varianza de X,


asociada a la variacin de X 2 y de X,1
X,, X ,, X2 :1
X,

La relacin X, = x; + (X 1 - X) es una pura identidad que puede ser inter-


pretada aceptando que la puntuacin directa oblenida es igual a l pronstico (X; )
ms el error en dicho pronstico (X1 - x; ). Por otra parte, hay variacin en los errores, cuando no la hay en la variables
Sabemos que x; = a + b2 X 1 + b3 X 3 . Esto nos indica que x; depe nde de. es predictoras. Es decir. a personas con una misma puntuacin en X 2 y en X., , les corres-
funcin de, est asociada a X2 y X 3 . pond en, en general, distintos errores en los pronsticos (a unas, pequeos; a otras.
Naturalmente, la cor relacin mltiple entre X y X 2 y X3 vale la unidad. (En
m edios ; y a otra~. altos).
realidad, no es ms que el coeficiente de correlacin de Pearson entre x y X; .) Puesto
Sabemos, adems. que:
que X = a + b2 X2 + b3 X 3 , suponiendo b2 y b3 positivas, a puntuacin baja
en X2 y en X 3 , corresponder pronstico bajo en X 1 ; a puntuacin media en X 2 y
A\) 2 -- --- + L (X 1 -x;
2
:E (X , - :E(X-A\)2
en X 3 , corresponder pronstico medio en X 1 ; a puntuacin alta en X 2 y en X 3 , -
11 n n
corresponder pronstico alto en X 1 Adems, en general, cuando hay variacin
en la variable predictora X 2 y/o en la variable predictora X 3 , la habr en el prons-
tico x;. Todas las personas que no difieran ni en X1 ni en X 3 , tampoco diferirn en
\2
x s!,. + .1 23

x;. A su vez, todas las personas que difieran en X1 y/o en X 3, diferirn, en general,
En otras palabras, la varianza total de X, (s; . ) se descompone en dos partes
en x;.
aditivas. lJna, s;.,, asociada a, dependiente de, explicada por, la variacin de X 2 y
Por el contrario, X, - x; no depende, no es funcin de, no est asociada a,
X 3 , ya que x; estaba asociada a. dependa de. era explicada por, la variaci n de
X 2 y X 3 . De hecho, r,,c,, - ,; = r,, cx, - x,i = O.A puntuacin baja en X 1 y/o en X 3
X 2 y X 3 . Otra, s 23 , no asociada a, no dependiente de. no explicada por, la va ria-
puede corresponder error bajo, medio o alto en X 1 Como se ve en la figura, tan to
cin de X 2 y X 3 .
en lre las personas con Xi = Xi 1 (puntuacin baja en X 2 ) y X 3 = X 31 (puntuacin
Por estas razones, llamaremos a s; varia nza asociada, y a s 2 3 la llamaremos
baja en X3 ), como entre las personas con X 1 = X 22 (puntuaci n media en X2 )
varianza no asociada.
y X3 = X 32 (,untuacin meda en X 3 ), como entre las pcrsopas con X i = X 23
(puntuacin'alta en X 2 ) y X 3 = X33 (punl uacn alla en X_) , a unas les corresponden Ahora bien, sabemos que: R 2 3 = s;;fs;, . Pero s;/s;, , dentro de este con -
346 / Estadistica para Psiclogos El coef1c1ente de correlacin mltiple y los planos de regresin / 34 7

texto, no es ms que la proporcin de la varianza total d e X 1 que e~t 18.3. D emostrar que r,,,=,- , , = "=,i=, -=.i = O. Es decir, q ue es nulo el coefi-
asociada a la variacin de Xi y X_1. Por tanto, Rf 23 representar esa propor- cien te de correlacin de Pearson entre los errores com etidos en los pronsticos
cin de varianza asociada. Si, por ejemplo, Ru 3 = 0,80, diremos que 0.64 es (en X 1 ) y las puntuaciones obtenid as en X 2 y enlre los mismos error es y las puntu acio-
la proporcin de la varianza total de X, que es1 asociada a la va riacin de X 2 nes obtenidas en X 3
y X 3 y que 0,36 es la proporcin que no est asociada. De otro modo, diremos
que el 64 por 100 de las diferencias individuales en X, est asociado, es atribui- 18.4. D emostrar que :E (X 1 - x;)(x ; - i'i) = O.
ble a, queda explicado por, ... las diferencias individuales en las dos variables 18.5. Demostrar que :E (x 1 - x; )(x;) = O.
predictoras, Xi y X 3 , y el 36 por 100 restante no est asociado, no es atribuible
18.6. D emostrar que L (;; 1 - :,, ; )(z;) = O.
a, no queda explicado por ... . las diferencias individuales en las dos varia bles
predictoras . 18.7. Apoyndose en 18.6, demos trar que '=it,,. =iJ = O. Es decir. que es nulo
el coeficiente de correlacin de P ear son e ntre los pronsticos, :-; . y los errores en
Igual que en el caso de dos variables, podemos expo ner las ideas anteriores de
dich o s pronsticos, z 1 - z;.
un modo algo ms intui tivo. De las n personas, unas son altas y otras son bajas en X 1
(criterio). Esa variabilidad es debida a la posesin en a l lo o bajo grado de cierlos 18.8. D emostrar q ue R 2 . 13 = R 3 . 12 = 1, si R u 3 = l.
factores (quienes los poseen en alto grado, obtienen altas puntuaciones en X 1 : 18.9. Sean r 12 y r13 las cor relaciones simples entre un criterio, X 1 , y dos variables
quienes los poseen en bajo grado, obtienen bajas puntuaciones en X 1 ). Parte de esos
prediclOras, X 2 y X 3 S uponiendo que ambas correlaciones tienen un mismo valor
factores son tales que su posesin en alto o bajo grado hacen, tambin, que las per-
(que llamaremos r), de mostrar que la correlacin simple, ,j 3 , entre las dos variables
sonas obtengan puntuaciones altas o bajas, respectivamente, en Xi y X3 (varia-
predicloras es igua l o mayor que 2r2 - l.
bles predictoras). Pero el resto de los factores , aunque influyen en obtener a ltas
Utilcese la frmula Ri .23 = (rfi - 2r 12 r 1.1r2 3 + ri 3 )/(l - ,.~,) y del hecho
o bajas puntuaciones en X,. no influyen en obtener sistemticamente puntuaciones
de que R, 23 :,:; !. )
allas o bajas en X 2 y X3 Es decir, del hecho de poseer estos ltimos fac tores en a lto
(bajo) grado, nada podemos concluir sobre si las puntuacion es en las var iables
18.10. A partir de 18.9, demostrar que si r12 = r13 = l. necesariamente r 23 = l.
predictoras sern, tambin, altas (bajas). Pues bien, los primeros factores daran
razn de la varianza asociada y los restantes daran razn de la no asociada . 18. 11 . Sean 1O, 14, 6, 2, 8 las puntuaciones directas pronosltcadas en un criterio X 1 ,
mediante el plano de regresin de X 1 sobre X 2 y X 3 . Siendo s;,
= 25, decir qu
parte de esta varianza no es atribuible a la variacin de X 2 y X 3 y cunto vale R u 3
18.4. Resumen: Definiciones y frmulas 18.12. D emostrar que rxf = :E(x 1 - x ; )2 + :E x ;2 .
18. 13. D emostrar que :E zf = L (z1 - z; ) + :E z;2.
2

L (X , - ..\' )2 = L (X; - x, )2 + L (X, - x ; )2


Si s.; + sf .23
s!~ sf.2 J
- ----
Rr2J = .s;: = SX:

EJERCICIOS

18.1. A partir de los cuatro cuadros del ejercic io 17.12 (del captulo a nterior).
calcular s;j . sf. 23 = s~ 1 -x ' s;1 - :
18.2. D emostrar que '= ,e,, -= ,, = O. Es decir , que es n ulo el coeficiente de corre-
lacin de Pea rs911 entre los pronsticos. z;.
y los errores en dichos pronslicos
(;; - z; ). ,,
1
>
Apndice 1

1. SIGNO (SIMPLE) DE SUMAR, 1:

1.1. Definicin

Comencemos con algu nos casos particulares.


Por definicin :

o

, :..
X, = X, + X 2 + X 3 + X 4 + X~+ X0

"
X, = X, + X 2 + + X,,
1 =1

Por defin icin :


i =-l
(X, - 5 )' = (X , - 5)1 + (X 2 - 5)-' + (X_1 - 5)-' + (X 4 - 5 )3

"
(X,
,c. 1
- 5)
1
= (X 1 - 5)-' + (X 2 - 5) 1 + + (X,, - 5)-'

Por defi nicin:

(2~ _1) = (~!, _1


' . 1 7
1

7
)
2

+ ( 2X - 1)
/
1
+( --t-1
2X ) 2

f (2X, _ 1) =(?X, _ 1)
2 2
+ (2X/ - 1)
2
i .+ 2X
( -1 - 1)
2

'" 1 7 7

De estos ejemplos pa rticulares inferimos que el signo de sumar, I , viene a sig-


f" nificar lo siguiente: Sume los 11 trminos obtenidos sustituyendo el subndice i por
1, 2, . .. . 11 en la expresin afectada por di cho signo.
352 / Estad1S/lca para Psiclogos
Apend1ce 1 / 353
1.2. Propiedades En efecto:
"
I I
('f
/(
1
<1) (('X, + k) = e X, + 11k. donde e y k son dos constantes arbHranas.
x,) =(X+ Xi+ .. . + x.)2 =X + X~+ . . . + X~+ X , Xi +
1= 1 I=
1
En efecto:
+ X i x-' + + x,,x,, _ , = I" x; + X1X1 + x , x, + +
I" (cX, + k) = (,X , + k) + (cX 1 + k) + + (cX,, + k) = 1 :: l
1= 1
= (cX 1 + cX1 + + cX,,) + (k + k + k) = + X ,,X0 _ 1

= dX 1 + X2 + +X,,) + 11k = As, por ejemplo, para:


" 3
= e X,+ nk
' 1
X i = 2, Xi = 3, x., = 4, I
,.:: t
X; = 2 2 + 32 + 42 =4 +9 + 16 = 29

( I' X,)2 = (2 + 3 + 4 )
n
h) (X, + k) = I X, + nk. Es un caso particular de a). para e = l . k j O. 2
= 92 = 81
P ---1 ,= 1 1~ 1
" n
e) cX, = e X,. Es un caso particular de a), para e/ O , k = O. Sin embargo, es posible la igualdad , siempre que:
p.: l i-=1
n
J I k = nk. Es un caso particular de a), para e= O , k -t O. XiX2 + X,X3 + '.' + x.x. - i = Q
,:. 1

11 n n As, por ejemplo, p ara:


<') I (X, + Y, ) = I X, + I Y,. 3
11::: I , ::: 1 , =- 1
Xi = - 1, X 2 = 2, X3 2. I x; = t-1 2
1-=I
+ (2i 2 + ,2, 2 = 1 + 4 + 4 = 9
En efecto:
n
L (X, + Y,) = (X + Y,) + (X2 + Y2) + ' + (X,, + Y,, ) =
( I-' x,)2 = ,-1 +2 + 2
2 , = (3)2 =9
' 1
En este ltimo caso:
= (X, + X, + + X,.)+ (Y, + Y2 + + Y,, )=
11 "
( - 1 )(2) + (- l )(2) + (2)( - 1) + (2)(2) + (2)( - l ) + (2 )(2 ) = -8 + 8 =O
= IX,+
..;;; 1
I
1 = l
Y,
" " n

/) I
"

(X, - k)2 = I
"

x; - 2k I
11

X, + nk 1 .
h) En general, I
1 ::. 1
X, Y, j
; .... l
X,
i= 1
Y,. Es d ecir, la suma de los p roductos
'= 1 i= l , =- 1 es distinta del producto de las sumas.
En efecto:
En efecto:
" n

I
ti

(X, - k) 2 = I
11

(X,2 - 2k X, + k 2 ) = I
11

X; - 2k I
11

X, + nk 2 L X, L
t== 1 1 = l
Y,= (X + X2 + '' + X,)(Yi + Yz + + Y,, )= (X, Y, +
1 :::) t= I ,=-1 ;= 1

+ X2Y2 + .. + X.Y,, ) + (X , Y2 + x, Y3 + + x,, r,, _,)


" ( " \ 2
r. ) En ge~:ral. .~, X,2 4' .~ X,) . Es decir, la suma de los cuadrados es
distinta del cu"drado de la suma.
= I" X,Y, + (Xi Y2 + X i Y3 + ' .. + X,, Y,, _i)
1=-l
3 54 / Esradist,ca para Psiclogos Apend,ce 1 / 355

As, por ejemplo, consideremos el cuadro siguiente : X,, representa la puntuacin de la persona i perteneciente al grupo f.

X, Y, X,Y, La suma de las puntuaciones del gru po l." vendr dada por
::e)
X"
(2 )(3) =
2
4
3
(4)(6) = 24 L X,Y, = 35 ~ 11 0 = (11 )(10) = X, Y,
La suma de las puntuaciones del grupo 2. vendr dada por 0

, . 1
X ,2
5 1 (5)( 1) = 5 i -= l ,. 1
(A )

'
L X; = 11
,. 1

3
Y,= 10
J

L X,Y, = 35 La suma de las puntuaciones del grupo J vendr dada por


'. 1
f X;,
1 ~ 1

Sin embargo, es posible la igualdad, siempre que:


La suma de las puntuaciones del grupo k vendr dada por I X ,.
X, Y2 + X 1 Y3 + + Xn Yn- =
As, por ejemplo, consideremos el cuadro ~iguiente:

La suma de las n p untuaciones del grupo total viene dada por


1= J


.f "
X,,. En
X, Y, X, Y; ~
- 2 (2)1 -2 ) = - 4
efecto. consideremos

f
n
X, 1 =
k ( )
X,, . es decir, el signo simple de sumar
1 1 ' ~ 1

2 2 2 2 ]= J p:::- ) JC [ re l


2 2
(1)(1) =
2
1
, .. 1
X,Y, = - 3 = (3)( - J) = X, Y;
j .a J ,., (con) variando de l a k) aplicado a la expresin f X ,,. Sabemos que. por definic in.
X,= 3 Y, = - 1 IX,Y,= -3
j :,;;.

,.. 1 ,, , "" 1 t ( "J ) n // "'


~ .~ X,, = .~, X,i + 1~ 1 X, 2 + + .~, X;, . que no es ms que la suma
En este ltimo caso, (2)(1) + ( -2)(1) = 2 - 2 = O. ,,
1 1
de las n puntuaciones, si tenemos en cuen ta (A).
NOTA. Ordinariamente, por sencillez, usaremos I: X; en vez de X;, y aun Supongamos ahora que nos ofrecen las puntuaciones den personas en k pruebas.
ic::.t
Tendremos el cuadro siguiente:
I: X en vez de I: X,, pero entendiendo que existe un subndice i que va de I a n (o a otro
valor concreto, de acuerdo con el contexto de que se trate).
Pruebas

2. SIGNO (DOBLE) DE SUMAR, I:I: 2 j k

2.1. Definicin
Supongamos que un grupo total queda descompuesto en k subgrup os, con 11 1
~ 1
x ,,
.-,~ 1 1

x, , x,,
x, ,
x,1
X 1,
x,.
11 2 , . , n. personas respectivamente.
Personas , X,1 X, 1 X ., x,, I' x,,
, . 1
G. l. G. 2.0 G.j G. k

X11 x,, X, Xu n I X,11 X"2


x,, X22 x,, x,. x"I x ,,t

I x,,
X,1 X,, X,, x,, 111 +112 +. + n1 = n J - 1

,r/; x,,.JJ
En este cuadro la fila i representa las puntuaciones obtenidas por la persona i en
Xn.zi x,..I< "
las k pruebas. La columna j representa las puntuaciones de las n personas en la
356 / Estadstica para Psiclogos Apndice / / 357

prueba). La puntuacin X, 1 no es ms q ue la puntuacin obtenida por la persona i en EJEMP~o A . I


la prueba j.
La suma de las puntuaciones de la persona i en las k pruebas vendr dada por G ru po 1. 0
Grupo 2." Grupo 3."

k 4 JO
X,1 + X,2 + ' .. + x,. = I
j = 1
X,j 2 4 8
8 2 6 11 1 =- 4 11, =J 11, =5
5 7
La suma de las puntuaciones de las n personas en la prueba j vendr dada por 9

"
X1, + X2j + . . . + x,,, = X,; 3 n- 4 J S
,~ 1 I
j ~ 1 i~
f 1
x,1 = I X11 + ,#I x,2
1 :::: I 1
+ I x,,
I= 1
= f4 +2+ 8 + 5J + (5 + 4 + 2 ) +

La suma de las puntuaciones de las n personas en las k pruebas vendr dada por
+( JO+ 8 +6 + 7 + 9) = 19 + 11 + 40 = 70
k II
~ , ; X;; En efecto, consideremos ;~i .~ X~
1 1 1
k n
= ~
1 1
k (n)
1
~
1
X ,; , es decir, el sig- r
jr. 1 r "" 1
(X,, - 4 )2 I
,= )
4
(X,1 - 4)
2
+ I
3

1= 1
(X;2 - 4)
2
+ I
S

I =1
(X,3 - 4 )2

no (simple) de sumar aplicado a la expresin X ,t Sabemos que, por definic in, 4) 2 +


= l /4 - (2 - 4 )2 + (8 - 4 )2 + (5 - 4)'] +
i=-cl
+ [(5 - 4)2 + (4 - 4 )2 + (2 - 4) 2 ) + [ (10 - 4)2+ (8 - 4)2 +
k( l~IX,;
j~t
n) n n
= I lXi + i~IX,2++ I1X,.=(X11 + X 21+ +X,,)+
n
+ (6 - 4 )2 + (7 - 4 )2 + (9 - 4 )2] = (O + 4 + 16 + 1J +
+ ( 1 +O + 4 ) + (36 + 16 + 4 + 9 + 25) = 2 1 + 5 + 90 = 116
+ (X12 + X22 + + x. 2 ) + + (X 1 + x 2 + + x ) que no es ms
que la suma de las puntuaciones de las n personas en la prueba primera , ms la suma
de las puntuaciones de las n personas en la prue ba segunda, .. . , ms la suma de 2 .2. Propiedades
las puntuaciones de las n personas en la prueba k . Es decir, la suma de las puntuacio-
nes de las n personas en las k pruebas. m n m n
Ntese que la suma de las puntuaciones de las n personas en las k pruebas puede a)
J=- 1 l
(e X,;+ k) =e
j e: l
X,,+ mn k, donde e y k son dos constan-
l
ven ir dada de esta forma : p ::: ::o

tes arbitrarias.
En e fecto :
(X 11 + X 12 + + X 1.) + (X 21 + X 22 + + X2k) + + (X,, 1 + X,,2 +
+ .. +X)
"' n " 11 11

nk = "X
~ 1J +' L. X 2J + + (cX ,, +k) = L (cX,, + k) + (cX, 2 + k ) + + {(X ,m + k) =
;-= 1 j= 1
jc l i =l e l i =l l"" I

+ I k
j = l
X,,, = L" (I. X,; )
;c J ,~ t
= L
".
L X,;
P" i =1 = (e I X., + nk) + (e I X ;2 + nk) + .. +
1 ::;: l p }

En otras palabras:
(
+ e ~" X,.,, + nk
1 1
) = e (" ~ ,
" X,2 +
X,i + ;~, +
k n n k 1

I I I I x,,
j z::: l i= 1
x,j =
1 .::. 1 = L
+
1
~
11

1
)

X;,,, + mnk =
1
m
~
1
e,;II

X, 1 + mnk = c,~
m

1
11

.~X,, + mnk
D e todo lo dicho inferimos q ue el doble signo de sumar viene a significar lo m n m n

siguiente: Sull)e todos los trminos obtenidos sustituyendo los subndices i y j b) I I (X,; + k) = I X0 + mnk. Es un caso particular de a), con
por todos sus' valores posibles en la expresin afectada por dicho signo . J= I ' "' l je 1
;e , e = 1, k 1 O.
358 / Estadistica para Psiclogos

e)
m n
I I ex,, = (' I
m .
I X,j Es un caso particular de a), con EJEMPLO A.3
Apndice I / 359

J"'" I 1= 1 j = l '~ l C j o, k = o.
X,, Y;, m "

m
I ,=I x,,Y, j = (2)( 1) + /3)(51 + (5)(2) + (6)(4 ) + (4 )( 1) +
k
[] []
:r: 1 1
d) = mnk. Es un caso particular de a), con
Jc:: 1 ""1 e = O, k j O.
+ (2)(3J = 2 + 15 + ro + 24 + 4 + 6 = 61
4 I m II m n

e)
111

I I
11

(X,j + l',,)
m

= ,:c.I I t
n

X,, +
m

I I
11

Y,1
2 3 X,j Y,j = (2 + 3 + 5 + 6 + 4 + 2 )(1 + 5 +
j =I 1= 1 j= I i =I
J ,,,,. J '- 1 ,.-1
) "' l 1 = 1
+ 2 + 4 + I + 3) = (22)(16 ) = 352
En efecto:
m II n 11
EJERCICIOS
I I rx,, + r,1) = I <X" + y"+ I 1x, 2 + r, 2 ) + +
l. Siendo X 1 = 3, X 2 = - l, X J = 4, calcular el valor numrico de las siguientes
j &. 1 i= 1 1'-' l ;;;:- )

+ _
"
r:a::. l
(X,.,+ Y,,.)= ["L x, , + J"
- l 1- 1
X,1 + ' + ~
" X,,.
1- l
]+ expresiones, donde suponemos que el subndice i va de I a 3.
o) r X, f) r (X, - 5)

[ "
+ .~, Y" + ,~, Y, 2 + + ,~, r,,,
" " ] b) r x; g) L [(X, - 7)/ 6)
e ) (L X)2 /z) L (3X, + 2X;)
m n m n

1=1
I I p:;J
x,j + I I r,,
j z 1 i == 1
d} L4X, i) L (2X; - X,/3 + 4)

,.,1 11 111 11 m
e) L (X /3) j) r (X, - 3) 2
/) IX,j - k )2 = X~ - 2k I" X, 1 + mnk 2 Su legitimacin
k ) [L (X, - 3)] 2
, .. 1 ; ::: 1 = 1 i-= 1 r;:- l i= 1
2. Supongamos:
queda como ejercicio.
a) X, = 1, X 2 = 1. X 3 = - 2 b ) X, = 2, X 2 = -2
g) En general, J, J, X
m
1 j
(
~
m

1
~
"

1
\2
X;} . Su legitimacin queda como
Y1 = - 1, Y2 = 3. YJ =2 Y 1 = I, Y 2 = 4
ejercicio. e) X, = 2, X 2 = O, X J = 1 d) X , = 2, X 2 = 1/ 2
m n m n
h) En general.
,,1


11

X,, Y,1 i- X,, )',r Su legitimacin que-


YI = 3, Y2 = - I, YJ = - 2 Y, = - 1/2, Y2 = 1/ 3
]'= l 1 "- 1 j-= 1 , l 1 l i= 1
En este supuesto, calcular el valor numrico d e las siguientes expresiones :
da como ejercicio.
Vamos a proponer ahora dos ejemplos comprobatorios de g) y h ).
Para comprobar g), supongamos el cuadro siguiente con m = 3 y n = 2. 2.1. L (2X, + Y,) 2.6. L (6X,)( Y,/2)

EJFMPUJ A.2
2.2. r (X, Y,) 2.7. L (2X, + Y)2
,,, 11 2.3. L (X,Y,)2 2.8. L [ (2X, )2 + Y;]
I I X;, = 4 2 + y + 51 + 6 2 + 22 + 42 = 16 + 9 + 25 + 2.4, (L X,Y, )2 2.9. [L (2X, + Y, )] 2
~
J" 1 1 .;. 1
+ 36 + 4 + 16 = I 06 2.s. rx; r r,
~ (J,"' J," X, ,)\' = (4 + 3 + 5 + 6 + 2 + 4)2 = 24 2 = 576
3. + Y,)2 ,fo L (Xf +
Dcmostar que, en general, L (X, rn.
4. Demostrar que, en general, [L (X, + Y;)] 2 ,fo r (X, + Y,)2.
Para compi:_ebar h), supongamos los dos cuadros siguientes, ambos con m = 2
y 11 = 3. 5. Demostrar que, en general, [L (X; + Y;)]2 ,fo r (X; + Yf ).
360 / Es1adist1ca para Ps1c/ogos

6. Supongamos que a tres personas les han sido aplicadas dos pruebas. Llame-
mos X,J a la puntuacin obtenida por la persona i en la prueba}. Es decir, X 1 1 es
la puntuacin obtenida por la persona primera en la prueba primera, X 12 es la
puntuacin obtenida por la persona primera en la prueba segunda, etc. Supon-
gamos, adems, que las puntuaciones obtenidas por estas tres personas en las
dos pruebas son las siguientes: Apndice 11. Soluciones a los
ejercicios propuestos
Pruebas (j)

X 11 =2 X 12 = l
Personas (i) 1 X 21 =- l x,, = 2
X3 , = 3 x,, = - 2 CAPITULO 4

4.1. a) 14,5 - 24,5 b) 62,45 - 68,55 e) 19,95 - 20,85


d) 44,345 - 54,355
En este supuesto, desarrollar las siguientes expresiones y calcular su valor
4.2. a) 10 b) 6,10 e) 0,90 d) 10,01 0
nmrico :
4.3. a) 19,5 b) 65,5 e) 20,4 49.35
a) L X;j
j
b) X,}
J
e) (~Fxijy d)

4.4.
d) 7 e) 5X,J /) ~ (~X,;)2 X
' J
i j ni 11. p
- -- "
- - - -
% '1/~"
il ~ q:x,1)2 h) (X,; + 9) i) ~ (;x,; + 9) 26-28 5 40 0, 125 1,000 12,5 100,0
j j 2325 6 35 0, 150 0.875 15,0 87,5
20-22 12 29 0.300 0,725 30,0 72.5
j) ; ( ~ X; + 9) 17-19 10 17 0.250 0,425 25,0 42,5
14-16 7 7 O 175 0.175 17,5 17.5
- -- ~ --- -
7. Demostrar que ;ti ( t X,, + k)1 1
r

i= 1 j = l
'
X,J + rk . 40 1,000 100,0

8. Demostrar que Ls (
' X,; + k )
= ' s Xii + sk. Tambin habran sido posible los intervalos 13-15, 16-18, 19-21, 22-24 y 25-27.
j == J :,: t i =- 1 j :;;;, 1

9. Demostrar que
1
f '
1
'
;~i X,~ = J '(
1
'
;~i X,} ) = ;~i
s ('
.~i X,j ) . 4.6.
X n, 11. p P, % ;1/~Q
' ' \ l ' s
--- ~ +- - ---
10. Demostrar que, en general, ( ,~i ;~i X,;) i .~ ~ X;] 17-19 8 50 0, 16 1.00 16 100
1 1 14-1 6 9 42 0, 18 0,84 18 84
11. Demostrar que, en general ,
i = l ) "' l
X; Y,1 =f. ,
je 1 j -= 1
X;J ,
i == 1 J::. 1
Y,,.
11-1 3
8-10
5-7
12
10
7
33
21
11
0,24
0,20
0,66
0,42
24
20
66
42
0,14 0,22 14 22
12. Demostrar que, en general , I'('
t = l j= 1
X,; 'f)' '(' X; )] 1= 1 l""' 1
1 .
2-4 4 4 0,08 0,08 8
- ~- -
8

f' 50 1,00 100


362 / Estad1st1ca p ara Psiclogos Apndice 11. So/uc,ones a los eerc,c,os propuestos / 363

4.7. 5.7. X9 = 2.20 ti = 2.251


5.8. 3 y 12
11, /! '"
- - 5.9. Tambin. A
42,572 0.2267 22.67 5.10. 30
25.683 0,1368 13.68 5.11. 65,727
22.665 0,1207 12,07 5. 12. 6.5
8.083 0,0430 4.30 5.13. M dicos: 0,3 08: Abogados: 0,467: Ingenieros: 0.225
49.049 0,261 2 26,12
5.14. Solteros: 0.27: Casados: 0.51 : Viudos : 0.22
37.578 0.2001 20.0 1
5.15. a) 4,9 h ) 22 e) 29,75 d) 42,278
2.166 0.0115 1.15
e) 28.324 () 123,773 g) 88,5 /) 100,2
187.796 1,0000 100.00 5.16. a) 5 h) 42 e) 17 d) 18 1') l l,75
n 4.9 g) 7.625 1, 22,25 i) 3,6
5.17. a) S b) No
4.8. 5.18. Mediana
X n,, p o,
%11 5.19. a) Mediana h) Mediana e) Media

20-24
"1
12 80 0, 150
""
1.000
'
15,00 100,00
5.20.
5.21.
4,375
a) P , 5 = 70,2353 P25 = 73,1765 P3 , = 76,2 105
15-19 18 68 0,225 0.850 22.50 85,00 P15 = 86,6667 P82 = 89,0000
10-14 24 50 0,300 0,625 30.00 62,50 5.22. a) P25 = 89,000 . P 30 = 91,625 P75 = 100,045
5.9 16 26 0,200 0.325 20.00 32,50 5.23. 24.7 (perccntil 12), 38,5 (percentil 88)
0-4 10 10 0.125 0, 125 12.50 12.50 5.24. No tiend que serlo (aunque puede se rlo)
5.25. No. Un percentil es una puntuacin que puede ser posi tiva, negativa o nula
80 1,000 IOOJlO

4.9.
o, CAPITULO 6
X ", " p p., /o ./.

92-95 ,1il 4 20 0,20 1.00 20 100 6.1. a) 9,20: 3,033 h) 1,50 : l,225 ; e) 4,40; 2,098 d) 2:
88-91 ,r 1/! 8 16 0.40 0.80 40 80 1,414 l') 5,33; 2,309 f) 8,67; 2,944
84-87 11/1 I 6 8 0,30 0.40 30 40 6.2. a) 2,4 h) l e) 2 d ) l,333 e) 2
80-83
--
// 2 2
- - - - - -- -- - - - - --
0.10 0, 10 10 10
.n 2.667
20 1,00 100 6.3. a) 7,5 ; 2,739 b) 7,56; 2,75 e) 6,56; 2,561 d ) 24,0J ;
4,9 e ) 8,64 ; 2,939 f) 26, 188; 5,11 7 K) 7,29:
2,7 /) 24,422: 4,942
6.4. a) 2 h) 2,4 , e) 2,24 d) J. 78 e) 2,4
CAPITULO 5 n 3,85 g) 2,24 11 4,01
6.5. a) 6.745 1 b) 5,5225
2
5. 1. a)
5,25 h) 20 e) 2,8 d) - 0,5 e) 0,633 6.7. (l - 3) + (2 - 3)2 + (6 - 3)2 = 14; (l - 5)2 + (2 - 5)2 + (6 - 5 )2 = 26 :
f) - 0,5875 g) - 0,051 (3)(3 - 5)2 = 12; 14 = 26 - 12
5.2. a) 7,2 h) 91 ,2 ; e) 75,7 d) 34,237 6.8. r
(X, - 5 )2 = 12, n(X - 5) 2 = (8 )(4,75 - 5) 2 = 0, 5
e) 31.875 /) 0.1379 ; K) !0.417 xi
r 1x, - 2 = 12 - o,5 = 1 u
5.3. Al intervalo 11 -13 le corresponde 5; al intervalo 2-4 le corresponde 2 75
6.9. Elegi r k = 1.75, .i; = _!2 , = l 5,9375
5.4. 4 y 12 f' 8
5.6. 15 6.10. 69
364 / Estadistica para Ps,c ologos Apndi ce 11. Soluciones a los eerc1c1os p ropuestos / 365

6.1 l. 65 8.13. a) 6,68 "1C, : 10 h) 84, 13 ', : 126 e} 69 . 15 "1 : 104


6.12. a) 60,66 h ) 40,833 e) 69.933 d} 70, 70 /) 20.29 ...: : 30
d) 22,66 "/., : 34 e) 28.57 /., : 43
e) 57,725 /) 49.067
~ ) 53.28 "/,. : 80
6.13, 25: 24
8.14. a) 40.16 b ) 48,80 e) 50.40 d) 47. 12
6, 14. 100 e) 44.08: 55,92 /) 48 : 52
6. 15. X = 5. M cd = 2 8. 15. 30.50 8.16. 16.48 8.17. 6 8.18. 4.50
8. 19. 60 ; 5 8.20. 34; 5 8.21. 37.900 8.22. 110
8.23. 41 O 8.24. 58 : 8 8.25. 75; 10
CAPTULO 7 8.26. 23.52 : 192.48 :::: 192 8.27. 6,68 "/., 8.28. 6,67
8.29. 20: 5
7. 1. 0,6 8.30. S 8.3 1 No 8.32 No 8.33 No
7.2. 2.2 8.34.
7.4. a ) a 3 = 0,5145, As = 0,059 a} T b) T
b) a 3 = - 0.328, A s = - 0,355 --
7.5. a) G4 = -0, 6345, b) G4 = - 0,336 66,4 67,5
7.6. P 75 = 12,5. CV = 40.32 59.9 59,9
7.7. 50 55,5 54, 1
50.5 48.0
42,9 40.1
CAPITULO 8 32,5 29,5

8. l. a) dif. : - 3: l : 3 : O: - 1 lp.: - 1,5: 0,5: 1,5 : O; -0,5


b) diL 3; O; - 3 ; l; - 1 tp. : 1,5 ; O; - 1,5: 0,5 : -0.5 CAPTULO 9
e) dif.: - 5 : 5: 5 : - 5 tp.; -1 : l: l: - 1

f'' J''-r _: -
' : - - l -, 2 - 1 X
d) dif. : - 1; 0;2 : - l llp. , 9. 1.
Fs JD' ./ w
' 3 3
e) d if. : - 3 ; O; 3 tlp. : - J6' , ,OJ]
fa
1

8.2. a) dif.: 8 directa ; 28 n-~~~ -' o -~ j__1~


b) dif. : 6 directa : 26 6-10 1 8 1 2 O j 10
~- ~~ - -
e) dif. : - 4, directa : 16
d) dif.: - l 8 1 6 j 6 1 20
directa: 19
e) dif. : 3,6 directa: 23.6
8.4. 40 9.2. 8,0375
8.5. No (su varianza vale 2) 9.3. a) 7, 1: 10.5 b ) Xr ; s = 4.3 , i r =tJ = 9.9 }\ .u = 8
8.6. Y, = X, - -~ 12 + 50 56, 44. 50, 32, 68 >'x= 7.5 = 11,33 Yx= ,1.s = 13 ; e) 11,04 ; 6,25 ;
4
8.7. 120 d) s;,,; 8 = 2,56 s;,213 = 3,84 , s,\= 3 ,s = O , s;x ,. 5 = 5,556 .
8.8. 9, 5, l. 7, 13 sffx=l t,s = O e) 7
8.9. X,: 13, 9, 7, JO, l l Y;: 28, 12, 4. 16, 20 9.4. a) 3,2 . 7.4 b ) X r ;s = 3,6 . .t'y . 8 = 3,1 Yx =l = 7,7 .
8.1 0. JO Yx; 4 = 7,2 e) 0,96 , 1,44 : d) s;,. 5 = 0,64 . .1; 1; 8 = 0.99 ,
8.11.
8.1 2.
X= 20 , Y = 12 sx = 8
a) a plici,t la misma transformacin 3X + 45
s,. = 6 s;,=i = 0,81 , s;x~
4 = 1,76 e ) ~ 0,24
9.5. a) 5,22 5 5,8 b) 5 e) 8, 154 d) 5,125 . 10.26
b) mcdi por d ebajo, media (aproximadamente) por en cima. una por encima
<') 4,5 f) 5,589 g ) 4,2075
366 / Estad/si/ca para Ps,clogos Apndice //. Soluc,ones a los eerc,c,os propuestos / 367

9.IO.. CAPITULO 12
X y xr
12.2. Basta con recor da r 10.2.3 .b y tener en cuenta que ,_. = r,/1,/s,) x. donde
2 4 8
r,,,.fs,) es una constante
4 4 16
12.3. Basta con demostrar que r x lr - r ') = O. r xr = r xr
8 10 80
10 14 140
12.4. Basta con demostrar que r y'(y - r ' ) = O, , r rr ' = r r' 1
12.5. Basta con recordar que f = f '
12.6. La igualdad propuesta equivale a r lr - r ')r' = O. que ha quedado demos-
trada en 12.4
12.7. S 12.8. No necesa riamente
CAPITULO 10
12.9. 4 12.13 12.14.
10. l. a)0,9 b) -0,6 e) 0,189 d) - 0,913 l r2 X r
- -~
e) 0,575 () -0,789
- 6 - 9 81 1 6
10.2. a) 0,356 ; b) - 0,853 ; e) 0,5 19 d) - 0.556 ; e) - 0.657 -- 2 - 3 9 13 10
10.5. Recuerde que el numerador de rx, es n L XY - LX L Y, que ser necesa- 9 81 4 7
riamente O si rx, = O o o o -~ 4
10,6. No 10.7. No 10.9. u) Tiene perfecto sentido : h) El 2 3 9 7 8
mismo (recuerde las propiedades de rx,.)
10.10. a) 244 , b) 484 , e) 4
s X - rs , rsx - s\._ __ 12. 15. 0,80 12. 18. 1,2 12.21. 1,44
10.12. 6
r,.,. = .j '
10.14. 0,65
10.13. 'n = Js; + s; - 2rx,s.s,. s~ +
2 2 s ,.
S_r - YX}' XJ ).

10.15. Para rxy = 1, 37; para rx, = O, 41: para r,r = - l. 45 CAPITULO 13
10.16. 0,875
10.17. Cuando rn = O , s., = 13 cuando rxv = 1 , s~ = 1 13.l. u) 11;., = 0,787 h) 11;. = 0,423 e) '1;.x = 0,808
JO.J8. rDH =0 13.2. a) 11;, = 0,592 h) 11;x = 0,625 e) ,;, = 0.200:
d) 11;.. = 0,663
13.4.
CAPITULO 11 X ., }"

- - - - -
11.1. a) Y' = 0, 3 + (0,9)X, y'= (0,9)x, z;, = (0,9) z, l - 3 5
b) Y'= 7 + ( - 0,6)X, y'= (-0,6)x, :;. = (-0,6) : , 6 2 5
4 o 5
e) Y'= 1,786 + (0,07l)X, y '= (0,07 1) x, : ;, = (0,189) z, 1 5
5
d) Y' = 3,5 + (--0,5)X, y' = (-0,5)x , :; = (-0.9 13) : ,
e) Y' = 3,4 + (1 ,15) X , y ' = (1,15) x , z; = (0,575) :,
/) Y'= 5,422 + (- 0,692)X, y'= (-0,692)x , z; = (-0,879):,
11.2. Y'(0,4; 10,0; 19,6: 6,8; 13,2) , y '(-9,6 ; O: 9,6: - 3,2: 3,2)
z;.( - 1,2: O; 1,2: - U,4 ; U,4J CAPITULO 14
11.3. a) 20 : b) 30 ; e) 40
11.4. Y'= 5 + (2)X y' = (2)x 14. 1. 0,57 14.2. 0,43 14.3. 0,69 14.4. 0,43
11.5, 5 7; JJ.6. y ' = (0,50) X 14.5. a) 0,7 b) -0,8 e) 0,71 4 d) 041 1
11.7. Y' = 6 '+ (0.8) X 14.6. a) 0.667 b) - 0,2 e) 0,067 d) - 0.524
368 / Estadisti ca p ara Ps,c/ogos Apndice /l. Sol ucion es a los ejerc,c,os p r opuestos / 369

14.7. I = 38 N I = 152 b) lp.: - 1.56 -0,28 0,06 0,40 1.38


14.8. a) 0,739 b) - 0,806 e) - 0,606 d) 0,601 dif.: - 6,24 - 1, 12 0,24 1,60 5,52
e) 0,460 f) - 0.282 dir.: 1, 76 6,88 8,24 9.60 13,52
e) t p. : 0,20940; 0,37037; -0,97151 ; 0,9017 1 ; -0,50997
dif. : 0,4 1880; 0.74074 ; - 1,94302 ; 1,80342 ; -1 ,01994
CAPITULO 15 dir. : 4,41 880 ; 4.74074 ; 2,0569 8 ; 5,80342 ; 2,98006
15.1. a) 0,667 h) 0,6 e) - 0,556 d) 0,280 d ) tp.: - J2/ 3 - J2/3 0.00 2 ./213
15.2. a ) 24,242 h) 0,284 e) 15, 139 d) 7.778 dif. : - 1/ 3 - 1/3 0,00 2/3
e) 19,833 /) 59,686 dir.: 2/3 2/3 1,00 5/ 3
15.3. a) 0,442 h) 0,06 e) 0,524 d) 0,529 0,663 d) 0,577
17.1 5. a) 0,4 18 b) 0.957 e)
e) 0,533 /) 0,611
15.4. 24
15.5. 0,8485
CAPITULO 18
CAPITULO 16
18.1. 2,8 a) 13,2 0,1 75 ; 0,825
16.1. a) -0,41 b) 0,30 e) 0,75 d) 0,46 14,656
b) 1,344 0,916 0,084
16,2. a) 0,32 b) 0,37 e) 0,30 d) - 0,38 e) 8,79 11,2 1 2,802 , 2,198
16.4. a) 0,45 b) -0,1 0 e) - 0,20 d) 0,15 d) 1/6 1/ 3 1/3 ' ; 2/3
eJ 0,2 1 18.11. 9 0,80
16.6. a) - 0,51 b) 0,38 e) 0,95 d) 0,58
16.7. a) 0,40 b) 0,47 e) 0,38 d) -0,49
16.8. a) 0,72 b) - 0, 16 e) - 0,31 d) 0,24
SOLUCIONES AL APNDICE 1
e) 0,33

a) 6, h) 26, e) 36, d) 24. <') 2, f) -9


CAPITULO 17 g) - 15/ 6, /) 70, i) 62, j) 17, k) 9
2.1 ) 4, b) 5, e) 6, d ) 29/ 6
17. 1. a) 0,722 b) 0,082 e) 0,665
17.2. 0,768 2.2 a) - 2, h) -6. e) 4. d) - 5/ 6
17.3. r 12 .3 = r 12 2.3 a) 26, b) 68, ,) 40, d) 37/36
17.JO. z; = (0,438) Z 2 + (0,312) Z3 , x; = (0,875) X 2 + (0,625 ) X3
2.4 a) 4, b) 36. e) 16, d) 25/36
17. ) 1, z;
= (0,750) Z2 + (0,250) Z3 x; = (0,6) X2 + (0,5) X3
17.12. a) z; = (0,250) z 2 + (0,250) z 3 , x; = (0,5) x 2 + (0,25 ) x 3 2.5 a) O. b) o. e) O, d) - 5/ 12
x = 2,75 + (0,5 ) X 2 + (0,25) X3 2.6 a) - 6. b) -1 8. e) 12. d) - 5/2
b) z;
= (0,92) Z2 + (0, 12) Z3 ' x;
= (l ,84) X2 + (0,24) X3 2.7 30, h) 25. e) 50. el) 505/36
x; = - 0,3 2 + ( 1,84)%2 + (0,24)%3 a)

e) z; z
= (0,60114 ) 2 + (0,13960) z3 x;
= (0,20038)x 2 + (0,0698) x 3 2.8 a) 38, h) 49, e) 34, d) 625/ 36
x; = 1,77778 + (0,20038) X 2 + (0,0698 ) X 3 2.9 a) 16. h) 25, e) 36, d) 841 /36
d) z; = (l/3)z2 + (l/3)z3 ; x; = ( l/3)x 2 + (J / 3)x3 ;
x; = (1 /3) X 2 + (1/3) X3 6. a) 5. h) 23, e) 25, d) 42. e) 25. n 11
g) 17. J,) 59, i) 32. ; ) 23
17.13. tp. : - 0,50 - 0,25
a)
dif. :_..- 2,00 - 1,00 O, 75 0,00

dir.':' 4, 00 5,00
0,00
6,00
3,00
9,00
6.00
Apndice 111 TABLA A. Dis tribu cin normal. P (Z :5 z). ( cont in ua C'/011)

~ z o 1 2 3 4 5 6 7 8 9
TABLA A. Distribucin normal. P(/.. ~z) . O'O '5000 '5040 '5080 ' 51 20 '5160 '5199 ' 5239 '5279 ' 5319 ' 5359
z O' l '5398 1
5438 '5478 '551 7 '5557 '5596 ' 5636 '5675 ' 5714 '5753
0'2 '5793 '5832 '5871 ' 5910 '5948 '5987 ' 6026 '6064 '6113 '6141
0'3 '6 179 '62 17 '6255 '6293 '6331 '6368 '6406 ' 6443 ' 6480 '6517
0 '4 ' 6554 ' 6591 '6628 '6664 '6700 '6736 '6772 '68-08 '6844 '6879
z o l 2 3 4 5 6 7 8 9 0 '5 '6915 '6950 '6985 '7019 '7054 '7088 1
7123 ' 71 57 1
7190 1 7224
0' 6 '7257 '7291 '7324 '7357 '7389 '7422 ' 7454 ' 7486 '7517 '754 9
-3'5 '0002 '0002 '0002 1
0002 '0002 '0002 1
0002 1
0002 '0002 ' 0002
0' 7 ' 7580 '7 611 '7642 '7673 '7703 ' 7734 ' 7764 ' 7794 '7823 ' 7852
-3'4 1
0003 '0003 '0003 '0003 '0003 ' 0003 '0003 '0003 '0002 ' 0002 '8023 ' 8051 ' 8078 '81 06 '8133
1
0004 '0003 0'8 ' 7881 ' 79 10 ' 7939 '7967 ' 7995
- 3' 3 '0005 '0005 '0004 '0004 1
0004 1 0004 '0004 '0004 0 '9 '81 59 ' 8186 ' 8212 '8238 '8264 '8289 '8315 ' 8340 '8 365 '8389
-3'2 1
0007 '0007 '0006 1
0006 1
0006 '0006 ' 0006 '0005 '0005 '0005
1 'O '8413 '8438 '8461 '8485 '8508 1
8531 '8554 ' 8577 ' 8 599 ' 8621
-3' 1 !OOlO '0009 '0009 ' 0009 ' 0008 '0008 '0008 ' 0008 '0007 '0007 1 ' 8749 ' 8770 ' 87 90 ' 8810 ' 8830
' 0010 1 '1 ' 8643 '8665 8 686 '8708 '8729
-3'0 1
0014 ' 0013 '0013 '0012 '0012 '0011 ' 0011 '0011 ' 0010 1' 2 '8849 ' 8869 '8888 '8907 '8925 '8944 '8962 '8980 ' 8997 ' 9015
-2'9 ' 0019 '0018 '0017 1
0017 '0016 '0016 1
0015 '0015 '0014 '0014 ' 9115 ' 9131 '9147 ' 9162 1 9177
113 '9032 '9049 ' 9066 ' 9082 '9099
-2'8 1
0026 '0025 '0024 '0023 ' 0023 '0022 '0021 1
0021 '0020 '0019 ' 9292 '9306 '93 19
'0026 1 '4 '9192 ' 9207 '9222 ' 9236 '925 1 ' 9265 ' 9278
-2'7 '0035 1 0034 '0033 '0032 ' 0031 1 0030 '0029 ' 0028 '0027 '9370 '9382 ' 9394 ' 9406 ' 9418 '9430 ' 9441
' 0037 1
0036 l '5 ' 9332 ' 9345 '9357
- 2'6 '0047 '0045 '0044 ' 0043 ' 0041 ' 0040 ' 0039 ' 0038 116 '9452 '9463 '9474 '9484 '9495 '9505 ' 9515 ' 9525 '9535 '9545
-2 1 5 1
0062 ' 0060 '0059 '0057 '0055 '0054 '0052 '0051 ' 0049 '0048 ' 9582 '9608 ' 9616 '9625 '9633
'0064 1'7 '9554 '9564 ' 9573 '959 1 '9599
-2'4 '0082 1 0080 '0078 '0075 '0073 '0071 '0069 '0068 '0066 '9648 1 '9664 '9671 ' 9678 '9686 ' 993 ' 9700 ' 9706
'0084 1'8 '964 1 9656
-2' 3 ' 0107 '0104 '0102 '0099 '0096 '0094 '0091 '0089 '0087 '973 2 ' 9738 ' 9744 '9750 ' 9756 ' 9762 '9767
' 0110 l '9 '9713 ' 9719 '9726
-2 ' 2 '01 39 1 0136 '0132 '0129 '0126 ' 0122 '0119 ' 0116 ' 0113 1 '9783 ' 9788 ' 9793 '9798 '9803 ' 9808 '981 2 '9817
' 0146 ' 0143 2'0 9772 '9778
- 2' 1 '0179 '0174 '0170 ' 0166 '0162 ' 0158 '0154 ' 0150 ' 9826 1
9830 '9834 '9838 ' 9842 '9846 '9850 '9854 ' 9857
1 '0192 ' 0188 ' 0183 2' 1 '982 1
-2 1 0 '0228 1 0222 1 0217 '02 12 '0207 '0202 0197 2 '2 '9861 '9864 ' 9868 '9871 '9874 '9878 '9881 ' 9884 ' 9887 ' 9890
-1 '9 '0287 ' 0281 '0274 '9268 '0262 ' 0256 '0250 1
0244 '0238 '0233 '9901 1
9904 '9906 '9909 '9911 '9913 '9916
' 0294 2' 3 '9893 ' 9896 '9898
-1 ' 8 ' 0359 '0352 ' 0344 '0336 '0329 '0322 '0314 ' 0307 '0300 '9927 ' 9929 '9931 ' 9932 ' 9934 '9936
'0367 2' 4 ' 9918 '9920 ' 9922 '9925
- 1'7 '0446 '0436 ' 0427 ' 0418 '0409 '0401 ' 0392 ' 0384 '0375 2' 5 '9938 '9940 '994 1 '9943 ' 9945 '9946 '9948 '9949 ' 9951 ' 9952
-1'6 '0548 '0537 '0526 '0516 '0505 '0495 '0485 '0475 '0465 '0455 ' 9959 ' 9960 '9961 ' 9962 ' 9963 '9964
2'6 '9953 '9955 '9956 '9957
- 1' 5 ' 0668 '0655 '0643 '0630 ' 06 18 '0606 '0594 '0582 ' 0570 ' 05 59 2' 7 ' 9969 '9970 '9971 ' 9972 ' 99 73 ' 9974
'0681 '9965 '9966 ' 9967 '9968
-1 '4 '0808 '0793 '0778 '0764 '0749 ' 0735 ' 0722 '0708 '0694 2' 8 '9976 '9977 '9977 '9978 '9979 ' 9979 ' 9980 '998 1
1 ' 0838 ' 0823 '9974 '9975
-1 '3 '0968 '0951 '0934 ' 0918 '0901 ' 0885 ' 0869 0853 2' 9 ' 9981 '9982 ' 9982 ' 998 3 '9984 '9984 '9985 ' 9985 '9986 '9986
1
-1'2 '11 51 '1131 '1112 ' 1093 '1075 '1056 '1038 ' 1020 '1003 0985 ' 9988 ' 9988 '9989 '9989 '9989 ' 9990 '9990
3'0 '9986 '9987 '9987
-1'1 '1357 '1335 '13 14 ' 1292 ' 1271 '1251 '1 230 '1210 '1190 '1 170 3'1 '9990 ' 9991 '9 991 '999 1 ' 9992 '9992 '9992 '9992 '9993 ' 9993
-1 'O ' 1587 '1562 '1539 '1515 '1492 ' 1469 '1 446 1
1423 ' 1401 '1379 '9994 '9994 ' 9994 '9994 '9994 ' 9995 '9995 ' 9995
' 161 l 3' 2 ' 9993 '9993
- 0'9 '1841 '1814 '1788 '1762 '1736 ' 1711 '1685 '1660 '1635 '9995 ' 9996 '9996 '9996 '9996 ' 9996 '9996 ' 9996
'1894 ' 1867 3' 3 '9995 ' 9995
-0'8 '2119 '2090 '2061 '2033 ' 2005 1 1977 ' 1949 '1922 3'4 ' 9997 ' 9997 ' 9997 '9997 '9997 '9997 ' 9997 ' 999 7 ' 9997 ' 9998
- 0'7 '2420 '2389 '2358 ' 2327 '2297 ' 2266 ' 2236 '2206 ' 2177 ' 2148 ' 9998 '9998 '9998 '9998 '9998 '9998 1
9998 '9998 ' 9998
' 2451 3'5 ' 9998
-0' 6 '2743 '2709 '2676 '2643 '2611 ' 2578 '2546 '2514 '2483
-0' 5 '3085 '3050 '3015 '2981 ' 2946 '291 2 '2877 ' 2843 '2810 '2776
-0'4 '3446 ' 3409 '3372 '3336 '3300 '3264 '3228 '3192 '3156 '312 1
-0' 3 ' J821 '3783 '3745 ' 3707 ' 366 9 '3632 ' 3594 '3557 '3520 ' 3483
-0'2 '4207 '4168 '4129 '4090 ' 4052 '4013 '3974 '3936 '3897 '3859
-0'1 '4620 '4562 '4522 '4483 ' 4443 '4404 ' 4364 '4325 '4268 ' 4247
-0'0 '5000 '4960 '4920 ' 4880 '4840 1 4801 '4761 472 1 ' 468 1 ' 464 1
Los va lores interiores indican probabilidades . Dela nte d e la coma decimal.(', se e ntiende que
va un cero. Asi, por CJcm plo . 8925 equivale a 08925 e indica que P(/. < 1'24) = 0'8925.
(conti nUo)

Fu t~ 1r : IIL U M. J. R. y ROSF.MBLA T T , J. l.. Prubobihties and Statisrics. f iladelfia, Launders.


Los valores intcfores indican probabilidades. Delante de la coma dec imal. (), se entiende qu e
va un cero. As,' p or ejemplo , 1292 equi vale a O' 1292 e indica qu e Pi/. :5 - 1 13) = o1292 1972.
TABLA B. Funcines de p , q e y. TA BLA B. Funciones J e p, q e v. (cant:nua c1n)

p B E
p A B e D E F q ;pTq p /y
(o, q ) lpq ljiTq pq/y /pq/y p/y y (o ' p)
O' 4 9 0'980 1 ' 229
0'99 0'0995 9'950 O' 371 5 3'733 37'148 0 ' 02665 0' 01 O' 4 8 0'96 1 1 ' 205
0'98 0'1400 7'000 0'4048 2 1 892 20 1 24 o 0'04842 0' 02 O' 47 O' 94 2 1 '18 1
0 ' 97 O' 1706 S' 68 6 0 '4 277 2'507 14 1 256 0'06804 0 '03 O' 4 6 0'923 1 ' 159
0 ' 96 0'1960 4 '899 0 ' 4456 2'274 11 ' 141 0'086 17 0' 04 O' 4 5 O' 904 1 '137
0'95 0'2179 4 1 359 0'4605 2 1 113 9 ' 211 0 ' 1031 0 '05 0' 44 0'886 1 ' 1 16
0 ' 94 0'2375 3'958 0'4735 1 '994 7'891 O' 1191 0' 06 O' 4 3 0 ' 869 1 '095
0'93 0'2551 3'645 0'4848 1 '900 6'926 O' 1343 0 ' 07 O' 4 2 O' 851 1 ' 074
0'92 0'2713 3 ' 391 0'495 1 1 ' 825 6' 188 0 1 1487 0'08 0'41 0'834 1 ' 054
0 ' 91 0'2862 3'180 0 1 5043 1'762 5' 604 O1 16 24 0 ' 09 0 ' 40 0 ' 816 1 1 035
0'90 0'3000 3'000 0'5128 1'709 5'128 0 ' 175 5 O' 1 O
0'39 0 ' 800 1 1 016
0'89 0 1 3129 2'844 0'5206 1'664 4 1 733 O' 1880 0'1 1 0'38 0'783 0 ' 998
O'88 0'3250 2 1 708 0 ' 5279 1 '625 4'399 0'2 0 00 O' 12 0 ' 37 0' 7 66 0'980
0'87 0'3363 2'587 0'5346 1'590 4 '112 O' 211 5 o 11 13 0'36 0 ' 750 0 ' 962
0'86 o1 3470 2 1 4 78 0'5409 1'559 3'864 0'22 26 o 14 0 ' 35 0 ' 734 0'945
0'85 0'3571 2'380 0'5468 1 1 532 3'646 0 ' 2332 o 11 1 5 0 ' 34 0'718 0 ' 928
0 1 84 0'3666 2'291 0 ' 5524 1 1 507 3' 4 52 O' 24 33 o 16 0 '3 3 0'702 O' 9 11
0'83 0'3756 2'210 0'5576 1 '484 3'28 0 0'2531 O' 1 7
O' 8 2 0'3842 2' 134 0'5625 1 '464 3'125 0 1 2624 o1 18 0 ' 32 0'686 0 ' 895
O' 81 0'3923 2'065 0 1 5671 1 '446 2'985 O' 2 714 O' 19 o11 3 1 0 ' 670 0 '879
0'80 0'4000 2'000 0'5715 1 1 429 2'858 0 1 2800 0' 20 o 30 0'655 0'863
0 ' 79 0 ' 4073 1 '940 0 ' 5756 1 1 4 13 2'741 0 ' 2882 0 '21 0'29 0 ' 639 0'8 4 7
0 1 78 0'4142 1' 8 83 0'5796 1 '399 2 1 634 0' 2961 0 '22 0 ' 28 0 ' 624 0'832
' 77 0'4208 1 '830 0'5832 1 1 386 2 1 536 0 1 3036 0 '23 o1 2 7 0 ' 608 o1 8 17
0'76 0'4271 1 1 780 0'5867 1 1 374 2 1 44 5 0'3109 0 '24 0 ' 26 0'593 0 ' 80 1
0'75 0 1 4330 1 '732 O' 5900 1 ' 363 2 1 360 0'3178 0 '25 0 ' 25 0 ' 577 0 ' 78 7
0'74 O' 4 38 6 1'687 O' 59 31 1 '352 2'281 0'3244 0 ' 26 0'2 4 0 ' 562 O' 772
0'73 0 1 4440 1'644 O' 5961 1 1 34 3 2 1 208 0 ' 33 06 0 '2 7 0'23 0'54 6 0'758
0'72 O' 44 90 1 1 604 0'5989 1 '334 2' 139 0' 3366 0' 28 0 '22 0 ' 53 1 0 '7 43
O' 71 0 1 4538 1 '565 0 ' 6015 1 1 326 2'074 o 1 3423 0' 29 O' 21 O' 5 1 6 0 ' 729
0 1 70 0'4583 1 '528 0'6040 1 1 318 2 ' 013 O' 34 77 0'3 0 O' 2 O 0 ' 500 O' 714
0'69 0'4625 1 1 492 0'6063 1 '311 1 ' 956 0 ' 3528 O' 31 O' 19 O' 4 84 0'700
0'68 0 ' 4665 1' 458 0'6085 1 '304 1 '902 0'35 76 0' 32 O' 18 0'468 0'686
0'67 0 ' 4702 1'425 0'6106 1 ' 298 1 '850 0'36 21 0'3 3 O' 17
0'66 0' 4737 1'393 0'612 4 1 '293 1 '801 0 1 366 4 O' 34 O' 4 53 0 ' 672
0'65 O' 4770 1 1 363 0'6142 1 '288 1 1 755 0'3 704 0' 35 O' 16 O' 4 36 0 ' 658
0 ' 64 0 ' 4800 1 '333 0'6158 1 ' 283 1 '711 0'3741 O' 36 O' 1 5 0'420 0'643
0'63 0'4828 1 1 305 0 ' 6174 1 '279 1'669 0'377 6 0 1 37 O' 14 o 1 403 0'6 2 9
0'62 0'4854 1' 277 0'6188 1'275 1 '628 O' 38 0 8 O' 38 O' 13 0 ' 387 0'6 1 5
0'61 0'4877 1' 251 0 1 6200 1 '27 1 I '590 0 '38 37 0 '3 9 O' 12 0 ' 369 0'600
0'60 0'4899 1'225 0'6212 1 '268 1'553 0'3863 0 '4 0 O' 11 0 ' 352 0'585
0'59 0 ' 4918 O' 1 O 0' 333 0 ' 570
1 '200 0'6223 1 '265 1 '518 0'3888 O' 4 1
O' 58 0 ' 4936 1'175 0 1 6232 1 '263 1 '484 0'3 909 0' 42 0 '09 O' 314 O' 5 54
0'5 7 0'4951 1' 151 O' 624 O 1 '260 1 1 451 0 ' 39 28 0 ' 43 0 ' 08 0'295 0 ' 538
0'56 0'4964 1 ' 128 O' 624 7 1 '2 59 1 1 420 0 ' 3944 0 ' 44 0'07 0'27 4 O' 5 21
0'55 0'4975 1 '1 06 0' 6 253 1' 257 1 1 390 0' 3958 O' 4 5 0 ' 06 0 ' 253 O' 504
O' 54 O' 4984 1 1 083 0'6258 1'256 1 '3t0 0 ' 39 6 9 o 1 46 0'05 O' 229 O' 4 85
0'53 0'4991 1'062 0'6262 1 '255 1 '332 0 ' 397 8 0'4 7 0'04 o1 20 4 0'464
0 ' 52 0'4996 1 '041 0'6264 1 '254 1 '305 0'398 4 0 '4 8 0'03 O' 176 0' 44 1
O' 51 0'4999 1 '020 0'6266 1 '253 1'279 O' 39 88 0 '49
0'5 0 0 ' 5000 1'000 0'6267 1'253 1 ' 253 0 '3989 0 '5 0
0' 02 o 1
143 O' 4 1 3
o1 01 O' 1 00 0 '3 75
,j'
FuENH: GUILFORD. J. P., Fundamenral Sraris rics 1n Psycho/ogy and Educatwn . 4. euicin.
(commaJ 1965. apndice B. tabla G.
TABLA C. Clculo del coeficiente de c orrelacin tctracrica , r,. (*)

rt cb/ad o ad/cb rt cb/ad o a d/cb rt cb/ad o ad/cb

0'00
O' 01 1 '
1 ' 013-1 '039
0'35
0'36
2'492-2 1 563
2'564-2'638
0 '70
0'71
8 1 500 -8'9 10
8'911-9'351
0'02 1'040-1'066 0'37 2 ' 639-2 ' 716 0 1 72 9'352-9'828
0'03 1 1 067-1'093 0'38 2'717-2'797 0'73 9' 8 29 - 1 o'34 4
0'04 1'094-1'122 0'39 2 1 798-2'881 0'74 10'345- 10'903 BIBLIOGRAFfA
0'05 1'123-1'151 0'40 2'882-2'968 0'75 10'904-11'512
l 0'06 1 1 152-1'180 0'41 2'969-3'059 0'76 11'513 - 12' 177
0'07 1'181-1 1 211 0'42 3'0603'153 0'77 12' 178- 12 '905
0'08 1' 212-1 242 O' 43 3 ' 1543'251 0'78 12'906-13 '707
0'09 1'243-1'275 O' 44 3'252-3 1 353 0'79 13 1 70814'592
' 1 O 1'276-1'308 0' 45 3'354 3'460 0'80 14'59315 ' 574 Alcaide lnchausti, A.: Estadfstica aplicada a las Ciencias Sociales, Ediciones Pirmide,
' 11
O' 12
1'3091'342
1'3431'377
0'46
O' 4 7
3'461-3' 571
3'5723'687
0'81
0 1 82
14'575-16'670
16'67117 '899
Madrid, 1976.
Amn , J.; Multidimensionalidad de la religiosidad utilitaria a travs de la afinidad entre
O' 13
O' 14
1 1 378-1 1 413
1 '414-1 '450
0'48
0'49
3'688-3'808
3 1 809-3'935
' 83
O' 84
17 '900-19'287
19'288-20'865 las cuestiones intrnsecas y las extrnsecas, Rev. de Psicol. Gen. y Aplic ., 1968,
vol. XXIII , nm. 95, pgs. 983-988.
O' 15 1 '4511 '488 0'50 3'9364 1 067 0 1 85 20'86622'674 Amn, J .: Prejuicio antiprotestante y religiosidad utililaria, Aguilar, Madrid , 1969.
O' 16 1'4891'528 0'51 4'0684'205 0'86 22'67524'766
O'l7 1'5291'568 0'52 4'206 4'351 0'87 24'767-27'212 Amn, J .: La construccin de escalas psicolgicas en funcin del mtodo elegido , Rev.
o11 18 1' 569 1 '610 0'53 4'3524'503 0'88 27'213-30'105 de Psicol. Gen. y Aplic . , 1972, vol. XXVII , nms. 116-117, pgs . 423-431.
o 19 1'6111'653 o1 54 4'504 4'662 0'89 30'10633 ' 577 Atkinson , R. C., Bower, G. H. y Crothers , E. J.: An Inrrod11ction ro Mathematical
0'20 1'654-1'697 0'55 4'6634'830 0'90 33 1 57837'815 Learning Theory , John Wiley, Nueva York, 1965.
O' 21 1'6981'743 0'56 4'831-5'007 0'91 37'816-43'096 Bailey, N. T. J.: The Ma thematical Approach to Biology and Medicine, John Wiley,
0'22 1 1 744 1 '790 0'57 5'008-5'192 0'92 43' 097-49 ' 846 Nueva York, 1967.
0'23 1 1 7911'838 0'58 5'193-5'388 O' 93 49 '847 -58 '758 Balow , B. , l:'ulton , H. y Peploe, E.: Reading Comprehension Ski/Is Among Hearing
0'24 1'839-1'888 0'59 5'3895'595 0'94 58 1 7597 1 ' 035 lmpaired Ado/escents , Volta Review, 1971, 73, pgs. 113- 119.
0'25 1 '889 - 1 '940 0'60 5'5965'813 0'95 71 '03 688' 96 4 Berman, P. W. , Waisman, H. A. y Graham, F . K .: Inte/ligence in Treat ed Phenylkero-
0'26 1'9411'993 0'61 5'8146'043 0 1 96 88'965- 117 1 479 nuric Children : A Dei-elopmental Study, Child Developmenl, 1966, 37, pginas
0'27 1'9942'048 0 1 62 6'0446'288 0'97 117'480169'503 731-747.
0'28 2' 04 9 - 2 ' 1 O5 0'63 6'289-6'547 0 1 98 169'504292'864
0'29 2'106-2'164 0'64 6'548-6'822 0'99 292'865923 1 687 Bingham , W. Wd., Moore , B. V. y Gustad , J . W.: H ow ro Interview, Harper & Row,
Nueva York", 1959.
0'30 2' 165-2' 225 0'65 6'8237'11S 1'00 923'688 "' Bisset , B. M. y Rieber, M .: Th e Effects of A ge and Incentive Va/u e on Discrimination
0 1 31 2'2262'288 0'66 7'116-7'428
0 1 32 2 1 289-2'353 0'67 7'429-7 1 761 Learning, . J. Exp. Child Psych., 1966, 3, pgs. 199-206.
0'33 2'354-2 1 421 0 '68 7 1 762 - 8'117 Blommers, P. y Lindquist, E . F .: Elemenrary Staristical Methods in Psycholog_v and
o 1 34 2' 422-2'491 0'69 8'118-8'499 Education, University of London Press, Londres, 1965.
Burt, C .: Is lnte/ligence Distributed Normal/y?, Brit. J . Statist. Psychol. . 1963, 16,
pgs. 175-90.
Calo!, G .: Cours de Statistiq11e descriptive, Dunod, Pars, 1969. (Traducida al castellano
(" ) Sr cb>ad calclese cb!ad y acptese como positivo el valor obtenido; indica relacin con el t tulo de Curso de estadstica descriptiva , editada por Paraninfo, 1970.)
positiva entre la categora O ( 1) de X y la categora O ( l) de Y. Si cb < ad, calclese adicb y Casa Aru ta, E.: 200 problem as de Estadstica descriptiva , Vice ns Vives, Barcelona, 1969.
acptese como negativo el valor obtenido; indica relacin negativa e ntre la categora O ( 1) de X y la Collman, R. D. y Stoller, A.: A Survey of Mongo/o d Birrhs in Victoria , Australia ,
categora O < I) de Y. 1942-1957, Arner. J. Public Heallh , 1962, 52, pgs. 8 13-829.
Conde, V. y Domenech, B.: Considerations on the l. Q. With the WA YS in a Sample of
Fu>.NH: GLA~ G. V. y SlANLEY , J. C., Staristical Meth ods in Educa1ion and Psyc/10/0:y. Schizophrenics in Relation With the Sex, Age, Cu/rural Le ve/, Origin, Residence and
1970; apndice A, tabla H. Civil State , Rev. de Neurnl., Neuroch. y Psich. , Oviedo, 1976, 27, pgs . 258-291.

You might also like