Professional Documents
Culture Documents
Estadstica descriptiva
.Jess Amn
. 1
NDICE GENERAL
Prlogo ... ... . .. . .... .. ........ . . ... .. .... ... .. ... .. . . .. ...... . ..... .. ... 7
l. INTRODUCCIN
1. Matemticas en Psicologia . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . . 19
2. Medida en Psicologa .. . . .. . . . . . . . . . . . . . . . . . . . . . . .. .. . . . . .. . . . . . . . . . 25
2. 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . 25
2.2. Carac1crsticas y modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 . Delinicin de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4. Delinicin de escala de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Tipos de escalas de medida (nominal , onJinal, de intervalos, de razn) . . . 29
2.6. Comentario sobre las escalas de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7. Resumen: Deliniciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3. Qu es la Estadistca7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
11.3. Ecua ciones de las rec tas de regresin d e Y sobre X segn el cri terio d e 15. Relacin entr variables nominales .. . . ... . ... ...... . ... < .. 272
mnimos cuadrados ............... . .......................... . .. . . . . . 203
11.4. Ecuaciones de las rectas d e regresin de X sobre Y seg n el criterio de 15. l. Idea previa. .. . . . . ..... . .. .. . .. . ................. . . . . . . . . . . . . . . . . . . . 272
mnimos cuadrados .. . .. . . . ....... . .... . .... . . .. . . . ..... . . .. . . . . . . .. . 21 4 15.2. Coeficiente Q de Yule (undamento y rmula, clculo, propiedades) . . . . 272
11.5. A plicacin d e las rectas de regresin ...... . .... .. . . ........ . .... . . .. . . 2 16 15.3. Coeficie nte 1.' (fundamento y frmula , clculo. prop iedades} . . . . . . . . . . . . . 279
11 .6. Resume n: Definiciones y frmulas ........... . . . . . ........... . .. ..... . 21 7 15.4 . Coeficiente de conti ngencia, C (fundamento y frmula. clculo. propiedades) 284
Apndice. (Introduccin , fu nci n c uadrtica , potencial, exponencial. loga- 15.5. 1n terprc taci n de Q y C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
rtmica/ . . .. .. .. . .. ..... . .... . ...... . .. . . ...... .... .... .. .. . .. . ..... . 218 15.6. Resumen : Definiciones y frmu las . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
E1ercicios .. .. . . .. . ... . .. .. , .... .. .. . . . .. . ... . . . . . .. ........ . ... . . .. 228 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
V. APNDICES ..,,.
Apndice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
Apndice 111. Tablas .. ... ..... ..... .............. .. ... .. ..... ... .. ... ...
Bibliografa .. .. .. . .. .. . .. .. . .. .. .. .. .. . .. . .. .. . .. . . . .. . . . . .. .. .. .. .. .. .. .
371
375
1
381
Indice de autores
Indice de materias . .. . . . . . . . . .. . .. . .. . . . . . .. . . . . . . . . . . . . . . .. . . . . . .. . . . .. 383
Introduccin
1
Matemticas en Psicolog a
Po r regla general, las ciencias se han man tenido a un nivel meramen te cuali-
tativo en su in fancia y han ido ascendiendo a niveles superiores cuantitativos al
ir alcanzando su edad adulta. Los investigadores se han esforzado en ir traducien-
do a lenguaje matemtico la form ulacin verbal primitiva d e las ideas cientficas
y este esfuerzo ha resuhado fec undo p ara la ciencia por un doble motivo . En primer
lugar, el in tento de expresar matemticamen te las hiptesis cientficas ha obli-
gad o a los investigadores a clarificar ms sus conceptos y a perfil ar mejor esas
hiptesis an tes de p lasmarlas definitivamente. En segundo lugar, toda hiptesis
cien tfica es susceptible de una comprobacin experimental ms satisfactoria
cuando viene formulada matemticamente que cuando viene propuesta en forma
meramente verbal.
Son m ltiples las citas aducibles segn las cuales van unidos estrechamente el
progreso de una ciencia y el grado de su desarrollo matemtico. Slo voy a presen-
tar el testimonio de dos psiclogos. Para Stevens (l 951, pg. 1), la importancia
de una ciencia es medida comnmente por el grado segn el cual hace uso de las
matemticas. A juicio de Atkinson et al., (1965, pg. 2), es un hecho histrico
fam iliar que a medida que la ciencia progresa, ;us teoras se van haciendo ms
y ms matemticas en la forma.
Parece, pues, clara la tendencia general de las ciencias modernas a expresar sus
conceptos matemticamente.
temtica a medida que vaya formu lando ms rigurosamente sus ideas fundamentales. o fr ecido cada uno de ellos por separado. En algunas ocasiones. la discordancia
Horst (i966, pg. 2) piensa que la Psicologa ha tardado tanto tiempo en ocupar entre los resultados de uno y otro enfoque puede sugerirnos un plan teamien to
su lugar apropiado entre las ciencias aplicadas, quiz por no haber reconocid o la n uevo m ucho ms acertado que el concebid o previamente.
importancia de la medida en la investigacin psicolgica. Segn Nunnally (1967,
pg. 6) todas las teoras psicolgicas, con el tiempo, irn siendo propuestas en for-
ma matemtica. Bailey (1967, IX) admite que la Biomatemlica ayudar a la Bio-
1.3. Matemticas y complejidad de las manifestaciones
loga y a la Medicina, como la Fsica matemtica ha ayudado a la Fsica. Existe.
psicolgicas
pues, un convencimiento casi general de que el lenguaje cuantitativo ir asumiend o
cada vez mayor relieve en las ciencias de la conducta y, en particular, en la Psico-
loga. De hecho, los modelos matemticos juegan hoy un papel importante en mu- De lo dicho se infiere que hoy las tcnicas matemticas son utilizadas en Psico-
chas reas psicolgicas: Psicologa experimental, diferencial, social, industrial, logia con gran profusin y no poco xito. Por ello consideramos superfluo poner-
pedaggica, ... y aun clnica. La lectura de bastantes artculos y libros relaciona- nos a refutar ciertas dificultades clsicas contra la aplicabilidad de los mtodos
dos con estas disciplinas exige una preparacin matemtica no ligera y, en oca- matemticos en Psicologa. Si n embargo, queremos responder a una pregunta
siones, profunda. Desde luego, sin esta ltima es imposible leer revistas de espe- que, obviamente, pueden hacer muchos lectores. Es posible acercarse a los pro-
cializacin psico o bio-matemtica (Psychometrika, Biometrica, Biome- blemas psicolgicos, de innegable complejidad, con instrumentos de naturaleza
trics, ,dournal of Mathematical Psychology, etc.) o entender libros, cada vez simple y elemental?
ms numerosos, que abordan los problemas psicolgicos de modo rigurosamente Comencemos admitiendo que tanto en Psicologa humana , como, sobre todo ,
mtrico. Igualmente, es necesaria una slida preparacin matemtica para com- en Psicologa animal, existen procesos bastante rudimentarios encajables fcil-
prender diversas leyes o teoras psicolgicas, tal como hoy son propuestas . As, mente dentro de esquemas matemticos. En estos casos no s lo es p osible, sino.
por ejemplo, leyes psicofisicas y psicomtricas, teoras sobre el aprendizaje, teora tambin, muy til la introduccin de instrumentos matemticos. No obstante,
de la decisin y teora de la informacin aplicadas a la Psicologa, teora de tests, debemos aceptar que son escasos los fenmenos psicolgicos de gran simpl icidad
etctera. En conclusin , las matemticas se van h aciendo cada vez ms indispen- y q ue, sobre todo, los fenmenos psquicos de mximo inters son p recisamente
sables dentro de las ciencias humanas y, en particular, dentro de . la Psicologa. los de contextura ms compleja. Qu hacer? En primer lugar, podernos conside-
Los mltiples libros de Matemticas para psiclogos, socilogos, bilogos, etc., rar aspectos parciales del fenmeno com plejo, limitando nuestra investigacin
que vienen apareciendo durante estos ltimos aos, son un ndice cla ro de que a ellos y, por supuesto, restringiendo, despus, n uestras conclusiones a esos ni-
estos investigadores necesitan y piden una fundamentacin matemtica cada vez cos aspectos. De esta manera pod remos uti lizar tcnicas matemticas relativamente
ms seria para poder abordar adecuadamente muchos problemas de sus corres- simples. En segundo lugar, conviene advertir que existen modelos matemticos
pondientes especialidades. muy complejos y a los q ue podemos acudir en muchos casos. Desde Juego, su ma-
Sin negar, ni mucho menos, la importancia del lenguaje matemtico en Psico- nejo exige con ocimientos matemticos no asequibles a .todos los psicl ogos. Es una
loga, conviene, no obstante, advertir que la tarea fundamental de un psiclogo dificultad innegable, pero no invencible. Es extrnseca y superable con una prepa-
es llegar a consecuencias psicolgicas a partir de premisas, tambin, psicolgicas. racin matemtica adecuada. En conclusin, parece p osible acercarse a muchos
Los instr umentos matemticos sern tiles en Psicologa en cuanto nos ayuden problemas psicolgicos con instrumentos matemticos con tal que stos sean sufi-
a alcanzar conclusiones psicolgicas. Sin duda alguna, es mucho ms estimable cientemente apropiados. Aclaremos lo dicho con un ejemplo.
una afirmacin con contenido psicolgico, expuesta en trminos verbales, que una Dos personas. Pablo y Santiago, consideran una frase sobre cierto problema
afirmacin carente de significado psicolgico, por ms elegante que sea su formu- social. Tienen que decir si estn de acuerdo o en desacuerdo con la misma. Pues
lacin matemtica y por ms riguroso que sea el proceso matemtico que nos ha bien, la situacin siguiente es muy posible. Pa blo responde que est de acuerdo
llevado a ella. Por tanto, como psiclogos, deberemos abordar matemticamente y Santiago que est en desacuerdo. Cuando Santiago escucha a Pablo razonar
un problema psicolgico siempre y slo cuando esta tctica nos ayude a encon- su respuesta afirmativa , nos dice : Yo tambin habra estado de acuerdo si hu-
trar una solucin psicolgica apropiada. Si un problema psicolgico no admite biera considerado la fra se desde el punto de vista bajo el cual l la ha considerado.
un enfoque matemtico, no nos empearemos en introducir modelos matemti- A su vez, cuando Pablo escucha a Santiago razonar su respuesta negativa, nos
cos que, en el caso ms favorable. sern perfectamente intiles. Con todo , si un dice : Yo tambin habra estado en desacuerdo si hubiera considerado la frase
problema psicolgico admite un enfoque matemtico y otro no matemtico. ser. desde el pun to de vista bajo el cual l la ha consid erado. Sin embargo. es muy pre-
muy interesante acometer el problema bajo los dos puntos de vista. Ambos enfo- visible que no preguntemos a ninguno de los dos la razn de sus respuestas y nos
ques, lejos de se;: antitticos, se complementarn mutuamente. El resultado con- contentemos con atribuir a Pablo un 1 (por estar de acuerdo) y a Santiago un O
junto de ambos puede ofrecernos una solucin ms rica que la que nos hubiera (por estar en desacuerdo). Si se trata de un cuestionario compuesto de diversas
22 / EstadstJca para Psiclogos
M atemticas en Ps,col oga / 23
frases, nos limitaremos a atribuir a cada persona una puntuacin igual al nmero
b) Es verdad que los modelos matemaucos complejos suelen ser los nica-
de frases con las que ha estado de acuerdo. Este tratamiento matemtico es muy
mente vlidos en situaciones psicolgicas compl~jas y que el dominio de tales mo-
asequible. De modo muy elemental dispondremos enseguida de una puntuacin
d elos exige un nivel matemtico algo ms que mediano. Sin embargo. conviene
para cada persona. Pero, es esto legtimo? Probablemente, no. En efecto, la tc-
hacer algunas pun tualizaciones. En primer lugar, segn ya hemos indicado, no
tica anterior supone implcitamente que a alta puntuacin en el cuestionario co-
todos los problemas psicolgicos son extremad amente complejos. Ms adelante
rresponde estar de acuerdo con el tema social del mismo . Ahora bien, tal supo-
sicin slo sera defendible si dicho tema social fuera unidimensional, admitiese nos encontraremos, de hecho, con situaciones bastante simples. Comprobaremos
cmo en ellas son aplicables legtimamente tcnicas matemticas sencill as y cmo
un nico enfoque, y ste hubiera sido asumido por todas las personas que respon-
sus resul tados numricos son susceptibles de una interpretacin psicolgica muy
den al cuestionario. Ms an, deberamos estar seguros de que la nica dimensin
satisfactoria. En segundo lugar, la apl icacin de modelos matemticos complejos
considerada por ellas ha sido entendida tal como lo pretenda el que aplica el cues-
no implica necesariamente una preparacin matemtica extremadamente especia-
tionario. De no cumplirse estas condiciones, el nmero atribuido a cada persona
lizada . Son deseables unos conocimientos matemticos serios, pero no es nece-
es susceptible de mltiples y aun equvocas interpretaciones psicosociales. Esto
sario que el in vestigador psicomatemtico sea especialista en reas matemticas
quiere decir que el modelo matemtico simple aplicado en esta ocasin no es el
concretas. Lo verdaderamente importante es que sepa acercarse con mentalidad
ms apropiado, pero ello no significa que sea rechazable todo tratamiento mate-
matemtica a los problemas q ue se le presenten. Es d ecir, que se esfuerce en asim ila r
mtico. Podemos valernos de un modelo que nos descubra las dimensiones fun -
el proceso lgico subyacente al razonamiento matemtico. que logre captar la es-
damentales simples del tema social complejo y que nos permi ta determinar la si-
tructura formal del modelo matemtico de que se trate, q ue conozca las condiciones
tuacin de cada persona respecto a cada una de esas dimensiones o facetas. Este
que lo hacen posible y, consiguientemen te, las condiciones que ste exige de la
modelo matemtico tratara de considerar los diversos aspectos considerados por
realidad concreta para que sea legtima su aplicacin a la misma . Slo as, sabr
las personas que responden al cuestionario, evaluando a las personas segn cada
elegir el modelo matemtico ms apropiado en cada situacin prctica de la vida
uno de estos aspectos, sin contentarse con clasificarlas en las dos nicas categoras
real. Por otra parte, asimilada esta mentalidad matemtica, no slo podr manejar
a favor o en contra. Es posible que muchos temas sociales, simples y unidi-
mensionales en apariencia, sean complejos y multidimensionales *. Pero ello no con suficiente pericia instrumentos matemticos bastan te sofisticados, sino que
podr enta blar dilogo con los especialistas en Estadstica matemtica para que
implica que sea inviable todo enfoque matemtico. Slo quiere decir que los pro-
le asesoren en el planteamiento mtrico de algn problema psicolgico y con los
blemas psicosociales multidimensionales deben ser afrontados con modelos mul -
especialistas de un Centro de Clculo para que le ayuden en la eleccin o creacin
tidimensionales. Admitimos ciertas dificultades de orden prctico en su aplica-
del programa ms adecuado con el q ue pueda resolver su problema psicolgico
cin, pero negamos la imposibilidad de acometer dichos problemas complejos con
instrumentos matemticos. mediante un ordenador electrnico.
e) Los modelos matemticos, aun los ms complejos, son todava bastante
elemen tales respecto a la realidad psicolgica concreta. Las relaciones previstas
por el modelo se verifican exactamente en una realid ad simplificada, ideal, y slo
1.4. Comentario sobre los modelos matemticos complejos aproximadamente en la realidad compleja, existente. El grado de aproximacin
en Psicologa ser tanto m,iyor, cuanto menor haya sido el proceso simplificador que ha permi-
tido crear el modelo. Cuanto ms mutilemos la realidad concreta, ms sencillo
a) Ante todo, queremos reafirmar que estos modelos complejos no slo son
y ms manejable ser el modelo creado a p artir de esa realid ad cercenad a, pero
posibles, ~ino que an son los nicos realistas en muchos casos. Es errneo creer ms problemtica ser su aplicacin a la realidad concreta, no mutilada. Cuanto
que las tcnicas matemticas algo complicadas son construcciones puramen te menos m utilemos la realidad concreta, mas com plicado ser el modelo, pero ms
ideales, muy propias para discusiones tericas, pero sin relacin alguna con los fiable ser su aplicacin a dicha realidad. Tendremos que ll egar a un compromiso:
problemas de la vida real. Con gran frecu encia los instrumentos sencillos y d e fcil simpl ificar la realidad concreta lo menos posible, p ero , a la vez lo suficiente de
aplicacin suelen ser menos realistas y menos tiles que los modelos matemticos modo que el modelo creado a partir de ella sea fc ilmen te manejable desde el punto
complejos a la hora de tomar decisiones psicolgicas de importancia en situaciones de vista in strumental matemtico. En Psicologa los casos prcticos que se nos
prcticas complejas. presentan en la vida real suelen ser ms complejos q ue los que aparecen en otras
ciencias de la Naturaleza. Por ello, si deseamos modelos sencillos, deberemos
Por poner un ejemplo, Amn ()969} comp rob cmo una faceta social tan aparentemente un1 simplificar la realidad concreta de man era notable. Aun q uedndonos con mo-
dimensional como la religio sidad l:)tililaria. medida con un cuestionario sumamente purificado. se ma - delos algo complejos, deberemos imponer a la realidad mutilaciones de ciena
nifest como pluriditp.cosional, siendo, adems. bast ante independientes entre s la s dimension es en las
que se descompoo3.-' impor tancia. Ello quiere decir que en Psicologa debemos ser prudentemente
cautos en la aplicacin de los modelos a la realidad concreta y en la traduc-
24 / Estadstica para Pstclogos
2.1 . Introduccin
La definicin anterior est tomada de Stevens . En su primera publ icacin sobre la medida
~.-!'"
( 1946. pg. 2 , deca: Parafra seando a N. R, Campbell . ... . podemos deci r que medid a. en su sentido
mas ampli o. es definida como la at ribucin de numerales a objetos o su cesos de acuerdo con regl as"' ,
26 / Estadstica para Psiclogos Medida en Psicologa / 21
Tenemos por una parte nmeros y, por otra, objetos con sus correspondientes dola en algunos casos particulares, para concluir ofreciendo una defin icin general.
modalidades. Entre los nmeros existen ciertas relaciones que son vlidas siempre Consideremos la caracterstica peso. Aceptemos como u nidad emprica de
dentro del mundo aritmtico, ideal. Entre las modalidades existen ciertas relacio- medida la modalidad p resentada por un cuerpo elegido arbitrariamente. Me-
nes (en unos casos, pocas y simples; en otros, bastantes y complejas) que son veri- diante una balanza podemos elegir otro cuerpo que manifieste la caracterstica
ficables en el mundo emprico, real. Pues bien, la atribucin d e nmeros a los ob- peso bajo la misma modalidad que el primero (es decir, que pese lo mismo ). Me-
jetos no va a ser arbitraria, sino de acuerdo con esta regla general: aceptar slo diante estos dos cuerpos podemos elegir otro nuevo cuya modalidad sea igual a
como relaciones vlidas entre los nmeros aquellas que sean verificables emp- la suma de las modalidades de los dos cuerpos anteriores (es decir, q ue pese lo
ricamente entre las correspondientes modalidades. Esta regla general se concre- mismo que los dos primeros juntos). Para ello, basta con colocar estos dos cuerpos
tar en unas u otras reglas particulares, segn sea mayor o menor el nmero de en un platillo de la balanza y en el otro un tercer cuerpo tal que la balanza quede
relaciones verificables empricamente. equilibrada. Esta operacin la podemos ir repitiendo, poniendo tres cuerpos d e
Exigimos, por tanto, un cierto paralelismo o isomorfismo entre las relaciones peso unidad en un platillo y en el otro un cuerpo tal que la balanza permanezca
aceptadas como vlidas entre los nmeros y las relaciones verificables entre las en equilibrio. Asi, llegaremos a obtener un conjunto de cuerpos materiales, uno
correspondientes modalidades (en nuestro caso, psicolgicas). Consiguientemente, con la modalidad unitaria , otro con una modalidad dos veces mayor que la uni-
con los nmeros atribuidos a las modalidades, slo podremos realizar aquellas taria, etc. Podemos ahora atribuir nmeros a estas modalidades (o a estos cuerpos
operaciones que estn de acuerdo con las relaciones aceptadas como vlidas entre manifestando la caracterstica, segn estas modalidades). Una atribucin obvia
los mismos. Por otra parte, estas relaciones son precisamente las verificables entre (no la nica, como luego veremos) es asignar el 1 a la primera modalidad, el 2 a
las modalidades empricas, psicolgicas. En consecuencia, parece que el resul- la modalidad emprica doble, el 3 a la triple, ele. Esta atribucin es obvia, en cuanto
tado numrico final, obtenido operando de este modo con los nmeros atribuidos que la primera modalidad ha sido elegida arbitrariamente como modalidad em-
a las modalidades psicolgicas, admitir una interpretacin psicolgica razonable. prica unitaria.
Ordinariamente, la expresin atribucin de nmeros a las modalidades Pues bien, llamaremos escala de medida a este conjunto de modalidades em-
ser una simplificacin de atribucin de nmeros a los objetos segn las modali- pricas distintas y de nmeros distintos, puestos en correspondencia biunvoca
dades bajo las cuales manifiestan cierta caracterstica. Pasamos por alto las ven- (a cada modalidad le corresponde un solo nmero y a cada nmero una sola mo-
tajas e inconvenientes que esta equivalencia lleva consigo. Tampoco nos detene- dalidad). O, lo que es igual, a este conjunto de cuerpos materiales, con pesos dis-
mos a discutir si los nmeros deben ser atribuidos a los objetos o a sus caracters- tintos, y de los nmeros distintos atribuidos a dichos cuerpos. Medi ante esta es-
ticas, por creer dicha discusin ajena al fin de este tex to . nicamente, nos conten- cala podemos atribuir nmeros de modo coherente a otro cuerpo cualquiera,
tamos con proponer la anterior equivalencia, usando preferentemente la expresin comparando su modalidad peso con las modalidades de la escala tipo acabada
primera por meras razones de sencillez. de cons1ruir y atribuyndole el nmero de la escala asociado a la modalidad que
coincide empricamente con la modalidad del cuerpo en cuestin.
Veamos otro ejemplo algo ms complejo. Se trata de la caracterstica tempera-
tura . Consideremos una vasija llena de agua y situada sobre una fuente calorifica.
2.4. Definicin de escala de medida Introduzcamos dentro del agua un tubo estrecho de vidrio en uno de cuyos extre-
mos lleva un pequeo depsito conteniendo mercurio. Al aumentar la tempera-
La palabra escala es usada profusamente en la literatura psicomatemtica , tura el mercurio se dilata y va avanzando por el tubo de vidrio que supondremos
pero raramente definida. Ya Suppes y Zinnes se quejaban (1968, pg. 10) de que en posicin vertical y con el depsito de mercurio en su extremo inferior. En un
es raro encontrar en la literatura sobre la medida una definicin exacta de escalas. momento arbitrario la vasija manifestar la caracterstica temperatura segn cier1a
Ni el mismo Stevens ha si do lo suficientemente explcito. Suppes y Zinnes han pre- modalidad determinada y la columna de mercurio habr alcanzado una altura de-
sentado una definicin clara de escala. Algo parecido ocurre con Coombs, Dawes terminada. Sealemos una raya en el tubo de vidrio junto al nivel alcanzado por
y Tverski (l 970) y con Pfanzagl (1971). el mercurio en ese momento. Vayamos aumentando la temperatura del agua y
Veamos qu entendemos aqu por escala de medida . Comenzaremos definin- en otro momento, tambin arbitrario, veamos hasta dnde ha ascendido la columna
de mercurio marcando otra raya en el tubo de vidrio junto al nivel alcanzado por
el mercurio en este segundo momento . Sigamos calentando el agua hasta el pre-
En artculos posleriores (195 1, 1959. 1966. 1968a , 1975. por ejemplo) volver a proponer illnlicas o
parecidas formulaciones sobre la medida. Ordinanamenle usa la r alabra numeral, pero, lambin. ciso momento en que la diferencia entre esta altura y la obtenida en el momento
usa la palabra nmero (vase, por ej emplo, 1968b, pg. 850). Segn algu nos amores, hay que segundo sea igual que la diferencia entre las alturas alcanzadas en los momentos
diferenciar cuidadosamen1e los dos vocablos numeral y nmero. As, enlre olros. Lorge (1%7,
pg. 44), Sender (l'ljS, pg. 50). Segn ellos. numeral es un concepto ms amplio que nmero.
segundo y primero respectivamente y hagamos otra raya en el tubo de vidrio junto
Con todo, Steveos ( 19~9. pg. 19) no parece dar mayor imponancia a esta dislincin. al nivel alcanzado por el mercurio en este tercer momento . Si verificamos una ope-
28 / Estadstica para Psiclogos Medida en Ps,co/ogia / 29
racwn semejante en repetidas ocasiones, el tubo de vidrio habr quedado mar- Ntese que hablam os de modalidades y nmeros relacionados biunvocamente.
cado con una sucesin de rayas equidistantes, correspondientes a las modalida- Ordinariamente, tendremos conjuntos de objetos tales que, dentro de cada con-
des de la caracterstica temperatura manifestadas por el agua de la vasija en el junto, todos sus objetos no manifiesten la caracterstica de que se trate bajo moda-
primer momento, en el segundo, en el 1ercero, etc. Podemos, ahora, atribui r n- lidades distintas. Es decir, 1endremos ms objetos que modalidades. En este caso,
meros a esas rayas. A una cualquiera de ellas le atribuimos el valor O. A cada una a cada objeto le corresponde un solo nmero; pero un mismo nmero puede corres-
de las rayas superiores (correspondientes a modalidades ms clidas) les vamos ponder a varios objetos (todos los que manifies ten la caracterstica seg n la misma
atribuyendo los nmeros 1, 2, 3, . .. A su vez, a cada una de las rayas inferiores modalidad). En el caso general, tendremos n objetos y III modalidades. Si defini-
(correspondientes a modalidades ms fras) les vamos atribuyendo los nmeros mos la escala como conjunto de objetos y de nmeros, deberemos distinguir d os
- 1, - 2, - 3, . .. casos. En el primero, m = n ; habr correspondencia biunvoca entre objetos y
Pues bien, llamaremos escala de medida a este conjunto de rayas y de nmeros nmeros (isomorfismo ). En el segundo, m < 11; no habr correspondencia biu-
relacionados biunvocamente. Mediante esta escala podemos atribuir nmeros nvoca, ser slo unvoca : a cada objeto un solo nmero (homomorfismo). Para
de modo coherente a un cuerpo cualquiera. Para ello, le ponemos en contacto con evitar estas distinciones, hemos definido la escala como un conjunto de modali-
el tubo de vidrio tipo (o termmetro), acabado de construir, y observamos hasta dades (distintas) y de nmeros (distintos) relacion ados, siempre, biunvocamente.
qu raya de ste, r., ha ascendido la columna de mercurio. Hecho esto, atribui-
remos al cuerpo en cuestin el nmero correspondiente a '
Por supuesto, la sucesin de nmeros(... , - 3, - 2, -1, O, !, 2, 3, . . .), aunque 2.5. Tipos de escalas de medida
obvia, no es la nica, segn veremos ms adelante. Adems, es claro que ahora la
medida es indirecta, en cuanto que lo que medimos directamente es la altura alcan- Al medir, o sea, al atribuir nmeros a los objetos, decamos q ue slo acept-
zada por el mercurio e indirectamente la temperatura causante de esa altura. Antes, bamos como vlidas entre los nmeros aquellas relaciones que fueran verificables
en cambio, medamos directamente la caracter.stica peso. empricamente entre las correspondientes modalidades. Ahora bien , estas rela-
Consideremos, finalmente, la caracterstica provincia de origen. Emprica- ciones son muy simples en algunos casos y complejas en otros. Por consiguien-
mente podemos distinguir las modalidades Soria y Segovia, por ejemplo. Tendre- te, en unos casos slo aceptaremos como vlidas entre los nmeros, relaciones
mos tantas modalidades distintas como provincias espaolas. Podemos atribuir muy sen cillas ; en cambio, en los otros daremos validez a relaciones aritmticas
a cada provincia un nmero distinto. Tendremos tantos nmeros distintos como ms complejas.
provincias distintas.
Pues bien, diremos que nos encon tramos a bajo o alto nivel de medida, segn
Pues bien, llamaremos escala de medida a este conjunto de modalidades (tantas sea menor o mayor la complejidad de las relaciones que podamos verificar emp-
como provincias espaolas) y de nmeros relacionados biunvocamen te. Mediante ricamente entre las modalidades. Esta terminologa parece la ms oportuna. Sin
esta escala, podemos atribuir nmeros de modo coherente a una persona cualquiera. embargo, en vez de niveles se suele hablar preferentemente de escalas de med ida.
Le atribuiremos, sencillamente, el nmero de la escala correspondiente a la mo- Nosotros hablaremos a veces de niveles de medida ; pero, por ahora, aceptaremos
dalidad bajo la cual manifiesta esa persona su provincia de origen . Por supuesto la expresin escalas de medida, dada su aceptacin casi un iversal. Esta ltima
existen infinitas sucesiones de nmeros distintos que puedan ser atribuidos a las expresin tiene, tambin, un sentido razonable. La escala es el conjunto de moda-
modalidades anteriores, segn veremos luego. lidades empricas y de nmeros relacionados biunvocamente. Pues bien, segn
En conclusin, podemos ofrecer la siguiente definicin general de escala : con- que entre las modalidades de la escala sea verificable uno u otro tipo de relaciones,
junto de modalidades (dis1intas) y conjunto de nmeros (distintos) relacionados tendremos uno u otro tipo de escala. Naturalmente, dentro de cada uno de estos
biunvocamente. Es decir, a cada modalidad le corresponde un solo nmero y a tipos slo sern vlidas entre los nmeros aquellas relaciones que sean verifica-
cada nmero una sola modalidad. bles entre las correspondientes modalidades.
La escala, as definida, es un instrumento natural de medida . Con ella podemos Distinguiremos cuatro tipos de escalas, siguiendo el esq uema tradicional pro-
atribuir nmeros a cualquier objeto. Para ello, basta con observar qu modalidad, puesto ya por Stevens en su primera publicacin sobre teora de la med ida (1946).
m,, de la escala coincide empricamente con la modalidad del objeto en cuestin,
atribuyendo a ste el nmero correspondiente a m, en la escala.
La definicin anterior de escala est de acuerdo con la idea que tenemos de 2.5.1. Escala nominal
uno de los instrumentos de medida ms usuales, la regla. Una regla no es ms que
un conjunto de rayas equidistantes marcadas sobre un listn de madera (o de otro Supongamos que, dadas dos o ms modalidades, slo podemos comprobar
material) y un ~pnjunto de nmeros, en correspondencia biunvoca : a cada raya empricamente si ellas son iguales o distin tas. Consiguientemen te, entre los nmeros
le corresponde n solo nmero y a cada nmero una sola raya. atribuidos a las mismas slo aceptaremos como vlida la relacin igualdad-des-
30 / Estadistica para Psiclogos Medida en Psicologia / 31
igualdad. Si, por ejemplo, se trata de la caracterstica provincia de origen y por ellos). Sigamos as hasta poner en l timo lugar aquel que raya a los nueve res-
atribuimos el 1 a la modalidad Soria, el 2 a la modalidad Segovia y el 3 a la moda- tantes y no es rayado por ninguno de ellos.
lidad Avila, entre los nmeros l, 2 y 3 slo aceptaremos como vlida la relacin Tenemos, por tanto, diez modalidades de la caracterstica dureza ordenadas
igualdad-desigualdad. Es decir, el smbolo l ser considerado como algo distinto empricamente desde la ms blanda hasta la ms dura. Atribuyamos a la primera
de los smbolos 2 y 3, y stos, tambin, como distintos entre s, del mismo modo que modalidad el nmero l, a la segunda el nmero 2, ... , a la ltima el nmero 10.
son distintas entre s las tres modalidades correspondientes; pero, el 2 no ser Ahora a ceptaremos no slo que los nmeros l , 2, . .. , l O son smbolos distintos,
considerado como mayor que el 1, ni el 3 como mayor que el 2 y el 1, del m ismo sino que, adems, el 2 es mayor que el l , el 3 es mayor que el 2 y el l, .. . , el 1O
modo que la modalidad Segovia no es una manifestacin mayor de la caracters- es mayor que los nueve primeros nmeros enteros positivos. Pero, a este nivel no
tica provincia de origen que la modalidad Soria, sino, simplemente, una mani- tiene sentido admitir como vlida entre los nmeros una igualdad del tipo 7 - 6 =
festacin distinta. A este nivel, los nmeros atribuidos son puros nombres>> (de = 3 - 2, pues no podemos comprobar empricamente si la diferencia de dureza
aqu el apelativo nominal) que podan ser sustituidos por cualesquiera smbolos entre la modalidad a la que he atribuido el 7 y la m odalidad a la que he atribuido
no numricos: letras, colores, figuras geomtricas, etc. Por consiguiente, los n- el 6 es igual que la diferencia de dureza entre la modalidad a la qu e he atribuido
meros no gozan aqu de ninguna de las propiedades aritmticas. No tiene ningn el 3 y la modalidad a la que he atribuido el 2.
sentido aceptar a este nivel que 3 = 2 + J, pues ello implicara que la modalidad Evidentemente, la escala ordinal permanece invanante frente a cualquier trans-
Avila era el resultado de unir las modalidades Soria y Segovia. En otras palabras. formacin montona creciente. En otras palabras, seguiremos teniendo una misma
que el resultado de unir una persona con la modalidad Soria y otra persona con escala ordinal, cuando, permaneciendo las mismas modalidades tipo, los n meros
la modalidad Segovia dara como resultado una nueva persona con la modalidad atribuidos a las mismas sean sometidos a una transformacin m ontona creciente,
Avila. es decir, que haga corresponder a una sucesin ordenada de nmeros otra sucesin
Evidentemente, la escala nominal permanece invariante frente a cualquier trans- de nmeros ordenados del mismo modo que los primeros. Si, por ejemplo, a tres
formacin que a nmeros distintos haga corresponder nmeros distintos. Es decir, modalidades ordenadas de menor a mayor les hemos a tribuido los nmeros 3, 5 y 8,
seguiremos teniendo una misma escala nominal, cuando, permaneciendo las mismas podemos atribuirles, con igual derecho, otras ternas del tipo : 6, 70, 95 ; 82, 195,
modalidades tipo, los nmeros atribuidos a las mismas sean transformados en otros 981; etc.
con la nica limitacin de que a nmeros distintos primitivos, correspondan , tam-
bin, nmeros distintos nuevos. Si, por ejemplo, a tres modalidades distintas les
hemos a tribuido los nmeros 5, 7, JO, podemos atribuirles con igual derecho cuales- 2.5.3. Escala de intervalos
quiera otra terna compuesta de nmeros distintos como 6, 9, 2; 7, 3, 1; etc.
Supongamos que, dadas dos o ms modalidades, n o slo podemos comprobar
empricamente la igualdad-desigualdad y el orden, sino que, tambin , podemos
2.5.2. Escala ordinal establecer una unidad emprica de medid a y observar cuntas veces se encue ntra
contenida dentro de la diferencia entre dos modalidades cualesquiera. Consiguien-
Supongamos que, dadas dos o ms modalidades, no slo podemos comprobar si temente, dadas tres modalidades a, b y e, podemos comprobar empricamen te
son iguales o distintas, sino, siendo distintas, cul de cada dos es la mayor. Es decir, cuntas veces la diferencia entre a y b es mayor (o menor) que la diferencia entre
dados dos objetos, podemos comprobar empricamente si ambos manifiestan una b y e, suponiendo que las dos diferencias son distintas. Consiguientemente, entre
caracterstica segn la misma o distinta modalidad y, supuesto que la manifiesten los nmeros atribuidos a las modalidades admitiremos como vlidas las relaciones
segn distinta, podemos comprobar cul de los dos la manifiesta segn una moda- igualdad-desigualdad y orden, y las operaciones suma y resta entre ellos . Adems,
lidad mayor. Consiguientemente, entre los nmeros atribuidos a las modalidades podemos admitir como vlidas la multiplicacin y divisin entre las diferencias
admitiremos como vlidas las relaciones igualdad-desigualdad y orden. obtenidas a partir de dichos nmeros (no entre los m ismos nmeros).
Si, por ejemplo, se trata de la caracterstica dureza, diremos que A es ms duro Supongamos que se trata de la caracterstica temperatura. Elegimos tres cuer-
que B si A raya a By no es rayado por ste, al frotarlos entre s. Es una definicin pos y los ponemos en contacto con un tubo de vidrio en uno de cuyos extremos
operativa de dureza, es decir, verificable empricamente. Vamos a construir una lleva un pequeo depsito con mercurio. Observamos ahora el nivel alcanzado
escala de dureza, o sea, una escala para medir la caracterstica dureza. Elijamos por el mercurio en cada uno de los tres casos. Tendremos tres niveles termomtri-
diez cuerpos de naturaleza fsica distinta y ordenmoslos empricamente de acuerdo cos n 1 , n 2 , 11 3 Elegimos arbitrariamente una unidad emprica de medida, es decir,
con la definicin anterior. Pongamos en primer Jugar aquel cuerpo que es rayado una distancia arbitraria sobre el tubo de vidrio. Por sencillez, supongamos que las
por todos y no raya a ninguno. Pongamos en segundo lugar aquel que raya al pri- diferencias entr e 11 1, n 2 y n 3 contienen esa unidad un nmero entero de veces. Pa ra
mero (sin ser fyado por ste) y no raya a ninguno de los restantes (siendo rayado ser ms concretos, supongamos que la unidad emprica q ueda comprendida dos
32 / Estadistica para Ps,clogos Medi da en Ps,colog ia / 33
veces entre n 1 y n 2 , y ocho veces entre n2 y n 3 , es decir, que la diferencia entre n 2 arbitrario que llamaremos v. Aplicamos r. a las tres varillas A, B y C y contamos
y n 3 es cuatro veces mayor que la diferencia entre 11 1 y 112 (No se olvi de que todas el nmero de veces q ue v. cabe.en A, en B y en C. Supongamos q ue v. cabe tres veces
estas relaciones las estamos constatando empricamente.) en A, seis veces en B y 24 veces en C. Tenemos, pues, tres objetos manifestando la
Pues bien, una atribucin obvia de nmeros a las tres modalidades anteriores caracterstica longitud segn tres modalidades distintas y equivalentes respecti-
puede ser: 4, 6, 14. Entre estos tres nmeros aceptaremos como vlidas las rela- vamen te a tres, seis y veinticuatro veces la mod alidad unitaria.
ciones: 4 f 6 f 14, 4 < 6 < 14, 14 - 6 = 4(6 - 4). Una atribucin obvia de nmeros a las tres modalidades anteriores puede ser:
Evidentemente, la escala de intervalos permanece invariante frente a cualquier 3, 6, 24. Entre estos tres nmeros son vlidas las relaciones siguientes : 3 ef= 6+ 24,
transformacin de la forma y = ax + b, donde a y b son dos constantes arbitra- 3 < 6 < 24, 24 - 6 = 6(6 - 3), y, adems, 6/3 = 2, 24/3 = 8, 24/6 = 4, dado
rias. En otras palabras, seguiremos teniendo una misma escala de intervalos, que empricamente podemos comprobar que la modalidad longitud de B es
cuando, permaneciendo las mismas modalidades tipo, los nmeros atribuidos a doble de la de A , la de Ces ocho veces la de A y la de Ces c uatro veces la de B .
ellas son sometidos a una transformacin de la forma y = ax + b. Esto es debido Evidentemente, la escala de razn es invariante fren te a cualquier transforma-
a que son arbitrarios tanto el origen, como la unidad de medida. Por consiguiente, cin de la forma y = ax, d onde a es una constan te arbitraria . En o tras palabras,
tan legtima es la terna primitiva 4, 6, 14, como la terna (4a + b), (6a + b), (14a + b), seguiremos teniendo la misma escala de razn, cuando, permaneciendo, las mismas
donde a y b son dos constantes arbitrarias. As, por ejemplo, para a = 2 y b = - 5, modalidades tipo, los nmeros atribuidos a ellas son sometidos a una transformacin
tendremos la terna 3, 7, 23. Para esta nueva terna siguen siendo vlidas las tres de la forma y = ax. Esto es debido a ser a rbitraria la unidad de medida, pero no
relaciones que fueron vlidas para la terna primitiva, a saber, 3 4= 7 4= 23, 3 < 7 < el origen. Ahora el origen emprico corresponde siempre a la carencia total de la
< 23, 23 - 7 = 4(7 - 3). caracterstica, a la modalidad nula. No lo podemos elegir arbitrariamente donde
Ntese que la introduccin de la unidad emprica de medida legtima la suma y nos parezca.
resta entre los nmeros atribuidos a las modalidades y la multiplicacin y la divisin Por consiguiente, tan legtima es la terna primitiva: 3, 6, 24, como la terna:
entre las diferencias obtenidas a partir de dichos nmeros. Pero no legitima la mul- 3a, 611, 24a, donde II es una constante arbitraria. As, por ejemplo, para 11 = 5,
tiplicacin y divisin entre los nmeros mismos. La legitimidad de estas ltimas tendremos la terna : 15, 30, 120. Para esta nueva terna siguen siendo vlidas las
operaciones slo es posible cuando contemos con un origen emprico absoluto y mismas r elaciones que fueron vlidas para la terna primitiva : 15 ef= 30 f 120,
no con un origen meramente arbitrario. Ahora bien, esta arbitrariedad en el origen 15 < 30 < 120, 120 - 30 = 6(30 - 15), 30/ 15 = 2, 120/ 15 = 8, 120/30 = 4.
es propia de las escalas de intervalos. As, por ejemplo, el origen emprico d e iem-
peraturas en la graduacin centgrada no corresponde a la temperatura nula , a la
carencia total de calor, es decir, no es absoluto. Ese origen corresponde a la moda-
lidad o grado de temperatura a la cual se funde el hielo, es decir, es arbitrario. Con 2.6. Comentario sobre las escalas de medida
el mismo derecho podramos haber elegido como modalidad origen cualquier otra
temperatura inferior o superior a la que se funde el hielo. As se hace, por ejemplo, En primer lugar, la aceptacin de cuatro tipos de escalas es tan arbitraria como
en las escalas Fahrenheit y Reaumur. lo hubiera sido aceptar dos, veinticinco u otro nmero cualquiera . El mismo Stevens,
propugnador de las cuatro escalas, acepta la posibilidad de esquemas no cuatri-
partitos. Las anteriores escalas representan los cuatro tipos de uso comn . Otros
2.5.4. Escala de razn tipos son posibles (1968b, pg. 850). De hecho, otros autores han aceptado otros
tipos de escalas o han aceptado el cuatripartito d e Stevens, pero modificado .
Supongamos que, dadas dos o ms mo dalidades, no slo podemos comprobar En segundo lugar, conviene distinguir en tre medida y estadstica . Esta es una
empricamente la igualdad-desigualdad, el orden y cuntas veces la diferencia ciencia matemtica que comienza y concluye con nmeros, sin atender al origen
entre dos modalidades es mayor que la diferencia entre otras dos, sino, adems, ex tramatcmtico de los mismos y sin pretender in terpretaciones ul tramatem ticas
cuntas veces una modalidad es mayor que la otra. Por tanto, en tre dos nmeros (psicolgicas, por ejem plo ). La medida, en cambio, como atribucin de n meros a
atribuidos a las modalidades admitiremos como vlidas las relaciones igualdad- modalidades empricas (psicolgicas, en par ticular ), es el eslabn que une las modali-
desigualdad y orden, y las operaciones suma, resta, multiplicacin y divisin . dades empricas con los nmeros y, gracias a l, podemos interpretar empricamente
Supongamos que se trata de la caracterstica longitud. Elegimos tres va rillas (psicolgicamente, en particular) los resultados numricos fina les que nos ofrece la
metlicas que manifiesten la caracterstica longitud segn tres modalidades distin - estadstica. Los p uros estadsticos prescinden de las escalas de medida. As, por ejem-
tas. (Basta con escoger tres varillas tales que, al compararlas simultneamente, plo, Savage (1957, pg. 331 ). Los psiclogos, en ca mbio, no pueden adop tar una pos-
coincidaJ las tres en uno de sus extremos y difieran en el otro. ) Determinarnos tura aspticamente matemtica. Necesitan recoger da tos psicolgicos, atribuirles
arbitra'riarnente una unidad emprica de medida, es decir. un trocito de varil la nmeros, operar con estos nmeros e interpretar psicolgicamente los resultados
'l
'
li
: 34 / Estadistica para Psiclogos Medida en Ps,col og,a / 35
viene advenir, adems, que muchos de los q ue anatematiLa n a quienes usan ins-
1 finales. Si los nmeros con los que empezamos una investigacin estadstica estn
desligados de las realidades psicolgicas, no ser fcil dar una interpretacin psico- trumentos estad sticos sin encontrarse al nivel estricto de medida requerido por
lgica al resultado obtenido a partir de aquellos nmeros iniciales. estos ltimos, luego los utilizan ellos mismos sin graves escrpulos en circunstan-
cias idnticas o muy parecidas.
Est claro, pues, que como psiclogos no podemos prescindir de la interconexin
entre modalidades psicolgicas y nmeros, ni del paralelismo en tre la contextura
relacional de las modalidades psicolgicas y la contextura relacional de los nmeros.
Sin embargo, tampoco debemos exagerar la necesidad de este paralelismo. En 2.7. Resumen : Definiciones
efecto, si llevramos a sus ltimas consecuencias este isomorfismo entre modali-
dades psicolgicas y nmeros, nos sera imposible aplicar muchas de las tcnicas
estadsticas que muy frecuente y razonablemente usamos en Psicologa. Suponga- Supuesto que los objetos manifestaban cierta s caracter1sticas segn d iversas
modalidades, proponamos las siguien tes definiciones:
mos, por ejemplo, que tres personas A, By Chacen un examen de Geografia. Aunque
con las naturales reservas, podemos aceptar que la lectura imparcial de los tres ex- Medida : atribucin de nmeros a los objetos segn ciertas reglas. Estas reglas
menes nos permitir ordenar empricamente a las tres personas segn las modalidades se resumen en la siguiente: aceptar slo como vl idas entre los nmeros aquellas
bajo las cuales manifiesta cada una de ellas su ciencia geogrfica. Pero, nos atre- relaciones que sean verificables empricamente en tre las correspondientes modali-
dades.
veramos a determinar empricamente cuntas veces la diferencia de ciencia geo-
grfica entre A y B es mayor o menor que la diferencia de ciencia geogrfica entre Escala de medida: conjunto de modalidades (distin tas) y de nmeros (distintos)
By C? Esta determinacin no parece muy viable. Ahora bien, slo bajo esta con- relacionados bi un vocamente. Es decir, a cada modalidad le corresponde un solo
dicin los nmeros atribuidos a las tres modalidades pueden ser considerados nmero y a cada nmero una sola modalidad. Tendremos uno u otro tipo de escala.
corno autnticos nmeros, es decir, susceptibles de ser sometidos a operaciones segn que sean verificables empricamente ms o menos relaciones entre las moda-
aritmticas como la suma y la resta. En otras palabras, la atribucin de un 10, un lidades que forman parte de la escala. De acuerdo con este criterio. hemos distin-
g uido cuatro tipos de escalas.
9 y un 7 (con propiedades de nmeros estrictamente dichos) a las tres modalidades,
slo sera legtima si pudiramos comprobar empricamente que la diferencia entre a) Nominal: slo es verificable empricamente la igualdad-desigualdad.
la ciencia de A y la de B era la mitad que la diferencia entre la ciencia de By la de C. b) Ordinal: son verifica bles empricamente igualdad-desigualdad y orden.
Pero, como ya hemos dicho, esta comprobacin es muy dificil en una gran mayora c) De imerrulos : son verificables empricamente igualdad-desigualdad y orden.
de los casos que se presentan en Psicologa. Podemos, adems, comprobar cun tas veces q ueda contenida una unidad emp-
Qu decisin tornar ? Llegar a un compromiso razonable guiados por el sentido rica, elegida arbitrariamen te, dentro de la diferencia entre dos modalidades.
comn. Usar aquellas tcnicas estadsticas que creamos ms apropiadas en cada d) De razn; son verificables empricamente igualdad-desigua ldad y orden.
caso, en cuanto usndolas esperamos llegar, como psiclogos, a conclusiones Adems de poder comprobar empricamente cun tas veces queda contenida una
psicolgicas razonables. La experiencia parece confirmar que podemos llegar a unidad emprica , elegida arbitrariamente. dentro de la diferencia entre dos mo-
resultados numricos interpretables psicolgicamente, aunque las tcnicas esta- dalidades, podemos, tam bin, comprobar cun tas veces una modalidad cualquiera
dsticas utilizadas no hayan sido las ms oportunas, teniendo en cuenta el nivel contiene dicha unidad emprica.
o escala de medida requeridos por los datos. El mismo Stevens (1968) reconoce
este h echo. Por su parte, Amn (1 968) pudo comprobar cmo eran susceptibles
de una misma interpretacin psicolgica los resultados obtenidos a par tir de unos
datos, valindose de unas tcnicas que implicaban mero nivel nominal, de otras
que implicaban nivel ordinal y, finalmente, de otras que requeran nivel de in ter-
valos.
De todo lo dicho se desprende que no aceptamos la postura de textos como
Sender (1958), Freeman (1968), el mismo Siegel (1958), etc., que encuadran algo
rgidamente las tcnicas estadsticas dentro del esquema cuatripartito de Stevens.
Si con alguna frecuencia acudimos nosotros, tambin, a dicho esquema, ser
con gran flexibilidad y valindonos de l con fines preferentemente d idcti-
cos. En ningn caso condenaremos a los que, por ejemplo, calculen la media
aritmtic.(cfe las puntuaciones dadas por un profesor a sus alumnos en un examen
o use oiras tcnicas estadsticas sin encontrarse a su estricto nivel de medida . Con-
/!j
!I,
1
Ou es la Estadstica ? / 37
3 versitarios espaoles, pues d icha media aritm tica no es ms que la suma de las
alturas de la poblacin de universitarios espaoles dividida por el nmero de stos,
es decir, es una funcin definida sobre los valores numricos de la poblacin.
Qu es la Estadstica? Conviene distinguir entre la funcin, como tal, y el resultado numrico obte-
nido mediante la misma en cada caso concreto . La funcin es idntica en todos los
casos particulares. Por el contrario , el resultado numrico varia, en general, de
caso a caso.
3.1.4. Estadstico
Toda funci n definida sobre los valores numricos de una muestra. As, p or
ejemplo, ser estadstico la media aritmtica de las alturas de una muestra de 300 uni-
3.1. Conceptos previos versitarios espaoles.
Supongamos una poblacin constituida por diez personas a quienes hemos
3.1. 1. Poblacin aplicado una prueba objetiva. Tenemos diez observaciones y diez valores num-
ricos. Supongamos que stos son : 3, 12, 14, 8, 7, 7, 3, JO, 6, 8. Las puntuaciones
Conjunto de objetos (realmente existentes o posibles) que verifican una de- 8 y 10, por ejemplo, constituirn una muestra de esa poblacin . Ser un parmetro
finicin bien determinada. Por objeto entendemos cualquier persona, animal, cosa, la media aritmtica de las diez pun tuaciones (poblacin ), es decir, (3 + 12 + 14 +
operacin, famil ia, institucin, etc. As, por ejemplo, constituirn una poblacin + 8 + 7 + 7 + 3 + 10 + 6 + 8)/ 10 = 7,8. Ser un estadstico la media aritm-
los universitarios espaoles, las familias europeas, los coches fabricados al ao tica de las dos puntuaciones 8 y 10 (m uestra), es decir (8 + 10)/2 = 9.
por cierta empresa automovilstica, los posibles lanzamientos de un d ado. Consideremos ahora el sexo de las diez personas. Atribuyamos un J a los va-
rones y un O a las mujeres. Tenemos, tambin, diez observaciones y diez valores
numricos. Supongamos que stos son: O, 1, 1, O, 1, O, 1, l, 1, l. Ellos constituyen
3.1.2. Muestra la poblacin. Los tres primeros, por ejemplo , constituirn una muestra de esa po-
blacin. Ser un parmetro la proporcin de unos (varones ) en la poblacin
Cualquier subconjunto de una poblacin. La muestra hace siempre referencia
de las diez personas, es decir, 7/ 10 = 0,70. Ser un estadstico la proporci n de
a una poblacin de la cual es parte. Asi, por ejemplo, constituirn una muestra
de las anteriores poblaciones : 300 universitarios espaoles, 1.200 familias europeas, unos (varones) en la muestra de las tres primeras personas, es decir, 2/ 3 = 0,67.
213 coches, 80 lanzamientos de un dado.
Supongamos que observamos una caracterstica de los objetos de una pobla-
cin. Por ejemplo, consideremos la altura de los universitarios espaoles (pobla- 3.2. Definicin de Estadstica
cin). Tendremos una poblacin de observaciones y una poblacin de nmeros.
Paralelamente, observando la altura de una muestra de universitarios espaoles , Ciencia que recoge, ordena y analiza los datos de una muestra, extrada de cier-
tendremos una muestra de observaciones y una muestra de nmeros. ta pobl acin, y que, a par tir de esa muestra, valindose del Clculo de Probabili-
Es claro que, dada una misma poblacin de objetos, podemos tener diversas dades, se encarga de hacer inferencias acerca de la poi.ilacin.
poblaciones de observaciones y, consiguien temente, diversas poblaciones de n- Ordinariamente, las inferencias versarn sobre los parmetros d e la poblacin
meros, segn que estudiemos una u otra caracterstica. As, con los mismos uni- a partir de los estadsticos de la muestra. Pero, tambin, haremos inferencias acerca
versitarios espaoles, podamos haber considerado su peso, su capacidad inte- de la forma de la distribucin* de la poblacin, a partir de la forma de la distribu-
lectual, su actitud fren te a la guerra, etc. cin de la muestra. En cualquier caso las inferencias estarn basadas nicamente
en la informaci n objetiva contenida en la muestra. La informacin ser exclusi-
vamente objetiva, no su bjetiva ; contenida en la m uestra y no en o tras fue ntes ex-
3.1.3. Parmetro traas a la misma. Esta postura es la llamada clsica cuyo exponente mximo
ha sido Ronald Aymer Fisher (1890-1962). Nos limitamos a este punto de vista
Toda jtncin definida sobre los valores numricos de una poblaci n. As,
por ejemplo, ser parmetro la media ari tmtica de las alturas de todos los un i- "' En el captulo 4 trataremos sobr e di stribucin de frecuencias
11
i
!
38 / Estadistica para Psiclogos
Out! es la Estadistica? / 39
clsico por una doble razn. En primer lugar, slo con una base slida en esta-
dstica clsica es posible acceder a otros puntos de vista como el bayesiano o el A su vez, es prcticamente imposible presentar el muestreo sin haber expuesto
de la teora de la decisin . En segundo lugar, ni la estadstica enfocada bayesiana- algunas nociones previas de Probabilid ad.
mente, ni la teora de la decisin pueden presentar hoy un cuerpo de doctrina tan
estructurado como el que presenta la estadstica clsica. Adems, el enfoque clsico
hoy por hoy es mucho ms til en la aplicacin a los casos prcticos psicolgicos 3.4.2. Organizacin de los datos
que los otros dos enfoques.
Conviene distinguir entre Estadstica, estadsticas y estadstico (o estadsticos). Supongamos una muestra de 300 nmos a quienes aplicamos una prueba de
a) Estadstica es la ciencia acabada de definir. inteligencia. Estos nios manifestarn dicha caracterstica segn diversas modali-
b) Estadsticas son los resultados numricos obtenidos mediante la Estads- dades. Si la prueba consta de 20 pregu ntas, un conjunto posible de modalidades
tica : nmero de accidentes de trfico durante un mes, proporcin d e alcohlicos sera: ninguna pregunta bien respondida, una pregunta bien respondida, . .. ,
en diversas naciones, consumo medio semanal de leche por famili a, etc. veinte preguntas bien respondidas. Atribuyamos nmeros a esas modalidades.
e) Estadstico es todo valor numrico obtenido a partir de los valores pre- Una atribucin razonable (no la nica) puede ser la siguiente: un O a la primera
sentados por una muestra, segn lo dicho anteriormente. modalidad, un I a la segunda, . .. , un 20 a la vigsimo primera. (Recurdese que
Por supuesto, estadstico como sustantivo es, tambin, usado para denominar esta atribucin de nmeros, en rigor, no es propia de la Estadstica que comienza
a la persona dedicada a la Estadstica. Como adjetivo es utilizado para calificar a actuar sobre unos nmeros ya atribuidos previamente.)
personas y cosas relacionadas con la Estadstica. Tenemos, por tanto, 300 nmeros (varios de ellos necesariamente iguales entre
s) correspondientes a los 300 nios. Este conjunto desordenado de nmeros nos
ofrece una informacin muy pobre sobre la inteligencia de la muestra. Una orde-
3.3. Divisin de la Estadstica nacin razonable consiste en colocar los 21 nmeros posibles (O, 1, 2, .. . , 20)
de menor a mayor. Pues bien, al nmero de ceros le llamaremos frecuencia corres-
Segn la definicin acabada de dar en el prrafo anterior, la Estadstica cons- pondiente a la primera modalidad (mejor an, correspondien te al O, atribuido
ta de dos partes fundam entales: a la primera modalidad ), al nmero de unos le llamaremos frecuencia correspon-
a) Recogida, ordenacin y anlisis de los datos de una muestra. diente a la segunda modalidad (mejor an, correspondiente al 1, atribuido a la
b) Verificacin de inferencias acerca de la poblacin (de sus parmetros, d e segunda modalidad), ... , al nmero de veintes le llamaremos frecuencia corres-
la forma de su distribucin), a partir de la muestra (de sus estadsticos, de la fo rma pondiente a la vigsimo primera modalidad (mejor an, correspondiente al 20,
de su distribucin). atribuid o a la vigsimo primera modalidad). Por fin, llamaremos distribucin
La Probabilidad es el puente que nos permite pasar vlidamente de la muestra de frecuencias al conjunto de todas las modalid ades (mejor an, de todos los n-
a la poblacin, que legitima el salto desde las caractersticas (conocidas) de la mues- meros atribuid os a dichas modalidades) y de sus correspondientes frecuencias.
tra hasta las caractersticas (desconocidas) de la poblacin. De esta manera obtendremos una informacin ms clara sobre la inteligencia de
La primera parte constituye la Estadstica Descriptiva, cuyo cometido es des- la muestra.
cribir una muestra. La segunda parte constituye la Estadstica Jnferencial, cuyo Es posible que sean muchas vein tiuna modalidad es. Por esta razn, podamos
cometido es hacer inferencias sobre la poblacin, a partir de la muestra. En este reducirlas, por ejemplo, a siete clases, cada una de ellas con tres modalidades.
primer tomo nos limitaremos a la Estadstica Descriptiva. En el segundo tomo , La primera compuesta d e las modalidades: ninguna pregunta bien respondida,
tras unos captulos sobre Probabilidad, estudiaremos la Estadstica Inferencia!. una pregun ta bien respo ndida, dos preguntas bien respondidas. Y as, suce-
All discutiremos la diferencia entre Probabilidad y Estadstica y veremos el papel sivamente. En este caso la distribucin de frecuencias quedara constituida por el
que juega la Probabilidad en la fundam entacin de las inferencias estadsticas. conjunto de las siete clases (mejor an, por el conjunto de los siete nmeros atri-
buidos a las siete clases) y de sus correspondientes frecuencias. Por regla general,
este agrupamiento en pocas clases nos ofrece una informacin ms asequible que
3.4. Tareas de la Estadstica Descriptiva la ofrecida por las 21 modalidades.
En el caso de caractersticas no cuan tificables, por ejemplo, provincia de ori-
3.4.1 . Recogida de datos gen, podemos seguir haciendo algo anlogo a lo acabado de realizar. Suponga-
mos una muestra de J.000 espaoles que manifiestan la caracterstica provincia
Posponemos la consideracin de este apartado, dejndola para el tomo JI. de origen segn diversas modalidades. En principio el nmero de modalidades
Es muf dificil hablar de recogida de datos sin haber tratado sobre el muestreo. posibles es 50. Podemos atribuir los nmeros 1, 2, . .. , 50 a estas modalidades.
Tendremos 1.000 nmeros (varios de ellos necesariamente iguales entre s), corres-
j!
li
1
i1 40 / Estadstica para Psiclogos Ou es la Estadstica? / 41
pondientes a los 1.000 espaoles. Podemos seguir un esquema anlogo al anterior Estadslica ; ciencia que recoge, ordena y ana liza los datos de una muestra,
hasta llegar a una distribucin de frecuencias. De igual modo podemos reducir extrada de cierta poblacin, y que, a partir de esa muestra, valindose del Clculo
las 50 modalidades (provincias) a un nmero menor de clases (por ejemplo, ha- de Probabilidades, se t>ncarga de hacer inferencias acerca de la po blacin.
ciendo de cada regin una clase). Es claro que, bajo estas condiciones, las diversas Estadstica Descriptira; parte de la Es tadstica que se limita a recoger, ordenar
clases no estarn constituidas por el mismo nmero de modalidades. y analizar los datos de una muestra . Es d ecir, se limita a describir la muestra.
Estadstica Inferencia/: parte de la Estadstica que se encarga de hacer nfe-
rencias acerca de la poblacin a partir de una muestra extrada de la misma.
3-4.3. Anlisis de los datos
Poblacin : conjunto de objetos (actuales o posibles) que veri fi can una defi-
nicin bien determinada.
Muestra: cualquier subconjun to de una poblacin.
Patjmetro : toda funcin definida sobre los valores numricos de una poblacin.
Esradsrico: toda funcin definida sobre los valores numricos de una muestra.
Q)
.e
ctl
;::
-
ctl
o>
-e ctl
.:3
(1)
o(1)
LU
ctl
e
::::,
Q)
-e
\..
1 ;
i
4
Organizacin de datos
4.1.1. Constante
Caracterstica que slo puede manifestarse bajo una nica modalidad. Por
ejemplo, la longitud de todas las circunferencias con el mismo radio.
4.1.2. Variable
Variable cualitatfra
Caraclerslica que puede ser considerada, como mximo, a nivel ordinal: du-
reza de los cuerpos, responsabilidad de un grupo d e operarios estimada por su ca-
...~ pataz, etc. Los nmeros atribuidos a sus modalidades slo' gozan de las relaciones
igualdad-desigualdad y orden.
1!
Caracterstica que puede ser considerada, al menos, a nivel de intervalos: peso, 4.2. 1. Variables cualitativas
inteligencia, fuerza fsica, nmero de hijos, etc. Con los nmeros atribuidos a las
mismas podemos realizar operaciones aritmticas. Warren (1974) investig la caracterstica tipo de color asociado a la palabra
paz (en tre otras). Para ello, la present a un grupo de cien personas, pidiendo
que cada una escogiese entre 4 colores (rojo, azul, amarillo y verde) el que mejor
Variable cuantitatira discl'l'la se ajustase a dicha palabra.
La distribucin de frecuencias fue la siguiente:
Caracterstica que no admite siempre una modalidad intermedia entre dos
cualesquiera de sus moda lidades: nmero de hijos, nmero de coches vendidos al
ao, nmero de caras al lanzar diez monedas al aire, etc. Una familia puede tener, Distribucin de frecuencias
por ejemplo, cuatro o cinco hijos, pero no cuatro y medio. Esta modalidad es im-
posible.
Color Frecuencia Proporcin Porcentaje
--- - -- - - - - -
Variable cuantitativa continua rojo 6 0,06 6
azul 58 0,58 58
amarillo 19 0,19 19
Ca racterstica que admite siempre una modalid ad intermedia entre d os cuales- verde 17 0,17 17
quiera de sus modalidades: fuerza fisica, lo ngitud, inteligencia, etc. - - - - ---
100 1,00 100
Represemacin grfica
Como ya hemos indicado, frecuentemente es muy grande el nmero de moda-
lidades bajo las cuales puede manifestarse una caracterstica. Conviene reducir
estas mltiples modalidades a un nmero menor de clases. Estas clases deben
estar bien definidas (es decir, debemos saber claramente qu modalidades inclu ye
cada una de ellas dentro de s), deben ser mutuamente exclusivas (es decir, nin-
guna modalidad puede pertenecer simultneamente a dos o ms clases distintas),
deben ser exhaustivas (es decir, toda modalidad debe pertenecer necesariamente
a alguna de las clases).
Otras representaciones grficas son posibles: ciclogramas, pictogramas, etc. El A n ivel ordinal tiene sentido hablar de frecuencias, proporciones y porcentajes
fin de todas ellas es representar de modo intuitivo las frecuencias de cada una de acumulados (Fr. ac., Prop. ac., Porc. ac.). Ordinariamente, se suele comenzar la
las modalidades (o clases de modalidades). acumulaci n a parllr de la clase infe rior. As lo hemos hecho en el cuadro adjunto .
En el diagrama de barras las modalidades (o clases de modalidades) pueden La primera frecuencia acumulada es la frecuencia de la clase inferio~. La segunda
ser coiocadas en cualquier orden, pues representan distintos aspectos, no orde- frecuencia acumulada es la suma de las frecuen cias de las dos clases in feriores.
nados, de una caracterstica. La tercera frecuencia acum ulada es la suma de las frecuencias de las tres clases
En el ejemplo anterior las modalid ades eran slo cua tro y no pareca razona- infer iores o , lo que es equivalente, la suma de la segunda fre cuencia acumulad a
ble agruparlas en clases. Pero pueden darse otros casos en los que el agrupamiento ms la de la tercera no acumulada. Y as sucesivam ente. Por supuesto la ltima
en clases sea muy conveniente. As, por ejemplo, supongamos un colegio mayor frecuencia acumulada ser igual, siempre, a la frecuencia total. En n uestro ejemplo,
con 80 universitarios. Estudiemos la caracterstica carrera universitaria y su-
po ngamos que tenemos 15 modalidades d istintas: Filologa Clsica, Arte, Fsica, Primera frecuencia acumu lada : 147
Ingeniera Naval, Qumica, etc. Hagamos con estas 15 modalidades cuatro clases Segunda frecuencia acumulada : 147 + 129 = 276
que las engloben a todas ellas, de acuerdo con el siguiente esq uema: Tercera frecue ncia acumulada : 147 + 129 + 212 = 276 + 212 = 488
Cuarta frec uencia acumulada : 147 + 129 + 212 + 134 = 488 + 134 = 622
Distribucin de frccuC'llcias De modo anlogo se obtienen las proporciones y los porcentajes acumulados
a partir de las proporciones y porcentajes sin acum ular. Naturalmente, las pro-
Carrera univ. Frecuencia Proporcin Porcentaje porciones acumuladas p ueden, tambin , ser obknidas dividiendo cada frecuencia
-- - - acumulada por el total de las observaciones. As, en nuestro caso, 147/622 = 0,2363,
Letras 24 0,30 30 276/ 622 = 0,4437, 488/622 = O,7846, 622/622 = 1,0000_ Multiplicando por 100
Ciencias 28 0,35 35 estas proporciones acum uladas, obtendremos los correspondientes porcentajes
Ingeniera 8 0, 10 10 acumulados.
Derecho 20 0,25 25
- - --
80 l,00 100 Representacin grf ica
Con esta distribucin de frecuencias tendramos una representac10n grfica Usaremos el diagrama de barras, como antes. Sin em bargo, ahor a las clases
deben ser colocadas segn un orden bien determinado, pues represen tan aspectos
semejante a la anterior, con la nica diferencia que ahora cada barra representa a
ordenados de una caracterstica.
una clase de modalidades y no a una sola modalidad.
La figura 4. l y la figura 4.2 han sido construidas con distinta unidad de medid a.
La primera barra de la izquierda de la figura 4 .1 y la primera barra de la izquierda
4.2.2. V ariables cu as-cuantitativas de la figura 4.2 representan lo mismo, a saber, la frecue ncia (proporcin o por-
centaje) correspondiente a la modalidad mejora n ula. La razn de elegir una
Con objeto de investigar la eficacia diagnstica y teraputica de algunas tc- distinta unidad de medida ha sido meramente prctica. Si hubiramos elegido la
nicas clnicas, Harrower (1965) recopil los datos que exponemos a continuacin misma unidad, o la fi gura 4. 1 habra quedado excesivamente reducida, o la fig u-
sobre la mejora de 622 pacientes. ra 4.2 habra quedado exageradamente grande.
Mejora Free. Prop. Porc. Fr. ac. Prop~ ac. Porc. ac.
-- --- ---- - - 4.2.3. Variables cuant itat ivas discretas
Mxima (4) 134 0,21543 21.543 62 2 1,0000 100,00
Moderada (3) 212 0,34084 34,084 4 88 0,7846 78,46 Considerem os cierta situacin experimental en que una persona debe aprender
Leve (2) 129 0,20740 20,740 276 0 ,4437 44.37 una lista de pares de palabras, de manera que al presentar le una pa labra de cada
Nula (l ) 147 0.23633 23,633 147 0,2363 23,63 par sepa decir cul es la otra que forma parte del m ismo . Tomaremos como nd ice
- - - -- - - -- de dificultad de la tarea, el nmero de ensayos necesarios para asociar cada palabra
.,.""; - 622 1,00000 100,000 con la correspondiente de su par. A continuacin proponemos la distribucin
:I '
11
1
Representacin grfica
r--
.---
-
.---
6 9 10 11 12 13 14
11 ,
I
.,1
1 52 / Estadisttca para Psiclogos Organizacin de datos / 53
1
Este grfico es el que usaremos en Probabilidad para representar la funcin H abra que distinguir entre intervalos abiertos y cerrad os, abiertos por la de-
1 de distribucin (concepto muy parecido al de distribucin de frecuencias acumu- recha (izquierda) y cerrados por la izq uierda (derecha). En rigor, la amplitud de
ladas) en el caso de varia bles aleatorias discretas. cada intervalo elemental valdr la unidad de medida utilizada si nos valemos de
Ntese que los saltos vienen dados en los puntos 4, 5, 6, ... Por ejemplo. al intervalos semiabiertos. Sin embargo, estas distinciones, aunque importantes a
punto 6 (necesitar 6 o menos ensayos) le corresponde exactamente la proporcin nivel matem tico, tienen poca importancia a n ivel psicolgico-estadstico . Por
acumulada 0,3559. Al punto 7 le corresponde 0,4746. A todos los puntos en trt: 6 ello, las pasaremos po r alto y aceptaremos un mismo valor com o lmite exacto
y 7 (excluido el 7) les hacemos corresponder la proporcin 0,3559, pues necesitar comn de dos intervalos consecutivos, admitiendo que la amplitud de cada in -
6,45: 6,78: ... (cualquier valor entre 6 y 7, excluidos ambos) equivale a necesitar tervalo elemental vale la unidad de medida.
seis ensayos, ya que es imposible necesitar seis ensayos y una fraccin de ensayo.
Por eso, a todos los valores entre 6 y 7 (excluidos a mbos ) les hacemos corresponder
la misma proporcin que corresponde al punto 6 (necestar seis ensayos). 4.2.4.2. Interva los elementales y compuestos
Recordemos que cada valor d iscreto representa a todos los valores situados
4.2.4. Variables cuantitativas continuas media unidad a su izquierda y meda unidad a su derecha. Es decir, con cada va lor
discreto va asociado un intervalo de amplitud unidad qu e hemos llamado element al.
4.2.4.1. Interpretacin continua de los valores discretos Llamaremos intervalo compuesto (o, simplem ente, intervalo) al conjunto de var ios
intervalos elemen ta les consecutivos. Por regla general, todos los inte rvalos com-
puestos (para un conjunto de datos) contendr n cada uno de ellos e l mism o n -
Consideremos, por ejemplo, la longitud. Entre dos modalidades cualesquiera mero de intervalos elemen tales.
existe un nmero infinito de modalidades posibles. Sin embargo, de hecho, slo
somos capaces de detectar un nmero finito de ellas, debido a la imperfeccin del
instrumento de medida, en este caso, la regla. Cuanto ms fina sea dicha regla. es 4.2.4.3. Lmites exactos y lm i tes apa rentes
1 decir. cuanto mayor nmero de subdivisiones contenga, tanto mayor ser el e-
mero de modalidades que podremos detectar. Pero, en todo caso, ese nmero 1rr Supongamos que en u na investigacin el valor discreto mnimo obtenido es 8
finito, por culpa del instrumento de medida. En conclusin, la variable que en s y el mxim o es 19. Los va lores-discretos posibles (incluy~ndo el 8 y el 19) ser.in:
misma es continua se manifiesta, de hecho. como discreta. El nmero de modali- 8, 9, 1O, 11, 12, 13, 14, 15, 16, 17, 18, 19. Cada uno de ellos representa un intervalo
dades discernibles es finito y, por ta nto, ser finito el nmero de va lores atribuibles elemental unitario. Formemos un intervalo compuesto con los intervalos elemen-
a dichas modalidades. Contemplemos algo ms despacio este nm ero finito le tales r epresentados por 8, 9 y 10. D ado que es 7,5 el limite exacto inferior del in-
valores discretos. tervalo elemental representado por el 8 y es 10,5 el lmite exacto superior del inter-
Supongamos que nuestra regla no discierne ms all de los centmetros. Ello valo elemental representado por el 10, ac;eptaremos 7,5 como lmite exacto
nos permitir atribuir valores tales como 1,87, 1,88, 1,89, por ejemplo, pero 110 inferior del intervalo compuesto y 10,5 como lmi te exacto superior del mismo .
valores intermedios. Ahora bien, esta limitacin, segn lo visto, es debida a la m- Por consiguiente, tendremos 4 intervalos compuestos cuyos lmites exactos sern :
perfeccin del instrumen to material de medida, no a que sean imposi bles esos ,i,a- 7,5-10,5 ; 10,5-13,5 ; 13,5-16,5; 16,5-19,5 . Llamaremos lmites aparentes de estos
lores intermedios. Por ello, p ara salvar la con tinuidad, vamos a admi tir que C11.rla cuatro in terva los a: 8 - 10, 11 - 13, 14 - 16, 17 - 19. Ntese que estos valores
valor discreto r epresenta a todos los infini tos valor es situados media unidad ,de aparentes son los nicos que, de hecho, p ueden aparecer.
medida (medio centmetro ) a su izquierda y media unidad a su derecha. En n uestro
caso. l ,68 representa a los infinitos valores que van desde J ,675 hasta 1,685 (in -
cluid o el mismo 1,68), el valor 1,69 representa a todos los valores que van da;de 4.2.4.4. Amplitud y punto medio de los i ntervalos. A mp litud tota l
1.685 hasta 1,695, etc. Es decir, 1,68 representa a una clase con infinitas modali-
dades. Llamaremos intervalo elemen tal a cada una de estas clases. D inmos La ampli tud de un intervalo es la diferencia ent re su lmite exacto superior y
que 1,675 es el lmite exacto inferior del intervalo representado por 1,68, y l.685 su lmite exacto inferior. En el ejemplo anterior la amplitud de los cuatro intervalos
su lmite exacto superior. Diremos que 1.685 es el lmite exacto inferior del ima.er- ser: 10,5 - 7,5 = 13,5 - 10,5 = 16,5 - 13,5 = 19,5 - 16,5 = 3. Aceptamos
valo representado por l ,69, y 1,695 es su limite exacto superior. Admitiremos, como punto medio de cada intervalo la media aritmtica de sus d os lmites exac-
por t~o, q ue 1,685 es, a la vez, limite exacto superior de un intervalo y lmite tos. As, los puntos medi os de los intervalos anter iores sern : (7.5 + 10,5)/2 = 9,
exacto inferior del intervalo siguiente (10,5 + 13.5)/2 = 12, (13,5 + 16,5)/2 = 15, (16,5 + 19.5 )/2 = 18. A los mismos
1 ,
, 1
1
r
54 / Estadstica p ar a Psiclogos
Organ,zac,n de datos / 55
a) El eje de abscisas (horizontal) representar las puntuaciones de la variable Edad Free. Pro p. Po rc. 1- rec. ac. Prop. ac. Porc. ac.
de que se trate, y el eje de ordenadas (eje vertical) re presentar las frecuencias , pro- -- -- - -
20-2 1 17 0, 1954 19.54 87 1,0000 100,00
porciones o porcentajes.
21 0.2414 24,14 70 0,8046 80,46
b) En el eje de abscisas pondremos las puntuaciones menores a la izquierda 18-19
16-17 33 0,3793 37,93 49 0,5632 56,32
y las mayores a la derecha. En el eje de ordenadas pondremos las frecuencia s me- 16 0. 1839 18.39
14- 15 15 0, 1724 17.24
nores abajo y las mayores arriba. 1 0,01 15 1, 15 l 0.0 115 1.15
12-1 3
e) La unidad de medida elegida en cada uno de los ejes ser tal que el grfico --
construido tenga una altura y una anchura cuya relacin aproximada sea igual 87 1,0000 100,00
a 3/ 5. Es decir, si tiene una altura de 9 cm, por ejemplo, deber tener una anchura
aproximada de 15 cm . T ABLA 4 .2
d ) La interseccin de los dos ejes ser tomada como orige n de puntuaciones Distribucin d, edades torrespondientes a la., mujeres
en el eje de abscisas y como origen de frecuencias, proporciones o porcentajes en
el eje de ordenadas . Edad Free. Prop. Porc. Free . ac Prop. ae. Pore. ac.
e) Si la puntuacin mnima de que se trate es alta y la frecuencia mnima en -- - -
20-21 13 0. 1857 18,57 70 1,0000 100,00
cuestin es, tambin, alta, tanto en el eje de abscisas como en el de ordenadas se
18-19 25 0,3571 35,71 57 0,8 143 81,43
suelen hacer dos cortes, segn la figura adj unta.
16-17 16 0,2286 22,86 32 0,4571 45,71
14-15 16 0.2286 22,86 16 0,2286 22.86
12-13 o 0,0000 00.00 o 0,0000 00,00
-
70 1,0000 100,00
v.
"'
;:;
e
0,40
"~ _ __ __ varone s
u: /\
- -- - - ~ mujeres I \
I \
~
I \
0 ,30
"'
80 90 100 1 ro 120
-e
"'
]
\\
Cocie ntes lntelec tua1cs \
"o ,- \
C
0,20 1
/) Conviene indicar explcitamen te qu repr esenta el grfico en ge neral y ~
I \
" \'
-~"
qu representa cada uno de los ej es, siempre que sea necesario. I ~
I \\
Por supuesto, las anteriores normas son convencionales y slo las seguiremos o
en tanto que nos sean tiles. e
~
0 , 10
I
l.
I \\
~
i
/
... r.:"
.
h~<
/2
~... ? .
1 TI
!
1
60 / Estadisllca para Psiclogos Organizacin de datos / 61
4.7. Durante el curso 1971 -1972 en las Facultades universitarias estatales espa-
olas estaban matriculados los siguientes alumnos:
Facultad de Ciencias . . . . . .. .. . 42.572
Fac. de Cienc. Polit. Econm . y Comerc .. . 25.683
Fac. de Derecho. . . . . . . . . . . . . ...... . .. . 22.665
Fac. de Farmacia. . . . . . . . . . . . ... . . .. . . 8.083
Fac. de Filosofia y Letras .. .. ... . . . ... . 49.049
Fac. de Medicina ......... .. . .. .. .... . 37.578
Fac. de Veterinaria .. . . . . . . . . . . . . . ... . 2.166
187.796
'
!1
Estadisr,cos de posicin o tend enc,a central / 65
5 Es decir, la med ia ari tmtica de 11 valores no es ms que su suma divid ida por
el n mero de ellos.
Aplicacin directa de la frm ula (5.1) a los datos o riginales. es decir. sumando
una a una las 11 puntuacion es y dividiendo el resu ltado por 11 .
EJEMPLO 5.1. Para obtener un ndice de la carga de significacin que posee la
palabra GOLA, Jez (1 976) la present a 23 personas con objeto de observar
el nmero de palabras que GOLA suscitaba en cada persona d urante cuarenta y
cinco segundos y obtuvo los siguientes r esultados:
5.1. Introduccin
10, 5, 2, 7, 9, 5, 7, 6, 5, 9, 12, 2, 6, 6, 9, 12, 6, 6, 6, 4, 9, 7. 12
Supongamos que deseamos comparar el aprovechamiento en Estadistica de una
muestra de 200 varones con el de otra muestra de 250 mujeres. Esta comparacin La media aritm tica fue tomada como ind ice de la carga de significacin de
ser muy difcil si hemos d e tener en cuenta todas las puntuaciones de ambos gru- GOLA y vali:
pos. Lo que solemos hacer es comparar el promedio de la primera muestra con el
promedio de la segunda. En otras palabras, lo que hacemos es determinar un esta- i = JO+ 5 + 2 + + 7 + 12 = 7,04
dstico (funcin de las puntuaciones de la muestra) que nos ofrezca la posicin 23
de una y otra muestra en la variable aprovechamiento. En general, este tipo d e
estadsticos se utiliza para darnos la posicin de cada una de las mues tras a las qu e b) Dalos agrupados
va representando y, por esta razn, deber ir tomando siempre un valor situado
hacia el centro de las puntuaciones de cada una de dichas muestras. Debido a esta Supongamos n observaciones agrupadas en r in terva los, lod os ellos de igua l
circunstancia, suelen ser llamados de posicin o tendencia central. amplitud. Sea X , el pun lo m edio del intervalo primero y 11 1 el nmero de observa-
Antes de comenzar a estudiar estos estadsticos, el lector d ebe consultar el ciones dentro del mismo. Sea X2 el pun to med io del in tervalo segundo y 11 1 el n-
Apndice A que trata sobre el signo de sumar :E. Este signo ser utilizado muy mero de obser vaciones d entro del mismo. Sea X, el punto m edio del intervalo r
profusamente de ahora en adelante y, por ello, conviene que el lector se familia- y n, el nmero de observaciones dentro del mismo . Segn sabemos, al agrupar las
rice con su uso. pun tuaciones en in tervalos, atrib uimos a cada u na de ellas (como pun tuacin )
el punto medio dentro d el intervalo dentro del cual se encuentra. Por consiguien le,
dentro del intervalo primero tendremos n 1 puntuacrnnes iguales a X , y su suma
valdr n 1 X 1 Dentro del intervalo segundo tendrem os 112 pun tuaciones igua les
5.2. Media aritmtica* a X, y su suma valdr n 2 X 2 . Dentro del intervalo r- sim o tendremos 11, puniuacio-
nes iguales a X, y su suma valdr n,X,. En conclusin, la suma !Otal de las n, + 11 2 +
5.2.1. Definicin + + n, = n puntuaciones valdr n 1 X 1 + 111 X 2 + + n,X, y su med ia ar it-
mtica valdr
5.2.3. Propiedades
X ", x, n)X1
23 154 - - :EX
:E(X.t - k ) = :E(X l
- X) = :EX t
- nX = :EX - n - /l '
J
= :EX. 1
- :EX- = O
1
Ntese que la definicin de media es la misma : sumar n puntuaciones y dividir a ' ) Si la suma de las diferencias de n puntuaciones X 1 , X2 , , X,, respecto
esa suma por n. Las que no suelen ser exaclamente iguales son las puntuaciones
a k vale cero, k = X.
antes y despus del agrupamiento en intervalos. As, comparando el ejemplo 5.1 En efecto, si se verifica que :E(X, - k) = O, entonces :EX, - nk = O. Es decir,
con el ejemplo 5.2, lenemos: :EX; = nk. Por tanto,
EJEMPL-0 5.1: 2, 2, 4, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 9, 9, 9, 9, 10, 12, 12, 12
k =:EX, = X
EJEMPLO 5.2: 2, 2, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 8, 8, 8, 8, 8, 8, 8, 11 . 11 , 11, 11 11
y = !: Y, = 6 + 8 + 16 = 30 = JO
11 3 3
j) Dados r grupos con n,, n2 , . , n, puntuaciones, respectivamente, y sien- x= (6)(5) + ~4li9! :!: (5)p~
do .X', X2 , , X, sus correspondientes medias, la media de las n, + n 2 + +
12(, = 8,40
15 15
+ n, = n puntuaciones vale X = (n,X, + n2.X\ + + n,X,)/n.
En efecto, sean EJEMPLO 5.8. Las puntuaciones de la tabla adjun ta representa n el aumento
X 11 , X21 , X., 1 las n 1 puntuaciones del grupo primero
. , en el cociente in telectual de un grupo de dos ni os y de un grupo de cuatro nias,
X, 2 , X 22 , , x.,
2 las 11 2 puntuaciones del grupo segundo todos de dos aos, tras haber sido estimulada la interaccin verba l co n sus madres
.... . . . ... . . . ' . .... . ........ . . . ......... . . . .... . duran te cua tro meses (Levenstei n, 1968). Ca lculemos el aum ento medio del grupo
Xi,, X 2 ,, . . , x.,, las n, puntuaciones del grupo r total, a partir del aumento med10 de los nios y del de las nias.
p 1 + 112 p 2 +
Grupo primero Grupo segundo Grupo tercero p = -n 1---- - - - - +- n,p,
- -
11 + n 2 + + n,
2 7 14
5 14 17
En efecto, llamando 11;, n;, .... n;
al nmero d e varones en el grupo p rimero,
4 7 8 en el segundo, ... , en el r , tendremos
7
7
8 12
9
p1= n;, de donde, 11; = n,P1; p2 = -n;, de d on de, 112' = n2 p2 , P, =~
n1 11 , 11,
5 de donde n; = n,p, .
-- - - -- - - -- -- - - - - - -- - --- -- Por definici n, la proporcin de varones dentro del grupo tota l va ldr,
30 36 60
..,,-r-
n1 =6 11, =4 11, =5 + 11; + + n;
x, = 5 x, = 9 x, = 12 11;
p= ~ -- - - -- -
11, + 11 2 + + n,
:
EJEMPLO 5.9. En tres grupos distintos, con 270, 180 y 300 personas, la propor-
cin de demcra tas es 0,70, 0,65 y 0,62, respectivamente. Esto supu esto , cul X0 + 31 (Xo + 31) - .\ o = 3
es la proporcin de demcratas en el grupo toial ? I
X0 + 21 (Xo _: !! ) -: _:\'o = 2
= (270)(0,70) + (180)(0,65) + (300)(0,62) = 492 = O656 I
P 270 + 180 + 300 750 ' + /) -
X0 +l
(X 0
-- - - - - -X0 = l
I
La propo rcin de demcratas en el grupo to tal es 0,656 o, dicho de otro modo,
X0 + O _(~o -!"u = 0
_+__) -:
el 65 ,6 por 100 del grupo total son demcratas. I
(Xo - l) - Xo
X., - l - - -- - -=- !
5.2.4. M t odo abreviado para el c lculo de la media
X0 - 2/ ! X..<> --:_ }/J --: !~ = - 2
I
Supongamos n puntuaciones a grupadas en intervalos, todos ellos con am-
plitud /. Sea X0 el punto medio de uno de ellos, elegido arbitrariamente, al que (X0 - 31) - X0
Xo - 3/ - - I - -- - = -3
:;_, ' llamaremos intervalo origen. Hagamos
A B = X!'.
I I
EJEMPLO 5.10. Apliquemos el mtodo abreviado a la sigu iente distribucin
Segn 5.2.3. e), las puntuaciones de frecuencias, donde todos los intervalos tien en amplitud / = 3 y d onde hemos
elegido como origen el in tervalo 6 - 8.
-'1
' 1
= IX; + (-~o) = X, -I Xo n1 x; n_rY;
13 - 7
tendrn como media
,, 12- 14 8 -- -=- - = 2 16
X.
."\ ' = ~ X - ~ = :" - Xo
,<"-.: "' 9-ll 12 -
10 - 7
- - = 1 12
1 I J 3 -, 10
X = -- = 0,2
De d onde, X = J.f:' + X0 Esta ltima frmula nos permi te obtener X mediante 7- 7 50
6-8 16 =o o
3
.i', cuyo clculo suele ser mucho ms sencillo y breve que el de X. x = !3)(0.2) +7 = 7,6
Si X0 es el punto medio del intervalo origen, los puntos medios de los inter- 4 - 7
valos superiores al origen sern X0 + /, X0 + 21, X0 + 3/, . .. y los puntos medios
3-5 10
3
= -1 - 10
-7 X = n1 X, + n2 X2 + + n,X,
6 ./
,. .
;1 /
\
u ~-
T
, - ..-;
7 1 1 ) ' ' ....
n 1 + 112 + + n,
(cambio de ongen)
4:t (4,5)(2) + q,5)(4) + (2)!_12) = ~~ = 4 7 EJEMPLO 5.12. En Psicofisica suele preferirse la media geomtrica a la media
4,5+3,5+2 10 ' aritmtica cuando se trata de promediar razones. Un caso tpico es el siguiente.
1~
:11
5.3.3. Clculo
Si los datos estuvieran agrupados en intervalos,
a) Datos agrupados en i111en:alos
5.2.7. NOTA
TAB LA 5. 1
La segunda propiedad de la media, la suma de las diferencias cuadrticas de --
n puntuaciones respecto a su media es mnima, queda legitimada ms sencilla- CI n,
mente derivando F(k ) = I: (X, - k) 2 respecto a k. En efecto, F ' (k) = 129,5
-2 I: (X; - k), F "(k) = 2n. 11 5 -129
Con estos supuestos, 114,5
a) Si k = X, F '(X ) = -2 I: (X; - X) = O, F " (X) = 2n > O. Por tanto, 100-114 4
99,5
para k = X, F pasa por un m nimo.
85-99 8
b) Si F pasa por un mnimo, F'(k) = - 2 I: (X; - k ) = O. Por tanto, I: X ; = nk, 84,5
k =:EX; = X 70-84 2
n 69,5
15
mediana, pues deja por debajo de s 10 observaciones (y por encima 5 J. La mediana Ntese que
tiene que ser un valor entre 84,5 y 99,5. Llamemos crtico al in terva lo (84,5 -
- 99,5) y dibujmoslo ampliado (Fig. 5. 1). Md = 845 + 1031=845 + (5, 5 Hl 5 ) = 845 + 7 , 5 - 2 15 =
' ' ' 8 ' 8
~- 2)
t ~----~~r~-ur
99 5
(T
t t
---------- 2.5 x' 84.5 + 15 = 94.81
== .,O,
94.81--------- -- Ahora bien,
8 15 5,5 X
84,5 = !, : lmi te exacto inferior del intervalo crtico.
oblrv. unid.
~
2
= ~
2
mitad o 50 por 100 de las observaciones.
Ntese que
25
Md = 995 - 469 = 995 - ( , Hl2) = 995 - 75 - 5 15 =
' ' ' 8 ' 8
= 99,5 -
~-5)
( - 15 = 94,81
2
15 , 8 y 15 s1gm
. .Ji1can Io mismo
. que en eI caso anterior.
.
-- n
n )
Md = !, - 2 nd s (5 .6)
(
3 10 (2)(10) = 6,67
CI n; -=- X = -3
142,5 2 X
133.142 2
132,5
123132 3 Por tanto, Md = 112,5 + 6,67 = 119, 17.
....:1 122,5 Por supuesto, a este mismo resultado habramos llegado aplicando (5.5 ). En
113122 3 efecto.
,:
112,5
.,1~ 103112 4
g _ 4
102,5
2
12 Md = 112,5 + -- 10 = 112,5 + 6,67 = 119,1 7
3
Mtl = 122,5 - -
~ - 5
2
3- 10 = 122,5 - 3,33 = 119,17 W8 &j+ : 1 D
6 7 9 !O 13
La vertical levantada sobre la mediana divide el rea total en dos reas d e igual
superficie. (Fig. 5.4.) Es decir, la mediana es la pun tuacin que ocupa el lugar cen tr al. La vertical le-
vantada sobre la mediana (9) divide el rea to tal en dos reas de igual superficie
(2 + 0,5 = 2,5 ; 2 + 0,5 = 2,5).
2) La puntuacin que ocupa el lugar central es igu al a una o varias de las
restantes.
EIEMPL05. 18. Calcul emos la mediana de 14, 15, 16, 18, 18, 18, 18, 19,20, 20, 22.
La puntuacin que ocupa el lugar sexto (el central) es 18 que es igual a las que
,;'
,. ocupan los lugares cuarto, quinto y sp timo. El intervalo crtico es el intervalo
'l unitario (17,5 - 18,5). Por tanto,
J
7 3)
... .!...!. _
:j Md = 17,5+ ( 1 17,5 + ?~ = 18,125
4
102 ,5 112,5 t 122 ,5 132,5 142,5
J
l 19,17
I'
/ Fg. 5.4
.,.
' Md = 8,5 +
~- 2)
(T 1 = 8,5 + 0,5 =9
Nmero par de observaciones. Tendremos dos lugares centrales.
1) Las puntuaciones que ocupan los lugares centrales son distintas entre
s y ambas son consecutivas o no lo son.
86 / Estadistica para Psiclogos Esradisticos de posicin o tendencia central / 87
Bajo una y otra condicin es posible seguir aplicando la frmula general eli-
giendo como intervalo crtica>>unitario, bien el que contiene la puntuacin central
inferior, bien el que contiene la superior. Sin embargo, slo si las puntuaciones
centrales son consecutivas, el valor encontrado para la mediana es nico y, adems,
coincide con la media aritmtica de las dos puntuaciones centrales. Por el contrario,
si no son consecutivas, el valor obtenido para la mediana es uno si elegimos com o
intervalo crtico unitario el que contiene la puntuacin central inferior y es otro
si elegimos el que contiene la puntuacin central superior. Son, adems, posibles
otros infinitos valores distintos para la mediana, situados entre los dos anteriores.
Todos ellos verifican la definicin de mediana. Pero con el fin de fijar un valor nico 31 32 33 37 39 40
para la mediana, se suele tomar, arbitrariamente, como tal la media aritm tica 35
de las dos puntuaciones centrales.
En conclusin, en uno y otro caso la mediana ser la media aritmtica d e las 2) Las puntuaciones que ocupan los lugares centralesn son iguales entre s,
dos puntuaciones centrales. pero distintas de todas las dems.
EJEMPLO 5.19. Calculemos la mediana de 24, 25, 26, 26, 27, 27, 27, 29. Las EJEMPLO 5.21. Calculemos la mediana de 3, 3, 4, 6, 6, 7, 7, 9. Las puntua-
puntuaciones que ocupan los lugares cuarto y quinto (los dos centrales) son 26 ciones q ue ocupan los lugares cuarto y quinto {los centrales") son las dos
y 27. Por tanto, la mediana valdr 26,5, media aritmtica de 26 y 27. iguales a 6 y distintas de las restantes. El intervalo crtico es el interva lo uni-
. tario (5,5 - 6,5).
ii~ Por tan to,
j ~
1
Md = 5,5 +
~-3)
(-- l = 5,5 + 0,5 = 6
Md = 4,5
~-1)
+ (T 1 = 4,5 + 0,67 = 5,17
Vemos, en efecto, cmo la suma de las diferencias (en valor absoluto) respec-
to a la media es mayor que la suma respecto a la mediana (la primera suma vale
8 y la segunda vale 7 ).
b) Es menos sensible que la media a la variacin de cada una de las puntua-
ciones. Aunque la variacin de una sola puntuacin (elegida a propsito) puede
La vertical levantada sobre la mediana (5,17) divide el rea total en dos reas
hacer variar la mediana, sin embargo, la variacin, de modo bastante anrquico,
de igual superficie (1 + 2 = 3; 2 + 1 = 3).
1 de la mayora y aun de todas las puntuaciones pueden dejar invariante la mediana.
As, por ejemplo, (2, 59, 61 , 945) y (57, 58, 62, 63) tienen la misma mediana (60).
e) Es funcin de los in tervalos elegidos (de su amplitud, de su nmero y de
1+3 .2. ; 3
3
2 + 3 ,_!_; 3
3
1 los lmites de los mismos).
d) Es fundamento de diversas tcnicas estadsticas. Sin embargo, el nmero
de stas es mucho menor que el de las tcnicas basadas sobre la media.
e) Puede ser calculada aunque el intervalo mximo no tenga lmite superior,
ni el intervalo mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su
correspondiente lmite extremo). Con todo, cuando uno de esos dos intervalos
sin lmite extremo contenga dentro de s ms del 50 por 100 de los casos, tampoco
rr,.rro ,u~
5
1
6
o_ 8
podr ser calculada la mediana. As, ser imposi ble calcular la mediana, dada la
siguiente distribucin de frecuencias
5,17
1 X "i
46-4 8 2
NOTA . Quiz, sean un poco superfluas las distinciones acabadas de exponer 43-45
40-42 2
para el caso de datos no agrupados en intervalos y baste con el siguiente criterio:
37-39 14
,; a) Si el nmero de observaciones es impar, la mediana es la puntuacin de la
36 menos 20
observacin que ocupa el lugar central.
b) Si el nmero de observaciones es par, la mediana es la media aritmtica
1: de las puntuaciones correspondientes a las dos observaciones que ocupan los dos f) La mediana es un punto tal, que la vertical levantada sobre el mismo di-
f11 valores centrales. vide el rea total del histograma en dos reas con idntica superficie.
g) Es ms recomendable que la media cuando la distribucin de frecuencias
'.' es muy asimtrica.
p 5.3.4. Propiedades /) Dados r grupos con medianas Md 1 , Md2 , . , Md,, la mediana del grupo
total es igual o mayor que la mediana mnima e igual o menor que la mxima.
a) La suma de las diferencias (en valor absoluto) den puntuaciones respecto a (Vase Calot, 1969.)
su mediana es igual o menor que la suma de las diferencias (en valor absoluto) de
esas puntuaciones respecto a cualquier otro valor. Para la legitimacin de esta
propiedad pueden ser consultados Freeman (1963), Horst (1966), Calot (1969). 5.4. Moda
Aqu nos limitaremos a comprobarla con un,ejemplo muy sencillo.
EJEMPW 5.23. Dadas las puntuaciones 2, 4 y 9, calculemos la suma de sus di- 5.4.1. Definicin
ferencias (en valor absoluto) respecto de la media y de la mediana.
Su media vale 5 y su mediana vale 4. Esto supuesto, Nivel de intervalos o razn
que ms veces se repite. As, por ejemplo, valdr 2 la moda de las puntuaciones: Nivel nominal
2, 5, 7, 2, 4, 2, 6, 6, 4, 2, 2, 3, 2.
b) Datos agrupados en intervalos_. Modalidad o categora nominal a las que corresponde frecuencia mxima.
Punto medio del intervalo al que corresponde frecuencia mxima. EJEMPLO 5.26. Conde y Domnech (1976) proponen los siguien tes resultados
EJEMPLO 5.24. Conde y Domnech (1976) estudiando una mues tra de pacien- respecto a su muestra de esquizofrnicos.
tes esquizofrnicos encontraron la siguiente distribucin de frecuencias:
Estado civil Total Varones M ujeres
La moda para el grupo total y para el de los varones vale 24,5 aos (punto medio 5.4.2. Propiedades
del intervalo 20 - 29) y vale 54,5 aos (punto medio del intervalo 50 - 59) para
a) Es muy sencilla de calcular.
el de las mujeres.
b) Tiene el inconveniente de no ser necesariamente nica. Dentro d e una misma
distribucin de frecuencias pueden aparecer dos o ms valores o d os o ms cate-
Nivel ordinal goras a los que corresponda frecuencia mxima.
e) Es funcin de los intervalos elegidos (de su amplitud, de su n mero y de
Valor o categora ordinal a los que corresponde frecuenci a mxima. los lmites de los mismos).
1,
-:~ EJEMPLO 5.25. Conde y Domnech (1976) en la misma investigacin acabada d) Puede ser calculada aunque el in tervalo mximo no tenga lmite superior
1;- de citar encontraron que el nivel cultural de 97 personas, de la muestra estudiada, ni el mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su correspon-
diente lmite extremo). Con todo, cuando uno de esos dos intervalos sin lmite
era el siguiente:
extremo contenga dentro de s la frecuencia mxima, tampoco ser calculable la
1~; moda.
Nivel cultural Total Varones Mujeres
1 1
Todo percen til sigue siendo ndice de posicin. Nos indica la posicin dentro
del grupo del objeto (persona, animal, cosa, familia, entidad, etc.) que tiene como
50.5 1 1 t t
puntuacin dicho percentil. Si, por ejemplo, dicho objeto tiene como puntuacin 3 x'
LJ ____ T T
el percentil 80, sabemos que deja por debajo de s el 80 por 100 de los objetos de su
grupo. O, expuesto de otro modo, que su puntuacin supera al 80 por 100 de las
puntuaciones del grupo. Sin embargo, ya no podemos decir que sea ndice d e ten-
dencia central. Un percentil, por su propia naturaleza, es una p untuacin que puede 7 15
estar situada tanto hacia el centro de las restantes puntuaciones de un grupo, como observ. uni<l.
en uno cualquiera de los dos extremos.
4 X
obscrv. und.
1
"' . j j
5.5.2. Clculo
Comenzamos aceptando, al igual que lo hicimos al tratar de la mediana, que 5,S 20.5 35.5 4/0150,5 65 ,5 80,5
dentro-.de cada intervalo las o bservaciones, en l contenidas, se distribuyen homo- Fig. 5.6
gnemente.
94 / Estadistica para Psiclogos Estadsticos de posicin o ten dencia central / 95
La vertical levantada sobre P60 divide el rea total en dos reas iguales al 60 Ahora bien,
por 100 (la de la izquierda) y al 40 por 100 (la de la derecha) respectivamente
(3 + 5 + 4 = 12 ; 3 + 2 + 3 = 8) (Fig. 5.6). 50,5 = I,: lmite superior del intervalo crtico.
Ntese que
2
12 8 (40)( 0) = (k ' )(n): k ' por 100 de las observaciones, d onde k ' por 100 = 100 por
P6o = 35,5 + 8,57 = 35,5 + (4 )(I 5 ) = 35,5 + - 15 = ' 100 100
7 7 JOO - k por 100.
(60)(20) _ 8) 5 = n, : nmero de observaciones sobre el intervalo crtico.
100
= 35,5 + ( 15 = 44 ,07 7 y 15 representan lo mismo que en el caso anterior.
7
Ahora bien, Por consiguien te, podemos proponer la siguiente como frmula alternativa
para P1 ,
35,5 = I, : lmite exacto inferior del intervalo crtico.
(k ')(n ) _ 11
)
(60)(20) (k)(n) .
= 100 :k por 100 de las observacwnes. P, = /, _ ( 100 ' J (5.8)*
100 nd
8 = nb: nmero de observaciones bajo el intervalo crtico.
7 = nd; n mero de observaciones dentro del intervalo crtico.
15 = 1 ; amplitud del intervalo crtico. 5.6. Resumen: Definiciones y frmulas
Como el razonamiento expuesto en este caso particular es vlido para cualquier
otro caso, podemos aceptar como frmula del percentil k, P1 ;
Media aritmtica: Llamarnos media aritmtica den valores a la suma de ellos
dividida por n .
-(k)(n) - nb)
P, = I; + ( 100 nd 1 (5.7) X =LX, (d atos no agrupad os en intervalos)
11
Podamos, tambin, haber pensado as: Si las siete observaciones del intervalo
X- I:n X
= =-:..:.L.:..:.. (datos agrupa d os en m
. lerva 1os )
(35,5 - 50,5) ocupan homogneamente una distancia igual a 15 unidades, las n
tres observaciones (que con las cinco superiores forman el 40 por 100) ocuparn
una distancia igual a x ' unidades. Es decir, Medias aritmticas generalizadas
7 15
= (3)(15)
-7
= 6,43 a) Media geomtrica: Llamamos med ia geomtrica de n valores a la raz
3 =~ , x' ensima del producto de esos n valores.
P 60 = 50 5 - 6 43 = 50 5 - (
3HI 5 ) = 50 5 - S - 5 15
, , ' 7 ' 7 X9 = J (X , )"' (X1 )"' (X, )"' (d atos agrupados en intervalos)
(40)(20) 5)
,,.f'
= 50 5 - ( IOO 15 = 44 07 El pcrcen!il 25 suele s er llamad o pri mer cua rt il , e l perccn!il 50 segundo cuart il (o me diana) y el
' 7 ' percent il 75 sue le denomi narse tercer cuartil.
96 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 97
-(i -
0, 11-0,13 20 10-12 8
11 25-29 10 0,08-0, 10 14 7. 9 6
Md = /, + (~ - nb) J = /, ' ) J 20-24 10 0,05-0,07 6 4- 6 5
"d lid 15- 19 9 1-3 4
5.4. La media aritmtica de dos nmeros vale 8 y uno de ellos es tres veces mayor 5.13. Calcular la proporc10n de mdicos, abogados e ingenieros dentro de un
que el otro, ,cunto valen ambos nmeros? grupo de 800 personas, conociendo el nmero de personas y la proporcin de m-
dicos, abogados e ingenieros dentro de cada uno de los subgrupos en los que se
5.5. Demostrar que, siendo X, = A, + B, + C,, X =A+ B + . divide el grupo primero, de acuerdo con el cuadro siguiente:
5.6. Deseamos transformar las puntuaciones 8, 13, 9, 15, 10 en otras (sumndoles
a todas ellas una misma constante) de modo que su media valga 26. Cul debe
ser esa constante aditiva ?
5.7. Ocho personas han comparado dos frases, A y B , acerca del divorcio, valo-
G r. 1. 0 , 11 1 = 2 10 Gr. 2. 0 , 11, = 180 Gr. 3. 0 , n 3 = 220 G r. 4.o, 114 = 190
- -
rando cuntas veces ms favorece A que B al divorcio. Los datos obtenidos han Mdicos 0,25 0,30 0,35 0,33
sido los siguientes: 2; 2,5; 2,7; 1,8; 3; 1,5: 2; 2,5. En qu proporcin, por trmi- Abogados 0,50 0,52 0,45 0,40
no medio, ha resultado ser ms favorabl e al divorcio la frase A que la B? Ingenieros 0,25 0, 18 0.20 0,27
5.8.Calcular dos nmeros tales que su media aritmtica valga 7,5 y su media
1,00
- - -- - - - - - --
1,00 1,00 1,00
geomtrica valga 6.
5.9. Sea k el valor de uno de dos nmeros cuya media aritmtica es igual que su
media armnica. Esto supuesto, cunto vale el otro nmero ?
5. 10. Un ciclista va de A a B a 20 km por hora y vuelve de B a A a 60 km por hora . 5.14. Calcular la proporcin de solteros, casados y viudos dentro de un grupo
Esto supuesto, cul es la velocidad media a la que ha recorrido la distancia total? de 150 adultos, conociendo el nmero de personas y la proporcin de solteros, ca-
(Sugerencia: utilizar la media armnica.) sados y viudos dentro de cada uno de los subgrupos en los que se divide el grupo
5. 11 .Calcular el peso medio de un grupo de personas, conocido el nmero de primero, de acuerdo con el cuadro siguiente:
personas y el peso medio de cada uno de los subgrupos en los que se divid e el grupo
total primero, teniendo en cuenta el cuadro siguiente :
Gr. l.". 11 1 = 60 Gr. 2. 0 , n 2 = 90
- - - --
Subgrupo i Personas (n;) Media (X.) So lteros 0,30 0.25
Casados 0,45 0,55
1 150 75 Viudos 0,25 0,20
2 220 60
3 180 65 1,00 1,00
[.::
5.12. Calcule la media aritmtica en lenguaje del primer curso de Bachillerato 5.15. Calcular la mediana a partir de los siguientes datos agrupados en intervalos:
de un centro escolar, sabiendo que est dividido en cuatro secciones, A, B , C y D,
segn el cuadro siguiente:
a) X "1 b) X 11 e) X n d) X
-- ~- "1
-- - -~ ~
Seccin N mero de al umnos Nota media 7-8 7 30-34 8 40-45 6 57-64 7
5-6 JO 25-29 18 34.39 12 49-56 11
A 20 10 3-4 8 20-24 20 28-33 16 4 1-48 18
B 50 6 1-2 5 15-19 16 22-27 14 33-40 15
..,:- e 60 5 - - - 10-14 10 16-21 8 25-32 JO
D 30 8 - -- 17-24 3
t Estadsticos de posicin o tendencia central / 1O1
100 / Esradst1ca para Psiclogos
1- --- --- t 5,20. Calcular la mediana de las puntuaciones 4, 4, 5, X, 5, 4, 4, sabiendo que su
1. X h) X n,
1 e) X
- -
",
38-41 13
f) X
137- 141
11)
lO
g)
- - -
n,
a) X n, b) X n, X n,
5.18. ;, Cual de las dos, media o mediana, representa mejor a los valores numri-
cos : l, 3, 4, 6, 8, 200, 8, 6, 4, 3, I ? J. 5.23. A partir de la siguiente distribucin de frecuencias , calcular las dos pun-
tuaciones que dejan entre s las 133 observaciones centrales y decir qu percen-
5.19. Cul eligira usted en primer lugar, la media o la mediana, como medida
tiles son esas d os pun tuaciones.
de tendencia central, a partir de las siguientes distribuciones de frecuencias ?
a) X n, b) X n, e) X
- -- -
n, r X n,
- -- --
34-39 2 66-69 8 91-100 6 f.! 40-44 13
28-33 o 62-65 10 81-90 10
35-39 40
22-27 l 58-61 25 71-80 25
30-34 77
16-2 1 6 54-57 28 61-70 26 t: 25-29 25
-...... ,,1:
10-15 15 50-53 12 51 -60 11
20-24 20
4-9 12 49 puntos o menos 9 41 -50 5
- - -
102 / Estadistica para Psiclogos
J.
5.24. Llamemos decil primero, decil segundo, ... , decil noveno a los puntos de
la escala que dejan por debajo de s el 10 por 100, el 20 por 100, ... , el 90 por 100
de las observaciones, respectivamente. Esto supuesto, tiene que ser igual la dis-
6
tancia sobre la escala entre dos deciles cualesquiera consecutivos que la distancia Estadsticos de variabilidad o dispersin
entre otro par cualquiera de deciles tambin consecutivos?
1
i;,. 5.25. Los percentiles son valores esencialmente positivos. S? No?
6.1. Introduccin
6.2.1 . Definicin
6.2.2. Clculo
2 1 2 1,2 2,4
x' = ~
JO = - 02
31-45
Rata n." 2 3 4 5 6 7 8 9 10 16-30 4 o o 0,2 0,8
1-15 4 - 1 -4 0,8 3,2
Tiempo (en seg.): 25; 1,43; 20; 1; 8,56; 16,5; 16; 34; 4,43; 44 X= 17,09 segundos
DM = 15 64 = 9,6 segundos
10 -2 6,4 10
6.2.3. Propiedades
b) Datos agrupados en interwlos
Es fcilmente inteligible y fcilmente calculable.
a)
Raramente usada debido a que los valores absolu tos son muy poco mane-
b)
DM = I: nIX; - XI = L n;IX - !_I (6.2) jables matemticamente.
I:nj n
donde nj y Xj ~on, respectivamente, el nmero de observaciones y el punto medio 6.3. Varianza y desviacin tpica
del intervalo j.
EJEMPLO 6.2. Agrupemos los datos del ejemplo 6. 1 en tres intervalos y calcu-
6.3.1. Introduccin
lemos la desviacin media.
Si sumamos las diferencias den p untuaciones respecto a su media, sabemos que
dicha suma vale siempre cero. Para evitar este inconveniente, podemos tomar
Tiempo n, X nX IX, - iJ nJ!X, - xJ -
X = -200 = 20 segund os
dichas puntuaciones en valor absoluto (caso de la desviacin media) o podemos,
tambin, elevar dichas diferencias al cuadrado y sumar estas diferencias cuadrticas.
36 JO
31-45 2 38 76 18 Esta ltima tctica es la que seguiremos en el caso de la varianza y de la desviacin
16-30 4 23 92 3 12 tpica.
1-15 4 8 32 12 48
DM = -96 = 9,6 segundos La varianza, referida a una m uestra, ser designada por s2 y, referida a una
10 poblacin , por a 2 Como en este tomo J nos limitamos al estudio de muestras,
10 200 96
usaremos s 2 al tratar de la varianza. Excepcionalmente usaremos el smbolo a2
cuando de modo incidental nos refiramos a la varianza de la poblacin. A su vez,
la desviacin tpica, referida a una muestra, ser designada por s y referida a una
Junto a la frmula (6.2) y mediante la transformacin x1= X - Xo de que poblacin por a. Llamaremos s;, s~ . .. , a la varianza de la variable X , Y, ...
1
hemos hablado en 5.2.4, tendremos la siguiente frmula
6.3.2. Definicin
DM = I: nlx1 - x'I = I: nlxJ ~ x'I (6.3)
I: n n a) Varianza
Aplicacin directa de (6.4) a los datos originales. Supongam os II observaciones agrupadas en r intervalos, todos ellos de igual
Desarrollando (6.4) podemos llegar a otras dos frmulas equivalentes. amplitud. Sea X, el punto m edio del in tervalo primero y 11 1 el nmero de obser-
vaciones dentro del mismo. Sea X2 el pun to medio del intervalo segundo y n2 el
2
X)2 + X2 ) nmero de observaciones dentro del mismo . Sea X, el pun to medio del intervalo
I:
- (X,
~ -- - = I:
______c.(X; - 2XX,
._ ,__ __,___....:. = :I:
- X,2 2X I:-
- - - X, + nX
- = , y n, el nmero de observaciones dentro del mismo. Segn sabem os, al agrupar
n n n n n
las observaciones en intervalos, atribuimos a cada una de ellas (como puntuacin )
= I: Xt _ 2g 2 + gz _ :I: X _ gi _ I: Xf _ (:I: X,) 2 _ n I: X,2 -2 (:I: X, )2 el punto medio del intervalo dentro del que se encuentra. Restemos ahora cada
n n n n n una de las puntuaciones de la media del grupo y elevemos al cuadrado estas d ife-
rencias. Dentro d el intervalo primero tendremos n 1 puntuaciones iguales a X , y,
Por con siguiente, consiguientemente, n 1 diferencias cuadrticas iguales a (X, - X)2 cuya suma
I:- X _ X2 valdr n 1(X 1 - X) 2 . Dentro del intervalo segundo tend remos n2 puntuaciones
52 - (6.5)
x - n iguales a X2 y, consiguientemente, n 2 diferencias cuadrticas iguales a (X 2 - X )2
cuya suma valdr 112 (X2 - X )2. Dentro del intervalo r ten dremos n, puntuaciones
2 _ n I: X - (:I: X, )2 (6.6) iguales a X, y, consiguien temen te, n, diferencias cuadrticas iguales a (X, - X )2
Sx - nz cuya suma valdr n, (X, - X)2 . En conclusin, la suma de las 11 1 + n2 + + n, = n
dife rencias cuadrticas valdr: n 1 (X, - X )2 + 112 (%2 - X )2 + + n,(X, - X )2 =
EJEMPLO 6.4. Rachman (1968) en un experimento con cinco jvenes pudo = !: nj{Xj - X) 2 y su media (es decir, la varianza de las n puntuaciones) valdr:
confirmar la hiptesis de que el fetichismo sexual es un comportamiento que puede
ser establecido tras un proceso de condicionamiento clsico. El nmero de ensayos I: n1 (X1 - X) 2 !: n(Xj - X) 2
de condicionamiento que fueron necesarios para implantar una conducta fe ti- si = (6.7)
chista en cada uno de los cinco sujetos fue : 35, 36, 21, 45, 38. Calculemos la varianza
r ni n
y la desviacin tpica de estos da tos. De (6.7) es fcil deducir las dos f rmulas siguien tes, de acuerd o con lo dicho
para el caso de da tos no agrupados en intervalos,
X, X,' (X, - X) (X, - .f)2
s2 = :I: nj_ - .f2
35 1.225 o o X
n
(6.8)
36 1.296 1 1 - 175
21 441 -14 196 X = - = 35 ensayos ,2 = n r '!J.-2]_::_J!: 111xy (6.9)
100
5 n2
45 2.025 JO X
38 1.444 3 9
EJEMPLO 6.5. Agrupando en cuatro in terva los los da tos de Conde y Domnech
ns- 6.431 o 306 (1976) propuestos en el ejemplo 5.24, nos queda
108 / Estadi5tica para Psiclogos
Estadisticos de variabilidad o di spersin / 109
Es decir, la varianza de las n puntuaciones es igual a la media de las varianzas En-.MPLO 6.6.
ms la varianza de las medias.
En efecto, sean
X11 , X2 1 , , X,., 1 las n 1 puntuaciones del grupo 1.0 con media X\ y varianza s}. Gru po p rimero Grupo segundo G ru po tercero
/l /l
EJEMPLO 6.7. resulta que la media de todas estas varianzas, as definidas, vale
11
-
1
a; y no a;.
11
Para alcanzar que esa media valga a;:, basta con multiplicarla por _ n_ o, lo que
111 x; x;2 IJ/<; IJ,-l/
> xj - _y (x; - n' n;(x; - .n' 11 - 1
. Iente, b asta con d efimir
es equ1va . s,2 = - 11 I (X, - X )2 = -I (X,
- - - - -- -
- X)
--- - .
2
Segn (6,7 ):
Ahora, en realidad, las nicas puntuaciones ex istentes son los p untos medios
6.4.1. Definicin de los intervalos. Por tanto, la amplitud total ser la diferencia en tre el punto medio
del intervalo mximo (91) y el punto medio del intervalo mnimo (3 1). A su vez,
Diferencia entre la puntuacin mxima y la mnima. O, teniendo en cuenta los Ja unidad que puede ser aadida es una unidad de intervalo , medio intervalo por
lmites exactos de los intervalos elementales o compuestos, diferencia entre la pun- debajo del punto medio mnimo y medio intervalo por encima del punto medio
tuaci n mxima y la mnima ms una unidad. mximo. En otras palabras, aadir una unidad de intervalo, equivale a aceptar
romo amplitud total la diferencia entre el lmite exacto superior del intervalo m-
ximo y el lmite exacto inferior del intervalo mnimo.
6.4.2. Clculo
23,5 31 38,5 83 ,5 91 98,5
a) Datos no agrupados en intervalos
EJEMPLO 6.9. La fenilcetonuria es una enfermedad causante de un deterioro
1 ' / " 1
mental que se agudiza con la edad. Los datos siguientes, tomados de Berman, ~ '-- - - - - ~( 60 )>-- - -- - -
Waisman y Graham (1966) representan los cocientes intelectuales de cinco nios
afectados por dicha enfermedad y cuya edad media aproximada era de cinco aos. 75
6.5. Amplitud semintercuartil Mientras que la amplitud semiin tercuartil ha permanecido invariante frente al
cambio de puntuaci ones. la desviacin media ha pasado de 5 a 37,33 y la desviacin
6.5.1. Definicin
tpica ha pasad o de 7,07 a 59,58.
Basta con calcular los percentiles 75 y 25 (segn lo dicho en 5.5.2) y hallar la Consid eremos dos variables distintas, por ejemplo, peso (X ) y altura ( Y). Es
semidiferencia entre ambos. claro que s, vendr dada en unidades de peso (por ejemplo, gramos ) y s,. en unida-
EJEMPLO 6.11. Calculemos la amplitud semiintercuartil, a partir de los datos des de longitud (por ejemplo, metros). Ambas desviaciones tpicas no son compara-
del ejemplo 6. 1O. bles. Si s, valiera 5 gramos y s, 3 me tros, 5 gramos no son ms ni menos que 3 me-
En dichos datos, P 7 5 = 84,75, P25 = 43. Por tanto tros, son cosas distintas. Para hacer comparables las variabilidades de ambos gru-
pos, con variables de d istinta naturaleza, es necesario que vengan expresadas en
nmeros abstractos (es decir, ni en me tros, ni en gramos). Un modo de conseguirlo
AS/ = 84,75 - 43 = 20 875 es tomar como medidas de variabilidad s_,/X y s,/Y. Estos cocientes son nmeros
2 ' abstractos. Lo nico q ue n os indican es el nmero de veces que el numerador con -
tiene al denominador, ind ependientemente de lo que ambos signifiquen (gramos,
metros, etc.).
; ' Consideremos ahora una misma variable y dos grupos distintos, cuyas medias
6.5.3. Propiedades en esa variable son muy distintas entre si. Por ejemplo, el peso de 100 elefantes y
; el de 100 hormigas. Es evidente que una misma desviacin tpica igual a l kg repre-
a) Es preferible a la desviacin tpica en el caso de distribuciones muy asim- senta una variabilidad insignificante para el grupo de los elefantes e inconcebible-
tricas. (Recurdese que en este caso la mediana era preferible a la media .) mente alta para el de las hormigas. Por tanto, la desviacin tpica ser algo equ-
b) Cuando el intervalo mximo carece de lmite superior y/ o el mnimo ca- voca, en este caso, como medida de variabilidad. Un modo de evitar esta dificultad
rece de lmite inferior, es imposible calcular la desviacin tpica. Bajo estas con- es dividir la desviacin tpica de cada grupo por su correspondien te media, s, ,!X,,
diciones es posible calcular la amplitud semiintercuartil, siempre que el primero s,,fX2
y el tercer cuarlil no se encuentren en esos intervalos extremos. (Recurdese que
bajo estas condiciones era posible calcular la mediana y no era posible el clculo
de la media.) 6.6.2. Definicin
e) Definida como distancia entre d os puntos, slo es calculable a nivel de
intervalos o de razn, pero no a nivel meramente ordinal. Resultado de dividir la desviacin tpica por la media. Ordinariamente, este
d) Menos sensible q ue la desviacin media y que la desviacin tpica a la va- cociente viene multiplicado por 100. Es decir,
riacin de los datos. Veamos confirmada esta afirmacin en los siguientes d atos :
CV =~ o , ms frecuentemente, CV =~ 100
X
Puntuaciones AS/ DM s,
en ambos grupos fuera l dg, ,cunto valdr el coeficiente de variacin en uno y hay alguna variabilidad) o nula (todas las puntuaciones son iguales entre s, no hay
otro grupo? variabilidad), pero es inconcebible una variabilidad negativa . De aqu que sean
esencialmente no negativos los valores que pueden tomar los ndices de variabilidad
CV = ~~ 1- - - = 0,0000000167 , multiplicado por 100, 0,00000167 o dispersin. Por esta razn, supondremos X j O y tomaremos X en valor absoluto.
60.000.000
El segundo CV es 30 millones (!) mayor que el primero. Esto quiere decir que
la variabilidad relativa de ambos grupos es enormemente distinta, a pesar de que Desviacin media: Media de las diferencias (en valor absoluto) den pu ntuaciones
son iguales sus desviaciones tpicas. Una desviacin tpica de l decigramo repre- respecto a su media aritmtica.
senta una variabilidad apreciable en relacin con el grupo de las hormigas y no
representa, prcticamente, variabilidad alguna en relacin con el grupo de los ele- DM = r.1x, -x 1 (datos no agrupados en intervalos)
fantes. n
AS] = ql. -= i\
a) Recordemos que, a nivel de intervalos o de razn, todo ndice de tendencia 2
central era un valor numrico que vena representado por un punto sobre el eje
de abscisas. Pues bien, todo ndice de variabilidad es una distancia q ue viene repre- Coeficientl' de tariacin : Cociente entre la desviacin tpica y la media (multi-
sentada por un segmento rectilneo . plicado, ordinariamente, por 100).
b) Tengamos presen te que todo indice de variabilidad es esencialmente no
negativif. Las puntuaciones pueden ser positivas o nega tivas, pero su variabilidad CV =~ 100
o dispersin ser siempre positiva (no son todas las puntuaciones iguales entre s, X
120 / Estadistica p ara Psiclogos Estadistlcos de var,abl/1dad o dispersin / 121
6.1. Calcular la varianza y la desviacin tpica a partir de los siguientes datos ,w 6.l 1. Sean 10 y 4, respectivamente, la media y la desviacin tpica de las puntua-
agrupados en intervalos. ciones X 1 , X 2 , . , X,, . Calcule la media de las nuevas puntuaciones (X1 - 3)2.
{X 2 - 3)2 , ... , (X,, - 3)2
a) 3, 5, !, 6, 10 b) 3, 4, 1, 4 6.12. Calcule el coeficien te de variacin a parti r de los da los del ejercicio 6. 1.
e) 2, 5, 6, l. 1 d) 1, O, 3, 1, 3, 4
e) 5,2,1,5,3,8 f) 1, 9, 3, 7, 8, 8 6.13. Sean 4 y 3, respectivamente, la media y la desviacin tpica de las punt ua-
ciones X 1 , X 2 , . . . , X,,. Calcule la media y la desviacin tpica de las puntuaciones
6.2. Calcular la d esviacin media a pa r tir de los datos del ejercicio anterior. Xf , X], . . . , X;, sabiendo que el coeficiente de variacin de estas ltimas puntua-
ciones vale 96 .
6.3. Calcular la varian za y la desviacin tpica a par tir de los siguen tes da tos
agrupados en intervalos. 6. 14. Sean 25 y 15, respectivamente, la m edia y la desviacin tpica de las pun-
tuaciones 3X1 - 5, 3X2 - 5, 3X. - 5. Calcular la desviacin tpica de las
- - - - nuevas puntuaciones Xr, X;. ... , X;.
sabiendo que el coeficiente de variacin
a) X ", b) X ll; e) X llj d) X ", de estas ltimas vale 80.
---
9-11 1 10-12 1 9-1 0 1 15-2 1 4 6.15. Sabiendo que las cinco puntuaciones - 4, 2, X , 4, O tienen como varianza 16
6-8 2 7-9 4 7-8 2 8- 14 10 y como coeficiente de variacin 200, calcular el valor de la tercera puntuacin
3-5 5 4-6 3 5-6 l 1-7 6 desconocida, X , y la mediana de las cinco.
0-2 4 1-3 2 3.4 4
6.16. Sea un grupo compuesto de n 1 personas con media X1 y varianza sf y olro
i) --- 1-2 2
grupo compuesto de n2 personas con media X2 y va rianza sf Demostrar que la
variam.a del grupo total, s1 , compuesto de las n 1 + n 2 personas, vale:
{-
- --
e) X n, f) X n, g) X ni h) X n
ll1Si + n2si + '!/~2 - (%1 - X2 )2
11 + 112
11-13 2 109-113 2 110-1 12 2 75-78 2 s2
8- 10 3 104-1 08 4 107-109 4 71 -74 :l 11 + 112
5-7 6 99-103 8 104-106 3 67-70 8
2-4 4 94-98 5 101- 103 1 63-66 7 (Sugerencia: recordar la propiedad 6.3.4.i de la varianza.)
--- 89-93 1 59-62 4
6. 17. Deducir las frmulas (6.2) y (6.3 ).
55-58 1
6.18. Deducir las frmulas (6.8) y (6.9).
6.19. Supongamos una poblacin compuesta de los cuatro elementos : l , 2, 3 y 4.
6.4. Calcular la desviacin media a pa rtir de los da tos del ejercicio anterior. Formemos a partir de la misma las (4)(4)(4) = 64 muestras ternarias posibles,
6.5. Calcular la amplitud semiintercuartil a partir de los datos de los ejercicios entendiendo q ue, extrado un elemento de la poblacin, es devuelto a la misma
5.21 y 5.22. antes de extraer un segundo elemento y, a su vez, ste es devuelto a la misma antes
de extraer un tercero. Esto supuesto, calcular la media de las va ria nzas de las 64 m ues-
6.6. Demostrar que L (X, - X)2 =L (X; - k )2 - n(X - k) 2
2
6.7. Comprobar la igualdad a nterior para X 1 = 1, X 2 = 2, X3 = 6 y k = 5. tras, habiendo definido, primero, la varianza como L (X, - X) Hacer lo mismo,
11
6.8. Vlgase de la igualdad expuesta en 6.6 para calcular L (X, - X )2 usando I: , - 2
k = 5 y teniendo en cuenta los datos siguientes: 3, 4, 5, 4, 6, 7, 4, 5. habiendo definido la varianza como _Q._::-~)_ (donde 11 = 3 ). Comprobar.
11 - 1
6.9. /. Qu hara Vd. para sim plificar el clculo de la varianza de las siguientes - 2 - 2
. L (X - X) 480/9 5 . I: (X, - X ) 720/9 5
punt\]a6nes: 2,75; -3,25; 6,75; 1,75; 5,75; -2,25; 4,75; - 4,25? _Cunto vale fi na1mente, como - ~ 1 - -
'
=- -=
64
-
6
y como - ~ - - = -
2 64 4
dicha varia nza?
122 / Esiadistica para Ps,clogos
7. 1. Introduccin
7 .2. Asimetra
- - 7
f
L __
A'
~J'~
Es claro que si la d istribucin es simtrica , la mediana es, tam bin, centro a e puntuaciones X 1 , X 2 . , x. sigue siendo el mismo que el obtenido a partir de
gravedad, es d ecir, la med ia na coincide con la media. Por otra parte, si la distribu- Jas puntuaciones Y1 = AX 1 + B, Y2 = AX2 + B. ... , Y. = AX. + B .
cin de frecuencias es unim oda l, esa nica m o da coincide con la m ediana y, con-
siguientemente, con la media. En conclusin, si la distribucin es sim trica, m edia,
med iana y moda co inciden .
Diremos que la asim etra es positiva si tenemos m uchas puntuaciones bajas y
pocas a ltas. D irem os que es negativa si sucede lo contrario . Un test dilcil dar
lugar a una d istribucin asimtrica positiva. U n test fcil da r lugar a una distri-
bucin asimtrica negativa :
Q, Q, Q, Q, Q, Q,
Asimetra positiva Asimetra negativa
5 10 15 20 25 30 JO IS 20 25 30
Asimetra positiva Asimetra negativa
Latencia
x, - ex, - x A = (2,470 - 1,074) - (1,074 - 0,535) = 1,396 - 0,539 = 0,857 =
", x,
2
nJXi X X)2 ni(X, - (Xi - X)' niX1 - X)' 0443
(en segundos) ' (2,470 - 1,074) + (1,074 - 0,535) l,396 + 0.539 l ,935 '
9,00-10,49 1 9,75 9,75 7,91 62,57 62,57 494,9 1 494,91
La asimetra es positiva. Consideremos el histograma correspondi ente a la
7,50-8,99 1 8,25 8,25 6,41 41,09 41,09 263,37 263,37
distribucin de frecuencias an terior (Fig. 7.3).
6,00-7,49 l 6,75 6,75 4,91 24,11 24,11 118,37 118,37
4,50-5,99 3 5,25 15,75 11,63 34,89 39,65 EJEMPW 7.2. En la tabla 7.2, dentro de cada intervalo tenemos los nios na-
3.41 118,95
3,00-4,49 7 3,75 26,25 1,91 3,65 25,55 6,97 48,79 cidos que, entre 10.000, probablemente presentarn el sndrome de D own (mon-
1,50-2,99 5 2,25 l l ,25 0,4 [ 0,17 0,85 0,07 0,35 golismo) y cuyas madres tienen edades comprendidas dentro de dicho intervalo
0,00- 1,49 41 0,75 30,75 -1 ,09 1, 19 48,79 -1,30 -53,30 (vease Coliman y Stoller, 1962). Como se ve, el riesgo de tener un hijo monglico
aumenta con la edad, por lo cual la distribucin es asimtrica negativa.
59 108, 75 237,85 991,44
Fig, 7.4
F ig. 7.3
Esradisticos de asimerria y apuntami ento / 129
128 / Esrad1st1ca para Psiclogos
TABLA 7.2 Pues bien, aceptaremos como indice de asimetra la expr esin
- - -- -- -- -
m3
a3 = - - - = - ~- '-'-
_ "f.11 (X, - X )3/n
a3 - (7. 2 )
- 175.939,5 1/ 382 = _ 2, 18
r. (X, - i)3 r. n}X1 - X) 3 3 = 2 11 ,58
nl3 = - - -- - m, =- - n -- -
11
Ntese que hay 218 diferencias (X1 - X ) p ositivas y slo 164 negativas, pero la
r. = ~~ ::..!1.. suma de stas (elevadas al cu bo) es mucho mayor que la suma de las primeras (ele-
4
X)
4 ..~
(X1 - /114
m4 = vadas, tambin, al cubo).
11
n
Estadsticos de asimetra y apuntamiento / 131
130 / Estadstica para Psiclogos
7.3.2. Indice basado en el momento de cuarto orden
Conviene advertir lo siguiente acerca del criterio (7.2):
3
a) Si la distribucin es simtrica. necesariamente l: (X, - X ) = O y, consi- Para dos curvas con la misma desviacin tpica, la ms apuntada deber con-
guientemente, 11 3 = O. Pero si ,1 3 = O, la distribucin puede ser simetrica o asi- tener ms observaciones bajo los dos extremos alejados de la media que la me-
m trica . nos apun tada. Para estas observaciones extremas, las diferencias (X, - .X) ser n
b) Si r (X, - .X) 3 +
O, necesariamente la distribucin es asimtrica, pero
3 grandes y sern mucho mayores al ser elevadas a la cuarta potencia. Por tanto ,
siendo la distribucin asimtrica, puede verificarse tanto l: (X, - X ) = O, como r (X; - X )4 ser mayor para la curva leplocrtica que p ara la platicrtica. Por
l: (X, - X )3
+O. .. .
otra parte, se dem uestra en Estadistica In feren cial que
l:(X- X )4/n
' 4 - 3 = O
s,
en el caso de la curva normal. Por e llo, suele ser elegido corno criterio de apunta-
7.2.4. Nota miento o curtosis la expresin
Hemos visto que si la distribucin es simtrica y unimodal, media, mediana y
moda coinciden y que si no coinciden, la dislribucin tiene que ser asimtrica. Fun- u4 = l: (X, - X)4/ n - 3
dados en ello, podemos introducir indices de asimetra . De hecho . han sido pro- s!
. d. d . .
puestos como m ices e as1metna A,= - - -
X - Mod y A,= --'---3(X - Md)
---' esperando De lo expuesto se infiere que a 4 > O para las curvas Ieptocrticas y a 4 < O
s,l; .\x
para las pla licrticas.
que A, > O si la asimetra es positiva y que A , < O si la asimetra es negativa. Lo
L a razn de dividir l: (X; - X) 4 /n por s! es a nloga a la ofrecida en 7.2.3 res-
que indudablemente es cierto es que A = O si la distribucin es simtrica y que
pecto a l ndice de asimetra a 3
si A, +
O, la distribucin es asimtrica . EJEMPLO 7. 5. Burt (1963) midi el cociente intelectual de un grupo numeroso
de nios y obtuvo la distribucin de frecuencias que, con ligeras modificaciones,
exponernos a continuacin.
7 .3. Apuntamiento
CI n1 x, n,X; (X1 - X) IX1 -X)2 ni(X - X)' n;(X; - X]4 /4 .659
7.3.1. Idea previa 150-159 5 154,5 772,5 55,74 3. 10<,,95 15.534,75 10.359,652
140-1 49 18 144,5 2.601,0 45,74 , 2.092, 15 37.658,70 16.9 10,81 1
De un modo no muy riguroso diremos que una curva es muy apuntada si es ff 130-139 84 134,5 11.298,0 35,74 1.277,35 107.297,40 29.4 17,433
muy alta y estrecha. Diremos que es p oco apuntada si es baja y ancha. Eligiendo 120-129 253 124,5 31.498,5 25,74 662,55 167.625, 15 23.837,570
como patrn la curva normal (de la que hablaremos pronto }, diremos que una JI0-119 74 7 114 ,5 85.531 ,5 15,74 247,75 185.0<,9,25 9.841 ,1 72
curva es leptocrtica si es ms apuntada que la normal y que es platicrtica si es 1 100-109 1.21 7 104,5 127. 176,5 5,74 32,95 40.100, 15 283,560
menos apuntada que la normal. Diremos que la curva normal es mesocrtica *. 90-99 1.148 94,5 108.486,0 -4,26 18,15 20.836,20 81 ,150
80-89 719 84,5 60.755,5 - 14 ,26 203,35 146.208,65 6.381 ,375
70-79 294 74,5 21.903,0 -24 ,26 588,55 173.033,70 2 1.858,372
60-69 99 64,5 6.385,5 -34,26 1.173,75 116.20 1,25 29.274,664
50-59 47 54,5 2 .561,5 - 44 ,26 1.958,95 92.070,65 38.712,462
40-49 21 44 ,5 934,5 - 54,26 2.944,15 61.827, 15 39.070,2 10
30-39 7 34,5 241 ,5 -64.26 4 .1 29,35 28.905,45 25.6 19,356
X=
460.145,5
4.659
= 98, 76, s; =
1.1 92.368,45
4 .659
= 255,93, s: = 65.500,1 6
X
25 1.647, 787
~1" 04 = - 3 = 3,84 - 3 = 0,84
Del griego, ,cnt<; (lepts): delgado, estrecho: ~tlI; (plats): ancho. extendido ; ,<!o<; 65.500, J 6
(mesos): medio : ppr,; (kirts): encorvado, convexo: xuptr~<; (kirtotes): curvatura.
132 / Estadistica para Psiclogos Estadsticos de asimetra y apuntamiento / 133
b) a3 =L (X, - X)3/n
7.5. Calcular el n dice de curtosis, propuesto en el texto, a partir de las d istri-
(para datos no agrupados en intervalos ) buciones del ejercicio a nterior.
53
X
7.6. Supongam os que, sie ndo simtrica la distribucin de frecue ncias, el per-
L n-(X - - X) 3 /n centil 25 vale 6,5, L n; = 12, L n;X; = 114, !: n;X; = l .259. Esto supuesto. calcu-
03 = 1 1 J
Sx
(para datos agrupados en intervalos)
lar el percentil 75 y el coeficiente de variacin.
7.7. En una distri bucin simtrica de 40 elementos, X 1 , X 2 , . , X40 , L (X, -
Apuntamiento : Diremos que una distribucin de frecuencias es muy apuntada
- 11 )2 = l.040, L x, - k I es m nima para k = 1O. Esto supuesto, calcular el
o poco apuntada segn que el correspondiente histograma sea alto y estrecho o coeficiente de variacin de dichas pu ntu aciones .
bajo y ancho.
ndice de apuntamiento :
a4 =L (X -
' X)4/n - 3 (para datos no agrupados en intervalos)
4
Sx
Ln(X - X)4 / n
a4 = 1 1
4
- 3 (para datos agrupados en intervalos)
sx
!'
Punruac,ones tip,cas / 135
8 equivale a
x , = AX, + B
Puntuaciones tpicas
con A 1y B = -X ;
1 -
= s- X - X 1 -
.X sx
equivale a
a) Puntuacin directa
l -
con A= - y B
sx
= -~
X
La atribuida directamente a cada objeto al ser sometido a cualquier tipo de
prueba . Estas puntuaciones suelen ser designadas en Estadistica Descriptiva, por
letras maysculas latinas.
:=2X -~ = 0
Sx Sx f = Az + B = (A)(O) + B = B (recordando 5.2.3 .c)
s, = IAl-r, = !A!O) = IA (reco rdando
1 6.3.4.a)
EJEMPLO 8.2 . Comprobemos esta propiedad con los datos del ejemplo 8.1.
EJEMPLO 8.4 . T ransformemos las puntuaciones tpicas del ejemplo 8.1 me-
: = (0,5) + (- 0,5 ) + (-1,5) + (0) + (1,5) = Q= O diante Y, = 10::, + 20 y comprohcmos cmo la media y la desviacin tpica de
5 5 Jas nuevas puntuaciones Y, valen, respectivamente, f = 20. = 1O. s,.
b) La varianza (y la desviacin tpica) d e las puntuaciones tpicas vale uno.
>' 1 = (1 0)(0,5) + 20 = 25 Y2 = ( 10)(-0.5) + 20 = 15
En efecto,
Y.i = (10)(-1 ,5) + 20 = 5 , Y4 = (10)(0) + 20 = 20
I _2 Y 5 = ( 10)(1, 5) + 20 = 35
s; = I (z, - .:)2 -2 I (x,/s,)2 I xf I I x; 1 2
- ~-'-- = ~ - = - - = - s
n n n (s;)(n) s; n s; '
y= 25 + 15 + 5 + 20 + 35 = l 00 = 20
De lo acabado de ver se deduce que I ::! = n . 5 5
Podamos, tambin, haber pensado as:
+ + + (20 - 20) 2 + (35 - 20) 2
s; (25 - 20)2 (15 - 20)' (5 - 20)2
5
-, = -l X, - ~-
Sx sx
500
100 1, = 10
Por consiguiente, segn 6.3.4.a, 5
,,_-:-- 20 20
Y1 = A~,+ B Y = -- X + (100 - - - 16) = 2X + 68
' 10 ' 10 '
Puntuaciones //picas / 139
138 / Estadistica para Psiclogos
= 2.000 = 400
5
S1. = 20
x~ t9 22
-J--.-
8.3. Significado de las puntuaciones directas, diferenciales
y tpicas En conclusin, el significado de las puntuaciones directas. consideradas en s
mismas, es prcticamente nulo. Admiten un cierto significado, consideradas en
Sabiendo que Pedro obtiene una puntuacin directa igual a 22 en una prueba relacin con la tendencia central (media). s te es an ms completo, consideradas
de memoria, nada podemos afirmar sobre su memoria. Es necesario conocer las en relacin con la tendencia central (media) y con la variabilidad (desviacin t-
puntuaciones obtenidas por las restantes personas del grupo al que pertenece pica). Es decir, las puntuaciones tpicas significan ms que las diferenciales y stas
Pedro. Este grupo puede ser reducido o amplio, puede constar de sus compaeros ms que las directas.
de clase, de los muchachos de su propia edad, de las personas de su nacin, de to- Pronto veremos que, muy frecuentemente, en Psicologa cada puntuacin tpica
dos los habitantes de la Tierra. Pero, pequeo o grande, es necesario un grupo de ser, adems, traducible en un porcentaje. Dada una puntuacin tpica, podremos
referencia para poder hacer la ms mnima afirmacin sobre la memoria de Pedro. calcular cuntas personas del grupo de referencia se encuentran po r debajo de ella.
Supongamos que, definido dicho grupo, la media de ste vale 19. La puntuacin As, m ediante las puntuaciones tpicas podemos obtener una interpretacin muy
diferencial de Pedro valdr 22 ~ 19 = 3. Por ser positiva comprobamos que Pe- razonable sobre la memoria de Pedro.
dro est encima de la media de su grupo. Si hubiera sido negativa, Pedro se habra
encontrado por debajo de la media . La puntuacin diferencial nos permite afirmar
algo sobre la memoria de Pedro, pero an esta interpretacin es bastante impreci- 8.4. Comparabilidad de las puntuaciones tpicas
sa. Superar la media en tres unidades, _es mucho o poco'? Depende de los casos.
Si nadie o casi nadie del grupo se aparta de la media tres o ms unidades, tres sig-
nifica mucho. Pero si bastantes la superan en ms de tres unidades, tres sign ifica En principio, dos puntuaciones directas (o diferenciales) r eferi das a dos carac-
mucho menos. Ahora bien, en general, en el primer caso la variabilidad del grupo tersticas distintas, no son comparables entre s. Si, por ejemplo, las dos caracters-
(y, en concreto, la desviacin tpica) ser pequea. Por el contrario, en el segundo ticas son p eso y altura, 70 kg ni son ms ni son menos que 180 cm. Son dos cosas
se:; grande. Por consiguiente, la in terpretacin de una misma puntuaci n diferencial distintas y, por tanto, no comparables. Por el contrario, dos pun tuaciones tpicas
-sr distinta segn sea una u otra la variabilidad del grupo y, en concreto, la des- son siempre comparables, al ser nmeros abstractos; es decir, al no venir expresadas
en ninguna unid ad concreta de medida.
viacin tpica.
140 / Estadistica para Psiclogos Puntuaciones tpicas / 141
Ms aun. En el caso de una sola caracterstica, seran ya comparables dos pun- Pero, A I dejar por debajo de s el 70 por 100 de los casos y A 2 slo el 60 por 100.
tuaciones directas y diferenciales, pues ambas vendran expresadas en una misma Es decir, a iguales puntuaciones tpicas (y directas) corresponden distintos por-
unidad de medida. Sin embargo, aun en este caso, las puntuaciones tpicas son centajes.
ms comparables entre s que las directas y diferenciales. Supongamos que dos es-
tudiantes, M y N, pertenecientes a dos grupos distintos realizan una misma prueba.
Es claro que las puntuaciones tpicas del primer grupo y las del segundo tienen una
misma media (igual a cero) y una misma desviacin tpica (igual a uno ). Por esta ra-
zn, las puntuaciones tpicas de M y N, referidas a una misma media y a una misma
desviacin tpica, son ms comparables entre s que sus puntuaciones directas,
referidas probablemente a distintas medias y a distintas desviaciones tpicas, y
que sus puntuaciones diferenciales, referidas probablemente a distintas desviaciones
tpicas. Por consiguiente, en general, dos puntuaciones tpicas admiten una com-
parabilidad mayor que las directas y diferenciales.
Con todo, esta mayor comparabilidad no implica que dos o ms personas,
40 30 20 20 30 40
pertenecientes a dos o ms grupos distintos, sean iguales bajo cualquier aspecto
por el mero hecho de haber obtenido las mismas puntuaciones tpicas. Vamos a 4 5
2 2
limitarnos a un par de casos elementales.
a) Dos grupos distintos realizan una misma prueba y obtienen la misma me-
dia y la misma desviacin tpica. Pues bien, si dos personas, una del primero y otra A su vez, A 1 con z , = 0,5, y ,4 2 con ::1 = 0,75, obtendrn puntuaciones d irectas
del segundo, obtienen la misma puntuacin tpica, obtendrn la misma puntuacin distintas X, = 3 + (1)(0,5) = 3,5, X 2 = 3 + (l )(0,75) = 3,75, pero dejarn por
directa (es decir, dentro de lo posible, manifestarn en el mismo grado la caracte- debajo de s el 70 por 100 en ambos casos. Es decir, a iguales porcentajes corresponden
rstica de que se trata), pero no dejarn necesariamente por debajo de si el mismo puntuaciones tpicas (y directas) distintas.
porcentaje. Recprocamente, si dos personas, una de cada grupo, dejan por debajo b) Dos grupos distintos realizan una misma prueba y alcanzan diversa media
de si el mismo porcentaje, no obtendrn necesariamente la misma puntuacin y/o diversa desviacin tpica. Pues bien , si dos personas, una del grupo primero
directa (es .decir, no manifestarn la caracterstica en el mismo grado) ni, en conse- y otra del segundo, obtienen Ja misma puntuacin tpica, obtendrn, en general,
cuencia, obtendrn necesariamente la misma puntuacin tpica. Consideremos, distintas pun tuaciones directas (es decir, manifestarn la caracterstica en distinto
por ejemplo, los dos grupos siguientes que, realizando una misma prueba , X, al- grado) y dejarn por debajo de s distintos porcentajes. Si dos personas, una del
canzan la misma media y la misma desviacin tpica, pero tales que el primero primer grupo y otra del segundo, obtienen la misma puntuacin directa, (mani-
muestra una clara asimetra positiva y el segundo una clara asimetra negativa. fiestan la caracterstica en el mismo grado), obtendrn, en general, distintas pun-
tuaciones tpicas y dejarn por debajo de s distintos porcentajes. Consideremos,
por ejemplo, los dos grupos siguientes que, realizando una misma prueba, X, al-
Grupo 1.0 Grupo 2. 0
4 4 6 8 IO
2
8.6. Combinacin de puntuaciones
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0), con la misma puntuacin
tpica 0,5, obtendrn distintas puntuaciones directas: X 1 = 3 + (1 )(0,5) = 3,5,
x2 = 8 + (2)(0,5) = 9 y dejarn por debajo de s distintos porcen tajes : 70 por 100 Para combinar en una sola pun tuacin to ta l, las pun tuaciones de varias pruebas,
y 60 por 100 respectivamente. Es decir, a iguales puntuaciones tpica s correspon- conviene operar con puntuacion es tpicas. Es decir, reducir las unidades de las
den distintas puntuaciones directas y distintos porcentajes. distintas pruebas a una un idad comn. Esto es conveniente aun en el caso e n que
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) con la misma puntuacin las pruebas sean muy semejan tes (por ejemplo, varias notas de una m isma asig-
45 3 nat ura com binad as para d ar la nota fin a l de curso) ya que superar la media en un a
directa 4, 5 , o b ten d ran
. d'1stmtas
. .
puntuac10nes ' .
t1p1cas: z 1 = -, --- = 1,5 , z 2 =
1 mism a distan cia significa ms cuando la desviacin tpica es pequea que cuando
es grande. D e aqui la necesidad de operar con puntuaciones tpicas, de tener en
= 4 ,5 - 8 = - 1,75 y dejarn por debajo de s distintos porcentajes: 90 po r l 00 cuenta la d esviacin tpica de cada prueba.
2
y 7,5 por 100 respectivamente. Es decir, a iguales puntuaciones directas corresponden EJEMPLO 8.6. Sean tres prueba s I, 11, Jll y dos al umnos A y B. Sean X 1 = 45,
s1 = 2; %11 = 60, s 11 = 4 ; %111 = 60, sm = 6. Sean fi na lmente las puntuaciones
distintas puntuaciones tpicas y distintos porcentajes.
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) que dejan por debajo d e siguientes las obtenidas p or A y B en las tres prue bas :
s el mismo porcentaje (30 por 100), obtendrn distintas puntuaciones directas:
5 X 7 d' . . . . 2,25 - 3 7
X 1 = 2.2 , 2 = , y 1stmtas puntuaciones t1p1cas: z 1 = = - O, 5.
DIRECTAS DIFER ENCIAi. ES TIPICAS
1
z = -7 -- -8 = - 05 , . Es d ec1r,
. a 1gua
. 1es porcentajes,
. correspon d en d1stmtas
.. pun- JI JII TOTA L IJ IJl TOTAL 11 111 TOTAL
2
2
tuacioncs directas y distintas puntuaciones tpicas. A406466 170 - 5 4 6 5 - 2,5 -0.5
B 50 56 54 160 5 - 4 - 6 -5 2,5 - l - 1 0,5
8.5. Nota
El al umno A tiene una puntuacin total (a partir de las d irectas y diferenciales)
Acabamos de considerar dos criterios indicadores de la posicin relativa de un a mayor q ue B. Sin embargo, el a lumno B tiene una puntuacin total (a parti r de las
persona respecto a un grupo de referencia: a ) Posicin relativa como dista ncia de esa tpicas) m ayor que A . El alumno B est por encima de la media en una sola p rueba,
persona a la media del grupo (medida en unidades tpicas) ; b ) Posicin relativa pero d onde la variabilidad es muy pequea . En cambio, el alumno A est por encima
como porcentaje de personas del grupo que deja por debajo de s esa persona. He- de la media en dos pruebas, pero donde la variabilidad es muy grande. En co njunto,
mos visto que dos personas, pertenecientes a dos grupos distintos, cuya posicin rela- el a lumno B debera ser p referid o al A , pues su pun tuacin tpica total es mayor
tiva es"itlntica segn uno de los dos criterios, no lo es necesa riamen te segn el otro
que la de A .
Sin ~mbargo, si las distribuciones de frec uencias de ambos grupos son t!ua lc,.
144 / Estadistica para Psiclogos
Puntuaciones tpicas / 145
8.7. Desviacin tpica y puntuaciones tpicas 8.8.2. Curva normal
Desviacin tpica y puntuacin tpica son conceptos distintos. La primera De ella trataremos ampliamente en el tomo 2 (Estadstica Inferencia!). Sin
es propia del grupo. La segunda es propia de cada persona. En un grupo den personas, embargo, vamos a ofrecer ahora una idea sucinta sobre la misma. Suponemos
tenemos n puntuaciones tpicas (algunas de las c uales pueden ser iguales entre s) que operamos con proporciones. Ello significa que vale la unidad el rea limitada
y una sola desviacin tpica. Sin embargo, es equivalente decir que un a persona por el histograma o (en el lmite) por la curva F y el eje de abscisas. Bajo esta con-
obtiene una puntuacin tpica igual a dos o que supera a la m edia en dos desviacio- dicin, la cur va normal es la representacin grfica de la siguiente funcin :
nes tpicas. Por ejemplo, suponiendo X = 60, sx = 3, una persona con puntuacin
directa X, = 66, tendr como puntuacin tpica : 1 -2 1(~)2
6
y = -- e
.j2na
z = 66-60 =~=o2
1
3 3 == media de la poblacin, a= desviacin tpica de la poblacin, e= base de los
logaritmos neperianos: 2,718281828 . .. , n = relacin de la circunferencia a su
Esto equivale a decir que su distancia de la media (66 - 60 "' 6 unidades) dimetro: 3, 141592 . . .
contiene dos veces la desviacin tpica : 3, ( } "' 2), o, a decir que supera la media
Para cada par de valores de y de a tendremos una curva normal distin ta . Es
decir, tenemos una familia de curvas. Pero todas ellas coincid en en algunas carac-
en dos desviaciones tpicas. tersticas (vase la figura adjun ta ):
Suele ser til operar con p untuaciones tpicas. En este caso la ecuacin de la
curva normal viene dada por
1 _ !,!
-~ .v= fo
- -e 2
146 / Estadistica para Ps,clogos
Puntuaciones lip,cas / 147
y su representacin grfica es la siguiente:
8.8.4 . Uso de la tabla de las reas bajo la curva normal
z
=n = -23 4 :,_cJ = _ 1,75
:--
-3 -2 -1 o 2
8.8 .3. Relacin entre las reas bajo la curva normal y proporciones
o probabilidades
z,
T ransformemos esa puntuacin directa en tpica: EJEMPt.O 8.1 l. ,Qu puntuacin directa d eja por encima de s el 61 por 100
de las observaciones, va liendo 40 la med ia y 6 la desviacin tpica'>
48 = 1,2 Dejar por encima de s el 61 por 100 de las observaciones equivale a deja r por
:54 = 54-5-- debajo de s el 39 por 100 de las mismas. En la tabla, el porcentaje ms prximo a l
39 por 100 es el 38,97 por 100 y a este porcen taje le corresponde la p untuacin
En la tabla, a z = 1,2 le corresponde un porcentaje igual a 88,49. Por tanto, tpica :: = - 0,28 . Por tan to,
por encima de la puntuacin tpica z = 1,2 (es decir, de la directa X = 54 ) queda
el (100 - 88,49) por 100 = 11,51 por 100 de las observaciones. - 0,28 = X - 40 X = (6)( - 0,28) + 40 = 40 - 1,68 = 38,32
EJEMPt.O 8.9. _Qu porcentaje de observaciones queda po r encima d e la pun. 6
tuacin directa X = 9 y, simultneamente, por d ebajo de la puntuacin direcia,
X = 3 1, valiendo 25 la media y 8 la desviacin tpica ? EJEMPLO 8. 12. Calculemos d os puntuaciones directas, X 1 y X 2 , ta les que la pri-
mera deje por debajo de s un 10 por 100 de las observaciones y la segunda deje por
encima de s o tro 1O p or 100 de los casos, valiendo 40 la media y 7 la desvia cin
tpica.
En la tabla, el porcentaje ms prximo a l 10 por 100 es el 10,03 p or 100 y a este
porcen taje le corresponde la puntuacin tpica z = - 1,28. Po r otra parte, dejar
~
por encima el 10 por 100 eq uivale a dejar por debajo el 90 por 100. En la tabla el
porcentaje m s prximo al 90 por 100 es el 89,97 por 100 y a este porcentaje le corres-
ponde la puntuacin tp ica ;; = 1,28. Por tanto,
1, 28 = !-2 -7 40
-- X2 = (7)(1,28 ) + 40 = 40 + 8,96 = 48 ,96
Z9 = 9 - 2~
-8
=_2 Z 31 = ~831 - 25 = 0,75
Las p un tuaciones tpicas ofrecen un doble inconveniente . En primer lugar,
unas son positivas y otras negativas (circunstan cia que puede ocasionar errores
En la ta bla, a :: = - 2 le corresponde un porcentaje igual a 2,28 y a ;: = O, 75
en los clculos). En segundo lugar , casi todas las o bser vaciones suelen quedar
un porcentaje igual a 77,34. Por tanto, por encima de la puntuacin tpica z = - 2 contenidas dentro de tres d esviaciones tpicas a la derecha de la media (igual a cero)
(es d ecir, de la directa X = 9) y, simultneamente, por debajo de la puntuacin y otras tres desviaciones tpicas a la izquierd a de la misma. Es decir , slo tendremos
tpica :: = O, 75 (es deci r, de la puntuacin directa X = 31) queda el (77,34 - 7 puntuaciones enteras posibles ( - 3, -2, - l , O, 1, 2, 3); tod as las dems sern
- 2,28) por 100 = 75,06 por 100 de las observacio nes. decimales (con los consiguientes inconvenientes para el clculo).
EJEMPLO 8. 10. ,Qu puntuacin directa deja por debajo de s e l 64 por 100 Para evitar los d ecimales (o, al menos, bastantes de ellos) multiplicamos las pun-
de las observaciones, valiendo 30 la media y 5 la desviacin tpica? tuaciones tpicas por una constante apropiada. Para evitar los valores negativos,
En la tabla , el porcentaje ms prximo al 64 por 100 es el 64,06 por 100 y a este sumamos a los productos o bten idos otra constante adecuada. En par ticula r, suelen
porcentaje le corresponde la puntuacin tpica z = 0,36. Por tanto: ser usadas, respectivam ente, 10 y 50. En otras ocasiones, 100 y 500 u otras cons-
tantes que nos sirvan para conseguir el fin pretendido.
,.. 0,36 =! - 30 X = (5)(0,36) + 30 = 1,8 + 30 = 31,8 Dentro de este contexto, llamaremos puntuaciones Ta las obtenidas mediante
- 5 la constante multiplicadora 10 y la constante aditiva 50, pero tras previa norma-
150 / Estadistica para Psiclogos Puntuaciones tipicas / 151
lizacin de la distribucin de frecuencias. Ello equivale a calcular las puntuaciones Cumu normal: representacin grfica de la siguiente funcin.
tpicas valindonos de la tabla de las reas bajo la curva normal y no mediante
la media y la desviacin tpica de las puntuaciones directas que nos son dadas.
Las puntuaciones tpicas as calculadas son las que se multiplican por l O y se les y = -_!_
:;:- (' _!2 (1_::_J'
)
'
(en punt uaciones directas)
aade la constan te 50. ,J.L1!
EJEMPLO 8.13. Calculemos las puntuaciones T a partir de la siguiente distri-
1 ,,
bucin de frecuencias: .V= - - e- -2 (en puntuaciones tpicas)
fo
+ 50
X; n, Free. ac. (pm) Porc. ac. (pm) zl (10)(: ; ) ()O)(z,)
Free. ac. (pm): frecuencia acumulada hasta el punto medio. Es decir, hasta la mi- 8.2. Suponiendo X = 20 y s, = 4, q u puntuaciones diferenciales y directas
tad del intervalo (3-5) habr .13. = 6 observaciones. Hasta la mitad correspondern a las siguientes puntuaciones tpicas?
2
a ) z,=2 ; b ) Zx= 1,5 ; e) Zx = - 1 ; d) :, = - 0.25 ; e) Zx=0 ,9
del intervalo (6-8) habr 12 + ?~2 = 23. Etc.
8.3. Supongamos que X 1 , X 2 , , X" son ciertas puntuaciones directas y que
Porc. ac. (pm) : porcentaje acumulado hasta el punto medio . Basta con dividir x 1 , x 2 , , x" son sus correspondientes puntuaciones diferenciales. Esto supuesto,
cada frecuencia acumulada hasta el punto medio por 80 y mul- demostrar que 1: X,y, = L x,Y,
tiplicar este cociente por 1OO.
8.4. Calcular el coeficiente de variacin de X, sabiendo que
Z/ puntuacin tpica normalizada. Es decir, -1 ,44 es la puntuacin
tpica que, supuesta una distribucin normal, deja por de bajo Zx , = z>., z~i = ZJ'2' Z.x 1 = Zy~ que Sy = 4~
de s el 7,5 por 100 de las observaciones. Etc.
que el coeficiente de variacin de Y va le 20 y teniendo en cuenta el cuadro adj un to .
X, Y,
8.10. Resumen: Definiciones y frmulas
18
6 22
Puniuacin directa; la atribuida directamente a cada elemento de un grup o. 1 26
8.6. Transformar las puntuaciones 9, 5, 7, 1, 13 en otras cuya media valga 50 y d) Mayores que 33. e) M a yores que 22 y menores que 28. j ) Mayores que 32
cuya desviacin tipica valga 12. y menores q ue 35. g ) Mayores q ue 28 y m enores que 34.
8.7. Sean X 1 , X2 , . . , X., n puntuaciones con media X = 10. Consideremos la s 8.14. Suponiendo que X = 50, s, = 8 y n = 500 y que la distribucin de frecuen-
puntuaciones 3X1 , 3X2 , . , 3X. cuya desviacin tpica nos es dada y va le 6. cias es normal, ca lcular la puntuacin directa que deja po r d ebaj o o por encima
Esto supuesto, calcular la varianza de las 2n puntuaciones X 1 X 2 . . , X., 3X 1 , de s los siguientes p orcentajes o nmero d e observaciones. a) Q ue deja por debaj o
3Xi, . . . , 3X . el 11 p or 100. b) Q ue deja por de bajo 220 observacion es. e) Q ue deja por encim a
el 48 por I OO. d) Que deja por encima 320 observaciones. e) D os pun tuaciones
8.8. Transformar las puntuaciones X , = 7, Xi = 5, X 3 = 3, X4 = 6, X 5 = 9 en (equidistantes de la media, a uno y otro lado de la misma ) q ue dejan entre ambas
otras puntuaciones Y tales que Y = 2X - 5, s, = 2sx. el 54 p or 100. f) D os pu ntuaciones (equidistan tes de la media) que dejan entre
ambas l 00 observa cion es.
8.9. Ponga las puntuaciones que fa ltan en el cuadro siguiente, sabiendo que
Zx, = z,,, , Zx , = z,.,, . . . , Zx , = z,.,, que Sx = 2 Y que los coeficien tes de va ria - 8.15. Calcular la media de un grupo de pe rsonas, suponiendo que la distribucin
cin de X y de Y valen 20 y 50, respectivamente . de frec uencia s es no rmal y sabien do que la desviacin tpica vale 10 y que el 4 0 por
100 obtiene punt uaciones menores q ue 28.
a) X, n; h) X 11,
~ -
35 5 26 - 28 4
8.24. Hemos aplicado una prueba de memoria a 5.000 varones y a 2.000 mujeres
33 6 23 - 25 8
separadamente. Son normales tanto la distribucin de los varones como la de las 7 20 - 22 10
31
mujeres. Del total de los varones, l.148 superan la media de las mujeres. Adems, 29 12 17 - 19 14
134 mujeres han obtenido puntuaciones superiores a 70. Suponiendo que la me- 27 16 14 - 16 12
dia y la desviacin tpica de los varones valen 54,3 y 5 respectivamente, calcular 25 4 11 - 13 2
la media y la desviacin tpica de las mujeres.
8.25. Un grupo de personas se distribuye normalmente en la va riable X. Para
estas personas el percentil 6 I vale 44 y la desviacin tpica vale 5. Calcular la media
y la desviacin tpica de unas nuevas puntuaciones Y relacionadas con las prime-
ras mediante 4X - 2 Y - 20,4 = O.
8.26. De un grupo de 600 personas, distribuidas normalmen te, 114 obtienen una
puntuacin directa menor que 20. Sabiendo que la varianza vale 16, calcular la
moda de dicha distribucin y el nmero de personas con puntuaciones mayores que
24 y menores
,,.. . que 28.
8.27. '. Las puntuaciones de un grupo de 500 ni os en inteligencia espacial, X, y en
--
-- --- ---- ... ------~--
\.
9
Organizacin de datos e ndices
de tendencia central y variabilidad
Hasta aqu hemos considerado una sola variable. Ahora vamos a estudiar con-
juntamente dos variables. Por ejemplo, peso y altura de un grupo de estudian tes,
aptitud para una asignatura y aprovechamiento en la misma, provincia de origen
y carrera estudiada, etc. Con cada persona tenemos dos modalidades, una perte-
neciente a la primera variable y otra a la segunda.
D esde luego, podamos ir estudiando por separado cada uno de los casos po-
sibles: ambas variables nominales, ambas o rdinales, .. . ; una nominal y otra
ordinal, una nominal y otra de intervalos, etc. Sin embargo, no seguiremos es1e
camino por una doble razn . En primer lugar, sera enormemente prolijo irnos
~ I
deteniendo en cada uno de los casos posibles, dado su gran nmero. En segundo
lugar, ello nos llevara a repeticiones superfl uas ya que lo dicho para uno de los casos,
vale p rcticamen te para los resta ntes, salvo diferencias accidentales fci lmen te
comprensibles. Consiguientemente, nos limitaremos por ahora a exponer la distri-
bucin conjunta de frecuencias respecto al caso en que las variables sean estric ta-
mente cuantitativas (es decir, a nivel, al menos, de in tervalos), por ser el ms comn
en Psicologa.
EJEMPW 9.1. Supongamos que 50 personas han obtenido, segn podem os
ver en la tabla de la pgina siguiente, los siguientes resultados en un test de inte-
ligencia abstracta (X) y en una prueba de aritmtica ( Y).
Podemos considerar estas pu ntuaciones tal com o vienen dadas, es decir, no
agrupadas en intervalos ni en X ni en Y. Cada persona aparece con el par de pun-
tuaciones que ha obtenido directamen te en el tesl y en el examen . Pero, tambin,
podemos considerarlas agrupadas en intervalos. Para ello, est udian do por separado
cada una de las dos variahles, agrupa mos sus puntuaciones en intervalos, siguiendo
los criterios ya expuestos para agrupar datos en el caso de una sola variable. El n-
mero de intervalos en cada una de las dos variables puede ser el mism o o distinto.
-.,.~ La amplitud de los in tervalos en una de las dos variables puede ser la misma o dis-
tinta que la a mplitud de los intervalos en la otra. Elijamos p ara X !os intervalos :
160 / Estadistica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 161
- - -- - - - - - -y
X y X y X y X X )'
--
10 51
--
8 51
-13 -51 12- -56 -JO -52
12 51 10 53 19 55 18 55 14 53 5
10 54 9 53 12 53 17 56 16 56
5.
20 56 15 54 11 52 16 57 14 55
13 54 14 56 17 54 18 58 21 57 5
21 58 18 57 16 54 13 53 17 53 5'
13 52 JI 54 10 50 9 51 17 55
5
20 57 9 so 12 55 16 55 15 56
18 56 19 54 20 58 15 53 17 57
19 57 14 52 14 54 15 55 8 52
7- 10, 11 -14, 15-18, 19-22 (con puntos medios 8,5 ; 12,5 ; 16,5 y 20,5, respectivamente) tro ejemplo tendremos 50 puntos. Este conjunto o nube de puntos constituye el
y elijamos para Y los intervalos: 50-52, 53-55, 56-58 (con puntos medios 51, 54 y diagrama de dispersin.
57, respectivamente). Tendremos: Otra manera de representar grficamente los datos no agrupados sera la siguiente.
A cada valor X, le corresponde un intervalo unitario y a cada valor Y otro intervalo
TABLA 9.1 unitario. Es decir, a cada par de puntuaciones ( X ,, Y,) les corresponder un rec-
..
X X
..
tngulo unitario limitado por los intervalos unitarios. Pues bien. sobre cada rectn-
7-10 11- 14 15- 18 19-22 7-10 11 -14 15-18 19-22 gulo unitario podemos levantar un prisma con una altura proporcional al nmero
de personas cuyo par de puntuaciones coincide con el par correspondiente a ese
56-58 // fllJ /// fl{j/ 56-58 o 2 8 6 16
rectngulo unitario. Ntese que la unidad elegida en el eje de las X no tiene por qu
y 22
ser igual que la elegida en el eje de las Y. Si fue ra igual, el rectngulo unitario se
y 53-55 /!/ fllJ /// fllJ /!// /! 53-55 3 8 9 2
convertira en un cuadrado.
50-52 7 5 o o 12 Consideremos ahora los datos agrupados en intervalos. La representacin
50-52 fllJ // fllJ
grfica correspondiente al histograma (propuesto para el caso de una sola variable),
10 15 17 8 50 es la siguiente. El plano quedar dividido en (r) x (s) rectngulos, d onde res el n -
mero de intervalos en X y s el de intervalos en Y. La base de esos rectngulos ser
la amplitud de los intervalos de X . y su altura la amplitud de los intervalos de Y.
En general, tendremos r intervalos en X, y s in tervalos en Y. Llamemos (], , !') Pues bien, sobre cada uno de esos rectngulos (inciden talmente cuadrados) levan-
al par de intervalos i de X y j de Y. A cada (/, , // ) le corresponder una frecuen- tamos un prisma cuya altura sea proporcional a la frecuencia correspondiente a
cia n;; (nmero de o bservaciones con puntuaciones dentro del intervalo i de X y dicho rectngulo. Es decir, dados el intervalo con punto medio X , y el intervalo
dentro del intervalo j de Y). Pues bien, llamaremos distribucin conjunta de fre - con punto medio Y1, la altura ser proporcional a la frecuenc ia de personas que,
cuencias al conjunto de pares de intervalos (11, Ji') y de sus correspondientes fr ecuen- a la vez, se encuentran dentro del intervalo primero y del segundo. En nuestro ejemplo
cias {proporciones o porcentajes). (vase tabla 9.1) tendramos nueve prismas con alturas proporcionales a 2, 8, 6, 3, 8,
9, 2, 7, 5. (En rigor, tendramos doce p rismas, aunque tres de ellos con altura nula.)
50 TABLA 9.3
De acuerdo con los datos de las tablas 92a y 9.2b, tendremos : Para X = 8,5 = = 16,5
Para X 12,5 Para X Para X = 20,5
x= (10)(8,5) + (15)(12,5) + (17)(16,5) + (8)(20,5) = 717 =
14 34 y n1 Y; y n1
y
j
y n1 Y y n, Y,
50 50 ' - -- - - - - ~-- - - - - - -- - -~
56-58 o 57 56-58 2 57
s; = (10)(8,5)2 + (15)(12,5)2 + (17)(16,5) 2 + (8)(20,5) 2 _ , ) =
0 4 34 2 53. 55 3 54 53-55 8 54
56-58
53-55
8
9
57
54
56-58
53-55
6
2
57
54
50 50-52 7 51 50-52 5 51 50-52 o 51 50-52 o 51
056 5
-
10
-
= 21- 50
- - 205 636 = 15 494
' '
15 17 8
De acuerdo con la tabla 9.3, las tres medias y las tres varianzas condicionales 1 -
(5)(51)2 + (8)(54)2 + (2)(57)2 -(53,40)2 =
Sy,X=l2,S -
S-On las siguientes: 15
42 83 1
Xr =si = (7)(8,5) + (5)(12,5) + (0)(16,5) + (0)(20,5) 122
10, 167
_
-
-
15
_ 2.85 l ,56 = 3,84
12 12
2
x_ = 14318 (0)(5 l ) + (9 )(54 J2 + (8 )( 57 J2 _ (55,4 1J 8)2 =
r- 54
= (3)(8,5) + (8)02,5) + (9)(16,5) + (2)(20,5) = 315
22 22 ,
s;. x~ 16,5
17
s2 = (7)(8,5)2 2 2 2
+ (5)(12,5 ) + (0)(16,5) + (0)(20,5) _ (IO )2 = 2 - (0)(51 )2 + (2)(54)2 + (6){57)2 -(56,25)2 =
Sy, X=l0 . 5 - ~
X, Y=5 1 12 , 167
25 26
87 = : - 3.164,06 = 1,69
= 1.2 - 103 37 = 3 88
12 ' '
Comprobemos ahora cmo la varianza m argin al de X es igual a la media de
s;, r~s 4
2 2
(3)(8,5) + (8)(12,5) + (9)(16,5)
2
+ (2)(20,5) 2 - ( 14 318)2 = las varianzas condicionales de X ms la varianza de las medias condicionales de X y
22 ' cmo la varianza marginal de Y es igual a la media de las varianzas condicionales de Y
ms la varianza de las medias condicionales de Y. Ntese que estas dos relaciones
= 4 -757 ,5 - 205 00 = l l 250 no son m s que una aplicacin de la propiedad 6.3.4.i) de la varianza, donde los
22 ' ' r grupos en que alh se descomponia el grupo to ta l son ahora, bien las distribu-
ciones condicionales de X, bien las distribuciones condicionales de Y .
2 -
Sx,Y - 51
= 2 2 2
(0)(8,5) 2 + (2)(12,5) + (8)(16,5) + (6)(20,5) - (17 500)2
,
= Hemos visto que la var ianza marginal d e X, s;,
vala 15,494. Pues bien :
16
2 ( 16)(17,5 )2
012 -(12)(3,88)
- -+-(22)(1
- --1,25) + d6)(7)
- ~ + -(12)(10,
-- 167)2 + (22)(14,318) +
- -- - - - - - -
= 5 16 - 306 25
'
=7 50 50
mien to abstracto y en ella les eran presentadas a los estudiantes distintas sucesiones Distribuciones condicionales de X.
de figuras planas, pidindoles que averiguaran en cada sucesin cul era la ley de
transformacin de unas figuras en otras.
Para Y= 12 Para Y = 21 Para Y = 30 Para Y = 39
-
X y X y X y X y X n, x, X n, X X n, x, X ,,, X
- - -- - - -- ---
7 22 14 31 9 27 11 29 )5-20 o 17,5 15-20 2 17,5 15-20 6 17,5 15-20 4 17,5
5 8 6 21 15 35 8 JU 9-14 1 11.5 9-14 I 11 ,5 9- 14 13 11 ,5 9-14 3 11,5
9 9 17 32 13 31 3 9 3-8 5 5.5 3-8 5 5,5 3-8 o 5,5 3-8 o 5,5
9 31 4 11 16 34 10 27 - --
13 30 8 12 16 31 14 36 6 8 19 7
16 35 11 37 16 35 18 22
12 29 12 36 19 37 18 33
12 31 14 34 6 17 16 34 Xr - 12 = 6,50 XY 21 = 9,25 Xr . ' = 13,3947 X,=, = 14 ,9286
20 25 13 20 16 29 14
10
29
26
s;,r "" 12 = 5.00 s;, Y ll = 26,44 s;, Y JO = 7,78 s;, Y 39 = 8,82
10 30 3 23 5 25
-- --
Elijamos para X los intervalos (3-8), (9-14), (15-20) y para Y los intervalos Distribuciones condicionales de Y.
(8- 16), (17-25), (26-34), (35-43).
Tendremos la tabla siguiente:
Para X = 5,5 Para X= 11.5 Para X = 17,5
X
y 11 Y, y 11 Y, y n, y
J
3-8 9- 14 15-20 - -- -- -
35-43 o 39 35-43 3 39 35-43 4 39
35-43 o 3 4 7 26-34 o 30 26-34 13 30 26-34 6 30
17- 25 5 21 17-25 l 21 17-25 2 21
26-34 o 13 6 19 8-16 5 12 8-16 l 12 8- 16 o 12
y - - - - - -- - -
17-25 5 l 2 8 10 18 12
8-16 5 I o 6
l\.,., = 16,50 yX= l 1, 5 = 30 >'x =n,, = 31 ,5
10 18 12 40 s;.hs., = 20,25 s;. X = ll ,5 = 36 s;,x. 11., = 38,25
Distribuciones marginales de X y de Y
Comprobemos cmo la varianza marginal de X es igual a la media de las va rian-
y zas condicionales de X ms la varianza de las medias condicionales de X y cmo
a) de X: X ", x, h) de Y: ", y
J la varianza marginal de Y es igual a la media de las var ianzas condicionales de Y
ms la varianza de las medias condicionales de Y.
15-20 12 17,5 35-43 7 39
9-14 18 11 ,5 26-34 19 30 Hemos visto que la varianza marginal de X, vala 19, 71. Pues bien: s;,
3-8 JO 5,5 17-25 8 21
8- 16 6 12 (6)(5) + (8)(26,44) + (19)(7,78) + (7)(8,82)
40 40 +
40
2 2 2
,.f' (6)(6,5)2 + (8)(9,25 ) + (19)(13,3947) + (7)(14,9286} - (] 1 80 )2 = 19 7 1
x= 11,80 s; = 19,7 1 Y = 27,075 s; = 70,42 + 40 ' '
168 / Estadistica para Psiclogos Orga nizacin de datos e in dices de tendenci a central y var iabili dad / 169
Hemos visto que la varianza marginal de Y, s;, vala 70,42. Pues bien: x, Y, X,Y, x, - i Y,- y {X, - X)(Y, - Y)
2
(10)(20,25) + (18)(36) + (12)(38,25) (10)(16,5)2 + (18)(30) + ( 12)(31,5)
2
11 7 77 0,53 -5,24 - 2,7772
40 + 40 - 26 23 598 15,53 10,76 167,1028
9 12 108 - 1,47 -0,24 0,3528
- (27,075) 2 = 70,42 3 14 42 -7,47 1,76 - 13,1472 178
13 10 130 2,53 - 2,24 -5,6672 x= 17
= 10 47
'
5 10 50 -5,47 - 2,24 12,2528
18 16 288 7,53 3,76 28,3128 208
15 12 180 4,53 -0,24 -1 ,0872 Y= = 12 24
17 '
9 .5. Covarianza de X e Y 13 14 182 2,53 1,76 4,4528
12 15 180 1,53 2 ,76 4,2228 348,1 176
12 15 180 1,53 2 ,76 4,2228 s,, = - 1- 7 - = 20,4775
9.5.1. Definicin o 3 o -1 0,47 -9,24 96,7428
9 12 108 - 1,47 - 0,24 0,3528 2.526 178 208
Media aritmtica de los productos entre la diferencia (X, - X ) y la diferencia 13
9
14
14
182
126
2,53
- 1,47
1,76
1,76
4 ,4528
-2,5872
= u - 1111
( Y, - Y) correspondientes a cada uno de los n elementos que componen un grupo. 7 11 77 - 3,47 -1,24 4 ,3028 = 20,4775
La designaremos por cov(X, Y) o por sxr Por tanto, 3 6 18 -7,47 -6,24 46,6128
cov(X, Y)= s
X)' -
_ li (X, - X) (Y, - Y)
ll
tf
je 1 i=:. J
n (X. - X) ( Y, - Y)
2
4
4
10
9
10
20
36
40
- 3
-1
- 1
1
o
1
- 3
o
- 1
65
s,,. = 20 = 3,25
cov(X, Y) = sx,. n 2 7 14 -3 -2 6
965
8 13 104 3 4 12 = - (5)(9) =
' r
I 11,,X;Y, 4 5 20 -1 -4 4 20
_ gy 9 12 108 4 3 12
j = 11 a 1
(9.2) 4 11 44 -1 2 -2 = 4 8,25 - 45 = 3,25
n -2 - 1 2
3 8 24
8 10 80 3 1 3
La frmula (9. 1) es la apropiada para datos no agrupados en in tervalos y la 7 11 77 2 2 4
(9.2) es la apropiada para datos agrupados en intervalos. Se entiende que , es el 5 8 40 o - 1 o
nmero de intervalos en que ha sido clasificada la variable X, s el nmero de inter- 6 13 78 l 4 4
1 5 5 -4 -4 16
valos en que ha sido clasificada la variable Y y n,i es el nmero de observaciones 2 6 12 -3 - 3 9
dentro del intervalo i en la variable X y del intervalo j en la varia bl e Y. 8 9 72 3 o o
5 6 30 o - 3 o
5 ll 55 o 2 o
6 6 36 1 - 3 - 3
9.5.2. Clculo 7 10 70 2 1 2
Agrupemos en intervalos los datos anteriores del modo siguiente : En este caso podemos agrupar los da tos en intervalos de amplitud unidad del
modo siguiente:
X
X
1-3 4-6 7-9
2 3
o.o
42 32 77
-~ 9,80
= ac !: (X, - X) ( Y, - Y)
= (ac) s
x = 2,1 Y= 1,6
/1 X )'
172 / Estadistica para Psiclogos Organizacin de datos e indices de tend encia cen tral y var,abilidad / 173
~
TABLA 9.5 Y)+ r (Y - Y) (X,; - X) + Lr 11; (X - X) (Y; - Y)
]
X, Y,
-
X,Y, V, w, V1W
.
I I
.,
J :::: I
(X,; -
i== l
X) ( Y,; - Y)
. j =- 1
n1 (X, - X) (Y1 - Y)
' = 1 f:;;:. 1 + = 1
3 5 15 x = ~4 = 4 7 7 49 -
V=
36
= 9
4 n n
3 3 3 1 3
pues:
5 5 25 -
y = -
24
=6
11 7 77
W = ~ =IO
~, ;
7 11 77
4
15 25 375
4 L ( Xi} - X;)= L (}',; - Y)= o
i==-1 I= 1
16 24 120 36 40 504
para
j = 1, 2, . . . , r
120
s,, = 4 - (4)(6) =6 s,.,.., -_ 504
4 _ (9 )(10) = 36 Pero :
r
, - ) (Y - y) n(X1 - X) ( Y1 - Y)
Es decir :
L
i= l ( X,; - X ij J = COV;(X, Y) y =1
11 n
s,.~ = 36 = (2)(3)(6) = (2 )(3) s,, = cov(X;, 1\ )
X3 Y, X3Y3 X y XY
o 2 o 2 4 , , - - - y - Y)
2 o o o 2
8
o ni cov,(X, Y) -~i n(X X) ( , _ 220 + 13 = 233 = cov(X, Y)
3 4 12 4 4 16
1
n + - n - 48 48 48
5 6 30 6 IO 60
5 8 40 o 2 o
1 2 2 NOTA
15 20 82 5 5 25
X3 =3 >\ = 4 o 2 o Si X = Y1 , X 2 = Y2 , , x. = Y., las covarianzas se convertiran en varan
1
2 o o zas y la propiedad acabada de demostrar para las covarianzas quedara traducida
3 4 12 as: la varianza del grupo total es igual a la media de las varianzas ms la varianza
5 6 30 de las medias, propiedad de las varianzas que ya conocam os (vase 6.3.4.i).
5 8 40
33 49 193
49
X =~ Y=- 9.6. Resumen: Definiciones y frmulas
12 12
9.1. A partir de los datos siguientes. construir una tabla de frecuencias tal que en la
variable X existan tres intervalos de amplitud 4 y en la variable Y existan dos inter-
valos de amplitud 5. Dibujar el correspondiente diagrama de dispersin . n "
9.6. Demostrar que (X, - X)(}, - f) = X,Y, - nXY.
,~ 1 r: = l
~
X y X y X y X y 9.7. Demostrarque ' n,;(X,-X) ( Y; - Y)= ' ;_J.
n,; X , Y1 - nXY.
--- Je 1 i= l j~ 1 i= I
8 15 12 14 8 10 7 7 9.8. Sea un grupo compuesto de n 1 personas con medias X1 e l' en dos variables
12 11 6 12 4 10 2 8
X e Y.
13 13 4 8 3 7 10 14
Sea otro grupo compuesto de n2 personas con medias i 2 e f 2 en dos varia-
8 13 3 6 12 15 5 9
9 14 JI 12 3 7 5 bles X e Y.
Sean cov,(X, Y) y cov2 (X, Y) las covarianzas de X e Y para el grupo prime-
ro y para el grupo segundo.
Sea cov(X, }') la covarianza de X e r para el grupo to tal.
9.2. A partir de los datos anteriores (sin agrupar), calcular la covarianza de X e Y. Esto supuesto, demostrar que
9.3. A partir de los datos anteriores (agrupados segn 9.1), calcular:
cov(X, Y)= _ l _ _ [n 1 cov, (X, Y)+ n2 covz( X, Y) +111n2(l\ - X2 ) (Y1 - l\ )]
a) Las medias marginales de X y de Y. 11 1 + 11 2 n 1 + 11 2
b) Las medias condicionales de X y de Y.
e) Las varianzas marginales de X y de Y.
d) Las varianzas condicionales de X y de Y. 9.9. Comprobar la propiedad an terior con el ejemplo siguiente :
e) La covarianza de X e Y.
X
Grupo l.0 Grupo 2. 0 Grupo total
2 4 X y X y X y
9.4. A partir del cuadro siguiente, calcular:
--- - -- --- -
a) Las medias marginales de X y de Y. 8 36 44 80 2 l 8 6 2 l
b) Las medias condicionales de X y de Y. y 6 3 14 10 6 3
e) Las varianzas marginales de X y de Y. 5 4 16 20 JO 5 --- 10 5
d) Las varianzas condicionales de X y de Y. 8 6
e) 1.a covarianza de X e Y. 40 60 100 14 10
178 / Estadistica para Psiclogos
de dispersin correspondiente a X e Y estn situados aproximadamente a lo largo de van de O a 100. Supongamos ahora los dos cuadros siguientes, el primero bajo la
una lnea recta. Este ndice va a ser el coeficiente de correlacin de Pearson y que condicin a) y el segundo bajo la condicin h ). Ambos son equivalentes. Slo di-
designaremos por r,,. Histricamente, la regresin aparece antes que la correlacin fieren en la unidad de medida elegida.
y, desde luego, tiene sus ventajas definir r,i a partir de la regresin. Noso tros, sin
embargo, por razones didcticas, propondremos r,, antes de introducir las rectas
de regresin. Con todo, una vez introducidas dichas rectas, volveremos a redefi. y (X-X) (Y- Y) (X-X)(Y - Y) X r (X - X ) 1r - Y) (X - X )( Y - Y)
X
nir r,)', dentro del contexto de la regresin, para alcanzar una idea ms clara y ms
cabal del mismo. 8 9 1,5 2 3 80 90 15 20 300
6 5 -0,5 -2 1 60 50 -5 -20 100
7 8 0,5 1 0,5 70 80 5 10 50
5 6 - 1,5 -1 1,5 50 60 -1 5 - 10 150
10.2. Coeficiente de correlacin de Pearson
26 28 6 260 280 600
Segn lo indicado, la correlacin entre X e res positiva cuando X e Y cavaran Teniendo en cuenta el cuadro de la derecha, s,)' vale 100 veces ms que consi-
en el mismo sentido, es decir, cuando a estar por encima de la media en X correspon- derando el de la izquierda, por el mero hecho de haber elegido unidades de medida
de estar, tambin, por encima de la media en Y, y cuando a estar por debajo de la distintas.
media en X corresponde estar, tambin, por debajo de la media en Y. La corre- En segundo lugar, es algo discutible la interpretacin de los n meros 6 y 600,
lacin entre X e Y es negativa cuando covaran en sentido opuesto, es decir, cuando como suma que son de productos cuyo par de factores representan cosas de natura-
a estar por encima de la media en X corresponde estar por debajo de la media en leza distinta.
Y, y cuando a estar por debajo de la media en X corresponde estar por encima de Para evitar estas dificultades, una tctica obvia es dividir (X - X ) por s, e
la media en Y. La correlacin es nula cuando no cavaran en ninguno de los dos (Y - Y) por s)'" Segn sabemos, (X - X) y s, vienen dadas en una misma unidad
sentidos, es decir, cuando a estar por encima de la meda en X corresponde tanto de medida. Por tanto, el cociente (X - X )/s, es el mismo, sea cual sea la unidad de
estar por encima como por debajo de la media en Y, e, igualmente, cuando a estar medida elegida para medir la variable X. As, es fci l comprobar cmo en el cuadro
por debajo de la media en X corresponde tanto estar por encima como por debajo de la izquierda s, = 1,118 y cmo en el cuadro de la derecha s, = 11, 18. De donde
de la meda en Y. Por todo ello, la covarianza parece ser un ndice apropiado para se deduce que 1,5/ 1,118 = 15/ 11,18, -0,5/l,118 = -5/11,18, etc. De modo an-
medir la correlacin. En efecto, en el caso de correlacin positiva, (X - .X)e (Y - Y) logo es fcil comprobar cmo en el cuadro de la izquierda si, = 1,581 y cmo en el
sern para todas o casi todas las observaciones del mismo signo y, por tanto, su cuadro de la derecha s, = 15,81. De donde se deduce que 2/J,581 = 20/ 15,81,
producto ser positivo ; consiguientemente, s,i = E (X - X)( r - Y)/n ser posi- -2/ 1,581 = - 20/ 15,81, etc. En conclusin, L (X - X ) (Y - Y)/s,sl' es invariante
tiva. Por el contrario, en el caso de correlacin negativa, (X - X) e (Y - Y) sern, frente a cualquier cambio de unidad de medida. As, en nuestro ejemplo,
para todas o casi todas las observaciones de distinto signo y, por tanto, su producto
(X - X) ( Y - Y) ser negativo ; consiguientemente, s,, = E (X - X) ( Y - Y)/n 6/ (1 ,118)(1,581) = 600/( 11.1 8)( 15,81)
ser negativa. Finalmente, en el caso de correlacin nula, aproximadamente, para
la mitad de observaciones, (X - X) e ( Y - Y) sern del mismo signo y para la Por otra parte, tanto (X - X) como s, son nmeros concretos q ue representan
otra mitad, lo sern de distinto signo; por tanto, ms o tnenos, la mitad de los pro- alguna caracters tica (ambos la misma) como peso, aprovechamiento en Es-
ductos (X - X) ( Y - f') sern positivos y la otra mitad sern negativos. Consiguien- tadstica, actitud frente a la guerra, etc., y ambos vienen dados en una misma
temente, s,l' ser nula o muy prxima a cero. En conclusin, a correlacin positiva, unidad de medida elegida arbitrariamente. Mientras que(X - X )/s, es un mero
negativa o nula, corresponde covarianza positiva, negativa o nula, respectivamente. nmero abstracto que se limita a indicar cuntas veces el numerador contiene al
Sin embargo, s,,, como indice de correlacin presenta algunos inconvenientes. denominador, independientemente de lo que stos signifiquen. Lo mismo sucede con
En primer lugar, el valor de s,l' es funcin de las unidades de medida elegidas (Y - Y)/s,.
para X e Y. Supongamos, por ejemplo, que X es aprovechamiento en gramtica . (X - X) (Y - Y) .
Finalmente, - - - - - - - es un numero abstracto, como producto de
e Y-,-ts aprovechamiento en aritmtica. Calculemos s,i bajo dos condiciones sx s,.
distintas : a) las puntuaciones posibles van de O a 10, h) las puntuaciones posibles dos nmeros abstractos.
182 / Estadistica para Psiclogos Relacin (lineal) entre dos var,ables / 183
Por todas estas razones, en vez de usar EJEMPLO IO. l. Calculemos rx,. a partir de los cinco pares de puntuaciones
siguientes:
:E (X - X) ( Y - Y)
sX)' = - - n
o o o o o
r(X - X)(Y- >') U~_- X)(Y- >')
3
5 12
9 9
25
81
144
27
60
-1
l 3
l
1 9 3
-0,5
0,5 0,5 0,25
Sx S. - = n = ~
(10.1) 4 o 16 o o o -9 o 81 o o - 1,5 o
n s,s,. s,s,. 7 18 49 324 126 3 9 9 81 27 1,5 1,5 2,25
1 6 l 36 6 - 3 -3 9 9 9 - 1,5 -0,5 0,75
Le llamaremos coeficiente de correlacin de Pearson y le designaremos por,,,.
La frmula ( I0.1) adopta diversas versiones, todas ellas equivalentes: 20 45 100 585 219 o o 20 180 39 o o 3,25
!: (X - X) ( Y - Y) Segn (10.1):
=~
n !: (X - X) ( Y - Y) = !: xy =
'xy s.s, = - - -SxSy
- -- - n s,s,
(10.3) 7,8 = 0,65
n Sxs, r,,. = (2)(6)
a) Datos agrupados en intervalos La fila nx est formada por las frecuencias marginales de X. (5, 5, 10, 6, 4). La
fila X est formada por los puntos medios de los intervalos en los que ha sido dis-
rxy -_ --;===n=L=I:
= n='
x'=.X
==Y= -=-
(!:-;=
nx~X=)==('=!:=n~,=Y=')= tribuida la variable X (1, 4, 7, JO, 13). La columna n, est formada por las frecuencias
(10.5)
Jn I: n,X2 - (!: nxXJ2 Jn !: n,.Y2 - (!: n, Y) 2 marginales de Y (10, 12, 8). La columna Y est formada por los puntos medios
Donde: de Jos intervalos en los que ha sido distribuida la variable Y (2, 7, 12).
nxX consta de los productos de la fila nx por la lila X; (5)(1 ), (5)(4 ), (10)(7),
n,: representa el nmero de observaciones o frecuencias marginales de X. (6)(10), (4)( 13).
11,. : representa el nmero de o bservaciones o frecuencias margi nales de Y. nxX2 consta de los productos de la fila nxX por la lila X: (5)( 1), (20)(4), (70)(7),
11,_.: representa el nmero de observaciones dentro de cada una de las casi- 1
(60)(10), (52)(13).
llas interiores de la tabla de frecuencias. Es decir, el nmero de observaciones n,Y consta de los productos de la columna n,. por la columna Y: (8 )(1 2), (12)(7),
que simultneamente pertenecen a un cierto intervalo de la variable X y a otro
de la variable Y. {10)(2).
n,Y2 consta de los productos de la columna n,.Y por la columna Y: (96)(1 2),
EJEMPLO 10.2. Calculemos r xy a partir de la siguiente distribucin conjunta (84)(7), (20)(2).
de frecuencias. En cada una de las 15 casillas interiores d e la tabla anterior tenemos tres nmeros.
X El central indica el nmero de observaciones o frecuencia de cada casilla. El situa-
do arriba a la derecha es el producto de los puntos medios de los dos intervalos
0-2 3-5 6-8 9- 11 12-14 11,. correspondientes a cada casilla : (1)(2), (1)(7), (1)(12), (4)(2), (4)(7), (4)( 12), .. . ,
(13)(2), (13)(7), (1 3)(12). El situado abajo a la izquierda es el producto de la fre-
10-14 o o 2 2 4 8 cuencia, n.,., de cada casilla por el XY correspondiente a la misma casilla : (2)(4),
(7)(1), (12)(0), . .. , (26)(0), (91)(0), (156)(4).
y
5-9 l 2 6 3 o 12
La columna n,,X Y consta de la suma de los nmeros n,,x >, los situados abajo
a la izquierda, pertenecientes a las casillas de la primera lila, (1.032 ), de la suma
0-4 4 3 2 1 o 10
de los nmeros nx,.XY pertenecientes a las casillas de la segunda lila (567), de la suma
n, 5 5 10 6 4 30 de los nmeros nx,.XY pertenecientes a las casillas de la tercera fila (80 ).
Por consiguiente, aplicando la frmula (1 0.5 ):
Para calcular rx, organicemos los datos anteriores del modo siguiente. r = (30)(1.679) - (207)(200) = 8.970 =
0 688
X xy )(30)(1.85 ]) - (207) 2 J(30)(1.780) - (200)2 13.035,5 '
f,
t 0-2 3-5 6-8 9-1 l 12-14 ", Y n, Y n,.Y2 n,..TXY
12 48 84 120 156
10-14 o o 2 2 4 8 12 96 1.152 1.032 10.2.3. Propiedades
o o 168 240 624
7 28 49 70 91 a) El coeficiente de correlacin de Pearson no puede valer menos que -1 ni
y 5-9 1 2 6 3 o 12 7 84 588 567 ms que l. Es decir, -1 ~ rx, ~ l.
7 56 294 210 o
t- - r-- - En efecto, sean u = zx + z,, u = Zx - z,., donde z, y z, son puntuaciones
2 8 14 20 26
-- tpicas.
0-4 4 3 2 o
8 24
1 10 2 20 40 80 Evidentemente, ii = f = O. Por tanto,
.-------- r-- - -
28 20 o
n, 5
1 - --
5 10 6
r----- --
4 30 200 J.780 1.679
X 1 4 7 10 2 _ !: (zx + z,)2 = L z; + 2 !: z,zy +~ 1 + 2r,,, + 1 = 2(1 + r, ,)
13 s. - n n n n
11,X 5 20 70 60 52 207
11.,,,x: :f.. s 80 490 600 676 1.851 2 _ L (zx - z,)
1
= !: z; _ 2 !: z,z,, + !-_5_ = 1 - 2r,,. + 1 = 2(1 - rx,l
Sv - n n n n
186 / Estadistica para Psiclogos Relacin (lin eal) entre dos var iables / 187
z,
Ahora bien, tanto s~ como s~ son esencialmente no negativos. Por tamo - + + +
(1 + ,,,) ~ O. Es decir, r,, ~ - l. Igualmente, (! - ,,, ) : O. Es decir, r,, $ 1'.
En conclusin, -1 ::; r,, ::; l.
El coeficiente '"' alcanza su valor extremo 1, cuando cada una de las personas
obtiene la misma puntuacin tpica en X y en Y, o sea, cuando z, ~ z, para toda z.
persona del grupo. Evidentemente, en este caso
z, z, z,
+ -
z. z.
decir que los productos d el par de puntuaciones tpicas de la mayora de las personas
sern negativos y grandes. En cambio, los productos del par de puntuaciones t-
'* picas de la minora sern positivos y pequeos. En conclusin, la suma de los n
(A) (B) productos, L z,z, ser negativa y, por tanto, r,, ser negativa.
a .3) Aproximadamente la cuarta parte de las n personas estn situadas en cada
Siempre que r,, = 1 o ,,., = - 1, los puntos siguen estando sobre una lnea uno de los cuatro cuadrantes. Por tan to, la mitad de ellas tendrn puntuaciones
recta (no necesariamente las dos diagonales anteriores) si nos valemos de puntua- tpicas del mismo signo y la otra mitad de signo distin to. Adems, en los cuatro
ciones diferenciales o directas. Y siempre que los puntos estn sobre una lnea recta,
,., = 1 o r,, = - J. Estas afirmaciones quedarn legitimadas en el captulo 12.
Veamos ahora lo que sucede cuando los puntos no estn sobre una lnea recta.
- . z,
+ +
i
AC 12-14 y n,y n,.y'2 n)(_,,x'y'
0-2 3-5 6-8 9-11 n,.
= /A C/ rx, = - rx,- si el signo de A es distinto que el de C
10-14 o o 2 2 4 8 1 8 8 10
Por tanto, /r,,./ = /r,,./.
5.9 l 2 6 3 o 12 o o o o
De esta propiedad se infiere fcilmente que en (10.4) las pun tuaciones directas - 0-4 o -1 - JO 10 10
1
en X y en Y pueden ser sustituidas por pun tuaciones diferenciales o tpicas. El
resultado final es el mismo usando directas-directas, que diferenciales-diferenciales,
4 3 2 1 JO
18 20
n, 5 5 10 6 4 30 -2 1
directas-diferenciales, diferenciales-tpicas, etc. En efecto, x = (1 )(X) + ( - X),
X - 2 - 1 o 1 2
1 posiliva,s:f nxx2 20 5 o 6 16 47
il
190 / Estadistica para Ps,c/ogos Relacin (linea l) entre dos var iables / 191
El procedimienlo para construir la tabla es anlogo al utilizado en el ejemplo 10.2. Intm l1vamente se puede apreciar que la nube de puntos cor respondien te a l
Aplicando la frmula ( 10.6) nos queda: grupo total es ms estrecha y a largada que las dos nubes correspondientes al grupo
G1 y al G2 .
=
---;==
(30)(20) - ( - I )( - 2)
=======~ =---'-:======='== = -
_ 598 _ O
- 68 8 Pues bien , para Gr, 'x, = 0,84
f X)'
)(30)(47) - (- J)2j(30)(18) - (-2) 2 869 ' para G 1 , , , ,, = 0,3 8
pa ra G 2 , , ,,. = 0,67
El resultado es el mismo que el obtenido media nte el mtodo no abreviado.
Ntese que este valor de , , ,, menor para G 1 y G2 que para Gr, no es debido
a que los dos subgrupos consten de menos personas que el grupo total. En e fecto,
10.3. Factores de los que depende rx, del grupo total podemos elegir slo siete personas, pero que formen un grupo de
gran variabilidad. Elijamos, por ejemplo, las tres ms bajas en X y las tres ms
a) Vuri,tbilidoJ ,le/ grupo altas en X.
Supongamos dos variables, X (capacidad intelectual) e Y (xito escolar), rela-
cionadas linealmente. Calculemos el coeficiente de correlacin de Pearson entre
ambas del modo siguiente. Consideremos, en primer lugar, el grupo total, Gr, y, X y xi y2 XY
luego, dos subgrupos del mismo: G 1 , compuesto de los bajos en X (que, dada la
relacin lineal entre X e Y, tendern a ser bajos, tambin, en Y) y G2 , compuesto 8 7 64 49 56
de los altos en X (que, por la razn ante rior, tendern a ser altos, tambin, en Y). 7 7 49 49 49 (7)( 188) - (32)(31)
7 6 49 36 42 r.,. >. = -
Es claro que la variabilidad en X y en Y d e las personas del grupo Gr ser mayor j(7)(2 l4) - 322 J(7)(173) - 312 -
que la de las personas tanto de G 1 como de G 2 . En efecto, Gr consta de personas 7 5 49 25 35
3 9 3 324
altas y bajas en capacidad intelectual (y en xito escolar). En cambio, G I slo consta = - - =0 94
2 4 2
de personas bajas y G 2 slo consta de personas altas. Pues bien , '>" es mayor en 1 1 l
344,238 '
Gr que en G 1 y en G2 Es decir, el coeficiente de correlacin de Pearson queda re-
ducido al restringir la variabilidad del grupo en una variable (o en las dos). 32 31 214 173 188
EJEMPLO 10.4. Consideremos un grupo total, Gr, con 25 personas. Vamos
a descomponerlo en dos subgrupos : uno, G 1 , con las diez personas ms bajas en
X, y otro, G 2 , con las 15 ms altas en X.
Para este grupo reducido, pero muy heterogneo, ' x; = 0,94, mayor q ue el
La representacin grfica es la siguiente:
coeficiente de correlacin de Pearson correspondiente a l grupo tota l compuesto de
X 25 personas .
Ntese, tambin, que por razn del aumento de variabilidad, un solo dato
alejado mucho de los restantes puede h acer que a umente espectacularmente el coe-
ficiente de correlacin de Pearson . As, por ejemplo, el alumno puede comprobar
G, cmo r,,. = O en la tabla A, y cmo r,_.. = 0,95 en la ta bla B que no es ms que
G,
la tabla A con un nuevo punto, el (12, 12) muy a lejado de los cuatro restantes.
I Aho~ r:n X I
TA BL A A TABLA B
-y
X y X
-- - -
3 3 12 12
3 1 3 3
G, 1
X 1 3 3
1Ba1~ en X )
l l 3
~:t 4 6 7
Altos en X
192 / Estadstica para Psiclogos Relacin //mea/) entre dos var iabl es / 193
Este influjo de la variabilidad del grupo sobre r, , debe ser tenido en cuenta negativa. Este alto coeficiente de correlacin entre peso y habilidad numenca es
al valorar sta. Contemplemos un caso muy ordinario en Psicologa . De modo ele- debido a la presencia de una tercera variable: la edad. D entro del margen de edades
mental diremos que un test es fiable cuando, aplicado en d os ocasio nes distintas a un propuesto, al ir aumentando la edad aumentan simultneamente el peso y la habilidad
mismo grupo, da lugar a dos sucesiones de puntuaciones muy parecidas. Ms concre- en operar con n meros. Un modo de eliminar el influjo de la edad es dividir el grupo
tamente, llamaremos coeficiente de fiabilidad o, si mplemente. fiabilidad de un test total en subgrupos, tales que los nios de cada uno de ellos tengan la misma edad y
al coeficiente de correlacin de Pearson, r 12 , entre las puntuaciones obtenidas e~ calcular r,,. dentro de cada uno de dichos subgrupos. Pues bien, siguiendo esta tcti-
la p rimera ocasin y las obtenidas en la segunda. Pues bien, segn lo dicho anterior- ca veremos que el coeficiente de correlacin de Pearson entre peso y habilidad num-
mente, r 12 ser funcin de la variabilidad del grupo en aquella variable medida por rica es muy bajo, por muchos nios que elijamos de cada subgrupo de la misma edad.
el test. Si se trata de un test de inteligencia y aplicamos el test a un grupo de nios Ms adelante propondremos una manera de controlar estadsticamente el in-
muy homogneos (o todos muy inteligentes, o todos medios, o todos poco in teli- flujo de la tercera variable de que se trate, sin tener que dividir el grupo total en va-
gentes) obtendremos un valor para r 12 mucho menor que si lo hubiramos aplicado rios subgrupos, de acuerdo con lo indicado.
a un grupo muy heterogneo (compuesto de nios, unos muy in teligentes, otros La situacin presente quedara representada grficamente segn se ve en la
de inteligencia media y otros poco inteligentes). En otras palabras, el mismo test figura de la pgina anterior.
aplicado a un grupo muy homogneo puede dar lugar a r 12 = 0,75, por ejemplo, y Dentro de cada edad, r,, es prcticamente nula (una circun ferencia limita lo s
aplicado a un grupo heterogneo puede dar Jugar a r 12 = 0,93, por ejemplo. puntos representativos de las personas de cada edad). Pero consideradas conjunta-
mente todas las edades, es decir, sin controlar el influjo de la edad, r " >' crece sensi-
b) Influjo de una tercera w riab/e blemente (una elipse estrecha y alargada limita los puntos representativos de las
personas de todas las edades).
Si calculamos el coeficiente de correlacin de Pearson entre el peso y la habi- Vemos ahora una situacin en la que el influjo de la tercera variable tiende
lidad en realizar operaciones aritmticas para un grupo de nios cuyas edades os- a reducir la correlacin entre d os variables. Consideremos la capacidad intelectual.
cilen aproximadamente entre los cuatro y los doce aos, veremos que r,,. suele X, y el rendimiento escolar en cierta disciplina, Y. Consid eremos, adems, la moti-
ser positivo y alto. Quiere decir esto que, en general, los nios de ms peso tienen vacin como tercera variable, Z. Si controlamos Z, r,.,. ser, en general, alta . Pero
mayor facilidad para el clculo numrico que los nios de menor peso? A primera sin este control es posible q ue alumnos con gran motivacin logren alto rendimiento
vista y atenindonos al valor de r,,, parece que s. Sin embargo, la respuesta es escolar, a pesar de tener capacidad intelectual media y aun baja. Por el con trario,
otros alumnos, poco motivados, pueden lograr un bajo rendimiento esco lar, a pesar
de estar dotados de gran capacidad intelectual, y es probable que descienda r,, si
dejamos actuar a Z.
La situacin presente quedara grficamen te representada asi:
motivacin alta
(baja capacidad , alto rendimiento)
o"'
~ motivaci n baJa
"o (alta ca pacidad. bajo re ndimiento)
j
g
:ae:
ii!
Si eliminamos los alumnos con motivacin alta y escasa capacidad intelectual y 10.4. Condicin esencial para poder calcular ,,r
los alumnos con motivacin baja y gran capacidad intelectual, rx, ser alta. (Una
elipse estrecha y alargada limita los puntos representativos de las personas no A nivel meramente descriptiro (en el cual nos movemos por ahora) la condicin
eliminadas.) Pero si no los eliminamos, rx,. puede descender sensiblemente (una cir- esencial para poder calcular r,,. es la linealidad de los puntos que representan a
cunferencia limita los puntos de todas las personas, sin eliminacin de ninguna). Jas n personas. Es decir, estos puntos deben estar situados prximos a una lnea
Consideremos un ltimo caso hiptetico. Supongamos que la relacin entre recta. No es necesario.que las dos variables se distribuyan normalmen te. Cualquier
dos variables, X e Y, es alta y positiva para las mujeres y alta y negativa para los tipo de distribucin es vlido, a condicin de que los puntos se siten cercanos a una
varones y es nula para el grupo total. En otras palabras, si prescindimos del influjo recta. Y esto es posible aun cuando las dos distribuciones sean asimtricas. Por
del sexo, rx, = O. Pero si tenemos en cuenta dicho influjo, rx, es alta y positiva 0
alta y negativa. ejemplo,
La situacin presente quedara representada grficamente as: X: l, 1, 1, l , l, 1, l, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5.
Y: 2, 2, 2, 2, 2, 2, 2, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 8, 8, 10.
son francame nte asimtricas. Sin embargo, los puntos (1 ,2), (1,2). .. . , (4,8), (5. 10)
se encuentran sobre la recta Y = 2X y 'x, vale l.
Advirtase que r,, puede ser calcu lado materialmente, siempre que tengamos
n pares de nmeros. Nuestro problema presente no es si puede ser calculado o no
mujeres
materialmente, sino si el resultado obtenido admi te una interpretacin razonable
como coeficiente de correlacin, es decir, como indicad or de la relacin existente en-
tre las d os variables. Pues bien, la interpretacin es razonable solamente cuando se
verifica la condicin de linealidad. Si los puntos representantes de las personas
y (es decir, de los pares de puntuaciones de cada persona) estn sobre una lnea curva,
r",. no sera recomendable, pues detectara muy p obremente la relacin curvilnea
entre las d os variables. Ms an, a una perfecta relacin curvilnea entre dos va-
varones
riables, puede corresponder rx,- = O. Vase el ejemplo siguiente:
X y
-- - - -- r (0,2)
2 o
/2 J2
X
o 2
,l 1
:j/2.0) X
- J. ../2 ( - 2,0)
sera alta y positiva (una elipse estrecha y alargada que va del 1. 0 al 3." cuadrante o - 2 (O, - 2)
limita los puntos represen tativos de las mujeres), y considerado el grupo de los va- ,./2 -/ 2
rones, 'x, sera alta y negativa (una elipse estrecha y alargada que va del 2.0 al 4.0
cuadrante limita los puntos represen tativos de los varones).
De estas y otras consideraciones que pasamos por alto se infiere la gran uti-
lidad de d_ibujar el diagrama de dispersin antes de calcular el coeficiente de co- Los ocho pu ntos anteriores estn situados sobre la circunferencia X 2 + Y2 = 4.
rrelacir de Pea rson, para luego poder interpretar ste de modo apropiad o. Existe una correlacin (curvilnea) perfecta entre X e Y y, sin embargo, rx, = O.
196 / Estadistica para Psi clogos Rel;mn (lineal / en tr e d os variabl es / 197
Por tanto, si no existe relacin alguna entre dos variables, r,, = O. Pero si Lo cual no quiere decir que la abundancia de telfonos sea la causa de los accidentes.
r,,. = O, no se puede concluir que no exista relacin alguna. Ciertamente no existe Obviamente, a mayor nivel de vida corresponde simultneamente mayor n mero
relacin lineal, pero puede existir una relacin no lineal. En resumen, r, ,. mide la de telfonos y mayor nmero de coches y, como consecuencia, ms accidentes.
relacin lineal entre dos variables. Pronto veremos que r,,, = 1 si los puntos Pero a nadie se le ocurrira reducir el nmero de telfonos pensando que as iba
estn sobre una recta y, recprocamente, que si ,,, = 1, los puntos estn sobre a evitar muchos de los accidentes.
una recta. De aqu que volvamos a inculcar la importancia de dibujar el diagrama La correlacin indica una mera covariacin en tre dos variabl es y nada ms.
de dispersin antes de calcular 'Y para comprobar si los puntos siguen una tra-
yectoria ms o menos rectilnea. Slo bajo esta condicin ser recomendable r.,.
como ndice de correlacin.
10.7. Resumen : Definiciones y frmulas
Sabernos que r,,. = 1 indica correlacin lineal perfecta, y que ,., = O indica
correlacin lineal nula. Esto supuesto, qu significa 0,65?, correlacin alta, media
r,..), = .!.,g__
S.xSy
o baja? Esta pregunta no tiene sentido considerada absolutamente. Depende de las
circunstancias. Es baja si se trata de la fiabilidad de un tes1. y es aJta si se trata de la
Otras frmulas equivalentes son :
validez del mismo. Ser baja si se trata de la correlacin entre dos tests de inteligencia
espacial parecidos, pero ser alta si se trata de la correlacin entre dos variables
sociales como, por ejemplo, patriotismo y prejuicio religioso. En general, la nica
valoracin razonable de un coeficiente de correlacin, es compararlo con los coefi-
= (
rX)' = LZn Z , don
d .
e z., y z , son puntuacmnes ,. )
llp1cas
cientes de correlacin encontrados por otros investigadores entre las mismas va-
riables y en circunstancias semejantes. El coeficiente de correlacin encontrado
por nosotros ser bajo, si es inferior al encontrado por otros investigadores; ser
= ns,,s,
L xy = ~/f~<r?:E x 2 L y2
(donde X e y son pun tuaciones diferenciales)
alto, si supera a los coeficientes obtenidos por estos. As, por ejemplo , si se trata
de las variables prejuicio antiprotestante y religiosidad utilitaria)), r.,. = 0,65 n:EXY-:EX:E Y
sera alto, pues no suelen alcanzar dicho valor los coeficientes encontrados por 2
(donde X e Y son puntuaciones di-
otros investigadores entre estas variables u otras muy semejantes corno prejuicio jn "J:,X - (LX) 2 j nT, Y 2 - (T, Y) 2 rectas)
racial)) y religiosidad utilitaria.
Por estas razones, son muy equvocas las tablas en las que se valoran los coefi-
n T, :E n,1.XY - (L n, X )(T, 11,. Y )
cientes de correlacin como bajos {por ejemplo, entre Oy 0,30), medios (por ejemplo, (donde X e Y son p untua-
entre 0,30 y 0,70), altos (por .ejemplo, entre 0,70 y 1), o segn otras categoras seme- J n L n,x2 - (L n,X)2 J n L n,. Y 2 - CE n,. Y)2 ciones directas y los da-
jantes. Es evidente que el nmero 0,40 es menor que 0,50. No obstante, la relacin tos se encuentran agrupa-
expresada por 0,40 puede significar ms que la expresada por 0,50. Depende de las dos en intervalos )
variables en cuestin.
Por el hecho de que exista una alta correlacin entre dos variables, no- podemos
decir que una de ellas sea causa de la otra. Es claro que hay correlacin positiva entre
el nmero <!(!'accidentes de trfico y el nmero de telfonos en las viviendas. En las
regiones on mayor nmero de telfonos suelen darse ms accidentes de trfico.
198 / Estadistica para Psiclogos Relacin /lineal) entre dos variabl es / 199
t0.9. Deseamos calcular r,, entre los resultados en u na prueba de aritm tica (X)
a) X y b) X y e) X y d) X y e) X r f) X y y otra de gramtica ( Y). Nos valemos de un o rdenador en cuya memoria se encuentra
- - - -- - - - - - --- - la frmula de , .,. en puntuaciones directas. Por distraccin introducimos en el or-
1 1 2 5 1 1 4 1 1 4 1 5 denador pu ntuaciones diferenciales en gramtica y tpicas en aritmtica. En este su-
2 2 4 7 2 3 6 1 2 2 3 2
puesto, a) Tendr algn sen tido el resultado que nos ofrezca la mquina ? b) Ser
4 5 5 4 6 2 2 2 3 6 4 4
este resul tado el mismo que el que hubiramos obtenido introduciendo p untua-
5 4 6 1 3 2 3 2 5 18 6 1
o 4 ciones directas en aritmtica y en gramtica?
8 3 --- 9 10
-- --- - -- JO. JO. Sean Xi, X 2 , . . , X. las puntuaciones directas obtenidas por II estudiantes
en la p rimera mitad de un examen de Estadistica, valiendo 4 la correspondiente
10.2. Calcular el coeficiente de correlacin de Pearson entre las variables X e Y, desvia cin tpica. Sean Y, , Y2 , , Y. las puntuaciones directas obtenidas por esos
a partir de los siguientes datos agrupados en intervalos. mismos estudiantes en la segunda mitad de dicho examen, va liendo 5 la correspon
diente desviacin tpica. Como notas finales en Estadstica aceptamos las siguientes:
3%1 + 2Y1 , 3X2 + 2Y2 , . , 3X. + 2Y. En este supuesto, cunto valdr la va-
a) 2-4 5.7 b) 6-9 10-13 e) 55-60 61-66 67-72 rianza de estas notas finales, a) si r,1 = O, b) si r,1 = 1, e) si ,,,. = -1 ?
4-6 4 10 13-17 3 o 94-100 1 2 6 10.11. Sean z 11 , z, 2 , . . . , z 1 las puntuaciones tpicas o btenidas por II estudiantes
1-3 4 2 8- 12 1 2 87-93 2 5 3 en Psicodiagnstico de nios y sean z 2 1 , z 22 , . . . , z 2 las pun tuaciones tpicas
3-7 o 4 80-86 6 4 1
obtenidas por esos mismos estudian tes en Psicodiagnstico de adultos. Como
nota fina l de Psicodiagnstico atribuimos a cada persona i la puntuacin
(zu + z 2 ,)/2. Demostrar que vale O la m edia de esas puntuaciones finales y que
18-20 21-23 24-26 27-29 vale ( 1 + r 12 )/2 la varianza de las mismas.
d) 62-66 67-71 72-76 e)
10.12. Sean X e Y dos variables tales que X = 40, Y = 15, s; = 25, r_
,,. = 0,125.
35.39 4 2 l 40--44 6 4 2 o
1 35.39 2 4 4 2 CV, = 10. Calcular la desviacin tpica de las puntuaciones W, = X, - Y; ,
30-34 l 3
25-29 l 4 3 30-34 o 3 6 6
10.13. Consideremos las puntuaciones X 1 , X2 , , x. e Y1 , Y2 , , Y. Intro-
20-24 o 1 4 25-29 o 1 3 7
duzcamos la n ueva variable V, = X; - Y, . Calcular el coeficiente de correlac in
de Pearson en tre X y V. y entre Y y V. en funcin des,, y s,. r,,,..
10.14. Calcula r el coeficien te de correlacin de Pearson introduciendo en la ecua-
10.3. D emostrar que la varia nza de V =X + Y es igual a la varianza de X ms
cin der.,. en puntuaciones directas, las puntuaciones dife renciales (1, - 1, O, - 3.
la varianza de Y, si r,y = O. 3) en X, y las p untuaciones tpicas (0.5, O, ~ 1,5, - 0,5, 1,5) en Y. Comprobar.
10.4. D emostrar que la varianza de V = X - Y es igual a la varianza de X ms adems, cmo ese resultado coincide con el obtenido median te I: z, z,/11, una vez
la varianza de Y, si,%, = O. transformadas en tpicas las puntuacion es diferen ciales en X.
10.5. Sean X e Y las medias de X,, X 2 , . , x. y de Y,, Y2 , , Y0 , respectiva-
10.15. Siendo z,, , z,,. . . . . z,. puntuaciones tpicas en X . y siendo Y1 , Y2, . Y.
mente. Form emos las nuevas puntuacion es X 1 Y, , X 2 Y2 , , X. Y . Supuesto esto,
demostrar que la media de estas nuevas puntuaciones es igual a XY si 'xr = O. . d. y I I: (}' - z )2
puntuaciones 1Tectas en , ca cular el valor de ' ' para r,,. = 1, r,,. = O.
10.6. ;Vale necesariamente 1 el coefi ciente de correlacin de Pearson entre X e Y n
si X = Y y s, = sy?
r,,, = - l. suponiendo que s,. = 2, Y = 6.
200 / Estadistica para Psiclogos
X X
o
Para X= O, Y = l; paraX = 1, Y = 3. Por Para X = O, Y = l; para X = 1, Y = 6 . Por Distinguiremos entre construccin y aplicacin. Comenzamos con la construc-
tanto, la recta pasar por los puntos cuyas tanto, la recta pasar por los puntos cuyas cin. Intentamos determinar una fun cin matemtica (una ecuacin) que nos
coordenadas son: (0,1 ) y ( t.3). coordenadas son (0, 1) y (1 ,6) . permita pronosticar la puntuacin de cada persona en una variable Y (cri terio ),
conocida su puntuacin en otra var iable X (variable predictora ). Entre todas las
Las dos rectas anteriores tienen la misma ordenada en el origen (a = 1), es funciones elegimos una m uy sencilla: la funcin lineal, la ecuacin de la lnea recta.
decir, corlan al eje O Y en el mismo punto (0, 1). Tienen distintas pendientes (2 y 5).
No son paralelas.
y {7 ,10)
y
10 - --- - - --- - ----- - - 1
X y Y, - Y', { 1
},,
Y = - l - 4X Y = -l + 4X
3
7 10 Y,
--'-++--'--'--'--'--'- X 10 8
X
o 1 2
4 9
_______0.:.l~i Y,
j Y',
(Y, - r; 2 + (Y2 - Y) 2 + (Y3 - Y3)2 + (Y4 - Y1)2 + (Y5 - Y5)2 O, lo que es equivalente,
En general si tenemos n personas, intentamos construir una recta tal, que haga L ( Y - A - BX) = O, de donde, L Y= nA + B!: X ( 11.2)
mnima la expresin !: ( Y - A - BX )X = O, de donde, L XY = A L X + B !: X 2 ( 11.3)
Las ecuaciones (11.2) y (l 1.3) suelen ser llamadas normales . Ellas nos permi-
!: ( Y, - Y,') 2 donde i = 1, 2, ... , n.
ten despejar A y B. En efecto, dividiendo (1 1.2) por n nos queda
Ntese que para construir la recta de regresin necesitamos un grupo de per- Y= A+ BX ( 11.4 )
sonas cuyas puntuaciones en X y en Y conozcamos. En cambio, la aplicaremos de donde
a otras personas, semejantes a las anteriores, de las que slo conoceremos sus pun- A= Y- BX (11.5)
tuaciones en X. Supongamos que X es un test de aptitud para la Estadstica e Y el
aprovechamiento en la misma manifestado mediante un examen. Queremos cons- Multiplicando ( 11.4) por nX y restando de (11.3) nos queda,
truir una ecuacin que nos permita pronosticar del mejor modo posible el aprove-
chamiento, conocido el resultado en el test. Pues bien, para construir esa recta,
necesitamos unas personas cuyas puntuaciones en el test y en el examen nos sean !:XY- nXY = (A!:X + B!:X2 ) - (AnX + BnX2 ) =
conocidas. Una vez construida, la aplicaremos a otras personas, semejantes a = A(!: X - nX) + B(!: x i - nxi =
las anteriores, de las que slo conoceremos sus puntuaciones en el test de aptitud.
Dada la semejanza entre los dos grupos de personas, es de esperar que la recta
= O + B(!:X2 - nX2 )
de regresin que fue ptima en reducir los errores cuadrticos respecto al primer
Por tanto,
grupo, ser, tambin, razonablemente buena en reducir los errores cuadrticos
respecto al segundo.
Ex.J"llestas estas consideraciones previas, veamos cul es la recta de regresin B=!:XY-n~ ~ (1 1.6)
de Y sobre X. !: xi - n X2
Ecu aciones de regresin / 207
206 / Estadistica para Psiclogos
b) Expresada en puntuaciones diferencia/es
:EXY- n:EX ~ Comenzamos con la ecuacin
B = n n _ n :E XY - :E X :E y (11.7) (1 1.12 )
:E xi - n (r,/) i - n :E xi - (:E X)2 y'= a+ hx
2
Nuestro propsito es determinar a y b de modo que :E (y - y') = r. (y - a - bx )2
sea mnima. Segn un razonamiento an logo al seguido en el caso de puntuacio-
En resumen,
(11.S) nes directas, llegamos a las dos ecuaciones normales
A= Y- BX
(1 1.13)
:E y= na+ b :Ex
B = nr.XY - :EX:E Y (11.7) :E (y - a - bx) = O, de donde, 2
n :E X 2 - (:E X) 2 :E( y-a-bx )x=O, dedonde, :Exy =a :Ex +b :E x ( 11.14)
Teniendo en cuenta (11.1) y (11.5), Ahora bien, :Ex = :E y = O. Por consiguiente, las dos ecuaciones normales
= [:E X Y - n X
L xi - n g2
Y] s 2
2
X
= (teniendo en cuenta 11.6) Ntese que
b = :E xy = :E (X - X)(Y - Y) = :E XY - n XY = B (11.18)
2
= [:E (X:E(X
- X)( Y -
- X)2
Y)] s: = [l:ns;xy]
2
x
2
2
Sx
= [n fxysxsr]
ns;
2
.2
s..
= r..2ys,.2 (11,10) r. x 2 :E (X - X) 2 L X 2 - 11 X
Y ' = (Y - BX) + BX = Y (11.11) sta es la recta de regresin de Y sobre X expresada en puntuaciones diferen-
" 1 1/;.\" 111 17 ).
208 / Estadistica para Psiclogos Ecu aciones de regresin / 209
1) En conclusin,
Y = ~ -= b~x = O (11.20)
n n a*= O (11.26)
Es decir, son iguales (valiendo ambas cero) la media de las puntuaciones di- b* = r,y (l 1.27)
ferenciales pronosticadas, y', y la media de las puntuaciones diferenciales obteni-
Teniendo en cuenta (11.23), (11.26) y (11.27),
das, y.
z;, = f x -, Zx (11.28)
2) s;, = b s; 2 (teniendo en cuenta (11.19) y 6.3.4 .a)
e) Expresada en puntuaciones tpicas Es decir, la varianza de las puntuaciones tpicas pronosticadas es igual o menor
que J. Esto significa que las puntuaciones z;.
no cumplen con una de las propie-
Comenzamos con la ecuacin dades esenciales de las puntuaciones tpicas, a saber, que su varianza vale nece-
sariamente J. Por esta razn, estas puntuaciones z;. deberan ser llamadas pseudo-
z; = a* + b*zx (11.23)
tpicas en vez de tpicas.
Nuestro propsito es determinar a y b* de modo que I: (z, - z;l2 = 3) Sus tituyendo : , por z, = O en ( 11.28),
= :!: (z, -a* - b*z,Y sea mnima. Segn un razonamiento anlogo al seguido
en el caso de puntuaciones directas llegamos a las dos ecuaciones normales z; = O
I: (z, - a* - b*zx) = O, de donde, I: z, = na* + b* I: Zx (11.24) O sea, la recta de regresin de Y sobre X, en puntuaciones pseudotpicas p asa
por el origen (z~ = O, :iy = O). (Lo mismo sucede con la recta de regresin de X
I: (z,, - a* - b*zx)Zx = O, de donde, I: ZxZy = a* I: Zx + b* I: z; (11.25) sobre Y.)
EJEMPLO 11.1. Comen zaremos in troduciendo un min iejemplo que ayude al lec-
Ahora bien , I: z, = I: zy = O, I: z; = n. Por consiguiente, las dos ecuaciones tor a comprender mejor la a plicacin de las frmulas anteriores. Despus, o fre-
normales quedan reducidas a ceremos otro ejemplo algo ms largo con unos datos ob tenidos en la vida real.
Supon gamos cinco personas con pun tuaciones en una variable predictora (X )
O = na* + O, de donde, na*= O, a * = O Y en un criterio ( Y), segn la tabla I l.l. (De acuerdo con la costumbre seguida
,!"
I: z,z,. = b*n, d e donde, b* = I: z, z,/n = r,, anteriormente, (X - X )= x, e (Y - f) = y .)
21 O / Estadstica para Ps,clogos
Ecuaciones de r egresin / 211
TABLA 11. l Por consiguien te,
X y X' r' xr X _1' x' r' xy -, =)' -x .. .r
y y _,
- y
y,' = 1,95 X , segn (11.19).
3 9 9 81 27 - 1 o 1 o o
- 0.5 o.o 0,00 7,05 - J ,95- 0.325
5 12 25 144 60 1 3 1 9 3 0,5 0,5 0,25 10,95 1,95 0,325 Aplicando esta ecuacin a los cinco puntos diferenciales en X (- 1, 1, O, 3, - 3),
4 o 16 o o o -9 o 81 o obtenemos la columna encabezada por y ' en la ta bla 12. l.
7 18 49 324 126 3 9 9 81 27
0,0
1,5
- 1,5
1,5
0,00 9,00
2,25 14,85
5,85
0,000
0,975 Ntese cmo :Ey = :Ey ' = O, o _v =Y= O.
6 1 36 6 -3 - 3 9 9 9 -1,5 - 0,5 0,75 3.15 - 5,85 -0,975
e) Recta de regresirn a partir d<' puntuaciones tpicas
20 45 100 585 219 o O 20 180 39 o.o o.o 3,25 45,00 0,00 0,000
Segn (11.27):
- 20 45 3,25 b* = 0,65
X= S = 4, f = - - = 9 s, = J205 = 2, s, = ~ = 6, r,,. =- - = 0,65 Segn (11.26):
5 ' 5
a* = O
Por consiguiente,
a) Recta de regresin a partir de puntuaciones directas
.,. = 0,65 ::, , segn (11.28 ).
Segn (11.7): Aplicando esta ecuacin a las cinco puntuaciones tpicas en X ( -0,5 ; 0,5; 0,0 ;
1,5; -1,5), obtenemos la columna encabezada por en la tabla 11.1. z;.
B = (5)(219) - (20)(45) = 195 = I
95 Ntese cmo :E z,. = :Ez;. = O, o, z,. = z;. = O.
(5)(100) - (20) 2 100 '
Segn (11.5): La representacin grfica de las tres rectas de regresin an teriores es la si-
guiente:
A = 9 - (1,95)(4 ) = 9 - 7,80 = 1,20
Por consiguiente,
y
Y= 1,20 + 1,95 X, segn (l 1.8).
b =~= l 95
20 '
Segn (1 1.17):
b = O 65 ~ = 1 95
' 2 '
Seg.~ ( 11.1 5):
a =O X
212 / Estadistica para Psiclogos Ecuaciones de regresin / 213
EJEMPLO J 1.2. La tabla 11 .2 nos presenta las puntuaciones obtenidas por 22 l: XY = (2)(4,3) + (20 )(7,5 ) + + (16)(4,3 ) = 2.217,8
alumnos de Enseanza General Bsica de la ciudad de Oviedo en un tes! de ra.
= i/22)(5.972)~5O)' = 4 2843
zonamiento abstracto, X, y las notas alcanzadas por los mismos en rendimiento s, (22) 2 '
escolar, Y, a fin de curso (promedio de sus calificaciones en todas la s ma terias
cursadas). Los datos han sido ofrecidos por M . C. Garca Mndez. (22)(871 ,62) :_ (133,6)2
s). = (22)' = 1,6556
Junto a las ecuaciones de regresin de Y sobre X, te nemos las ecuaciones de b) Expresada en puntuaciones diferenciales
regresin de X sobre Y. Mediante ellas intentamos pronosticar X a partir de Y.
Para ello nos valemos de una recta que haga mnima la expresin L (X, - X;2 . Segn (11.34 ) :
De acuerdo con un razonamiento anlogo al seguido en el caso de las rectas 39
b = -- = O 2 167
de regresin de Y sobre X, es fcil demostrar que ahora es: 180 '
Segn (1 1.33 ):
a=0
a) Expresada en puntuaciones directas Por consiguiente,
(1 1.31 )
A = X - BY x; = 0,2167 y,
B =nL YX - "!: Y LX (11.32)
e) Expresada en puntuaciones tpicas
2
n "!: Y 2 - (L Y)
Segn (11.3 7):
b* = 0,65
Segn ( 11.36):
b) Expresada en p11nt11aciones diferencia les
a= O
a=0 (11.33) Por consiguiente,
=~ = 0,65 z>'
b = LYX (1 1.34)
"!: y2 Las ecuaciones anteriores dan lugar a los siguientes valores pronosticados :
b) Expresada en puntuaciones diferenciales oq>= - 2I:( Y- a -bX - cX 2 )X2 = 0, de donde, I:X2 Y= a:E X 2 + b I:X' + c I: X 4
Jc
y ' = a + bx
donde Despejando a, b y e en las tres ecuaciones anleriores, podemos determinar la
ecuacin Y' = a + bX + cX2
a= O EJEMPLO 11.4. Comenzamos con un miniejemplo que aclare la lctica a se-
guir. Luego propondremos otro extrado de la lileratura psicolgica.
b = LX.Y Construyamos la ecuacin cuadrtica Y' = a + bX + cX 2 a par tir de los
xz datos siguientes:
b -;:::: rX)'
31 TABLA 11.3
s,.
Funcin cuadrtica Funcin lineal
c) Expresada en punruaciones tpicas X Y x2 X' x XY X
2
Y I Y' ( Y- Y' ) (Y - }")2 }" (y - Y ') (Y - Y')2
Hasta ahora hemos presentado lneas de reg resin de la forma Y ' = a + bX,
es decir, en las que era lineal la relacin entre X e Y '. Existen, sin embargo, en Psico-
loga situaciones en las que no es el ms adecuado este tipo de funcin lineal. Vamos
ahora a presentar otras funciones no lineales de aplicacin en las investigaciones
psicolgi~s. En todos los casos siguientes nos valdremos del principio de mnimos
(1 )
(II )
+ Jb
4 - 4,
4 = 3a + 5b
(lll) 6 = 5a + 9b
+ 5,
+ 9c
+ 17e
l
Las tres ecuaciones norm a]Ps. sern :
De aqu se deduce inmediatamente, a = O,ti, e = - 1,25. Sustituyendo estos Como se ve, es mucho mayor la suma de errores cuadrticos obtenida median-
valores de a y e en (1 ) deducimos b = 2,75. te la funcin lineal, que la obtenida mediante la funcin cuadrtica. sta se apro-
Por consiguiente, la ecuacin buscada es la siguiente: xima mejor que la funcin lineal a los cuatro puntos d ados. Esta a proximacin
puede ser observada en la figura de la pgina anterior.
Y' = 0,5 + 2,75 X - 1,25 xi EJEMPLO 11.5. Kitterle y Helson (1 972) llevaron a cabo un experimento par a
probar que el tiempo de reaccin ante un estmulo luminoso es funcin cuadr -
Sustituyendo en esta ecuacin los valores (0, O, 1, 2) de X , obtenemos los pro- tica del intervalo de tiempo transcurrido entre la aparicin de ese estm ulo y la
nsticos (0,5, 0,5, 2, 1). aparicin de otro estmulo perturbador, tambin luminoso. En la columna X de
La correspondiente suma de errores cuadrticos vale 0,50. {Vase tabla 11.3.) la tabla 11.4 tenemos, en centisegundos, el tiempo transcurrido en tre la aparicin
Calculemos ahora , para estos mismos datos, la ecuacin Y' = a + bX: del primer estmulo y la aparicin del estmulo perturbador ; en la columna Y se
.encuentran los tiempos de reaccin correspondientes.
b = (4)(4) - (3)(4) =~ a = 1
3 8
(4)(5) - (3)2 11 11 11
TABLA 11.4
---
_ 8 4 V
Cuudr1. Lineal
Por tanto. Y - - +- ... X y y y
11 11
2 17,3 17,4000 17,9182
Sustituyendo en esta ecuacin los valores (O, O, L 2) de X, obtenemos los pro- 4 17,7 17,6836 17,8564
nsticos (8/ 11 , 8/11, 12/ 11, 16/ 11 ). 6 17,9 17,8808 17 ,7945
La correspondiente suma de errores cuadrticos vale 1,6364. (Vase tabla 11.3.) 8 18,2 17,9916 17,7327
10 18,2 18,0160 17,6709
12 17,6 17,9540 17,6091
y 14 17,8 17,8056 17.5473
16 17,5 17,5708 17,4855
2 ~ - -- r---::;.....----=::::::------J----;-- -
18 17,3 17,2496 17 ,4236
20 16,9 16,8420 17,3618
176,4 = 10 a + ! JO b + l.540 e
1.930,20 = 110 a + 1.540 b + 24.200 e
26 .850 = 1.540 a + 24.200 b + 405.328 e
De aq u se deduce,
(5)(2,0343) - (2,0792)(2,6879)
b = (10)(1.930,20) - (110)(176,4) = - 00309 b = (5)( 1,1693) - (2,0792) 2 = 30082
(10)(1. 540) - (110)2 '
2,6879 2,0792
a = 17,64 - ( - 0,0309)(11) = 17,98 log o = - - - (3,0082) -
5 5
- = - 0,7133
Sustituyendo en esta ecuacin los valores (2, 4, ... , 20) d e X, obtenemos Y' = (0, 1935) X 3 2
los pronsticos (17,9 182, 17,8564, .. . , 17,36 18). (Vase tabla 11.4.)
2
La correspondiente suma de errores cuadrticos, L (Y - Y' ) , vale 1,209, Sustituyendo en esta ecuacin los valores ( l. 2. 3, 4, 5) de X. obtenemos los
como puede comprobar el lector a partir de la tabla 11.4. pronsticos expuestos en la tabla 11.5 (O, 1935, 1,5568, .. . ).
Como se ve, es bastante mayor la suma de errores cuadrticos obtenida m e- La correspondiente sum a de errores cuadrticos, L ( Y - Y') 2 , vale 0,5435,
diante la funcin lineal que la obtenida mediante la funcin cuadrtica. sta se como puede comprobar el lector a p arti r de la tabla I 1.5.
aproxima mejor que la funcin lineal a los diez puntos dados. Calculemos ahora, p ara los datos d irectos en X y en Y, la ecuacin Y ' = a + bX.
De la tabla 11.5 se deduce:
P or tanto,
A.3. Funcin potencial : Y'= ax
b = (5)( 195,2) - (15 )(44,7) =6 11 44,7 15
(5)(55) - (15) 2 '
a = -
5 - (6 ll ) -
' 5 = - 939
.
Es claro que, tomando logarit mos, la ecuac10n Y = ax
se transforma en
log Y = log a + b log X, ecuacin lineal en log X y log Y. Mediante esta lti- Consiguientemente,
ma ecuacin, podemos determinar log a, y b, siguiendo la tctica ad optada al tratar
de las rectas de regresin. Una vez calculado log a, basta con encontrar su anti- Y ' = -9,39 + 6,1 1 X
logaritmo, para determinar a.
ErnMl'LO 11 .6 . Calculemos a y b, en la ecuacin Y' = ax a partir de la tabla Sustituyendo en esta ecuacin los valores ( ! , 2, 3, 4, 5) de X, obtenemos los
pronsticos expuestos en la tabla 11.5 ( - 3,28, 2,83, .. . ).
siguiete:
224 / Estadistica para Psiclogos Ecuaciones de regresin / 225
2
La correspondiente suma de errores cuadrticos, :E (Y - Y') , vale 48,3510 (16)(6,5597) - (10,3155)(8,4607)
como puede comprobar el lector a partir de la tabla J 1.5. ' b = (16)(8,6290) - (10,3155)2 = 05585
Como se ve, es enormemente superior la suma de errores cuadr ticos o btenida
mediante la funcin lineal que la obtenida mediante la fun cin potencial. sta 8,4607 10,3155
loga = - - - {0,5585) - - - = 0,1687
se aproxima mucho mejor que la funcin lineal a los cinco puntos dados. 16 16
EJEMPLO 11.7. Amn (1972) estudi los valores atribuidos a 16 frases acerca
del divorcio, teniendo en cuenta el mtodo seguido en la evaluacin de las mismas. a = antilog (0, 1687) = 1,4747
A continuacin se exponen los valores atribuidos a dichas frases segn el m todo
de las comparaciones apareadas (decir cul de las dos frases de cada par favorece Por consiguien te, la ecuacin potencial buscada es :
ms al divorcio) y segn el mtodo de la estimacin de razones (decir cuntas ve-
ces favorece ms al divorcio una frase del par que la otra). La variable X repre- y= 1,4747 X5585
senta la estimacin de razones y la variable Y las comparaciones apareadas. Los
resultados obtenidos fueron los siguientes: Sustituyendo en esta ecuacin los valores (1, 1.44, . . . , 14,72) de X , obte-
nemos los pronsticos (1,4747, 1,8078, . . . , 6,62 19) expuestos en la tabla 11.6.
La correspondiente suma de errores cuadrticos, :E ( Y - Y' )2, vale 2,5071,
como puede comprobar el lector a par tir de la ta bla 11.6.
TABLA 11.6 Ca lculemos ahora, para los datos directos en X y en Y, la ecuacin
F. potencial F. lineal
X y y y Y' = a+ bX
1,0 7 1,00 0,845 1 0,8451 7, 1267 4 ,5755 A.5. Funcin logartmica: Y' =a +b log X
17,9147 11,2505 12,5212
16,6 12 275,56 1,0792
36,1230 16,6532 19,3464 Como esta ecuacin es lineal en Y y en log X, segui remos la tctica adoptada
30,0 16 900,00 1,2041
60,7288 25,0869 26,4772
44,0 24 1.936,00 1,3802 al tratar de las rectas de regresin .
85,5965 34,6150 32,0799
55,0 36 3.025,00 1,5563 EIEMPW 11.9. Doce alumnos de la Universidad Complu tense de Madrid,
94,7323 95,0002 aceptando como criterio un estmulo luminoso, L, evaluaron la intensidad lu-
6.137 ,56 6,0649 201,2081
146,6 95 minosa de otros respecto a L. La variable X representa la intensidad luminosa,
medida en unidades arbitrarias. La var iable Y representa las estimaciones de di-
cha intensidad ofrecidas por los sujetos experimentales *.
(5)(201 ,2081) - (146,6)(6,0649) = 0, 012715 , b = antilog (0,0 12715) = 1,0297 TABLA 11.8
log b = (5)(6.137,56) - (146,6)2
F. logarit. F . lineal
6,0649 146,6
log a= - - - 0,012715 - - = 0,840176, a = antilog (0,8401 76) = 6,92 11 X y log X (log X)' (log X)(Y) Y' Y'
5 5
0,1 0,3 - 1,0000 1,0000 -0,3000 0,1517 11,2236
0,4 4 ,5 - 0,3979 0, 1583 -1 ,7906 5,4380 11 ,261 1
Por tanto, la ecuaci n exponencial buscada es:
9, 1 18,0 0,9590 0,9197 17,2620 17,3527 12,3495
18,2 19,7 1,2601 1,5879 24,8240 19 ,9958 13,4879
Y' = (6,9211 )(1,0297l 36,4 25,0 1,5611 2,4370 39,0275 22,6389 15,7647
145,5 26,0 2, 1629 4,6781 56,2354 27,9226 29.4132
Sustituyendo en esta ecuacin los valores (1, 16,6, 30, 44, 55) de X , obtenemos
los pronsticos expuestos en la tabla 11.7 (7, 1267, . . . ). 209,7 93,5 4 ,5452 10,78IO 135,2583 93,4997 93,5000
La correspondiente suma de errores cuadrticos, 1: ( Y - Y' )2, vale 4.1042,
como puede comprobar el lector a partir de la tabla 11.7 . (6)(135,2583 ) - (4,5452)(93,5) 93,5 4,5452
b =- - -- - = 87803 a =- -- 8,7803 - - = 8,9320
(6)(10,7810) - (4,5452) 2 ' ' 6 6
C_~ulemos ahora, para los datos directos en X y en Y, la ecuacin
Los datos han sido ofrecidos por L. Jez.
Y '= a+ bX
228 / Estadistica para Psiclogos Ecuaciones de regresin / 229
Por tanto, la ecuacin logartmica buscada es : tt.3. Sean X = 10, Y = 3X, s,. = 2sx. Esto supuesto , qu p untuacin directa
se podra pronosticar, mediante la recta de regresin de Y sobre X, a una persona
Y' = 8,9320 + 8,7803 log X con p untuacin directa igual a 5,
Sustituyendo en esta ecuacin los valores (0,1, 0,4, ... ) de X , obtenemos los a) si r,>' = 1, b) si r,>' = O, e) si r, ,. = - J?
pronsticos (0,1517, .. .) expuestos en la tabla 11.8.
11.4. Calcular la ecuacin de regresin de Y sobre X, en puntuaciones directas
La correspondiente suma de errores cuadrticos, r ( Y - Y')2, vale 10,6795,
y diferenciales, sabiendo q ue dicha recta debe hacer corresponder a X = 10,
como puede comprobar el lector a partir de la tabla 11.8.
Y ' = 25 y que X = 20 e Y = 45.
Calculemos ahora, para los datos directos en X y en Y, la ecuacin
11.5. Supongamos que la recta de regresin de Y sobre X hace corresponder
Y'= a + bX a las puntuaciones directas X 1 = 2 y X 2 = -1, las puntuaciones directas Y; = 2,2
e Y'2 = - 2,6, respectivamente. Supon iendo, adems, que X + Y = 12, calcu-
De la tabla 11.8 se deduce : lar cunto valen X e Y'.
11.6. Sabiendo que s, = 6, s, = 5 y s,.. = 3, calcular la recta de regresin de
l: X = 209,7, l: Y = 93,5, l: X 2 = 22.909,43, l: X Y = 5.217,1 7 Y sobre X, en puntuaciones diferenciales, suponiendo que es positiva la correla-
cin en tre X e Y.
Por consiguiente,
11.7. Suponiendo que X = 5, que Y= 10 y que y = 0,8x, calcular la ecuacin
b = (6)(5.217,17) - (209,7)(93,5) = O1251 93 5 209 7 de regresin de Y sobre X, en puntuaciones directas.
a= - O 1251 = 11 2111
(6)(22.909,43) - (209,7)2 ' '
6 ' 6 '
Consiguientemente,
EJERCICIOS
El coeficiente de correlacin de Pearson, r x>'' medio, E:,. cometido al atribuir a cada persona, como puntuacin. la media Y.
y las rectas de regresin I. ( Y- Y') 2
A su vez, - -- .. , que designaremos por
n
es el cometido al atri- s;.., E;,
buir a cada persona la puntuacin Y' obtenida mediante la recta de regresin.
. , I.(Y ' - Y)2 '.E(Y- Y)2 I.(Y- Y') 1
Fmalmente, segun ( 12.1 ), - -- - ~ = -- -- -~ - - .. --- - - , que de-
n n n
signaremos por s;-,
no es ms que la diferencia entre el E;, cometido valindonos
de Y y el E;, cometido valindonos de Y' . En otras palabras, es aquella parte del
E;, que dejamos de cometer por el hecho de atribuir Y' a cada persona en vez de
atribuirle Y.
12.1. r;r como ndice de reduccin de error en los pronsticos Por consiguiente,
5: __ sL_ _ parte de E;, eliminada
Vamos a considerar, en concreto, la recta de regresin de Y sobre X. Algo
anlogo valdr para la recta de regresin de X sobre Y.
s; - s;. + s;. - parte de E;, eliminada + parte de E;, no eliminada
= proporci n de E;, eliminado
o, de otro mod o, proporcin en que reducimos el E;, primitivo, el que co-
Y,
y
metamos valindonos de Y. Si, por ejemplo, ese cociente fuera igual a 0,65,
'}
1
Y, - Y,
'
Y'
ello significara que habamos reducid o el E;, en un 65 por 100, es decir, que,
valindonos de Y', slo cometeramos un 35 por 100 del que habramos co-
metido valindonos de Y.
Y, - y 1
1r]! -
Pero,
xy) s.2 2
Y ', - y
y
5:
s;
I, y 2 /n
s;
2
b I, x /n
- - 2- -
.s,.
2
_ b s;
--2
2
.s,,,
(
I,
= L Xs2
2
y
2
=
es;
:::1:)
2
Sx
2
s,
-- ~ - -- ( ~ ) : .- . 2 (12.2)
X s~ s; SXS}'
rX)'
El primero nos indica que, valindonos de la recta de regresin , hemos eli- Como ejercicios (ta mbin se encuentran propuestos al final del captulo ), el
minado o reducido por completo el E;
primitivo, el que ha bramo s cometido lec tor se encargar de proba r que
atribuyendo Y, como puntuacin en Y, a cada una de las personas d e la muestra.
Ahora bien, s s;.,
= O, entonces, segn (12.3), r;,
= l; luego a reduccin total L y2 = :E (y _ y 2 + L y 2 112.7)
del E;, corresponde r;>
. = J. Recprocamente, si r;y = l , entonces, segn (1 2.3 ), L z; = L (z,. - z;J2 + L :;2
s;., r;,
= O; luego a = 1, corresponde reduccin total del pri mitivo . E; (12. 8 )
El segundo caso extremo nos indica que, valindonos de la recta de regresin,
EJEMPLO 12. 1. Comprobemos las rela ciones aca badas de exponer , recordan-
no hemos reducido en nada el E;
que cometamos atribuyendo Y, como pun tua -
do la tabla 11.l del ejemplo 11. 1. Valindonos de esta ta bla for memos la siguiente :
cin en Y, a cada una de las personas de la muestra. Ahora bien, si = O, en- s;-
tonces, segn (12.3), r;,
= O; luego a reduccin nula del E;
pr imitivo , correspo n-
de ,;,. = O. Recprocamente, si r;>. = O, entonces, segn (1 2.3), = O; luego a s;, (Y - f)' 1 ., 1 y ty - y) --
..- i", -,,,' f )" ...
, ;>, = O, corresponde reduccin nula del E;, primitivo.
t) -
J :, 'y - y 1' -
-= I r - l 1 1, - 1 l ,'
En conclusin, 0 .00 7,05 - 1.95 - o.ns 1.95 0 .3~ ~ .l 8025 o JCJ St.:'S J ~02'.'i
a ,;>, = 1, corresponde reduccin total del E;, primi tivo y recproca mente.
8)
0 .25
2,2l
I 0.9S 1.95 0.325 IOS O t7S 1 1025 O.Ol06JS i im2~
1 o 1056:.\
!J HJ562,
I"""""'"
9 .00 0.00 0.000 - uoo
a r;,. = O, corresponde reduccin nula del E; primitivo y recprocamente. SI
9
2.25
o.is
14.85
J .l S
5.8 5
- 5.8 5
0.975
-0.975
- 9.00
.ll S
l.i l
0.5 25
0.4 7S
8 1.0000
9 9)2~
k.i 22 5
21 50000
02 15fr2)
0.225&'!!
OIIOIKI
14 :!.:'.:'~
l -1,! 225
O Q50t, 2'i
O.'lSOb.:' 5
180 .\.00 4 5.00 O 00 0 000 0 .00 "000 JO l <J<.tJ< I 2 ~X i ~Ol 7t,IJSOO 2 112 ~00
El valor s )' .x sue le ser llamado error tpico de estimacin . 1
Sy s,.s,,
La de finici n de r;,. como Comprobac in de (12.3) :
s_r _ :E ( Y' - Y)2 ( 12.5 )
s; - :E ( Y - Y)2 1 - s; x/s; =1 (1 03,95 )/ (5) = _ 0,5775 = 0,4225 "'
(180)/ (5)
1
-:r
:E (Y - Y' ) 2
= l - ---'--,..C. (12.6)
:E ( Y - Y)2
tiene la ventaja de su paralelismo con la de fini cin de o tros coeficientes de corre- _ " En el captulo an tcrjor, en (l 1.30) hemos visto que r~1 = s;,, . Ahora vemos comprobada esta
lacin como ndices de re duccin de error. Unos diferirn de otros en diversos igualdad. En efecto,
aspe,ctl s accidentales, pero todos ellos c oincidirn en ser ndices de reducci n
de error.
1
, ., =
2. 1125
O, 4225 = - - = l:
5
.,
,,,, ,
= -';
El coeficiente de corre/ac,n de Pearson / 235
234 / Estadstica para Psiclogos
Comprobacin de (12.8):
12.3. r;rcomo proporc1on de la varianza
de Y asociada a la variacin de X
:E (z,. - z;.)2 + :E z;.2 = 2,8875 + 2,1125 = 5 = }.: :;
La relacin Y= Y ' + {Y - Y') es una pura identidad que p uede ser inter-
NoTA. A pesar de Jo expuesto, es posible que = O, valiendo r;,.
= O. s;., pretada aceptando que la p untuacin directa obtenida es igual al pronstico ( }" )
Esto sucedera si todos los puntos estuvieran situados sobre la recta de regresin ms el error en dicho pronstico {Y - Y').
y sta fuera paralela al eje OX. Ciertamente, s;.x
= O. Adems, .s; = O. Por tan- Sabemos que Y' = a + bX. Esto nos indica que Y' depende, es funcin de,
to, s;.= O - O = O. Consiguientemente, ,;,. = s;,/s;
= OJO, quedara indetermi- est asociada a, X. Ms concretamen te, dado que a y b son dos constantes, valdr
nado. Sin embargo, tiene sentido admitir rx,. = O, ya que en esta situacin, tanto 1 el coeficiente de correlacin de Pearson entre X e Y' (es decir, entre X y a + bX).
a puntuaciones altas como medias y bajas en X, corresponde una misma puntua- segn lo dicho en 10.2.3. b. Puesto que Y' = u + bX, si suponemos que r., es po-
cin, Y, en Y y, por tanto, la covariacin entre X e Y es nula . sitiva, a puntuacin baja en X, corresponder pronstico bajo en Y ; a puntuacin
media en X, corresponder pronstico medio en Y; a puntuacin alta en X, co-
rresponder pronstico alto en Y. Adems, siempre y slo cuando hay variacin
12.2. r;,.como ndice de aproximacin de los puntos en la variable predictora X, la habr en el pronstico Y'. Todas las personas que
a la recta de regresin no difieran en X, tampoco diferirn en Y '. A su vez, todas las personas que difieran
en X, diferirn, tambin, en Y' .
Por el contrario, Y - Y' no depende, no es fun cin de, no est asociado a,
Hemos visto en el prrafo anterior que r;,.
= l - :E ( Y - Y' ) / }.; ( Y - Y)2. 1
X. De hecho, rx,,-,. = O. A puntuacin baja en X , puede corresponder error
De aqu se deduce inmediatamente lo siguiente: bajo, medio o alto en Y. A puntuacin media en X , puede corresponder error bajo,
a) Si todos los puntos (representantes de las puntuaciones obtenidas) se en- medio o alto en Y . A puntuacin alta en X, puede corresponder error bajo, medio
cuentran sobre la recta de regresin de Y sobre X, entonces, Y = Y' para 2toda o alto en Y. Como se ve en la figura adjunta, ta nto entre las perso nas con X = X,
persona de la muestra. Por tanto, Y - Y' = O. Consiguientemente, :E ( Y - Y') = O. (puntuacin baja en X), como entre las personas con X= X 2 (puntuacin media
Es decir, r;,r;,.
= l. en X), como entre las personas con X = X 3 (puntuacin alta en X) , a unas les
b) Si = 1, entonces, :E (Y - Y')2 = O. Ahora bien, como los sumandos n corresponden errores grandes (a las que se alejen bastante de la recta de regresin ),
son no negativos (por ser cuadrticos), si su suma es cero, quiere decir que cada a otras medios (a las que se alejan moderadamente de la misma), y a otras peque-
uno de ellos tiene que valer cero. Por consiguiente, Y - Y' = O, es decir, Y = Y', os (a las que se alejan muy poco de dicha recta).
para toda persona de la muestra. En otras palabras, todos los puntos se encuen-
tran sobre la recta de regresin de Y sobre X.
En conclusin:
Si todos los puntos se encuentran sobre la recta de regres10n, = 1. r;,.
Si r;,,
= 1. todos los puntos se encuentran sobre la recta de regresin.
Por consiguien te, r;,
nos mide la aproximacin de los puntos a la recta de re-
gresin. Ntese, por tanto, que lo que mide r,,. es la aproximacin de los pun tos Y' = j
a una lnea recia. Es posible que todos los puntos se encuentren exactamente sobre
una lnea curva, que exista una relacin funcional (no lineal) perfecta entre X e Y
que n,s permita pronosticar un valor exacto de Y para cada valor dado de X, y
que (,,. valga cero. Recurdese a este respecto el ejemplo propuesto en el aparta-
X=X, X = X, X = X,
do 10.4.
236 / Estadstica para Ps,clogos El coef,c,ente de correlac,n de Pearson / 237
Por otra parte, hay variacin en los errores, cuando no la hay en la varia ble ticular, salud, motivacin, tiempo dedicable al estudio) que hacen diferenciarse
predictora, X. Es decir, a las personas con una misma puntuacin en X, les co- sistemticamen te a los estudiantes en el rendimiento escolar, pero no en el test
rresponden, en general, distintos errores en los pronsticos (a unas, pequeos; de aptitud. No por poseerlos en alto grado se obtendrn sistemticamente pun-
a otras, medios; y a otras, altos). tuaciones altas en el test de aptitud , ni por poseerlos en bajo grado se obtendrn
Sabemos, adems. que necesariamente puntuaciones bajas. Naturalmente, a nosotros nos in teresa en-
contrar tests cuya correlacin con el xito escolar sea muy grande, es decir, que
i:; (y _ Y)2 i:; ( y _ yi i:; (y _ Y')2 sea muy grande la proporcin de varianza del xito escolar que se encuentre aso-
~ -- = n
+- - n ciada a la variacin en los tests predictores.
n
s; = s2y + s;.:x NOTA l. Dado que s; = s;.- + s;.x, necesariamente _s;. 5 s;. Por otra parte,
2
En otras palabras, la varianza total de Y (s;) se descompone en dos parles adi- ,;, = ~- Consiguientemente,
s,,
r;, :,; l . De donde, - 1 :,; rx,. :,; l. As vemos com-
tivas. Una, s;., asociada a, dependiente de, explicada por, la variacin de X, ya probada de otro modo la propiedad -1 :,; ,.,. :,; l.
que Y ' estaba asociada a, dependa de, era explicada por, la variacin de X . Otra,
s;..,, no asociada a, no dependiente de, no explicada por, la variacin de X, ya NOTA 2. Ntese que s,. = Js;, + s;., j s,.. + s,.x Es decir, la desviacin
que ( Y - Y') no estaba asociada a, no dependa de, no era explicada por, la va- tpica total de Y no es la suma de dos desviaciones tpicas, una asociada y otra no
riacin de X. asociada. De aqu que no podamos decir que 'xy es la proporcin de desviaci n
Por estas razones, llamaremos a s;, varianza asociada, y a s;..x la llamaremos tpica asociada a la variacin de X.
varianza no asociada. NOTA 3. Es claro que la correlacin entre puntuaciones obtenidas (y) y pun-
s2 s2 si
Ahora bien, sabemos que r;, = 1
s,,
Pero, 1 = 2 2 ,
s, s, + s,..x
dentro de este con- tuaciones pronosticadas (y' ) indicar la precisin del pron stico. ste ser tanto
ms preciso, cuanto mayor sea dicha correlacin. Ahora bien,,,,. = :E yy'fns,s,.. =
texto, no es ms que la proporcin de varianza asociada (cociente entre la varianza = :Ey bxfns,lblsx = l:E xyl/nsxs,. = lrx,-1- Por tanto, lrx,-1aparece claramente como
asociada y la varianza total de Y). Por tanto, r;,
representar esa proporcin de va- ndice de precisin en el pronstico.
rianza asociada. Si, por ejemplo, ,.,. = 0,70, diremos que 0,49 es la proporcin de 2 2
varianza asociada y que 0,51 es la proporcin de varianza no asociada. De otro NOTA 4. La definicin r;, = ~s,. =
1 - ~ nos puede ayudar a comprender
s,,
modo, diremos que el 49 por 100 de las diferencias individuales en Y est asocia- cmo la variabilidad de las puntuaciones en dos variables correlacionadas influ-
do, depende de, es explicado por, es atribuible a, las diferencias individuales en X
ye en el valor del coeficiente de correlacin de Pearson entre dichas variables.
y que el 51 por 100 restante no est asociado a, no depende de, no es explicado por,
Consideremos el grupo siguiente, compuesto de diez observaciones y dividid o
no es atribuible a, las diferencias individuales en la variable predictora, X. en dos subgrupos, cada uno de ellos compuesto de cinco observaciones.
La idea de r;,
como proporcin de varianza asociada puede quedar aclarada
as. Sea X un test de aptitud y sea Y el rendimiento a fin de curso. Este rendimien-
to depende de varios factores. Quien los posee en alto grado, obtiene puntuacio- y
X subgrupo 1. 0
nes altas a fin de curso, quien los posee en bajo grado, obtiene puntuaciones bajas - -
l
a /in de curso. De estos factores, unos son tales que quien los posee en alto gra- 1 12,80
do, obtiene, tambin, puntuaciones altas en el test de aptitud y quien los posee en 3 2
5 )'.X = - 5 - = 2,56, S2 = ~ = 4
y 5
bajo grado, obtiene, tambin, puntuaciones bajas en dicho test. En cambio, exis- Subg. 1.0 5
ten otros factores tales que quien los posee en alto grado (y obtiene altas puntua- 4 2 56
ciones a fin de curso), obtiene bien puntuaciones altas, bien medias, bien bajas 7
,2
X)
= t _ 4 = 1 - 0,64 = 0, 36
en el test de aptitud ; sucediendo algo parecido con los que los poseen en bajo grado. Grupo total ~ subgrupo 2.0
Por consiguiente, la varianza total del rendimiento escolar (es decir, la diferen- 11
!"
ciacin de los alumnos en buenos y malos a fin de curso) queda descompuesta en 12 9
dos partes: una debida a los primeros factores (varianza asociada) y otra debida Subg. 2.0 14 7 s2
y.x
= 12,80
5
= 2,56, s; = 520 =4
a 1os segundos (varianza no asociada). La primera es debida a unos factores que 16 13
hacen v;friar, diferenciarse sistemticamente, a los estudiantes en el test de aptitud 15 10 2 56
y en l rendimiento escolar. La segunda es debida a otros factores (profeso r par-
,2
.,. = l _ ,4 = 1 - 0,64 = 0,36
238 / Esradisuca para Psiclogos
El coeftCtente de correlacin de Pea rson / 239
2 25,6 130
S,,
.X = ~
10 = 2' 56 '
2
\ ,. 13
10
L Y - Y)2
,.2 = 2,56
1 - 0,197 = 0,803
s; 11
error cuadrtico medio cometido al atribuir a cada perso-
na, como puntuacin, la media l'. (Bajo otro pun to de vis-
,'Y
13 ta, varianza total de Y.)
2
2 !: (-y-- - Y'l- error cuad rat1co
me d 10
. que aun cometemos a1 a tn' b mr
. a ca d a
5 .x -
i 1 v : i '
1 i 1 1 1 s,. s,.
5
l
1 1 , 1 :Y. 1
1 1
1
1
1
1
1 1
1
1 1
' ;
l
1 1 ! ./' 1 1
i 1 1
1 1 1 l
7. V, i 1
1
'
1
l ! i 1
'
1
l i 1
EJERCICIOS
!
J : l 1
1
1 1 ! 1 1 1 : i 1
...... ! T l 1 : : 1 1 1 1
2 3 4 5 6 7 8 9 JO 11 12 13 14 15 16 17 18 19 20 12. 1. Sean b,., y bxy las pendien tes de la recta de regresin de Y sobre X y de X
Grupo l. Grupo 2.0 sobre Y, respectivamente. Demostrar que (b,., )(b,,.) = r;,..
12.2. Demostrar que el coeficiente de correlacin de Pearson (al cuadrado) vale
1 entre las puntuaciones obtenidas en la variable predictora y las puntuaciones
La recta dibujada es de regresin (de Y sobre X ) tanto para cada uno de los d os
subgrupos. corno para el grupo total. La situacin acabada de exponer es artificial,
pronosticad as en el criterio. En otras palabras, demuestre que = l. r;,..
pero bas tante de acu erdo con lo que suele suceder en la realidad. El error cuadr- 12.3. Demostrar que el coeficiente de correlacin de Pearson vale O entre las
tico medio cometido en los pronsticos mediante dicha recta, es el mismo (2,56) puntuaciones obtenidas en la variable prcdictora y los errores cometidos en los
en cada uno de los dos subgrupos y en el grupo to tal. En lo que difieren ambos pronsticos. En otras palabras, d emostrar que r,t,- ,-, = O.
subgrupos es en la variabilidad o dispersin . M ientras q ue = 4 en cada uno s;
de los dos subgrupos, s;
= 13 en el grupo total. Ello hace q ue = 2,56/4 = 0,64 s;.xfs; 12.4. Demostrar que el coeficiente de correlacin de Pcarson vale O en tre las
(para cada subgrupo) sea mayor que s;.xfs;
= 2,56/ 13 = O, 197 (para el grupo total). puntuaciones prono'sticadas en el criterio y los errores cometidos en los prons-
ticos. En otras palabras, demostrar que r,..1,.. ,, = O.
Consiguientemente, r;,.
= 1 - 0,64 = 0,36 (para cada subgrupo) ser menor que
r;,.= 1 - O, 197 = 0,803 (para el grupo total). 12.5. D emostra r que Y - Y' =y - y '.
12.6. D emostrar que I: ( Y - Y ' )( Y' - Y) = O.
12.7. Si y ' = (- 0,25)x, r ,,. tiene que ser negativa. S ( ). No ( ).
12.8. Si en un grupo es y' = 0,30x, y en otro grupo es y ' = 0,20x , r,,, valdr ne-
f'
cesaria mente ms en el pri mer grupo que en el segundo. S ( ). No ( ).
240 / Estadistica para Psiclogos El coeficiente de correlacin de Pearso n / 241
12.9. Sabiendo que vale 5,76 el error cuadrtico medio cometido al pronosti- que X = 4 y que s,.
= 2. En este supuesto, poner las puntuaciones directas que
car las puntuaciones tpicas en un criterio, Y , a partir de las puntuaciones tpicas faltan en el cuadro adjunto.
en un test predictor, X, calcular la desviacin tpica de Y, teniendo en cuenta el
cuadro adjunto.
X y
- - -
6
X y \ 10
- - -
- 1
4,8 j - 5 4
8
-3
l
o
12.15. Sea X un test de habilidad manuiJ e Y la habilidad manual manifestada
en un oficio determinado. Sea 12,96 la parte de la varianza de los operarios en Y
que no est asociada a su variacin en X. Calcular rx,. teniendo en cuenta el cuadro
adjunto y sabiendo que :I: xy = 96. (Suponemos que las cinco puntuaciones di-
12.10. Demostrar que :I: Xy' = :I: Yx' = :E X 'y = :E Y 'x = nrx,sxsy.
ferenciales en X son valores enteros. )
12.11 . Demostrar que :I: Xx' = I: X'x' = I: X'.~ = nr;ysi .
12.12. Demostrar que I: Yy' = :I: Y'y' = :I: Y'y = nr;ys;.
x' y'
12.13. Supongamos:
a) X es un test de inteligencia numrica e Y un examen de aritmtica.
36
b) Sx = 4, S1 = 8. 4 - 2,4
c) Valindonos de Y ' (puntuaciones pronosticadas mediante la recta de re-
gresin de Y sobre X) reducimos en un 56,25 por 100 el error cuadrti- 7,2
co medio que habramos cometido valindonos de Y.
Bajo estas condiciones, poner los valores que faltan en el cuadro siguiente.
(Suponemos que las cinco puntuaciones diferenciales en X son valores enteros.) 12.16. Demostrar que el cuadrado del coeficien te de correlaci n de Pearson
entre las puntuaciones obtenidas en Y y los errores cometidos en los pronsticos,
mediante la recta de regresin de Y sobre X, es igual a 1 - r;,..
En otras palabras,
y'2
demostrar que r; _
, = 1 - r;,..
X y'
12.17. Comprobar cmo se verifica la anterior propiedad en el ejemplo siguiente :
- 6
-3 X y
o 4 7
9
3 l
5
5 9
7 13
12.14. .,.,Supongamos que la pendiente de la recta de regresin (en puntuaciones
directs) de Y sobre X vale 1/ 3, que z. = z,.
(para toda persona de la muestra),
242 / Estadistica para Ps,clogos
12.18.
12.19.
Calcular la pendiente de la recta de regresin de Y sobre X sabiendo que
r,y- = 0.6, s; = 4 y s;..x = 10,24.
Demostrar que L y 2 =L (y - y ')2 +L y'
2
13
12.20. Demostrar que L z; = L (:,. - z;.)2 + L z;,2. Relacin (curvilnea) entre dos variables :
12.21. Sabiendo que para cinco personas la pendiente de la recta de regresin Razn de correlacin
(en puntuaciones directas) de Y sobre X vale 0,2, sx vale 8 y s;.x/s;.- vale 9/ 16, ca lcu-
lar el error cuadrtico medio que an seguimos cometiendo al valernos de dicha
recta de regresi n, en vez de atribuir a cada persona, como puntua cin, la media Y.
2
12.22. Demostrar que I: y (y - y') = :E (y - y ') .
12.23. Comproba r cmo se verifica la propiedad anterior con los datos del ejer-
cicio 12. 17.
13.1. Introduccin
<
~
"'
;:
<
N ,
..
, +
+
1- ~
, ,. < : : \~ ~ ~. > ~
.)(XIII(
K X
~
.W
,<
"'
..... .
,+,
;J
;:)
;..
+ +
....
.+. f
+
- EDA D
244 / Estad,sr,ca para Psiclogos Relacin (curv,lmea) entre dos vanables: razn de correl aci n / 245
13.2. Fundamento y definicin (razn de correlacin medias particul ares, 5' = 8, 5'2 = 1O, l\ = 6 de cada uno de los tres grupos,
de Y sobre X) . pronosticaremos a cada persona, como puntuacin en Y, la media del grupo a
que pertenece de acuerdo con su edad. As, por ejemplo, si sabemos que una per-
Comencemos con un caso particular. Sea X la edad e Y una prueba de habili - sona tiene dieciocho aos, le atribuiremos JO como puntuacin en Y, por ser JO
dad mecnica. Supongamos 50 personas distribuidas segn la tabla siguiente: la media de las personas cuyas edades oscilan entre quince y veinticuatro aos.
Esperamos que, valindonos de la media del propio grupo, en vez de valernos de
TABLA 13.l la media del grupo total, mejoraremos nuestros pronsticos en Y.
Pasemos ahora al caso general. Sea una variable X descompuesta en s cate-
X goras (en el ejemplo anterior, s = 3). Sea n, el n mero de personas pertenecientes
EDAD a la categora e ; es decir, sea 11 1 el nm ero de personas pertenecientes a la catego-
25-34
ra l, sea n2 el nmero de personas pertenecien tes a la categora 2, . .. , sea ns el
5-14 15-24
nmero de personas pertenecientes a la ca tegora s (en nuestro ejemp lo, 11 1 = 15,
to 10 7 n 2 = 25, n3 = JO).
8 8 7
7 8 6 TAB LA 13.2
6 14 4
9 12 6 Categora l Categora 2 1 .. . Categora e ... Categora s
10 12 7 1
~
. . .
~
10
10 y = n, Y, + n2 Y2 + + n, Y, + + n, Y,
12
n 1 + n1 + + n, + + n,
12
8
8 En la tabla J 3.2,
120 250 60
Y;,: puntuacin directa de la p ersona i p erteneciente a la ca tegora c.
- 120 . 250 . 60
l', = 15 = 8 ) l = 25 = 10 ), = 10 = 6 Y, : media en Y de las 11, personas pertenecientes a la categora c.
5': m edia en Y de las n personas pertenecientes a todas las categor as, es de-
cir, media total.
120 + 250 + 60 430 Bajo estos supuestos, LL p " - 5' )2 ser la suma de errores cuadrticos (que
f 15_+_2_5_+_ 10_ = 50 = 86 designaremos por E 2 ) cometida al atrbuir a cada persona con puntuacin Y" la
media d el grupo total, Y.
Si s9,lo conocemos la media del grupo total, Y = 8,6, pronosticaremos a cada 1:1: (Y,, - i\ )2 ser la suma de errores cuadrticos (E 2 ) cometida al atribuir
una de -~sas 50 personas 8,6 como puntuacin en Y. Si conocemos. adems. las a cada persona con puntuacin Y;, la media. Y,, de la categor a e a la que pertenece.
246 / Estadistica para Ps,clogos Relacin /curvilinea) entre dos var,ables: razn de correl ac,n / 247
Ahora bien , En la segunda frm ula, Y; es el pu nto medio del intervalo j de la variable Y,
n1 es el n mero de personas dentro del mismo intervalo j. El ndice j va de I a r ,
II ( Y" - i' )2
= II (Y" - Y,) + 15', - f )l2 = Ir ( Y" - 9,)2 + siend o r el nm ero de inter valos.
+ In,lf~ - 9)2 ( 13. I ) Observemos el gran paralelismo entre ,;, y r;,. Segn la ecuacin (12.l ),
pues
I ( Y, - 9) 2 = I ( Y, - l',')2 + I ( Y/ - l1 )2
2 II ( Y,, - i', )( i', - Y) = 2 I ( f, - i') I ( Y" i', ) = o
' Llamemos Y,, a la puntuacin en Y de cada persona i cuya puntuacin en X
ya que p ara categora c. es decir. para cada valor fijo de e, es X, . Sean n, las personas con X = X, . A todas ellas las deberemos atribuir el
mismo pronstico, que llamaremos r;. Su puesto esto, la anterior igualdad q ue-
dar as:
:E ( Y;, Y,l = o
de acuerdo con 5.2.3.a. II ( Y., - 9)1 = II ( Y., - Y; )' + In,( Y,' - 9) 2 (13.4 )
Por consiguiente,
In,(9, - 9)2 = II(Y" - 9)2 - II ( Yic - i',)2 Pues bien. en la pgina anterior veam os:
2 In,( Y; - 9) 2
representa la proporcin en que ha sido reducida la suma de E pr imitiva (la co-
metida mediante Y) al valernos de Y,. S, por ejemplo, este cociente valiera 0,60,
r;,. II ( Y., - 9 )2
(1 3.5)
quiere decir que la suma de E 1 primitiva ha sido reducida en un 60 por IOO. Es I n,(Y, - f) 2
2
decir, que atribuyendo a cada persona la media , f,, de su propia categora, slo ,,.. = II I Y.,- 9) 2
(1 3.6)
cometemos un 40 por 100 de la suma de E 2 que cometamos atribuyndole la me-
dia total, Y. Pues bien, por definicin, llamaremos razn de correlacin (de Y
Las expresiones (13.5) y (13 .6) representan lo mismo: proporc1on en que re-
sobre X), o 1, , , a ducimos la suma de errores cuadrticos primitiva (la cometida valindonos de
In,( f, - Y) 2 f) al valernos bien de la puntuacin dada por la recta de regresin (13.5 ), bien
IJp = (13 .2) de la media de cada una de las categoras (13.6 ).
I I (Y;, - f )2
cuando los da tos no estn agrupados en intervalos en la variable Y.
13.3. Clculo
I 11, ( f, __: fJ 2 (13.3 )
IJ.-x = LIIJ(YJ - >' )
2
a) Datos no agrupados en in/erra/os
f" .
cundo los datos estn agrupados en intervalos en la variable Y. Es una mera aplicacin de (13. 2 ).
~
248 / Estadistica para Psi clogos Relacin /cur vlirnea) en tr e d os varia bl es: razn de correlac,n / 249
EJEMPLO 13.1. Calculemos la razn de correlacin, de Y sobre X , (de la ha- Ntese cmo ( 3 )( 11 - 8)2 + (9)(8 - 8)2 + (3 )(5 - 8)2 + (3 )(14 - 10,04) 2 +
bilidad mecnica sobre la edad) a partir de la tabla 13.1. + (12)(11 - 10,04) 2 + (9)i!l- 10,04)2 + ( 1)(5 - 10,04) 2 + (31(8 - 5,9 )2 +
2
+ (7)(5 - 5,9)2 = 193,86.
I:I: (Y;, - Y) 2 = (10 - 8,6) 2 + + (5 - 8,6) 2 + (10 - 8,6) + +
8,6)2 + (7- 8,6)2 + + (6 - 8,6)2 = 51,4 + 169 + 75,6 =
+ (8 - Ntese, consiguientemente, cmo 324 = 193, 86 + 130.14
La interpretacin de la tabla anterior es la sigu iente:
= 296
I:I: ( Y;, - Y,)2 = (10 - 8) 2 + + (5 - 8) 2 + (10 - 10) + + (8 -
2
10)2 + n 1 : personas de ntro del intervalo j en la variable Y. En los cuatro in -
+ (7 - 6)2 + + (6 - 6)2 = 46 + 120 + 8 174 = tervalos de nuestro ejemplo tenemos 3 + 1 + 7 = IJ; 9 + 9 + 3 =
2 = 21 ; 3 + 12 +O = 15 ; O + 3 + O= 3.
I: n,( Y, - Y) 2 2
= (15)(8 - 8,6) + (25)(10 - 8,6)2 + (10)(6 - 8,6) =
= 5,4 + 49 + 67,6 = 122 Y1 : punto medio del intervalo j en la vara ble }'; los cuatro puntos me-
do s son 5, 8, 1 1, 14.
(Y; - Y)2 : ( - 3,6)2 = 12,96 ; (-0,6) 2 = 0,36 ; (2,4) 2 = 5,76 ; (5,4)2 = 29, 16.
13.4. Propiedades
que respecto a cualquier otro valor, en particular que l',', sa lvo el caso Y, = r;
en el cual ambas sumas seran iguales. Por consiguiente,
11) 11;, es igual o mayor que cero e igual o menor que l. 2Es decir, O :; 11;" :; :E:E ( Y, - Y,')2 rr ( Yir - Y,- )2
En efecto, segn (13.l), :En,( Y, - Y)2 :; :E:E (Y;, - Y) Por tanto, teniendo ==:-:-:=---:--':- >
:E:E ( y" _ y2 - :E:E ( y" _ y2
en cuen!a (13.2), 11;, $ 1.
Por otra parte, 11;" es el cocien te de dos expresiones no negativas y, por tanto, Es decir,
no negativo. Es decir. 11;, O.
Consideremos ahora los dos casos extremos posibles : 11;, = 1, 11;, = O.
En primer lugar, teniendo en cuenta (1 3.2) y (13.1), podemos escribir: (
1 _ n (Y,, -
:E:E(Y,,- Y)
~ ): ) 5 (i _n (Y;, -
1::E( Y., - Y)
~l: ) o r;x-5 '1:x
L w m
lido de Y. Recprocamente, si reducimos a cero la suma de erro res cuadrticos
primitiva, si no cometemos errores en nuestros pronsticos, quiere decir que
2
Y;, = Y, para toda persona de la muestra y, consiguientemente, !::E ( Y,, - Y, ) = O.
Pero si esto sucede, 11;, = 1, de acuerdo con (13.7).
En conclusin, a ,;,
= 1, corresponde reduccin total del error primitivo y
a reduccin total del error primitivo corresponde = 1. ,;, ( A) ( B) (CJ (D)
Si 11~, = O, teniendo en cuenta (13. 7), :E:E ( Y,, - Y, )2 = 1::E ( Y,, - Y)2.
Esto significa que nos da lo mismo usar Y, que Y en nuestros pronsticos, ya que
valindonos de Y,, seguimos cometiendo la misma suma de errores cuadrticos la relacin ser positiva, en (B) negativa, en (C) y en (D ) no tiene sentido hablar
que cometamos valindonos de Y. Recprocamente, si la suma de errores cua- de signo, a no ser que consideremos por separado la parte izquierda y la parte
drticos sigue siendo la misma valindonos de Y, que valindonos de 9, tendremos derecha de cada una d e las dos curvas. Para cada una de estas dos mitades pode-
:E:E (Y;, - 9,)2 = :E:E (Yic - 9)2 y, teniendo en cuenta (1 3.7), 11;:. = O. mos- atribuir signo tanto en (C) como en (D).
En conclusin, a ,;,
= O, corresponde reduccin nula del error primitivo y
a reduccin nula del error primitivo, corresponde = O. ,;, d) ,;xes funcin del nmero de categoras. En general, ,;,
tender a ser ma-
yor, al aumentar el nmero de categoras en la variable X . Sin embargo, si stas
b) Para unos mismos datos, $ r;, ,;x son muchas, la media en Y dentro de cada una de las categoras ser poco fiable
En efecto, recordando (13.1), (1 3.4), (13.5) y (13.6), por estar calculada con pocas personas. En general, tender a ser menor, al dis-
minuir el nmero de categoras en X , pero en este caso la media en Y de cada ca-
J _ :E!: ( Y,, - Y:)2 , :rr (yic - Y,)2 tegora ser ms fiabl e. Esta fiabilidad tiene importancia a nivel inferenc!I. Algu-
r;:,; =
!::E ( Yic - Y) 2
r ,., = - :E:E(Yic - 9)' nos autores sugieren que para 100 o ms datos sean elegidas entre 6 y 12 categoras.
Si hiciramos una sola categora, 11;. = O, tendramos Y, = Y. Si todas las
personas tuvieran distintas puntuaciones e hiciramos tantas categoras como
AWora bien, :E:E ( Y,, - r; 2 :E:E ( Y,, - 9,)2, d ado que para cada valor de e
(1, 2. . .. , s) la suma de errores cuadr licos respecto a la media (Y,) es meno1
personas, ,;,
= !, tendra mos en ese caso Y" = 9,.
Relacin /curvilinea) entre dos vaflab/es: razn de correlac,n / 253
252 / Estadistica para Psiclogos
Y, : media en habilidad mecnica de las personas cuya edad estaba dentro de la 2 r 11,( Y, - Y)2
(para d atos no agrupados en intervalos)
'lrx = rr f ric - 9 )2
categora c.
Y: media en habilidad mecnica de todas las personas. 2 r n,( 9, - 9 )2
r;,: proporcin en que quedaba reducida la suma de errores cuadrticos por el r,, = I: n( Y. - 9)2 (para datos agrupados en intervalos )
hecho de pronosticar Y, a cada persona de la categora e en vez de pronos- } }
ticarle Y.
Ahora tendremos, para calcular 17,,. :
EJERCICIOS
X,: media en edad de las personas cuya habilidad mecnica est dentro de la
categora c. 13.l. Calcular la razn de correlacin '1,-x entre las variables X e l', a partir de
X: media en edad de todas las personas. los siguientes datos no agrupados en intervalos (en la variable Y).
17;,.: proporcin en que queda reducida la suma de errores cuadrticos por el he-
cho de pronosticar X, a cada persona de la categora e en vez de pronosti- Los valores numricos dentro de las tablas siguientes represen tan puntuacio-
nes obtenidas en la variable Y.
carle X.
El clculo de 17,,. es anlogo al expuesto para 17,.,. La diferencia est en poner
como puntuaciones X( Y) las que antes ponamos como puntuaciones Y(X). Es a) X h) X c') X
decir, poniendo como intervalos en Y las que antes eran categoras en X, y como
categoras en X los que antes eran intervalos en Y. En particular, en nuestro ejem-
plo, la habilidad mecnica sera la variable X con 4 categoras y la edad sera Y y 1 ~
3
6
8
7
~1
5
1
2
3
5
4
2
4
1
2
5
b
7
6
1
2
con tres intervalos que antes no habamos explicitado (porque no era necesario 3 1 4 4 8 4
2 2 5 5 l 6 7 1
para calcular IJ,,,) y que ahora tendramos que expresar de modo explicito d e acuer- y l 3 3 y 2 4 7
do con los datos en cuestin. Supongamos que stos fueran 5-14 aos, 15-24, 25-34.
2 3 1 8
Pues bien, calcularamos en primer lugar la edad media de todas las personas. 3 3 6
Despus la edad media de las personas con habilidad mecnica (4-6), la de las per- 2 9
sonas con habilidad mecnica (7-9), ... , la de las personas con habilidad me- 2 5
cnica (13-15). Con este esquema previo es ya fcil calcular rfw
e) X d) X
14
l'
1 8-12 18
3-7 2
1
4 ~1 )'
9-11
6-8
3-5
4
7
4
o o 2
J
8
o 8
1 o Relacin entre variables ordinales
0-2 o 11 4 o
donde d, es la diferencia entre el valor ordinal en X y el valo r ordinal en Y del ob- Es claro que r d, = O, p ues no es ms que la diferencia entre la suma de los
jeto i. n primeros nmeros naturales y la suma de esos mismos nmeros.
Para el caso de empates hay otra frmula distinta de (\4.1 ). Sin embargo, con EJEMPW 14.3. En el primer cuadro de la pgina siguiente tenemos las puntua
frecuencia (sobre todo. si el nmero de empates es reducido) suele ser aplicada ciones en nivel de lectura (X) y la conducta en clase ( Y) de diez nios de clase media,
(14. 1), atr ibuyendo como valor ordinal a cada objeto empatado con o tros la media con problemas en ambas variables, sometidos a un programa de recuperacin cuyo
aritmtica de los valo res ordinales que hubieran ocupado esos objetos en caso fin era manifestar la eficacia de las tcnicas de modificacin de conducta en la
de no haber es tado empatados. Por ejemplo, si un objeto ocupa el lugar p rimero, superacin de dichos problemas (Wadswo rth, 1971).
cuatro quedan empatados detrs de l y otros tres quedan empatados detrs de los Es indiferente at ribuir en ambas variables el valor l a la persona con mxi -
anteriores, los valores ordinales de estos ocho objetos seran: 1 para el primero, ma puntuacin , el 2 a la inmediatamen te inferior, etc., que atr ibuir en ambas va-
(2 + >ft 4 + 5)/4 = 3,5 para los cuatro siguientes, (6 + 7 + 8)/3 = 7 para los riables el valor 1 a la persona con mnima p untuacin, el 2 a la inmediatamente
tres l timos. superior, etc. El valor de r, ser el mismo en uno y otro caso.
Relac,on entre variables ordinales / 259
258 / Estadistica para Psiclogos
pero sta era cada vez ms escasa y tardaba ms en aparecer (mayor latencia }. Los
Nivel Conducta
datos sobre la latencia (X) y las gotas de saliva segregadas ( Y) correspondientes
lectura en clase rdenes
y X y d, d.' a siete ensayos de extincin, se hallan en la tabla anterior. Calculemos r, entre
X
X e Y. Tendremos que transformar los valores cuantitativos en valores ordinales.
2,7 40 4 1 3 9 La relacin es nega tiva, indicando que a mayor latencia en la segregacin de
2.2 14 8 9 -1 1 saliva, menor nmero de gotas segregadas.
2,3 18 7 7 o o
2,6 20 5 5 o o
3,1 22 3 4 - 1 14.2.3. Propiedades
3,4 36 2 3 - 1
1,9 17 10 8 2 4
a ) El coeficiente de correlacin de Spearman no puede valer menos que - 1
2,1 13 9 10 - 1 1
16
ni ms que 1. Es decir,
2,4 39 6 2 4
3,9 19 1 6 -5 25
- l :s; r, :S 1
o 58
En efecto, basta con advertir que r, no es ms que un caso particular de r.,.
(6)(58) (a saber, r,, aplicado a unos valores ordinales considerados como puntuaciones).
r, = 1 - (I0)(l0' _ I) = l - 0,35 = 0,65 Esta propiedad puede ser comprobada, tambin, a partir de la frmula (14.l }.
Es claro que los dos casos extrem os de correlacin son los siguientes:
Cada objeto ocupa el mismo lugar ordinal en ambas variables (el que es pri-
Distngase claramente entre r xy aplicado a las autnticas puntuaciones (cuan-
mero en X, es primero en Y; el que es segundo en X, lo es, tambin, en Y; .. . ; el
do stas nos sean dadas), y rxr aplicado a los rdenes originados a partir de dichas
que es ltimo en X, lo es, tambin, en Y).
puntuaciones (es decir, ,, ). Ambos valores, en general, sern distintos.
Cada objeto ocupa un lugar opuesto en am bas variables (el que es primero
EJEMPLO 14.4. Pavlov (1929) haca sonar el tic-tac de un metrnomo en la
en X, es ltimo en Y; el que es segundo en X, es penltimo en Y; .. . ; el que es
habitacin donde se hallaba un perro y, a continuacin, le presentaba comida.
ltimo en X, es primero en Y).
Tras varios ensayos consigui que la puesta en marcha del metrnomo provocase
Como ejercicio, verifique el lector cmo, efectivamente, en el primer caso
r pidamente la secrecin de abundante saliva, como respuesta condicionada . Pos-
r, = l y cmo en el segundo r, = - 1.
teriormente procedi a la extincin de dicha respuesta haciendo sonar el metr-
nomo, sin presentar comida, con lo cual el perro, al orlo, segregaba an saliva, b) Su clculo es ms sencillo que el de r,,. para unos mismos datos, si stos
no son muy numerosos y son escasos los empates.
rdenes
Ensayo X y X y
(segundos) (gotas) d, d,2 14.3. Coeficiente de correlacin de Kendall, T
Jy 3 10 7 l 6 36
7 3 3,5 - 0,5 0,25 14.3.1. Fundamento y definicin
2. 7
3. 5 8 4,5 2 2,5 6,25
4. 4 5 6 5 1 1 Se diferencia de r, en que no se funda en rx, Kendall (1970) considera el orden
5. 5 7 4 ,5 3,5 1 1 de n objetos en una variable y su orden en otra e intenta medir el grado de co-
6. 9 4 2 6 -4 16 rrespondencia entre estos dos rdenes" (pg. 3 }.
7. 13 3 1 7 -6 36 Supongamos n personas y dos variables X e Y. Elijamos dos personas, A y B.
Si A es superior a Ben X e inferior a B en Y o inferior a B en X y super ior a B en
96,5
Y, diremos que se da una inversin. Si, por el contrario, A es superior a Ben X y
+j" superior a B en Y o inferior a B en X e inferior a Ben Y, diremos que no se d a in-
(6)(96,5) 579
r = 1- - ~-- = 1 - - = l - l 72 = - 072 versin alguna o que se da una n o-inversin . H agamos la m isma comparacin
' (7)(72 - 1) 336 ' '
260 / Esu,disuca para Psiclogos
Re/ac,n entre variables ordinal es / 261
con todos los pares posibles, es decir, con los n(n - l )/2, ya que ste es el nmero en segundo lugar la que supera a todas menos a la anterior, etc. Siemp re que en
de pares que se pueden formar con n elementos de manera que cada p ar difiera la tabla una persona tenga por debajo de s alguna persona superior a ella en Y,
de los restantes en uno, al menos, de sus elementos. Llamemos P al nmero de tendremos inversin, pues todas las situadas debajo de eJla en la ta bla son infe-
no-inversiones y Q al de inversiones. Bajo estas premisas, por definicin : riores en X. En el ejemplo acabado de exponer intercambiemos las cinco personas
de modo que en primer lugar se encuentre la que es superior en X a las cuatro res-
P - Q P - Q tantes, en segundo lugar la que es superior en X a las tres restantes. etc. Segn este
r= - - = - -- (14.2)
p + Q l)
n{n - criterio, la tabla anterior quedar reorgani7.ada as:
2
rdenes
14.3.2. Clculo X }'
- --
Es una mera aplicacin de (14.2). B 1 3
EJEMPLO 14.5. Bingham, Moore y Gustad (1959) hicieron que 22 personas e 2 2
que solicitaban un empleo fueran entrevistadas por distintos jueces, cada uno D 3
A 4 4
de los cuales deba ordenarlas segn la presumible aptitud de cada una para el
E 5 5
empleo en cuestin. Por sencillez en los clculos hemos elegido 5 de las 22. En la
tabla adjunta aparece el orden relativo de estas 5 personas propuesto por dos de
los jueces. Comparemos B con las cuatro restantes, fijndonos en la variable Y:
En la prctica, la manera ms sencilla de calcular el nmero de inversio nes a) El coeficiente de cor relacin de Kendall no puede valer menos que - 1
es la siguiente. Las personas son intercambiadas entre s de manera que en una ni ms que l. Es decir, - I :o; r :5 l.
de las dos variables queden colocadas de superior a inferior (o de inferior a su- En efecto, los dos casos extremos posibles son o q ue no haya inversin algu na,
perior).jlupongamos que estn colocadas en X de superior a inferior. Es decir, o que todos los pares sean inversos. En el primer caso Q = O y, por tanto,
en la fabla est situada en primer lugar la persona que es superio r a todas en X , t = P/P = l . En el segundo caso, P = O y, po r tanto, r = - Q/Q = - 1.
262 / Estadistica para Ps,clogos Relacin entre vanab/es ordinal es / 263
b) A partir de -r pueden ser calculados coeficientes de correlacin parcial, jan te o i nverso si la primera persona es superior a la segunda en X e inferior
semejantes a los que calcularemos ms adelante a partir de r x> a ella en Y o si es inferior a la segunda en X y superior a ella en Y. D iremos que
r) Segn Kendall ( I970, pg. 12 ), en la prctica encontramos frecuente- un par est empatado o es un empate si la p rimera persona es igual que la
mente que, cuando ninguno de los dos coeficientes se acercan a la unidad, r. es apro- segunda bien slo en X , bien slo en Y, bien sim ultneamente en X y en Y.
ximadamente un 50 por 100 m ayor que r en valor absoluto, pero esta r egla no es Veamos ahora cuntos de los 990 pa res son semejan tes. Para ello conside-
invariable. Es decir, r, " (3/2),. Conviene, no obstante, advertir que esta regla rem os las tablas siguientes. tod as ellas extradas de la tabla 14.1.
no es invariable .
NOTA . Para el caso de empates existe una frmula especial que no propo- TABLA 14.2 TABLA 14.3 TABLA 14.4 T A BLA 14 .5
nemos porque slo aplicaremos el coeficiente de correlacin de Kendall en situa-
~
ciones en las que no aparezcan empates. Para un estudio ms detallado de pro- X X
blemas relacionados con este coeficiente, vase Kendall (1970).
1
B M A B M IA
14.4.1. Introduccin
Ai
Y/MI
1 fi+~f
\ ''j ' ;,
B 3
y
-
A
B
6
-
4., 8 '
-- ,-
y
A
B
9,
18 '
1
j
.,. _
1
Cuando la muestra consta de muchas observaciones y son muy p ocos los va-
En la ta bla 14.2 son semejantes todos los pares en los que una de las dos per-
lores ordinales alcanzables por ellas, ser muy grande el nmero de empa tes. En
sonas del par pertenezca a la casilla a y la otra a una cualquiera de las cuatro
este caso es recomendable la gamma de Goodman y Kruskal.
casillas e, f, h, i. En efecto, consideremos las casillas a y f, por ejem-
EJEMPLO 14.6. Supongamos dos variables: nivel social (X ) y nivel eco-
plo . Toda persona P., perteneciente a a, es baja en X y baja en Y. Toda
nmico {l'). Consideremos divididas ambas variables en tres categoras: nivel
persona P1 , perteneciente a fo es <mita en X y media en Y. Es decir, P. es in-
bajo (B) . nivel medio (M). nivel alto {A). Esto significa que tanto en X como
ferior a P1 tanto en X como en Y. Por anlogo razonamiento, toda persona P, es
en Y slo son posibles tres valores ord inales distintos. Supongamos que 45 per-
inferior a toda P, , a toda Ph y a !oda P, tanto en X como en Y.
sonas se encuentran distribuidas, segn la tabla 14. 1.
En la tabla 14.3 son semejantes todos los pares en los que una de las do s per-
sonas del par per!cnezca a la casilla b y la otra a una cualquiera de las dos casi-
TABLA 14.1 llas f o i>i. En efecto, toda persona P. es inferior a toda persona P1 y a toda
A persona P, tanto en X como en Y.
En la tabla 14.4 son semejantes todos los pares en los que una de las dos per-
B 1 M A
! sonas del par pertenezca a la casilla <<d y la otra a una cualquiera de las dos ca -
A 1 ! 4 8 ; 13 sillas h o i . En efecto, toda p ersona Pd es inferior a toda p ersona Ph y P, tanto
en X como en Y.
1
y M 6 1 9 < 5 f 20 En la tabla 14.5 son semejantes lodos los pares en los que una de la s dos
' personas pertenezca a la casilla e y la o tra a la casilla i. En efecto , toda per-
B 7 3 b 2 ' 12 sona P, es inferior a toda persona P, tanto en X como en Y.
Por consiguiente, el nmero de pares semejantes ser
14 16 15 45
(7)(9 + 5 + 4 + 8) = 182 (ta bla 14.2)
(3)(5 + 8) = 39 {ta bla 14.3)
Con estas 45 person as podemos formar (44)(45)/2 = 990 pares que difieran (6)(4 + 8) = 72 (tabla 14.4)
en uno, al menos, de sus elementos. Diremos que un p ar es semejante o no =
(9 )(8) 72 (tabla 14.5)
inversif si la primera persona es superior a la segunda tanto en X como en Y o
365
si es inferio r a la segunda tanto en X como en Y. Diremos que un par es deseme-
264 / Estadsttca para Psiclogos Relaci n entre variables ordinal es / 265
De modo anlogo, consideremos ahora las tablas siguientes. todas ellas ex- Veamos, fina lmente, cuntos son los pares empatados:
tradas de la tabla 14. l. a) Las dos personas del par pertenecen a un mismo nivel en X:
tenido
Por tanto,
Ver los conce ptos expuestos en el apartado l 0.5 .
; = 365 .- 95 = 270 _ O 587
365 + 95 460 '
EJEMPLO 14.7. Amn (1969) estudi la relacin entre el prejuicio antipro- 14.6. Apndice: Deduccin del coeficiente
testante y la religiosidad utilitaria (es decir, usada como instrumento para conse- de correlacin de Spearman
guir beneficios bien materiales, bien espirituales) en un grupo de 223 estudiantes
varones de edades entre quince y veinte aos. Los resultados obtenidos fueron Segn sabernos, el coeficiente de correlacin de Spearman no es ms que e l
los siguientes: coeficiente de correlacin de Pearson aplicado a dos series de valores ordinales,
cada una de ellas compuesta por los n primeros nm eros naturales.
Prejuicio a.p. Tambin sabemos que el coeficiente de correlacin de Pcarson. r x, , viene dado por
Bajo Alto
73 69 t42 :E (X - X)(Y - Y ) (1 )
Alta
-- - Jr. (X - Jr. (Y -
,. ;X \
Rel. util. -- - - X)2 9) 2
Baja 64 17 81
-- ~ - - .. - 223
Por otra parte.
137 86
(:EX )2
:E (X - X)2 = r. X 2 (2)
11
.. = (64)(69) - ( 17)(73) _ 4.416 - _ 1.24 1 = 3.175 = 0,56
' (64)(69) + (17)(73) 4.416 + 1.241 5.657
(I. }')2
._!" r. ( y - y )2 = r. , 2 (3)
Una 1' = 0,56 es bastante alta, si nos atenemos a los resultados obtenidos or- n
dinariamente con varia bles de este tipo.
268 / Estadstica para Psiclogos Relacin entre variabl es ordinal es / 269
Puesto que los valores de X (y de Y) son l, 2, 3, ... , n, calcular LX (I Y) 14.7. Resumen: Definiciones y frmulas
y IX 2 (I Y 2 ) equivale a calcular la suma de los n primeros nmeros naturales y
la suma de sus cuadrados. Ahora bien, se demuestra que :
Coeficieme de correlacin de Spearman: Coeficien te de correlacin de Pea r-
son aplicado a dos sucesiones de valores ordinales, considerados estos l timos
1 + 2 + 3 + + n = n(n + 1)/2
como autn ticas puntuaciones:
J2 + 22 + 32 + + n 2 = n(n + 1)(211 + 1)/6
I (X - X) 2 = I xi _ (I X)2 /n = 11(11 + 1)(211 + ) _ 112(11 + 2 Coeficiente de correlacin de Kenda/1: ndice que nos mide el grado de seme-
6 411
janza entre los valores de dos sucesiones .ordinales. Ms concretamente, siendo
4n 3 + 2n 2 + 4n 2 + 2n - 311 3 611 2 311
P el nmero de no-inversiones y Q el nmero de inversion es, por definicin,
12
3 2
= 11 - 11 = 11(n - l) (4 )
12 12
P-Q
T= P+Q
Por anloga razn,
2
11(11 - !)
I(Y - Y) 2 (5 ) Gamma de Goodman y Kruska/ : Proporcin de pares semejantes o no-inver-
12
sos, dentro de los no empatados, menos proporcin de pares desemejantes o in-
versos, dentro, tambin, de los no empatados :
Llamemos d = X - Y a la diferencia entre el valor ordin al en X y el valor
ordinal en Y de la persona i. Advirtiendo que X = Y es decir, X - Y = O, y, te-
niendo en cuenta (4), nos queda:
.., ns lld ns ~ n4
, = - - - - - =--
I d 2 = I [(X - Y) - (X - Y)]2 = ;[(X - X) - (Y - Y)]2 = n, + nd n, + nd n, + nd
= ;(X - X) 2 - 2I (X - X)(Y - Y)+ :E (Y - Y) 2 =
2
1
= 2 n(n - l - u: (X - X)( Y - Y)
12
De donde,
2
I c/2 EJERCICIOS
L (X - X)(Y _ y= n(n - J) (6)
12 2
14.1. En un colegio femenino socioeconom1camente medio-alto, siete alumnas
fueron ordenadas de 1 a 7 segn el mayor o menor grado en el que crean haber
En conclusin, teniendo en cuenta ( 1), (4 ), (5 ) y (6 ), nos queda:
alcanzado las cosas deseadas. Cada a lumna lleva asignados los ingresos fami -
liares mensua les. Los datos son los siguientes: J. F . (250.000 p tas. o ms ), L. P.
n(n 2 - 1) :I: d 2 n(n 2 - 1) - 6 :I: d 2
- - (210.000), M. A. (115.000), P. E. (72.000 ), A . Q. (78 .000), E . R . (143.000),
12 2 12 6 I d2 V. G. (85.000). Calcular el coeficiente de correlacin de Spea rman .
r = 2
=
n(n 2 -
= ! - -2- -
' /' /11(11 - 1) n(n2 - 1) 1) n(n - 1)
14.2, A p artir de los datos del ejercicio anterior, calcula r el coeficiente de co -
12 12 12 rrelacin de Kendall.
Relacin entre vanables ordinales / 271
270 / Estadistica para Psiclogos
8
6
7
8
7
6
Y, 6 16 Y, JO
-~ ~- ~- --
Y, 1 8 i 4
-~~~-~
Y1 20 8 yl 2 41 8 2
14.4. A partir de los datos del ejercicio anterior, calcular el coe!iciente de co- Y, i 2: 4 6
rrelacin de Kendall.
14.5. Calcular el coeficiente de correlacin de Spearman entre X e Y a partir
de los cuadros siguientes. (Los nmeros dentro de cada cuadro son puntuacio-
nes en las variables X e Y. Como se sabe, estas puntuaciones deben ser transfor- x, 1 x, x, X, x.
d) x, x, x, e) f) X,
madas en sus correspondientes valores ordinales.)
y 4 3 3
y y d) X y
Y, 2 10 12 Y, 1 3 I 7 --6 -
a) X y b) X e) X
- - - - -- --- - -- Y, 3 6 4 Y2 1 61 5 r, 3 4 2 2
6 10 48 28 25 18 18 15 - - -
2 33 37 24 15 14 15 Y, 5 5 2 Y1 1 8 I 4 rl 2 1
- - --- -- . -~ ' 4
4 7 51 34 20 14 24 19
24 6 1 yl 2 2 3 5
2 9 12 46 20 10 28 Y1 J 10
5 8 43 42 18 12 26 15
20 7 14 30
28 32
---
15 (A 2B 1 ) : nmero de protestantes
latin os .
(A 1 ): nmero de catlicos.
( A 2 B 2 ) : nmero de protestantes
sajones.
(A 2 ): nmero de protestantes.
(B, ): nmero de latinos. (B 2 ) : nmero de sajones.
Relacin entre variables nominales
n: nmero total de personas.
(A 1 B 1 ) = (A ,B2 )
(15.1 )
(B,) (B2 )
A 1 (catlicos) A 2 (protestantes)
Esto es obvio, pues si no existe relacin entre raza y religin , la proporcin
B 2 (saj.) (A,Bi) (A2B2) (B 2) de protestantes entre los latinos debe ser la misma que entre los sajones. Las re-
RAZA - laciones (15. 1) y (15 .2) se implican mutuamente. Si es verdadera una cualquiera
B 1 (}al.) (A 1B 1 ) (A 2 B 1 ) (B, ) de las dos, tiene que serlo, tambin, la otra.
Si, adems, tenemos en cuenta una conocida propiedad de las proporciones,
(A, ) (A 2) n (15.1) y ( 15.2) llevan consigo
En conclusin, de acuerdo con ( 15.3) y ( 15.4 ). la indepen dencia entre raza y sustituimos en ( 15.9), (A 1 ) . (B 1 ) y n por sus correspondientes valores, llegamos
y religin implica (y es impl icada por) las siguientes relaciones: fcilmente a
(A1B2l = ~ (B2) (15.6/,) que valdn cero en caso de independencia y que ser distinto de cero si existe al-
(ABz) = (A 1)(B2 ) (15,611). o sea ,
11 11 11 11 guna dependencia o relacin en tre las dos variables de q ue se trate, segn lo aca-
bado de ver hace unos instantes .
(A 2B)=~(_!!..!.!_ 115 .71,J As. por ejemplo. en la ta bla 15.1. existe independencia entre raza y r eligin.
(A2B,) = (A2)(B1) (15.7u). o sea.
n 11 11 11 Por el contrario. en la tabla 15.2. existe una gran relacin entre a mbas variables,
pues la mayora de los catlicos tienden a ser latinos, la mayora de los latinos
(A 2B2) = (Az) ~ (15.8h) tienden a ser catlicos, la mayora de los protestan tes tienden a ser sajones y la
(A2B2) = (A2HB2) (15.8a). o sea.
11 11 n mayora de los sajones tienden a ser protestantes .
11
Si es cierta una cualqu iera de las relaciones (1 5.511). (1 5.6a), ( 15.711) y (15.8a), TA BLA 15.1
lo son, tambin, las tres restantes. Consiguientemente, si es verdadera una cual-
quiera de las relaciones (15 .5h), ( 15.61!), (15.7b) y (15.8b), lo son, tam bin, las tres Catlicos Pro testantes
restantes. En otras palabras, la independencia entre raza y religin puede venir
expresada p or una de las cuatro proposiciones : la proporcin de catlicos lati- SaJones 78 52 130
nos es igua l a la proporcin de catl icos por la pro porcin de latinos, la propor-
Latinos 42 28 70
cin de protestantes latinos es igual a la proporcin de protestantes por la pro-
porcin de latinos. la proporcin de catlicos sajones es igual a la proporcin 120 80 200
de catlicos por la proporcin de sajones, la proporcin de pro testantes sajo-
nes es igual a la proporcin de protestantes por la proporcin de sajones.
Por tanto, la independencia puede ser introducida mediante (1 5.5h) o, lo que (42)(52) - (78)(28) 2.1 84 - 2.184
,/ = - -- -- - = - - - - = ()
es equivalente, m ediante ( 15.5a ). Ahora bien, esto es lo mismo que aceptar como 200 200
criterio de independencia,
Catlicos Protestantes
Si d = O, tendremos independencia. En cambio, si d 4' O, existir alguna depen-
dencia o relacin entre raza y religin. En otras palabras, Sajones 10 75 85
a) No existe un valor numenco mximo al cual podamos referir el d obte- Sin em bargo, aunque Q = 1 Q = - 1, la relacin no es necesariamente
nido en un caso concreto. Por consiguiente, no podemos hacernos una idea apro- perfecta. Por ejemplo, en el cuadro siguiente, ni todo catlico es latino, ni todo
ximada sobre la magnitud del d encontrado en una situacin concreta. Ms an, sajn es protestante. A pesar de ell o. Q = 1.
manteniendo constantes los porcentajes de las cuatro casillas interiores, pode-
mos hacer que d aumente tanto como queramos, con tal de aumentar el tamao
de la muestra . Asi, por ejemplo, si en la tabla 15.2 multiplicamos por 10 todas las
casillas, d pasar a valer 367,5; y si las multiplicamos por 100, d pasar a valer Catlicos Protestantes
3.675. Y, sin embargo, la contextura intrnseca del cuadro es la misma en los tres - ----~ - - -
Sajones 30 40 70
casos:
Latinos 75 o 75
Catlicos Protestantes
- --
105 40 145
b) Existiendo relacin perfecta entre las dos variables (por ejemplo, todo
15.2.2. Clculo
catlico es latino, todo latino es catlico, todo protestan te es sajn y todo sajn
es protestante), d puede tomar valores muy distintos. As, por ejemplo, consi- Basta con aplicar la d efini cin dada.
deremos los dos casos siguientes: EJEMPLO 15. l. Calculemos Q entre raza y religin a partir de la tabla l 5.3.
Latinos 99
99
o
1
99
100
Latinos 50
50
o
50 - 50
100
Sajones
Latinos
20
100
70
10
90
JJO
120 80 200
(99)( 1) - 0 99 (50)(50) - O 2.500
d = - - -- = - = O 99 d = --'- - =- = 25
100 100 ' 100 100
Q = (100)(70) - (20)(10) = 7.000 - 200 = 6.800 = 0,944
Para evitar estas dificultades, Yule (1965) propone el coeficiente Q definido as : (100)(70) + (20)(10) 7.000 + 200 7.200
1
6
2 QJ -
8
40
20
6
8
40 1 18
-;o-- 24
!
as : existe clara relacin negativa en tre ser catlico y ser sajn y entre ser sajn
15.3. Coeficiente x
2
y ser pro testan te; entre ser protestante y ser latino y entre ser latino y ser protes-
tante. 15.3.1. Fundamento y frmula
EJEMPLO 15.2. Getzels y Jackson (1962) distinguieron entre los adolescentes
dos tipos de talento : inteligentes y creativos. Estudiando la relacin entre el tipo Mejor sera llamarle X 2 u otro simbolo distinto d e x2 En realidad, lo que aqu
de talento y la profesin del padre de los adolescentes considerados, llegaron al vamos a llamar ,..2 no es ms que un estad stico cuya distri bucin de probabilidad
siguiente resultado: se aproxima a la distribucin de p robabilidad llamada x2 , a med ida que aumenta
ms y m s el tamao de la muestra. Sin embargo, le llamarem os x2, dada la uni-
Profesin del padre
versalidad de esta designacin en los libros de Estadstica para psiclogos.
El coeficiente x2 lo proponemos aqu pri ncipalmente como medio para poder
Prof. univcrs. Negocios calcular el coeficiente de contingencia C, d el q ue hablaremos inmediatamen te
despus.
Creativos 7 11 18 Recordemos que el coeficiente Q exiga q ue las dos variables constaran de slo
Tipo de talento dos categoras. Ahora bien, cada una de las d os variables puede constar de dos o ms
Inteligentes 15 4 19 categoras. No o bstante, el modo de razonar es el anlogo al seguido al tratar del
-- - -- - --~ --- coeficiente Q. Supongam os, por ejemplo, la variable religin (con tres categoras)
22 15 37
y la variable raza (con dos). segn el cuadro de la pgina siguiente.
(A;) y (B;) represen tan el nmero de personas dentro de las categoras A, y B,,
respectivamente. (A ;B;) representa el nmero de p ersonas que pertenecen simul-
.,,.; (15)( 11) - (7)(4 ) 137
0 71
tneamente a la categora A , (de la var iable A : religin) y a la categora B1 (de la
Q = (15)(11) + (7)(4) = 193 = varia ble B: raza).
280 / Estadistica para Psiclogos Relacin entre variables nominale s / 28 1
A, A1 A, A y B no son independientes para ese grupo, es decir, que existe cierta relacin
(catlicos) (protestantes) (Judos) entre A y B. Esta no independencia (o relacin) tender a ser mayor a medida que
las frecuencias empricas se alejen ms y ms de las tericas. P ues bien , llamando
B 1 (sajones) (A,B 2 ) (A 2 B 2 ) (A,B1 ) (B,l J. a las frecuencias tericas y f. a las frecuencias empricas, definiremos 7. 2 del modo
siguiente:
B 1 (latinos) (A,B) (A 1 B,) (A 3B 1) (B, )
(A 1 B) (A 1 B 2 ) (A 1B 1 ) + (A 1 B 2 ) (A 1 )
15.3.2. Clculo
(E) = (BJ = (8
1
) + (B )
2
= -n-
Es una mera aplicacin de la frmula anterior.
Por consiguiente, EJEMPLO 15.3. Con el fin de estudiar el influjo de las condiciones ambienta -
les en que se desarrollan los gatos sobre su tendencia a cazar ratones, Kuo (] 930)
(A,B ,) = (A,)(B 1 ) (A B
1 2
) = (A)(B2 ) cri gatitos en distintas condiciones: 20 fueron criados en aislamiento; 21 con
n n sus madres, vindolas cazar ratones y 18 fueron criados con ratones. Despus
del perodo de crianza, a cada gatito se le presentaba un ratn para ve r si lo ma-
(A 2 B) (A 2 B 2 ) (A 2 B 1 ) + (A 2 B 2 ) (A 2 ) taba o no. Pues bien, encontr los siguientes resultados :
(E)=~ = (B 1 ) + (B 2 ) =-;;-
Por tanto,
Forma de crianza
(A B)
2
= (A 2 )(B 1 ) (A B,)
2
= (A 2 )(B2 )
n En aislamiento Con sus madres Con ratones
"
Respuesta Matarlo 9 (10,1 7) 18 (10,68) 3 (9, 15) 30
(A 3 B) (A 3 B 2 ) (A 3 B 1 ) + (A 3 B 2 ) (A 3 ) ante el
(E)=~= (B )
1
+ (B2 ) = -n- roedor No matarlo 11 (9,83) 3 (l0,32) 15 (8,85) 29
-
Por consiguiente, 20 21 18 59
(A 3B1) = (A3)(B1) (A B )
3 2
= (A3 )(B 2 )
En cada una de las seis casillas hay dos nmeros, uno sin parntesis (la fre-
11 n
cuencia emprica, la encontrada, de hecho ), otro dentro de un parntesis (la fre-
cuencia terica, la que debera aparecer en caso de independencia). Segn lo dicho,
Ntese que la independencia implica que la frecuencia de cada casilla sea igual
estas frecuencias ter icas se calculan as:
al producto de sus dos frecuencias marginales dividido por el nmero total de
personas. Llamemos frecuencia terica a esta frecuencia que debera aparecer
en cada casilla en caso de independencia. Si observando un grupo de personas, (20)(30) = 10,17 (21 )(30) (18)(30) = 9,15
10,68
las frecuencias encontradas, de hecho (que llamaremos empricas) coinciden con 59 59 59
las terk,as, diremos que no existe relacin entre las dos variables en cuestin , (20)(29) = 9,83 (21)(29) (18 )(29) = 8,85
A y B / para ese grupo de personas. Por el contrario, si no coinciden , diremos que 59 -59 = 10,32 59
282 / Estadistica para Psiclogos Relacin en/re var,ab/es nomina l es / 283
+ ( I5 - 8,85): = ~_22_ + 53,58 + 3?_,_8_3 + 1,37 + ?3,58 + ~2_:8} = O, J3 + = (1,6) 2 (0,2778 + 0, 119 1 + 0,4167 + 0,1786) = (2,56)(0,9922) = 2,54
8,85 10,1 7 10,68 9,15 9,83 10,32 8,85
Segn (15.13):
+ 5.02 + 4, 13 + 0, 14 + 5,19 + 4,27 = 18,88
2
2 = (20)(40 - 8) = 20.480 = 2 54
En el caso en que cada una de las dos varia bles conste de slo dos categor as,
X. (12)(8)(6)(14) 8.064 '
tendremos la tabla siguiente:
Como vemos, tanto ( 15.12) como (15.13) nos llevan a l mismo resultado.
Con tablas de frecuencias de dos fil as y dos columnas es recomendable la co-
1 (u+ h) rreccin de Yates, especialmente cuando una o ms de las frecuencias tericas
h
" 1 en las cuatro casillas es pequea . (Por pequea se suele entender menor que 5 y
e d 1 (e+ d) aun menor que I O.) Mediante ella,
Calculemos en el ejemplo siguiente x2. primero sin la correccin y luego con ella.
En l, a, b, e y d son las cuatro frecuencias empricas y n = a + h + e + d.
Las cuatro frecuencias tericas sern:
EJEMPLO 15.4. A partir de la tabla siguiente calculemos/, apl icand o (15.12) = (0,2) 2 (0,8333 + 0,5556 + 0,357 1 + 0,2381) =
y (15. 13). = (0,04 )( 1,984 1 ) = 0,079364
2 (3.6)
1
1 ' (8.4) 12 Con correccin y usando la primera fr mula :
2 2
4 (2,4) 1 4 (5,6) 8
X2 = ~(0,2-- -~
0,5)
+ -(0,2 -~--
- 0,5)2
+ (0,2
- -- -0,5)2
--- + (0,2 - 0,5)
-'---'----'--- =
f" L 1,2 1,8 4.2 2.8
6 1 14
'
20
(0,3)2(1,9841) = 0, 178569
284 / Estad is tica para Psiclogos Rel ac,n entre var,ab/es nominal es / 285
Con correccin y usan do la segunda frmula: podemos hace que 7. 2 au mente, a pesar de que las proporciones de todas las casi-
llas sean las mismas an tes y despus de dicha multiplicacin . Pues bien, una ma-
2
2 = ( 10)( j6 - 4 1 - I0/ 2 ) = (I0)( - 3)2 = _2.Q_ = O 178570 nera de evitar este incon veniente es uti lizar C. defin ido d e la siguiente manera :
X (3)(7)(4 )(6 ) 504 504 ,
Como se ve, el valor de x2 vara a l usar la frm ula sin correccin y la f rmula
corregida. Es d ebido a lo pequeas que son las frecuencias tericas. La importan-
C =
ffi .
cia de esta diferencia se ver mejor al estudiar Estadistica In ferencia!.
C uando la ta bla es de dos lilas y d os columnas, la diferencia lf. - ; (es decir,
15.4.2. Clculo
tomada en valor a bsoluto) es la misma en las cuatro casil las. El lector se encar-
gar de demostrar esta afirmacin en el ejercicio 15. 7. Es una mera ap licacin de la frm ula anterior.
EJEMPLO 15.5. Calculemos C a partir de x2 = 18,88 o btenido en el ejem -
p lo 15.3.
15.3.3. Propiedades
2 =I (k l. - k lrJ2 = ~ I y; =1;i2 = k x.2 a) El coefi ciente de contingencia C no valdr menos que cero n valdr uno
x. k (, k (, 1
o ms. Es decir, O :;; C < l.
Basta con mirar la f rmula de C para convencerse q ue nunca podr llega r
Compruebe el alumno cmo, en efecto, el valor de _2 es 10/3 a partir de la ta a valer u no, pues el numerador ser siempre menor que el denomin ad or, para todo
bla 15.10 y 40/3 a partir de la ta bla 15.1 l. valor fi nito de n. Por otra parte, de las d os races posibles aceptam os para C la
TABLA 15. 11 p osi tiva, con lo cual no tiene sen tido hablar de valores nega tivos de C. Por con-
TAB LA 15. 10
siguiente, C nos indica la magnitud de la relacin entre dos variables. El significado
8 4 32 16 48 positivo o negativo de la misma lo tendremos que inferir a base de la tabla de con
tingencia, considerando cmo se encuentran distribuidas las frecuencias en las di-
A) 2 6 8) 8 24 32 versas casillas. Incluso a veces, ni tendr sentido hablar del signo positivo o nega
tivo de C, sino m eramen te de la intensidad de la relacin entre las dos variables
10 10 40 40 80 en cuestin . Esto suceder cuando la ta bla de contingencia tenga ms de dos filas
o/y ms de dos colum nas.
NoTA . En bastantes textos las tablas de frecuencias de que hem os venido b) Es fu ncin d el nm ero de lilas y columnas. De aqu que dos C's (entre
hablando suelen ser denominadas tablas dt' contingencia (con tingency tables). las mismas variables, X e Y) slo son comparables si la primera C y la segunda .
amba s han sido calculadas a partir de dos tablas de con tingencia tales que la pri-
mera tiene el mismo nm ero de filas que la segunda y la primera tiene el mismo
15.4. Coeficiente de contingencia, C nmero de columnas q ue la segun da. As, por ejemp lo, sern comparables dos
C's si la primera ha sido calculada a par tir de una tabla de co ntingencia con cinco
15.4.1. Fundamento y frmul a fil as y dos col umnas y la segunda a partir de o tra tabla, tam bin, con cinco lilas
y dos colu mnas. (Suponemos, n aturalmente, que son las mismas las variables
Aca~.mos de ver que x2 es funcin den. Hemos visto, en efecto, que mul tipli estudiadas en ambos casos .) En cambio, no sern comparables dos C's, si una tabla
cando 01as frecuencias de todas las casillas por una constante sulicientemente alta. tiene cuatro lilas y dos columnas y la otra tiene siete fi las y tres columnas.
Relac16n entre v anabtes nommales / 287
286 / Estadistica p ara Ps ,clogos
para k =2 Cm;, = J2---= 1)/2 = fe = 0,707 d ) Las distribuciones de am bas variables pued en ser de cualquier forma .
C puede ser calculad o y tiene sentido sea cual sea la fo rma de a m bas distribuciones.
k =3 cm... = J3=-i" )/3 = ./2/3 = 0,816 e) Puede ser calculado a cualq uier nivel d e medid a. Si la s var iables son cuan -
tita tivas, C puede ca lcula rse y tie ne sen tid o, sea cua l sea el diagrama de dispersin .
k =4 cm,, = fe-=- )/4 = J 34 = 0,866 /) N o es comparable directamen te con otros ndices de correlacin como
. ' . .. ..... .. .. . . .. . . . . ... . .. .. . . . . rx, r,, etc. De a qu q ue no parezca muy recomendable in terpretar como r,,. el co-
c iente C/Cm;, .
k = 10 cm = J- 1)/ 10 = )9110 = 0,949
. . . . . .. . . . .. ' . . .. . . . . . . . . . .. . ... . . . . . .. ' . . .
Esto quiere decir, que el C.,,;, no alcanzar el valor 1, para va lores fin itos de 15.5. Interpretacin de Q y C
k por grandes que sean . Solamente en el lmite alcanzara ese valor. Es decir.
lm
11 -a::
J:"= 1)/k = lm J 1- ~1/k ) = .1
1 - a::
Como en ocasiones anterio res, la nica mterpretac10n razonable de un valor
determinado de Q y de C es compararlo con los valo res enco ntrados p or otros
inves tiga dores trabajando con las mismas variables o va riables semejantes. /\de-
Vamos a comprobar el valor del Cm, para el ca so de una tabla de contingen-
m s, en el caso de C, para q ue sea sensata la com paracin, es necesario que nues-
cia de dos fil as y d os columnas. tro coefcien te C haya sido calcula do a partir de una tabla de contingencia con
Las dos tablas de contingencia siguientes implican m xima correlacin. Com-
el mism o nmero de lilas y de col umnas que tenan las ta blas de contingencia de
probemos cmo en ambos casos C = fir2 = 0,707 . los otros investigadores o con un n mero muy parec id o.
1 (0,1) O (0,9) 1
15.6. Resumen : Definiciones y frmulas
O (0,9) 9 (8.1) 9
1 9 10 Coeficient e Q
Q _ (A , B , )(A 2 B 2 ) - (A 1 B 2 )(A 2 B 1 )
(0,9 )2 (0,9)2 (0,9)2 (0 ,9)'
/ = - - + - + -- + - - = 8, 1 + 0,9 + 0,9 + 0. 1 = 10 - (A , B )(A 2 B2 ) + (A 1 B 2 )(A 2 B 1 )
0. 1 9 9 8. 1
Por consiguiente,
Y/7
2
! "
l.
,
= u(3.2) 2 {J,2)2 13.2)'
+ o.8- + ti ll + "3,2
(3.2)
= 3.2 + 12,8 + 0.8 + 3.2 = 20 e= ~ --,.2
288 / Estad1st1ca para Ps iclogos
15. l.
EJERCICIOS
~ ~ ~ ~
15.2. Calcular el coeficiente x2 a pa rtir de los cuadros siguientes:
<t)~
~
h) 6
10
14
26
10
14
e)~
~
d) i5 3 3
16.1. Conceptos previos
constar de ceros y unos. Pues bien, la frmula del coeficiente de correlacin bisc-
X
., n, x 1
rial puntual no es ms que la frmula del coeficiente de correlacin de Pearson "r 11, rr, X X li:X nP" n"''
aplicada a estas dos columnas de nmeros. 24-28 6 1 7 2 4 14 28 12 2
Se demuestra (vase 16. 7. Apndice), que el coeficiente de correlacin de Pearson 19-23 6 2 8 1 1 8 8 6 2
baJo estas condiciones, es decir, el coeficiente de correlacin biserial puntual, 14-18 5 4 9 o o o o () o
rhp viene dado por 9-13 4 4 8 -1 1 -8 8 -4 - 4
. -
-
~.i
x . ,/pq 116.l )
4-8 1 7 8 - 2 4 - 16 32 - 2 - 14
J hp - S J.
22 18 40 - 2 76 12 - 14
= ?l'_=- -~
s, yq,_ 116.2 )
(26, 1), (26, 1 ), (26. 1), (26, 1), (26, 1), (26, 1), (26.0); las ocho siguientes : 121, 1). (21, J ),
X es la variable cuantitativa con!nua e Y es la dicotmica . (21 , 1), (21,1 ), (21,1 ), (21 , 1), (21,0), (21,0); ... ; las ocho ltimas : (6,l ), (6,0), (6,0 ),
p es la proporcin de personas con una de las dos modalidades posibles en la (6,0), (6,0), (6,0), (6,0), (6.0). Pues bien, ri,p no es ms que r , , aplicado a estos cua-
variable F. renta pares de nmeros.
q es la proporcin de personas con la otra modalidad. Calculemos previa men te los elementos que aparecen en las dos frmulas
XP es la media en X de las personas cuya proporcin es p . de rbp
l\ es la media en X de las personas cuya proporcin es q.
X es la media en X de todas las personas. x = 16 + (5)( - 2/40) = 16 - 0,25 = 15. 75
sx es la desviacin tpica en X de todas las personas. x. = 16 + (5 )( 12/22) = 16 + 2,73 = 18.73
N tese que (16.1) admite una interpretacin muy razonable. Supongamos. x. = 16 + (5)( - 14/ 18 ) = 16 - 3.89 = 12, 11
en efecto, que X representa agresividad, Y representa sexo, p es la proporcin s, = (5))76/40 - 4/ 1.600 = (5)JI.9 - 0,0025 = (5 ),/1-:8975
de varones, q la de mujeres y que los varones de nuestra muestra son ms agresivos = (5 )( 1,378) = 6,89
que las mujeres. Bajo estas condiciones, XP (agresividad media de los varones ) p = 22/40 = 0,55 q = 18/ 40 = 0.45
ser mayor que x. (agresividad media de las mujeres) y x. - x.
ser tanto mayor
cuanto ms difieran en agresividad los varones de las mujeres, cuanto ms estrecha De acuerdo con la tabla B (Apndice 111. al final del libro):
concomitancia o correlacin exista entre ser varn y alta agresividad y entre ser
mujer y baja agresividad. Ahora bien, segn (16. l ), rbp tender a crecer con x. - 1\, , /pq = J o,55)(0.45l = o,4975 ,/piq = .,./(0.55)/(0,4 5 ) = 1.106
es decir, con la correlacin entre el sexo y la agresividad. Por consiguien te, rbp apa-
rece como ndice idneo de correlacin. Algo parecido poda decirse sobre (16.2).
Entonces, aplicando (16. 1).
gativo. a ser alto en X corresponde pertenecer a la categora cuya proporcin es q Es decir, a, h. e y e/ representan el nmero de personas cuyas p untuaciones
y a ser bajo en X corresponde pertenecer a la categora cuya proporcin es p. en X e Y son respectivamente : (O, 1), (1, 1), (0,0), (1,0 ). Asimismo, (a + h) representa
El esquema anterior es arbitrario. Otros serian posibles. Sin embargo, le segui- el nm ero de personas con puntuacin igual a I en Y (o. mejor an, el nmero
remos siempre para evitar confusiones. No obstante, conviene que el alumno se de personas pertenecientes a la categora de Y a la que hemos atribuido el valor 1 ),
acostumbre a considerar la tabla de frecuencias y, a partir de la misma, interprete (e + d) representa el nmero de personas con pun tuacin igual a Oen Y, (a + e)
oportunamente el valor posi tivo o negativo ofrecido por la frmula. En nuestro el de las personas con puntuacin igual a O en X, (h + d ) el de las personas con pun-
ejemplo, rb, = 0,48 es positivo. Esto quiere decir que a ser alto en X corresponde tuacin igual a I en X.
pertenecer a la categora de los varones y a ser bajo en X corresponde pertenecer Usando el esquema anterior, si <P es p ositivo (negativo) quiere decir que es
a la categora de las mujeres. positiva {negativa) la relacin entre la categora O en X y la categora O en Y, o entre
Desde luego, no es necesario atribuir unos y ceros. Bastara con llamar X, la categora 1 en X y la categora l en Y. Con todo, lo mejor es estudiar el cuadro
a la media del grupo de personas cuya proporcin es p y 1\ a la media del grupo de frecuencias para asegurarse del signo de la relaci n.
cuya proporcin es q. Hemos atribuido ceros y unos para hacer ver cmo ,.bp no es
ms que una aplicacin de r,,, al caso de dos variables, una cuantitativa continua y
la otra dicotmica . Compruebe el alumno cmo r, ,., aplicado a los 40 pares de que b) Clculo
hemos hablado ms arriba, vale 0,48.
Apliquemos (16.3) al ejemplo siguien te :
EJEMPLO l 6.2. Calculemos la relacin posible entre poseer coche y poseer
16.2.2. Coeficient e de correlacin, e, piso a partir de los datos que proponemos a continuacin . Se trata de dos variables
dicotmicas: o se tiene o no se tiene coche, o se tiene o no se tiene piso. A tribuyamos
a) Fundllmcn/0 y frmulll un O a las categoras no coche y no piso; atribuyamos un J a las categoras
coche y piso>: . Supongamos que tenemos la siguiente labia de frecuencias :
Introduzcamos dos variables dicotmicas, X e Y. Cada una de ellas admite
slo dos modalidades a las que vamos a atribuir dos nmeros distintos que, por
sencillez suelen ser el O y el J. Consideremos estos dos valores como autnticos
X
nmeros. Esto supuesto, tendremos dos columnas de nmeros, cada una de las cua
les consta nicamente de ceros y unos. Pues bien, la frmula del coeficiente cp no
No coch e Coche
es ms que la frmula del coeficiente de correlacin de Pearson aplicada a estas o 1
dos columnas de nmeros.
Se demuestra (vase 16.7. Apndice), que el coeficiente de correlacin de Pearson Piso
bajo estas condiciones, es decir, el coeficiente cp, viene dado por : 1 30 60 90
)'
ch - ad (16.3)
<P = -;== = = = = = = == No piso
j(ll + h)(c + d)(a + c)(h + d) o 70 40 J 10
Donde 11. h, e, y d tienen el significado expuesto en el cuadro adjunto : 100 100 200
X
Aplicando la frmula (16.3):
o l
conclusin llegamos observando el cuadro de frecuencias. En l son mayora los 16.2.3. Propiedades de ' y q,
que poseen simultneamente ambas cosas o carecen simultneamente d e ellas ;
en cambio, son minora los que poseyendo una de ellas, carecen de la otra. a) Ninguno de los dos coefi cientes puede valer meno~ que - 1, ni ms q ue l.
No es necesario atribuir expresamente los unos y ceros. Basta con poner las Es decir, - l ~ rbp ~ 1, - 1 ~ <p ~ 1.
frecuencias. Hemos atribuido los unos y ceros para q ue el alumno vea cmo rp es En efecto, basta con tener en cuen ta que a mbos son aplicaciones par ticulares de r,,.
un caso particular de r, En este ejemplo tenemos 30 personas cuyas puntuaciones r bp = 1 cuando toda s las persona s con I en Y (va r iable dicotmica), oblen-
en X e Y seran (O. l ), 60 cuyas puntuaciones seran ( 1. 1 ), 70 cuyas puntuaciones gan la misma puntuacin en X (variable cuantitativa contin ua) y cuan do todas las
seran (0,0) y 40 cuyas puntuaciones seran ( 1,0). Tendramos, por tanto , 200 pares personas con O en Y, obtengan la misma puntua cin en X.
de puntuaciones. Compruebe el lector cmo, de hecho, al aplicar el coeficiente En par ticular, valdr 1, c uando la nica puntuacin en X de los que obtienen 1
de correlacin de Pearson a estos 200 pares de nmeros se obtiene r., = 0,30. en Y sea ma yor q ue la nica pun tuacin en X de los que obtienen O en Y. Valdr
EJEMPLO 16.3. Dement y Kleitman (1957) se plantearon la hip tesis de que -1 , cuando la nica puntuacin en X de los que obtienen I en Y sea menor q ue la
cuando una persona est soando. sus ojos se mueven rpidamente . Para verificarla, de los que obtienen O. N tese que en ambos casos los puntos representativos d e las
hicieron que un grupo de personas durmieran en un laboratorio y durante la noche personas estn so bre una lnea recta. Veam os dos ej emplos :
les despertaban varias veces. Unas veces, cuando presentaban movimientos oculares a ' ) T odos los va rones (1 en Y) obtienen 7 en X ; todas las mujeres (O en Y)
rpidos (M . O. R.), y otras, cuando no los presentaban. En ambas ocasiones les obtienen 2 en X ; r bp ser positivo.
preguntaban si recordaban algn sueo. Pues bien, encontraron los siguientes a ") Todos los varones (1 en }') obtienen 3 en X : todas las mujeres (O en Y)
resultados. obtienen 6 en X; ' ser nega tivo.
He aqu las correspondientes representaciones gr ficas:
X a) b
1
Despertados 1
Despertados
sin M.O.R. con M.O. R.
(7.1 ) (3 ,1
o 1 y y
Recuerdan ( 2.0)
algn sueo 1 11 152 163 o~-~.,....-~_ _,__~_ _,____ _.__ o " ( 6 ,0)
1 X
X -
y
No recuerdan
<p = 1 cuando todas las personas co n I en X obtienen l en Y, y todas con O e n
sueo alguno 149 39 188
o X obtienen O en Y.
rp = - 1 cuando toda s las perso nas con I en X obtienen O en Y. y todas con O
160 191 351 en X obtienen J en Y.
H e aqu lo, c uadros q ue rep resenta n estas dos situaciones extremas :
22.2 19
.. - ,/(h)f<')(h)(r) d,
(f)
(149)(152 ) - (l 1)(39)
..j(l 63)(1 88)(160)(191)
22.648 - 429
J936.480.640 30.60 1,97
0,73
y
1 o /, h
y
i
1
1 ti io " O - ad
,P =----:--=-.-::=- ..
o (' o e i o l o 1
' d d ..j(11)(d)(11)(d )
1 ' 1 1
1 -ad
" d
El resitado obtenido apoya la hiptesis propuesta. (' b 11 ll = -1
mi
296 / Estadistica para Ps,clogos Rela cin entre var,ables d1co tm1cas o d1coto m1zadas / 297
Estas dos situaciones extremas quedan representadas grficamen te as: Este valor mximo es a lcanzable. por eJemplo. co n los dos cudros siguientes
(1.1)
(0. 1) 2 28 30 20 o 20
20 o 20 con lf! = 0,92 2 28 JO con lf! - - 0.92
y 22 28 50 22 28 50
y
e) Para una tab) de contingencia de dos fi las y dos columnlls. / "" nlf) 2
En efecto, basta con comparar la frmula ( 15.13) de /, con la frmula ( l 6.3 )
( 1.0) de <P (elevada al culldrado).
(0,0) X X
b) Dada una tabla con las cuatro frecuencias marginales fijas, el valor mximo 16.2.4. Interpretacin de rP y de <>
alcanzable por <P es funcin de ellas.
Acabamos de ver que <P = l slo cuando las cuatro frecuen cias marginales Segn lo dicho en ocasiones semejantes. el nico modo razonable de interpretar
son (b, e, h. e) o (a, d, a, d). En cu alquier otro caso l<P I < l. Ahora bien, fijadas un valor determinado der., o de ({) es compararlo con los va lores de rP y lf' o bte-
las cuatro frecuencias marginales, pueden variar las cuatro frecuencias interiores y, nidos por otros investigadores trabajando con las mismas o parecidas vana blcs.
consiguientemente, ({) puede ir tomando diversos valores. Lo que a hora nos interesa Conviene, adems, que sean iguales o parecidas las proporciones marginales de X en
es determinar cul de esos valores posibles es el mximo. Se demuestra que, fijadas sus tablas de contingencia y en la nuestra , y que ocurra lo mismo con las proporcio-
las cuatro frecuencias marginales, ese valor mximo viene dado por la siguiente nes marginales de Y.
expresin :
En estas frmula s XP. X9 , X.,. e tienen el mismo signifcado que en 16.2. 1. nidos coinciden con los <latos del ejemplo 16. I a partir de los cuales hemos calculado
Por otro lado. el significado de y es el siguiente : Supongamos una distribucin rpLo hacemos as para poder comparar luego los resultados numricos alcanzados
normal con rea unidad. Sea : la abscisa que deja a uno de sus lados un rea igual en uno y otro caso. Llamemos 11P al nmero de buenos relojeros. 11 al de malos
a p y al otro un rea igual a q. Pues bien. y es la ordenada correspondiente a dicha relojeros y II al nmero total de relojeros de nuestra muestra. Sup uesto esto. apli-
abscisa :. quemos (16.4) y (16.5) al cuadro de la pgina anterior.
Recordemos los resultados previos obtenidos en 16.2. 1.
b) Clculo
Esto nos indica que a ser altos en la prue ba de agudeza visu al, corresponde ser
Apliquemos (16.4) y (16.5) al siguiente ejemplo. buenos relojeros ; y a ser bajos en la misma, corresponde ser malos relojeros. No
Em,tPLO 16.4. Llamemos X a la agudeza visual e Y a la habilidad para el todo el que es alto es buen relojero. ni todo el que es bajo es mal relojero, pero , e n
oficio de relojero. Un comit de expertos califica como buenos o como malos general, los a ltos en la prueba, tienden a ser buenos relojeros y los bajos en la misma .
profesionales a un grupo de relojeros. stos. a su vez, realizan una prueba de agudeza tienden a ser malos relojeros.
visual que les permite a lcanzar puntuacion es que van de O a 30. X e Y son variables Recurdese aqu las ohservaciones hechas en este mismo contexto al tratar del
con tinuas, pero la segunda ha quedado dicotomizada anilicialmente, ya que en ella clculo de rbp al fina l de 16.2. l .
~lo son posibles dos p untuaciones: una correspond iente a buen relojero y la otra
correspondiente a mal relojero. En estas circunstancias parece muy oportuno
el uso de la correlacin biserial. Supongamos ahora que los datos numricos obte- 16.3.2. Coeficient e de correlacin tetracrica, r ,
X n, 11 a) Fundamt'nto y fm1ulas
"
24-28 6 1 7
Supongamos <los variables. X e r. ambas cominuas. Las dos aparecen d ico-
19-23 6 2 8
tomizadas artificia lmente. Por tanto, en X y en Y slo tenemos. de.- hecho, dos
14-18 5 4 9
4 4 8
categoras. Pues bien. el coeficiente de correlacin tctracrica. r,. es una estimacin
9-JJ
4-8 1 7 8 de r,,. si tanto X como Y se hubieran mantenido continuas y se hubieran cumplid o
f" las dos condiciones siguientes:
22 18 40
a ') Las distnbucioncs de X e Y. consideradas como continuas. son norma les
300 / Estadistica para Ps,clogos Relacrn entre variables d1cotm1cas o dicorom,zadas / 301
Usando la tabla C. tenemos: Ahora bien, de acuerdo con la tabla B. (Apnd ice 11 ), ..Jqr va de 3,733. p ara
p = 0,99 ( p = O.O! ). a 1,253, para p = 0,50. Por consigu iente /pq ,y es siempre
i:ll"J = (70)(60) = 4.200 = 3,5 mayor que uno y, en consecuencia, r. ser siempre mayor que r,r para unos mismos
(u)(,/) (30)(40) J.200 datos.
Recordemos cmo para los mismos d atos del ejem plo 16. l. rr vala 0,48 y,.. va lia
En la tabla C vemos que a iodos los valores comprendidos entre 3,461 y 3.571 0.60 (ejemplo 16.4).
les corresponde r, = 0,46. e) Para unos mismos datos, r, :e (3/2)(,p) (vase Lord y N ov1ck. 1968 ). Esta
La tabla de frecuencias nos dir qu signo debemos a1ribuir a u n r, detenni- aproximacin es tanto mej or, cuanto ms se aproximen a la media na los puntos de
nado. Recurdese a este respecto las consideraciones hechas al fina l de 16.2.1 . dicotomizacin en ambas variables y cuando r, es igual o menor que 0,50. As, por
EJEMPLO 16.6. Vamos a analizar los datos presentados por Woodworth ejemplo, compr uebe el alumno cmo se verifica esta relacin en el cuadro siguiente :
( 194 I ) sobre 19 pares de gemelos univtelinos. Los dos elemen1os de cada par son
educados en ambientes diferentes. Consideremos la diferencia en educacin (X)
enlrc los dos elementos de cada par y su diferencia en cociente intelectual ( Y). JO 20 30
Tendremos 19 diferencias en educacin y 19 diferencias en cociente intelectual. r, = 0,61 (con sul1ando tahla C del Apndice 11 )
Calculemos r,. habiendo dicotomizado X e Y del modo siguiente : 15 5 20 <f! = 0.408 (mediante f rmula J
{] /2)((/)) = (3/ 2)(0.4 08) = 0.6 12 ::,, 0,61 ~ , ,
25 25 50
X: Diferencia en educacin
BaJa O Alta 1 d) Siempre que una de las cuatro frecuen cias interiores sea nula . r, = 1.
En efec to, si uno de los cuatro valores a, b, e o des nulo, claramente ad ch
X: Alta 1 1 (a) 8 (h) 9 sern nulos. Consiguientemente valdr cero uno de los dos cocientes ch/"d ad/ch.
1
[)ifcrcncia -----r-- En ambos casos, al cociente nulo le corresponde en la tabla C. (Apndice lll ) r, = 1.
en CI Baja O 1 8 (e) 2 (d) 10
1 1 El signo positivo o negativo depender de cul de los cuatro valores es nulo.
9 JO
1
1
19
'
16.3.4. Interpretacin de r y de r,
(8 H8 I = 32. En la la bla C (Apndice III) vemos que a 32 le corresponde r, = 0,89.
(1 )(2)
Esto significa que el cociente intelectual es funcin de la educacin recibida, La in1erprctacin razonable es compararlos con los valores de rb y r, obtenidos
ya que los elementos de cada par no difieren cnlre s genticamente, al ser univi por otros investigadores trabajando con iguales o parecidas variables. Conviene.
telinas, sino slo por razn del entorno distinto dentro del cual uno y otro han sido adems, t ener en cuen ta los pu ntos de dicotomizacin usados por noso1ros y
educados. por ellos.
a) El coeficienlc de correlacin biserial, rb , puede valer ms que uno (o menos 11)El coeficiente rb, es una aplicacin de r,, El coeficie nte r, es una es11maci11
que - 1). de r,,.
bajo cie rtas condiciones.
h) Para unos mismos datos, lr"Ies siempre mayor que jr.pj. b ) El coeficienle lrbpl es siempre menor q ue rl cod cicnte hl-
para uno; m is -
En efecto: mos datos .
e ) El coeficienle Ir.PI es siem pre igual o menor que l. El coefc,entc lr.l puede
:'" . ' = ! ~t pq = !__p_ - xj ;q Jpq = ,." /j,q supe rar ese valor.
el) Ambos coeficientes son usados en teor a de tests. Cada uno tiene s us ven-
Sx .V Sx y P y
304 / Estadistica para Psic logos
Rela cin entre variabl es dicotmicas o d icotomizadas / 305
tajas e inconvenientes. segn sean las situaciones concretas en que van a ser usados rh = ;__-__,__ X vr.:
X -_ __:_:_j i - X~p-
PC/ = ::_.e__:_:_
y el aspecto que desea ser considerado. Esta discusin. en si muy interesan te, no p sx sx q
la creemos oportuna ahora . El lector preocupado por este tema puede consultar Lord Coeficiente tle correlacin <p: Aplicacin de r,,, a dos varia bles, ambas dico-
y Novick (1968). tm icas.
cb - ad
Variable dicotomi;ada: Aquella que puede manifestarse segn tres o ms mo- y _ (np)( I ) + (nq)(O) _ np _ p
dalidades, pero a la que, de hecho, slo se le permite manifestarse segn dos m oda- n n
lidades. 2 +
,.. (np)(I - p)2 _+__J_n_11_)(0 -~Ji = _llf!lf _ _ ll__lfl'_ = pq2 + qp2 = pq(p + q) = pq
2 1
Coefic:frr1e de correlacin biserial puntual : Aplicacin de r" a dos variables . s2
,.
= ~----- n n
una continua y la otra dicotmica.
306 / Estadisuca para Psiclogos Relac,n entre var,ables d 1coton11cas o dico tom,zadas / 307
Sea XP la media en X de las np personas con I en Y. Sea p_, la proporcin de personas con puntuacin I en X.
Sea X la media en X de las nq personas con O en Y. Sea q_, la proporci n de personas con puntuacin Oen X.
9
Seas, la desviacin tpica en X de las personas. Sea p,. la proporcin de personas con puntuacin I en }'_
Es claro que : Sea q, la proporci n de personas con puntuacin O en Y.
Hemos visto en 16.7.1 que la media y la desviacin tpica de la variable dico-
L XY = (X 1 )(1) + + (X.P)(l) + (X,.p+iHO) + ... + (X.,)(0) = L X+ O =
= L X , donde L va de 1 a np
tmica. Y. valan f" = p. s, = jpq. Como a hora X e Y son dicot m1cas,
X = Px S;r = . . . _/ pxqx y= P, s ,. = "/ p,.tf,
Por consiguiente,
L XY = LX = X Es claro q ue, siendo np.,. el nmero de perso nas que obtienen I en X y 1 en J'.
np np
!:XY = {(1)(1) + +(1)( 1): + : (1)(0) + + 11)(0): + ((())(1) + +
o sea, + (0)11 ): + liO)(O ) + + (0)(0) : = 11)(1) + + (1)11) +O + O +
L XY = 11pX (2) + O = n,, ,
EJERCICIOS 16.4. Calcular el coeficiente q> a partir de las tablas de frecuencias siguientes:
X d) X
a) X
"- - -
" b) X " ", e)
" 11,
" "
16.5. T eniend o en cuenta lo exp uesto en 16.2 .2. compr ue be el lector cmo. en
4 1 4 5 6 2 5 3 o 5 4 ()
efec tos, los valores de q> ob tenidos en todos los casos del ejercicio anterior no son
3 3 4 4 6 4 4 3 l 4 6 2
3 6 6
ms que una aplicacin del coeficiente de co rrelacin de Pearson .
2 5 3 3 8 10 3 2 3
4 1 2 2 6 2 o 4 2 2 8 16.6. Calcula r el coeficien te de correlacin biserial, teniendo en cuenta los mis-
2 4 1 o 4 1 2 4 mos c uadros a partir de los cuales ha calculado rbp en el ejercicio 16.1. Ahora su-
ponemos que X e Y son continuas, aunque Y aparece dicotomizada. Ntese cmo
rb es ma yor (en va lor absoluto) que rbp pa ra unos mismos datos numricos .
d) X
" ",
17-2 1 o 4
12-16 4 12
7-11 6 8
2-6 4 2
(:
\ (~
. (
17.1. Introduccin
a) Eliminacin emprica. Es decir. empricamente formamos sub!rupos. cada Segn lo visto en I l. l. tendremos ahora :
uno de ellos con nios de la misma o parecida eda_d y calculamos r,, dentro de cada
grupo . As, la correlacin entre peso y clculo numrico quedar libr e d.:I in!lujo o)
de la edad. Esta eliminacin, no obstante, presenta dos inconvenientes . En primer
lugar, deberemos calcular varios coeficientes de correlacin (uno para cada sub- :E (.\ .,; )2 :!!
grupo). En segundo lugar, cada uno de estos coefcicntcs habr sido calculado con ,.~ .\ 1- 1
muy pocas personas y scr: poco fiable.
Dentro dr las edades propuestas, podemos suponer razona blemente que son
lineales las relaciones entre peso y edad y entre habilidad numrica y edad. Po r b)
tanto. utilizando puntuaciones d iferenciales. tendremos:
2
.2 _ ( L (X2 - _,; ) /n
1 2 .\ - - , ...
s:;
~
E 2
~
e:: de donde , var (Y
2 _ ,.)_
2 - :E (x2 -
--=-- .1 )2
~..:___ s~ (I - d 3 ) que designa remos por s~ 1
11
.\; r 13
.\'1
- x .\
.\ '
(pronstico del peso, mediante la edad)
L (x 1 - x ; )(x 2 - x; )
"<'(.
t- .\ 1 -
--
.
I 1 .\ S
~ '( J)
' J
( ., ;z - I . 1.\ .1"2
s.}
\)
- J
-" .1
Dondes ,. s 2 , .1, son las desviaciones tpicas del grupo tota l de nios en peso.
habilidad numrica y eda d, respectiva mente; r1 , y r 23 son los coeficientes de co - L x 1x 1 - r2 _, \; I x ,x., - r1.,
11I x x, + r 1.,r, ., 51:12 L x~
- 2
rrelacin de Pearson obte nidos a partir del grupo total entre peso y edad. y entre SJ .\J S 3., .~
r - --- - ,- --
ha bilidad numrica y edad, respectivame nte. 11 S 1 S2 ,j l - r _, ./ l - /} l
Segn ya sabemos (vase 11.3), x 1 - x; y x2 - x; (errores en los pronsticos)
no dependen de la variable pred ictora (edad).
Pues bien . calcular la correlacin entre peso y habilidad numrica. indcpcndien -
tementt: de la edad, equivaldr a calcular la correlaci n entre aq uella parte del + r 1.\"1J r r 1 _\r} .\
r Ll - r 2 .\ r13 - f13f2J 12 -
peso y aqueij,i pa rte de la habilidad numrica que no depen den de la edad. o sea. ( 17. l )
e ntre x 1 ___: x ; y x 1 - x;. /1 - r_, ,/ 1- r~ ., ,/1----=- ,.T, ,/ 1 - ,."
316 / Estadistica para Psiclogos Correlacin y r egr esm n / 317
17.2.2. Clculo de errores cua drticos. :E (X, - X j )2 es decir. la suma de la s diferencias c uadr-
ticas entre las puntuaciones obte nidas, de hecho, en el criterio y las puntuaciones
Es una mera aplicacin de (17. 1) pronoslicadas en el mismo med iante dicho plano.
EJEMPLO 17. 1. Supongamos que hemos calculado, de modo ord ina rio, ,-" Hablaremos de regresin mltiple, siempre que apa rezcan dos o ms var iables
entre el peso (X,) de un grupo de ni os y su habilidad en el manejo de smbolo~ predictoras. Por ahora nos limitaremos a l caso de slo dos variables.
numricos (X1 ). obteniendo r 1 2 = 0,50. Calculemos, ahora. r, ., entre peso (X 1 )
y edad (X 3 ) y r 23 entre habilidad numrica (X 2 ) y edad (X3 ). Los siguientes valores
hipotticos son muy razonables: r 13 = 0,80, r 2 .1 = 0.60. Esto supuesto, veamos 17.3.2. Ecuacin del p lano en un espacio tridimensional
lo que sucede aplicando (17. 1).
La ecuacin de la recta en el plano (espacio bidimensional I era Y = " + b X
( X , =" + b2 X 2 ). La ecuacin del plano en un espacio tr idimensional viene
0.50 - (0,80)(0,60) 0,02 dada por X , = a+ h2 X 2 + b.,X.,. donde " b2 y h3 son tres constantes ca racte-
r,u = -,/! - 0,64~36 = (0.60 )(0,80) = 0,042 rsticas de cada plano. La constante u nos determ ina el punto en q ue el plano corta
el eje OX, . o sea. el pu nto de coor denadas (a, O.O). Cuando a = O. el plano pasar
por el o rigen de coordenadas ((),0,0) y recproca mente. Las cons1antes /J 2 y /J 3 nos
En conclusin, el coeficiente de correlacin de Pearson entre peso y habilidad determinan la incl in acin del plano.
numrica, en vez de va ler 0,50, es prcticamente nulo, en cuanto hemos elim inado
el influjo de la edad.
Este y otros muchos eJemplos nos ensean con qu ca utela debemos proceder e n 17.3.3. Ecuaciones de los plan os de regresin de X, sobre X, y X ,
algunos casos a l analizar el valor de rx,. encontrado entre dos variables. Es p osible segn el criterio de mnimos cuadrados
una relacin verdadera entre las mismas. Pero, tambin, es posible que esa relacin
sea slo aparente y se deba lotalmente o. al menos, en gran pa rte, al in fl ujo de otra Supongamos un grupo de 11 pe rsonas de las que conocem os sus pu ntuaciones
u otras varia bles. en las dos variables predictoras. X 2 y X.,. y en el cri terio. X 1 . Po r ejemplo, en dos tests
de aptitud y en el examen final de curso. Consideremos tres ejes ortogonales. OX ,.
OX 2 y OX.,. (Vase fig ura 17. 1. l Cada persona i viene represeniada por un punto
17.2.3. Propiedades
X,
Sealar emos como nica propiedad del coeficiente de correlacin pa rcial, q ue
no pu ede valer menos que - 1, ni ms que l. En efecto, dicho coeficiente no es ms
q ue un coeficien te de correlacin de Pearson . e
\ .,
1/'
17.3. Regresin mltiple
x:,
17.3. 1. Introduccin
cuyas coordenadas (X,.. X, 2 X, 3 ) no son ms que las puntuaciones obtc111das en il<J) <~ <I) (~(}) r'<t> 11(}> Q,
las dos variables predictoras y en el criterio. El grpo total de las n perso nas vcn dr
resolver las t res ecuaciones -: - = O. -- = O. e;- = O donde - , ~ - -- son
,A ,B1 1-B.1 r' A ,~B2 ?B.,
representado por una nube de puntos que ser de forma elipsoidal !algo as como las derivadas parciales de <11 respecto a A, a Bi y a B.,. Es decir.
un baln de rugby) si existe correlacin entre las tres variables. Sea un phrno ABCD.
Hagamos pasar por el punto (X,1. X ,2 , X,.,) una perpendicular al plano determinado r' I (X 1 -A - B1 X 2 - B.1X ,)2
- 2 I fX 1 - A BiX, - B, X, ) =O
por los cJes OX, y OX.,. Esw perpendicular cortar al plano ABCD en un u n punto ,'A
(X;,. X,i X,_i ). Si a la persona i que ha obtenido. de hecho. la puntuacin X,, en el
<' I (X, - A - B2X 2 - B_1 X _d 2
criterio le atribuimos la puntuacin X,', (dada por el plano ABCD ). cometeremos - 2I IX , - A - 8,). 1 - B_
, x_.ix , = {)
el error (X,1 - x;,) y, consiguientemen te, el error cuadr tico (X11 - x;, )2 . Haciendo <'B2
lo mismo con las restantes personas, tendremos 11 errores cuadrticos y. por tanto. t I (X, - A - B 2 X 2 - B.,X1 )2
una suma de errores cuadrticos expresada por I (X;, - x;, ) .
2 - 2 I (X, - A - l/ 2 ). 1 - B_, X_.} ). _, = O
<'B
Con cada plano del espacio ir asociada una suma de errores cuadrticos. Pue, '
bien. el plano de regresin de X I sobre Xi y X .1 es aquel plano cuya suma de errores O, lo que es equivalente:
cuadrticos asociada. I (X11 - X,\ )2, es ms pequea que la suma de errores cua- I (X, - A - B 2 X 2 - B.1 Y.1 ) = O. de donde.
drticos asociada a cualquier otro de los infinitos planos del espacio. Ms breve- I X 1 = nA + B2 I .\'2 + B.1 I X.1 ( 173 )
mente. es aquel plano que hace mnima la suma de errores cuadrticos I (X., -
L (X , - A - Bi X 2 B.,X_iJXi = O, d e donde,
-
- x;,)2 . IX ,X2 = A IX 2 -t B2 I X~ + B., IX2 X 3 ( 17.4 )
Ntese que para construir el plano de regre~in necesitamos un grupo de personas
cuyas puntuaciones en X,. en Xi y en X 3 debemos conocer. En cambio. lo aplicare- I (X 1 - A - B2X 2 - B.1 X.i JX., = O. de donde.
mos a otras personas, se111eja111,s a las anteriores. de las que slo conoceremos sus I X , X , = AL X_, + Bi I X 2 X.1 + B.1 I X3 ( 17.5 )
puntuaciones en Xi y en X 3 . Supongamos que Xi y X 3 son dos tests de aptitud para
la Estadstica y X 1 el rend;miento en la misma. manifestado mediante un examen. Las ecuaciones ( 17.3 ). ( 17A ) y ( 17.5) suelen ser lla madas normales. Ellas nos
Queremos construir la ecuacin del plano que nos permita pronosticar del mejor permiten despejar A, Bi y B 3 (vase NtnA 3. al fin al de este capt ulo). Sus valores son :
modo posible el rendimiento, conocido el resultado en ambos 1ests. Pues bien . A = X, - Bi Xi - B_1X., (l 7.6 )
para c onstruir ese plano, necesitamos unas personas cuyas puntuaciones en los dos
tests y en el examen nos sean conocidas. Una ve7 construido. lo a plicamos a otras B _ [11 :l.: X1 X2 - LX 1 IX2 ]l11 I X1 - t:l.: X.1) 2 J
personas. se,11,/0111,s a las anteriores. de las que slo conoceremos sus puntuaciones i - [n I Xi - (I Xz}2 l[ 11 LX~ - (:l.: X,)21 - (11 l: X 2 X., - I X 2 L X.1)2
en los dos tests de aptitud. 11 7 7 )
Dada la semejanza entre los dos grupos de personas. es de esperar que el plan o [11 I X, X.1 - IX , I X.1][ 11 L Xi X.1 - I X 2 L X3J
de regresin que fue ptimo en la reduccin de los errores cuadrticos respecto a l [11 LX - (I Xi )1 J[n I Xi - (I X j] _y,;I X2X.1 - I X2 I X_,] '
pnmer grupo. ser . tambin. razonablemente bueno en la rcdw.:cin de los er rores
[nIX 1 X 3 - IX, IX 3 ]lnIX~ - (LX2 )2 J
cuadrticos respecto al segundo. B3
Expuestas estas consideraciones previas. vea mos cul es el plan o de regresin de [n I X3 - (I X_,)2][11 IX~ - (I X2 )2 ] - (n I X.,X 2 - L X _, L Xi) 2
l J7 8 )
X, sobre X i y X.,.
--~ [,_, I_ X,X 2 - I X1 LX2 )[11 I X.1X 2 - IX.1I Xi ]
- [;, L X3 - (I X_,)2 )[11 IX~ - (I Xz}2 ] - [11 I X1 X2 - IX., rA;;p
a I E rprnado <'11 nm111aci1111es direc/a.,
T eniendo en cuenta ( 17.2) y 117.6). nos queda
Comenzamos con la ecuacin x; = A + BiX 2 -1 B.1X.1 = (-\\ - B, X, - B., X.1 1 + B2 X 1 + B_,X, () 7.9 )
De (1 7.9 J se m fi eren rnmediatamcntc las s1gu1cntes consecuencias :
X; = A . B2 Xi + B.1X., (17.21
-,. I x; , - -. I ). I >. .1
11 .\ , = - - = (.,\, - B,Xi - H,A.1 ) + B - --2 + B, - -
11 11 11
Nuestro pto psito es d eterminar A . Bi y B 3 de modo que cti = I IX, - A -
B2 X 2 - B.,X., )2 sea mnima. Segn se demuestra en Clculo. ello eq uivale a = X, - B 2 X2 B_,f _. + B2 X1 + B..X., = f, f 17.10)
r.
Es d~cir. so n iguales la media de las puntuaci ones directas pronosticadas. x;. Tenien do en cuenta (17.12) y (1 7. 16). nos q ueda
y la media de las puntuaciones directas obtenida s. X,.
x; =U + b2X2 + h3X3 = + h 2X2 + b _X _ ( 17.21)
b) ExpreJ11do 111 pu11 1u11cioncs i/ifenm u,les 2) Sustit uyendox 2 porx2 = O y x, por .i ., = O e n (17 .21). x; = O (17.23 )
h.1
I x,,., I xi - I x x 1 2 I -".1'2
(17. 18)
IX~ I \'~ - (I X.1 Xd Las igualdades ( 17 .24 ) y ( J 7.25 J nos indica n que son paralelos el pla no de regre-
sin en p un tu aciones di ferencia les y el correspondiente plano de regresin en
Recorda ndo q ue L x ,x 1 = nr,1ss1 y que r ;, = 1, nos q ueda r : p untuaciones d irectas.
h2
n r,,s 1S2l1S ~ - 111'13S 1S.,nr13S2S3 = \'_,_ (1'12- 1'131'23 ) ( 17.1 9 ) c) Ex presado en pu111uaciv11es 1ipirn.1
ns1ns~- (nr 2 _,.12 s3 )
2
s2 1 - r ,
Comenzamos con la ec uacin
h9= lll'1.1S 1S3l1.\ ~ - _nl'1 2-'1S 2111'13S2.\3 = .11 ( 1' 1 3 - f 12~2 3)
(1 7.20)
, ns~n.1i - (111'2.1-1'2 .1.J s, 1- rL ::; = a* + h!=2 + b!= 3 ( 17.26)
322 / Estadstica para Psiclogos Correla c1n y regresin / 323
- h!: 3 ) 2 sea mnima. Segn un razonamiento anlogo a l seguido en el caso d e En el capiulo siguicn1c veremos que s;. = z~ :,;
. 11
1. En olras palabras. las
las puntuaciones directas llegamos a puntuaciones z; no cumplen con una de las condiciones necesarias con las que cum-
r : 1 = na* + b! r Zz + b! r :3 (17.27) plen las autnticas puntuaciones lpicas, a saber. q ue su varianza vak siempre 1.
Por esta razn, las puntuaciones z; deberan ser llamadas pscudotpicas .
r =,=1 = a* L =2 + b! L =~+ b! L =1=3 (17.28)
EJEMPLO 17.2. Comenzaremos introduciendo un min icjemplo que ayude a l
r :,;:3 = a* r ;:3 + /J! r Z2Z3 + /Jj r :i (17 .29 )
lector a comprend er mejor la aplicacin de las frm ulas an teriores. Despus ofre-
Las ecuaciones (17.27), (17.28) y (17.29) suelen ser llam ados normales. Ellas ceremos otro ejemplo a lgo ms largo, con unos datos obtenidos en la vida real.
nos permiten despejar a*, hJ y h'.\. (Vase NoTA I al final de este capitulo.) Sus Supongamos cinco personas con puntuaciones en dos va riables predictoras.
X 2 y X 3 y un criterio X, . segn las tres tablas siguien tes:
va Iores son :
a* = O (17.30)
b2
*_ r, 2 - r ,3 r23
(17.31) TABLA 17. 1
-
1- rt (pun!Ulll'UIIC'.\ dl/"l'C[t/S)
b* - r,3 - r,1r23
.\ - 1 - d3
(17.32)
X, x, X, x,x, x,x, x,x, X'1 xf x; ,. x;
5 9 8 45 40 72 25 KI 64 4.2
Teniendo en cuenta (17.26) y (17.30), nos queda 1 o 4 o 4 o 1 o 16 1: 1.4
3 b o 18 o o 9 36 o 2.6
7 18 12 126 84 211> 49 .124 144 1: 7.0
:; = a* + h!z2 + h!: 3 = O + h!z1 + hjz 3 ( 17.33) 4 12 6 48 24 72 16 144 36 I 4.8
1
De ( 17.33) se deducen inmediata mente las siguientes consecuencias: 20 45 JO 237 152 360 1O{) 585 260 ;i 20.0
1
1) :; = r :; = h! r = 2
+ b'; r .: = (b!HOJ
3
+ (b!)(Ol = o (17.34)
n n n
b2 = -:J. b! (17.35)
1~
Sz o o o , 57 .12 90 20 IKO 80 1 o.o
f b3 = :f_i b! (1 7.36)
S3
324 / Estadis11ca para Ps,clogos
Correlac,n y r egresin / 325
TABLA 17.3 Ntese cmo:
lp1111111acio11es tpicas)
r x, = r x ; = 20. . x, = x; = 4
z, Z z, 1i Z1Z1 z 1 z ., z1 z.l 11 z; 1 1
1
y cmo:
0.5
-1.5
o.o
- 1.5
0.5 1
- 0 .5 1 2.25
0,25
0,75
0,75
'
1
1 - U
0,1 0.0 1
1,69
x; = 0,997 + 10.267)(,\\ ) + (O. t )(X,1 = 0,997 + (0,26 7)(9 ) + 10. 1)(6) = 4 = x,
- 0.5 -0.5 - 1.5 1 0.25 0.75 0,75 - 0.7 0,4,
1.5 1.5 1.5 11 2.25 2.25 2.25 1,5 2.25 h) Plano de rt'J(f<'.W/1 ti partir de p u11tuacioncs d1f,,r,11cwle.,
1
O.O 0.5 o.o 0.00 0.00
1
0,4 1(:
Segn (1 7.24 ): h1 = B2 = 0.267.
O.O O.O O.O 1- 4.75 4.00 3,75
li O.O 4.60 Segn (17.25): h-' = B-' = 0. 100.
1
Segn (17.16): a = O.
4
1'11 = -4.7s
5 = o 95. ,. 1] = 5= 0.80. ,., _, = -3,75
5 = 0.75
Por consiguiente,
x; = (0.267)x 2 + (0, 100) .\J
a) Plano de l'<'f!l'<'si,n a partir de prmtuaciones direct,.1
Aplicando esta ecuacin a los correspondien les valores de x 2 y \'.,, obtenemos
Segn (17.7 ): la columna encabezada por x; en la tabla 17.2.
Ntese cmo:
B _ [(5)(237) - (20)(45))((5)(260) - (30)2) _ !: x , =r x; = O, . .f , = t; = O
1
- [(5)(585) - (45 )2 )((5 )(260) - (30)2] - [(5)(360) - (45)(30)] 2
y cmo
[(5)( 152 ) - (20)(30)][(5)(360) - (45)(30)]2
- [ (5 )iss5T =- !4WJ[l5J(260J - (30)2J - [(5)(360J - (45H30JJ 2
x; = (0.267)(.i 2 ) + (0,I)h\l = (0.267)(0) + (0.1 )(0) =O = \' 1
= -~
157.500
= 0.267
.
c) Plano de regre.~in a partir de p11111uucio11es tipirns
Hagamos 17,4. Supongamos que r 12 , r 13 y r23 tienen un mismo valor que llamaremos r.
Con estas condiciones. demostrar que r 12 _3 = r 13 , = r 13 _2 = r/(1 + r ).
n E X,X 1 - E X, E X, = H,, (1 7.50) 17.5. Comprobar lo demostrado en 17.4, para r = 0,60.
328 / Estad,srica para Ps,cologos Correl acin y r eg resin / 329
U n nuevo alu mno (semeJante a los primeros) hace los dos tesis de aplitud y
e) Plano de regrl'sin II partir de pw11uaciones tpirn.1 obliene las pun luaciones directas X 2 = 30. -".1 = 20. ;. Qu puntuacin di recta.
dife rencia l y tpica le pronosticaremos como nota de fi n de curso 9
Segn (17.31): /,! = 0,5918 - (0,54 11)(0,1779) Pa ra obtener la puntuacin directa pronosticada, basta con apl icar ( 17.37 ).
1 _ (0,1779)2 = 0,5117 Es decir:
x; = I,50 + (0,60)(30) + (0,50)(20) = uo + 18 + 10 = 29.50
Segn (17.32): b'j = 0,54 11 - (0,59 18)(0,1779) 0,4501
1 - (0, 1779)2
Para obtener la puntuacin d iferencial pronosticada podemos seguir dos ca-
minos:
Segn (17.30): a* = O
a) Transformar 30 y 20 en d iferenciales y a plicar (17.38). Es decir :
Por consiguiente,
x; = (0,60)(30 - 25) + (ll.50)(20 - 15) = 3 + 2.5 = 5,5
:; = (0.5 117) =, + (0,4501) =.,
h) Transformar la puntuacin directa pronosticada. 29,50, en diferencial pro -
A plicando esta ecuac1on a lo s correspondientes valores :::2 y : 3 , obtenemos la
nosticada. Es decir :
columna encabezada por:; en la tabla 17.4.
y cmo: Para obtener la punt uacin tpica pronosticada podemos seguir dos caminos :
:::; = (0,75)(30 - 25 )/(5 ) + (0,25 )(20 - 15)/ (2) = 0,75 + 0.625 = 1,375
17.3.4. Aplicacin de los planos de regresin b) Transfor mar la puntuacin directa (o diferencial) pronosticada en tpica
pronosticada. Es decir :
Una vez construidos los planos de regresin, los podemos aplicar a otras per-
sonas con tal que sean semejantes a aquellas con las que los hemos construido. ::: 1 = (29,5 - 24)/(4) = (5,5)(4) = 1.375
En realidad, suponemos que tanto el grupo con el que hemos construido los p la-
nos como el grupo al que se los aplicamos, no son ms que d os muestras d e la el mismo resultado que en a).
misma poblacin.
Sean X 2 y X 3 d os tests de aptitud y sea X I el aprovechamiento escola r o notas Evidentemente. este n uevo alumno no pertenece a l gru po p nmcro median te
en el examen de fin de curso. Supongamos que para las personas del grupo pri- el c ual hemos calcula do X,. ,\\. X.1 . s, . .1,. 1_,. Sin embargo. podemos referir sus
mero (mediante las cuales hemos construido los planos) X1 = 24, X2 = 25, X3 = 15. punt uaciones directas a esas medias y desviaciones tpic,1s (pa ra calcular sus pun-
s1 = 4, s2 =.f.>, s3 = - 2, r, 2 = 0,80, r, 3 = 0,40, r2 , = 0.20. A partir de estos tuaciones diferenciales y tpicas) porq ue suponemos que pertenece a la m isma
da tos tendremos las sigui en tes ecuaciones de regresin : pobla cin a la que perteneca el grupo primero.
330 / Estadistica para Ps1cvlogos Correlacin y regresin / 331
17.4. Correlacin mltiple En segundo lugar, veamos lo que vales;,. es decir, la varianza de las puntuaciones
pseudotpicas pronosticadas, z; .
17.4.1. Definicin '<' - ' '<' (b* z + h*3 -3 2 '<' ,2 '<' " " "<' ,2
.2
.1, , =- - = ..._ _::-=.
... . , 2 2
_
4
____;:.....=e_ -
- h*' ...
2 --
2
+ 2b*b* ... 2-3 h*' ... J
2 3 --- + 3 --
-
-
El coeficiente de correlacin mltiple es un ndice que nos mide la relacin 11 n n n 11
existente entre una variable, X,. y otras variables. Xi, X 3 X 4 . consideradas = h!' + 2h!h!r 23 + hf = hf + h!h1r23 + hf + h!h!r 23
conjuntamente. Por ahora slo consideraremos tres variables. Por tanto. ser un
ndice que nos mide la relacin existente entre X , y las dos variables Xi y X3 consi- = h!(h! + htr23 ) + h!(h! + h!r 23 ) = b!r, 2 + h!ru
deradas conjuntam ente. Definamos este ndice de un modo ms preciso. De las
varias definiciones posibles (equivalentes entre s) elegimos la siguiente: (de acuerdo con ( 17.41 ) y ( 17.42).
Sean X 11 , X 2 1, . .. , X,, 1 las puntuaciones directas obtenidas por 11 personas Por consiguiente,
en el c riterio, X 1.
Sean x; 1 x; 1 . x;, 1 las puntuaciones directas pronosticadas a esas II per-
sonas mediante el plano de regresin de X 1 sobre X 2 y X3 s,; = .Jh!r12 + h!r , 3 (17.43 )
Pues bien, definimos el coeficiente de correlacin mltiple de X, con X 2 y X 3
(designndolo por R, _23 ) como el coeficiente de correlacin de Pearso n entre (X 11. En este supuesto, aplicando la definic in de correlacin propuesta;
X21 . . . X,, 1 ) y (X; 1 x; 1 , x,; 1 ). Es decir:
L z 1 z; = Lz 1 z; = L z1 (b!z2 + b!z 3 )
R 1 _2 _1 = rz1:i
() 7.40) nsz,sz nsz. ns::'1
R,.23 = J'X!X'i
1 2
= -l (h*2 -I z- z + b*3 -
I
-
Z1Z3)- -
h!r12
/ *
+ h!r1J
* = '\/h*r
2 12
+ h!r 1 3 (17.44 )
Aceptamos esta definicin de Ru 3 por dos razones. En primer lugar, x ; es fun - s,., 11 ll V h2 r1 2 + h3r1.,
cin conjunta de X 2 y X3 (recurdense las ecuaciones de regresin ). Por tanto.
correlacionar X 1 con x; es correlacionar X 1 con una funcin conjunta de X 2 y X 3 Por consiguiente, teniendo en cuenta (17 .44) y ( 17.43 ).
es decir, es correl acionar X 1 con X 2 y X3 consideradas conjuntamente. En segundo
lugar esta definicin es muy parecida a la del coeficiente de correlacin de Pearson
entre dos variables, X 1 y X 2 . En efecto, sabemos que el coeficiente de correlacin Rf.23 = s;, ( 17.45)
de Pearson entre un criterio, X 1 y la variable predictora, X 2 , no es ms que el mismo
coeficiente entre las puntuaciones obtenidas en el criterio (X 1) y las puntuaciones Si en (17.44) sustituimos b! y h! por sus valores en (17.31 ) y (17.32),
pronosticadas en el mismo (X;), es decir, r,,,, = rx,x,
Dada esta definicin, como coeficien te de correlacin de Pearson, es claro
que R1.2 3 valdr lo mismo tanto si lo calculamos a partir de puntuaciones directas, r,2 - '13f2.3 r 13 - '12r23 rf2 - 2r, 2r 13r23 + rf J
como si lo hacemos a partir de puntuaciones diferenciales o tpicas. Ms an, no
R~ 23 2
1 - 1'23 'u + 2
1 - /'23 '1 3
- rJ3
(l 7.46)
tienen por qu ser del -mismo tipo las puntuaciones obtenidas y las pronosticadas .
As, por ejemplo. las obtenidas en el cri terio pueden ser directas y las pronosticadas
en el mismo, diferenciales. 17.4.2. Clculo
De la definicin expuesta, R1.2 3 = r,,,, se deducen otras frmulas ms aptas.
tal vez. que ella misma para el clculo efectivo de R 1.2J Vamos a deducir dos. Es una aplicacin de las frmulas anteriores.
una de las cuales suele ser presentada, con frecuencia, como dehmc1n de R1.2_,. EJEMPLO 17.4. Calculemos R 1 _23 a partir de los datos contenidos en la tabla 17.5
Pero antes hagamos algunas aclaraciones introductorias que creemos necesar ias. El lector se encargar de comprobar que:
En primer lugar, dividiendo por n (1 7.28) y (1 7.29). nos queda
segn (17.44): Ru 3 = ./(0,5117)(0,5918) + (0,4501)(0,54 11) = 0,74 17.5. Resumen : Definiciones y frmulas
segn (17.45): Rr. 23 = ./12,0201/22 = 0,74
Co,jicienh' de correlacin parcal,r1 , .., : Coefic iente de correlacin de Pca rson
segn 117 _4_6 V'Ru 3 = ro,59_18~ {2 (oj918)(0,54I I)(0, 1779) + (0,54112 = 0 74 entre aquella parte de X 1 q ue no depende de X3 y aquella par le de X 2 q ue ta mpoco
1 - (0,1779)2 ' depende de X 3
334 / Estadistica para Psiclogos Correl acin y r egr esin / 335
r12 - 1'13"23 NOTA l. Las puntuaciones diferenciales y tpicas no son ms q ue las direc-
r12.3
tas sometidas a ciertas condicion es restrictivas. Por tanto, las relaciones vlidas
~~ entre las directas, sern tam bin vlidas entre las diferenciales y tpicas, con ta l
que impongamos a las directas las restricciones requeridas.
Ecuaciones de regresin mltiple de X 1 sobre Xi y X3 : Ecuaciones que nos per-
Ahora bien, in troducir puntuaciones diferenciales equivale a imponer r: x, =
miten pronosticar las puntuaciones en X, a partir de las puntuaciones obtenidas = i, = O, (i = J. 2, 3). Consiguientemente, (17.6), (17 .7) y (17.8 ) quedarn con -
en X 2 y en X3
vertidas en
a) Supuestas puntuaciones directas: x; = A + B2 X 2 + B 3 X _1
A = O + (B 2 )(0) + (B 3 )(0) = O, o sea, (17. 16)
A= X, - B2 X2 - B 3 X3
B _ (n r: x 1 xi - 0) - (n r: x x
0)(11 r: x~ - 0)(n I x 2 x_, 1 3 - - 0) _
_ [n ~ -~\X2 - LX, r: Xi][n :E X5 - X3 )2J _
B
2 - Ji
(I: 2
- (11 - 0)(11 L xs - O) - (n r: Xz X 3_ - OJ2
r: x -
[n r: X 1 X 3 - r: X 1 r: X 3 ][n r: X2 X3 - r: Xi~ ~J ,1 (!: X X2 r: x1 - :r: X X_, r: X2x ..J o sea, (1 7. 17)
JI
= JI (L x} L x~ - (!: x2 x 3 )2) ,
B = [n :E_X ,X3 - :E X 1 :E X 3 ] [n :E XJ _::- (!: X2 )2l _ B _ (n r: x 1 x 3 - 0)(11 I x }_- !!_L-=. !:1..~ x 1x 2 --:__0)!_n__I ...:'i:.'Z_ -:-__Q_) _
3
Ji 3
- (11 I x3 - O)(n L x - 0) - (n L X 3X z - OJ2 -
[n r: X 1 X 2 - r: X 1 r: X 2][ n r: X 3 X 2 - r: X3 r: X 2 ]
Ji
I (LXX3LX~ - L X Xi LX3X2)
o sea, (17.18 )
= - - 4 r ;s r:x~ - Cix3x,)2) _ _ ,
siendo:
A su vez, introducir puntuaciones tpicas equivale a imponer r: :, = z, = O,
ll = [n r: X} - (:E X2)2 ][n r: Xi - (1: X3 )2] - [n r: X 2 X 3 - r: X2 :E XJ 2 r: z,z1 = nr,, (i,J= 1, 2, 3), con r.. = l. Consiguientemente, (1 7.6), (17.7) y (17.8)
quedarn convertidas en
b) Supuf'stas puntuacion<'s diferencia/es: x; = b2 x 2 + b3x 3
A = O + (B 2 )(0) + (B 3 )(0) = O, o sea, (17.30)
h2 = B2 b3 = B1
B _ illl_!!.1_~ - 0)(1111 - O) - (nnr 13 - O)(nnr 23 _-_ Q_) _
c) Supuestas punluaciones tpicas: z; = b!z2 + b!z3 2
- (nn - 0)(nn - O) - (nnr2 _1 - 0)2 -
X, = A + B 2 X2 + B 3 X3 (17.47) De donde :
A = X, - B 2 x2 - B 3 X 3 , que es (17.6)
_ H, 3H22 - H 1, H 1.1
8
Multiplicando ( 17.4 7) por nX2 y restando este resultado de ( 17.4),
-' - l/11 H .1.1 - J/L,
que, teniendo en cuenta ( 17.50), no es ms que ( 17.8 ).
I X,X 2 - nX,X 2 = (A I X2 + B 1 I Xi + B 3 I X2 X3 ) - Recordando la NOTA l. podemos deducir inmediatamente los coeficientes
- (AnX 2 + B2 nx~
+ 8 3nX2 X3 ) = correspond ientes a las ecuaciones de regresin en punt ua ciones tlif,,wiaks y en
= A(I X 2 - nX2 ) + B2 (:E X~ - nXi) + 8 3 (:E X 2 X 3 - 11X2 .\\)
pun tuaciones tpicas, a partir de A,. 8 2 y B., imponiendo las condiciones restr ic-
tivas pro pias de las puntuaciones diferencia les y de las tpicas. respectivamente .
Esta igualdad puede ser escrita del modo siguiente:
I X,X 2 2
11
~ - -I X-2 = {A)(0)
-. ---- IX, - - + ~B 2 (n- IX; - (I X2 ) )
--=-"-' -- +
r r tz EJ ERCICIOS
B3 (n I X 2 X 3 - I X 1 I X3 )
+- - -- ---- - (17.48) 17.1. Calcu lar r 12 __, sabiendo q ue
!
a) r1 2 = 0.80: r 13 = 0,60: ri, = 0.50.
De modo anlogo, multiplicando (17.47) por nX3 y restando este resultado h ) r 12 = 0.30: r 1., = 0,40: r 2 , = 0.60
de (1 7.5). e) r 11 = 0,80: ri., = 0, 70: rv = 0.60.
11!: X,X.1 - IX 1 IX 3 = (A )(0) + B 1 (nIX 2 X 3 - IX 2 IX 3 ) + 17.2. Calcular el valor de ru, sa bi endo q ue r,, .., = 0.60 : r,., = 0,80 : ,-2 _1 = 0,60.
+ 8 3 ( 11 I Xi - (I X 3 ) 2 ) (17.49) 17.3. ,Cun to valdr r 12 3 si r ,3 = O y r23 = 0 ''
Hagamos 17.4. Supongamos que r 1 2 r, ., y r2 3 tienen un mismo valor que llamaremos .-.
Con estas condiciones, d emostrar que ru -' = r 2 .1 . 1 = r13. 1 = r ( 1 + r ).
:!'"
11 L x,xj - L X, L x, = H,, ( 17.50) 17.5. Comprobar lo demostrado en 17.4. para r = 0,60.
338 / Estadistica p ara Psiclog os
17.6.
17.7.
y 1'3
Demostrar que r 23
=.l.
= 1. ta nto si r 12 = r 13 =
Demostra r que r 23 = -1, tanto si r12 = 1 y r 13 = - 1, como si r 12 = - 1
1, como si r 12 = r 13 = - 1.
18
17.8. Demostrar que r 13 _2 = r 12 . 3 si r 13 = r 12 El coeficiente de correlacin mltiple
17.9. Comprobar lo de mostrado en 17.8. p ara r1 2 = r1 3 = 0,80. y los planos de reg resin
17.10. Suponiendo s, = 6, s 2 = 3, s 3 = 3. r, 2 = 0.50, r 13 = 0,40, r 23 = 0,20,
calcular las ecuaciones de regresin de X 1 sobre X 2 y X 3 , en puntuaciones diferencia -
les y tpicas.
17.11. Suponiendo s 1 = 4, s 2 = 5, s 3 = 2, r, 2 = 0,80, r 13 = 0,40, r 23 = 0,20,
calcular las ecua ciones de regresin de X 1 sobre X2 y X 3 , en puntuaciones diferen-
ciales y tpicas.
17. 12. Calcula r las ecuaciones de regresin de X 1 sobre X2 y X 3 a partir de los da-
tos siguie ntes : 18.1. R~23 como ndice de reduccin
de error en los pronst icos
--
a) X, x, x, h) X, Xi x, e) X, x, X3 d) x, X, x,
Vamos a considerar, en concreto, el pla no de regresin de X, sobre X 2 y X 3 .
o 2 1 2 1 1 3 9 12 1 1 o Algo parecido va ldr p ara los planos de regresin de X , sobre X , y X 3 y de X ,
4 o 9 6 3 7 5 12 8 1 o 1 sobre X 1 y X 2 .
8 4 5 10 4 5 4 o 4 o l l Sea X 1 la puntuacin directa obtenida por una persona i en el criterio X 1 y
6 6 13 8 5 3 7 18 6 2 2 2 sea x; la puntuacin directa pronosticada a esa misma persona media nte el pla -
12 3 7 14 7 4 1 6 o no de regresin de X 1 sobre X2 y X3 El error cuadr tico cometido en ese prons-
tico individual valdr (X, - x; )2 y .t (X, - x; 2 ser la suma de errores cua -
drticos respecto a todas las personas de la muestra. Por su parte, la suma .t(X ,- %1 ) 2
17.13. Calcular las puntu aciones directas, diferenciales y pse udotp icas pro- queda descompuesta en dos sumas de trminos c uadrticos. En efecto :
n osticadas en el criterio X 1 , mediante las ecuacio nes de regresin d e X 1 sobre X 2
y X 3 , tenie ndo en cuenta los datos del ejercicio 17. 12. .t(X, - A\)2 = :E [(X, - x;) + (X ; - ..\"'i)]2 = :E(X1 - x ;)2 + .t x; - A')2 (18.1)
17.14. Sea n X 1 , , x;,, x 1,, x;, las puntuaciones directas (obtenida y pronosticada ) pues:
y diferenciales (obtenida y pro nosticada) de la persona i. Demostrar que para toda
persona i se verifica: X 11 - x;, = x 1 , - x;,. .t x 1 - x;)(x; - X)= o
17.15. Calcular el coeficiente de correlacin mltiple, teniendo en cuenta los segn se encargar de com probar el lector en el ejercicio 18.4.
datos del ejercicio 17. 12. Ahora bien:
:E (X1 - .%\ )2
n
que solemos designar por s s~,. es el error c uadr tico medio (E,;; ) cometido a l
atribuir a cada persona, como pu ntuacin , la med ia X1
A su vez:
.!" :E (X1 - x; )2
11
340 / Estadistica para Psiclogos El c oeficiente de correlacin mltiple y los planos de r egresi n / 341
= proporcin de E;,
eliminado o. de otro modo, proporcin en que reducimos el De acuerdo con lo dic ho en el apartado 12.1, el paso de R 1.23 de 0,20 a 0,50,
E! primitivo, el que cometamos valindonos de i'. por ejemplo, significa mucho me nos que el paso de 0,65 a 0,95, en cuanto a reduc-
Si, por ejemplo, ese cociente fuera igual a 0,60, ello significara que habamos cin de E!.
reducido el E! en un 60 por 100, es decir, que, valindonos de x; slo cometeramos Segn (1 7.37), (17.44) y (1 8.2), vemos que, definiendo R 23 como rJ,,., = sJ;,
un 40 por 100 del E! que habramos cometido valindonos de .X 1 . llegamos a que Ri .v = s;/s;, y vemos, tambin, que, definiendo Rf. 23 como
Pero s;;fs;,, llegamos a que R_ 23 = = ,~,,; s;,
s;. x;2 (x;Jsx, )2 La definicin de R_ 1 3 como s;Js;, = L (X; - X1 ) 1 /L (X , - X, )2 = I -
L 1 L : ::;2 = s;; Rf.13 (l8.2) - r (X 1 - x ;2J (X 1 - %)2 tiene la ventaja de su paralelsmo con la definicin
s!: = n s; . = n n
de otros coeficientes de correlacin como ndices de reduccin de error. Unos d i-
ferirn de otros en diversos aspectos acciden tales, pero tod os ellos coincidirn
segn (17.44 ).
en ser ndices de reduccin de error.
Por tanto, Rf. 23 no es ms que la proporcin en que ha sido reducido el error
En los ejercicios 18. 12. y 18. 13, al final del capitulo, el lector se encargar de
cuadrtico primitivo, el que habramos cometido si nos hubiramos valido de X 1
probar que
como puntuacin pronosticada.
En conclusin:
1: xf = !: (x 1 - x; )2 + L x;1 (18.5)
2 2 2
Rf2 3
r
=~ s
= -~r~~ = -
Si.2J
- -1- ( l 8.3) 1: zf = 1: (z1 - z;)2 + L z;1 (18.6)
\';I .\';l sx,
EJEMPLO 18. l. Comprobemos las relaciones aca badas de exponer con los da-
Consideremos los dos casos extremos posibles : sf. 23 = O (equivalente a s;, = tos siguientes:
= s;, ), y s:-, = O (equivalente a sf. 13 = s;, ).
El primero nos indica que, valindonos del plano de regresin, hemos elimi- x T 't 1' 1 :C 1-"J "1), J :,:i :,:1 : l :)
nado o reducido por completo el E;. primitivo. el que habramos cometido a tribu- . - - - - -
9 12 - 1 o 6 1 o 16 o - 6 o - 0.5 o.o 1.5 0.00 - 0. 75 0,00
yendo X 1 , como puntuacin en X 1 , a cada una de las personas de la muestra. Ahora 12 K 1 ) 2 1 9 4 J 2 6 05 05 0.5 U.25 0.25 0 .25
o o -9 o KI o o o.o
bier., si sf. 23 = O. entonces, segn (18 .3), Rf. 23 = 1; luego a reduccin total del
4 - 2 4 IK - 1 5 - 0,5 0,00 0,00 0 .75
18 6 1 9 o 9 KI o 27 o o 1. 5 u o.o 2.25 0,00
E;, primitivo, corresponde Rt 2 3 = l. Recprocamente, si R ,.. = l. entonce< 6
2045~- . o
O -) -) - 6
--
9
20-180
9 '6 9 18 18 - 1.5 - 0.5 -1.5 0,15 2.25 0,75
segn (18.3).~{ 23 = O; luego a R _23 = l, corresponde reduccin total del E;, KO w 14 42
o.o 3.25 1,7 5 1,75
primitivo.
342 / Estadistica para Ps,clogos El coef1c1ente de correl ac,n m l t,p l e y l os p lanos d e r egr esi n / 343
D el cuadro anterior es fcil construir las euaciones de regresin. NOTA. A pesar de lo expuesto, es posible que R 23 = O, valiendo sf. = O.
23
Esto sucedera si todos los puntos estuvieran situados sobre el pla no de regresin
x; = 1,77778 + 0,20038 X 1 + 0,06980 X 3 x; = 0,20038 X + 0,06980 x 3
y ste fuera paralelo al plano X 2 0X 3 . Ciertamente, s_ 23 = O. Adems, s;, = O.
:; = 0,60114 Z2 + 0,13960:3
Por tanto, s;,
= O - O = O. Consiguientemente, R_ 2 _, = s;Js~, = 0/0, quedara
Con estas ecuaciones podemos formar el cuadro siguiente : indeterminado. Sin embargo, tiene sentido admitir R, .23 = O, ya que en esta situa-
ci n, tanto a pu ntuaciones altas, como medias y bajas en X 2 y X 3 , co rresponde una
misma puntua cin. i\, en X, y, por tanto, Ja covan aci n entre X , y X 2 y X., es nula.
IX, - id 1
-,: ,1 -
j,\' 1 - -~\
1, X - .r;
- -'r - x j
l - ;
(X 1
- 1A 1
- X; )1 r
- xY
li, - :)
1
- .r ;J
..
0 .25
O.lS
4.41880
4.74074
04l8M0
0. 740 74
0,20940
0 370H
- 1_41880
0.25926
- 0.70940
0,1296J
2,0 119'}
0.06122
0.SUJJS
0.0 161<0
O 175.'"1
0 ,~4~70
U.0-08S
OJ .'717
18.2. R;n como ndice de aproximacin
0.00 2.0~6')11
S.80324
- J 94] 02 - 0.97I.S I
0.90171
1/H)Ol
1, 196.58
0,971.51
0.59829
3.77SB
J.4) 180
0.94l8 ~
0 .].5 79 5
J .77.5U
3 .25:.'.'12
0.94Ul3
oxnox
de los puntos al plano de regresin
l .2~ 1.804J2
2.25 2.98006 - 1.01994 - 0. .50997 - 1.98006 - 0.9900.l 3.92064 0 980 16 I J) 402t! 0.l007
lU S 00 20.00000 0.00000 0.00000 0.00000 0.00000 11.20798 2.80199 K,79202 2 19 800 Hemos visto en el prrafo anterior que Rf 23 = 1 - r (X , - x; )2 1:E (X, -
- l\ )2. De
aqu se deduce inmedia tamen te lo siguien te:
Comprobacin de (18. 1) : a) Si todos los puntos (represen tantes de las puntuaciones ob tenidas) se en-
cuentran sobre el plano de regresin de X, sobre X 2 y X 3 , X, = x; para toda per
:t (X 1 - x; )2 + :E (X; - .\')2 = 11,20798 + 8,79202 = 20,00000 = :E (X 1 - X, )2 sona de la muestra. Por tanto, x, - x; = O. Consiguientemente, :E (X, - x; )2 = O.
Es decir , Ri, 23 = l.
Comprobacin de (18.5): b) Si Rt_ 3 = 1, :E (X , - x;)2 = O.Ahora bien , como los 11 su mandos son
no negativos (por ser cuadrticos), si su suma es cero quiere decir q ue cada uno
:E (x, - x; )2 + :Ex; 2 = 11,20798 + 8,79202 = 20,00000 = :Ex de ellos tiene que valer cero. Por co nsiguiente, X, - x; = O, es decir , X 1 = x ;.
para toda persona de la muestra. En otras palabras, todos los puntos se encuentran
Segn sabemos, sobre el plano de regresin de X 1 y X 3 sobre X, ,
Comprobacin de (l 8.4): x, x, x,
s_;, (1 - R f.23) = ~ (1 - 0,4396) = 2,2416 = 11 2 t 98
= s 23 o
o
o
o
2
o
2
o
- 2
Comprobacin de (18.6): u - 2 o
,; 2 o o
:E (2 1 - :i) 2 + r ;:2 = 2,80 199 + 2,19800 = 4,9999Q e:: 5 = :E z - 2 o o
344 / Estadstica para Psiclogos El coeficiente de correlacin mu/tiple y los planos de r egresi n / 345
Ntese que R} 23 no es slo funcin de sf 23 , sino, tambin de s; .. Eslo quiere errores grandes (a las que se aleja n bastante d el plano de regresin). a otras medios
dccr que para un mismo error cuadrlico medi (sL 3 ) , R 13 puede ser mayor o (a las que se alejan moderadamente del mismo) y a otras pequeos (a las que se a le-
menor segn que sea mayor o menor s~.- jan muy poco de dicho plano).
Por supuesto, s operamos con puntu~ciones tpicas :
s;, = 1 X,
Por tanto,
>< x. , ~
I: (= - :;)2 X
"
R_H -~'
s;I - s;i u n
)(
X
)(
)(
/ ../ X 1
X )(
X X '12: _ x_ )(
a mayor (menor) aproximacin de los puntos a la recta al plano de regresin. co- X ' ,, -X- )( .,,'/.,"'
,,
rresponde siempre mayor (menor) valor de R_ 23 . , ....-'
)( _ /
x;. A su vez, todas las personas que difieran en X1 y/o en X 3, diferirn, en general,
En otras palabras, la varianza total de X, (s; . ) se descompone en dos partes
en x;.
aditivas. lJna, s;.,, asociada a, dependiente de, explicada por, la variacin de X 2 y
Por el contrario, X, - x; no depende, no es funcin de, no est asociada a,
X 3 , ya que x; estaba asociada a. dependa de. era explicada por, la variaci n de
X 2 y X 3 . De hecho, r,,c,, - ,; = r,, cx, - x,i = O.A puntuacin baja en X 1 y/o en X 3
X 2 y X 3 . Otra, s 23 , no asociada a, no dependiente de. no explicada por, la va ria-
puede corresponder error bajo, medio o alto en X 1 Como se ve en la figura, tan to
cin de X 2 y X 3 .
en lre las personas con Xi = Xi 1 (puntuacin baja en X 2 ) y X 3 = X 31 (puntuacin
Por estas razones, llamaremos a s; varia nza asociada, y a s 2 3 la llamaremos
baja en X3 ), como entre las personas con X 1 = X 22 (puntuaci n media en X2 )
varianza no asociada.
y X3 = X 32 (,untuacin meda en X 3 ), como entre las pcrsopas con X i = X 23
(puntuacin'alta en X 2 ) y X 3 = X33 (punl uacn alla en X_) , a unas les corresponden Ahora bien, sabemos que: R 2 3 = s;;fs;, . Pero s;/s;, , dentro de este con -
346 / Estadistica para Psiclogos El coef1c1ente de correlacin mltiple y los planos de regresin / 34 7
texto, no es ms que la proporcin de la varianza total d e X 1 que e~t 18.3. D emostrar que r,,,=,- , , = "=,i=, -=.i = O. Es decir, q ue es nulo el coefi-
asociada a la variacin de Xi y X_1. Por tanto, Rf 23 representar esa propor- cien te de correlacin de Pearson entre los errores com etidos en los pronsticos
cin de varianza asociada. Si, por ejemplo, Ru 3 = 0,80, diremos que 0.64 es (en X 1 ) y las puntuaciones obtenid as en X 2 y enlre los mismos error es y las puntu acio-
la proporcin de la varianza total de X, que es1 asociada a la va riacin de X 2 nes obtenidas en X 3
y X 3 y que 0,36 es la proporcin que no est asociada. De otro modo, diremos
que el 64 por 100 de las diferencias individuales en X, est asociado, es atribui- 18.4. D emostrar que :E (X 1 - x;)(x ; - i'i) = O.
ble a, queda explicado por, ... las diferencias individuales en las dos variables 18.5. Demostrar que :E (x 1 - x; )(x;) = O.
predictoras, Xi y X 3 , y el 36 por 100 restante no est asociado, no es atribuible
18.6. D emostrar que L (;; 1 - :,, ; )(z;) = O.
a, no queda explicado por ... . las diferencias individuales en las dos varia bles
predictoras . 18.7. Apoyndose en 18.6, demos trar que '=it,,. =iJ = O. Es decir. que es nulo
el coeficiente de correlacin de P ear son e ntre los pronsticos, :-; . y los errores en
Igual que en el caso de dos variables, podemos expo ner las ideas anteriores de
dich o s pronsticos, z 1 - z;.
un modo algo ms intui tivo. De las n personas, unas son altas y otras son bajas en X 1
(criterio). Esa variabilidad es debida a la posesin en a l lo o bajo grado de cierlos 18.8. D emostrar q ue R 2 . 13 = R 3 . 12 = 1, si R u 3 = l.
factores (quienes los poseen en alto grado, obtienen altas puntuaciones en X 1 : 18.9. Sean r 12 y r13 las cor relaciones simples entre un criterio, X 1 , y dos variables
quienes los poseen en bajo grado, obtienen bajas puntuaciones en X 1 ). Parte de esos
prediclOras, X 2 y X 3 S uponiendo que ambas correlaciones tienen un mismo valor
factores son tales que su posesin en alto o bajo grado hacen, tambin, que las per-
(que llamaremos r), de mostrar que la correlacin simple, ,j 3 , entre las dos variables
sonas obtengan puntuaciones altas o bajas, respectivamente, en Xi y X3 (varia-
predicloras es igua l o mayor que 2r2 - l.
bles predictoras). Pero el resto de los factores , aunque influyen en obtener a ltas
Utilcese la frmula Ri .23 = (rfi - 2r 12 r 1.1r2 3 + ri 3 )/(l - ,.~,) y del hecho
o bajas puntuaciones en X,. no influyen en obtener sistemticamente puntuaciones
de que R, 23 :,:; !. )
allas o bajas en X 2 y X3 Es decir, del hecho de poseer estos ltimos fac tores en a lto
(bajo) grado, nada podemos concluir sobre si las puntuacion es en las var iables
18.10. A partir de 18.9, demostrar que si r12 = r13 = l. necesariamente r 23 = l.
predictoras sern, tambin, altas (bajas). Pues bien, los primeros factores daran
razn de la varianza asociada y los restantes daran razn de la no asociada . 18. 11 . Sean 1O, 14, 6, 2, 8 las puntuaciones directas pronosltcadas en un criterio X 1 ,
mediante el plano de regresin de X 1 sobre X 2 y X 3 . Siendo s;,
= 25, decir qu
parte de esta varianza no es atribuible a la variacin de X 2 y X 3 y cunto vale R u 3
18.4. Resumen: Definiciones y frmulas 18.12. D emostrar que rxf = :E(x 1 - x ; )2 + :E x ;2 .
18. 13. D emostrar que :E zf = L (z1 - z; ) + :E z;2.
2
EJERCICIOS
18.1. A partir de los cuatro cuadros del ejercic io 17.12 (del captulo a nterior).
calcular s;j . sf. 23 = s~ 1 -x ' s;1 - :
18.2. D emostrar que '= ,e,, -= ,, = O. Es decir , que es n ulo el coeficiente de corre-
lacin de Pea rs911 entre los pronsticos. z;.
y los errores en dichos pronslicos
(;; - z; ). ,,
1
>
Apndice 1
1.1. Definicin
o
, :..
X, = X, + X 2 + X 3 + X 4 + X~+ X0
"
X, = X, + X 2 + + X,,
1 =1
i =-l
(X, - 5 )' = (X , - 5)1 + (X 2 - 5)-' + (X_1 - 5)-' + (X 4 - 5 )3
"
(X,
,c. 1
- 5)
1
= (X 1 - 5)-' + (X 2 - 5) 1 + + (X,, - 5)-'
7
)
2
+ ( 2X - 1)
/
1
+( --t-1
2X ) 2
f (2X, _ 1) =(?X, _ 1)
2 2
+ (2X/ - 1)
2
i .+ 2X
( -1 - 1)
2
'" 1 7 7
( I' X,)2 = (2 + 3 + 4 )
n
h) (X, + k) = I X, + nk. Es un caso particular de a). para e = l . k j O. 2
= 92 = 81
P ---1 ,= 1 1~ 1
" n
e) cX, = e X,. Es un caso particular de a), para e/ O , k = O. Sin embargo, es posible la igualdad , siempre que:
p.: l i-=1
n
J I k = nk. Es un caso particular de a), para e= O , k -t O. XiX2 + X,X3 + '.' + x.x. - i = Q
,:. 1
/) I
"
(X, - k)2 = I
"
x; - 2k I
11
X, + nk 1 .
h) En general, I
1 ::. 1
X, Y, j
; .... l
X,
i= 1
Y,. Es d ecir, la suma de los p roductos
'= 1 i= l , =- 1 es distinta del producto de las sumas.
En efecto:
En efecto:
" n
I
ti
(X, - k) 2 = I
11
(X,2 - 2k X, + k 2 ) = I
11
X; - 2k I
11
X, + nk 2 L X, L
t== 1 1 = l
Y,= (X + X2 + '' + X,)(Yi + Yz + + Y,, )= (X, Y, +
1 :::) t= I ,=-1 ;= 1
As, por ejemplo, consideremos el cuadro siguiente : X,, representa la puntuacin de la persona i perteneciente al grupo f.
X, Y, X,Y, La suma de las puntuaciones del gru po l." vendr dada por
::e)
X"
(2 )(3) =
2
4
3
(4)(6) = 24 L X,Y, = 35 ~ 11 0 = (11 )(10) = X, Y,
La suma de las puntuaciones del grupo 2. vendr dada por 0
, . 1
X ,2
5 1 (5)( 1) = 5 i -= l ,. 1
(A )
'
L X; = 11
,. 1
3
Y,= 10
J
.f "
X,,. En
X, Y, X, Y; ~
- 2 (2)1 -2 ) = - 4
efecto. consideremos
f
n
X, 1 =
k ( )
X,, . es decir, el signo simple de sumar
1 1 ' ~ 1
2 2 2 2 ]= J p:::- ) JC [ re l
2 2
(1)(1) =
2
1
, .. 1
X,Y, = - 3 = (3)( - J) = X, Y;
j .a J ,., (con) variando de l a k) aplicado a la expresin f X ,,. Sabemos que. por definic in.
X,= 3 Y, = - 1 IX,Y,= -3
j :,;;.
2.1. Definicin
Supongamos que un grupo total queda descompuesto en k subgrup os, con 11 1
~ 1
x ,,
.-,~ 1 1
x, , x,,
x, ,
x,1
X 1,
x,.
11 2 , . , n. personas respectivamente.
Personas , X,1 X, 1 X ., x,, I' x,,
, . 1
G. l. G. 2.0 G.j G. k
I x,,
X,1 X,, X,, x,, 111 +112 +. + n1 = n J - 1
,r/; x,,.JJ
En este cuadro la fila i representa las puntuaciones obtenidas por la persona i en
Xn.zi x,..I< "
las k pruebas. La columna j representa las puntuaciones de las n personas en la
356 / Estadstica para Psiclogos Apndice / / 357
k 4 JO
X,1 + X,2 + ' .. + x,. = I
j = 1
X,j 2 4 8
8 2 6 11 1 =- 4 11, =J 11, =5
5 7
La suma de las puntuaciones de las n personas en la prueba j vendr dada por 9
"
X1, + X2j + . . . + x,,, = X,; 3 n- 4 J S
,~ 1 I
j ~ 1 i~
f 1
x,1 = I X11 + ,#I x,2
1 :::: I 1
+ I x,,
I= 1
= f4 +2+ 8 + 5J + (5 + 4 + 2 ) +
La suma de las puntuaciones de las n personas en las k pruebas vendr dada por
+( JO+ 8 +6 + 7 + 9) = 19 + 11 + 40 = 70
k II
~ , ; X;; En efecto, consideremos ;~i .~ X~
1 1 1
k n
= ~
1 1
k (n)
1
~
1
X ,; , es decir, el sig- r
jr. 1 r "" 1
(X,, - 4 )2 I
,= )
4
(X,1 - 4)
2
+ I
3
1= 1
(X;2 - 4)
2
+ I
S
I =1
(X,3 - 4 )2
tes arbitrarias.
En e fecto :
(X 11 + X 12 + + X 1.) + (X 21 + X 22 + + X2k) + + (X,, 1 + X,,2 +
+ .. +X)
"' n " 11 11
nk = "X
~ 1J +' L. X 2J + + (cX ,, +k) = L (cX,, + k) + (cX, 2 + k ) + + {(X ,m + k) =
;-= 1 j= 1
jc l i =l e l i =l l"" I
+ I k
j = l
X,,, = L" (I. X,; )
;c J ,~ t
= L
".
L X,;
P" i =1 = (e I X., + nk) + (e I X ;2 + nk) + .. +
1 ::;: l p }
En otras palabras:
(
+ e ~" X,.,, + nk
1 1
) = e (" ~ ,
" X,2 +
X,i + ;~, +
k n n k 1
I I I I x,,
j z::: l i= 1
x,j =
1 .::. 1 = L
+
1
~
11
1
)
X;,,, + mnk =
1
m
~
1
e,;II
X, 1 + mnk = c,~
m
1
11
.~X,, + mnk
D e todo lo dicho inferimos q ue el doble signo de sumar viene a significar lo m n m n
siguiente: Sull)e todos los trminos obtenidos sustituyendo los subndices i y j b) I I (X,; + k) = I X0 + mnk. Es un caso particular de a), con
por todos sus' valores posibles en la expresin afectada por dicho signo . J= I ' "' l je 1
;e , e = 1, k 1 O.
358 / Estadistica para Psiclogos
e)
m n
I I ex,, = (' I
m .
I X,j Es un caso particular de a), con EJEMPLO A.3
Apndice I / 359
J"'" I 1= 1 j = l '~ l C j o, k = o.
X,, Y;, m "
m
I ,=I x,,Y, j = (2)( 1) + /3)(51 + (5)(2) + (6)(4 ) + (4 )( 1) +
k
[] []
:r: 1 1
d) = mnk. Es un caso particular de a), con
Jc:: 1 ""1 e = O, k j O.
+ (2)(3J = 2 + 15 + ro + 24 + 4 + 6 = 61
4 I m II m n
e)
111
I I
11
(X,j + l',,)
m
= ,:c.I I t
n
X,, +
m
I I
11
Y,1
2 3 X,j Y,j = (2 + 3 + 5 + 6 + 4 + 2 )(1 + 5 +
j =I 1= 1 j= I i =I
J ,,,,. J '- 1 ,.-1
) "' l 1 = 1
+ 2 + 4 + I + 3) = (22)(16 ) = 352
En efecto:
m II n 11
EJERCICIOS
I I rx,, + r,1) = I <X" + y"+ I 1x, 2 + r, 2 ) + +
l. Siendo X 1 = 3, X 2 = - l, X J = 4, calcular el valor numrico de las siguientes
j &. 1 i= 1 1'-' l ;;;:- )
+ _
"
r:a::. l
(X,.,+ Y,,.)= ["L x, , + J"
- l 1- 1
X,1 + ' + ~
" X,,.
1- l
]+ expresiones, donde suponemos que el subndice i va de I a 3.
o) r X, f) r (X, - 5)
[ "
+ .~, Y" + ,~, Y, 2 + + ,~, r,,,
" " ] b) r x; g) L [(X, - 7)/ 6)
e ) (L X)2 /z) L (3X, + 2X;)
m n m n
1=1
I I p:;J
x,j + I I r,,
j z 1 i == 1
d} L4X, i) L (2X; - X,/3 + 4)
,.,1 11 111 11 m
e) L (X /3) j) r (X, - 3) 2
/) IX,j - k )2 = X~ - 2k I" X, 1 + mnk 2 Su legitimacin
k ) [L (X, - 3)] 2
, .. 1 ; ::: 1 = 1 i-= 1 r;:- l i= 1
2. Supongamos:
queda como ejercicio.
a) X, = 1, X 2 = 1. X 3 = - 2 b ) X, = 2, X 2 = -2
g) En general, J, J, X
m
1 j
(
~
m
1
~
"
1
\2
X;} . Su legitimacin queda como
Y1 = - 1, Y2 = 3. YJ =2 Y 1 = I, Y 2 = 4
ejercicio. e) X, = 2, X 2 = O, X J = 1 d) X , = 2, X 2 = 1/ 2
m n m n
h) En general.
,,1
11
EJFMPUJ A.2
2.2. r (X, Y,) 2.7. L (2X, + Y)2
,,, 11 2.3. L (X,Y,)2 2.8. L [ (2X, )2 + Y;]
I I X;, = 4 2 + y + 51 + 6 2 + 22 + 42 = 16 + 9 + 25 + 2.4, (L X,Y, )2 2.9. [L (2X, + Y, )] 2
~
J" 1 1 .;. 1
+ 36 + 4 + 16 = I 06 2.s. rx; r r,
~ (J,"' J," X, ,)\' = (4 + 3 + 5 + 6 + 2 + 4)2 = 24 2 = 576
3. + Y,)2 ,fo L (Xf +
Dcmostar que, en general, L (X, rn.
4. Demostrar que, en general, [L (X, + Y;)] 2 ,fo r (X, + Y,)2.
Para compi:_ebar h), supongamos los dos cuadros siguientes, ambos con m = 2
y 11 = 3. 5. Demostrar que, en general, [L (X; + Y;)]2 ,fo r (X; + Yf ).
360 / Es1adist1ca para Ps1c/ogos
6. Supongamos que a tres personas les han sido aplicadas dos pruebas. Llame-
mos X,J a la puntuacin obtenida por la persona i en la prueba}. Es decir, X 1 1 es
la puntuacin obtenida por la persona primera en la prueba primera, X 12 es la
puntuacin obtenida por la persona primera en la prueba segunda, etc. Supon-
gamos, adems, que las puntuaciones obtenidas por estas tres personas en las
dos pruebas son las siguientes: Apndice 11. Soluciones a los
ejercicios propuestos
Pruebas (j)
X 11 =2 X 12 = l
Personas (i) 1 X 21 =- l x,, = 2
X3 , = 3 x,, = - 2 CAPITULO 4
4.4.
d) 7 e) 5X,J /) ~ (~X,;)2 X
' J
i j ni 11. p
- -- "
- - - -
% '1/~"
il ~ q:x,1)2 h) (X,; + 9) i) ~ (;x,; + 9) 26-28 5 40 0, 125 1,000 12,5 100,0
j j 2325 6 35 0, 150 0.875 15,0 87,5
20-22 12 29 0.300 0,725 30,0 72.5
j) ; ( ~ X; + 9) 17-19 10 17 0.250 0,425 25,0 42,5
14-16 7 7 O 175 0.175 17,5 17.5
- -- ~ --- -
7. Demostrar que ;ti ( t X,, + k)1 1
r
i= 1 j = l
'
X,J + rk . 40 1,000 100,0
8. Demostrar que Ls (
' X,; + k )
= ' s Xii + sk. Tambin habran sido posible los intervalos 13-15, 16-18, 19-21, 22-24 y 25-27.
j == J :,: t i =- 1 j :;;;, 1
9. Demostrar que
1
f '
1
'
;~i X,~ = J '(
1
'
;~i X,} ) = ;~i
s ('
.~i X,j ) . 4.6.
X n, 11. p P, % ;1/~Q
' ' \ l ' s
--- ~ +- - ---
10. Demostrar que, en general, ( ,~i ;~i X,;) i .~ ~ X;] 17-19 8 50 0, 16 1.00 16 100
1 1 14-1 6 9 42 0, 18 0,84 18 84
11. Demostrar que, en general ,
i = l ) "' l
X; Y,1 =f. ,
je 1 j -= 1
X;J ,
i == 1 J::. 1
Y,,.
11-1 3
8-10
5-7
12
10
7
33
21
11
0,24
0,20
0,66
0,42
24
20
66
42
0,14 0,22 14 22
12. Demostrar que, en general , I'('
t = l j= 1
X,; 'f)' '(' X; )] 1= 1 l""' 1
1 .
2-4 4 4 0,08 0,08 8
- ~- -
8
20-24
"1
12 80 0, 150
""
1.000
'
15,00 100,00
5.20.
5.21.
4,375
a) P , 5 = 70,2353 P25 = 73,1765 P3 , = 76,2 105
15-19 18 68 0,225 0.850 22.50 85,00 P15 = 86,6667 P82 = 89,0000
10-14 24 50 0,300 0,625 30.00 62,50 5.22. a) P25 = 89,000 . P 30 = 91,625 P75 = 100,045
5.9 16 26 0,200 0.325 20.00 32,50 5.23. 24.7 (perccntil 12), 38,5 (percentil 88)
0-4 10 10 0.125 0, 125 12.50 12.50 5.24. No tiend que serlo (aunque puede se rlo)
5.25. No. Un percentil es una puntuacin que puede ser posi tiva, negativa o nula
80 1,000 IOOJlO
4.9.
o, CAPITULO 6
X ", " p p., /o ./.
92-95 ,1il 4 20 0,20 1.00 20 100 6.1. a) 9,20: 3,033 h) 1,50 : l,225 ; e) 4,40; 2,098 d) 2:
88-91 ,r 1/! 8 16 0.40 0.80 40 80 1,414 l') 5,33; 2,309 f) 8,67; 2,944
84-87 11/1 I 6 8 0,30 0.40 30 40 6.2. a) 2,4 h) l e) 2 d ) l,333 e) 2
80-83
--
// 2 2
- - - - - -- -- - - - - --
0.10 0, 10 10 10
.n 2.667
20 1,00 100 6.3. a) 7,5 ; 2,739 b) 7,56; 2,75 e) 6,56; 2,561 d ) 24,0J ;
4,9 e ) 8,64 ; 2,939 f) 26, 188; 5,11 7 K) 7,29:
2,7 /) 24,422: 4,942
6.4. a) 2 h) 2,4 , e) 2,24 d) J. 78 e) 2,4
CAPITULO 5 n 3,85 g) 2,24 11 4,01
6.5. a) 6.745 1 b) 5,5225
2
5. 1. a)
5,25 h) 20 e) 2,8 d) - 0,5 e) 0,633 6.7. (l - 3) + (2 - 3)2 + (6 - 3)2 = 14; (l - 5)2 + (2 - 5)2 + (6 - 5 )2 = 26 :
f) - 0,5875 g) - 0,051 (3)(3 - 5)2 = 12; 14 = 26 - 12
5.2. a) 7,2 h) 91 ,2 ; e) 75,7 d) 34,237 6.8. r
(X, - 5 )2 = 12, n(X - 5) 2 = (8 )(4,75 - 5) 2 = 0, 5
e) 31.875 /) 0.1379 ; K) !0.417 xi
r 1x, - 2 = 12 - o,5 = 1 u
5.3. Al intervalo 11 -13 le corresponde 5; al intervalo 2-4 le corresponde 2 75
6.9. Elegi r k = 1.75, .i; = _!2 , = l 5,9375
5.4. 4 y 12 f' 8
5.6. 15 6.10. 69
364 / Estadistica para Ps,c ologos Apndi ce 11. Soluciones a los eerc1c1os p ropuestos / 365
f'' J''-r _: -
' : - - l -, 2 - 1 X
d) dif. : - 1; 0;2 : - l llp. , 9. 1.
Fs JD' ./ w
' 3 3
e) d if. : - 3 ; O; 3 tlp. : - J6' , ,OJ]
fa
1
9.IO.. CAPITULO 12
X y xr
12.2. Basta con recor da r 10.2.3 .b y tener en cuenta que ,_. = r,/1,/s,) x. donde
2 4 8
r,,,.fs,) es una constante
4 4 16
12.3. Basta con demostrar que r x lr - r ') = O. r xr = r xr
8 10 80
10 14 140
12.4. Basta con demostrar que r y'(y - r ' ) = O, , r rr ' = r r' 1
12.5. Basta con recordar que f = f '
12.6. La igualdad propuesta equivale a r lr - r ')r' = O. que ha quedado demos-
trada en 12.4
12.7. S 12.8. No necesa riamente
CAPITULO 10
12.9. 4 12.13 12.14.
10. l. a)0,9 b) -0,6 e) 0,189 d) - 0,913 l r2 X r
- -~
e) 0,575 () -0,789
- 6 - 9 81 1 6
10.2. a) 0,356 ; b) - 0,853 ; e) 0,5 19 d) - 0.556 ; e) - 0.657 -- 2 - 3 9 13 10
10.5. Recuerde que el numerador de rx, es n L XY - LX L Y, que ser necesa- 9 81 4 7
riamente O si rx, = O o o o -~ 4
10,6. No 10.7. No 10.9. u) Tiene perfecto sentido : h) El 2 3 9 7 8
mismo (recuerde las propiedades de rx,.)
10.10. a) 244 , b) 484 , e) 4
s X - rs , rsx - s\._ __ 12. 15. 0,80 12. 18. 1,2 12.21. 1,44
10.12. 6
r,.,. = .j '
10.14. 0,65
10.13. 'n = Js; + s; - 2rx,s.s,. s~ +
2 2 s ,.
S_r - YX}' XJ ).
10.15. Para rxy = 1, 37; para rx, = O, 41: para r,r = - l. 45 CAPITULO 13
10.16. 0,875
10.17. Cuando rn = O , s., = 13 cuando rxv = 1 , s~ = 1 13.l. u) 11;., = 0,787 h) 11;. = 0,423 e) '1;.x = 0,808
JO.J8. rDH =0 13.2. a) 11;, = 0,592 h) 11;x = 0,625 e) ,;, = 0.200:
d) 11;.. = 0,663
13.4.
CAPITULO 11 X ., }"
- - - - -
11.1. a) Y' = 0, 3 + (0,9)X, y'= (0,9)x, z;, = (0,9) z, l - 3 5
b) Y'= 7 + ( - 0,6)X, y'= (-0,6)x, :;. = (-0,6) : , 6 2 5
4 o 5
e) Y'= 1,786 + (0,07l)X, y '= (0,07 1) x, : ;, = (0,189) z, 1 5
5
d) Y' = 3,5 + (--0,5)X, y' = (-0,5)x , :; = (-0.9 13) : ,
e) Y' = 3,4 + (1 ,15) X , y ' = (1,15) x , z; = (0,575) :,
/) Y'= 5,422 + (- 0,692)X, y'= (-0,692)x , z; = (-0,879):,
11.2. Y'(0,4; 10,0; 19,6: 6,8; 13,2) , y '(-9,6 ; O: 9,6: - 3,2: 3,2)
z;.( - 1,2: O; 1,2: - U,4 ; U,4J CAPITULO 14
11.3. a) 20 : b) 30 ; e) 40
11.4. Y'= 5 + (2)X y' = (2)x 14. 1. 0,57 14.2. 0,43 14.3. 0,69 14.4. 0,43
11.5, 5 7; JJ.6. y ' = (0,50) X 14.5. a) 0,7 b) -0,8 e) 0,71 4 d) 041 1
11.7. Y' = 6 '+ (0.8) X 14.6. a) 0.667 b) - 0,2 e) 0,067 d) - 0.524
368 / Estadisti ca p ara Ps,c/ogos Apndice /l. Sol ucion es a los ejerc,c,os p r opuestos / 369
e) z; z
= (0,60114 ) 2 + (0,13960) z3 x;
= (0,20038)x 2 + (0,0698) x 3 2.8 a) 38, h) 49, e) 34, d) 625/ 36
x; = 1,77778 + (0,20038) X 2 + (0,0698 ) X 3 2.9 a) 16. h) 25, e) 36, d) 841 /36
d) z; = (l/3)z2 + (l/3)z3 ; x; = ( l/3)x 2 + (J / 3)x3 ;
x; = (1 /3) X 2 + (1/3) X3 6. a) 5. h) 23, e) 25, d) 42. e) 25. n 11
g) 17. J,) 59, i) 32. ; ) 23
17.13. tp. : - 0,50 - 0,25
a)
dif. :_..- 2,00 - 1,00 O, 75 0,00
dir.':' 4, 00 5,00
0,00
6,00
3,00
9,00
6.00
Apndice 111 TABLA A. Dis tribu cin normal. P (Z :5 z). ( cont in ua C'/011)
~ z o 1 2 3 4 5 6 7 8 9
TABLA A. Distribucin normal. P(/.. ~z) . O'O '5000 '5040 '5080 ' 51 20 '5160 '5199 ' 5239 '5279 ' 5319 ' 5359
z O' l '5398 1
5438 '5478 '551 7 '5557 '5596 ' 5636 '5675 ' 5714 '5753
0'2 '5793 '5832 '5871 ' 5910 '5948 '5987 ' 6026 '6064 '6113 '6141
0'3 '6 179 '62 17 '6255 '6293 '6331 '6368 '6406 ' 6443 ' 6480 '6517
0 '4 ' 6554 ' 6591 '6628 '6664 '6700 '6736 '6772 '68-08 '6844 '6879
z o l 2 3 4 5 6 7 8 9 0 '5 '6915 '6950 '6985 '7019 '7054 '7088 1
7123 ' 71 57 1
7190 1 7224
0' 6 '7257 '7291 '7324 '7357 '7389 '7422 ' 7454 ' 7486 '7517 '754 9
-3'5 '0002 '0002 '0002 1
0002 '0002 '0002 1
0002 1
0002 '0002 ' 0002
0' 7 ' 7580 '7 611 '7642 '7673 '7703 ' 7734 ' 7764 ' 7794 '7823 ' 7852
-3'4 1
0003 '0003 '0003 '0003 '0003 ' 0003 '0003 '0003 '0002 ' 0002 '8023 ' 8051 ' 8078 '81 06 '8133
1
0004 '0003 0'8 ' 7881 ' 79 10 ' 7939 '7967 ' 7995
- 3' 3 '0005 '0005 '0004 '0004 1
0004 1 0004 '0004 '0004 0 '9 '81 59 ' 8186 ' 8212 '8238 '8264 '8289 '8315 ' 8340 '8 365 '8389
-3'2 1
0007 '0007 '0006 1
0006 1
0006 '0006 ' 0006 '0005 '0005 '0005
1 'O '8413 '8438 '8461 '8485 '8508 1
8531 '8554 ' 8577 ' 8 599 ' 8621
-3' 1 !OOlO '0009 '0009 ' 0009 ' 0008 '0008 '0008 ' 0008 '0007 '0007 1 ' 8749 ' 8770 ' 87 90 ' 8810 ' 8830
' 0010 1 '1 ' 8643 '8665 8 686 '8708 '8729
-3'0 1
0014 ' 0013 '0013 '0012 '0012 '0011 ' 0011 '0011 ' 0010 1' 2 '8849 ' 8869 '8888 '8907 '8925 '8944 '8962 '8980 ' 8997 ' 9015
-2'9 ' 0019 '0018 '0017 1
0017 '0016 '0016 1
0015 '0015 '0014 '0014 ' 9115 ' 9131 '9147 ' 9162 1 9177
113 '9032 '9049 ' 9066 ' 9082 '9099
-2'8 1
0026 '0025 '0024 '0023 ' 0023 '0022 '0021 1
0021 '0020 '0019 ' 9292 '9306 '93 19
'0026 1 '4 '9192 ' 9207 '9222 ' 9236 '925 1 ' 9265 ' 9278
-2'7 '0035 1 0034 '0033 '0032 ' 0031 1 0030 '0029 ' 0028 '0027 '9370 '9382 ' 9394 ' 9406 ' 9418 '9430 ' 9441
' 0037 1
0036 l '5 ' 9332 ' 9345 '9357
- 2'6 '0047 '0045 '0044 ' 0043 ' 0041 ' 0040 ' 0039 ' 0038 116 '9452 '9463 '9474 '9484 '9495 '9505 ' 9515 ' 9525 '9535 '9545
-2 1 5 1
0062 ' 0060 '0059 '0057 '0055 '0054 '0052 '0051 ' 0049 '0048 ' 9582 '9608 ' 9616 '9625 '9633
'0064 1'7 '9554 '9564 ' 9573 '959 1 '9599
-2'4 '0082 1 0080 '0078 '0075 '0073 '0071 '0069 '0068 '0066 '9648 1 '9664 '9671 ' 9678 '9686 ' 993 ' 9700 ' 9706
'0084 1'8 '964 1 9656
-2' 3 ' 0107 '0104 '0102 '0099 '0096 '0094 '0091 '0089 '0087 '973 2 ' 9738 ' 9744 '9750 ' 9756 ' 9762 '9767
' 0110 l '9 '9713 ' 9719 '9726
-2 ' 2 '01 39 1 0136 '0132 '0129 '0126 ' 0122 '0119 ' 0116 ' 0113 1 '9783 ' 9788 ' 9793 '9798 '9803 ' 9808 '981 2 '9817
' 0146 ' 0143 2'0 9772 '9778
- 2' 1 '0179 '0174 '0170 ' 0166 '0162 ' 0158 '0154 ' 0150 ' 9826 1
9830 '9834 '9838 ' 9842 '9846 '9850 '9854 ' 9857
1 '0192 ' 0188 ' 0183 2' 1 '982 1
-2 1 0 '0228 1 0222 1 0217 '02 12 '0207 '0202 0197 2 '2 '9861 '9864 ' 9868 '9871 '9874 '9878 '9881 ' 9884 ' 9887 ' 9890
-1 '9 '0287 ' 0281 '0274 '9268 '0262 ' 0256 '0250 1
0244 '0238 '0233 '9901 1
9904 '9906 '9909 '9911 '9913 '9916
' 0294 2' 3 '9893 ' 9896 '9898
-1 ' 8 ' 0359 '0352 ' 0344 '0336 '0329 '0322 '0314 ' 0307 '0300 '9927 ' 9929 '9931 ' 9932 ' 9934 '9936
'0367 2' 4 ' 9918 '9920 ' 9922 '9925
- 1'7 '0446 '0436 ' 0427 ' 0418 '0409 '0401 ' 0392 ' 0384 '0375 2' 5 '9938 '9940 '994 1 '9943 ' 9945 '9946 '9948 '9949 ' 9951 ' 9952
-1'6 '0548 '0537 '0526 '0516 '0505 '0495 '0485 '0475 '0465 '0455 ' 9959 ' 9960 '9961 ' 9962 ' 9963 '9964
2'6 '9953 '9955 '9956 '9957
- 1' 5 ' 0668 '0655 '0643 '0630 ' 06 18 '0606 '0594 '0582 ' 0570 ' 05 59 2' 7 ' 9969 '9970 '9971 ' 9972 ' 99 73 ' 9974
'0681 '9965 '9966 ' 9967 '9968
-1 '4 '0808 '0793 '0778 '0764 '0749 ' 0735 ' 0722 '0708 '0694 2' 8 '9976 '9977 '9977 '9978 '9979 ' 9979 ' 9980 '998 1
1 ' 0838 ' 0823 '9974 '9975
-1 '3 '0968 '0951 '0934 ' 0918 '0901 ' 0885 ' 0869 0853 2' 9 ' 9981 '9982 ' 9982 ' 998 3 '9984 '9984 '9985 ' 9985 '9986 '9986
1
-1'2 '11 51 '1131 '1112 ' 1093 '1075 '1056 '1038 ' 1020 '1003 0985 ' 9988 ' 9988 '9989 '9989 '9989 ' 9990 '9990
3'0 '9986 '9987 '9987
-1'1 '1357 '1335 '13 14 ' 1292 ' 1271 '1251 '1 230 '1210 '1190 '1 170 3'1 '9990 ' 9991 '9 991 '999 1 ' 9992 '9992 '9992 '9992 '9993 ' 9993
-1 'O ' 1587 '1562 '1539 '1515 '1492 ' 1469 '1 446 1
1423 ' 1401 '1379 '9994 '9994 ' 9994 '9994 '9994 ' 9995 '9995 ' 9995
' 161 l 3' 2 ' 9993 '9993
- 0'9 '1841 '1814 '1788 '1762 '1736 ' 1711 '1685 '1660 '1635 '9995 ' 9996 '9996 '9996 '9996 ' 9996 '9996 ' 9996
'1894 ' 1867 3' 3 '9995 ' 9995
-0'8 '2119 '2090 '2061 '2033 ' 2005 1 1977 ' 1949 '1922 3'4 ' 9997 ' 9997 ' 9997 '9997 '9997 '9997 ' 9997 ' 999 7 ' 9997 ' 9998
- 0'7 '2420 '2389 '2358 ' 2327 '2297 ' 2266 ' 2236 '2206 ' 2177 ' 2148 ' 9998 '9998 '9998 '9998 '9998 '9998 1
9998 '9998 ' 9998
' 2451 3'5 ' 9998
-0' 6 '2743 '2709 '2676 '2643 '2611 ' 2578 '2546 '2514 '2483
-0' 5 '3085 '3050 '3015 '2981 ' 2946 '291 2 '2877 ' 2843 '2810 '2776
-0'4 '3446 ' 3409 '3372 '3336 '3300 '3264 '3228 '3192 '3156 '312 1
-0' 3 ' J821 '3783 '3745 ' 3707 ' 366 9 '3632 ' 3594 '3557 '3520 ' 3483
-0'2 '4207 '4168 '4129 '4090 ' 4052 '4013 '3974 '3936 '3897 '3859
-0'1 '4620 '4562 '4522 '4483 ' 4443 '4404 ' 4364 '4325 '4268 ' 4247
-0'0 '5000 '4960 '4920 ' 4880 '4840 1 4801 '4761 472 1 ' 468 1 ' 464 1
Los va lores interiores indican probabilidades . Dela nte d e la coma decimal.(', se e ntiende que
va un cero. Asi, por CJcm plo . 8925 equivale a 08925 e indica que P(/. < 1'24) = 0'8925.
(conti nUo)
p B E
p A B e D E F q ;pTq p /y
(o, q ) lpq ljiTq pq/y /pq/y p/y y (o ' p)
O' 4 9 0'980 1 ' 229
0'99 0'0995 9'950 O' 371 5 3'733 37'148 0 ' 02665 0' 01 O' 4 8 0'96 1 1 ' 205
0'98 0'1400 7'000 0'4048 2 1 892 20 1 24 o 0'04842 0' 02 O' 47 O' 94 2 1 '18 1
0 ' 97 O' 1706 S' 68 6 0 '4 277 2'507 14 1 256 0'06804 0 '03 O' 4 6 0'923 1 ' 159
0 ' 96 0'1960 4 '899 0 ' 4456 2'274 11 ' 141 0'086 17 0' 04 O' 4 5 O' 904 1 '137
0'95 0'2179 4 1 359 0'4605 2 1 113 9 ' 211 0 ' 1031 0 '05 0' 44 0'886 1 ' 1 16
0 ' 94 0'2375 3'958 0'4735 1 '994 7'891 O' 1191 0' 06 O' 4 3 0 ' 869 1 '095
0'93 0'2551 3'645 0'4848 1 '900 6'926 O' 1343 0 ' 07 O' 4 2 O' 851 1 ' 074
0'92 0'2713 3 ' 391 0'495 1 1 ' 825 6' 188 0 1 1487 0'08 0'41 0'834 1 ' 054
0 ' 91 0'2862 3'180 0 1 5043 1'762 5' 604 O1 16 24 0 ' 09 0 ' 40 0 ' 816 1 1 035
0'90 0'3000 3'000 0'5128 1'709 5'128 0 ' 175 5 O' 1 O
0'39 0 ' 800 1 1 016
0'89 0 1 3129 2'844 0'5206 1'664 4 1 733 O' 1880 0'1 1 0'38 0'783 0 ' 998
O'88 0'3250 2 1 708 0 ' 5279 1 '625 4'399 0'2 0 00 O' 12 0 ' 37 0' 7 66 0'980
0'87 0'3363 2'587 0'5346 1'590 4 '112 O' 211 5 o 11 13 0'36 0 ' 750 0 ' 962
0'86 o1 3470 2 1 4 78 0'5409 1'559 3'864 0'22 26 o 14 0 ' 35 0 ' 734 0'945
0'85 0'3571 2'380 0'5468 1 1 532 3'646 0 ' 2332 o 11 1 5 0 ' 34 0'718 0 ' 928
0 1 84 0'3666 2'291 0 ' 5524 1 1 507 3' 4 52 O' 24 33 o 16 0 '3 3 0'702 O' 9 11
0'83 0'3756 2'210 0'5576 1 '484 3'28 0 0'2531 O' 1 7
O' 8 2 0'3842 2' 134 0'5625 1 '464 3'125 0 1 2624 o1 18 0 ' 32 0'686 0 ' 895
O' 81 0'3923 2'065 0 1 5671 1 '446 2'985 O' 2 714 O' 19 o11 3 1 0 ' 670 0 '879
0'80 0'4000 2'000 0'5715 1 1 429 2'858 0 1 2800 0' 20 o 30 0'655 0'863
0 ' 79 0 ' 4073 1 '940 0 ' 5756 1 1 4 13 2'741 0 ' 2882 0 '21 0'29 0 ' 639 0'8 4 7
0 1 78 0'4142 1' 8 83 0'5796 1 '399 2 1 634 0' 2961 0 '22 0 ' 28 0 ' 624 0'832
' 77 0'4208 1 '830 0'5832 1 1 386 2 1 536 0 1 3036 0 '23 o1 2 7 0 ' 608 o1 8 17
0'76 0'4271 1 1 780 0'5867 1 1 374 2 1 44 5 0'3109 0 '24 0 ' 26 0'593 0 ' 80 1
0'75 0 1 4330 1 '732 O' 5900 1 ' 363 2 1 360 0'3178 0 '25 0 ' 25 0 ' 577 0 ' 78 7
0'74 O' 4 38 6 1'687 O' 59 31 1 '352 2'281 0'3244 0 ' 26 0'2 4 0 ' 562 O' 772
0'73 0 1 4440 1'644 O' 5961 1 1 34 3 2 1 208 0 ' 33 06 0 '2 7 0'23 0'54 6 0'758
0'72 O' 44 90 1 1 604 0'5989 1 '334 2' 139 0' 3366 0' 28 0 '22 0 ' 53 1 0 '7 43
O' 71 0 1 4538 1 '565 0 ' 6015 1 1 326 2'074 o 1 3423 0' 29 O' 21 O' 5 1 6 0 ' 729
0 1 70 0'4583 1 '528 0'6040 1 1 318 2 ' 013 O' 34 77 0'3 0 O' 2 O 0 ' 500 O' 714
0'69 0'4625 1 1 492 0'6063 1 '311 1 ' 956 0 ' 3528 O' 31 O' 19 O' 4 84 0'700
0'68 0 ' 4665 1' 458 0'6085 1 '304 1 '902 0'35 76 0' 32 O' 18 0'468 0'686
0'67 0 ' 4702 1'425 0'6106 1 ' 298 1 '850 0'36 21 0'3 3 O' 17
0'66 0' 4737 1'393 0'612 4 1 '293 1 '801 0 1 366 4 O' 34 O' 4 53 0 ' 672
0'65 O' 4770 1 1 363 0'6142 1 '288 1 1 755 0'3 704 0' 35 O' 16 O' 4 36 0 ' 658
0 ' 64 0 ' 4800 1 '333 0'6158 1 ' 283 1 '711 0'3741 O' 36 O' 1 5 0'420 0'643
0'63 0'4828 1 1 305 0 ' 6174 1 '279 1'669 0'377 6 0 1 37 O' 14 o 1 403 0'6 2 9
0'62 0'4854 1' 277 0'6188 1'275 1 '628 O' 38 0 8 O' 38 O' 13 0 ' 387 0'6 1 5
0'61 0'4877 1' 251 0 1 6200 1 '27 1 I '590 0 '38 37 0 '3 9 O' 12 0 ' 369 0'600
0'60 0'4899 1'225 0'6212 1 '268 1'553 0'3863 0 '4 0 O' 11 0 ' 352 0'585
0'59 0 ' 4918 O' 1 O 0' 333 0 ' 570
1 '200 0'6223 1 '265 1 '518 0'3888 O' 4 1
O' 58 0 ' 4936 1'175 0 1 6232 1 '263 1 '484 0'3 909 0' 42 0 '09 O' 314 O' 5 54
0'5 7 0'4951 1' 151 O' 624 O 1 '260 1 1 451 0 ' 39 28 0 ' 43 0 ' 08 0'295 0 ' 538
0'56 0'4964 1 ' 128 O' 624 7 1 '2 59 1 1 420 0 ' 3944 0 ' 44 0'07 0'27 4 O' 5 21
0'55 0'4975 1 '1 06 0' 6 253 1' 257 1 1 390 0' 3958 O' 4 5 0 ' 06 0 ' 253 O' 504
O' 54 O' 4984 1 1 083 0'6258 1'256 1 '3t0 0 ' 39 6 9 o 1 46 0'05 O' 229 O' 4 85
0'53 0'4991 1'062 0'6262 1 '255 1 '332 0 ' 397 8 0'4 7 0'04 o1 20 4 0'464
0 ' 52 0'4996 1 '041 0'6264 1 '254 1 '305 0'398 4 0 '4 8 0'03 O' 176 0' 44 1
O' 51 0'4999 1 '020 0'6266 1 '253 1'279 O' 39 88 0 '49
0'5 0 0 ' 5000 1'000 0'6267 1'253 1 ' 253 0 '3989 0 '5 0
0' 02 o 1
143 O' 4 1 3
o1 01 O' 1 00 0 '3 75
,j'
FuENH: GUILFORD. J. P., Fundamenral Sraris rics 1n Psycho/ogy and Educatwn . 4. euicin.
(commaJ 1965. apndice B. tabla G.
TABLA C. Clculo del coeficiente de c orrelacin tctracrica , r,. (*)
0'00
O' 01 1 '
1 ' 013-1 '039
0'35
0'36
2'492-2 1 563
2'564-2'638
0 '70
0'71
8 1 500 -8'9 10
8'911-9'351
0'02 1'040-1'066 0'37 2 ' 639-2 ' 716 0 1 72 9'352-9'828
0'03 1 1 067-1'093 0'38 2'717-2'797 0'73 9' 8 29 - 1 o'34 4
0'04 1'094-1'122 0'39 2 1 798-2'881 0'74 10'345- 10'903 BIBLIOGRAFfA
0'05 1'123-1'151 0'40 2'882-2'968 0'75 10'904-11'512
l 0'06 1 1 152-1'180 0'41 2'969-3'059 0'76 11'513 - 12' 177
0'07 1'181-1 1 211 0'42 3'0603'153 0'77 12' 178- 12 '905
0'08 1' 212-1 242 O' 43 3 ' 1543'251 0'78 12'906-13 '707
0'09 1'243-1'275 O' 44 3'252-3 1 353 0'79 13 1 70814'592
' 1 O 1'276-1'308 0' 45 3'354 3'460 0'80 14'59315 ' 574 Alcaide lnchausti, A.: Estadfstica aplicada a las Ciencias Sociales, Ediciones Pirmide,
' 11
O' 12
1'3091'342
1'3431'377
0'46
O' 4 7
3'461-3' 571
3'5723'687
0'81
0 1 82
14'575-16'670
16'67117 '899
Madrid, 1976.
Amn , J.; Multidimensionalidad de la religiosidad utilitaria a travs de la afinidad entre
O' 13
O' 14
1 1 378-1 1 413
1 '414-1 '450
0'48
0'49
3'688-3'808
3 1 809-3'935
' 83
O' 84
17 '900-19'287
19'288-20'865 las cuestiones intrnsecas y las extrnsecas, Rev. de Psicol. Gen. y Aplic ., 1968,
vol. XXIII , nm. 95, pgs. 983-988.
O' 15 1 '4511 '488 0'50 3'9364 1 067 0 1 85 20'86622'674 Amn, J .: Prejuicio antiprotestante y religiosidad utililaria, Aguilar, Madrid , 1969.
O' 16 1'4891'528 0'51 4'0684'205 0'86 22'67524'766
O'l7 1'5291'568 0'52 4'206 4'351 0'87 24'767-27'212 Amn, J .: La construccin de escalas psicolgicas en funcin del mtodo elegido , Rev.
o11 18 1' 569 1 '610 0'53 4'3524'503 0'88 27'213-30'105 de Psicol. Gen. y Aplic . , 1972, vol. XXVII , nms. 116-117, pgs . 423-431.
o 19 1'6111'653 o1 54 4'504 4'662 0'89 30'10633 ' 577 Atkinson , R. C., Bower, G. H. y Crothers , E. J.: An Inrrod11ction ro Mathematical
0'20 1'654-1'697 0'55 4'6634'830 0'90 33 1 57837'815 Learning Theory , John Wiley, Nueva York, 1965.
O' 21 1'6981'743 0'56 4'831-5'007 0'91 37'816-43'096 Bailey, N. T. J.: The Ma thematical Approach to Biology and Medicine, John Wiley,
0'22 1 1 744 1 '790 0'57 5'008-5'192 0'92 43' 097-49 ' 846 Nueva York, 1967.
0'23 1 1 7911'838 0'58 5'193-5'388 O' 93 49 '847 -58 '758 Balow , B. , l:'ulton , H. y Peploe, E.: Reading Comprehension Ski/Is Among Hearing
0'24 1'839-1'888 0'59 5'3895'595 0'94 58 1 7597 1 ' 035 lmpaired Ado/escents , Volta Review, 1971, 73, pgs. 113- 119.
0'25 1 '889 - 1 '940 0'60 5'5965'813 0'95 71 '03 688' 96 4 Berman, P. W. , Waisman, H. A. y Graham, F . K .: Inte/ligence in Treat ed Phenylkero-
0'26 1'9411'993 0'61 5'8146'043 0 1 96 88'965- 117 1 479 nuric Children : A Dei-elopmental Study, Child Developmenl, 1966, 37, pginas
0'27 1'9942'048 0 1 62 6'0446'288 0'97 117'480169'503 731-747.
0'28 2' 04 9 - 2 ' 1 O5 0'63 6'289-6'547 0 1 98 169'504292'864
0'29 2'106-2'164 0'64 6'548-6'822 0'99 292'865923 1 687 Bingham , W. Wd., Moore , B. V. y Gustad , J . W.: H ow ro Interview, Harper & Row,
Nueva York", 1959.
0'30 2' 165-2' 225 0'65 6'8237'11S 1'00 923'688 "' Bisset , B. M. y Rieber, M .: Th e Effects of A ge and Incentive Va/u e on Discrimination
0 1 31 2'2262'288 0'66 7'116-7'428
0 1 32 2 1 289-2'353 0'67 7'429-7 1 761 Learning, . J. Exp. Child Psych., 1966, 3, pgs. 199-206.
0'33 2'354-2 1 421 0 '68 7 1 762 - 8'117 Blommers, P. y Lindquist, E . F .: Elemenrary Staristical Methods in Psycholog_v and
o 1 34 2' 422-2'491 0'69 8'118-8'499 Education, University of London Press, Londres, 1965.
Burt, C .: Is lnte/ligence Distributed Normal/y?, Brit. J . Statist. Psychol. . 1963, 16,
pgs. 175-90.
Calo!, G .: Cours de Statistiq11e descriptive, Dunod, Pars, 1969. (Traducida al castellano
(" ) Sr cb>ad calclese cb!ad y acptese como positivo el valor obtenido; indica relacin con el t tulo de Curso de estadstica descriptiva , editada por Paraninfo, 1970.)
positiva entre la categora O ( 1) de X y la categora O ( l) de Y. Si cb < ad, calclese adicb y Casa Aru ta, E.: 200 problem as de Estadstica descriptiva , Vice ns Vives, Barcelona, 1969.
acptese como negativo el valor obtenido; indica relacin negativa e ntre la categora O ( 1) de X y la Collman, R. D. y Stoller, A.: A Survey of Mongo/o d Birrhs in Victoria , Australia ,
categora O < I) de Y. 1942-1957, Arner. J. Public Heallh , 1962, 52, pgs. 8 13-829.
Conde, V. y Domenech, B.: Considerations on the l. Q. With the WA YS in a Sample of
Fu>.NH: GLA~ G. V. y SlANLEY , J. C., Staristical Meth ods in Educa1ion and Psyc/10/0:y. Schizophrenics in Relation With the Sex, Age, Cu/rural Le ve/, Origin, Residence and
1970; apndice A, tabla H. Civil State , Rev. de Neurnl., Neuroch. y Psich. , Oviedo, 1976, 27, pgs . 258-291.