You are on page 1of 23

INTRODUCCIN AL ANLISIS DE CORRESPONDENCIAS: USO EN ANLISIS

MULTIDIMENSIONALES.
Copyright Fco.J.Herrero y M.Cuesta (1998)
Dpto. de Psicologa
Universidad de Oviedo (Report:DPAM#98.1)
*RESUMEN*
El anlisis de correspondencias (AC) es una tcnica exploratoria, semejante a los
componentes principales, que determina la representacin multidimensional de la
asociacin entre las caractersticas expresadas en una tabla de contingencias.
Esta tcnica convierte las categoras de la tabla de frecuencias (filas y columnas) en
un menor nmero de dimensiones, indicando que porcentaje del valor 2 de la
asociacin puede ser explicado por las nuevas dimensiones.
En esta exposicin nos introduciremos en el uso de una de las tcnicas bsicas de
anlisis descriptivo sobre matrices bidimensionales as como su mecanizacin en SPSS.
Dedicndonos inicialmente a una introduccin breve de la utilizacin del Anlisis de
Correspondencias (AC) en su formulacin simple, para describir a continuacin de
forma paradigmtica algunos de los mecanismos bsicos de programacin del paquete
SPSS as como la interpretacin de los resultados obtenidos al manipular esta clase de
datos.
Claves: Proceso de Datos, multivariado, reduccin de datos, anlisis de
correspondencias, SPSS.

1.- Introduccin.
2.- Anlisis de Correspondencias: Las matrices multidimensionales.
3.- Un ejemplo detallado del anlisis de correspondencias.
3.1.- Un ejemplo en Psicometra.
3.2.- Un ejemplo en Psicologa Social.
4. Conclusin.
5. Referencias.

1.- Introduccin
El uso y reconocimiento de las metodologas cualitativas dentro la comunidad cientfica
abren una nueva etapa, teniendo en cuenta que las respuestas que podamos obtener
guardan una estrecha relacin con la aplicacin de los ordenadores al anlisis de datos
cualitativos (Batista y Martnez, 1989; Lebart, 1981; Richards y Richards, 1987) sobre
todo en anlisis complejos (Morineau, 1984), al facilitar el uso de procedimientos ms

intuitivos (Corroyer y Bert, 1990), adems de constituir una nueva metodologa dentro
del campo de las Ciencias del Comportamiento (Cornejo, 1988).
La estadstica aplicada, como herramienta bsica de investigacin, hace uso de tanto de
los conocimientos matemticos como de los conocimientos informticos (Foucart,
1984). Estos dos aspectos sern contemplados dentro de este tipo de anlisis de datos,
centrandonos en principio en los aspectos que convierten al AC en una tcnica
estadstica til dentro de la Psicologa a la hora de tratar la informacin de naturaleza
abierta, o cuando los objetivos son meramente exploratorios.
El AC es til en los trabajos exploratorios previos donde no existen hiptesis previas del
comportamiento de la poblacin, tanto en las vertientes correlacionales como
experimentales (Cornejo, 1988). Permite extraer relaciones de dependencia a partir de
variables categricas expresadas en tablas de contingencia. Estando de esta forma
relacionada con otros procedimientos estadsticos clsicos como son las formulaciones
del 2, o el coeficiente de concordancia de Kendall. Por otra parte, permite analizar la
estructura de esta asociacin (Snchez y Prez, 1990), en forma de proximidades que
nos ayudan a identificar las "causas" de la asociacin medida, acentuando la
representacin grfica como mtodo ptimo de obtencin de conclusiones (Lebart el al.,
1982). Es decir, como una herramienta bsica de informacin de tipo cualitativo.
Los orgenes del anlisis de correspondencias se remontan a la dcada de los 60
(Benzcri, 1982). Se desarrolla como tcnica estadstica aplicada de naturaleza
euclidiana (Foucart, 1984 y 1985) a la hora de analizar las tablas de contingencia, cuyo
objeto es obtener una representacin geomtrica de los datos que ayude a visualizar y
localizar las relaciones establecidas en grandes matrices de datos. Este nuevo enfoque
del anlisis de las tablas de contingencias, fuera del marco de la estadstica clsica
(Batista, 1984), ha derivado posteriormente a formulaciones nuevas. De este modo es
plausible utilizarlo en tablas lgicas completas o datos ordinales, y en general a
cualquier estructura (sujetos x variables) que contenga valores enteros positivos
(Cornejo, 1988; Foucart, 1985) y tambin a formas multivariantes, de forma tal que es
tomado en la actualidad como un caso particular del anlisis factorial. Concretamente,
pude ser tomado como una tcnica particular del anlisis de componentes principales,
iniciado en los trabajos de principios de siglo de Pearson y Hottelling, y desarrollado
sobre todo a partir de la dcada de los 60 gracias al uso de la informtica (Batista y
Martnez, 1989). Mientras la escuela anglosajona enfoca las aplicaciones sobre las
variables (estructuras) con el desarrollo del anlisis factorial, la escuela francesa se
desva hacia aplicaciones centradas en los individuos (anlisis de correspondencias).
2.- Anlisis de Correspondencias: Las matrices multidimensionales.
La estructura ms comn de las matrices multidimensionales, Tablas de individuos x
variables cuantitativas, pude representarse de la siguiente forma:
VARIABLES
Observa
ciones

X1 X2 X3 .. Xp
.
1 x11 x12 x13 .. x1p

.
2 x21 x22 x23
3 x31 x32 x33

x2p
..
.
..
.

.
.. .. ..
. . . .
.

x3p

..
.

..
xn1 xn2 xn3 . xnp

n
..
.
Tabla 1: Tabla de individuos por variables.
Compuestas por p variables y n individuos cada elemento o celda de la matriz suele
denotarse por medio de la expresin xij, que representa la medida obtenida por el sujeto i
en la variable j. Ejemplos de este tipo de matrices son las obtenidas cuando evaluamos
el rendimiento de una muestra sobre un conjunto de pruebas psicomtricas tradicionales
(ej: Tests de Raven, Wisc, Bohen, etc.).
Tablas de contingencia.
Matriz representativa de 2 caracteres o propiedades generales de tipo cualitativo,
expresado en forma de modalidades exhaustivas y exclusivas entre s. Por ejemplo,
veamos la siguiente tabla:

CARCTER 2
CARC
X1 X2 X3 ... Xp
TER 1 1 k
k12 k13 ... k1p
11
2 k21 k22 k23 ... k2p
3 k31 k32 k33 ... k3p

.
.
.

... ... ...

...
...

kn1 kn2 kn3

knp
...

Tabla 2: Tabla de contingencias


El elemento kij representa el nmero de individuos (frecuencia absoluta) que cumplen
tanto la condicin de la modalidad i perteneciente al primer carcter como la condicin
de la modalidad j correspondiente al segundo carcter estudiado sobre una muestra
puntual. Ejemplo de este tipo de matrices son todos aquellos estudios que relacionan
variables como son el sexo, la clase social, tipo de estudios o el estado civil.
2.1.- Notacin en la tabla de contingencia y construccin de la nube de puntos.
El anlisis de correspondencias se efectua sobre la matriz de probabilidades que
podemos determinar a partir de una matriz o tabla de contingencia, pudiendo ser
introducido como un anlisis de componentes principales o como anlisis cannico
(Foucart, 1984 y 1985). La matriz de datos de partida es una tabla de frecuencias:

3 ...

...

1 k11 k12 k13 ... K1j ... K1p k1.


2 k21 k22 k23 ... K2j ... K2p k2.
3 k31 k32 k33 ... K3j ... K3p k3.
K(nxp) = .

...

...

... ... ... ... ...

...

.
.
i ki1 ki2 ki3 ... Kij ... Kip ki.

.
...

...

...

.
n

...
...

.
kn1 kn2 kn3

...

...

...
Knj

...

Knp kn.
...

k.1 k.2 k.3 ... k.j ... k.p K


Tabla 3: Notacin en la tabla de contingencias.
Para aplicar el anlisis de correspondencias no se emplea directamente la tabla de
frecuencias sino que se transforma en una matriz de probabilidades, de acuerdo a la
siguiente expresin:

A partir de la informacin anterior nos encontramos con la posibilidad de definir, sobre


Rp, las caractersticas de cada punto fila en la nube de puntos, situacin esta que viene
dada por los siguientes elementos:
perfil =(fij /fi.) j = 1,...,p (2)
masa = fi. = ki./K (3)
coordenadas = (fij /(fi.f.j1/2)) j = 1,...,p (4)
Observando que el perfil fila no es nada ms que la frecuencia condicionada [f(j/i)], y
por otra parte, que el perfil medio es equivalente al marginal de la tabla de frecuencias.
En Rn, cada punto columna j vendr definido por los siguientes elementos:
masa = f.j = k.j/K (5)
perfil =(fij /f.j) j = 1,...,n (6)
coordenadas = (fij /(f.jfi.1/2)) j = 1,...,n (7)
La masa de una fila (fi.) o columna (f.j) debe entenderse como la importancia relativa
dentro de la tabla de datos. Sirven para atenuar la preponderancia que podra tener
alguna fila o columna en el anlisis. Por otra parte, el perfil fila o perfil columna
identifica cada modalidad en cuanto a su importancia relativa.
Por ejemplo, supongamos que la tabla de frecuencias es la siguiente:

Fila/Column 1 2 Margina
a
l

20 11

31

21 8

29

60 3
3

93

Marginal

10 5
1 2

153

Tabla 4: Frecuencias absolutas.


operando la formulacin anterior obtendramos la siguiente tabla:
Fila/Columna 1
2 Marginal
1
0,645 0,355 1,000
2
0,724 0,276 1,000
3
0,645 0,355 1,000
Masa
0,660 0,340
Tabla 5: Perfil fila.
En el mbito aparente, si nos basamos en la informacin de la tabla de resultados
brutos, la fila 1 y 2 tienen la misma semejanza. Sin embargo, atendiendo a la
informacin de la matriz de perfil fila nos encontramos que la fila 1 y 3 son exactamente
iguales (0,645 0,355).
La solucin para los datos brutos anteriores, en cuanto a la dimensin columna, sera:
Fila/Columna 1
2 Masa
1
0,198 0,211 0,203
2
0,208 0,154 0,190
3
0,594 0,635 0,607
Marginal 1,000 1,000
Tabla 6: Perfil Columna
2.2.- ELECCIN DE LAS DISTANCIAS.
En Rp, el cuadrado de la distancia entre dos puntos fila (i,i') cualesquiera viene dado por
la expresin mtrica (mtrica de Mahalanobis(1)) conocida como la distancia 2. La
justificacin del uso de este tipo de distancia, y no la euclidiana bsica, se basa en que
esta ltima plantea el problema de menospreciar los pesos de las columnas lo cual da
como resultado final, en algunas soluciones, conclusiones inaceptables.
Por ejemplo, supongamos el caso de una tabla de n filas y 2 columnas, donde las dos
primeras filas estn formadas por los siguientes elementos:

Sa
Sb
...

C+
.32
.28
...

C.03
.07
...

Tabla 7: Distancias para dos sujetos hipotticos.


donde verificando la distancia euclidiana:

obtenemos como resultados distancias equivalentes para las categoras-columna positivo


[(0.32-0.28)2 =0.0016] y negativo [(0.03-0.07)2=0.0016], lo cual en el mbito intuitivo
(cualitativamente) es contradictorio, ya que las diferencias para los dos sujetos en estas
dos categoras son evidentemente distintas (ms del doble en la categora "negativo" y
una sptima parte en la categora "positivo").
La inconsistencia anterior, producida por los efectos marginales, se puede contrarrestar
operando las distancias euclidianas en forma de cocientes:

pero el peso excesivo de las columnas con f.j cuando contiene valores elevados sigue
distorsionando los resultados. La forma de controlar esta fuente de error es ponderando
la expresin anterior, formulacin conocida como distancia 2:

verificandose adems, que ...

A este tipo de distancia se le denomina tambin "ponderada", por cumplir la propiedad


de invarianza o equivalencia distribucional. Esto implica que si se unen dos puntos filas
o dos puntos columna con idnticos perfiles, la distancia entre esos dos puntos queda
invariante. Esto es, si dos puntos son semejantes se pueden agrupar sin alterar las
distancias para el resto de los puntos en Rp y Rn, lo cual representa una ventaja al poder
garantizar la arbitrariedad de la nomenclatura (Lebart et al., 1982).
Para Rn, la distancia de dos puntos columnas cualesquiera (j,j'), vendr dado por la
formula semejante a la vista anteriormente en el caso de las filas:

La originalidad de este tipo de anlisis radica en la utilizacin de la distancia 2, que si


bien no es equivalente al 2 de contingencia (formulacin de Pearson) si estn
relacionadas entre s en la medida en que ste es igual a la nube de inercia (NI), que
podemos tambin obtener por medio de la distancia 2, multiplicada por la suma de la
matriz de contingencia (K). Ya que la nube de inercia que podemos resolver por...

resultando entonces que...

2.3. - Contraste de independencia.


Usando la notacin de la tabla, donde fij, fi. y fj. pueden ser tomados como estimaciones
de probabilidad, se puede definir ahora la hiptesis de independencia entre filas y
columnas de la tabla de contingencia por fij = fi.f.j, admitiendo que para tamaos grandes
K la correspondencia sigue una distribucin asinttica 2 con (n-1).(p-1) grados de
libertad. Obteniendo el estadstico de contrate correspondiente al operar:

Asumiendo de esta forma que el contraste de independencia habitual equivale a la


igualdad de todos los valores propios a cero, lo cual comprobamos con la obtencin del
estadstico anterior, que podemos simplificar de la forma siguiente:

2.4.- Proceso de datos: tipo de elementos.


El proceso de anlisis de datos o mtodo de estadstica descriptiva multidimensional
(Lebart et al., 1982), puede abordarse desde tres perspectivas, que no son contradictorias
entre s sino ms bien complementarias en cuanto a los resultados obtenidos:
1. Anlisis de correspondencias con la obtencin de los ejes factoriales y el
porcentaje de variacin explicada.
2. Clasificacin jerrquica ascendente sobre las soluciones factoriales obtenidas
de forma tal que es posible obtener un nmero menor de clases.
3. Caracterizacin de los grupos obtenidos por sus variables demogrficas.

Los elementos que ayudan a determinar los planos factoriales se denominan activos,
debiendo cumplir el principio de conjunto homogneo (similar al anlisis factorial). Los
elementos que forman parte del anlisis "a posteriori", una vez determinados los ejes, se
denominan elementos ilustrativos y no es necesario el cumplimiento de homogeneidad.
Esta distincin es similar a la mantenida en los modelos lineales entre variables
exgenas y endgenas, siendo equiparables desde un punto de vista geomtrico, en la
medida que las variables activas (exgenas) crean un subespacio acotado donde
proyectar las variables ilustrativas (endgenas).
De todo lo dicho anteriormente, es posible aplicar dos mtodos complementarios de
anlisis:
- mtodos factoriales, basados en el lgebra lineal, donde las proximidades entre los
puntos indican asociacin estadstica (ej: Anlisis de correspondencias).
- mtodos de clasificacin, basados en la agrupacin de clases de puntos.

*NOTA:
1. Las caractersticas de este tipo de mtrica pueden ser contempladas de forma ms
detallada en Foucart (1984, pgina 42).
3.- Un ejemplo detallado del anlisis de correspondencias.
Veamos el siguiente ejemplo proveniente del campo de la Etologa:
Deseamos verificar si la "conducta de evitacin" se relaciona directamente con el nivel
de predacin a que son sometidos los alevines de la trucha comn en situacin
experimental. Para ello asignamos aleatoriamente los animales en cuatro grupos
experimentales (4 acuarios), de acuerdo a las siguientes condiciones:
- Nivel de predacin 0, sin predador.
- Nivel de predacin 1, el investigador introduce un predador (tortuga de agua
dulce) cada 9 das en el acuario durante 2 horas.
-Nivel 2, el investigador introduce una vez cada 5 das el predador 2 horas.
-Y nivel 3, el predador se introduce cada dos das 2 horas.
Transcurridas cuatro semanas, se determina la conducta de evitacin (ocultacin de los
individuos en la vegetacin del acuario) ante la presencia del investigador en los cuatro
acuarios durante media hora. Categorizando los resultados observados en cuatro niveles:
-No, no se observa la conducta de evitacin en los animales.
-Baja, menos del 25% del tiempo de observacin los animales presentan la
conducta.
-Media, entre el 25% y el 50% del tiempo los animales manifiestan la conducta.
-Alta, ms del 50% del tiempo presentan la conducta de evitacin.
Los resultados obtenidos aparecen reflejados en la siguiente tabla de contingencia:

Tabla 8: Tabla de frecuencias.


A continuacin definimos un procedimiento en SPSS que recoja los datos anteriores:

DATA LIST FREE/fila col frecu.


Begin data.
1 1 80 1 2 4
2 1 10 2 2 59
3 1 5 3 2 4
4 1 5 4 2 3
end data.

1
2
3
4

3 3 1
3 3 2
3 40 3
3 4 4

4 1
4 2
4 2
4 20

Variable labels fila 'Conducta


evitacin'/
Col 'Nivel de Predacin'.
Value labels fila 1 'No' 2 'Baja' 3
'Media' 4 'Alta'
/ col 1 '0' 2 '1' 3 '2' 4 '3'.
Weight by frecu.

Tabla 9: Procedimiento en SPSS para definir la tabla de frecuencias.


A continuacin verificamos si existe relacin entre las dos variables, para ello nos ser
suficiente determinar las siguientes instrucciones para tablas de contingencia:
Crosstabs
/tables=fila by
col
/statistic=chisq
.

Tabla 10: Procedimiento SPSS para analizar la tabla de frecuencias.


Obteniendo la siguiente tabla de resultados:

Tabla 11: Estadstico chi-2.


Los datos de la tabla anterior nos indican que existe relacin estadsticamente
significativa entre las dos variables (p<.001), es decir, se verifica la relacin entre las
dimensiones estudiadas. Por tanto, nos encontramos en una situacin aceptable de
anlisis de correspondencias.
De acuerdo con la formula 14, estamos en condiciones de establecer la nube de inercia
(NI) del modelo, que podramos interpretar como la cantidad de la informacin recogida
en la tabla de contingencias. De este modo despejando la ecuacin general anterior la
NI ser el resultado de operar /K, por lo tanto la NI para este caso ser igual a
1,58429, resultado de operar 388,151/245.
3.1.- Mtodos de normalizacin.
El mtodo de normalizacin especfica la forma de normalizar las puntuaciones fila y
columnas, teniendo en cuenta que solo afecta a las puntuaciones y a las varianzas
obtenidas. La contribucin en las dimensiones y los perfiles se mantienen inalterables.
- Cannica: Para cada una de las dimensiones, las filas son el promedio ponderado de
las columnas dividido por el autovalor correspondiente (valor propio), y las columnas
son el promedio ponderado de las filas divido por el autovalor. Es el procedimiento ms
adecuado cuando se desea verificar sobre todo las diferencias o similitudes entre las dos
variables.
- Principal: Las distancias entre los puntos fila y columna son aproximaciones de las
distancias chi-cuadrado. Mtodo aconsejable cuando se desea verificar las diferencias o
similitudes entre las categoras de una o ambas de las variables, ms que las diferencias
entre las propias variables.
- Principal por fila: Maximiza las distancias entre los puntos fila con objeto de verificar
las diferencias o similitudes entre las categoras de la variable fila. Para ello toma la
distancia entre los puntos fila como aproximaciones de las distancias chi-cuadrado.
- Principal por columna: Maximiza las distancias entre los puntos columna con objeto
de verificar las diferencias o similitudes entre las categoras de la variable columna.
Asume la distancia entre los puntos columna como aproximaciones de las distancias
chi-cuadrado.
- "Equilibrado": Distribuye la inercia tanto sobre las puntuaciones fila como sobre las
puntuaciones columna. Es el mtodo ms til para analizar las dimensiones
representadas de forma conjunta.
Para el ejemplo estudiado, el mtodo que mejor se ajusta es el cannico. De acuerdo con

esto, el siguiente paso ser definir las instrucciones en SPSS para el anlisis de
correspondencias:
Anacor
table=fila(1 4) by col(1 4)
/dimension=2
/normalization canonical
/print scores contributions
profiles
/plot joint ndim(all,max).

Tabla 12: Procedimiento Anacor en SPSS.


Despus de lo cual ejecutaremos el procedimiento anterior, mediante el cual se obtienen
los siguientes resultados:
The Rowprofiles:
1
4

2
0

3
1

2
3 Margin
1 No
,909
,045
,034
011 1,000
2 Baja
,135
,797
,041
027 1,000
3 Media
,098
,078
,784
039 1,000
4 Alta
,156
,094
,125
625 1,000
-------- -------- --------------Margin
,408
,286
,204
102
The Columnprofiles:
1
2
3
4
0
1
2
3 Margin
1 No
,800
,057
,060
040 ,359
2 Baja
,100
,843
,060
080 ,302
3 Media
,050
,057
,800
080 ,208
4 Alta
,050
,043
,080
800 ,131
-------- -------- --------------Margin
1,000
1,000
1,000
1,000

Tabla 13:

,
,
,
,

,
,
,
,

En la tabla anterior se puede verificar como los patrones de los perfiles filas son
completamente distintos entre s y como ocurre lo mismo con los patrones de los
perfiles columna. Lo cual es un indicador claro que las modalidades estudiadas tanto en
el sentido de las filas y como de las columnas estn bastante bien diferenciadas. Ntese
como las celdas de la diagonal principal mantienen la carga mayor en las dos
dimensiones analizadas, lo cual como veremos ms adelante, es un indicador fuerte que
las respectivas modalidades ij estn fuertemente relacionadas entre s.
Dimension Singular Inertia
Proportion
Cumulative
Value
Explained
Proportion
1
,76994
,59280
,374
,374
2
,74714
,55822
,352
,727
3
,65823
,43327
,273
1,000
--------- ------------------Total
1,58429
1,000
1,000

Tabla 14:
En la solucin anterior aparece expresado cada una de las dimensiones de las soluciones
alcanzadas (no triviales), con la cantidad de la nube de inercia total explicada. De esta
forma si ponemos en relacin la inercia de cada dimensin con la inercia total
obtendremos la proporcin explicada de la informacin original (en forma bruta y
acumulada).
De este modo, podemos decir que la informacin de la tabla de contingencia se
explicara por la primera dimensin el 37,4%, mientras en la segunda la explicacin
sera del 35,2%, y en la tercera del 27,3%. Como con las dos dimensiones primeras
tendramos explicada el 72,7% de la informacin inicial, se hace plausible reducir la
dimensionalidad a dos nicos componentes.
Tambin es posible aplicar el estadstico conocido como la descomposicin aditiva de
. El mtodo consiste en obtener cada para cada una de las dimensiones, mediante la
aplicacin de la formula 16 y donde los grados de libertad se obtienen mediante la
expresin general: (n+p-2.i-1)
donde ...
n : nmero de filas
p: nmero de columnas
i : nmero de la dimensin
De esta forma, aplicado a la tabla anterior los para las distintas dimensiones son:
245 . 0,59280 = 145,236 (gl:4+4-2-.1-1=5).
245 . 0,55822 = 136,764 (gl:4+4-2.2-1=3).
245 . 0,43327 = 106,151 (gl:4+4-2.3-1=1).
que son inicialmente todos significativos, es decir, aplicando esta solucin nos
quedariamos con los tres componentes.

El autovalor (singular value) expresado en la tabla anterior(Tabla 14), se obtiene


mediante la resolucin de:

donde ...
i (valor propio) referencia la cantidad de inercia explicada por la dimensin.
As, podemos comprobar como el autovalor de la primera dimensin (0,76994)
es el resultado de operar:

Por otra parte, los autovalores (singular value), se pueden interpretar como la relacin
existente entre las puntuaciones fila y columna. De esta forma, el valor 0,76994
(dimensin 1), es la correlacin entre las puntuaciones fila y columna para la primera
dimensin, 0,74714 la correlacin de las puntuaciones anteriores para la segunda
dimensin, y 0,65823 la correlacin en la tercera dimensin.
Vamos a ver esto de una forma ms detallada. Las puntuaciones fila y columna de
nuestro ejemplo en las dos dimensiones alcanzadas son las siguientes:
Row Scores:
FILA
1
2
3
4

No
Baja
Media
Alta

Marginal
Profile
,359
,302
,208
,131

Column Scores:
COL
Marginal
Profile
1 0
,408
2 1
,286
3 2
,204
4 3
,102

Dim
1
1,007
-,014
-1,288
-,682

2
-,579
1,302
-,703
-,299

Dim
1
,916
-,075
-1,332
-,792

2
-,513
1,354
-,726
-,287

Tabla 15: Puntuaciones fila y columna.


Si sustituimos las puntuaciones originales por los valores de las dimensiones de la
solucin anterior, y aplicamos la formula de la correlacin de pearson obtendremos el
resultado del autovalor.

Vamos a verificarlo con el segundo autovalor (0,747). Para ello basta con efectuar el
siguiente procedimiento de recodificacin en SPSS:
recode fila (1=-0,579) (2=1,302) (3=-0,703)
(4=-0,299) into rfila/
col (1=-0,513) (2=1,354) (3=-0,726) (4=0,287) into rcol.
correlation rfila rcol.
Tabla 16: Recodificacin en SPSS.
Una vez ejecutado obtendremos la siguiente matriz de resultados:

Tabla 17: Matriz de correlaciones.


que como podemos comprobar coincide con el autovalor de la segunda dimensin
descrito anteriormente.
Como hemos visto anteriormente, dado que las modalidades o categoras, tienen pesos
distintos, lo cual implica que pueden tener mayor o menor influencia entre las relaciones
de las variables cualitativas estudiadas. Para medir la influencia que tiene cada una de
las modalidades en la relacin final, se utiliza el ndice conocido como contribucin.
Se distingue en primer lugar la contribucin relativa de un factor a la inercia de los
elementos, que no es nada mas que la cantidad relativa de inercia de un elemento (en
forma de proporcin) que es captada por cada una de las dimensiones alcanzadas. De
esta forma en nuestro ejemplo la tabla de resultados es la siguiente:

Contribution of dimensions to the inertia of each row point:


FILA
Marginal
Dim
Total
Profile
1
2
1 No
,359
,751
,241
,992
2 Baja
,302
,000
,986
,986
3 Media
,208
,616
,178
,793
4 Alta
,131
,120
,022
,142
Contribution of dimensions to the inertia of each column point:
COL
Marginal
Dim
Total

1
2
3
4

0
1
2
3

Profile
,408
,286
,204
,102

1
,764
,003
,636
,122

2
,232
,985
,184
,016

,996
,988
,820
,138

Tabla 18: Contribucin de los factores.


Observando la tabla anterior, podemos verificar por ejemplo, que los elemento fila 1 y 3
se explican mejor por la primera dimension, mientras el elemento 2 tiene mayor
explicacin en la segunda dimensin. Finalmente el elemento 4 no se encuentra bien
representado en la solucin alcanzada. Para los elementos columna, la estructura es
semejante a lo visto en los puntos fila.
El segundo ndice, se conoce como la contribucin relativa de la puntuacin a la
dimensin. Dicho de otra forma, la parte de la varianza explicada (en forma de
proporcin) de cada elemento fila o columna a cada una de las dimensiones.
Contribution of row points to the inertia of each dimension:
FILA
Marginal
Dim
Profile
1
2
1 No
,359
,473
,161
2 Baja
,302
,000
,686
3 Media
,208
,448
,138
4 Alta
,131
,079
,016
-------- -------1,000
1,000
Contribution of column points to the inertia of each dimension:
COL
Marginal
Dim
Profile
1
2
1 0
,408
,445
,144
2 1
,286
,002
,701
3 2
,204
,470
,144
4 3
,102
,083
,011
-------- -------1,000
1,000

Tabla 19: Contribucin de las puntuaciones.


Por ejemplo, observando los datos de la tabla anterior, se puede determinar que la
primera y tercera modalidad fila y columna contribuyen bsicamente a la formacin de
la primera dimensin, mientras la segunda dimensin est determinada por la segunda
modalidad tanto en las filas como en las columnas.
Por ltimo, la representacin grfica dentro del anlisis de correspondencias, ayuda a
determinar intuitivamente entre que modalidades se produce la relacin. Teniendo en
cuenta que en los ejes cartesianos se representan los valores numricos de las
puntuaciones filas y columna sobre cada una de las nuevas dimensiones estimadas como
significativas (ver tabla 15).

De acuerdo a esto, si tomasemos los datos de la tabla 15 y la representsemos


grficamente el resultado sera:

Grfica 1: Representacin bidimensional del anlisis de correspondencias.


Inicialmente se puede determinar una clara asociacin entre los niveles de predacin y
el tipo de conducta de evitacin de los animales. Las diversas modalidades de las
variables aparecen estrechamente emparejadas entre s. Pudiendo verificarse de este
modo como la conducta de evitacin "media" se asocia al "nivel 2" de predacin,
mientras la conducta "alta" de evitacin se relaciona con el "nivel 3", y de la misma
forma la conducta "baja" se asocia con el "nivel 1", y la ausencia de la conducta con el
"nivel 0".
Este tipo de situaciones de fuerte relacin, produce frecuentemente soluciones a escala
grfica donde las categoras se distribuyen en torno a una parbola.
Si se obtienen soluciones espaciales complicadas, como son tres dimensiones o ms, el
paquete SPSS resuelve perfectamente el problema. Como ejemplo puede servir la
siguiente grfica tridimensional de los datos estudiados:

3.1.- Un ejemplo en Psicometra.


La tabla siguiente representa a seis sujetos y el porcentaje de aciertos en un test donde
los items han sido diferenciados en su grado de dificultad (facil, medio y alto):

ITEM
SUJETO IDF IDM IDA
S1

100 100 100

S2

100 100

90

S3

100

90

50

S4

90

70

40

S5

80

40

10

S6

70

30

Aplicando el programa CORRESPONDENCE (SPSS 8.0) obtenemos la siguiente tabla


resumen:

que puede asumirse como una solucin con dos dimensiones de importancia desigual. Si
bien es posible quedarnos el primeros de los ejes (explican el 97,2% de la inercia), es
necesario el segundo para diferenciar claramente todos los tipos de tems estudiados.
De esta forma, la representacin grfica de la solucin alcanzada ser:

... pudiendo observarse como la primera dimensin diferencia entre los items faciles
(asociados a los sujetos 5 y 6) de los difciles (asociados a los sujetos 1 y 2). Mientras la

segunda dimensin discrimina entre los items de dificultad media (asociados a los
sujetos 3 y 4) frente al otro tipo de items.
3.2.- Un ejemplo en Psicologa Social.
Los datos siguientes representan la reparticin de los diputados franceses (Legislativas
1981) de acuerdo al partido poltico y su profesin:

... donde
Ind:
Com:
Agr:
Med:
Abo:
Opl:
Psu:
Pme:
Cas:
Ing:
Per:
Pba:
Tec:
Cad:
Emp:
Obr:
Otr:
Spr:

Industriales y directores de sociedades.


Comerciantes y artesanos.
Agricultores.
Medicos
Abogados
Otras profesiones liberales
Profesores superiores.
Profesores medias.
Administrativos superiores.
Ingenieros.
Periodistas.
Maestros.
Tcnicos.
Administrativos.
Empleados.
Obreros.
Otras profesiones.
Sin profesin.

Aplicando el programa CORRESPONDENCE (SPSS 8.0) obtenemos la siguiente tabla


resumen:

que puede asumirse como una solucin con tres dimensiones de importancia desigual.
Si bien es posible quedarnos con los dos primeros ejes (explican el 90,8% de la inercia),
es necesario el tercero para diferenciar claramente todos los partidos polticos
estudiados.
Si representasemos la solucin anterior en forma de grfica tridimensional,
obtendriamos como resultado:

Como se puede ver, la primera dimensin diferencia el partido comunista (PC) del resto
de los partidos. La segunda dimensin discrimina entre el partido socialista (PS) y los
partidos de la derecha. Por ltimo, la tercera dimensin diferencia a los partidos UDF y
RPR del resto de los partidos de la derecha.
4. Conclusin.
El anlisis de correspondencias, bsicamente es un doble anlisis de componentes
principales, uno realizado sobre las filas y el segundo sobre las columnas de la matriz de
partida. Es una herramienta orientada como ayuda en la generacin de teoras,
facilitando la eleccin previa de las caractersticas o modalidades ms significativas,
frente a otros criterios de tipo terico. Basandose la tcnica ms en las caractersticas de
anlisis generales e intuitivos frente a otro tipo de anlisis ms detallados.
Si bien los anlisis deben ser guiados por un marco terico previo (explcito), de hecho
las metodologas cualitativas, debido a su flexibilidad, pueden hacer que los elementos
subjetivos produzcan resultados sesgados. Precisamente el uso de ordenadores reduce
este problema en la medida que los distintos aspectos son obtenidos mediante una
operativizacin previa de los criterios utilizados, evitando un sobrevaloracin humana
de algunos elementos por parte del investigador y no apoyada en los datos.
El paquete SPSS se muestra as til en la fase de reduccin de datos, aun cuando
presenta problemas que debern ser solucionados en fases de desarrollo posterior del
software o bien utilizando tcnicas complementarias de programacin "ad hoc", como

ocurre en la obtencin de las dimensiones significativas a la hora de contrastar hiptesis.


5. Referencias.
Batista,J.M. (1984). Componentes principales y anlisis factorial. En J.J. Snchez
Carrin(ed.). Introduccin a las Tcnicas de Anlisis Multivariable Aplicado a las
Ciencias Sociales. Madrid: C.I.S.
Batista,J.M. y Martnez,M.R. (1989). Anlisis Multivariado. Anlisis en
Componentes Principales. Barcelona: Hispano Europea.
Benzcri,J.P. (1982). Histoire et Prhistoire de l'Analyse des Donnes. Paris: Dunod.
Cornejo, J.M. (1988). Tcnicas de Investigacin Social: El Anlisis de
Correspondencias. Barcelona: PPU.
Corroyer,D. y Bert,M.-C. (1990). De l're des tables a l're informatique: Faire de
l'infrence sans 2 sans T et sans F ?. L'Anne Psychologique, 90, 381-401.
Foucart,T. (1984). Analyse Factorielle de Tableaux Multiples. Paris: Masson.
Foucart,T. (1985). Analyse Factorielle. Programmation Sur Micro-ordinateurs.
Paris: Masson (2me dition).
Lebart,L. (1981). Une procdure d'analyse lexicalle ecrite en langage FORTRAN. Les
Cahiers de l'Analyse des Donnes, 6(2), 229-243.
Lebart,L.;Morineau;A. y Fnelon,J.-P. (1982). Traitement des Donnes Statistiques.
Pars: Dunod. (Trad. castellana en Marcombo, 1985
Morineau,A. (1984). Computational and statistical methods for exploratory analysis of
textual data. COMPSTAT, Verlag, Vienna.
Richards,L. y Richards,T. (1987). Qualitative data analysis: can computers do it?.
Australian and New Zeland Journal of Sociology, 23(1), 23-35.
Snchez,E.F. y Prez,C. (1990). Diagnstico sistmico de una familia: El Cuestionario
de Interrelacin Familiar (CIF) y la tcnica de rejilla. Psicolgica, 11, 59-82.

You might also like