You are on page 1of 150

Generalizacin del A.F.C.

Presentacin
Anlisis Factorial
de Correspondencias
Mltiples

Primera Parte
La encuesta
y el tratamiento
de los datos de encuesta

Encuesta :
proceso estandarizado de observacin de p atributos
(cualitativos o cuantitativos) sobre n unidades de observacin.

Ejemplos de encuestas...

Estudio de las condiciones de trabajo en la


produccin minera.

Estudio de las intenciones de voto del


cuerpo electoral.

Evaluacin del funcionamiento del sistema


judicial.

Unidades temticas de la encuesta :


Una encuesta se organiza en torno a algunas unidades
temticas que resultan de los objetivos del estudio y
del marco conceptual.

* Ejemplo de unidades temticas del estudio de las


condiciones de trabajo en la produccin minera...

Informacin socio-descriptiva de los trabajadores.


Descripcin de un puesto de trabajo.
Descripcin de un equipo.
Descripcin de la organizacin del trabajo
en la empresa.

Indicadores observables :
Las unidades temticas de una encuesta estn
compuestas de indicadores - observables de manera
estndar -

sobre las n unidades de observacin.

Ejecutando la encuesta, los indicadores observables


permiten crear las variables observadas.

Qu significa la observacin estndar de un


indicador sobre n unidades de observacin?

Estrategia de tratamiento de la informacin :


Una encuesta debe definir las modalidades de construccin de los diferentes conceptos que resultan:
- de tipologas deducidas de una unidad temtica,
o bien,
- de la relacin observada entre dos o ms unidades
temticas.
Variabledel
deducida
En funcin del marco terico
estudio, la encuesta
Informacin

utilizacin
Tipologa
debe
preveren
laselestrategias
dede
las
obsersocio-descriptiva
* Ejemplo,
estudio de de
lastratamiento
condiciones
trabajo
de esa
de los
delalos
en
produccin
vaciones
que sern minera...
recogidas.
variable?
mineros
trabajadores

Definicin de las unidades de observacin :


Una encuesta debe definir claramente la poblacin de
referencia P(de tamao N) y la manera de seleccionar
las n unidades de observacin.

Eventualmente N = n
La seleccin de las n unidades de observacin
puede ser aleatoria o razonada...

Etapas de preparacin de una encuesta


Objetivos del estudio claramente definidos...
Marco terico de referencia...
Definicin de las unidades temticas del estudio
con los indicadores observables correspondientes...

Definicin de la poblacin de referencia y del modo


de seleccin de las n unidades de observacin...

Definicin de la estrategia de tratamiento de la


informacin...

y slo entonces...

Protocolo normalizado de encuesta :


cuestionario ...

Tabla de resumen y conservacin de los datos


Formato del archivo informtico
Indice
obs1

Indice
obsj

Indice
obsZ

xij

Tabla de datos brutos


Es la Tabla resumen, corregida (errores de observacin) y ordenada en unidades temticas.
Tema 1
Tema J
Var. Var. Var. Var. Var. Var.
obs1
obsj obsZ obs1
obsj obsZ

Tema K

xij

xij

Construccin progresiva del objeto de estudio...


Var. sociodescriptivas
Var. Var. Var.
obs1
obsj
obsZ

Var. opinin
Op.
obs1

Op.
obsz

xij

xij

Tipologia
sociodesc.

Tipologa opinin

Tipologa de la opinin
J
de los n individuos
en J clases

njk

Tipologa
de

los
n individuos
en K clases

Por ello
el A.F.C.M. es el instrumento apropiado para
el tratamiento estadstico de los datos producidos por va de encuestas.
El mtodo de A.F.C.M. permite :

Explorar las relaciones existentes en un conjunto


de atributos observados;

Reducir las dimensiones del fenmeno observado,


sin arbitrariedad;

Tratar la informacin de la encuesta con el nivel de

sntesis adecuado con el marco conceptual utilizado.

Primer error :
slo se exploran las relaciones bivariadas...
Var. sociodescriptivas
Var.
obs1

Var. Var.
obsj
obsz

Var. opinin
Op.
obs1

Op.
obsz

Variable
observj

Se crean
A.F.C.M.
evitar
tresautomticamente
errores ms
1 El
permite

los

comunes
que

tratando
se cometen
p xopinin
q Tablas de

Variable
j
los
datos
de
una
encuesta...
i
xij

xij

Contingencia!!!
1

njk

Segundo error :
se seleccionan las Tablas de Contingencia
interesantes entre las p x q tablas creadas...
Criterio de seleccin : test de independencia del Chi2
Pero

El test de independencia del Chi2 no prueba la fuerza


de la asociacin entre las variables
No es pertinente emplear de esa forma
ese test estadstico.

Veremos que el A.F.C.M. realiza el estudio


de las p x q Tablas de Contingencia que se
pueden crear en un estudio de ese tipo
pero esas tablas son consideradas
simultneamente
y no sucesivamente! ! !

Tercer error :
se construyen arbitrariamente las tipologas
que resumen una unidad temtica...
Tema: opinin poltica
Esc.
obs1

Esc.
obsj

Esc.
obsp

Variable resumen :

vir p1x i1 pp x ip

eventualmente : pj = 1

Clase A : 0 F( v ) 25%

xij

Clase B : 25% F( v ) 50%

Tipologa de la opinin :

Clase C : 50% F( v ) 75%


Clase D : 75% F( v ) 100%

Veremos tambin que el A.F.C.M.


permite crear, sin arbitrariedad,
las tipologas buscadas en un anlisis...

Las Tablas estadsticas creadas


a partir de una encuesta

Esquema de un cuestionario...
El investigador dispone:
- de un protocolo normalizado de encuesta ;
- de una lista estandardizada de caractersticas
observables, con atributos mutuamente exclusivos.
Durante el trabajo de campo
el observador atribuye, sin ninguna ambigedad,
al
i-simo individuo, la k-sima modalidad de la j-sima
caracterstica que figura en el cuestionario.

A partir de un cuestionario se crea la Tabla de Datos...


La Tabla de Datos es llamada

Tabla de Cdigos Condensados

Cada lnea de la TCC (n x p) contiene todos los cdigos


correspondientes a las modalidades atribudas a un
individuo, para cada una de las caractersticas
observadas.

Tabla de Cdigos Condensados : TCC (n x p)

Suma imposible

Suma imposible

La Tabla de Cdigos Condensados


no posee propiedades numricas.

Para producir una representacin grfica de la informacin


contenida en una TCC(n x p) debemos transformar esa tabla.

Cmo se producen las Tablas Lgicas?

En la Tabla TL(n x 3) asociada a la primera columna


de la Tabla TCC (n x p) :
xi1 = 1, si y slo si ki1 = 1 ; si ki1 1

xi1 = 0

xi2 = 1, si y slo si ki2 = 2 ; si ki2 2

xi2 = 0

xi3 = 1, si y slo si ki3 = 3 ; si ki3 3

xi3 = 0

Atencin : esa recodificacin es posible... slo si las


modalidades de la variable cualitativa son
mutuamente exclusivas...

Generalizando esa recodificacin a todas las columnas


de una Tabla TCC (n x p) obtenemos la

Tabla Lgica TL (n x K)
llamada tambin ;

Tabla Disyuntiva Completa


correspondiente a la TCC (n x p)
Siendo :

K : la suma de las modalidades de las p caractersticas


observadas.

La Tabla TDC (n x K) resume lo observado en los


mismos trminos que la Tabla TCC (n x p).

La Tabla TDC (n x K) tiene propiedades numricas :


- Margen en columna : p
- Margen en lnea : distribucin de frecuencias
de las p caractersticas observadas.

Veremos que la Tabla TDC (n x K) puede ser considerada


como una Tabla de Contingencia de tipo particular.

Pre-multiplicando la Tabla TL(n x K) por su transpuesta,


la Tabla TL(K x n) obtenemos la

Tabla de Burt TB (K x K)
correspondiente a la TCC (n x p)

La Tabla TB (K x K) es una tabla simtrica.


En la k-sima lnea (columna) de la Tabla TB (K x K) :
- el trmino diagonal es : nk.
- la k-sima lnea (columna) muestra la distribucin de
esos nk. individuos en las p variables que componen
la tabla.
- el k-simo valor en margen es : p x nk.

Veremos que la Tabla TB (K x K) puede ser considerada


como una Tabla de Contingencia de tipo particular.

Segunda Parte

Fundamentos racionales
del Anlisis Factorial
de Correspondencias Mltiples

Primer tema
Objetivos del mtodo
de Anlisis Factorial de
Correspondencias Mltiples
(A.F.C.M.)

Cuarto
Primer
Tercer objetivo
objetivo

Segundo
Construir
Estudiar
Resumir
tipologas
la relacin
el conjunto
de las
existente
unidades
de caractersticas
entre
de todas
observacin,
las
observadas
endeun
pequeo
nmero observadas.
de variables
modalidades
las
caractersticas
las
caractersticas
observadas.
mediante la comparacin de todas las unidades de
cuantitativas, relacionadas con el conjunto
observacin
a travscualitativas
de todas las
modalidades de
de variables
estudiado.
las caractersticas observadas.

Segundo tema
Anlisis Factorial de
Correspondencias
de una
Tabla Disyuntiva Completa

El espacio de representacin
de los individuos
verificacin de la pertinencia
de la distancia del Chi2
en el espacio de los puntos-lnea

Consideramos que la Tabla TDC (n x K) es

una
Aplicando el A.F.C. a la Tabla TDC (n x K) podemos
Tabla de Contingencia de tipo particular.
representar :
- la j-sima coordenada del i-simo individuo
en :
x
K

x ij

nj
1
fij
; fi. ; f. j
;
np
n
np

ij

np

1 nj
n np

x ij
p

nj
np

- la j-sima coordenada del i-simo individuo


en :
x
K

x i' j

nj
1
fi' j
; fi'. ; f. j
;
np
n
np

i' j

np

1 nj
n np

x i' j
p

nj
np

Distancia del Chi

entre dos lneas


de la Tabla TDC (n x K)
2

Coordenadas del i-simo perfil-ponderado-lnea:

x ij

Trmino general :

nj

, j 1, , K

np

Coordenadas del i-simo perfil-ponderado-lnea:

x i' j

Trmino general :

nj
np

, j 1, , K

x i' j
d2 i,i'

n
n
j
j
j 1

p
p
np
np

x ij

Desarrollando ese cuadrado de una diferencia...


K

np x ij x i' j
2
d i,i'

nj p
p
j 1

d2 i,i'

j 1

j 1

n x x
i' j
n j ij

n x x
i' j
n j ij

d2 i,i' 1
p

j 1

n x x
i' j
n j ij

Vemos en esa expresin que...

De modo que .

Para cada trmino de la sumatoria...

La distancia del
i e i
2 Chi2 entre dos individuos
x ij x i' j 1 o bien x ij x i' j 2 0
slo si losen
individuos
i e i no presentan
aumenta
, en
que aumenta
2 la medida
x x 1
ij

i' j

simultneamente la j-sima modalidad.

el nmero de modalidades
diferentes
cuando los individuos
i e i presentan o

x
0 no presentan conjuntamente
ij
i' j
la j-sima
que presentan
esosmodalidad.
individuos.

d2 i,i' 1
p

j 1

n x x
i' j
n j ij

De modo que
Vemos tambin en esa expresin
que...
2

La distancia del Chi entre dos individuos i e i

Cada modalidad interviene en el clculo de la

aumenta
las divergencias
presentadas
distancia tambin
entre dos si
individuos
con el factor
:
en las modalidades lo son a propsito de
n : inverso del peso de mod j 1, , K
j
nmodalidades
muy poco frecuentes
j
(de bajo peso).

Aplicada a las lneas


de la Tabla Lgica
la distancia del Chi2 entre los
individuos respeta el criterio adoptado
para la comparacin de las unidades
de observacin de una encuesta.

El espacio de representacin
de las modalidades
verificacin de la pertinencia
de la distancia del Chi2
en el espacio de los puntos-columna

Distancia del Chi

entre dos columnas


de la Tabla TDC (n x K)
2

Coordenada del j-simo perfil-ponderado-columna:

x ij

Trmino general :

np
nj

p
np np

i 1, , n

Coordenada del j-simo perfil-ponderado-columna:

x ij'

Trmino general :

np
n j'

p
np np

i 1, , n

x ij

x ij'

np

np

d2 j, j'

nj

p
i 1
np np

n j'

p
np np

De modo que...
n

d2 j, j'

x ij

i 1

nj 1

x ij'

x ij x ij'

n j n j'

i 1

n j' 1
n

d2 j, j'

x ij x ij'

n j n j'

i 1

Desarrollando ese cuadrado de una diferencia...

x ij2 x ij2'
x ij x ij'

d2 j, j'
n 2 2 2
n j n j'
n j n j'
i 1

Llamando :

n jj' : frecuencia de ind. que presentaron simultneamente


la modalidad j y la modalidad j.

nj

: frecuencia de ind. que presentaron la modalidad j.

n j'

: frecuencia de ind. que presentaron la modalidad j.

x ij2 x ij2'
x ij x ij'

d2 j, j'
n 2 2 2
n j n j'
n j n j'
i 1

De modo que, para los n individuos observados...

1 1 n1j n jj2' n j' n jj'


2
d j,aj' : 0 n
para
n ))para
todos
no

para
los
individuos
los
que
n
Es igual
los
(n
n
individuos
individuos
que
que

jj ind.
jj
jjjj
n
n
n
n
2
2
2
j j'
n j' j nj' jn j'
n n
j
'
j

presentaron la modalidad
j nilalamodalidad
modalidadj.
j.
presentaron
j.
El cuadrado de la distancia entre dos modalidades
que presentaron
simultneamente
la modalidad
j
Individuos
para
los
cuales
x
=
1
y
x
=
0.
0
1.
ijij
ij
ij
es igual
a la proporcin
de individuos
que
presentaron
y la modalidad
j.
la modalidad
j, pero
modalidad
la proporcin
Individuos
para no
losla
cuales
xij = 1 j,
y xms
=
1.
ij
de individuos que presentaron la modalidad j, pero no
la modalidad j.

Aplicada a las columnas


de la Tabla Lgica
la distancia del Chi2 entre las modalidades
respeta el criterio adoptado para la comparacin de los atributos observados
en la encuesta.

Matrices de inercia
asociadas a las nubes de puntos
perfiles en lnea y en columna

matriz de perfiles-lnea de la Tabla Lgica


L : laNotacin
:
de dimensin (n x K)

Dp

1
2



x i1
L p



x ij

p

x iK

p

: la matriz diagonal de dimensin (K x K)


0

nj
2

np

DI

: la matriz diagonal de pesos, de dimensin n x n


0

1
1

I
n

La matriz de inercia A, simtrica,


de dimensin K x K , es definida por :
1

A Dp L ' DI

Trmino general : a jj'

L Dp

x ij x ij'

j 1

1 n j n j'
n n n

La matriz A es la matriz de inercia de la nube de


puntos-perfiles-ponderados-individuos, cuando las
coordenadas iniciales del i-simo perfil-individuo
son las siguientes :

x ij

x iK
; ;
; ;

n1
nj
nK
p

p
p
np
np
np

x i1

Centrando la nube de puntos-perfiles-ponderados-lnea


en su Centro de Gravedad, las coordenadas del i-simo
punto-perfil-lnea son :

x ij
nj
n1
x iK
nK

; ;

; ;

np
np
np
n1
nj
nK
p

p
p
np
np
np

x i1

Puesto que...
Coordenadas de GL :

nj
n1
nK

; ;
; ;
np
np
np

La determinacin de las direcciones principales


de alargamiento de la nube de puntos lnea
se hace, como ya lo vimos, mediante la
diagonalizacin de la matriz de inercia A
asociada a la nube de puntos-lnea.

La diagonalizacin de la matriz de inercia A


produce las matrices y w, tales que :

A w w

Si la nube de puntos-lnea no est centrada, la


matriz de inercia asociada a esa nube es:
1

A L ' DI L
en general, la matriz A no es simtrica pero
Se verifica que :

tr A

1 1 y

tr A 1
p 0

En el A.F.C.M. de la Tabla Lgica, es equivalente


diagonalizar

la matriz de inercia correspondiente


a la tabla de perfiles-individuos ;
o bien,

la matriz de inercia correspondiente


a la tabla de perfiles-individuos centrados.

De la misma manera, podemos calcular


la matriz de inercia correspondiente a
la nube de puntos-perfiles-modalidades
de la Tabla Lgica en n.

Diagonalizando la matriz de inercia

B (n x n)...

B .u .u

Se puede demostrar que...

Como en el A.F.C.Simples, en el A.F.C.M. se


verifican las siguientes propiedades de dualidad :
valores propios que resultan de la diagonalizacin

Los
Los vectores propios w asociados a los valores
de A son iguales a los valores propios resultantes de
propios que resultan de la diagonalizacin de
la diagonalizacin de B.

A son colineales con


los vectores propios u

= 1,r

asociados a los valores propios resultantes de


u

la diagonalizacin de

B:

1 w
1
n

En consecuencia, es evidente que


en el procedimiento de clculo del A.F.C.M. se
diagonaliza la matriz de inercia correspondiente
a la nube de puntos-perfiles-individuos pues es una
matriz de dimensiones (K x K) ;
se deducen, luego, los vectores propios correspondientes la nube de puntos-perfiles-modalidades.

Construccin de los ejes factoriales


para la
nube de puntos-individuos
y la
nube de puntos-modalidades

Los ejes factoriales se construyen con el producto


Los ejes factoriales se construyen calculando
escalar : de los vectores cuyos extremos son los
las coordenadas de los puntos-perfiles a lo largo
de
las direcciones principales
puntos-modalidades
(centrados de
en alargamiento
GM) y de los
comunes a ambas nubes de puntos.

vectores cuyos extremos son los puntos-individuos


(centrados en GL) ; con los vectores de las bases

Las coordenadas factoriales se determinan


mediante
la proyeccin
de los puntos
ortonomales
construidasortogonal
por diagonalizacin
de las
(perfiles-modalidades e individuos) sobre cada
matrices de
inercia correspondientes
ambos
direccin
principal
de alargamiento a
de
las nubes
de puntos.

espacios.

Coordenadas factoriales
Coordenadas de los puntos-individuos sobre el eje :

n
j

F i

w j

np
n
j
j 1

p
np

x ij

Coordenadas de los puntos-modalidades sobre el eje :

G j

x ij

i 1

nj

u i
n
1

Se construyen as las

Tablas de Coordenadas
Factoriales de los individuos
y las

Tablas de Coordenadas
Factoriales
de los puntos-perfilesmodalidades

F1 F

Fr

F(i)

GI

G1

Gr

Gj

G(j)

GM

Propiedades de los ejes factoriales


Los factores son p variables centradas, continuas.
n

1, , r F
1, , r G

1 F i 0
n

i 1
K n

np G
j 1

j 0

Varianza de las variables factoriales :

s 2
s 2

i 1
K

1 F i F

n
nj

np
j 1

n1 F
2

G2 j

i 1

Significado de los valores propios de ambas


matrices de inercia
El valor propio asociado al eje factorial
representa, para la nube de puntos-modalidades, la parte
asumida por el eje de la asociacin observada entre las
modalidades de las variables de la Tabla Lgica.

El valor propio asociado al eje factorial


representa, para la nube de puntos-individuos, la parte
asumida por el eje del resultado de las comparaciones
de todos los individuos considerando todas las variables
de la Tabla Lgica.

Como en el A.F.C.S, en el A.F.C.M. los valores


propios son inferiores o iguales a 1.

Vemos que la representacin factorial de los elementos


en lnea y en columna de una Tabla Lgica permite
satisfacer los tres primeros objetivos del A.F.C.M.

Tercer
objetivo
Segundo
objetivo
Primer
objetivo

Resumir
de caractersticas
Estudiar el
la conjunto
relacin existente
entre todas las

Construir tipologas de las unidades de observacin,


observadas
en
nmero
de
variables
modalidades
deun
laspequeo
caractersticas
mediante
la comparacin
de todas
lasobservadas.
unidades
de
cuantitativas,
relacionadas
el conjunto de
observacin
a travs
de todascon
las modalidades
variables
estudiado.
En
el
espaciocualitativas
deobservadas.
los puntos-modalidades,
lasde
caractersticas

los ejes factoriales resumen esas relaciones


En
espacio
de losson
puntos-individuos,
ejes
Loselejes
factoriales
combinaciones los
lineales
para todas las modalidades observadas.
de todas
las modalidades
observadas.para
factoriales
resumen
esas comparaciones
Los ejes
factoriales
son variables
cuantitativas
todos
los individuos
observados.
que resumen la informacin relativa al
conjunto de variables cualitativas observadas.

Contribucin a la inercia
de una modalidad
e
Inercia total de la
nube de puntos-modalidades

Contribucin de la j-sima modalidad a la inercia


de la nube de puntos-modalidades

Contrib. j I

GM

pj

Siendo : d2 j ; GM

d2

j ;GM np d2 j ;GM

nx ij2

i 1

nj

2
n
j

x ij
1
2
n
nj

En esa expresin :
xij = 1 : para los nj ind. que presentaron la modalidad j.
xij = 0 : para los (n - nj) ind. que no presentaron la modalidad j.

Entonces, la distancia al Centro de Gravedad de una


modalidad es igual a :

d 2 j ; GM

n 1 2 1
nj 2 n nj
nj n nj n

n 1
nj
De modo que :

Contrib. j I

GM

nj
np

d 2 j ; GM

nj

1
1
p
n

nj n

np n j

Contrib. j I

GM

nj

1
1
p
n

Cuanto
ms rara es una modalidad mayor es su
Este trmino es muy pequeo si n es muy grande
j

contribucin a la inercia total de la nube de puntosmodalidades.


Este trmino es prximo de 1 si nj es muy pequeo

Ejemplo de un grfico factorial de la nube de puntosmodalidades, con modalidades de muy baja frecuencia
otras
modalidades

mod2B
mod1C
mod3B

modalidades
raras

mod2A

eje I

mod4B

mod1A
mod2C

eje II

mod3C
mod1B

Cmo se construyen
artificialmente las
modalidades de
muy baja frecuencia?

Elaboracin de los
cuestionarios...
Supervisin del trabajo de campo...
Verificacin y correccin de la
base de datos...

Inercia total con respecto a G

de la nube

de puntos-modalidades
K

j 1

j 1

IGM Contrib. j IGM

1 1 n j
p
n

IGM Kp 1
La inercia total de una Tabla Lgica depende
nicamente del nmero de variables observadas
y del nmero de modalidades definidas para esas
variables

Relaciones de Transicin
en el
anlisis de correspondencias
de una
Tabla Lgica

Tratndose del Anlisis Factorial de Correspondencias


de una Tabla de Contingencia particular,

el A.F.C.M. sobre una Tabla Lgica satisface


tambin las Relaciones de Transicin

F i

x ij

pG
j 1

j i 1, , n

Perfil del i-simo individuo


xij = 1 cuando el ind. i present la modalidad j ;
xij = 0 si el ind. i no present la modalidad j.
Coordenadas factoriales de las K modalidades
(columnas) de la Tabla Lgica.
La coordenada F(i) del i-simo individuo es igual
al promedio de las coordenadas de las modalidades
que l present (promedio ponderado con un factor
de contraccin).

Consecuencias de esta primera relacin baricntrica


entre ambos espacios de representacin

El i-simo individuo se encuentra ubicado al baricentro


de las modalidades (atributos) que present en la
encuesta.

La proximidad de dos individuos sobre un plano factorial


traduce grficamente el hecho observado que ambos
individuos presentaron un nmero suficientemente
grande de atributos semejantes en las p variables de
la encuesta.

G j

x ij

n
i 1

F i j 1, , K

Perfil de la j-sima modalidad


xij = 1 cuando el ind. i present la modalidad j ;
xij = 0 si el ind. i no present la modalidad j.
Coordenadas factoriales de los n individuos
(lneas) de la Tabla Lgica.
La coordenada G(j) de la j-sima modalidad es igual
al promedio de las coordenadas de los individuos
que presentaron esa modalidad (promedio ponderado
con el mismo factor de contraccin).

Consecuencias de esta segunda relacin baricntrica


entre ambos espacios de representacin

La j-sima modalidad se encuentra ubicada al baricentro


de los individuos que presentaron ese atributo en la
encuesta.
La proximidad de dos modalidades j y j sobre un plano
factorial traduce grficamente el hecho observado que
los atributos j y j fueron presentados conjuntamente por
un cierto nmero de individuos observados.
La proximidad de dos modalidades j y j sobre un plano
factorial indica entonces que la variable indicadora j
y la variable indicadora j estn relacionadas.

La doble relacin baricntrica facilita la interpretacin


de la nube de individuos cuando n es muy grande
Eje II

Eje I

Eje II

Eje I

Eje II

Eje I

Representacin
de los puntos-variables
en el
anlisis de correspondencias
de una
Tabla Lgica

La representacin factorial de los puntos-variables


permite satisfacer el cuarto objetivo del A.F.C.M.

Cuarto objetivo
Estudiar la relacin existente entre todas las
las caractersticas observadas.

Para comprender como se realiza en el A.F.C.M.


la representacin grfica de la relacin observada
entre las variables cualitativas, es necesario recordar
como se mide la asociacin entre una variable
cuantitativa y una variable cualitativa...

Ejemplo
scattergrama de la distribucin de una variable
cuantitativa en una particin en tres grupos

El promedio de las coordenadas de los individuos del


grupo (que presentaron la modalidad Jk) es :

yk 1
nk

nk

F i
i 1

por la segunda relacin de transicin :

G Jk

nk

x ij

n
i 1

de modo que :

nk

F i F i nk G Jk
i 1

yk G Jk

Cmo evaluar el grado de asociacin existente


entre la variable J y el eje ?

La intensidad de la asociacin se mide con el


2
ndice de correlacin
2 varianza inter - clases
varianza total

Siendo :

s2

inter - clases

k 1

nk 2

G Jk p
n


total

s2

k 1

nk 2
G Jk
np

k 1

nk 2
G Jk
np

k 1

nk 2
G Jk
np

contribucin a la inercia de cada


modalidad de la variable J

y sabemos que : Jk
de modo que :

2 J;F

nk 2
G Jk
np

100

p
100

J
k 1

Cmo evaluar el grado de asociacin existente


entre cada variable J de la Tabla Lgica y cada
eje factorial?

Sea una variable J de la Tabla Lgica, que presenta


una cantidad r de modalidades...

2 J;F

p
100

J
k 1

La relacin de la variable J con el eje est medida


por la suma de las contribuciones a la inercia de las
modalidades de la variable J.
Veremos que los resultados del A.F.C.M.
editan esas sumas de contribuciones a la
inercia de las modalidades de cada variable.

Representacin factorial de las variables


de una Tabla Lgica

Qu significa la proximidad de dos puntos-variables


en ese plano factorial?

Tercer tema
Anlisis Factorial de
Correspondencias
de una Tabla de Burt

Cul es la informacin contenida en una


Tabla de Burt TB (K x K)?

Cada variable cualitativa realiza una particin de

los n individuos observados en tantas clases como


modalidades presente la variable.

La informacin contenida en una TB (K x K) resulta


de la comparacin de los perfiles de esas clases.
La clase de los individuos j ser semejante a la clase de
los individuos j cuando ambas clases presenten perfiles
equivalentes de distribucin del conjunto de variables
cualitativas consideradas en la TB (K x K).

Distancia entre elementos de una Tabla de Burt TB (K x K)


Coordenadas del j-simo perfil-ponderado correspondiente
a la modalidad j de una TB (K x K)

n j1

n jk

n jK

p 2n

p 2n

p 2n

pn j.

pn.1
2
2n
p
n
p

n j1

; ;

pn j.

; ;

pn.k
p 2n p 2n

n jk

pn j.

pn.K
p 2n p 2n

n jK

n
; ; n
; ; n
p n n
p n n
p n n
j. .1
j. .k
j. .K

Distancia del Chi2 entre dos modalidades j y j


d2 j; j'

k 1

k 1

n jk

n j'k

n
n

p n n
p n n
j. .k
j'. .k
n
n.k

n jk n j'k

n j. n j'.

La nube de puntos-modalidades construda a partir


de la TB (K x K), con la distancia del Chi2, permite
comparar las modalidades por la semejanza entre
los perfiles de distribucin de todas las variables
cualitativas de la tabla.

El anlisis de correspondencias de la Tabla de Burt


permite construir una buena representacin
grfica de las comparaciones de las modalidades,
traducidas en distancias entre los puntos de la
nube de puntos-modalidades, cualquiera sean las
dimensiones de la Tabla de Burt.

Relaciones existentes
entre la Tabla Lgica
(o Tabla Disyuntiva Completa)
y la Tabla de Burt

El k-simo punto-perfil-ponderado de la Tabla de Burt


est ubicado en el baricentro de los perfiles de los nk
individuos de la Tabla Lgica que presentaron el atributo (modalidad) k.

Las modalidades (columnas) de una Tabla Lgica


y de una Tabla de Burt tienen el mismo peso.

La nube de puntos-individuos (definida a partir de


una Tabla Lgica) y los baricentros de esos puntos
(definidos a partir de una Tabla de Burt) estn ubicados en el mismo espacio euclidiano, de K dimensiones.

Los puntos-individuos en la representacin de una


Tabla Lgica tienen todos el mismo peso, mientras
que los puntos-modalidades en la representacin de
la Tabla de Burt estn afectados de un peso que es
proporcional a la importancia de la clase.

En consecuencia, por la propiedad de equivalencia


distribucional que cumplen los espacios dotados
de la distancia del Chi2
El anlisis de la nube de puntos-columna N(J),
baricentros de los individuos de una Tabla Lgica,
puede ser hecho mediante el Anlisis Factorial de
Correspondencias de una Tabla de Burt.
El Anlisis Factorial de Correspondencias...
- de una Tabla Lgica
y
- de una Tabla de Burt
tienen que producir resultados equivalentes

Semejanzas y diferencias
entre el A.F.C. de una Tabla Lgica
y el A.F.C. de una Tabla de Burt

Los ejes factoriales asociados a la nube de puntos N(I)


(lneas de la TL) son similares a los ejes factoriales
asociados a la nube de puntos N(J) de sus baricentros
(columnas de la TB).

Se obtiene la mejor representacin de ambas nubes de


puntos-perfiles de dos maneras:

Determinando los ejes factoriales en el espacio de


puntos-baricentros (columnas de la TB), se puede
proyectar sobre esos ejes las lneas de la TL como
elementos suplementarios.
Determinando los ejes factoriales en el espacio de
puntos-individuos (lneas de la TL), se puede
proyectar sobre esos ejes las columnas de la TB
como elementos suplementarios.

En la representacin factorial de los elementos de


una TL, se interpreta la proximidad entre dos puntoscolumna :
en trminos de asociaciones entre variables
indicadoras (var.presencia-ausencia) ;
En trminos de similitud de perfiles de distribucin
de variables cualitativas para todas las
clases de individuos.

Los ejes factoriales de las columnas de una TL y los


ejes factoriales de las columnas de una TB no son
idnticos, pero si homotticos
Los ejes factoriales son proporcionales

TB

J GTL
J

Los valores propios asociados a los ejes factoriales


de una TB son iguales al cuadrado de sus homlogos
en una TL.

TB 2TL

El AFCM se hace sobre la Tabla de Burt... pero se


editan los resultados correspondientes a la Tabla Lgica.

Tercera Parte
Funcionamiento del Anlisis
Factorial de
Correspondencias Mltiples

Seleccin de los ejes factoriales


interesantes en un Anlsis Factorial
de Correspondencias Mltiples

Los valores propios de descomposicin de la inercia


La inercia a lo largo del eje de las K modalidades
de las p variables cualitativas es igual al valor promedio
del ndice de correlacin 2 de las p variables con el
eje .

1

p

J 1

2 G

;J

Si : 2 G ;J 1 J 1, , p 1

En la prctica, los p valores propios son : 0 1

Tasa de inercia de un factor

100 100
IG

En el AFCM, la tasa de inercia de un factor NO PUEDE


ser interpretada como un indicador del grado de
importancia de un eje factorial.
Debemos referirnos al valor absoluto de y a la
estructura del decrecimiento de los valores propios...

Seleccin de los ejes interesantes


Ejemplos de descomposicin de la inercia de una TL

Coeficientes de ayuda
a la interpretacin de resultados
en el Anlisis Factorial
de Correspondencias Mltiples

Contribucin de los individuos y de las modalidades


a la inercia proyectada a lo largo de un eje

1 F2 i

n
C TR i
100 i I

nk 2
G k
C TR k n
100 k K

Los programas editan las sumas de las CTR(k) para las


modalidades de una misma variable cualitativa
(para calcular el 2 de las variables con cada eje).
Grado de generalidad de un eje factorial...

Calidad de representacin de las modalidades


sobre un eje factorial

En el AFCM, no es posible utilizar este ndice...


Porqu?
Se emplean los valores-test
estos indicadores sern explicados en las sesiones
de trabajos prcticos.

Elementos suplementarios
o ilustrativos
en el Anlisis Factorial
de Correspondencias Mltiples

Individuos suplementarios
F i' s

x 'sj

p
j 1

G j

1 1
p

j 1

x 'sj G j

Atributos suplementarios

G Cq

x iq

n
i 1

.q

F i

Modalidades suplementarias

G Cq

1
1

nqj

n
j 1

G j

Utilizacin de los elementos suplementarios


Ejemplo :

Qu significa explicar la estructura


de la opinin de la poblacin observada
en funcin de sus caractersticas
socioeconmicas?

Cuarta Parte
Prctica
del Anlisis Factorial de
Correspondencias Mltiples

Ejemplo de aplicacin
del A.F.C.M.
al tratamiento de la informacin
producida
en una observacin descriptiva

1. Presentacin del problema

Una institucin italiana de investigacin (CERFE)


realiz un estudio destinado a evaluar la calidad
de los servicios de salud en Italia.

Ese estudio (y la encuesta que se hizo) fue organizado


y realizado por un conjunto de personas que participaron
voluntariamente en todas las etapas de esa evaluacin.
Participaron en ese trabajo 2163 personas.

Al trmino de ese estudio, el CERFE quiso analizar


las caractersticas socio-culturales y polticas de
ese importante grupo de voluntarios que participaron
en esa evaluacin.

Se realiz una encuesta ante esas 2163 personas, produciendo


la base de datos siguiente...
Esa base de datos permite explorar diferentes problemas relativos
a las caractersticas de esos voluntarios.

En este ejemplo nos limitaremos al anlisis de uno


de los aspectos que pueden ser explorados:

Construccin de una tipologa sociodescriptiva

de los participantes voluntarios al estudio sobre


la calidad de los servicios de salud.

Construccin de una tipologa de la experiencia previa


de participacin en actividades asociativas de los
participantes voluntarios al estudio sobre la calidad
de los servicios de salud.

Anlisis de la relacin existente entre esas tipologas.

Base de Datos : Tabla de Cdigos Condensados

: Unidad
temtica
3 4
Variables
Variables :: Unidad
Unidad temtica
temtica 21 Variables
Variables
: Unidad
temtica
V31.
Colab.
a observ.
V23.
Miembro
Partido
Poltico
V9.
Part. Org. Escolar
V16.
Part.
denuncias/protes.
V1. Edad
V32.
Colab.Sindicato
a entrev.
V24.
Miembro
V10.
Part. Org. Poltica
V17.
Part.cartas
adm.pbl.
V2. Sexo
V33.
Colab.Org.
a organiz.
V25.
Miembro
Volont.
V11.
Part.
Sindical
V18.
Part.reclamos
func.
V3. Nivel
deOrg.
Instruccin
V34.
Colab.
a difusin
V26.
Miembro
Comit
Barrio
V12.
Part. Org.
Barrial
V19.
Part.
reuniones
amicales.
V4. Estatuto
ocupacin
V35.
Colab.
a iniciativa
V27.
Miembro
Asoc.Cult.
V13.
Part. profesional
a peticiones
V20.
Part.
progr.radio/TV
V5. Sector
V36.
Colab.Org.
a formacin
V28.
Miembro
Ecolo
V14.
Part.act.voluntarias
V21.
Part.prod.estudios
V6. Tipo
de ocupacin
V15.
Part.de
gestin
servicios V29.
V22.
Part.reuniones
defensa
V37.
Colab.Org.
a otras
for.
Miembro
Relig.
V7. Rama
ocupacin
V8. Regin de residencia

V30.

Miembro Otras org.

Estrategia de anlisis de los datos


El anlisis de los datos se desarrolla en tres etapas :

Primera etapa :

Objetivo :Construccin de una tipologa socio-descriptiva


de los 2163 voluntarios italianos.

Segunda etapa :

Objetivo :Construccin de una tipologa de la experiencia


previa de participacin en evaluaciones sociales
de los 2163 voluntarios italianos.

Tercera etapa :

Objetivo :Anlisis de la relacin entre esas tipologas.

Primera etapa :
Objetivo : Construccin de una tipologa

sociodescriptiva de los 2163


voluntarios italianos.

Instrumento :

Anlisis Factorial de
Correspondencias Mltiples
de la tabla TCC(2163,7)

Tabla de Cdigos Condensados (2163 x 7)

Variables activas : Unidad temtica 1


V1. Edad
V2. Sexo
V3. Nivel de Instruccin
V4. Estatuto ocupacin
V5. Sector profesional
V6. Tipo de ocupacin
V7. Rama de ocupacin
Var. Suplementaria en el tema :
V8. Regin de residencia

Distribuciones de frecuencias de las variables activas

Tabla de Burt (perfiles en lnea)

Descomposicin de la inercia total de la Tabla Lgica

diff1 1 2 2 1

diff1 2 3 3 2

diff2 1 2 diff1 1 2 diff1 2 3

diff2 2 3 diff1 2 3 diff1 3 4

Interpretacin
de los ejes factoriales
y de los planos factoriales

ZOOM
Eje I

ZOOM
Eje I

Eje II

ZOOM
Eje I

Problema

Conclusiones :
- Permite verificar la clasificabilidad del conjunto de
individuos observados.
- Pero, siendo un espacio continuo de comparacin
de los individuos, se hace complejo la definicin
de las clases (problemas de frontera)

Por ello, los mtodos de clasificacin


son un complemento indispensable del
A.F.C.M.