You are on page 1of 38

LAFC, mais quest-ce?

Quelques rappels
Prsentation gnrale
mthodes dites multidimensionnelles
reprsentations gomtriques
Trois mthodes classiques
ACP: Analyse en composantes principales.
Individus et variables numriques
ACM: Analyse des correspondances multiples
Individus et codages de valeurs qualitatives.
AFC: Analyse factorielle des correspondances.
tableaux de frquence
Un exemple:
Exemple
Taille
Exemple
Taille
Exemple
Age (4 classes)
Activit (8 classes)
Exemple
Age
Activit
Exemple
Age
Activit
Exemple

Age
Activit
Exemple

Age
Activit
Exemple
Taille
Poids
Age
Exemple
Taille
Poids
Age
Exemple
Taille
Poids
Age
Taux cholestrol
Consommation dalcool
CSP
Sexe
???
Exemple
???
Espace multi-dimensionnel
Multi-paramtrique
Comment qualifier, quantifier, et surtout
visualiser ces phnomnes ?
Comment diffrencier les interactions
essentielles des rencontres fortuites ?
Exemple
projections de ces hyper-nuages sur
des plans.
Ombres portes
Dformer le moins possible
= Conserver linertie
Choisir le bon angle
= Axes factoriels
Exemple
Baguette
Allongement
Aplatissement
75% de la variance
1 plan = 2 axes
Prcisions
Variance, dispersion, inertie ???
Individus et modalits superposs
Une reprsentation est une
description, pas une preuve !!!
Mthode et hop!

Avec deux variables


Mthode et hop!

Avec 2 I\J htel locat propri parent amis tente villag divers total
variables
CSP Agricult 160 28 0 321 36 141 45 65 796
Lieux de
vacances Salaris 35 34 1 178 8 0 4 0 260

Patrons 700 354 229 959 185 292 119 140 2978

Cad sup 961 471 633 1580 305 360 162 148 4620

Cadre 572 537 279 1689 206 748 155 112 4298
moy

Employ 441 404 166 1079 178 434 178 92 2972


s

Ouvriers 783 1114 387 4052 497 1464 525 387 9209

Personne 65 43 21 294 79 57 18 6 580


ls

Autres 77 60 189 839 53 124 28 53 1423


actif

Non 741 332 327 1789 311 236 102 102 3940
actifs

Total 4535 3377 2232 12780 1858 3856 1336 1105 31079
Et hop!

Patrons
Agriculteur htel
villag locat
tente
Employs
divers

Total
Cadre moy
total
Cadre sup
Ouvriers amis

Non actifs
propri
parent

Personnels

Salaris

Autres actif
Moins vite

Couleur des yeux


Couleur des
cheveux

Couleur des cheveux / Couleur des yeux


bleus marrons verts noisette Total
blanc 24 36 60
blond 36 12 24 72
chtain 12 12 48 72
sombre 12 12 24 48
noir 36 36 12 84
chauve 24 48 12 24 108
roux 24 24
Total 108 144 84 132 468
Encore plus fort

Effectifs thoriques en cas dindpendance, tablis partir des totaux en ligne et


en colonne

Couleur des cheveux / Couleur des yeux


bleus marrons verts noisette Total
Eff. Th Eff. Th Eff. Th Eff. Th Eff. Th
blanc 24 13,8 36 18,5 10,8 16,9 60
blond 36 16,6 12 22,2 12,9 24 20,3 72
chtain 12 16,6 12 22,2 12,9 48 20,3 72
sombre 12 11,1 14,8 12 8,6 24 13,5 48
noir 19,4 36 25,8 36 15,1 12 23,7 84
chauve 24 24,9 48 33,2 12 19,4 24 30,5 108
roux 5,5 7,4 24 4,3 6,8 24
Total 108 144 84 132 468
Toujours mieux

Ecarts lindpendance: diffrence entre leffectif constat et leffectif


thorique.

bleus marrons verts noisette Total

Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.

blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60

blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72

chtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72

sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48

noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84

chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108

roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24

Total 108 144 84 132 468


Attractions

Les carts positifs significatifs :

bleus marrons verts noisette Total

Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.

blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60

blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72

chtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72

sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48

noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84

chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108

roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24

Total 108 144 84 132 468


Rpulsions

Les carts ngatifs significatifs :

bleus marrons verts noisette Total

Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.

blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60

blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72

chtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72

sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48

noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84

chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108

roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24

Total 108 144 84 132 468


And the winner is

sombre
chtainnoisette

roux

verts
blond

bleus
noir
chauve

marrons

blanc
Encore plus fort

chtain sombre

noisette

roux

verts

blond

bleus

chauve noir

marrons

blanc
Est-ce bien clair ?

Chtains
noisette
chtain
Blonds bleus
sombre

noisette

Verts roux
Mais roux

verts
Axe 1: des blond
cheveux blonds
aux cheveux
bleus
roux ou des chauve noir
yeux bleus aux
yeux verts?
Axe 2: du blanc marrons

au chtain, ou
des yeux blanc

marrons aux
yeux noisette?
Un peu daide les contributions absolues

La contribution absolue
rsume le poids dune
modalit par rapport
lensemble des modalits
dcrites par un facteur.
On les lit en colonne et par
facteur. Total = 100
Elle permet de reprer les
modalits qui ont le plus
cr le facteur.
F1: Y verts, C roux, C noirs
F2: Y noisette, Y marrons, C
blancs, C chtain & sombre
Un peu plus daide: les contributions relatives.

La contribution relative dcrit le


poids dune modalit
relativement lensemble des
facteurs.
Elle se lit horizontalement, par
modalit.
Elle permet de voir sur quel
facteur une modalit est le
mieux reprsente.
Les blonds aux yeux bleus ?
Contributions: les blonds aux yeux bleus

Sur le facteur 3, ils ont les plus


fortes contributions absolues!
Ils ont donc permis la
formation de ce facteur.
Ils sont nanmoins mieux
reprsents sur le facteur 1 !
Encore plus fort : 3 variables.
Lecture du graphe

Facteur 1:
Femmes aux yeux
noisettes, aux
cheveux chtains
ou sombres,
Hommes aux yeux
marrons, chauves
ou cheveux
blancs.
Facteur 2:
Les irlandais vs les
scandinaves.
Reprsentation graphique des contributions absolues

Les rectangles se
lisent dans la
dimension du facteur.
Contributions
horizontales,
seulement facteur 1
Contributions
verticales, facteur 2
Carr (blanc), un peu
des deux, mais pas
beaucoup.
Et les yeux verts?
Et les chauves?
Interprter : prudence
difficile interprter quand le nombre de questions et de
modalits est trs lev
tendance mettre en valeur les carts sur les modalits
aux effectifs faibles.
Linterprtation dun mapping (reprsentation graphique
des modalits sur 2 axes) est assez dlicate.
Le fait que deux modalits soient proches ne signifie pas
ncessairement quelles sont en attraction. Il est rare en
effet que tous les liens entre modalits puissent tre
reprsents en deux dimensions.
Interprter : prudence
lanalyse factorielle peut se rduire une technique
permettant de reprsenter de manire suggestive le
maximum dinformations sur les attractions entre
modalits
Elle devient une technique exploratoire qui permet un
premier dbroussaillage des donnes et qui peut
suggrer des pistes fructueuses.
Il faut toujours revenir aux tris croiss ou aux profils
de modalits pour vrifier les suggestions de
lapproche graphique.
Le fait que lAFC rvle peu dattractions entre
variables peut tre un rsultat intressant en tant que
tel.
Dcrire / prdire
Echantillon Probabilits
1 rponse = 1 estimateur
(valeur dune moyenne, dune variance, dune
proportion, dun pourcentage)
+ un intervalle de confiance
+ une probabilit
Dcrire / prdire
Description: la moyenne est m.
Prdiction: jai une probabilit p de
ne pas me tromper en affirmant que
la moyenne est comprise entre (m-i)
et (m+i).
Dcrire / prdire
Hypothses sur les distributions des
paramtres de la population totale,
des paramtres des chantillons
Ambiguts des thories en
probabilit.
Les probabilits, ce nest pas intuitif.
Benzecri: prouver lexistence de Dieu.