Professional Documents
Culture Documents
AFM
Jérôme Pagès
Mathématiques appliquées
Agrocampus Rennes
France
1
1.Données ; notations ; exemple
2. Pondération des variables
3. L’AFM est basée sur une ACP de l’ensemble des variables actives
4. Représentation superposée des J nuages d’individus
5. Recherche de facteurs communs
6. Représentation globale des groupes de variables
7. Relations avec les facteurs des analyses séparées
8. Cas des variables qualitatives
9. Conclusion
10. Références (m.à j. mars 2008)
2
1. Données
1. Données : cadre général
Objectif
Etudier la variabilité sensorielle des vins
en relation avec le type de sol et l’appellation
20 parcelles
4 types de sol
Même : cépage, viticulture, vinification
21 vins : 1 vin est proposé deux fois
36 dégustateurs = juges (professionnels)
29 questions (= descripteurs = attributs)
3
Tasting of red wines from the Loire Valley (INRA Angers) 1. Données
Le questionnaire Olfaction at rest 1 2 3 4 5
Olfactory intensity nil → very high
Olfactory quality “
Fruity “
Floral “
Spicy “
Vision
Color intensity light → dark
Shade orange/purple orange → purple
Surface (size of tears) nil → very high
Olfaction after agitation
Olfactory intensity nil → very high
Olfactory quality “
Fruity “
Floral “
Spicy “
Vegetal “
Phenolic “
Mouth aromas intensity “
Mouth aromas persistence “
Mouth aromas quality nil → excellent
Gustation
First mouth intensity nil → very high
Sour “
Astringency “
Alcohol “
Balance sour-astr.-alc. “
Velvety “
Bitter “
End mouth intensity “
Harmony “
Overall judgment
Overall quality nil → excellent
Typicity nil → very high 4
Free comments
1. Données
variables
1 k 29 31
1
vins i xik
21
variables
1 k 29 31
1
vins i xik
21
Objectif
Mettre en évidence les principales dimensions de la variabilité sensorielle
des vins
Relier ces dimensions avec le type de terroir et l’appellation
Méthodologie usuelle
Appliquer l’ACP à l’ensemble du tableau
les variables sensorielles (centrées-réduites) étant actives
les variables “origine” étant supplémentaires
6
1. Données
groupes 1 2 3 4 5 6
variables 1 31
1
vins
21
6 groupes de variables
1 Olfaction au repos (5 variables)
2 Vision (3 variables)
3 Olfaction après agitation (10 variables)
4 Gustation (9 variables)
5 Jugement d’ensemble (2 variables)
6 Origine (2 variables ; 7 modalités)
Premier problème : équilibrer l’influence des groupes au sein d’une analyse d’ensemble
7
1. Données
Notations générales
groupes 1 j J
variables 1 K1 1 k Kj 1 KJ
1
indiv. i xik
Même notation I, J, K :
nombre d’éléments
ensemble des éléments
8
2. Pondération
2. Pondération des variables
Exemple de référence
RI
groupe 1 : 2 var.
groupe 2 : 3 var.
9
2. Pondération
Exemple de référence
1ère composante
principale
RI
groupe 1 : 2 var.
groupe 2 : 3 var.
10
2. Pondération
Exemple de référence
1
.5
RI .5
groupe 1 : 2 var.
1 groupe 2 : 3 var.
11
3. ACP pondérée
3. L’AFM est basée sur une ACP de l’ensemble des variables actives
Equivalence
Quand chaque groupe est réduit à 1 variable quantitative : AFM = ACP normée
12
3. ACP pondérée
L’AFM est basée sur une ACP de l’ensemble des variables actives
L’AFM fournit :
13
3. ACP pondérée
AFM : représentation des vins
F1:
Bmi2
49.4 % (2ING)
Cmi3
(1VAU)
Smi2
Smi3 Bmi2
Cmi3
Cmi2
14
Sref (1DAM)
3. ACP pondérée
0.6
olfaction au repos
vision
arôme végétal olfaction après agitation
0.4 gustation
jugement d'ensemble
0.2
F2 : 19.5 %
0
-0.2 floral
arôme épicé
amertume -0.4
floral
1 j J
1 K1 1 Kj 1 KJ
1
i1 ij iJ
i
17
4. Représ. superposée
Analyse procustéenne : principe
18
4. Représ. superposée
RK
RKj
j
RK1 NI j NI nuage partiel
NIj ij
RK = ⊕R
Kj
i1
NI nuage moyen
i
NI
19
4. Représ. superposée
RK
RKj
RK1
NI j
ij NIj
i1
NI us
Les nuages partiels sont projetés sur les axes principaux d’inertie du nuage moyen
20
4. Représ. superposée
F1
4
3
2
4
3 1VAU 2ING
2
1
1
3
4
3
F2
1 Smi4 4 1
Smi4 2 3
2
1 2 1POY
4
2 4
1DAM 3
1
21
4. Représ. superposée
Quelques valeurs des trois variables du groupe 1 les plus corrélées au premier facteur
Quelques valeurs des 4 variables du groupe 4 les plus corrélées au premier facteur
F2
F2
1 A
C
F1 F1
2 B
23
4. Représ. superposée
Si la variable k a le poids mk
1
Fs (i ) =
λs
∑x
k∈K
ik mk Gs (k )
stations
station i
flore
F1
25
4. Représ. superposée
Enquête
opinions comportements
individus
Indiv. i
comportement
F1
26
5. Facteurs communs
B
C
A
B
recherche simultanée de
combinaisons linéaires des variables des groupes 1 et 2
28
5. Facteurs communs
Ej engendré par
RI les variables
Fs du groupe j
R²(z, Kj) : coefficient de détermination
Fs j
Fs maximise ∑Rj
2
(z ,K j )
Fs j : projection de Fs sur Ej
29
5. Facteurs communs
1
Lg ( z, K j ) =
λj ∑r 2
( z, vk )
1 k∈K j
0 ≤ Lg ( z , K j ) ≤ 1
30
5. Facteurs communs
z Ej
Pj(z)
v1
v2
31
5. Facteurs communs
32
5. Facteurs communs
j
Lien avec la représentation superposée des NI
RK
RKj
RK1
NI j
ij NIj
i1
NI us
Coordonnées de Coordonnées de
NI sur us sur us
Fs Fsj Comment mettre en évidence un facteur commun ?
1 1
r(Fs , Fsj) = corrélation entre
i i le facteur “commun” : Fs
sa représentation dans le groupe j : Fsj
I I
33
5. Facteurs communs
34
6. Représentation des groupes
j
NI : nuage partiel (des individus ; associé au groupe j) 35
6. Représentation des groupes
j
Etudier les ressemblances globales entre les Ni
1 j J
1 l I 1 l I 1 l I
1 1 1
I I I
W j = X j X ′j
36
6. Représentation des groupes
i xik Æ i Wj(i,l)
I I
RI RI²
NKj Wj
NJ
37
6. Représentation des groupes
RI²
Wj
NJ
Etudier le nuage NJ
Axes principaux de NJ
i xik Æ i Wj(i,l)
I I
RI RI²
NKj Wj ws
NJ
vs
ws : W associé à vs
j
inertie de NK projeté sur vs coordonnée de Wj sur ws
=Lg(vs , Kj) 39
6. Représentation des groupes
F2
1 Carré des liaisons
Coordonnée = Lg
terroir
0.8
Qualité de représentation des groupes
6 1 (inertie projetée / inertie totale)
0.6
1 olfaction au repos : 0.617
2 vision : 0.729
3 3 olfaction après agitation : 0.784
0.4 4 gustation : 0.772
5 appréciation d'ensemble : 0.444
6 origine : 0.189
5 4
0.2
appellation
2
0
0 0.2 0.4 0.6 0.8 1 F1
40
6. Représentation des groupes
Autre exemple de représentation des groupes
50 vins mousseux (incluant 26 Champagne) décrits par
25 amateurs
7 œnologues
25 amateurs 7 œnologues
F2
1 juge = 1 point
F1 41
7. Analyses séparées
Les facteurs des analyses séparées sont projetés comme des éléments supplémentaires
Groupes 1 j J
Variables 1 K1 1 k Kj 1 KJ 1 s S
1
Indiv. i
ACP
1 s S
1
i Fs(i)
I
42
7. Analyses séparées
Les facteurs des analyses séparées sont projetées comme des éléments supplémentaires
F1
G4F1
G3F1
G2F1
G5F1
G3F2
G2F2 G5F2
G4F2
-1 1 F2
G1F2
G1F1
-1
Smi2
Smi3 Bmi2
milieu 2
milieu 3 Chinon
Cmi3
Cmi2 Bourgueil
44
Sref (1DAM)
8. Variables qualitatives
Cas des variables qualitatives
3
4
3
F2
1 4
2
1
S. référence
45
8. Variables qualitatives
Cas des variables qualitatives
Lorsque chaque groupe est réduit à une variable qualitative : AFM = ACM
46
8. Variables qualitatives
Données mixtes
Lorsque chaque groupe est composé d’une seule variable, quantitative ou qualitative,
AFM = Analyse Factorielle pour Données Mixtes (AFDM)
47
9. Conclusion
9. Conclusion
Le cœur de la méthode est une analyse factorielle pondérée qui fonctionne comme
une ACP pour les groupes de variables quantitatives
une ACM pour les groupes de variables qualitatives
une AFDM pour les groupes mixtes
48
9. Conclusion
Conclusion : extensions
Pays 1 t T
Mots 1 J1 1 j Jt 1 JT
1
Categories i xijt
d’enquêtés
49
9. Conclusion
Conclusion : extensions
Jury 1 Jury 2
Un package R dédié à
l’analyse exploratoire multidimensionnelle
développé par
le laboratoire de mathématiques appliquées
d’Agrocampus
http://factominer.free.fr
51
10. Références
10. Quelques références sur l ’AFM
Escofier B. & Pagès J. (1992) Analisis factoriales simples y multiples ; objectivos, métodos e
interpretacion. Traduccion de Elena Abascal Fdez., Karmele Fdez. Aguirre, Isabel Landaluce Calvo, José
M. Piris Laespada, Amaya Zarraga Castro. Servicio editorial Universidad del pais Vasco.
(Information : etpfeagk@bs.ehu.es)
Références méthodologiques
Escofier B. & Pagès J. (1994). Multiple Factor Analysis (AFMULT package). Computational statistics &
data analysis 18 121-140
Pagès J. (1996). Eléments de comparaison entre l’Analyse Factorielle Multiple et la méthode STATIS.
Rev. Statistique appliquée XLIV (4) 81-95
Pagès J. & Ténenhaus M. (2001). Multiple factor analysis combined with path modelling. Application to
the analysis of relationships between physicochemical variables, sensory profiles and hedonic
judgements. Chemometrics and Intelligent Laboratory Systems 58 261-273.
Pagès J. & Ténenhaus M. (2002) Analyse factorielle multiple et approche PLS. Rev Statistique
appliquée, L (1) 5-33 52
10. Références
Quelques références sur l ’AFM
Pagès J. (2002) Analyse factorielle multiple appliquée aux variables qualitatives et aux données mixtes.
Rev Statistique appliquée, L (4), 5-37.
Le Dien S., Pagès J. (2003) Analyse factorielle multiple hiérarchique. Rev Statistique appliquée. LI (2)
47-73.
Bécue M. & Pagès J. (2003) A principal axes method for comparing contingency tables: MFACT.
Computational Statistics and Data Analysis. (45) 3 481-503
Pagès J. (2004) Analyse factorielle de données mixtes. Rev Statistique appliquée. LII (4), 93-111.
Pagès J. (2005) Analyse factorielle multiple et analyse procustéenne. Rev Statistique appliquée. LIII (4),
61-86
Pagès J., & Husson F. (2005). Multiple factor analysis with confidence ellipses: a methodology to study
the relationships between sensory and instrumental data. J. Chemometrics. 19. 1-7
Husson, F. & Pagès, J. (2006) Indscal Model: geometrical interpretation and methodology.
Computational Statistics and Data Analysis. 50 (2). pp. 358-378
Morand E. & Pagès J. (2006). Procrustes multiple factor analysis to analyse the overall perception of
food products. Food quality and preference 17 36-42.
53
10. Références
Quelques références sur l ’AFM
Documentation SPAD
Pagès J. (1997). Procédure AFMUL : la méthode. In SPAD TM : analyse des tableaux multiples. CISIA
Ed. 11-22.
Pagès J. (1997). Commentaire d’un exemple d’analyse factorielle multiple. In SPAD TM : analyse des
tableaux multiples. CISIA Ed. 1-35.
54
10. Références
Quelques références sur l ’AFM
Applications
Pagès J. & Escofier B. & Haury J. (1991). Multiple factor analysis : a method to analyse several groups
of variables measured on the same set of individuals. Applied multivariate analysis in SAR and
environmental studies. Devillers & Karcher (Eds). Kluwer Academic Publishers. 33-83.
Pagès J. (1996). Quelques apports de l'AFM à l'analyse de données sensorielles. J. int. Sci. Vigne Vin.
30, n°4
Pagès J. & Husson F. (2001) Inter-laboratory comparison of sensory profiles. Methodology and results.
Food quality and preference 12 297-309.
Husson F., Le Dien, Pagès J. (2001) Which value can be granted to sensory profiles given by
consumers ? Methodology and results Food quality and preference 12 291-296
Bécue M. & Pagès J. (2001). Analyse simultanée de questions ouvertes et de questions fermées.
Méthodologie, exemple. Journal de la SFdS. 142 (4), 91-104.
Le Dien S., Pagès J. (2003) Hierarchical Multiple Factor Analysis : application to the comparison of
sensory profiles. Food quality and preference. 14 397-403.
Pagès J. (2003) Recueil direct de distances sensorielles : application à l’évaluation de dix vins blancs du
Val de Loire. Sciences des aliments. (23) 679-688.
55
10. Références
Quelques références sur l ’AFM
Applications (suite)
Pagès J., Deneulin P. & Asselin C. (2004) Recherche méthodologique pour une caractérisation du
cépage Chenin. Application au "rendez-vous du chenin ”. Revue française d'Oenologie. 208, 35-40.
Pagès, J. & Périnel E. (2004) Panel performance and number of evaluations in a descriptive sensory
text assertions : comparing and combining both. Food quality and preference 19 122-134 .
56