You are on page 1of 7

Analyse des donnes.

ANALYSE FACTORIELLE DES CORRESPONDANCES (AFC)

1. INTRODUCTION. Lanalyse factorielle des correspondances a pour but ltude de la relation de dpendance qui existe entre deux variables nominales. La correspondance ou dpendance est illustre par des reprsentations graphiques. LAFC permet de rpondre deux questions : - y-a-t-il un lien entre les deux caractres tudis ? - Si oui, comment se comporte un facteur par rapport lautre facteur ? LAFC constitue donc un prolongement du test Khi deux de lindpendance de deux variables nominales. LAFC sapplique des donnes qui se prsentent sous forme dun tableau de frquences deux entres. Ces frquences constituent les lment dune matrice, de dimensions n lignes et p colonnes, n et p reprsentant les nombres de modalits relatives aux deux critres pris en considration. Les lignes et les colonnes sont de mme nature, elles jouent un rle symtrique contrairement la matrice des donnes pour une analyse en composantes principales, o les lignes correspondent aux individus et les colonnes aux variables. Cette symtrie permet de raliser deux ACP et de porter les deux analyses sur un mme graphique. Le principe de lAFC est identique celui de lACP, savoir identifier un petit nombre de dimensions pour simplifier et interprter un ensemble de donnes relativement important tout en minimisant au maximum la perte dinformation. 2. INTERPRETATION DES RESULTATS DE LAFC. Linterprtation dune AFC est compose des tapes suivantes : 2.1. Analyse du tableau des correspondances. Il sagit du tableau de frquences ou tableau de contingence, cette analyse portent sur les frquences conditionnelles exprimes en pourcentages lignes et pourcentages colonnes, appeles aussi profils lignes et profils colonnes.
1 Adil ELMARHOUM

Analyse des donnes.

2.2. Choix du nombre de dimensions. le nombre total de dimensions est gal au minimum du nombre de lignes et nombre de colonnes diminu de 1. le choix du nombre de dimensions principales est base sur le taux dinertie qui quantifie la part dinformation extraite par chaque dimension. Cest lquivalent de la variance en ACP. 2.3. Interprtation des dimensions. Pour interprter une dimension, on utilise : - Les contributions des lignes et des colonnes au dimension : elles reprsentent, en pourcentage, les parts de chaque modalit dans linertie totale des dimensions. Plus cette part est leve, et plus la modalit caractrise le mieux la dimension. - Qualit de la reprsentation des lignes et des colonnes dans les sous-espaces constitus des dimensions : elle indique la capacit des dimensions restituer linformation contenue dans la variable initiale. Un pourcentage lev traduit une perte dinformation minime. - Reprsentation graphique : Contrairement lanalyse en composantes principales, o on effectue habituellement des graphiques spars pour les individus et variables, lAFC utilise une reprsentation graphique simultane des points lignes et des points colonnes dans un plan factoriel, elle met en correspondance les liens ventuels entre les modalits des deux caractres tudis. Dans ces graphiques, la proximit de deux points linges ou de deux points colonnes traduit la similitude des profils, cest dire des distributions conditionnelles, relatifs ces deux lignes ou ces deux colonnes. En pratique, on repre en premier lieu les points lignes et les points colonnes qui ont une forte contribution aux facteurs utiliss pour la reprsentation graphique et qui ont, en mme temps, une qualit de reprsentation satisfaisante. Pour ces points, on examine alors les projections sur les axes et plus particulirement le signe de ces projections, de manire mettre en vidence les ventuelles conjonctions ou opposition.

Adil ELMARHOUM

Analyse des donnes.

3. APPLICATION NUMERIQUE. Parmi les objectifs dune tude est ltude de la frquence dachat dune marque dun produit dhygine en fonction de lge du consommateur. On voudrait savoir quelle est la tranche dge la plus rceptive cette marque. Un chantillon de 420 personnes a t interrog. On a effectu un tri crois entre les diffrentes classes dge des rpondants et la variable frquence dachat comportant 4 modalits. Les classes dges sont au nombre de 6 : Moins de 20 ans ; 20 moins de 25 ans ; 25 moins de 35 ans ; 35 moins de 45 ans ; 45 moins de 60 ans ; 60 ans et plus. Les modalits de la variable frquence dachat sont : Systmatiquement ; Souvent ; Occasionnellement ; Jamais. Les donnes ont t saisies sur SPSS en dfinissant deux variables : la variable ge et la variable frquence dachat. Les modalits de la variable ge sont codes de 1 6, celles de la variable frquence dachat sont codes de 1 4. Une analyse factorielle des correspondances a t effectu dans le but de savoir si la frquence dachat est lie lge du consommateur, et dans laffirmative, comment se comporte cette frquence dachat en fonction des diffrentes tranches dge. La procdure SPSS pour raliser une AFC est la suivante : - Analyse Factorisation Analyse des correspondances. - Dans Ligne, glisser la variable correspondant aux lignes du tableau crois. Cliquer sur dfinir intervalle, saisissez la valeur minimale des codes (gnralement 1) et la valeur maximale (gnralement le nombre de modalits) puis cliquez sur mettre jour puis poursuivre. - Dans Colonne, glisser la variable correspondant aux colonnes du tableau crois. Cliquer sur dfinir intervalle, saisissez la valeur minimale des codes (gnralement 1) et la valeur maximale (gnralement le nombre de modalits) puis cliquez sur mettre jour puis poursuivre. - Dans Modles, saisissez le nombre de dimensions retenir dans dimensions de la solution (souvent 2 ou 3). - Dans Statistiques, cochez profils lignes et profils colonnes. Les rsultats de lanalyse sont :

Adil ELMARHOUM

Analyse des donnes.

a) Analyse du tableau des correspondances.


Tableau des correspondances Frquence d'achat de la marque Occasion Souvent nelement Jamais Marge active 7 24 10 48 26 39 7 76 19 26 10 61 31 37 4 85 46 36 13 99 20 13 6 51 149 175 50 420

Systmati Age du consommateur quement Moins de 20 ans 7 20 moins de 25 ans 4 25 moins de 35 ans 6 35 moins de 45 ans 13 45 moins de 60 ans 4 60 ans et plus 12 Marge active 46

Chaque case du tableau reprsente le nombre dindividus prsentant les deux modalits considres. Dans la premire case par exemple, 7 individus sont gs de moins de 20 ans et dclarent faire achat systmatique de la marque.
Profils lignes Frquence d'achat de la marque Occasion Souvent nelement Jamais Marge active ,146 ,500 ,208 1,000 ,342 ,513 ,092 1,000 ,311 ,426 ,164 1,000 ,365 ,435 ,047 1,000 ,465 ,364 ,131 1,000 ,392 ,255 ,118 1,000 ,355 ,417 ,119

Systmati Age du consommateur quement Moins de 20 ans ,146 20 moins de 25 ans ,053 25 moins de 35 ans ,098 35 moins de 45 ans ,153 45 moins de 60 ans ,040 60 ans et plus ,235 Masse ,110

Ce tableau prsente le pourcentage que reprsente leffectif du tableau des correspondances par rapport au total de la ligne. Ainsi 14,6 % des individus gs de moins de 20 ans, dclarent acheter systmatiquement la marque. Lanalyse de cette premire ligne montre que les consommateurs gs de moins de 20 ans ont tendance acheter occasionnellement la marque (50%). Un achat souvent de la marque semble tre une tendance pour les plus de 60 ans (39,2%).

Adil ELMARHOUM

Analyse des donnes.


Profils colonnes Frquence d'achat de la marque Occasion Souvent nelement Jamais ,047 ,137 ,200 ,174 ,223 ,140 ,128 ,149 ,200 ,208 ,211 ,080 ,309 ,206 ,260 ,134 ,074 ,120 1,000 1,000 1,000

Age du consommateur Moins de 20 ans 20 moins de 25 ans 25 moins de 35 ans 35 moins de 45 ans 45 moins de 60 ans 60 ans et plus Marge active

Systmati quement ,152 ,087 ,130 ,283 ,087 ,261 1,000

Masse ,114 ,181 ,145 ,202 ,236 ,121

Ce tableau prsente le pourcentage que reprsente leffectif du tableau des correspondances par rapport au total de la colonne. Ainsi 15,2 % des individus achetant systmatiquement la marque, sont gs de moins de 20 ans. Lanalyse de cette premire colonne montre que lachat systmatique de la marque est surtout un comportement de la tranche dge 35 moins de 45 ans (28,3%). b) Choix du nombre de dimensions. le nombre total de dimensions est gal au minimum du nombre de lignes et nombre de colonnes diminu de 1. La variable ge a 6 modalit, la frquence dachat en a 4, donc le nombre de dimensions est gal (4-1)=3.
Valeur singulire Inertie Rsum Khi-deux Sig. Proportion d'inertie Pris en compte Dimension 1 2 3 Total ,208 ,190 ,133 ,043 ,036 ,018 ,097 ,446 ,372 ,182 1,000 Cumul

40,887

,000

,446 ,818 1,000 1,000

Au seuil de signification de 5 %, la valeur calcule de Khi deux (40,887) est de loin suprieur la valeur thorique de la table qui est, pour 15 degr de libert, de 24,996, ou la probabilit de signification (sig. = 0,000) est infrieur au seuil de 5 %, on rejette donc lhypothse de lindpendance des deux variables. On conclut donc que lge des consommateurs a une influence sur la frquence dachat de la marque. le choix du nombre de dimensions principales est base sur le taux dinertie qui quantifie la part dinformation extraite par chaque dimension. La premire dimension contribue pour 44,6 % de linertie totale, la deuxime dimension contribue pour 37,2 % alors que la troisime dimension ne contribue que pour 18,2 %, soit moiti moins que la seconde dimension. Les deux dimensions contribuent ensemble pour 81,8 % de linertie totale. Il semble donc logique de ngliger la troisime dimension pour ne retenir que les deux premires.

Adil ELMARHOUM

Analyse des donnes.

c) Interprtation des dimensions. - Les contributions des lignes au dimension et qualit de la reprsentation des lignes dans les sous-espaces constitus des dimensions.

Masse Age du consommateur

Score dans la dimension 1 2

Inerti e

Contribution De point inertie de dimension 1 2 De dimension inertie de point 1 2 Tota l ,214 ,775 ,989 ,568 ,115 ,683 ,000 ,150 ,667 ,654 ,711 ,270 ,132 ,279 ,711 ,419 ,799 ,933

Moins de 20 ans 20 moins de 25 ans 25 moins de 35 ans 35 moins de 45 ans 45 moins de 60 ans 60 ans et plus Total actif

,114 ,181 ,145 ,202 ,236 ,121 1,000

,474 -,399 ,000 ,211 -,523 ,814

-,944 -,188 -,297 ,296 ,244 ,556

,025 ,011 ,003 ,013 ,020 ,026 ,097

,123 ,138 ,000 ,043 ,310 ,386 1,000

,535 ,034 ,067 ,093 ,074 ,197 1,000

Pour la variable ge, la contribution la plus forte la dimension 1 est celle de la tranche 60 ans et plus (38,6 %). La dimension 2 quant elle, rsulte de la contribution de la tranche moins de 20 ans (53,5 %). Les tranches dge 45 moins de 60 ans et 60 ans et plus sont les mieux reprsentes sur la dimension 1 (respectivement 66,7% et 65,4%), tandis que la dimension 2 reprsente mieux la tranche moins de 20 ans (77,5%). - Les contributions des colonnes au dimension et qualit de la reprsentation des colonnes dans les sous-espaces constitus des dimensions.

Masse Score dans la Inertie dimension Frquence d'achat de la marque 1 2 De point inertie de dimension 1 2 ,841 ,042 ,122 ,480 ,033 ,227 ,004 ,251 1,000 1,000

Contribution De dimension inertie de point 1 ,957 ,227 ,092 ,008 2 ,040 ,741 ,535 ,447

Total

Systmatiquement Souvent Occasionnelement Jamais Total actif

,110 1,265 ,270 ,355 -,268 ,508 ,417 -,128 -,322 ,119 ,083 -,633 1,000

,038 ,023 ,015 ,020 ,097

,996 ,968 ,628 ,456

Adil ELMARHOUM

Analyse des donnes.

Pour la variable frquence dachat, la contribution la plus forte la dimension 1 est celle de lachat systmatique (84,1 %). La dimension 2 quant elle, rsulte de la contribution de la modalit souvent (48 %). La modalit achat systmatique est la mieux reprsente sur la dimension 1 (95,7%), tandis que la dimension 2 reprsente mieux la modalit souvent (74,1%). On peut donc affirmer que sur la dimension1, il y a une certaine correspondance entre la tranche dge 60 ans et plus et la modalit achat systmatique, alors que la dimension 2 mais en correspondance la tranche dge moins de 20 ans et la modalit dachat souvent mais en sens oppos puisque les scores dans la dimension 2 de ces deux modalits sont de signes opposs. - Reprsentation graphique.

Points de ligne et de colonne Symtrique Normalisation


,6 Souvent Systmatiquement

35ans moins de 45 ans ,4 45 moins de 60 ,2 ,0 20 moins de 25 ans 25 moins de 35 ans Occasionnelement Jamais

Dimension 2

-,2 -,4 -,6 -,8 -1,0 -1,0

Frquence d'achat de la marque

Moins de 20 ans Age du consommateur -,5 0,0 ,5 1,0 1,5

Dimension 1

Ce diagramme confirme le rsultat des tableaux des contributions, en effet, on peut voir sur laxe horizontal une certaine correspondance entre la tranche dge 60 ans et plus et la modalit achat systmatique, par contre sur laxe vertical, on peut voir une nette opposition entre la tranche dge moins de 20 ans et la modalit dachat souvent. Comme synthse du rsultat de cette analyse factorielle des correspondances, on peut affirmer quil y a une opposition entre une classe dge ge (60 ans et plus) laquelle semble tre associ un comportement dachat systmatique de la marque et une classe dge trs jeune (moins de 20 ans) dont le comportement nest pas clairement dfini, mais oppos un comportement que lon pourrait qualifier de rgulier (souvent). Les classes intermdiaires sont assez mal prises en compte dans lanalyse.

Adil ELMARHOUM

You might also like