Professional Documents
Culture Documents
Contenu :
Prsentation des mthodes danalyses multivaries
Objectifs :
LACP a pour objectif de simplifier un tableau de donnes initiales en passant dun grand nombre
de variables un petit nombre de nouvelles variables obtenues en regroupant les variables
initiales prsentant un coefficient de corrlation relativement important.
Page 1/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Hte-Norm.
1000000 Fr.-Comt
Corse
800000 Champ.-Ard.
Centre
600000
Bretagne
Bourgogne
400000
Basse-Norm.
Auvergne
200000
POPUL
Aquitaine
0 Alsace
0 1000000 2000000 3000000 4000000 5000000
SUPERF
Remarque : Pour afficher dans SPSS les lgendes des points dans un diagramme de dispersion:
Menu Graphe ; Commande Diagramme de dispersion ; Choisir Simple et cliquez sur Dfinir ;
dans la fentre diagramme de dispersion simple faites les choix suivants :
Axe des Y : POPUL
Axe des X : SUPERF
Dfinir les marques par : rgion
Page 2/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Lgende :
POPUL : Population de la rgion en milliers dindividus.
TACT : Taux dactivit (population active /population totale de la rgion) en %.
SUPERF : superficie de la rgion
NBENTR : nombre dentreprises
NBNREV : Nombre de brevets dposs au cours de lanne
CHOM : Taux de chmage, en %.
TELEPH : Nombre de lignes tlphoniques en place dans la rgion, en milliers.
Page 3/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Page 4/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Dans la matrice des corrlations (appele Matrice de proximit) ci-dessus on peut distinguer trois
cas : des corrlations leves proches de 0,8-0,9 indiquant le premier groupe de variables corrles
(qui va constituer la premire nouvelle variable appele facteur ou dimension). Deux variables
faiblement corrles avec les autres (CHOM et TACT) mais assez corrles entre elles (r=0,76), qui
constituent la deuxime dimension. Enfin la variable SUPERF est corrle avec le premier groupe,
mais plus faiblement (r entre 0,5 et 06), elle pourrait constituer la troisime dimension.
Page 5/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Cette matrice est identique celle obtenue dans ltape 2 (appele Matrice de proximit).
SPSS a calcul 7 composantes principales ou facteurs, la premire par exemple a une valeur propre (
variance) de 4,158 qui reprsente 59,39 % de la variance des variables initiales, les trois premires
composantes reprsentent donc 95% de la variance des variables initiales
Page 6/7
Nadiri Abdeljalil 01/10/2004
Matire : Analyse des donnes
Il faut choisir un nombre de composantes suffisant pour rsumer les variables avec une perte
dinformation minimale.
Pour le choix du nombre des composantes retenir il existe deux critres :
Valeur propre ou (critre de Kaiser) : les variables initiales ont une variance gale 1,
puisquelles sont rduites. On retient les composantes dont la variance est suprieure 1,
parce quelles apportent plus dinformation (variance) que les variables de dpart.
Utilisation du graphique des valeurs propres (Scree-test):
On relier par une droite les points presque aligns, en partant de la dernire composante, le
nombre de composantes retenir est alors reprsent par les points ne figurant pas sur la
droite.
En utilisant le critre de Kaiser SPSS a retenu 2 composantes : qui restituent 86,521 % de la
variance des variables de dpart.
En utilisant le critre du Scree-Test daprs le graphique des valeurs propres les composantes
4,5,6 et 7 peuvent tre considres comme aligns sur une mme droite, donc les composantes
retenir sont les composantes 1,2 et 3 qui restituent 95% de la variance des valeurs initiales.
Donc si vous voulez opter pour lutilisation du Scree-Test, il faut refaire lACP et dans la
fentre Extraction il faut slectionner Nombre de facteurs : 3 ( et non loption valeurs propres
suprieures : 1).
Page 7/7