You are on page 1of 16

Fiche TD avec le logiciel

tdr521

Initiation a ` lACM : analyse des correspondances multiples


J.R. Lobry & A.B. Dufour

Un jeu de donn ees tr` es simple qui peut etre analys e aussi bien en ACP quen ACM est utilis e pour une premi` ere approche introductive a lACM. `

Table des mati` eres


1 Les donn ees 2 Analyse univari ee 2.1 Les 8 premi` eres variables . 2.1.1 altit . . . . . . . 2.1.2 deniv . . . . . . . 2.1.3 cloiso . . . . . . 2.1.4 domain . . . . . . 2.1.5 boise . . . . . . . 2.1.6 hetra . . . . . . . 2.1.7 favor . . . . . . . 2.1.8 inexp . . . . . . . 2.2 Les 2 derni` eres variables . 2.2.1 citat . . . . . . . 2.2.2 depart . . . . . . 3 Une ACP pour commencer 4 Une ACM pour continuer 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Mise en oeuvre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Une di erence importante en lACP et lACM . . . . . . . . . . . R ef erences 2 2 2 2 3 3 4 4 4 5 5 6 6 6 7 9 9 10 13 15

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

J.R. Lobry & A.B. Dufour

Les donn ees

Les donn ees utilis ees sont disponibles dans le paquet ade4. Elles ont et e etablies lors de la r edaction dun ouvrage [1] sur l eradication de lours brun dans les Alpes fran caises.
library(ade4) data(ours) dim(ours) [1] 38 10 names(ours) [1] "altit" "deniv" [10] "depart" summary(ours) altit deniv 1: 8 1:13 2:17 2:14 3:13 3:11 cloiso 1:12 2: 4 3:22

"cloiso" "domain" "boise"

"hetra"

"favor"

"inexp"

"citat"

domain 1: 9 2:13 3:16

boise 1:10 2:15 3:13

hetra 1:19 2: 5 3:14

favor 1:15 2:12 3:11

inexp 1:20 2:10 3: 8

citat 1:22 2: 7 3: 4 4: 5

depart AHP:5 AM :4 D :5 HP :8 HS :4 I :5 S :7

Analyse univari ee

Nous allons commencer par faire lexamen univari e de ces donn ees. Les individus sont ici 38 r egions d enies par lInventaire National Forestier et caract eris ees par 10 variables. Les 8 premi` eres variables d ecrivent les caract eristiques environnementales li ees ` a la pr esence de lours ; les deux derni` eres repr esentent des informations compl ementaires.

2.1

Les 8 premi` eres variables

Les 8 premi` eres variables ont la m eme logique et peuvent etre consid er ees comme des variables qualitatives ordonn ees ou comme des indices quantitatifs, les notes 1, 2 et 3 codant dans lordre une situation a priori de plus en plus favorable ` a lours brun (grands espaces forestiers, connexes, dacc` es dicile). 2.1.1 altit

La variable donne limportance de la tranche altitudinale habit ee par lours (800-2000 m) sous forme dun facteur ` a 3 modalit es : 1. moins 50 % de la surface se situe entre 800 et 2000 m 2. entre 50 et 70 % de la surface se situe entre 800 et 2000 m 3. plus de 70 % de la surface se situe entre 800 et 2000 m Repr esenter graphiquement les eectifs des modalit es de cette variable qualitative :

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 2/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

La variable altit
3 2 1 0 5 10 Nombre de rgions 15

2.1.2

deniv

La variable donne limportance du d enivel e moyen par carr e de 50km2 sous forme dun facteur ` a 3 modalit es : 1. moins de 700 m 2. entre 700 et 900 m 3. plus de 900 m
La variable deniv
3 2 1 0 2 4 6 8 10 12 14

Nombre de rgions

2.1.3

cloiso

La variable d ecrit le cloisonnement du secteur sous la forme dun facteur ` a 3 modalit es : 1. une grande vall ee ou une cr ete isole au moins un quart du massif 2. une grande vall ee ou une cr ete isole moins dun quart du massif 3. le massif ne pr esente pas de coupure
La variable cloiso
3 2 1 0 5 10 Nombre de rgions 15 20

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 3/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

2.1.4

domain

La variable donne limportance du domaine forestier en contact avec la r egion sous la forme dun facteur ` a 3 modalit es : 1. moins de 400 km2 2. entre 400 et 1000 km2 3. plus de 1000 km2
La variable domain
3 2 1 0 5 10 Nombre de rgions 15 20

2.1.5

boise

La variable donne le taux (pourcentage de surface de la r egion) de boisement sous la forme dun facteur ` a 3 modalit es : 1. moins de 30 % 2. entre 30 et 50 % 3. plus de 50 %
La variable boise
3 2 1 0 2 4 6 8 10 12 14

Nombre de rgions

2.1.6

hetra

La variable indique limportance des h etraies et for ets mixtes dans la r egion sous forme dun facteur ` a 3 modalit es : 1. moins de 5% 2. entre 5 et 10% 3. plus de 10%

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 4/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

La variable hetra
3 2 1 0 5 10 Nombre de rgions 15

2.1.7

favor

La variable renseigne limportance (pourcentage de surface de la r egion) des for ets favorables ` a lours (h etraies, for ets mixtes, sapini` eres et pessi` eres) sous forme dun facteur ` a 3 modalit es : 1. moins de 5 % 2. entre 5 et 10 % 3. plus de 10 % du massif
La variable favor
3 2 1 0 2 4 6 8 10 12 14

Nombre de rgions

2.1.8

inexp

La variable renseigne limportance (pourcentage de surface de la r egion) des for ets inexploit ees sous forme dun facteur ` a 3 modalit es : 1. moins de 4 % 2. entre 4 et 8 % 3. plus de 8 % du massif
La variable inexp
3 2 1 0 5 10 Nombre de rgions 15 20

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 5/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

2.2
2.2.1

Les 2 derni` eres variables


citat

La variable donne linformation sur la date de disparition de lOurs sous la forme dune variable qualitative ordonn ee ` a 4 modalit es : 1. aucune citation de lesp` ece depuis 1840 2. 1 ` a 3 citations avant 1900 et aucune apr` es 3. 4 citations et plus avant 1900 et aucune apr` es 4. 1 citation ou plus entre 1900 et 1940
La variable citat
4 3 2 1 0 5 10 Nombre de rgions 15 20

2.2.2

depart

La variable indique le d epartement qui contient la r egion sous la forme dun variable qualitative ` a 7 modalit es : AHP Alpes-de-Haute-Provence AM Alpes-Maritimes D Dr ome HP Hautes-Alpes HS Haute-Savoie I Is` ere S Savoie

La variable depart
S I HS HP D AM AHP 0 2 4 Nombre de rgions 6 8

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 6/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

Une ACP pour commencer

Les huit premi` eres variables etant des variables qualitatives ordonn ees associ ees a une description de lenvironnement, on peut les transformer en variables semi` quantitatives sans perte de sens et faire une ACP pour r esumer linformation.
qtt <- apply(ours[, 1:8], 2, as.numeric) acp <- dudi.pca(qtt, scan = FALSE) scatter(acp, posieig = "bottomright")
inexp d=1

deniv

14

2 9 8 6 favor 13 3 10 5 1 2627 38 15 16 25 7

11

12

22 23 35 30 29 24

20 21 36

hetra

cloiso
18 2834

19

32 33

Eigenvalues
31 37

boise
17

altit

domain

Le r esultat est sans surprise, les variables sont globalement toutes corr el ees positivement entre elles, ce qui est dans leur logique m eme. On note aussi que la variable domain est particuli` ere puisque que cest la seule ` a etre de signe oppos e aux autres sur le premier facteur. Pour aider ` a linterpr etation, on consid` ere le graphe canonique qui confronte les coordonn ees sur le premier facteur aux valeurs originelles :
score(acp)
3.0 3.0
q q q

altit

q q

qq

q qq

q q q

deniv

3.0

q q q q

q q

q q q

cloiso

q q q qq q q

q qq q qq

q q

q q

2.5

2.5

2.0

2.0

q qq q

q qq q

qq qq q q q

q qq

q qqq q

2.0

2.5

q qq

1.5

1.5

1.0

1.0

qq q q q q

q q

q qq

q q

q q

q q

1.0

1.5

q q

q q qq

2.0 3.0
q

1.0
q q q

0.0 score
qq q q q q q q

1.0 3.0
q q q

2.0
q q q q

1.0
q qq q q qq q

0.0 score
q

1.0 3.0

2.0
q q q q

1.0
q qq q q

0.0
q q qq

1.0

domain

boise

hetra

score

2.5

2.5

2.0

2.0

q q q

qq q qq q

q qq q

q qq q q

2.0

2.5

q q

1.5

1.5

1.0

1.0

q q

qq

q qqq q q q q

q q

1.0

1.5

qq q qq q q q qq q qq q q q

q q

2.0 3.0
q q q

1.0
q q q q q q q

0.0 score
q

1.0 3.0

2.0
q q

1.0
q qq q

0.0 score
q q

1.0

2.0

1.0

0.0 score

1.0

favor

inexp

2.5

2.0

qq

q qq q

qq q

2.0

2.5
q

q q q

q q

q qq

1.5

1.0

qq q q q qq q q q

q q

1.0

1.5

q q qq

q qq q q qq q q q q q

q q

2.0

1.0

0.0

1.0

2.0

1.0

0.0

1.0

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 7/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

On a donc un gradient entre les r egions favorables et d efavorables ` a l eradication de lours brun. Pour bien comprendre la nature des donn ees, on croise la variable for ets inexploit ees inexp qui est bien corr el ee avec la variable d enivel e deniv. Du point de vue semi-quantitatif adopt e ici, nous avons donc un nuage de points avec beaucoup de superpositions parce quil ny a que peu de valeurs possibles pour les variables. On peut aussi envisager un point de vue compl` etement qualitatif avec la table de contingence correspondant au croisement de ces deux modalit es :
table(ours[, c("inexp", "deniv")]) deniv inexp 1 2 3 1 11 8 1 2 2 4 4 3 0 2 6

La repr esentation graphique suivante permet de comparer ces points de vue :


par(mfrow = c(1, 2), mar = c(5, 4, 3, 1)) sunflowerplot(qtt[, "inexp"], -qtt[, "deniv"], ylab = "deniv", xlab = "inexp", main = "Semi-quantitatif (ACP)", xaxt = "n", yaxt = "n") axis(1, at = 1:3) axis(2, labels = 1:4, at = -(1:4), las = 1) mosaicplot(table(ours[, c("inexp", "deniv")]), shade = T, main = "Qualitatif (ACM)", las = 1)

Semiquantitatif (ACP)
1
q q

Qualitatif (ACM)
1 2 3 <44:22:0 0:2 2:4 >4

deniv

deniv

2 inexp

inexp

Faire la m eme repr esentation pour la variable altit pour comprendre en quoi elle di` ere des autres :

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 8/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

Standardized Residuals:

J.R. Lobry & A.B. Dufour

Semiquantitatif (ACP)
1
q q q

Qualitatif (ACM)
1 2 3 <44:22:0 0:2 2:4 >4

deniv

deniv

2 altit

altit

Nous ne pouvons pas int egrer directement la variable depart dans lACP parce que cest dune part une variable de nature tr` es di erente - qui ne d ecrit pas le milieu - et, dautre part, une variable qualitative non ordonn ee, mais rien ne nous emp eche de lutiliser ` a titre de variable illustrative.
s.class(acp$li, ours$depart, col = rainbow(7))
d=1

q q

S
q q q q q q

q q

HS I
q q q q q q q

q q

q q

HP
q q q

q q

AM
q q

q q

AHP

q q q

On trouve une opposition entre les d epartements du nord plus favorables ` a lours que ceux du sud.

4
4.1

Une ACM pour continuer


Introduction

Une variable qualitative ou variable nominale ou facteur (factor) est une mesure qui prend ses valeurs dans un ensemble ditems ou modalit es ou valeurs ou niveaux (levels). La variable deniv peut, par exemple, prendre des valeurs dans 1, 2, et 3. Nous allons oublier ici le caract` ere ordonn e de nos variables

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 9/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

Standardized Residuals:

J.R. Lobry & A.B. Dufour

pour les traiter comme des variables purement nominales. Une correspondance simple est la pr esence de deux modalit es de deux facteurs di erents chez le m eme individu. Par exemple, comme nous lavons vu dans le paragraphe pr ec edent, il y a un nombre anormalement grand de r egions qui ont ` a la fois la modalit e 3 de la variable deniv et la modalit e 3 de la variable inexp. Autrement dit, les r egions qui pr esentent dimportantes di erences de d enivel ee sont aussi des r egions diciles ` a exploiter par lhomme. Une correspondance multiple est la pr esence simultan ee de m modalit es de p facteurs di erents chez le m eme individu. La description du mode dassemblage des modalit es chez les individus rel` eve de lanalyse des correspondances simples (2 facteurs) ou multiples (plus de 2 facteurs). Ici nous avons 8 facteurs environnementaux, cest donc loccasion dutiliser lanalyse des correspondances multiples.

4.2

Mise en oeuvre

acm <- dudi.acm(ours[, 1:8], scan = FALSE) barplot(acm$eig)

Notez que la d ecroissance des valeurs propres est bien moins rapide que dans le cas de lACP. Il est plus dicile d enoncer un crit` ere relatif au nombre de facteurs a conserver. On d ` ecide de ne consid erer que les deux premiers facteurs par la suite. Comparons les coordonn ees des individus sur le premier et le deuxi` eme facteurs entre les deux analyses :
par(mfrow = c(1, 2)) plot(acp$li[, 1], acm$li[, 1], xlab = "ACP", ylab = "ACM", main = "Premier facteur") plot(acp$li[, 2], acm$li[, 2], xlab = "ACP", ylab = "ACM", main = "Deuxi` eme facteur")

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 10/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

0.0

0.1

0.2

0.3

0.4

J.R. Lobry & A.B. Dufour

Premier facteur
1.0
q q q q qq q q q q q q qq q

Deuxime facteur
q

1.0

q q q q q q q q qq q qq q qq q q q q q q

0.5

0.5

ACM

0.0

ACM

q q qq q q

q q q

1.0

q q

0.5

q q q qq qq q

0.0

q q qq q qq q q q

0 ACP

0 ACP

Les r esultats sont tr` es comparables : lACM retrouve les m emes structures que celles fournies par lACP, ce qui est rassurant car on naurait pas aim e passer ` a c ot e dune structure aussi forte. Examinons le premier plan factoriel :
scatter(acm, col = rep(c("black", "red3", "darkblue"), 2))
altit
q q

deniv
q q

cloiso
q q

q q q q q q q

q q q q

q q q q q q q q q q q q q q q

2
q q q q q q q q q

3
q q q q q q q

1
q

2
q q q q

q q

3
q q q q q q q q

q q q

1
q q

q q

2
q q q q q q q q

1
q q q

q q

3
q q q q q q q q

q q q

domain
q q

boise
q q

hetra
q q

2
q q q q q q q q q q q q q q

q q q q

2
q q q

q q q

q q q q q q

2
q q q q q q

q q q q

q q

q q

q q

1 3
q q q q q q q q q q

3
q q

q q q q q q q q q

1
q

q q

3
q q q

1
q q q q q q q q q q

q q

q q

favor
q q

inexp
q q

q q q q q q q

q q

3
q q q q q q q q q q

q q q

3
q q q q q q q q q

q q q q

2
q q q q q q

1
q

1
q q q q q q q q

q q q

q q q q

Le m eme plan factoriel est r ep et e autant de fois quil y a de variables dans le tableau de d epart, ici 8. Sur chaque plan il y a 38 points, correspondant aux 38 r egions analys ees. Pour faciliter linterpr etation on repr esente, variable par variable, la modalit e prise par chaque individu avec un code couleur et une ellipse r esumant la dispersion des points. On voit par exemple que pour la variable altit le premier facteur oppose les r egions ayant la modalit e 1 (faible altitude) aux r egions ayant la modalit e 3 (altitude el ev ee). Examiner soigneuseLogiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 11/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

ment le premier plan factoriel variable par variable. Retrouve-t-on les r esultats de lACP ? Que pouvez-vous dire de la variable domain ? Lobjectif de lACM est dobtenir des scores num eriques des individus qui maximisent les pourcentages de variance expliqu ee, en moyenne, pour toutes les variables qualitatives (rapport de corr elation). Il est donc int eressant dexaminer ces rapports de corr elation entre les variables de d epart et les facteurs interpr et es. Faites le lien avec les plans factoriels.
par(mfrow = c(1, 2), mar = c(5, 4, 2, 0)) barplot(acm$cr[, 1], horiz = TRUE, xlim = c(0, 1), names.arg = colnames(ours[1:8]), las = 1, main = "Premier facteur", col = "lightblue", xlab = "Rapport de corr elation") barplot(acm$cr[, 2], horiz = TRUE, xlim = c(0, 1), names.arg = colnames(ours[1:8]), las = 1, main = "Deuxi` eme facteur", col = "lightblue", xlab = "Rapport de corr elation")

Premier facteur
inexp favor hetra boise domain cloiso deniv altit 0.0 0.2 0.4 0.6 0.8 1.0 inexp favor hetra boise domain cloiso deniv altit 0.0 0.2

Deuxime facteur

0.4

0.6

0.8

1.0

Rapport de corrlation

Rapport de corrlation

Une autre aide ` a linterpr etation des facteurs est donn ee par la fonction score(), qui est une version univari ee des plans factoriels pr ec edents. Pour chaque variable, les individus sont positionn es sur laxe des abscisses par leur score sur laxe factoriel consid er e et sur laxe des ordonn ees par le score de la modalit e quils portent. Le score dune modalit e nest rien dautre que la moyenne des scores des individus portant cette modalit e, ce qui est mis en evidence par la premi` ere bissectrice dans les graphiques suivants.
score(acm, xax = 1)

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 12/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

1.5

1.5

1.0

1.0

0.5

0.5

1 score 2

0.5

1.0

1.5

altit

deniv

cloiso
2

0.0

0.0

score

score

0.0

3 1.0

1.0

2.0

2.0

1.0

2.0

1.0

0.0 score

1.0

2.0

1.0

0.0 score

1.0

2.0 2.0

1.0

0.0 score

1.0

1.5

1.5

1.0

1.0

1.0

1.5

domain

boise

hetra

1 0.5 0.5 2 score 3 2 0.5 score 0.0

0.0

score

0.0

1 1.0 1.0 3 1.0 3

2.0

2.0

2.0

1.0

0.0 score

1.0

2.0

1.0

0.0 score

1.0

2.0 2.0

1.0

0.0 score

1.0

1.5

1.0

1 0.5 0.5 1

0.0

score

score

0.0

1.0

1.5

favor

inexp

2 1.0 3

1.0

2.0

2.0

1.0

0.0

1.0

2.0 2.0

1.0

0.0

1.0

En etudiant egalement le r esultat de score(acm, xax = 2), faites le lien avec les plans factoriels.

4.3

Une di erence importante en lACP et lACM

La grande similitude des r esultats ici entre lACP et lACM ne doit pas masquer une di erence fondamentale entre les deux m ethodes : dans lACM, lordre des modalit es est perdu. Comme cela correspond ` a une perte dinformation, on pourrait penser que cest un d esavantage de lACM. Ce nest pas forc ement le cas, et nous allons lillustrer avec une petite exp erience o` u nous m elangeons sauvagement les modalit es des donn ees de d epart.
melanger <- function(facteur) { new <- factor(facteur) levels(new) <- sample(levels(new)) return(new) } ours.rnd <- as.data.frame(apply(ours[, 1:8], 2, melanger)) summary(ours[, 1:8]) altit deniv cloiso domain boise hetra favor inexp 1: 8 1:13 1:12 1: 9 1:10 1:19 1:15 1:20 2:17 2:14 2: 4 2:13 2:15 2: 5 2:12 2:10 3:13 3:11 3:22 3:16 3:13 3:14 3:11 3: 8 summary(ours.rnd) altit deniv cloiso domain boise hetra favor inexp 1: 8 1:13 1:12 1: 9 1:13 1:19 1:15 1:20 2:13 2:11 2:22 2:13 2:15 2: 5 2:11 2:10 3:17 3:14 3: 4 3:16 3:10 3:14 3:12 3: 8

Que donne lACP sur ces donn ees m elang ees ?


scatter(dudi.pca(apply(ours.rnd[, 1:8], 2, as.numeric), scan = FALSE))

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 13/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

Eigenvalues

d=1

altit
19 34 37 17 26 36 13 27 12 9 4 15 38 32 3 30 35 28 1 31 33 25 22 20 21 29

hetra

domain 23

24

6 10 5

16 18

cloiso
2 14

11

deniv

boise

favor inexp

Nous avons compl` etement d etruit la structure initiale des donn ees, il nest pas sans cons equence de d etruire lordre dune variable ordonn ee. Que donne lACM sur les donn ees m elang ees ?
scatter(dudi.acm(ours.rnd, scan = FALSE), col = rep(c("black", "red3", "darkblue"), 2))
altit
q q q q q q q q q q q q q

deniv
q q q q q q q q q q q q q q

cloiso
q q q q q q q q q q q q

q q q q q q

2
q

1
q q q q q q

q q q q q q q

q q q q q

1
q q q q q q q

2
q

q q

q q

3
q q q q

2
q q q

q q

q q q q q

3
q q

domain
q q q q q q q q q q q

boise
q q q q q q q q q q q q q q q q q q q q q q q q q q q

hetra
q q q q q q q q q q q q q q q q q

3
q q q q q q

3
q q q q q

q q q

3
q

q q q

1
q q q q q

2
q q q q

q q q q

q q q q q

2
q

2
q q

favor
q q q q q q q q q q q q q q q q q q q q q q q

inexp
q q q q q q q q q q q q q q q q q q q q q q q q q

1 2
q q q

1
q

q q q

2
q q q q

3
q

q q

Aux op erations de sym etrie pr` es, on retrouve exactement les m emes r esultats que pour lACM de d epart. On a bien entendu perdu la signication des modalit es, mais la structure du nuage de point est inchang ee. Il est sans cons equence (autre que s emantique !) de changer les noms dune variable nominale. Si la relation dordre entre les modalit es des variables etudi ees nest pas absolue, comme cest ici le cas avec la variable domain, il peut etre int eressant de privil egier lACM ` a lACP pour ne pas tenir compte dun ordre que lon sait ne pas etre absolu. Les graphiques suivants avec des donn ees simul ees devraient vous aider ` a comprendre cette di erence entre lACP et lACM.

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 14/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

set.seed(1) x <- rep(1:3, 10) x2 <- rep(c(2, 1, 3), 10) y <- rnorm(30, c(10, 20, 30)) pltr2 <- function(x, y) { r2 <- cor(x, y)^2 plot(x, y, xaxt = "n", las = 1, main = bquote(r^2 == .(round(r2, 3)))) axis(1, at = 1:3) abline(lm(y ~ x), col = "red") } plteta2 <- function(x, y) { x.q <- factor(x) var.n <- function(x) sum((x - mean(x))^2)/length(x) vartot <- var.n(y) moys <- by(y, x.q, mean) varinter <- var.n(moys) e2 <- (varinter/vartot)^2 plot(x, y, xaxt = "n", las = 1, main = bquote(eta^2 == .(round(e2, 3))), xlim = c(min(x), max(x) + 1)) axis(1, at = 1:3) axis(1, "inter", at = 4, col.axis = "blue") points(rep(4, 3), moys, pch = 19, col = "blue") segments(1:3, moys, rep(4, 3), moys, col = "blue") } par(mfrow = c(2, 2), mar = c(4, 4, 3, 1)) pltr2(x, y) pltr2(x2, y) plteta2(x, y) plteta2(x2, y)

r2 = 0.988
30 25 20 15 10
q q q q q q q q q q q q q q q q q

r2 = 0.248
30 25 20 15 10
q q q q q q q q q q q q q q q q q

2 x

2 x

2 = 0.976
30 25 20 15 10
q q q q q q q q q q q q q q q q q q q

2 = 0.976
30 25 y
q q q q q q q

20 15 10

q q q q q q

q q q q q q

2 x

inter

2 x

inter

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 15/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

J.R. Lobry & A.B. Dufour

R ef erences
[1] G. Erome. Lours brun dans les Alpes fran caises. Historique de sa disparition. Centre Ornithologique Rh one-Alpes, Villeurbanne, 1989.

Logiciel R version 2.11.1 (2010-05-31) tdr521.rnw Page 16/16 Compil e le 2010-11-24 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/pdf/tdr521.pdf

You might also like