Professional Documents
Culture Documents
Rivières
Ayoub BOKHABRINE
TABLE DES MATIERES
Maîtrise en mathématiques et informatique appliquées ............................................................................. 1
EXERCICE 1 : .................................................................................................................................................. 4
Solution EXERCICE 1 : .................................................................................................................................... 4
a) Calcule de la matrice X des Variables Centrées : .............................................................................. 4
b) Calcule de la matrice : = 𝑋𝑇𝑋 ......................................................................................................... 5
c) En déduire la troisième valeur propre, calcule du troisième vecteur propre u3 ............................. 6
d) Le pourcentage d’inertie expliquée par les deux premiers axes factoriels : .................................... 7
e) Représentation du nuage des points-individus dans le plan ............................................................ 7
f) Situer les membres G, H, I parmi les individus A,...,F sur le graphique précédent. ...................... 8
EXERCICE 2 : ................................................................................................................................................ 11
a) Démonstration du 𝑚𝑗𝑗′ a les mêmes marges que le tableau binaire 𝑘𝑗𝑗′ : .................................... 11
b) Démonstration qu’il y a une indépendance conditionnellement à T entre J1 et J2, alors 𝑚𝑗𝑗′ est
égal à 𝑘𝑗𝑗′ : .............................................................................................................................................. 12
c) Indépendance conditionnelle moyenne entraîne t’elle l’indépendance conditionnelle ............... 13
d) L’analyse des correspondances du tableau J1 × J2 ......................................................................... 13
e) Indiquer ce que permet d’étudier l’analyse des correspondances binaires de ce tableau. ........... 13
EXERCICE 3 : ................................................................................................................................................ 14
a) L’ACM de Z est équivalente à celle de 𝐵 = 𝑍𝑡𝑍 ............................................................................. 14
b) L’ACM de Z est équivalente à celle de 𝑍2𝑇𝑍1 ................................................................................ 15
EXERCICE 4 .................................................................................................................................................. 16
SOLUTION EXERCICE 4 ................................................................................................................................ 16
a) Que conclut-on du fait que la statistique du khi-deux ................................................................... 16
b) Pourquoi cette statistique a-t-elle 45 degrés de liberté ................................................................. 16
c) Quelle proportion de l’inertie est expliquée par les deux premiers axes factoriels ....................... 16
d) Quel point-ligne est le moins bien représenté dans ce plan .......................................................... 16
e) Identifier le point-ligne qui possède la plus grande masse. ........................................................... 16
f) Identifier les points-colonnes qui affichent de plus grands cosinus carrés dans le deuxième axe
factoriel que dans le premier. ................................................................................................................. 17
g) Interpréter le graphique obtenu pour les deux premiers axes factoriels....................................... 17
h) Est-il possible de faire une analyse des correspondances multiple du jeu de données de Heuer . 17
EXERCICE 5 .................................................................................................................................................. 22
SOLOTION EXERCICE 5 ................................................................................................................................ 22
a) La matrice de corrélation : .............................................................................................................. 22
Exercice 6 .................................................................................................................................................... 26
Solution EXERCICE 6 .................................................................................................................................... 26
Exercice 7 .................................................................................................................................................... 26
SOLUTION EXERCICE 7 ................................................................................................................................ 26
a) Construire la Matrice de similarité basé sur l’indice de Jaccard pour les quatre individus............ 26
b) Classifier ces données en vous basant sur le critère du saut minimal............................................ 27
c) La méthode du saut maximale ........................................................................................................ 28
EXERCICE 8 .................................................................................................................................................. 29
Solution EXERCICE 8 .................................................................................................................................... 30
TABLE DE FIGURE
Figure 1 représentation des individus .......................................................................................................... 8
Figure 2 représentation des variables ........................................................................................................ 10
Figure 3 Table Contingence ........................................................................................................................ 17
Figure 4Profil de lignes ................................................................................................................................ 18
Figure 5 KHI-2 .............................................................................................................................................. 18
Figure 6 Coordonnés des lignes / Figure 7 Statistiques descriptives pour les points lignes / Figure 8
Contribution partielles ................................................................................................................................ 19
Figure 9 Inertie des points lignes / Figure 10 𝑐𝑜𝑠2 / Figure 11 Coordonnées des colonnes ...................... 19
Figure 12 Statistique descriptive pour les points des colonnes / Figure 13indices des coordonnes
contribuant le plus à l'inertie des points colonnes ..................................................................................... 20
Figure 14 Cos caré pour les points colonnes ............................................................................................... 20
Figure 15 ACP .............................................................................................................................................. 21
Figure 16 Tableau de Burt ........................................................................................................................... 21
Figure 17 matrice de corrélation ................................................................................................................ 22
Figure 18 Valeurs propres de la matrice de corrélation ............................................................................ 23
Figure 19 Vecteurs Propres ........................................................................................................................ 23
Figure 20 Diagramme des valeurs propres ................................................................................................. 24
Figure 21 facteurs retenus .......................................................................................................................... 24
Figure 22 ..................................................................................................................................................... 25
Figure 23 Classification avec la méthode du saut maximal ........................................................................ 30
Figure 24 Classification avec Ward ............................................................................................................. 30
Figure 25 Classification avec saut minimal ................................................................................................. 31
EXERCICE 1 :
Trois films désignés par I, II et III ont été notés par un jury formé de 6 membres désignés par A,
B, C, D, E, F. Les résultats ont été regroupés dans la matrice 𝑅 = (𝑟𝑖𝑗) 1≤𝑖≤6
1≤𝑗≤3
Trois nouveaux membres du jury désignés par G, H, I communiquent leurs notes une fois
l’analyse faite ; elles sont indiquées dans la matrice 𝑇 = (𝑡𝑖𝑗) 1≤𝑖≤3
1≤𝑗≤3
𝐴 8 1 0
𝐵 4 6 5
𝐺 8 1 3
𝐶 6 8 7
𝑅= 𝑇 = 𝐻 (1 2 1)
𝐷 10 4 7
𝐼 4 0 0
𝐸 8 2 5
𝐹(0 3 6)
Solution EXERCICE 1 :
a) Calcule de la matrice X des Variables Centrées :
8 + 4 + 6 + 10 + 8 + 0
𝑥1 = =6
6
1+6+8+4+2+3
𝑥2 = =4
6
0+5+7+7+5+6
𝑥3 = =5
6
2 −3 5
−2 2 0
2 −2 0 4 2 −6
𝑇 0 4 2
∑ = 𝑋 𝑋 = (−3 2 4 0 −2 −1)
4 0 2
−5 0 2 2 0 1
2 −2 0
(−6 −1 1)
64 −8 −8
= (−24 34 22 )
−8 22 34
64 − 𝜆 −8 −8
det(𝛴 − 𝜆𝐼) = | −24 34 − 𝜆 22 | = 0
−8 22 34 − 𝜆
det(𝛴 − 𝜆𝐼) = −λ3 + 132 × λ2 − 4896 × λ + 41472
𝑑𝑒𝑡(𝛴 − 𝜆𝐼) = −(𝜆 − 12) × (𝜆 − 48) × (𝜆 − 72)
Donc : 𝜆1 = 72, 𝜆2 = 48 et 𝜆3 = 12
Calcule des Vecteurs propres :
𝛴𝑢1 = 𝜆1 𝑢1
𝛴𝑢2 = 𝜆2 𝑢2
Pour le Vecteur 𝑢1 :
On sait que 𝜆1 = 72 :
𝑥 64 − 72 −8 −8 𝑥 0
(𝛴 − 𝜆1 𝐼 ) (𝑦) = ( −24 34 − 72 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 72 𝑧 0
−8𝑥 − 8𝑦 − 8𝑧 = 0
⟺ {−8𝑥 − 38𝑦 + 22𝑧 = 0
−8𝑥 + 22𝑦 − 38𝑧 = 0
𝑥 = −2𝑧
⟺ {
𝑦=𝑧
2
Donc le Vecteur propre associe à 𝜆1 est : 𝑢1 = (−1)
−1
Pour le Vecteur 𝑢2 :
On sait que 𝜆2 = 48 :
𝑥 64 − 48 −8 −8 𝑥 0
(𝛴 − 𝜆1 𝐼 ) (𝑦) = ( −24 34 − 48 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 48 𝑧 0
16𝑥 − 8𝑦 − 8𝑧 = 0
⟺ {−8𝑥 − 14𝑦 + 22𝑧 = 0
−8𝑥 + 22𝑦 − 14𝑧 = 0
⟺ {𝑥 = 𝑦 = 𝑧
1
Donc le Vecteur propre associe à 𝜆1 est : 𝑢2 = (1)
1
On sait que :
𝑡𝑟(𝛴) =𝜆1 + 𝜆2 + 𝜆3
On a 𝜆1 = 72 𝑒𝑡 𝜆2 = 48
𝑥 64 − 12 −8 −8 𝑥 0
(𝛴 − 𝜆3 𝐼 ) (𝑦) = ( −24 34 − 12 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 12 𝑧 0
52𝑥 − 8𝑦 − 8𝑧 = 0
⟺{
−8𝑥 + 22𝑦 + 22𝑧 = 0
𝑥 = 0
⟺{
𝑦 = −𝑧
0
Donc le Vecteur propre associe à 𝜆3 est : 𝑢2 = (−1)
1
𝜆𝑖
∑ 𝑖 𝜆𝑖
𝜆1 + 𝜆2
𝑣𝑎𝑟 = = 0.9090
𝜆1 + 𝜆2 + 𝜆3
Les deux premiers facteurs représentent 90.91% de l'inertie total donc on peut effectuer notre
analyse en se focalisant sur les deux axes
2 1
√6 √3
−1 1
|𝑢1 | = 𝑒𝑡 |𝑢2 | =
√6 √3
−1 1
( √6 ) (√3)
On a:
2 −3 5 2 4.89898
−2 2 0 √6 −2.44949
0 4 2 −1 −2.44949
𝑌1 = 𝑋𝑢1 =
4 0 2 √6 2.44949
−1
2 −2 0 2.44949
(6 −1 1) ( √6 ) (−4.89898)
1
2 −3 5 −3.46410
−2 2 0 √3 0
0 4 2 1 3.46410
𝑌2 = 𝑋𝑢2 =
4 0 2 √3 3.46410
2 −2 0 1 0
(6 −1 1) ( 3) (−3.46410)
√
f) Situer les membres G, H, I parmi les individus A,...,F sur le graphique précédent.
1+2+0
𝑥2 = = 3⁄3
3
3+1+0
𝑥3 = = 4⁄3
3
Donc la matrice T va devenir
4
8 − 13⁄3 0 3−
3
4
1 − 13⁄3 1 1−
3
13⁄
4
(4 − 3 −1 0 − )
3
2 1
√6 √3
−1 1
|𝑢1 | = 𝑒𝑡 |𝑢2 | =
√6 √3
−1 1
( √6 ) (√3)
On a:
4 2
8 − 13⁄3 0 3−
3 √6
2.31341
4 −1
𝑦1 = 1 − 13⁄3 1 1− = (−2.99382)
3 √6 0.680414
13⁄
4 −1
(4 − 3 −1 0 − )
3 ( √6 )
4 1
8 − 13⁄3 0 3− √3
3.0792 3
13 4 1
𝑦2 = 1 − ⁄3 1 1 − 3 √3
= ( −1.5396 )
4 −1.5396
4 − 13⁄3 −1 0 −
1
( 3) (√3)
Donc la matrice va être
2.31341 3.0792
(−2.99382 −1.5396)
0.680414 −1.5396
Figure 2 représentation des variables
EXERCICE 2 :
On considère un ensemble d’individus I, de cardinal n sur lequel sont définis, d’une part deux
variables qualitatives dont les ensembles de modalités sont notés J1 et J2, et d’autre part une
variable qualitative dont l’ensemble des modalités est noté T. Le croisement de J1, J2 et T
définit un tableau ternaire dont le terme général est noté kjj0t. Les marges binaires de ce tableau
sont notées kjj0 . (sur J1 × J2), kj.t et k.j0t et les marges unaires sont notées kj.., k.j0 . et k..t.
Son effectif total est égal au nombre d’individus n. Soit mjj0 un tableau J1 × J2 défini de la
façon suivante :
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
𝑚𝑗𝑗 ′ = ∑𝑡 ∈𝑇 𝑘..𝑡 , 𝑗 ∈ 𝐽1 , 𝑗 ′ ∈ 𝐽2
𝑘..𝑡 𝑘..𝑡
𝑚𝑗. = ∑ 𝑚𝑗𝑗′
𝑗′∈𝐽2
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
𝑚𝑗𝑗′ = ∑ ∑ 𝑘..𝑡
𝑗′∈𝐽2 𝑡∈𝑇
𝑘..𝑡 𝑘..𝑡
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑∑
𝑘..𝑡
𝑗′∈𝐽2 𝑡∈𝑇
𝑘𝑗.𝑡
=∑ ∑ 𝑘.𝑗′𝑡
𝑘..𝑡
𝑡∈𝑇 𝑗′∈𝐽2
= ∑ 𝑘𝑗.𝑡
𝑡∈𝑇
= 𝑘𝑗.
𝑚𝑗. = ∑ 𝑚𝑗𝑗′
𝑗′∈𝐽1
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑ ∑ 𝑘..𝑡
𝑗′∈𝐽1 𝑡∈𝑇
𝑘..𝑡 𝑘..𝑡
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑∑
𝑗′∈𝐽1 𝑡∈𝑇
𝑘..𝑡
𝑘𝑗.𝑡
=∑ ∑ 𝑘𝑗.𝑡
𝑘..𝑡
𝑡∈𝑇 𝑗′∈𝐽2
𝑘.𝑗′𝑡
=∑ 𝑘
𝑘..𝑡 ..𝑡
𝑡∈𝑇
= ∑ 𝑘.𝑗′𝑡
𝑡∈𝑇
= ∑ 𝑘𝑗𝑗′𝑡
𝑡∈𝑇
= 𝑘𝑗𝑗′
c) Indépendance conditionnelle moyenne entraîne t’elle l’indépendance
conditionnelle
Qui nous représente que pour chacun des points, on réalise une analyse de la moyenne.
Calcule de ACM de Z :
𝒁
𝑭= , ∑𝒏𝒊=𝟏 ∑𝒑𝒋=𝟏 𝒇𝒊𝒋 = 𝟏
𝒏𝑸
Soit 𝐷𝑛 la matrice diagonale des profils ligne et 𝐷𝑝 celle des profils colonne :
𝑫𝒏 = 𝒅𝒊𝒂𝒈(𝒇𝒊. ) et 𝑫𝒑 = 𝒅𝒊𝒂𝒈(𝒇.𝒊 )
𝑫 𝒅𝒊𝒂𝒈(𝒁𝑻𝒊 𝒁)
𝑫𝒏 = =
𝒏𝑸 𝒏𝑸
Aussi que 𝜆𝑗 sont les valeurs propres de 𝐹 𝑇 𝐷𝑛−1 𝐹𝐷𝑝−1 associées aux vecteurs
propres 𝑢𝑗 , Donc on retient :
𝐹 𝑇 𝐷𝑛−1 𝐹𝐷𝑝−1 𝑢𝑗 = 𝜆𝑗 𝑢𝑗
−1
𝑍𝑇 𝑍
𝑛𝑄𝐷 𝑛 φ = 𝜆𝑗 φ𝑗
𝑛𝑄 𝑛𝑄 𝑗
1 −1 𝑇
𝐷 𝑍 𝑍φ𝑗 = 𝜆𝑗 φ𝑗
𝑄
Calcule de ACM de B :
𝐁
Prennent B est Symétrique Donc : 𝐅 = 𝐧𝐐𝟐
𝑫
𝑫𝒑 = 𝑫𝒏 =
𝒏𝑸
Sachant que φ′𝑗 = 𝐷𝑛−1 𝑣𝑗
Aussi 𝜑 ′ = 𝑛𝑄𝐷−1 𝑣𝑗
𝐵 𝐵𝑇
𝑛𝑄𝐷−1 𝑛𝑄𝐷 −1
φ′ = 𝜆′𝑗 φ′𝑗
𝑛𝑄 2 𝑛𝑄 2 𝑗
1 −1 −1
𝐷 𝐵𝐷 φ𝑗 = 𝜆𝑗2 φ𝑗
𝑄2
𝜆𝑗2 = 𝜆′𝑗
{ , 1 ≤ 𝑗 ≤ 𝑝.
φ𝑗 = φ′𝑗
1 + √𝜆𝑗′
𝜆𝑗 =
2
De ce fait l’ACM de Z est équivalente à celle de 𝑍2𝑇 𝑍1
EXERCICE 4
Le tableau suivant est tiré d’un ouvrage de Gerhild Heuer intitulé «Selbstmord bei Kindern und
Jugendlichen», publié chez Ernst Klett Verlag (Stuttgart) en 1979. On y trouve une compilation
de 48 961 suicides survenus en Allemagne de l’Ouest sur une longue période de temps. Les
données sont ventilées en fonction du sexe et de l’âge de la victime, ainsi que de la cause du décès.
SOLUTION EXERCICE 4
a) Que conclut-on du fait que la statistique du khi-deux
Dans une khi-deux, c’est toujours (n-1)(m-1) degrés avec n et m modalités donc
(6-1) (10—1) = 5*9 = 45 Ce qui explique les 45 degrés de liberté.
c) Quelle proportion de l’inertie est expliquée par les deux premiers axes factoriels
Le profil ligne le moins bien représenté est P : F ∗ 10−20 parce que sa qualité est la plus faible
Oui il est possible de faire une des correspondances multiples du jeu de données d’Heure il faut
faire le tableau de Burt
Figure 5 KHI-2
Figure 6 Coordonnés des lignes / Figure 7 Statistiques descriptives pour les points lignes / Figure 8 Contribution partielles
Figure 9 Inertie des points lignes / Figure 10 𝑐𝑜𝑠 2 / Figure 11 Coordonnées des colonnes
Figure 12 Statistique descriptive pour les points des colonnes / Figure 13indices des coordonnes contribuant le plus à l'inertie
des points colonnes
SOLOTION EXERCICE 5
a) La matrice de corrélation :
Le critère de Kaiser nous conduit à sélectionner un seul axe, qui retient 77% de l’inertie totale. L’axe
2 retient tout de même 11% de l’inertie, ce qui n’est pas négligeable, et qui conduit à un taux d’inertie
expliquée de 89%, ce qui est un très bon résultat. Il peut être donc intéressant de l’étudier aussi. Nous
le retiendrons si nous pouvons l’interpréter
On sait que les variables contribuant le plus à la formation de l’axe 1 sont celles dont les
coordonnées sur cet axe sont proches de 1 en valeur absolue. Pour repérer les contributions
significatives, PAA et VIO sont très proches de la contribution moyenne, on les intègrera
donc dans l’interprétation de l’axe si elles vont dans le sens de l’interprétation que l’on
peut en faire, sans elles.
L’axe 1 oppose les individus consommant du pain ordinaire, des légumes secs (et
éventuellement du vin ordinaire) à ceux qui consomment du raisin, du vin (éventuellement
du pain) plus sophistiqué et des plats préparés.
L’axe 1, et donc la première composante principale, mesure la répartition entre aliments
ordinaires bon marchés et aliments plus recherchés.
Exercice 6
Montrer que dans la décomposition de la somme de carrés due à Huygens qui intervient en
analyse discriminante, le terme général de la matrice B de variation inter-groupes s’exprime sous
la forme
Solution EXERCICE 6
On sait que S = W + B,
Donc 𝑠𝑖𝑗 = 𝑊𝑖𝐼𝑗+ 𝐵𝐼𝑗
𝑛1 𝑛2
Dans le cas ou Q=2 et en utilisant 𝑦𝑗 = 𝑦1 + 𝑦2
𝑛 𝑛
2
Exercice 7
1 1 0 1
1 0 0 0
On a la matrice T = ( )
0 1 1 0
0 1 1 1
SOLUTION EXERCICE 7
a) Construire la Matrice de similarité basé sur l’indice de Jaccard pour les quatre
individus
+ total
-
I a a+b
+ b c+d
c
- d
Total a+c a+b+c+d
b+d
On sait que l’indice de Jacard est :
𝑎
𝑎+𝑏+𝑐
Similarité entre Variables Indice de Jacard
S-→ (1,2) 1 1 0 1 1
( ) 𝑠(1,2) =
1 0 0 0 3
S-→ (1,3) 1 1 0 1 1
( ) 𝑠(1,3) =
0 1 1 0 4
S-→ (1,4) 1 1 0 1 1
( ) 𝑠(1,4) =
0 1 1 1 2
S-→ (2,3) 1 0 0 0 𝑠(2,2) = 0
( )
1 0 0 0
S-→ (2,4) 1 0 0 0 𝑠(2,4) = 0
( )
0 1 1 0
S-→ (3,4) 0 1 1 0 2
( ) 𝑠(3,2) =
0 1 1 1 3
On obtient :
1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0 3
1)
On a
1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0
3
1)
2
On va commencer par 𝑠(3,4) = 3 par ce que c’est la plus grande donc la première partition
𝑆 = {{1]{2]{3; 4]}
1 1
1 3 2
1
Donc : 1 0
3
1
0 1
(2 )
Avec:
1
𝑠(1, 3.4) = 𝑚𝑎𝑥(𝑠(1, 3), 𝑠(1, 4)) =
2
𝑠(2, 3.4) = 𝑚𝑎𝑥(𝑠(2, 3), 𝑠(2, 4)) = 0
1
Les classe les plus similaires sont {1} 𝑒𝑡 {3,4} avec 𝑠(1, 3.4) = donc :
2
1
1
( 2)
1
1
2
1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0
3
1)
𝑎𝑣𝑒𝑐 ∶
1
𝑠(1, 2.4) = min(𝑠(1, 2), 𝑠(1, 4)) =
3
Et
Les classes les moins similaires sont : {3 }𝑒𝑡 {2,4 } avec 𝑠(1, 3.4) = 0 donc la partition
devient {{1}, {2,3,4}}.
1
(1 4)
1
EXERCICE 8
À l’aide de l’analyse discriminante et de méthodes de classification appropriées, analyser le
fichier de données représentant deux classes imbriquées dont le programme de simulation SAS
data concave;
keep x y;
do i=1 to 100;
a=i*0.0628319;
x=cos(a)+(i>50)+rannor(7)*0.1 ; y=sin(a)+(i>50)*0.3+rannor(7)*0.1 ;
output;
end;
run;
Solution EXERCICE 8