Professional Documents
Culture Documents
En médecine, par exemple pour détecter les groupes à hauts risques cardiaques à partir
de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents
familiaux, etc.
Dans le domaine bancaire, lorsque l’on veut évaluer la fiabilité d’un demandeur de crédit
à partir de ses revenus, du nombre de personnes à charge, des encours de crédits qu’il
détient, etc.
En biologie, lorsque l’on veut affecter un objet à sa famille d’appartenance à partir de ses
caractéristiques physiques. Les iris de Sir Ronald Fisher — qui est à l'origine de cette
méthode — en est un exemple, il s’agit de reconnaître le type d’iris (setosa, virginica, et
versicolor) à partir de la longueur/largeur de ses pétales et sépales.
L’analyse discriminante est une technique connue et reconnue, elle est décrite à peu près
de manière identique par les différentes communautés du traitement de données :
N° X1 X2 Y
1 1 3 A
2 6 5 B
3 8 3 B
4 4 4 A
Approches différentes
On distingue généralement deux grandes approches :
L’analyse discriminante peut être une technique descriptive.
On parle dans ce cas d’analyse factorielle discriminante (ou analyse discriminante descriptive).
L’objectif est de proposer un nouveau système de représentation, des variables cachées formées à
partir de combinaisons linéaires des variables prédictives, qui permettent de discerner le plus
possible les groupes d’individus. En ce sens, elle se rapproche de l’analyse factorielle car elle permet
de proposer une représentation graphique dans un espace réduit, plus particulièrement de l’analyse
en composantes principales calculée sur les centres de gravité conditionnels des nuages de points
avec une métrique particulière.
Il s’agit dans ce cas de construire une fonction de classement (règle d’affectation, …) qui permet de
prédire le groupe d’appartenance d’un individu à partir des valeurs prises par les variables
prédictives. En ce sens, cette technique se rapproche des techniques supervisées en apprentissage
automatique telles que les arbres de décision, les réseaux de neurones, …
Analyse discriminante
Analyse discriminante descriptive
L’analyse discriminante descriptive (analyse factorielle discriminante, canonical
discriminant analysis en anglais) est une technique de statistique exploratoire qui travaille
sur un ensemble de n observations décrites par p variables, répartis en k groupes.
•L’analyse discriminante descriptive est une technique descriptive car elle propose une
représentation graphique qui permet de visualiser les proximités entre les observations,
appartenant au même groupe ou non.
•C’est aussi une technique explicative car nous avons la possibilité d’interpréter les axes
factoriels, combinaisons linéaires des variables initiales, et ainsi comprendre les
caractéristiques qui distinguent les différents groupes.
L’éloignement entre les groupes, entre les centres de gravité des groupes, est traduit
par la matrice de variance co-variance inter-groupes (à un facteur près)
La dispersion totale du nuage est obtenue par la matrice de variance co-variance totale V.
Le premier axe factoriel sera donc défini par le vecteur directeur tel que l'on
maximise la quantité
La réponse nous est directement fournie par le calcul des valeurs propres et vecteurs
propres de la matrice :
Résultat d’une ACP
Inertie d’un nuage de points
Mesures de ressemblance
Une distance est une dissimilarité qui vérifie en plus l'inégalité triangulaire
Inertie Intra et Inter classes
Inertie Intra et Inter classes
Inertie Intra et Inter classes
Inertie Intra et Inter classes
Soit une partition en k classes de
poids pi.
Soit T={Mi=(xi, yi), i=1,…,14} un nuage de points du plan (figure exo3), chacun étant
pondéré d’un poids pi.