You are on page 1of 32

Pr.

Abdelouahid Lyhyaoui

ENSA de Tanger 2006- Data Mining


07
CHANGEMENT DANS L’ENVIRONEMENT DES
ENTREPRISES
Saturation des marchés
Nouvelles stratégies de relation entre clients et
entreprises
Changements socio-économiques
Apparition de nouveaux compétiteurs

Nécessité de réévaluer les méthodes traditionnelles de


négoce et la recherche d ’une réponse aux changement dans
l ’environnement des entreprises

ENSA de Tanger 2006- Data Mining 2


07
CIBLE SUR LE CLIENT

Quel est le profil du client?


(CONCESSION DE CRÉDIT)

Quel profil de client cibler lors d’une campagne de


marketing ? (MARKETING SEGMENTÉ)

Quels clients sont susceptibles de réagir à une promotion


déterminée ?

Quel est le profil des clients de longue durée ?

ENSA de Tanger 2006- Data Mining 3


07
CIBLE SUR LA CONCURRENCE

Prédiction de nouvelles stratégies du négoce


concurrentiel
Prédiction des mouvements tactiques de
compétition locale
TYPES DE PROBLÈMES
Clustering
Classification Séquençage
Estimation Prédiction
TOUS SONT DESTRAITEMENTS DE DONNEES:

DECISION ET/OU ESTIMATIÓN


ENSA de Tanger 2006- Data Mining 4
07
OUI/NON (COMBIEN)

• Choix d’une action (ou d’une stratégie) d’investissement

•Détection d’une opération frauduleuse

•Prédiction du changement de devises

•Prédiction de la consommation

•Estimation des bénéfices de l’opération

•Détermination du taux d’intérêt pour un prêt donné


ENSA de Tanger 2006- Data Mining 5
07
MOTIVATION INFORMATIQUE (I)

Le développement des moyens informatiques de


stockage (bases de données) et de calcul permet le
traitement et l’analyse d’ensembles de données très
volumineux.

Le perfectionnement des interfaces offre aux


utilisateurs, statisticiens ou autres, des possibilités de
mise en œuvre très simples des outils logiciels.

ENSA de Tanger 2006- Data Mining 6


07
MOTIVATION INFORMATIQUE (II)

• Le développement de nouvelles méthodes


algorithmiques (réseaux de neurones) et outils
graphiques, conduit au développement et à la
commercialisation de logiciels intégrant un sous-
ensemble de méthodes statistiques et algorithmiques
sous la terminologie de Data Mining.

ENSA de Tanger 2006- Data Mining 7


07
PRINCIPALES APPLICATIONS DU DM :
MARKETING

• Quel profil de client cibler lors d’une campagne


marketing ?

•Quels clients sont susceptibles de réagir à une


promotion déterminée ?

•Quel est le profil des clients de longue durée ?

•Quels produits proposer en achats groupés ?

ENSA de Tanger 2006- Data Mining 8


07
PRINCIPALES APPLICATIONS DU DM :
FINANCES
•Quel est le profil des clients non rentables ?
•Quels facteur de risque associer à un demandeur de crédit ?
•Détection d’un usage frauduleux d’une carte de crédit ?
•Quels produits financiers proposer à quels clients ?
•Quels clients risquent de clôturer prochainement leur
compte ?
•Comment détecter une déclaration de sinistre frauduleuse ?
•Comment détecter une faillite prochaine ?
ENSA de Tanger 2006- Data Mining 9
07
PRINCIPALES APPLICATIONS DU DM :
TÉLÉCOMMUNICATIONS

•Quels clients sont susceptibles de nous quitter ?

•Quel est le profil des clients très rentables, et des clients


pas ou peu rentables ?
•Quels produits offrir à quels clients ?

•Comment détecter si une carte a été volée en fonction


de son utilisation ?
•Quel est le profil des clients avec abonnement ?
•Quel est le profil des clients non rentables ?
ENSA de Tanger 2006- Data Mining 10
07
Comment sont les problèmes de décision?

Nationalité :X1
Age :X2
Revenus :X3
Oui-Non?
....

ENSA de Tanger 2006- Data Mining 11


07
VIS ION AN ALYTIQU E

H1
D1

Observation
Observation zz “Decideur”
“Decideur”
D0
H0
Données Decision

ENSA de Tanger 2006- Data Mining 12


07
¿Comment sont les problèmes d’estimation?

Prédiction de la bourse:

Hier Aujourd'hui Demain

ENSA de Tanger 2006- Data Mining 13


07
VISION ANALYTIQUE

x z Estimateur x
Observation

Donné es Estimation
Valeur à estimer

ENSA de Tanger 2006- Data Mining 14


07
Machine de décision

En général
oi
zi
F(zi) (i:indique les échantillons)

Et on force

1, si H1
oi ci
0 , si H 0 ( ó 1 ) Entraînement supervisé
En minimisant un certain coût C(o,c) qui mesure ce qui
rapproche o de c, en modifiant les paramètres de la
machine w.

ENSA de Tanger 2006- Data Mining 15


07
EXEMPLE

Entreprise : banque

Activité : prêts hypothécaires

Problème : accepter ou refuser une demande de crédit ?

Solution actuelle : évaluation de la solvabilité du client sur base de


critères définis par des gestionnaires expérimentés

ENSA de Tanger 2006- Data Mining 16


07
SOLUTION : DATA MINING

Analyser les données historiques : solvabilité observée


lors des anciens crédits

crédits modèle demandes


anciens de crédit

pour prévoir la solvabilité des demandeurs de crédit

ENSA de Tanger 2006- Data Mining 17


07
DONNÉES HISTORIQUES

montant_ tx_crédit professio état_civil revenus solvabilit


c n é
1000000 9.5% enseignan M 980000 O
t
2000000 7.4% employé M 1080000 N
2500000 8.1% ouvrier C 1200000 O
2200000 5.3% cadre M 1600000 O
3000000 8.1% ouvrier M 1500000 N
1900000 6.1% prof.libér. D 2100000 O
4200000 6.9% cadre M 1800000 O

ENSA de Tanger 2006- Data Mining 18


07
APPLICATION DU MODÈLE
AUX NOUVELLES DONNÉES

montant_ tx_crédit professio état_civil revenus solvabilit


c n é
2100000 7.2% employé C 1200000
1900000 7.4% employé M 1170000
3300000 6.9% prof.lib. C 1900000
1700000 7.00% cadre M 2050000
3100000 7.3% ouvrier M 1200000
2400000 6.9% fonction. M 1100000
4000000 7.1% cadre M 1900000

ENSA de Tanger 2006- Data Mining 19


07
DATA MINING (FOUILLE DE DONNÉES)

Définition

Le Data Mining combine les techniques


d’intelligence artificielle, d’analyse statistique, de
base de données et celles de la visualisation
graphique en vue d’obtenir de l’information qui
n’est pas explicitement représentée dans les
données et susceptible d’être plus profitable que les
données de départ.

ENSA de Tanger 2006- Data Mining 20


07
QU’ ENGLOBE LE CONCEPT DE DATA MINING?

Applications:
•Segmentation du marché
•Rétention de clients •Détection de fraude
Opérations
•Classification et prédiction
•Clustering •Analyse d’associations

Techniques et algorithmes
•Réseaux de neurones artificielles
•Arbre de décision •Analyse clustering

ENSA de Tanger 2006- Data Mining 21


07
ETAPES DE DATA MINING
Détermination de l ’objectif

Préparation des données

•Sélection des données


• Pré-traitement des données
• Transformation des données

Application des modèles prédictifs

Analyse des résultats et assimilation des


connaissances
ENSA de Tanger 2006- Data Mining 22
07
DIAGRAMME DE FLUX GÉNÉRAL

Données Sélection Nettoyage Emmagasinement

BASE

Information Traitement Codage Pré-traitement

Interprétation Application Evaluation

Réinterprétation

CONAISSANCES
ENSA de Tanger 2006- Data Mining 23
07
TÉCHNIQUES ET ALGORITHMES DU
DATA MINING
(Modèles Prédictifs)

ENSA de Tanger 2006- Data Mining 24


07
ARBRES DE DECISION

On part de l’ensemble des échantillons et on les divise


pour le test
noeud
r1
1 (test 1)
r2
terminal noeud (test 2)
1 r1 2
r2
(classe 1)
terminal terminal
2 3
(classe 2) (classe 1)

ENSA de Tanger 2006- Data Mining 25


07
ARBRES DE DECISION (EXEMPLE)

Versements mens.
<1230 >=1230
solde moy. j. bon : 79%
mauvais : 21%
>420 <160
160-420
bon : 94% bon :58% nbre chèques sans prov.
mauvais : 6% mauvais : 42% >1
0-1

bon : 55% bon :21%


mauvais : 45% mauvais : 79%

ENSA de Tanger 2006- Data Mining 26


07
ARBRES DE DECISION

•Sont efficaces en temps d’exécution

•Offre une méthode intuitive pour l’analyse des résultats

•Mais tendent à se fragmenter

•Mauvaise généralisation ( surtout avec des variables


continues)
•Difficultés concernant les versions adaptatives

ENSA de Tanger 2006- Data Mining 27


07
REGLES

Se construisent (analogiquement) des règles type

si X (Y Z) - alors C

Problèmes

•Elles sont de construction difficile


•Mauvaise généralisation
•Difficultés concernant les versions
adaptatives
ENSA de Tanger 2006- Data Mining 28
07
RÉSEAUX DE NEURONES

Une des possibles machines de décision et d’estimation

Exemple MLP : Perceptron multi-couches

Sont : th
•Puissants +
•Versatiles th th
•Distribués robustes + +
Mais sont :

•d’entraînement difficile et lent


•Et difficiles à analyser z
ENSA de Tanger 2006- Data Mining 29
07
LES RÉSEAUX DE NEURONES

•Ne requièrent pas d’hypothèses « a priori »

•Extraient l’information présente dans les données

•Rapprochent de façon efficace les optima

•Peuvent aisément s’actualiser et s’améliorer

•Ne se saturent pas avec des données massives

ENSA de Tanger 2006- Data Mining 30


07
LES RÉSEAUX DE NEURONES

Mais nécessitent un modèle conceptuel professionnel

• SONT DIFICILES D ’INTERPRETER

En tout cas :

•Vaut-il mieux vendre ou comprendre totalement les vents ?

•Vaut-il mieux retenir ou comprendre totalement les


abonnés ?

ENSA de Tanger 2006- Data Mining 31


07
This document was created with Win2PDF available at http://www.win2pdf.com.
The unregistered version of Win2PDF is for evaluation or non-commercial use only.
This page will not be added after purchasing Win2PDF.

You might also like