Professional Documents
Culture Documents
DATA MINING
& STATISTIQUE DCISIONNELLE
01/05/2007
Plan du cours
01/05/2007
Technique de classement ou de
prdiction :
01/05/2007
n2
p1
p2
donnes
n3
p3
p4
n4
s(n1p1+ + nkpk)
p5
couche de sortie
n5
couche d'entre
01/05/2007
s(x) = 1 / [1 + exp(-x)]
Lchantillon
01/05/2007
La fonction logistique
Fonction Sigmode
1/(1+exp(-x))
1,2
1
0,8
0,6
0,4
0,2
0
-5
-4
-3
-2
-1
01/05/2007
p1
q1
n2
nb enfants
revenus
donnes
n3
s(n ipi)
niqi
...
n4
...
nipi
s [.s(nipi)
+ .s( niq i)]
s(niqi)
p5
n5
q5
couche cache
couche de sortie
couche d'entre
01/05/2007
sinon, il y a sur-apprentissage
01/05/2007
n2
donnes
n3
n4
n5
couche cache
couche de sortie
couche d'entre
01/05/2007
Le
01/05/2007
10
Les
01/05/2007
11
ou 2 (rseau PMC)
Un rseau n units dentre, 1 unit cache, m units
dans la couche cache et 1 unit de sortie a n.m+m poids
Il faut donc un chantillon dau moins 5(n.m+m) individus
pour lapprentissage
La valeur de m est gnralement comprise en n/2 et 2n
On a intrt diminuer n (en utilisant lACP par ex)
Pour un classement, m nombre de classes
Lchantillon dapprentissage ne doit pas tre tri selon un
ordre significatif, qui pourrait induire le rseau en erreur
Lchantillon dapprentissage doit couvrir tous les cas
01/05/2007
12
Levenberg-Marquardt
01/05/2007
13
Rtro-propagation du gradient
Quasi-Newton
Algorithmes gntiques
01/05/2007
14
Rtropropagation du gradient
01/05/2007
15
C
A
B
01/05/2007
16
Paramtres de rtropropagation
Taux
01/05/2007
17
01/05/2007
18
rseau
PMC
RBF
poids p i
centre i
nb couches caches
=1
fonction combinaison
poids
couche
k kk (voir ci-aprs)
de sortie
fonction transfert
rapidit
01/05/2007
du modle
19
k 2
( xi i )
nb de noeuds cachs
1
i =1
exp
k
2
k
2
k =1
01/05/2007
20
Solution simple
k plus nombreux
k plus faibles
01/05/2007
21
01/05/2007
22
PMC
RBF
01/05/2007
23
Technique de classification :
01/05/2007
24
Le rseau de Kohonen
pijk
individu 1
individu 2
couche dentre
individu N
25
individu 1
(i,j)
individu 2
couche dentre
individu N
pijk
poids pijk
= taux dapprentissage
f(i,j;I,J) = fct dcroissante de la
26
Apprentissage du rseau
(i,j+1)
(i+1,j+1)
(i-1,j)
(i,j)
(i+1,j)
(i,j-1)
(i+1,j-1)
01/05/2007
revenus
nombre
denfants
27
Tout
Une
01/05/2007
28
01/05/2007
29
Synonymes
Utilisation
voir
01/05/2007
les exemples
suivants
Stphane Tuffry
- Data Mining - http://data.mining.free.fr
30
01/05/2007
31
Analyse typologique
Prdiction classement
Sries temporelles (prvision de cours boursiers)
Reconnaissance de caractres optiques et de lcriture
01/05/2007
32
de variables non
discriminantes
Convergence vers la meilleure solution globale pas
toujours assure
Difficult dutilisation correcte paramtres nombreux
et dlicats rgler (nb et tailles des couches caches,
taux dapprentissage, moment...)
Ne sappliquent naturellement quaux variables
continues dans lintervalle [0,1]
01/05/2007
33
01/05/2007
34
01/05/2007
35
Exemple de transformation
01/05/2007
36
Maximisation de la marge
ax+b
a
B1 meilleur que B2
sparation optimale
B1
B2
marge
b21
b22
margin
b11
b12
01/05/2007
37
Forme de la solution
01/05/2007
38
Exemples de noyaux
Linaire
k(x,x) = x.x
k(x,x) = (x.x)d
si d = 2, x=(x1,x2) et (x) = (x1,2x1x2,x2), alors
(x).(x) = (x1x1 + x2x2) = (x.x)2
Polynomial
Gaussien (RBF)
x x'
2
k(x,x) =
Sigmodal
39
Algorithmes gntiques
01/05/2007
40
Algorithmes gntiques
Les
Droulement en 3 phases :
01/05/2007
41
01/05/2007
42
Croisement de rgles
01/05/2007
43
Une
01/05/2007
44
Aprs
01/05/2007
45
01/05/2007
46