Guenounou Ouahib PDF

THSE
En vue de l'obtention du
DOCTORAT DE LUNIVERSIT DE TOULOUSE

Dlivr par l'Universit Toulouse III - Paul Sabatier
Discipline ou spcialit : Systmes Automatiques
Prsente et soutenue par Ouahib GUENOUNOU

Le 22 avril 2009
Titre : Mthodologie de conception de contrleurs intelligents
par l'approche gntique- application un bioprocd
JURY
Gilles ROUX, Professeur l'UPS de Toulouse, Prsident
Monique POLIT, Professeur l'universit de Perpignan, Rapporteur
Sad DJENNOUN, Professeur l'universit de Tizi Ouzou, Rapporteur
Boubekeur MENDIL, Professeur L'universit de Bjaa, Examinateur
Ecole doctorale : Ecole Doctoral Systme

Unit de recherche : Nom de l'Unit de recherche
Directeur(s) de Thse : Prof. Ali BELMEHDI et Prof. Boutaib DAHHOU
Rapporteurs : Prof. Monique POLIT et Prof. Sad DJENNOUN
Avant propos
Les travaux prsents dans le mmoire ont t effectus dans le cadre dune cotutelle entre
luniversit Paul Sabatier Toulouse III et luniversit A.Mira de Bejaia. Ils ont t raliss
au Laboratoire dAnalyse et dArchitecture des Systmes du CNRS et au Laboratoire de
technologie Industrielle et de linformation de luniversit A. mira de Bejaia. A ce titre je
remercie le service de lAgence Universitaire de Francophonie (AUF) qui par son financement ma aid effectuer mes travaux dans de bonnes conditions.
Je remercie Messieurs Malik GHALLAB et Raja CHATILA, respectivement ancien et
actuel Directeurs du LAAS CNRS et Madame Louise TRAVE-MASSUYES, responsable
du groupe DISCO.
Je remercie galement Monsieur Ali BELMEHDI, Directeur du LTII.
Je tiens remercier vivement Monsieur Gilles Roux, Professeur lUPS de Toulouse pour
avoir accept dexaminer ce travail et pour mavoir fait lhonneur de prsider la commission dexamen.
Je tiens galement remercier trs sincrement Madame Monique Polit, Professeur
luniversit de Perpigan et Monsieur Sad Djennoune, Professeur de luniversit Mouloud
Mameri de Tizi ouzou, pour lhonneur quils mont fait dexaminer cette tude et den
tre les rapporteurs. Je remercie galement Monsieur Boubekeur Mendil, Professeur de
lUniversit A. Mira de Bjaia davoir accept dexaminer cette thse.
Jexprime ma profonde reconnaissance mon directeur de thse ct franais, Monsieur
Boutaib Dahhou, Professeur lUPS de Toulouse, et je le remercie pour son soutien scientifique et pour la confiance quil ma accorde tout au long de mes travaux.
Je ne saurais exprimer ma sympathie et ma reconnaissance envers mon directeur de thse
ct Algrien, Monsieur Ali Belmehdi, Professeur de lUniverist A. Mira de Bjaia pour
le soutien quil a pu mapporter, pour ses orientations, sa disponibilit et ses conseils.
Quil soit assur de ma respectueuse reconnaissance.
Finalement, je remercie sincrement tous mes amis en particulier Nassim pour le soutien
quil ma apport durant les sjours effectus Toulouse.
Table des matires
liste des figures
vii
liste des Tableaux
xi
Introduction
Algorithmes gntiques
1.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Algorithmes gntiques . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
Codage et population initiale . . . . . . . . . . . . . . . . . . . .
1.2.1.1
Codage binaire . . . . . . . . . . . . . . . . . . . . . .
1.2.1.2
Codage rel . . . . . . . . . . . . . . . . . . . . . . .
1.2.1.3
Codage en base n . . . . . . . . . . . . . . . . . . . .
1.2.2
Oprateur de croisement . . . . . . . . . . . . . . . . . . . . . .
1.2.3
Oprateur de mutation . . . . . . . . . . . . . . . . . . . . . . .
11
1.2.4
Fonction dvaluation . . . . . . . . . . . . . . . . . . . . . . .
12
1.2.5
Oprateur de slection . . . . . . . . . . . . . . . . . . . . . . .
13
1.2.5.1
14
Slection par tournoi . . . . . . . . . . . . . . . . . . .

i
ii
TABLE DES MATIRES
1.3
1.4
1.5
1.2.5.2
Sharing . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.2.5.3
Elitisme . . . . . . . . . . . . . . . . . . . . . . . . .
15
Algorithmes Gntiques Hirarchiss . . . . . . . . . . . . . . . . . . .
16
1.3.1
Formulation du chromosome hirarchis . . . . . . . . . . . . . .
16
1.3.2
Oprateurs gntiques . . . . . . . . . . . . . . . . . . . . . . .
18
Optimisation multi-objectifs . . . . . . . . . . . . . . . . . . . . . . . .
18
1.4.1
Mthode agrgative . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.4.2
Mthode non agrgative . . . . . . . . . . . . . . . . . . . . . .
22
1.4.2.1
Vector evaluated genetic algorithm (VEGA) . . . . . .
22
1.4.2.2
Multiple Objectives Genetic Algorithm (MOGA) . . .
23
1.4.2.3
NSGA (Nondominated Sorting Genetic Algorithm) . .
23
1.4.2.4
Niched Pareto Genetic Algorithm (NPGA) . . . . . . .
24
1.4.2.5
NSGA-II . . . . . . . . . . . . . . . . . . . . . . . . .
24
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
Rseaux de neurones et systmes flous
29
2.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.2
Rseaux de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.2.1
Le neurone formel . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.2.2
Rseaux non boucls . . . . . . . . . . . . . . . . . . . . . . . .
31
2.2.3
Rseaux boucls . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2.4
Apprentissage dans les rseaux de neurones . . . . . . . . . . . .
33
2.2.4.1
34
Algorithme de rtropropagation du gradient . . . . . .
TABLE DES MATIRES
2.2.5
2.3
2.4
2.5
2.6
iii
Identification par rseaux de neurones . . . . . . . . . . . . . . .
36
Rseaux de neurones pour la commande . . . . . . . . . . . . . . . . . .
38
2.3.1
Imitation dun contrleur existant . . . . . . . . . . . . . . . . .
38
2.3.2
Utilisation directe de lerreur en sortie du procd . . . . . . . . .
39
2.3.3
Identification du modle inverse . . . . . . . . . . . . . . . . . .
40
2.3.4
Architecture indirecte dapprentissage . . . . . . . . . . . . . . .
41
2.3.5
Apprentissage indirect du systme de commande . . . . . . . . .
42
Systmes flous . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4.1
Ensembles flous . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4.2
Variables linguistiques . . . . . . . . . . . . . . . . . . . . . . .
45
2.4.3
Rgles et oprateurs flous . . . . . . . . . . . . . . . . . . . . .
46
2.4.4
Structure interne dun systme flou . . . . . . . . . . . . . . . .
47
Systme neuro-flou . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
2.5.1
Architecture neuro flou hybride . . . . . . . . . . . . . . . . . .
52
2.5.1.1
ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . .
53
2.5.1.2
FALCON ET GARIC . . . . . . . . . . . . . . . . . .
53
2.5.1.3
NEFCLASS . . . . . . . . . . . . . . . . . . . . . . .
54
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
Conception de contrleurs flous par algorithmes gntiques

3.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
Optimisation des contrleurs flous de type Mamdani par algorithmes g-
55
55
ntiques simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
3.2.1
58
Reprsentation des fonctions dappartenance . . . . . . . . . . .
iv
TABLE DES MATIRES
3.2.1.1
Partitionnement avec des fonctions triangulaires . . . .
59
3.2.1.2
Partitionnement avec des fonctions trapzodales . . . .
62
3.2.1.3
Fonction dappartenance Gaussienne . . . . . . . . . .
64
3.2.2
Codage des paramtres des fonctions dappartenance . . . . . . .
66
3.2.3
Reprsentation des rgles floues . . . . . . . . . . . . . . . . . .
66
3.2.4
Codage des rgles floues . . . . . . . . . . . . . . . . . . . . . .
67
3.2.4.1
Le codage binaire . . . . . . . . . . . . . . . . . . . .
67
3.2.4.2
Le codage rel . . . . . . . . . . . . . . . . . . . . . .
67
3.2.4.3
Codage en base n . . . . . . . . . . . . . . . . . . . .
67
3.2.5
Structure du chromosome . . . . . . . . . . . . . . . . . . . . .
68
3.2.6
68
3.2.6.1
Oprateur de Croisement . . . . . . . . . . . . . . . .
68
3.2.6.2
Oprateur de Mutation . . . . . . . . . . . . . . . . . .
69
3.2.7
Initialisation des chromosomes . . . . . . . . . . . . . . . . . . .
70
3.2.8
Exemple dapplication . . . . . . . . . . . . . . . . . . . . . . .
71
3.2.8.1
Critres de performance . . . . . . . . . . . . . . . . .
72
3.2.8.2
Paramtres de lAG . . . . . . . . . . . . . . . . . . .
73
3.2.8.3
Fonction Objectif . . . . . . . . . . . . . . . . . . . .
73
3.2.8.4
Mthodes de slection . . . . . . . . . . . . . . . . . .
74
3.2.8.5
Rsultats de loptimisation pour la premire mthode

(tournoi) . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.8.6
75
Rsultats de loptimisation pour la deuxime mthode

(NSGA-II) . . . . . . . . . . . . . . . . . . . . . . . .
78
3.3
3.4
TABLE DES MATIRES
Optimisation par algorithmes gntiques hirarchiss . . . . . . . . . . .
82
3.3.1
Structure du chromosome hirarchis . . . . . . . . . . . . . . .
83
3.3.2
84
3.3.3
Fonction objectif supplmentaire . . . . . . . . . . . . . . . . . .
84
3.3.4
Evaluation des performances de lAGH . . . . . . . . . . . . . .
85
Optimisation des contrleurs flous de type Sugeno . . . . . . . . . . . . .
88
3.4.1
Structure du rseau Neuro-flou . . . . . . . . . . . . . . . . . . .
90
3.4.1.1
Premire couche (couche dentre) . . . . . . . . . . .
90
3.4.1.2
Deuxime couche (couche des fonctions dappartenance) 91
3.4.1.3
Troisime couche(couche des prmisses) . . . . . . . .
91
3.4.1.4
Quatrime couche(couche des conclusions) . . . . . . .
91
3.4.1.5
Cinquime couche (couche de sortie) . . . . . . . . . .
92
Optimisation des paramtres du rseau neuro-flou . . . . . . . . .
92
3.4.2
3.4.2.1
gradient . . . . . . . . . . . . . . . . . . . . . . . . .
92
Optimisation par algorithme gntique . . . . . . . . .
93
Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
3.4.3.1
Modle de simulation . . . . . . . . . . . . . . . . . .
94
3.4.3.2
Rsultats de simulations . . . . . . . . . . . . . . . . .
94
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
3.4.2.2
3.4.3
3.5
Optimisation par lalgorithme de rtropropagation du
Application un bioprocd
101
4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2
Procd de fermentation . . . . . . . . . . . . . . . . . . . . . . . . . . 102
vi
TABLE DES MATIRES
4.3
4.4
4.5
Modlisation des bioprocds . . . . . . . . . . . . . . . . . . . . . . . . 103

4.3.1
Modles non structurs . . . . . . . . . . . . . . . . . . . . . . . 103
4.3.2
Modles structurs . . . . . . . . . . . . . . . . . . . . . . . . . 104
Modlisation de la fermentation alcoolique . . . . . . . . . . . . . . . . 104

4.4.1
Mode discontinu . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.4.2
Mode semi-continu . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4.3
Mode continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4.4
Modle dynamique . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.4.5
Simulation du modle en mode discontinu . . . . . . . . . . . . . 107
4.4.6
Simulation du modle en mode continu . . . . . . . . . . . . . . 108
Application des approches intelligentes pour la conduite du bioprocd . . 110

4.5.1
Optimisation du contrleur flou par algorithme gntique simple . 110

4.5.1.1
4.5.2
Rsultats de simulation . . . . . . . . . . . . . . . . . 111
Optimisation du contrleur flou par algorithme gntique hirarchis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.5.3
4.5.4
4.6
4.5.2.1
Objectifs de la stratgie de commande . . . . . . . . . 122
4.5.2.2
Rsultats de simulation . . . . . . . . . . . . . . . . . 123
Optimisation du contrleur flou de type Sugeno . . . . . . . . . . 126

4.5.3.1
Premire tape: optimisation par rtropropagation . . . 127
4.5.3.2
Deuxime tape: optimisation par AGH . . . . . . . . 129
Paramtres de lAGH . . . . . . . . . . . . . . . . . . . . . . . . 130
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Table des figures
1.1
Croisement standard en un seul point . . . . . . . . . . . . . . . . . . . .
1.2
Croisement standard en deux points . . . . . . . . . . . . . . . . . . . .
10
1.3
Principe de loprateur de mutation . . . . . . . . . . . . . . . . . . . . .
11
1.4
Effet de sharing sur la rpartition des solutions . . . . . . . . . . . . . . .
15
1.5
Structure hirarchique dun chromosome . . . . . . . . . . . . . . . . . .
16
1.6
Principe de dcodage des chromosomes des AGH . . . . . . . . . . . . .
17
1.7
Front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.8
Interprtation gomtrique de la mthode dagrgation . . . . . . . . . .
21
1.9
Illustration de la variation des coefficients de pondration pour la recherche du front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.10 Schma de lvolution de lalgorithme NSGA-II . . . . . . . . . . . . . .
25
1.11 Distance de crowding (les points noirs sont des solutions appartenant au
mme front) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.1
Modle de base dun neurone formel . . . . . . . . . . . . . . . . . . . .
30
2.2
Perceptron une couche cache . . . . . . . . . . . . . . . . . . . . . .
31
2.3
Rseaux de neurones rcurrents . . . . . . . . . . . . . . . . . . . . . . .
33
2.4
Schma de principe didentification par rseau de neurones . . . . . . . .
37
vii
viii
TABLE DES FIGURES
2.5
Structure didentification srie parallle . . . . . . . . . . . . . . . . . .
37
2.6
Structure didentification parallle . . . . . . . . . . . . . . . . . . . . .
38
2.7
Commande neuronale par reproduction dun contrleur conventionnel . .
38
2.8
Apprentissage spcialis . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.9
Commande neuronale par identification du modle inverse . . . . . . . .
40
2.10 Architecture dapprentissage gnralis . . . . . . . . . . . . . . . . . .
41
2.11 Architecture de commande indirecte . . . . . . . . . . . . . . . . . . . .
42
2.12 Reprsentation de la temprature dun corps par les ensembles classiques

et flous . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
2.13 Diffrents types de fonctions dappartenance utilises . . . . . . . . . . .
44
2.14 Variable linguistique . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
2.15 La partition suprieure ne peut sinterprter en termes linguistiques . . . .
46
2.16 Structure interne dun systme flou . . . . . . . . . . . . . . . . . . . . .
47
2.17 Infrence: MINIMUM et PRODUIT . . . . . . . . . . . . . . . . . . . .
49
2.18 Composions des ensembles flous issus de linfrence . . . . . . . . . . .
50
2.19 Diffrentes architectures des systmes neuro-flous . . . . . . . . . . . . .
53
3.1
Reprsentation graphique des diffrentes approches doptimisation dun

contrleur flou par algorithme gntique . . . . . . . . . . . . . . . . . .
56
3.2
Contrleur flou deux entres . . . . . . . . . . . . . . . . . . . . . . .
57
3.3
Fonction dappartenance triangulaire dfinie par trois paramtres . . . . .
59
3.4
Partition floue avec des fonctions dappartenance triangulaires . . . . . .
60
3.5
Partition avec 5 fonctions dappartenance daprs Lee et Yubaziki . . . .
61
3.6
Fonction dappartenance trapzodale . . . . . . . . . . . . . . . . . . .
62
TABLE DES FIGURES
3.7
Partition avec 5 fonctions dappartenance trapzoidales daprs Lee et Yubaziki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8
ix
63
Fonction dappartenance gaussienne asymtrique(ligne continue): La moyenne est note c et les variances g2 et d2 . . . . . . . . . . . . . . . . .
64
Partition avec 5 gaussiennes asymtriques . . . . . . . . . . . . . . . . .
65
3.10 Structure du chromosome de lAGS . . . . . . . . . . . . . . . . . . . .
68
3.11 Rponse indicielle du systme en boucle ferme sans le contrleur flou . .
71
3.9
3.12 Fonctions dappartenance du meilleur chromosome de la premire gnration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
3.13 Sortie du systme pour le meilleur chromosome de la premire gnration
76
3.14 Evolution de lobjectif Ob travers les gnrations . . . . . . . . . . . .
76
3.15 Fonctions dappartenance du meilleur chromosome de la 210 me gnration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
3.16 Sortie du systme pour le meilleur chromosome de la 210 me gnration
78
3.17 Rpartition de la population initiale . . . . . . . . . . . . . . . . . . . .
78
3.18 Evolution de la population . . . . . . . . . . . . . . . . . . . . . . . . .
79
3.19 Rpartition de la population finale . . . . . . . . . . . . . . . . . . . . .
80
3.20 Sortie du systme pour la solution de test . . . . . . . . . . . . . . . . .
80
3.21 Fonctions dappartenance . . . . . . . . . . . . . . . . . . . . . . . . . .
81
3.22 Bases de rgles contenant des rgles incohrentes . . . . . . . . . . . . .
82
3.23 Structure du chromosome de lAGH appliqu pour loptimisation des paramtres dun CF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
3.24 Rpartition de la population finale . . . . . . . . . . . . . . . . . . . . .
86
3.25 Solutions constituant le front de Pareto . . . . . . . . . . . . . . . . . . .
86
3.26 Sortie du systme pour la solution de test . . . . . . . . . . . . . . . . .
87
TABLE DES FIGURES
3.27 Fonctions dappartenance . . . . . . . . . . . . . . . . . . . . . . . . . .
87
3.28 Structures du chromosome optimisant le contrleur de Sugeno . . . . . .
89
3.29 Structure du rseau neuro-flou . . . . . . . . . . . . . . . . . . . . . . .
90
3.30 Rpartition des solutions de la premire gnration . . . . . . . . . . . .
96
3.31 Rpartition des solutions de la dernire gnration . . . . . . . . . . . . .
97
3.32 Rpartition des solutions du front de Pareto . . . . . . . . . . . . . . . .
97
3.33 Test du modle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
4.1
Schma simplifi dune culture de levure . . . . . . . . . . . . . . . . . . 102
4.2
Evolution des concentrations en substrat, biomasse, produit et du taux de

croissance pour une fermentation en mode batch . . . . . . . . . . . . . . 108
4.3
Evolution des variables dtat pour une fermentation en mode continu . . 109
4.4
Principe de la commande floue optimise par algorithme gntique . . . . 110
4.5
Evolution de lobjectif (Ob) travers les gnrations-structure 5*5*5 . . . 113
4.6
Evolution des paramtres du contrleur flou travers les gnrationsstructure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.7
Evolution de la concentration en Substrat pour le meilleur chromosome

de la premire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . 115
4.8
Fonctions dappartenance correspondantes au meilleur chromosome de la

premire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . 116
4.9
Evolution de la concentration en Substrat et le taux de dilution pour la

dernire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . 117
4.10 Fonctions dappartenance correspondantes au meilleur chromosome de la

4.11 Evolution de lobjectif (Ob) travers les gnrations-structure 7*7*7 . . . 119
TABLE DES FIGURES
xi
4.12 Evolution de la concentration en Substrat et le taux de dilution pour la

4.13 Fonctions dappartenance correspondantes au meilleur chromosome de la
4.14 Rpartition de solutions de la premire gnration . . . . . . . . . . . . . 123
4.15 Rpartition de solutions de la dernire gnration . . . . . . . . . . . . . 124
4.16 Evolution de la concentration en Substrat et le taux de dilution . . . . . . 125
4.17 Schma de principe de loptimisation dun contrleur flou de type Sugeno 126
4.18 Evolution de la concentration en Substrat et le taux de dilution aprs la
premire phase doptimisation . . . . . . . . . . . . . . . . . . . . . . . 128
4.19 Fonctions dappartenance initiales . . . . . . . . . . . . . . . . . . . . . 128
4.20 Solutions de la premire gnration . . . . . . . . . . . . . . . . . . . . 130
4.21 Solutions de la dernire gnration . . . . . . . . . . . . . . . . . . . . . 131
4.22 Solutions du front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . 131
4.23 Evolution de la concentration en Substrat et le taux de dilution pour la
solution de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.24 Fonctions dappartenance correspondant la solution de test . . . . . . . 132
LISTE DES TABLEAUX
xiii
Liste des tableaux
3.1
Base de rgles floues . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
3.2
Base de rgles gnre partir du modle de Macvicar-Whelan . . . . . .
70
3.3
Paramtres de lAGs . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3.4
Facteurs dchelle du meilleure chromosome de la premire gnration . .
75
3.5
Facteurs dchelle du meilleur chromosome de la 210 gnration . . . . .
77
3.6
Base de rgle gnre partir du meilleur chromosome de la 210 me

gnration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
3.7
Facteurs dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
3.8
Base de rgle gnre . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
3.9
Facteurs dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
3.10 Base de rgles avec 22 rgles floues . . . . . . . . . . . . . . . . . . . .
88
3.11 Paramtres des fonctions dappartenance obtenus par rtropropagation . .
94
3.12 Base de rgles floues obtenue par rtropropagation . . . . . . . . . . . .
95
3.13 Paramtres des fonctions dappartenance relatifs la solution de test . . .
98
3.14 Base de rgles relative la solution de test . . . . . . . . . . . . . . . . .
98
3.15 Comparaison avec dautres modles . . . . . . . . . . . . . . . . . . . .
99
4.1
Variables denvironnement maintenues au cours de la fermentation . . . . 106
xiv
LISTE DES TABLEAUX
4.2
Intervalles de variation des centres des fonctions dappartenance . . . . . 111
4.3
Intervalles de variation des facteurs dchelle . . . . . . . . . . . . . . . 112
4.4
Facteur dchelle correspondants au meilleur chromosome de la premire

gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5
Base de rgles floues correspondante au meilleur chromosome de la premire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . 116
4.6
Facteur dchelle correspondants au meilleur chromosome de la dernire

4.7
Base de rgles floues correspondante au meilleur chromosome de la dernire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . 118
4.8
Facteur dchelle correspondants au meilleur chromosome de la dernire

4.9
Base de rgles floues correspondante au meilleur chromosome de la dernire gnration-structure 7*7*7 . . . . . . . . . . . . . . . . . . . . . . 121
4.10 Base de rgles correspondant la solution de test . . . . . . . . . . . . . 125

4.11 Base de rgles obtenue aprs la rtropropagation . . . . . . . . . . . . . . 129
4.12 Paramtres de lAGH . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.13 Base de rgles relative la solution de test . . . . . . . . . . . . . . . . . 133
Introduction
Historique
Les outils intelligents sont de plus en plus utiliss dans la conception, la modlisation
et la commande de systmes complexes tels que les robots, les procds biologiques, les
vhicules routiers . On entend par outils intelligents les techniques du soft computing
savoir : les rseaux de neurones, la logique floue et les algorithmes gntiques.
Les rseaux de neurones sont apparus dans les annes cinquante mais nont reu cependant un intrt considrable qu partir des annes 80 avec lapparition de lalgorithme
de rtropropagation (Rumelhart et McClelland, 1986). Leur capacit dapprentissage et
dapproximation de fonctions leur procure un intrt considrable de la part des chercheurs. Il suffit de voir les nombreuses applications industrielles qui en dcoulent partir
des annes 90 et de consulter labondante littrature sur le sujet pour sen convaincre.
La logique floue introduite par Zadeh (1965) dans les annes soixante constitue un outil
trs puisant pour la reprsentation des termes et des connaissances vagues. Elle est issue
de la capacit de lhomme dcider et agir dune manire intelligente malgr limprcis
et lincertitude des connaissances disponibles. Son utilisation dans le domaine du contrle
(contrle flou) a t lune des premires applications de cette thorie dans lindustrie avec
les travaux de Mamdani et Assilian (1975). Depuis, les applications de la logique floue se
sont multiplies pour toucher des domaines trs divers.
Lutilisation de la commande floue est particulirement intressante lorsquon ne dispose
pas de modle mathmatique prcis, voir inexistant, du systme commander ou lorsque
ce dernier prsente de fortes non linarits. Contrairement aux approches classiques de
lautomatique, qui se basent en grande partie sur un modle mathmatique, la commande
par logique floue, repose sur une collection de rgles linguistiques de la forme " Si
Alors " qui traduisent la stratgie de contrle dun oprateur humain.
1
INTRODUCTION
Les algorithmes gntiques sont des mthodes stochastiques bases sur une analogie avec
des systmes biologiques. Ils reposent sur un codage de variables organises sous forme
de structures chromosomiques et prennent modle sur les principes de lvolution naturelle de Darwin pour dterminer une solution optimale au problme considr. Ils ont
t introduits par Holland (Holland, 1975) pour des problmes doptimisation complexe.
Contrairement aux mthodes doptimisation classique, ces algorithmes sont caractriss
par une grande robustesse et possdent la capacit dviter les minimums locaux pour
effectuer une recherche globale. De plus, ces algorithmes nobissent pas aux hypothses
de drivabilit qui contraignent pas mal de mthodes classiques destines traiter des
problmes rels.
Au cours de ces dernires annes, la combinaison de ces techniques a attir lattention
de beaucoup de chercheurs. Plusieurs hybridations ont t alors proposes dont les plus
rencontres sont: Algorithme Gntique /Contrleur flou (AG/CF) et Rseau de neurones/Contrleur flou (RN/CF).
La premire combinaison (AG/CF) vise la conception des CF par algorithmes gntiques. Karr et Gentry (1993) utilisent un algorithme gntique standard (codage binaire,
oprateurs de croisement et de mutation simples) pour loptimisation des paramtres des
fonctions dappartenance. Le nombre de termes linguistiques associ chaque variable
du contrleur est diffrent, mais il reste fixe durant tout le processus doptimisation. Plusieurs mthodes ont t proposes par la suite, dont certaines diffrent par le type de codages et/ou des fonctions dappartenance utilises (Liska et Melsheimer, 1994; Herrera et
al., 1995). Rcemment, les algorithmes hirarchiss ou AGH sont aussi impliqus. Dans
(Acosta et Todorovich, 2003), on utilise un AGH avec un seul niveau de gnes de contrle
pour chercher le nombre minimal de fonctions dappartenance associer chacune des
variables du contrleur flou.
Thrift (1991) est le premier dcrire une mthode doptimisation des rgles floues par
algorithme gntique standard, en utilisant trois bits pour coder chaque rgle. A la mme
poque, Karr propose une mthode permettant de faire intervenir dans le contrleur flou
la fois des rgles spcifies par un expert humain et des rgles optimises par un algorithme gntique (Karr, 1991). Quelques amliorations ont t apportes par la suite
(Herrera et al., 1998; Chen et Wong, 2002; Belarbi et al., 2005).
Homaifar et MCCormick (1993) proposent une mthode doptimisation qui prend en
compte simultanment les fonctions dappartenance des variables dentres et les rgles
floues. Les diffrents paramtres sont cods sur le mme chromosome en base 6. Dans
(Lee et Takagi, 1993), les auteurs partagent la mme ide de Hamaifar et MCCormik (co-
INTRODUCTION
dage de lensemble des paramtres dans un chromosome unique) en utilisant un codage

binaire. Dans larticle de Zhou et Lai (2000), on adopte un codage mixte des paramtres.
Ainsi les chanes relles et les chanes entires sont utilises respectivement pour coder
les fonctions dappartenance et les rgles floues.
La combinaison (RN/CF), ou tout simplement contrleur neuro-flou est une combinaison de la logique floue et des rseaux de neurones qui tire profit des deux approches.
Plusieurs architectures neuro-floues ont t proposes dans la littrature suivant le type
de rgles floues quelles intgrent (Mamdani ou Sugeno). La puissance de ces structures
rside dans la possibilit dincorporer une base de connaissances, de traiter les donnes
imprcises et vagues par logique floue et en mme temps dintroduire lapprentissage via
le rseau de neurones. Pour la plupart des architectures proposes, les procdures dapprentissage appliques sont soit supervises et se basent sur les techniques doptimisation
classique (descente du gradient, les moindres carrs), soit non supervises et on utilise les
algorithmes de classification (K-means).
Problmatique
Loptimisation indpendante, des paramtres des fonctions dappartenance ou des
rgles floues par algorithme gntique est juste mais reste incomplte car les deux parties
(fonctions dappartenance et rgles floues) ne peuvent tre dissocies. Par consquent,
pour obtenir de meilleurs rsultats, il faudrait prvoir un codage qui prend en charge simultanment les fonctions dappartenance et les rgles floues. En raison dune part dun
espace de recherche trs grand (fonctions dappartenance + rgles floues) et dautre part
de lutilisation dune procdure dinitialisation des chromosomes base souvent sur un
processus alatoire, les mthodes proposes ncessitent gnralement un nombre important de gnrations. De plus loptimisation aveugle des algorithmes gntiques, dont le
seul objectif est lamlioration dun critre numrique, conduit souvent la prsence de
rgles floues incohrentes (brouilles) en fin du processus doptimisation. Lamlioration de ltape dinitialisation des chromosomes ainsi que lutilisation dune procdure de
slection qui dfavorise lapparition de rgles incohrentes peut tre une solution fiable
pour contourner ces inconvnients. Cest dans ce cadre que se situent nos motivations et
intrts pour la conception de contrleurs flous par algorithmes gntiques.
INTRODUCTION
Prsentation des chapitres

Ce mmoire est organis en quatre chapitres comme suit:
Le premier chapitre est consacr aux algorithmes gntiques. Il est constitu de trois
parties principales. La premire prsente une description dtaille des algorithmes gntiques simples dans laquelle nous rappelons les dfinitions relatives leur fonctionnement.
Dans la deuxime partie nous introduirons les algorithmes gntiques hirarchiss, version amliore des algorithmes gntiques simples. La troisime partie traite de loptimisation multi-objectifs par algorithmes gntiques. Nous dcrivons quelques algorithmes
de rsolution tout en accordant plus dimportance lalgorithme NSGA-II (Nondominated Sorting Genetic Algorithm-II) qui est utilis dans ce mmoire.
Le deuxime chapitre est divis en trois parties. La premire traite les rseaux de neurones et leur modalit dutilisation pour les problmes de modlisation et de commande.
La deuxime partie est consacre aux systmes flous. Nous rappelons dabord les notions
de bases sur lesquelles reposent ses systmes puis nous dcrivons leur principe de fonctionnement et leurs diffrentes composantes. Enfin, dans la troisime partie nous aborderons lapproche neuro-floue ainsi quune classification des ses diffrentes structures.
Le troisime chapitre constitue le noyau de ce mmoire. Nous commenons par une
description de la premire mthode de synthse des contrleurs flous de Mamdani par algorithmes gntiques simples. Nous introduisons par la suite le NSGA-II avec un codage
hirarchis des paramtres. Enfin nous proposons un algorithme hybride pour la synthse
des contrleurs de Sugeno.
Le quatrime chapitre concerne une application des mthodes de synthse des contrleurs intelligents pour la conduite dun procd de fermentation alcoolique.
Chapitre 1
1.1
Introduction
Les ingnieurs se heurtent quotidiennement des problmes de complexit grandissante, qui surgissent dans des secteurs trs divers, comme le traitement dimages, la
conception de systmes de commande et de diagnostic, etc . . .. Le problme rsoudre
peut souvent tre considr comme un problme doptimisation dans lequel on dfinit
une ou plusieurs fonctions objectif, ou fonctions de cot, que lon cherche minimiser
(ou maximiser) par apport lensemble des paramtres concerns. La rsolution dun tel
problme a conduit les chercheurs proposer des mthodes de rsolution de plus en plus
performantes, parmi lesquelles on peut citer les mtaheuristiques. Ces dernires qui comprennent notamment la mthode du recuit simul (Kirkpatrick et al., 1983), la mthode de
recherche Tabou (Glover, 1989), les algorithmes de colonies de fourmis, les algorithmes
gntiques etc . . ., prsentent des caractristiques communes, qui sont:
1. Raisonnement par analogie avec les systmes rels (physique, biologie, thologie,
).
2. Stochastiques
et partagent aussi les mmes inconvnients :
1. Difficult de rglage des paramtres de la mthode
2. Temps de calcul lev.
5
CHAPITRE 1. ALGORITHMES GNTIQUES
Dans ce chapitre, nous allons nous intresser uniquement aux algorithmes gntiques qui
ont connu ces quinze dernires annes un dveloppement considrable grce laugmentation vertigineuse de la puissance des calculateurs et notamment suite lapparition des
architectures massivement parallles qui exploitent leur paralllisme intrinsque.
Le chapitre est organis en trois parties. La premire est consacre aux algorithmes gntiques comme tant une mthode doptimisation mono-objectif. Aprs une prsentation
gnrale du principe de fonctionnement dun algorithme gntique, nous ferons une description dtaille de ses diffrentes composantes. La deuxime partie est consacre aux
algorithmes gntiques hirarchiss (AGH), une version amliore des AGS. Ils diffrent
de ces derniers dans la structure de leurs chromosomes qui prsente un niveau hirarchique et se compose de deux types de gnes: les gnes de contrle et les gnes de paramtres. Enfin la dernire partie traite de loptimisation multi-objectifs par algorithmes
gntiques. Nous commenons dabord par un bref rappel sur les spcificits dun problme plusieurs objectifs, puis nous voquons le concept de dominance et la notion
doptimalit au sens de Pareto qui caractrise cette classe de problmes. Enfin, nous dtaillons quelques algorithmes gntiques, ddis loptimisation multi-objectifs tout en
accordant plus dimportance un algorithme litiste de rfrence (NSGA-II) qui sera utilis dans la suite de ce travail.
1.2
Les algorithmes gntiques (AG) dvelopps par J. Holland (Holland, 1992) prsentent des qualits intressantes pour la rsolution de problmes doptimisation complexes. Leurs fondements thoriques furent exposs par Goldberg (Goldberg, 1994). Ils
tentent de simuler le processus dvolution des espces dans leur milieu naturel: soit une
transposition artificielle de concepts basiques de la gntique et des lois de survie noncs
par Darwin. Rappelons que la gntique reprsente un individu par un code, cest--dire
un ensemble de donnes (appeles chromosomes), identifiant compltement lindividu.
La reproduction est, dans ce domaine, un mixage alatoire de chromosomes de deux individus, donnant naissance des individus enfants ayant une empreinte gntique nouvelle,
hrite des parents. La mutation gntique est caractrise dans le code gntique de lenfant par lapparition dun chromosome nouveau, inexistant chez les individus parents.
Ce phnomne gntique dapparition de " mutants" est rare mais permet dexpliquer
les changements dans la morphologie des espces, toujours dans le sens dune meilleure
1.2. ALGORITHMES GNTIQUES
adaptation au milieu naturel. La disparition de certaines espces est explique par " les
lois de survie " selon lesquelles seuls les individus les mieux adapts auront une longvit
suffisante pour gnrer une descendance. Les individus peu adapts auront une tendance
disparatre. Cest une slection naturelle qui conduit de gnration en gnration une
population compose dindividus de plus en plus adapts.
Un algorithme gntique est construit de manire tout fait analogue. Dans lensemble
des solutions dun problme doptimisation, une population de taille N est constitue de
N solutions (les individus de la population) convenablement marques par un codage qui
les identifie compltement. Une procdure dvaluation est ncessaire la dtermination
de la force de chaque individu de la population. Viennent ensuite une phase de slection
(en slectionnant les individus au prorata de leur force) et une phase de recombinaison
(oprateurs artificiels de croisement et de mutation) qui gnrent une nouvelle population
dindividus, qui ont de bonnes chances dtre plus forts que ceux de la gnration prcdente. De gnration en gnration, la force des individus de la population augmente et
aprs un certain nombre ditrations, la population est entirement constitue dindividus
tous forts, soit de solutions quasi-optimales du problme pos.
En, le fonctionnement dun AG est alors bas sur les phases suivantes :
1. Initialisation : une population initiale de taille N chromosomes est tire alatoirement.
2. Evaluation : chaque chromosome est dcod puis valu.
3. Reproduction: cration dune nouvelle population de N chromosomes par lutilisation dune mthode de slection approprie.
4. Oprateurs gntiques: croisement et mutation de certains chromosomes au sein
de la nouvelle population.
5. Retour la phase 2 tant que la condition darrt du problme nest pas satisfaite.
1.2.1
Codage et population initiale
Premirement, il faut reprsenter les diffrents tats possibles de la variable dont on

cherche la valeur optimale sous forme utilisable pour un AG: cest le codage. Cela permet
dtablir une connexion entre la valeur de la variable et les individus de la population, de
manire imiter la transcription gnotype-phnotype qui existe dans le monde vivant. Il
existe principalement trois types de codage : le codage binaire, le codage rel et le codage
en base n.
1.2.1.1 Codage binaire

Ce codage a t le premier tre utilis dans le domaine des AG. Il prsente plusieurs
avantages : alphabet minimum {0,1}, facilit de mise en point doprateurs gntiques
et existence de fondements thoriques (thorie sur les schmas). Nanmoins ce type de
codage prsente quelques inconvnients :
1. Les performances de lalgorithme sont dgrades devant les problmes doptimisation de grande dimension haute prcision numrique. Pour de tels problmes,
les AG bass sur les chanes binaires ont de faibles performances comme le montre
michalewicz (Michalewicz, 1992).
2. La distance de Hamming entre deux nombres voisins(nombre de bits diffrents)
peut tre assez grande dans le codage binaire : lentier 7 correspond la chane
0111 et la chane 1000 correspond lentier 8. Or la distance de hamming entre
ces deux chanes est de 4, ce qui cre bien souvent une convergence, et non pas
lobtention de la valeur optimale.
1.2.1.2
Codage rel
Il a le mrite dtre simple. Chaque chromosome est en fait un vecteur dont les composantes sont les paramtres du processus doptimisation. Par exemple, si on recherche
loptimum dune fonction de n variables f (x1 , x2 , . . . , xn1 , xn ), on peut utiliser tout
simplement un chromosome ch contenant les n variables: Avec ce type de codage, la proch:
x1
x2
xn1
xn
cdure dvaluation des chromosomes est plus rapide vu labsence de ltape de transcodage (du binaire vers le rel). Les rsultats donns par Michalewicz (Michalewicz, 1992)
montrent que la reprsentation relle aboutit souvent une meilleure prcision et un gain
important en termes de temps dexcution.
1.2.1.3
Codage en base n
Dans ce type de codage, les gnes constituant un chromosome sont des chiffres exprims dans une base de numration n, ce qui permet de reprsenter n valeurs discrtes.
LAG dmarre avec une population compose de N individus dans le codage retenu. Le
choix des individus conditionne fortement la rapidit de lalgorithme. Si la position de
loptimum dans lespace de recherche est totalement inconnue, il est intressant que la
population soit rpartie sur tout lespace de recherche. Si par contre des informations
priori sur le problme sont disponibles, il parat vident de gnrer les individus dans
un espace particulier afin dacclrer la convergence. Disposant dune population initiale
souvent non homogne, la diversit de la population doit tre entretenue aux cours des
gnrations afin dexplorer le plus largement possible lespace de recherche. Cest le rle
des oprateurs de croisement et de mutation.
1.2.2
Oprateur de croisement
Le croisement est le principal oprateur agissant sur la population des parents. Il permet de crer de nouveaux individus par lchange dinformation entre les chromosomes
par leur biais de leur combinaison. La population courante est divise en deux sous populations de mme taille (N/2) et chaque couple form par un membre provenant de chaque
sous population participe un croisement avec une probabilit (pc ) souvent suprieure
0,5. Si le croisement a eu lieu entre deux chromosomes parents (ch1 et ch2 ), constitus de
l gnes, on tire alatoirement une position de chacun des parents. On change ensuite les
deux sous chanes terminales de chacun des chromosomes, ce qui produit deux enfants
0
ch1 et ch2 comme indiqu sur la figure 1.1.
F IG . 1.1 Croisement standard en un seul point
10
Dans notre exemple, Figure 1.1, un croisement localis la quatrime position a eu

lieu entre les chromosomes ch1 et ch2 : il sagit bien dun croisement en un seul point.
Ainsi on peut tendre ce principe de combinaison en choisissant non pas un seul point,
mais 2, 3, etc...(croisement en multipoints) (Man et al., 1996). Sur la figure 1.2 nous reprsentons un croisement en deux points, que nous utiliserons dans la suite de ce mmoire.
F IG . 1.2 Croisement standard en deux points
Ce type de croisement est trs efficace et peut stendre nimporte quel type de
chanes (relles, en base n, etc...). Nanmoins certains auteurs (Wu et Lin, 1999) prfrent utiliser dans le cas des chanes relles, un croisement de type barycentre: deux
gnes ch1 (i) et ch2 (i) sont slectionns dans chacun des parents la mme position i. Ils
0
dfinissent deux nouveaux gnes ch1 (i) et ch2 (i) par combinaison linaire :
(
ch1 (i) = ch1 (i) + (1 ) ch2 (i)

0
ch2 (i) = (1 ) ch1 (i) + ch2 (i)
(1.1)
o est un paramtre de pondration alatoire qui prend gnralement ses valeurs dans
lintervalle [0.5, 1.5] (ceci permet de gnrer des points entre ou lextrieur des deux
gnes considrs).
Quoi quil en soit, il se peut que leffet de loprateur de croisement soit insuffisant pour
assurer une meilleure exploration de lespace de recherche. Ainsi dans le cas du codage
binaire, certaines chanes peuvent totalement disparatre de la population. Par exemple, si
aucun chromosome de la population initiale ne contient de 1 en premire position et que ce
1 fasse partie de la chane optimale trouver, aucun croisement ne peut faire apparatre cet
lment. Ce dernier ne peut sintroduire dans la population que si lon introduit un autre
oprateur et cest, entre autre, pour remdier ce problme que loprateur de mutation
est utilis.
1.2.3
11
Oprateur de mutation
Le rle de cet oprateur est de modifier alatoirement la valeur dun gne dans un
chromosome. Dans le cas du codage binaire, chaque bit ai {0,1} est remplac par son
complmentaire ai = 1 ai . Dans lexemple de la figure 1.3, une mutation a eu lieu sur
le troisime gne du chromosome ch et elle a transform ce gne de 1 en 0.
F IG . 1.3 Principe de loprateur de mutation
Pour les chaines codes en base n, la mutation consiste remplacer le gne initial par
un chiffre en base n tir au sort.
Dans le cas dun codage rel, on utilise principalement deux oprateurs de mutation: la
mutation uniforme et la mutation non uniforme (Michalewicz, 1992). En supposant fixe
la probabilit de mutation pm , un tirage au sort pour chaque gne xk dun chromosome ch
permet de dcider si ce gne doit tre ou non modifi. Nous supposons que le gne prend
max
ses valeurs dans un intervalle [xmin
].
k ,xk
Pour la mutation uniforme, qui est une simple extension de la mutation binaire, on rem0
place le gne xk slectionn par une valeur quelconque xk tire alatoirement dans linmax
tervalle [xmin
].
k ,xk
Pour la mutation non uniforme, le calcul de la nouvelle valeur dun gne est un peu plus
complexe. Le gne xk subit des modifications importantes durant les premires gnrations, puis graduellement dcroissantes au fur et mesure que lon progresse dans le
processus doptimisation. Pour une gnration t, on tire au sort une valeur binaire qui
0
dcidera si le changement doit tre positif ou ngatif. La nouvelle valeur xk du gne xk

est donne par :
(
0
xk =
xk + 4(t,xmax
xk )
k
si rand = 0
xmin
k )
si rand = 1
xk 4(t,xk
(1.2)
o 4(t,y) est une fonction qui dfinit lcart entre la nouvelle valeur et la valeur initiale
12
la gnration t et rand est nombre altoire qui prend les valeurs 0 ou 1.

Dans (Cordon et al., 2001), les auteurs proposent dutiliser une fonction 4(t,y) correspondante une dcroissance exponentielle de lcart travers les gnrations. Cette fonction est dfinie par :
4(t,y) = y (1 r(1t/T ) )
(1.3)
o T est lindice de gnration pour laquelle lamplitude de la mutation sannule, est

un paramtre de loprateur de mutation (souvent = 5), r est un nombre produit alatoirement dans lintervalle [0,1] et t le numro de la gnration.
Si par contre, lintervalle de variations du gne xk nest pas connu, une mutation gaussienne est souvent utilise. Le principe de base de ce type de mutation est dajouter un
bruit gaussien centr N (0,) au gne que lon dsire faire muter:
0
xk = xk + N (0,)
(1.4)
o reprsente la variance.
La mutation est traditionnellement considre comme un oprateur intervenant la marge,
dans la mesure o sa probabilit est en gnral assez faible (de lordre de 1%). Mais
elle confre aux algorithmes gntiques une proprit trs importante : lergodicit (tous
les points de lespace de recherche peuvent tre atteints). Cet oprateur est donc dune
grande importance et il est loin dtre marginal, dailleurs un algorithme gntique peut
converger sans loprateur de croisement et certaines applications fonctionnent de cette
manire (Hwang, 1999).
1.2.4
Fonction dvaluation
Un algorithme gntique ncessite gnralement la dfinition dune fonction rendant

compte de la pertinente des solutions potentielles, partir des grandeurs optimiser.
Nous la nommerons fonction dadaptation f (ou fitness function en terminologie anglosaxonne). Elle est souvent exprime par la composition de deux fonctions g et h:
f =gh
(1.5)
avec:
: loi de composition de fonctions
g: fonction de transformation, pouvant tre linaire, exponentielle, logarithmique, etc . . ..
h: fonction objectif ou de cot, elle dpend de lobjectif recherch.
1.2.5
13
Oprateur de slection
La slection cre une population intermdiaire constitue de copies des individus de

la population courante. En rgle gnrale, le nombre de copies dun individu est li directement la fitness relative de lindividu au sein de la population. Il existe plusieurs
mthodes heuristiques qui reprsentent la reproduction, la mthode la plus connue et la
plus utilise est la slection par roulette biaise (roulette wheel selection) de Goldberg
(Goldberg, 1994). Selon cette mthode, chaque chromosome est copi dans la nouvelle
population proportionnellement sa fitness. On effectue en quelque sorte, autant de tirages avec remise que dlments existant dans la population. Ainsi pour un chromosome
particulier chi de fitness f (chi ), la probabilit de sa slection dans la nouvelle population
de taille N est :
p(chi ) =
f (chi )
N
X
(1.6)
f (chj )
j=1
Plus la performance dun individu est leve par rapport celle des autres, plus il a une
chance dtre reproduit dans la population. Les individus ayant une grande fitness relative
ont donc plus de chance dtre slectionns. On parle alors de slection proportionnelle.
Le nombre de copies espres pour chaque individu chi qui va rsulter de la slection est
alors gal :
ni = N p(chi ) =
f (chi )
f (chi )
=
N
f
1 X
f (chj )
N j=1
(1.7)
Linconvnient majeur de ce type de reproduction vient du fait quil peut favoriser la

dominance dun individu qui nest pas forcment le meilleur. Cette mthode peut aussi
engendrer une perte de diversit par la dominance dun super-individu. Pour palier cet inconvnient, on prfre souvent des mthodes qui nautorisent en aucun cas lapparition de
super-individu. Par exemple, la slection par tournoi (tournement selection) ou dautres
mthodes faisant intervenir un changement dchelle (Scalling) et/ou des notions de voisinage entre chromosomes (Sharing).
14
1.2.5.1
Slection par tournoi
On tire deux individus alatoirement dans la population et on reproduit le meilleur

des deux dans la nouvelle population. On rpte la procdure jusqu ce que la nouvelle
population soit complte.
1.2.5.2
Sharing
Le sharing consiste ajuster la fitness des individus pour viter quils se concentrent
dans une niche principale (optimum globale). La technique de partage de la fitness (fitness
sharing), introduite par Goldberg et Richardson (Goldberg et Richardson, 1987), rduit la
fitness de chaque individu dun facteur correspondant environ au taux dagrgation de la
population autour de son voisinage :
f 0 (chi ) =
f (chi )
mi
(1.8)
o le compteur de niche mi se calcule de la manire suivante:
mi =
N
X
sh(dij )
(1.9)
j=1
O N dsigne la taille de la population et sh mesure la similarit entre deux individus i

et j en fonction de la distance dij et le rayon de niche shar :
1 ( dij )
shar
sh(dij ) =
si dij < shar
(1.10)
sinon
La figure 1.4 montre deux exemples de rpartition de populations dans le cas dune fonction multimodale: le premier sans sharing et le deuxime avec sharing.
15
F IG . 1.4 Effet de sharing sur la rpartition des solutions
Si le principe de sharing a t utilis initialement dans lespace de paramtres (le critre de distance tant fonction des paramtres), il est tout a fait possible de ladapter dans
lespace des objectifs. Cest dailleurs cette ide qui est exploite dans les algorithmes
gntiques multi-objectifs.
1.2.5.3
Elitisme
La stratgie litiste consiste conserver le meilleur individu chaque gnration.

Ainsi llitisme empche lindividu le plus performant de disparatre au cours de la slection ou que ses bonnes combinaisons soient affectes par les oprateurs de croisement
et de mutation. Aprs chaque valuation de la performance des individus une gnration t donne, le meilleur individu de la gnration prcdente (t 1) est rintroduit dans
la population si aucun des individus de la gnration t nest meilleur que lui. Par cette
approche, la performance du meilleur individu de la population courante est monotone
de gnration en gnration. Il apparat que llitisme amliore considrablement les performances de lalgorithme gntique pour certaines classes de problmes, mais peut les
dgrader pour dautres classes, en augmentant le taux de convergences prmatures.
16
1.3
Algorithmes Gntiques Hirarchiss
En dpit des avantages des algorithmes gntiques standards (AGS) pour la rsolution
des problmes doptimisation difficiles o dautres techniques ont chou, ils prsentent
quand mme des limites, quand on sintresse loptimisation de la topologie dun systme plutt qu loptimisation seule de ses paramtres, car le chromosome et la structure
du phnotype dans lAGS sont fixs ou prdfinis, ce qui conduit lutilisation des AGH
qui surmontent ces contraintes (Tang et al., 1995; Xiang et al., 2006). Les AGH diffrent
des AGS dans la structure des chromosomes. Ils prsentent une structure hirarchique et
se composent de deux types de gnes : les gnes de contrle et les gnes de paramtres.
Les gnes de contrle ont un rle dactivation ou de dsactivation des blocs, tandis que
les gnes de paramtres dfinissent la valeur des coefficients dans chaque bloc.
1.3.1
Formulation du chromosome hirarchis
La formulation hirarchique du chromosome se base sur le principe naturel de lADN :

les gnes paramtriques (analogie aux gnes structuraux en ADN) et les gnes de contrle
sous forme de bits (analogie aux ordres de normalisation en ADN). Pour gnraliser cette
architecture, plusieurs niveaux de gnes de contrle sont prsents dune manire hirarchique comme illustre par la figure 1.5.
F IG . 1.5 Structure hirarchique dun chromosome
Dans ce cas-l, lactivation des gnes paramtriques est rgie par la valeur du premier niveau du gne de contrle, qui est rgi son tour par la valeur du deuxime niveau
1.3. ALGORITHMES GNTIQUES HIRARCHISS
17
du gne de contrle, et ainsi de suite. Pour indiquer lactivation du gne de contrle, un

nombre entier "1" est assign pour chaque gne de contrle actif et "0" pour chaque gne
de contrle inactif. Quand "1" est signal, les gnes de paramtres associs ce gne actif,
sont activs dans la structure infrieure. Pour mieux comprendre le concept, prenons les
exemples de la figure 1.6: Les chromosomes ch1 et ch2 , sont constitus chacun de 6 gnes
de contrle et 6 gnes de paramtres. Le chromosome ch1 correspond une squence de
paramtres S(ch1 ) = (3,2,7,8) dune longueur qui diffre de celle du chromosome ch2
(S(ch2 ) = (2,5)). Ceci signifie que le phnotype peut exister avec des longueurs diffrentes dans une structure fixe. Ainsi un AGH peut explorer toutes les longueurs possibles,
y compris les paramtres de sort satisfaire les exigences et les objectifs tracs. Enfin il
est possible daugmenter le niveau hirarchique dans le chromosome en ajoutant un ou
plusieurs niveaux de gnes de contrle. Ceci est illustr par la figure 1.6-b o une structure
deux niveaux de gnes de contrle est prsente.
F IG . 1.6 Principe de dcodage des chromosomes des AGH
La structure dun chromosome contient la fois des gnes actifs et inactifs. Il faut
noter que les gnes inactifs existent toujours dans le chromosome et peuvent tre transmis
ensuite aux nouvelles gnrations. Cette architecture hirarchique implique que le chromosome contient plus dinformations que celle de la structure conventionnelle des AG.
Par consquent, la puissance artificielle est largement amliore.
18
1.3.2
Oprateurs gntiques
Les oprateurs gntiques de base peuvent tre utiliss sans aucune contrainte. La
mutation et le croisement peuvent tre appliqus indpendamment chaque niveau de
gnes de contrle. Cependant, les oprateurs gntiques qui affectent les niveaux hauts
des gnes de contrle et produisent des changements des gnes actifs mnent des changements multiples dans les niveaux infrieurs. Cest la raison pour laquelle, un AGH est
capable dobtenir le meilleur ensemble de paramtres dun systme avec une topologie
ou structure minimise.
1.4
Optimisation multi-objectifs
Dans la section prcdente, nous avons considr uniquement le cas o le problme

traiter possdait un objectif unique optimiser. En pratique ces problmes sont rares, il
sagit souvent de satisfaire plusieurs critres simultanment. Loptimisation multi-objectifs
sintresse ce type de problme que lon peut dfinir de la manire suivante :
(
min(F (X) = (f1 (X),f2 (X)...fn (X)))

XC
(1.11)
o n est le nombre de fonctions objectifs, X = [x1 ,x2 ,...xm ] est le vecteur reprsentant les variables de dcision. C reprsente lensemble des solutions ralisables associ
des contraintes dgalit et dingalit et F (X) = (f1 (X),f2 (X)...fn (X)) est le vecteur
dobjectifs.
Dans un problme doptimisation multi-objectifs, il y a plus quune fonction dobjectif
(n 2), chaque fonction peut avoir un optimum diffrent. Le but dun problme multiobjectifs est donc de trouver de "bons compromis" plutt quune seule solution ( moins
quune solution soit optimale pour toutes les fonctions objectifs, ce qui est rarement le
cas). Lorsquil y a plusieurs objectifs, la notion doptimum change, elle est remplace par
les notions de dominance et doptimalit de Pareto.
Dfinition 1 (la dominance): une solution A domine une solution B pour un problme
de minimisation (resp. maximisation) si et seulement si:
i {1, 2, . . . ,n} : fi (A) fi (B) (resp. fi (A) fi (B))
et j {1,2,...,n} : fj (A) < fj (B) (resp. fj (A) > fj (B))
(1.12)
1.4. OPTIMISATION MULTI-OBJECTIFS
19
On dit que B est domine par A ou entre les deux solutions, A est la solution non domine.
Dfinition 2 (Pareto optimum): un vecteur X C est un optimum de Pareto sil
nexiste aucune solution X de C qui domine X .
Au lieu dune solution unique, loptimisation multi-objectifs donne lieu un ensemble
de solutions optimales. Toute solution de cet ensemble est optimale dans le sens quil est
impossible damliorer les performances, sur un critre de cette solution, sans que cela
entrane une dgradation des performances, sur au moins un autre critre. Ces solutions
optimales forment lensemble de solutions Pareto optimales, elles sont aussi connues sous
le nom de solutions efficaces, non infrieures et non domines. La reprsentation de ces
solutions non domines dans lespace dobjectif est appele front de Pareto. La figure 1.7
montre un exemple de front de Pareto pour un problme de minimisation deux objectifs.
Lensemble de points blancs reprsentent le front de Pareto.
F IG . 1.7 Front de Pareto
Les algorithmes gntiques, avec un bon rglage de leurs paramtres, constituent une
approche intressante pour la rsolution des problmes doptimisation multi-objectifs. De
plus, ce domaine est trs dynamique et ne cesse de se dvelopper. Il a t propos plusieurs mthodes pour le traitement des problmes multiobjectifs. Ces mthodes peuvent
tre classes principalement en deux catgories: La premire catgorie enveloppe les mthodes "agrgatives", qui transforment le problme en un problme uni-objectif utilisant
20
une fonction objectif quivalente. La deuxime famille comporte les mthodes dites "non
agrgatives", dans ces mthodes il ny a pas fusion dobjectifs pour se ramener un problme doptimisation mono-objectif.
1.4.1
Mthode agrgative
Cest lune des premires mthodes utilise pour rsoudre les problmes doptimisation multiobjectifs (MO). Elle consiste transformer le problme MO en un problme
monoobjectif en combinant les composantes fi du vecteur objectif du problme en une
seule fonction scalaire f . Il existe dans la pratique, diffrentes faons de construire la
fonction f . La plus classique et la plus utilise se ramne une simple somme pondre
des objectifs fi (agrgation additive):
f=
n
X
i fi
(1.13)
i=1
o les paramtres i sont les poids de pondration. La figure 8 illustre linterprtation

gomtrique de la mthode de pondration dans le cas dun problme deux objectifs.
Fixer un vecteur de poids revient trouver un hyper plan dans lespace objectif (une ligne
pour un problme bi-objectif). La solution Pareto optimale est le point o lhyper-plan
possde une tangente commune avec lespace ralisable. La mthode de pondration est
relativement simple utiliser mais il est assez difficile de fixer a priori les valeurs des
poids associs chaque objectif. Il est par ailleurs impratif de normaliser les objectifs
lorsque ceux-ci sont non-commensurables, ce qui est souvent le cas. Ce problme de mise
lchelle savre complexe car les valeurs de normalisation ne sont pas faciles dterminer. De plus, comme le montre la figure 1.8-b, cette mthode nest pas adapte aux
espaces non convexes qui empchent lalgorithme de converger vers loptimum global.
Le champ applicatif de cette mthode se trouve alors fortement rduit.
Grce au principe de pondration, il est possible avec un algorithme gntique standard
dobtenir le front de Pareto dun problme multi-objectifs. Il est ncessaire pour cela
dexcuter lalgorithme plusieurs fois successives en faisant varier les facteurs de pondration (voir figure 1.9).
21
F IG . 1.8 Interprtation gomtrique de la mthode dagrgation
Toutefois, une variation uniforme des poids ne garantit pas la dtermination des solutions Pareto optimales uniformment rparties sur le front.
F IG . 1.9 Illustration de la variation des coefficients de pondration pour la recherche

du front de Pareto
22
1.4.2
Mthode non agrgative
Comme nous lavons signal prcdemment, la mthode agrgative peut tre utilise de faon squentielle pour obtenir le front de Pareto pour un problme doptimisation multi-objectifs. Toutefois, cette approche nest gnralement pas satisfaisante car le
nombre dexcutions successives ncessaires pour dterminer les diffrents compromis
conduit alors un nombre dvaluations de critres prohibitif. Ainsi, pour surmonter cette
difficult, on prfre utiliser des mthodes permettant dune part de trouver lensemble
de solutions Pareto optimales en une seule excution et dautre part de saffranchir des
problmes de mise lchelle des objectifs. Parmi ces mthodes on peut citer :
Vector Evaluated Genetic Algorithm (VEGA)
Multiple Objective Genetic algorithm (MOGA)
Niched Pareto genetic algorithm (NPGA)
Nondominated sorting genetic algorithm (NSGA) et sa deuxime version (NSGAII)
1.4.2.1
Vector evaluated genetic algorithm (VEGA)
Le VEGA (Vector evaluated genetic algorithm) propos par Schaffer (1985), a t la

premire mthode non agrgative utilisant les algorithmes gntiques pour rsoudre un
problme doptimisation multiobjectif. Cet algorithme considre une population de N individus. A chaque gnration, la population est divise en un nombre de sous populations
gal au nombre dobjectifs. Chaque sous population i est slectionne en considrant un
seul objectif fi . Ensuite, ces sous populations sont regroupes afin dobtenir une nouvelle
population de N individus et les oprateurs de croisement et de mutation sont appliqus.
Lavantage de cet algorithme est quil est facile implmenter et combiner avec nimporte quel mode de slection (tournoi, roulette, rang), mais son inconvnient majeur est
quil a tendance gnrer des solutions qui excellent dans un seul objectif, sans tenir
compte des autres objectifs (points extrmes du front). Toutes les solutions de performance moyenne (ne possdant aucun objectif fort) et qui peuvent tre de bons compromis,
risquent de disparatre avec ce type de slection.
1.4.2.2
23
Multiple Objectives Genetic Algorithm (MOGA)
Cet algorithme, propos par Fonseca et Fleming (1993), utilise la notion de dominance
pour ranger les individus de la population. Il diffre de lalgorithme gntique standard
uniquement dans la manire dont la fitness est assigne pour chaque solution. Pour dmarrer lalgorithme, les relations de domination sont dabord calcules pour chaque solution.
Puis, pour une solution i, un rang gal un plus le nombre de solutions ni qui dominent
la solution i est attribu. Une fitness est ensuite attribue chaque solution en fonction
de son rang, les individus avec les rangs les plus faibles ayant les meilleures fitness. Afin
de maintenir la diversit entre les solutions non domines, les auteurs utilisent une fonction de partage (Sharing). La mthode permet dobtenir des solutions de bonne qualit et
simplante facilement. Toutefois, les performances sont trs dpendantes de la valeur du
paramtre shar utilis dans le sharing.
1.4.2.3
NSGA (Nondominated Sorting Genetic Algorithm)
Dans lalgorithme NSGA propos par Srinivas et Deb (1993), le calcul de fitness seffectue en divisant dabord la population en plusieurs fronts en fonction du degr de dominance au sens de Pareto de chaque individu. Les individus non domins de la population
courante constituent le premier front de Pareto. On attribue alors tous les individus de ce
front la mme valeur de fitness factice. Cette valeur est suppose donner une chance gale
de reproduction tous ces individus. Mais pour maintenir la diversit de la population, il
est ncessaire dappliquer une fonction de partage sur cette valeur. En suite, ce premier
groupe dindividus est temporairement supprim de la population. On recommence cette
procdure jusqu lidentification des solutions du deuxime front. La valeur factice de
fitness attribue ce second groupe est infrieure la plus petite fitness, aprs application
de la fonction de partage sur le premier front. Ce mcanisme est rpt jusqu ce que lon
ait trait tous les individus. Lalgorithme se droule ensuite comme un algorithme gntique standard. Grce sa procdure dassignement de fitness base la fois sur la notion
de dominance et la fonction de partage, le NSGA semble le plus appropri maintenir la
diversit de la population et rpartir plus efficacement les solutions sur le front de Pareto.
Nanmoins, cet algorithme prsente quelques insuffisances en raison de sa complexit de
calcul et de sa sensibilit au choix de la valeur shar .
24
1.4.2.4
Niched Pareto Genetic Algorithm (NPGA)
Cette mthode propose par Horn et Napfliotis (1994) utilise une slection par tournoi
en se basant sur la notion de dominance de Pareto. Le NPGA excute les mmes tapes
que lAG standard, la seule chose qui diffre tant la mthode de slection. A chaque
tournoi, deux individus candidats A et B sont pris au hasard dans la population courante.
Au lieu de limiter la comparaison aux deux individus (comme cest le cas pour lAG standard), une sous population (ou ensemble de comparaison) de taille tdom est galement
choisie au hasard. Les deux candidats slectionns sont compars chaque individu du
sous-groupe. Si lun des candidats est domin par lensemble de comparaison et le second
ne lest pas, ce dernier est alors positionn dans la population suivante. Dans les autres
cas, une fonction de partage est applique pour choisir le candidat gagnant. Le paramtre
tdom permet de contrler la pression de slection ou de dominance.
Lalgorithme NPGA est considr comme tant lalgorithme le plus rapide parmi les approches prcdentes car chaque gnration la comparaison nest applique que sur une
portion de la population. Le principal inconvnient de cet algorithme est quil ncessite,
en plus de spcifier le paramtre de sharing shar , un autre paramtre supplmentaire qui
est la taille du tournoi tdom .
1.4.2.5
NSGA-II
Toutes les mthodes que nous venons de prsenter ne conservent pas leurs solutions
Pareto-optimales trouves au cours des gnrations. Elles sont dites non litistes. Pour
rsoudre cette difficult, de nouvelles techniques ont t appliques. Nous avons choisi
de prsenter uniquement le NSGA-II car il a t utilis dans nos travaux. Nous ne ferons
que citer les deux autres mthodes les plus connues savoir Strength Pareto Evolutionary
Algorithm (SPEA) et Pareto Envelope-based Selection Algorithm (PESA) prsentes plus
amplement dans les rfrences (Zitzler et Thiele, 1999) et (Corne et al., 2000).
En proposant le NSGA II, Deb (Deb et al., 2002) a tent de rsoudre toutes les critiques
faites sur NSGA: non litiste, complexit de calcul et utilisation de sharing qui implique
le rglage dun ou plusieurs paramtres. Dans cet algorithme, chaque gnration t une
population de parents (Pt ) de taille N et une population denfants (Qt ) de mme taille
sont assembles pour former une population (Rt ) de taille 2N , comme indiqu sur la
figure 1.10. Cet assemblage permet dassurer llitisme. La population (Rt ) est ensuite
25
rpartie en plusieurs fronts (F1 , F2 , . . .) par une procdure de tri, plus rapide que celle
propose dans la premire version de NSGA. Une nouvelle population parent (Pt+1 ) est
forme en ajoutant les fronts au complet (premier front F1 , second front F2 , etc...) tant
que ce ceux-ci ne dpassent pas N . Si le nombre dindividus prsents dans (Pt+1 ) est
infrieur N , une procdure de crowding est applique sur le premier front suivant Fi
non inclus dans (Pt+1 ). Le but de cet oprateur est dinsrer les (N Pt+1 ) meilleurs
individus de Fi qui manquent dans la population (Pt+1 ). Une fois que les individus de
la population (Pt+1 ) sont identifis, une nouvelle population enfant (Qt+1 ) est cre par
slection, croisement et mutation. La slection par tournoi est utilise mais le critre de
slection est maintenant bas sur loprateur de comparaison (<n ) dfini ci-dessous. Le
processus se rpte dune gnration une autre jusqu satisfaction dun critre darrt.
F IG . 1.10 Schma de lvolution de lalgorithme NSGA-II
Procdure de tri rapide (Fast sorting non dominated)

La rpartition de la population en plusieurs fronts seffectue de la manire suivante :
1. Pour chaque solution p de Rt on calcule deux paramtres:
np (compteur de dominance), il reprsente le nombre de solutions qui dominent la solution p
26
Si ensemble de solutions domines par p.
2. i = 1 initialisation du compteur de front
3. Identification des solutions non domines np = 0, ces solutions forment le front Fi .
4. Pour chaque solution p de Fi on parcourt lensemble Sp et on retranche 1 au np de

chaque solution.
5. i = i + 1 incrmente le compteur de front
6. On recommence les tapes partir de 3 jusqu ce que tous les points soient traits.
Cet algorithme est dune complexit de O(k.N 2 ), alors que celui utilis dans la premire
version est de O(k.N 3 ). k tant la taille du vecteur objectifs
Distance de crowding
La dernire critique faite sur le NSGA est lutilisation du sharing. Une mthode qui exige
le rglage dun ou plusieurs paramtre(s). Dans NSGA-II, Deb et al remplacent la procdure de sharing par une procdure de crowding, base sur un calcul de distance (distance
de crowding) qui ne ncessite aucun paramtrage et qui est galement dune complexit
algorithmique moindre que celle de sharing. La distance de crowding dune solution particulire i se calcule en fonction du primtre de lhypercube ayant comme sommets les
points les plus proches de i sur chaque objectif. Sur la figure 1.11, est reprsent lhypercube en deux dimensions associ au point i. Le calcul de la distance de crowding
ncessite, avant tout, le tri des solutions selon chaque objectif, dans un ordre ascendant.
Ensuite, pour chaque objectif, les individus possdant des valeurs limites se voient associs une distance infinie. Pour les autres solutions intermdiaires, on calcule une distance
de crowding gale la diffrence normalise des valeurs des fonctions objectifs de deux
solutions adjacentes. Ce calcul est ralis pour chaque objectif. La distance de crowding
dune solution est obtenue en sommant les distances correspondantes chaque objectif.
27
F IG . 1.11 Distance de crowding (les points noirs sont des solutions appartenant au
mme front)
Lalgorithme 1 reprend toutes les tapes dcrites ci-dessus.

Algorithm 1 Calcul de la distance de crowding pour chaque solution dun front
1: l = |I|, nombre de solutions dans le Front I
2: Pour chaque solution i poser I[i]distance = 0, Initialisation des distances.
3: Pour chaque objectif m:
-I = trier(I,m), trier I par ordre croissant selon le critre m

-I[1]distance = I[l]distance = +
-Pour i=2 jusqu l 1 faire
I[i]distance = I[i]distance + (
i+1
i1
fm
fm
)
M ax
M in
fm
fm
i+1
i1
Dans cet algorithme, fm
et fm
reprsentent respectivement les valeurs de la mime
M ax
M in
fonction objectif des solutions i + 1 et i 1 alors que les paramtres fm
et fm
dsi-
gnent les valeurs maximale et minimale de la mime fonction objectif.

Oprateur de crowding de comparaison( n )
Cet oprateur est utilis pour guider le processus de slection comme suit : chaque solution i de la population est identifie par son rang irank et sa distance de crowding idistance .
28
Loprateur n , dfini ci-dessous, permet dtablir un ordre de prfrence entre deux

solutions:
i n j
si (irank < jrank )

ou (irank = jrank ) et (idistance > jdistance )
Entre deux solutions de fronts diffrents, on prfre la solution avec le plus petit front.
Pour deux solutions qui appartiennent au mme front, on prfre la solution situe dans
une rgion dpeuple, cest--dire la solution possdant la plus grande valeur de distance
de crowding.
1.5
Conclusion
Dans ce chapitre, nous avons dcrit le fonctionnement et les diffrents oprateurs dun
algorithme gntique standard, technique doptimisation mono-objectif. Nous avons vu
que ces algorithmes prsentent des inconvnients lorsquon sintresse loptimisation
de la topologie dun systme plutt qu loptimisation seule des ses paramtres. Cela
nous a conduits introduire une autre version dalgorithmes mieux adapte cette classe
de problmes nomme "algorithmes gntiques hirarchiss". Nous avons galement dcrit dans ce chapitre le problme doptimisation multi-objectifs et quelques algorithmes
gntiques de rsolution rapports dans la littrature. Parmi les algorithmes examins, le
NSGA-II semble tre aujourdhui lune des techniques de rfrence qui garantit la diversit des solutions Pareto-optimal sans quil soit ncessaire de connatre le rayon de
niche.
Chapitre 2
Rseaux de neurones et systmes flous
2.1
Introduction
Lutilisation des rseaux de neurones (RN) et des systmes flous (SF) pour la synthse
des systmes de commande a connu un essor important au cours de ces dernires annes.
Dans ce chapitre, nous allons dcrire ces outils ainsi que les modalits de leur utilisation.
Le chapitre est organis en trois parties. La premire partie fait lobjet dune tude dtaille sur lemploi des rseaux de neurones pour la commande. Aprs une brve prsentation de quelques notions gnrales sur les rseaux de neurones, nous prsentons les deux
grandes familles de structures neuronales les plus utilises. Nous abordons galement le
problme dapprentissage des paramtres de ces structures, nous nous intressons particulirement lalgorithme de rtropropagation. Nous exposons dans un deuxime temps,
la classification des principales approches de la commande par rseaux de neurones rencontres dans la littrature. Notre but nest pas de dresser une liste complte mais plutt
de dgager les lignes directrices communes. Certaines architectures sont ainsi absentes
dans cette classification mais on peut gnralement les rattacher lune des classes proposes. La deuxime partie sera consacre aux systmes flous. Aprs une prsentation
gnrale de quelques notions sur les ensembles flous, nous prsentons en dtail la structure interne dun contrleur flou. Ce dernier est considr comme lune des applications
les plus importantes des systmes flous. Dans la troisime partie, nous aborderons la technique dhybridation entre ces deux paradigmes (SF et RN), employe frquemment pour
la modlisation et la commande des systmes complexes.
29
30
CHAPITRE 2. RSEAUX DE NEURONES ET SYSTMES FLOUS
2.2
Rseaux de neurones
2.2.1
Le neurone formel
Un neurone formel est un automate trs simple imitant grossirement la structure et

le fonctionnement dun neurone biologique. La premire version de ce dernier est celle
de Mc Culloch et W. Pitts et date de 1943. Sinspirant de leurs travaux sur les neurones
biologiques, ils ont propos le modle du neurone formel qui se voit comme un oprateur
effectuant une somme pondre de ses entres suivie dune fonction dactivation (ou de
transfert) comme indiqu par la figure 2.1.
Oi reprsente la somme pondre des entres du neurone, elle est donne par :
Ui =
ij xj + bi
(2.1)
o: xj reprsente lentre j connecte au neurone i. bi le seuil interne du neurone.

ij dsigne le poids de la connexion reliant lentre j au neurone.
Oi = g(Ui ) est la sortie du neurone et g sa fonction dactivation.
F IG . 2.1 Modle de base dun neurone formel
La fonction dactivation de chaque neurone dtermine ses propres caractristiques. Par

consquent, le type du neurone est caractris par sa fonction dactivation. Conformment au neurone biologique, les fonctions dactivation sont gnralement croissantes et
continues. Les fonctions les plus utilises sont la fonction linaire et la fonction sigmode.
Leur choix revt une importance capitale et dpend souvent du type de lapplication et du
domaine de variation des variables dentre/sortie.
2.2. RSEAUX DE NEURONES
31
Un rseau de neurones (RN) est un systme informatique qui a des caractristiques semblables aux rseaux de neurones biologiques. Il est constitu de plusieurs units (neurones) organises sous forme de niveaux diffrents appels couches du rseau. Les neurones appartenant la mme couche possdent les mmes caractristiques et utilisent le
mme type de fonction dactivation. Entre deux couches voisines les connexions se font
par lintermdiaire de poids qui jouent le rle des synapses. Linformation est porte par
la valeur de ses poids, tandis que la structure du rseau de neurones ne sert qu traiter
linformation et lacheminer vers la sortie. La structure ou la topologie dun rseau de neurones est la manire dont les neurones sont connects. Les structures rsultantes peuvent
tre trs varies mais elles sont souvent rparties en deux grandes familles savoir : les
rseaux de neurones non boucls et les rseaux de neurones boucls (Burns, 2001).
2.2.2
Rseaux non boucls
Dans ce type de structure dite feedforward, la propagation de linformation se fait uniquement de lentre vers la sortie. Les neurones de la mme couche peuvent se connecter
uniquement avec les neurones de la couche suivante. Larchitecture la plus utilise est le
Perceptron multicouches. Les neurones composant ce rseau sorganisent en N couches
successives (N 3). Dans lexemple suivant (figure 2.2), nous prsentons un perceptron
trois couches. Les neurones de la premire couche, nomme couche dentre, voient
leur activation force la valeur dentre. La dernire couche est appele couche de sortie. Elle regroupe les neurones dont les fonctions dactivation sont gnralement de type
linaire. Les couches intermdiaires sont appeles couches caches. Elles constituent le
cur du rseau. Les fonctions dactivation utilises sont de type sigmode.
F IG . 2.2 Perceptron une couche cache
32
Sur la figure 2.2, les termes bli et ijl dsignent respectivement le biais du neurone i de
la couche l et le poids de connexion entre le neurone j de la couche l 1 et le neurone i
de la couche l.
Tenant compte de ces notations, la sortie du neurone i dans la couche l est peut tre donne
par :
Nl1
Uil
ijl Ojl1 + bli
(2.2)
Oil = g l (Uil )
(2.3)
l = 1,2
o g l (.) est la fonction dactivation des neurones de la couche l.
On peut rcrire les quations ci-dessus sous forme matricielle comme suit :
U l = W l Ol1 + bl
(2.4)
Ol = g l (U l )
(2.5)
l T
avec : U l = (U1l ,U2l ,.....,UNl l )T , Ol = (O1l ,O2l ,.....,ON
) , bl = (bl1 ,bl2 ,.....,blNl )T et
l
l
11
l
21
l
12
l
22
l
1N
l1
l
2N
l1
l
W = .
.
.
..
..
..
l
l
l
N
12
Nl Nl1
l1
Le perceptron multicouche prsente une alternative prometteuse pour la modlisation des
systmes complexes. Avec une seule couche cache, il constitue un approximateur universel. Les tudes menes dans (Hornik et al., 1989; Cybenko, 1989) montrent quil peut tre
entrain de manire approximer nimporte quelle fonction sous rserve de mettre suffisamment de neurones dans la couche cache et dutiliser des sigmodes comme fonctions
dactivation.
2.2.3
33
Rseaux boucls
Un rseau dynamique ou rcurrent possde la mme structure quun rseau multicouches munie de rtroactions. Les connexions rtroactives peuvent exister entre tous les
neurones du rseau sans distinction, ou seulement entre certains neurones (les neurones
de la couche de sortie et les neurones de la couche dentre ou les neurones de la mme
couche par exemple). La figure 2.3 montre deux exemples de rseaux rcurrents. Le premier est un simple multicouches qui utilise un vecteur dentre qui contient les copies des
activations de la couche de sortie du rseau et le deuxime est un rseau mmoire se
distingue du premier par la prsence des units mmoires (Sastry et al., 1994).
F IG . 2.3 Rseaux de neurones rcurrents
2.2.4
Apprentissage dans les rseaux de neurones
Lapprentissage dans le contexte des rseaux de neurones, est le processus de modification des poids de connexions (y compris les biais) ou plus rarement du nombre de
couches et de neurones (Man et Halang, 1997), afin dadapter le traitement effectu par le
rseau une tache particulire.
On distingue trois familles dapprentissage :
apprentissage supervis: Dans ce cas, un superviseur(ou expert humain) fournit
une valeur ou un vecteur de sortie (appel cible ou sortie dsire), que le rseau de
neurones doit associer un vecteur dentre. Lapprentissage consiste dans ce cas
34
ajuster les paramtres du rseau afin de minimiser lerreur entre la sortie dsire et
la sortie relle du rseau.
apprentissage semi-supervis ou apprentissage par renforcement: Ce mode dapprentissage, suppose quun comportement de rfrence nest pas possible, mais en
revanche, il est possible dobtenir des indications qualitatives (vrai, faux, ...) sur les
performances du rseau.
apprentissage non supervis: Dans cet apprentissage, les donnes ne contiennent
pas dinformation sur la sortie dsire. Il ny a pas de superviseur. La tche du
rseau consiste, par exemple dans ce cas, crer des regroupements de donnes
selon des proprits communes (classification).
2.2.4.1
Algorithme de rtropropagation du gradient
Lalgorithme de rtropropagation (backpropagation) est lun des algorithmes supervis les plus utiliss pour lapprentissage des rseaux de neurones. Cest dailleurs sa
dcouverte au dbut des annes 80 (Rumelhart et McClelland, 1986) que lon doit le
renouveau dintrt pour les rseaux de neurones. Lobjectif de cet algorithme est de modifier les poids du rseau dans le sens contraire du gradient du critre de performance.
Dans ce qui suit, nous allons prsenter les quations constituant lalgorithme en utilisant
un rseau multicouches. Une mise sous forme matricielle sera aussi faite afin de faciliter
limplantation de lalgorithme sous un logiciel bien adapt aux calculs matriciels.
Considrons le rseau multicouche dcrit prcdemment. Pour allger lexpos, on suppose que lapprentissage se fait chaque prsentation dun couple entre/sortie de lensemble dapprentissage. Le critre de performance minimiser peut tre alors exprim
par :
J(t) = 0.5
NL
X
(OiL (t) di (t))2
(2.6)
i=1
avec:
J(t)est la valeur du critre linstant t.
di (t) est la ime sortie dsire linstant t.
Les paramtres du rseau sont modifis suivant la rgle du gradient comme suit:
J(t)
ijl (t)
J(t)
bli (t + 1) = bli (t) l
bi (t)
ijl (t + 1) = ijl (t)
(2.7)
(2.8)
35
avec est une constante positive appele taux dapprentissage.

J
J
Le calcul des quantits
et
fait intervenir les dcompositions ci-dessous:
b
J(t)
J(t)
Uil (t)
=
ijl (t)
Uil (t) ijl (t)
(2.9)
J(t)
J(t)
Uil (t)
=
bli (t)
Uil (t)
bli (t)
(2.10)
De lquation (2.2) on dduit que:
En posant, il (t) =
Uil (t)
= Ojl1
l
ij (t)
(2.11)
Uil (t)
= 1
bli (t)
(2.12)
J(t)
on obitent:
Uil
J(t)
= il (t) Ojl1
l
ij (t)
J(t)
= il (t)
l
bi (t)
(2.13)
(2.14)
La quantit il exprime la sensibilit du critre de performance aux changements du potentiel Uil du neurone i de la couche l. Dans le cas o i est lindice dun neurone de sortie
(l = L), on obtient :
iL (t) =
J(t)
J(t) OiL
=
= (OiL (t) di (t)) g l (UiL (t))

L
L
L
Ui
Oi
Ui
(2.15)
avec
dg L (UiL (t))
dUiL (t)
Dans le cas o i est lindice dun neurone cach (1 < l < L 1), on peut vrifier
g L (UiL (t)) =
aisment que les fonctions de sensibilit satisfont la relation rcurrente ci-dessous (Hagan
et Menhaj, 1994):
l = G l (U l ) (W l+1 )T l+1
o
l
l
G (U ) =
(U1l (t))
0
..
.
0
0
g
(U2l (t))
..
.
0
(2.16)
0
g l (U1l (t))
0
..
.
(2.17)
36
Pour rsumer, lalgorithme de mise jour des paramtres du rseau se droule comme
suit : premirement le vecteur dentre U 0 = (x1 ,x2 , ,xN0 )T est propag vers la sortie
en utilisant les quations (2.2) et (2.3). Ensuite, on calcule les fonctions de sensibilits par
rtropropagation de lerreur de sortie laide des quations (2.15) et (2.16). Finalement
on modifie les poids et les biais en utilisant les quations (2.13), (2.14), (2.7) et (2.8).
Cet algorithme, prsent ici dans sa version la plus simple, possde de nombreuses variantes. Elles correspondent pour la plupart ladaptation du coefficient dapprentissage
(Magoulasb et al., 1999), ou lutilisation de mthodes du deuxime ordre pour le calcul
du gradient (Hagan et Menhaj, 1994). Nous pouvons galement citer parmi ces variantes
la mthode avec un terme de momentum (Vogl et al., 1988), qui utilise une version lgrement diffrente des quations (3.7) et (3.8) pour ajuster les paramtres du rseau:
p(t + 1) = p(t)
J(t)
+ p(t)
p(t)
(2.18)
o est une constante appele momentum et p reprsente un paramtre du rseau qui

peut tre soit un poids de connexion ou un biais. Cette version introduit un autre terme
proportionnel la dernire adaptation p du paramtre p.
2.2.5
Identification par rseaux de neurones
Lidentification des systmes linaires est actuellement un domaine bien matris par
lautomaticien. Cependant, de nombreux processus rels sont complexes et prsentent des
dynamiques non linaires. De plus, sur ces mmes systmes, les connaissances des phnomnes physico-chimiques mises en jeu ne sont pas forcment mesures. Le recours
des modles de type "boite noire" devient ncessaire et lidentification du modle est ralise autour dun ensemble de donnes entres/sorties. Un rseau de neurone, qualifi de
bote noire, prsente un outil incontournable pour lidentification de tels systmes.
La figure 2.4 montre le schma gnral didentification neuronale. Sur cette figure, le rseau de neurones est utilis en parallle avec un processus de type boite noire identifier.
La sortie y du processus est compare la sortie y du rseau de neurones puis lerreur
ei = y y est utilise par un algorithme dapprentissage appropri (exemple la rtropropagation) pour ajuster les paramtres du rseau neuronal.
37
F IG . 2.4 Schma de principe didentification par rseau de neurones
Pour tenir compte de laspect dynamique du processus, le vecteur dentre du rseau

est souvent renforc par des signaux correspondants aux valeurs antrieures des sorties
du systme ou du rseau. Si lon utilise les sorties du processus (figure 2.5), la structure
didentification est dite srie parallle, par opposition la structure parallle qui exploite
les sorties du rseau (figure 2.6). Le modle parallle est un cas particulier de la structure
gnrale dun rseau rcurrent, par consquent il est intressent de remplacer la boucle
donnant ltat du systme par une connexion rcurrente afin de rduire la taille du vecteur
dentre. Cependant, il est difficile de vrifier dans quelles conditions le modle obtenu
est stable sans oublier la charge de calcul supplmentaire ncessaire dans lalgorithme
dapprentissage. Pour ces raisons, le modle srie parallle est couramment utilis.
F IG . 2.5 Structure didentification srie parallle
38
F IG . 2.6 Structure didentification parallle
2.3
Rseaux de neurones pour la commande
2.3.1
Imitation dun contrleur existant
La premire mthode utilise pour la conception dun contrleur neuronal consiste

simplement imiter un systme de commande existant. Mme si cette approche semble,
au premier abord, peut intressante puisquelle ncessite lexistence dun autre contrleur. Elle peut savrer utile si ce dernier est trop complexe ou prsente des difficults
dimplmentation matrielle.
F IG . 2.7 Commande neuronale par reproduction dun contrleur conventionnel
2.3. RSEAUX DE NEURONES POUR LA COMMANDE
39
La figure 2.7 prsente larchitecture gnrale de ce type de commande. Lerreur ec

entre la sortie du systme de commande et celle du rseau est utilise directement par
lalgorithme de rtropropagation pour ajuster les poids de connexion du contrleur neuronal.
Bien que les premires applications de cette approche remontent dj plusieurs annes,
il existe nanmoins des travaux rcents qui exploitent cette approche.
2.3.2
Utilisation directe de lerreur en sortie du procd
Dans cette mthode, le rseau neuronal utilise lerreur e, mesure en sortie du processus, pour adapter ses paramtres en ligne. Plusieurs stratgies sont possibles. La plus
simple consiste utiliser directement cette erreur comme sil sagissait de lerreur ec ,
en sortie du contrleur. Cette approche ne peut donner de bons rsultats que si ces deux
erreurs sont fortement corrles. La mthode la plus utilise consiste considrer le processus comme une couche supplmentaire du rseau travers laquelle on rtropropage
lerreur.
F IG . 2.8 Apprentissage spcialis
Pour pouvoir utiliser cette stratgie, il est ncessaire de connaitre le Jacobien du proy
cessus, cest--dire la quantit
. Il est alors possible dutiliser lalgorithme de rtroprou
pagation en considrant que le processus est une extension fixe du rseau. Le calcul du
gradient du critre doptimisation J (J = f (e)) par rapport aux poids du rseau se fait en
appliquant la rgle:
J
J
y u
=
p
y
u p
(2.19)
40
Le terme
J
y
dpend du critre doptimisation choisi,
est le Jacobien du processus
y
u
u
est obtenu par lalgorithme de rtropropagation du gradient. Comme lobtention
p
y
du Jacobien
est souvent difficile, Psaltis (Psaltis et al., 1988) propose de lapproxiu
mer par une mthode base sur la perturbation des entres, alors que Saerens (Saerens
et
et Soquet, 1991) le remplace par celui dun systme linaire approchant le procd pour
lequel on dduit aisment le Jacobien. Il est galement possible de nutiliser que le signe
du Jacobien, plus facile connatre que le Jacobien lui-mme.
2.3.3
Identification du modle inverse
Cette approche sexcute en deux tapes spares : tape dapprentissage et tape

dutilisation. Durant lapprentissage, le rseau est entran par rtropropagation de manire identifier le modle inverse du procd. Comme lindique la figure 2.9, le rseau
se place en parallle avec le procd, il reoit par ses entres la sortie actuelle y(t) du
procd et fournit en sortie u(t) une estimation de la commande u(t). Le but de lapprentissage est lajustement des paramtres du rseau afin de produire en sortie une commande
u(t) proche de u(t). Aprs cette phase, le rseau se place devant le procd afin de fournir
chaque instant la commande u(t) ncessaire pour atteindre la sortie dsire y (t) qui lui
est donne en entre.
F IG . 2.9 Commande neuronale par identification du modle inverse
La mthode prsente un inconvnient majeur li ltape dapprentissage: le modle appris ne garantit pas forcment la ralisation correcte dun comportement dsir du
2.3. RSEAUX DE NEURONES POUR LA COMMANDE
41
moment que tous les tats dsirs possibles, non pas ncessairement, t rencontrs lors
de lapprentissage. Une autre difficult apparat quand le modle inverse du processus est
mal conditionn (i.e. il existe plusieurs commandes correspondant un comportement dsir). Les algorithmes dapprentissage superviss ragissent gnralement ce problme
par une commande gale la moyenne des solutions admissibles rencontres, ce qui peut
tre catastrophique dans certains cas. Cette approche a cependant, t utilise avec succs
par de nombreux auteurs.
2.3.4
Architecture indirecte dapprentissage
Cette mthode, propose par Psaltis (Psaltis et al., 1987), correspond une mise en
uvre particulire de la commande par modle inverse, dans laquelle, le modle neuronal
en cours dapprentissage, sert aussi commander le processus. La sortie dsire y (t) est
propage travers le premier rseau neuronal pour produire une commande u1 (t) qui est
applique au systme. La sortie y(t) obtenue est alors utilise comme entre du deuxime
rseau (identique au premier rseau) qui produit une commande u2 (t). La diffrence entre
u1 (t) et u2 (t) sert de signal derreur ec (t) afin dassurer lapprentissage des paramtres
des rseaux par rtropropagation. Le point positif de lapproche est que lentranement
est ralis dans lespace objectif, permettant ainsi de faire parcourir au processus lensemble de ses tats possibles, ou tout au moins lensemble des tats qui seront utiliss
lors du fonctionnement. Nanmoins, lide exploite par cette approche (la minimisation
de lerreur commise sur la commande entrane la minimisation de lerreur en sortie du
processus) nest pas souvent juste, ce qui rend lapproche peu utilisable.
F IG . 2.10 Architecture dapprentissage gnralis
42
2.3.5
Apprentissage indirect du systme de commande
Cette mthode diffre des approches prsentes prcdemment par lusage dun modle neuronal du procd dans la structure de commande prsente par la figure 2.11. La
mthode ncessite, donc au pralable, une tape de modlisation du procd par un rseau
de neurones. On cherche ainsi obtenir, par un rseau neuronal, une bonne approximation
de la sortie du procd y(t) lorsquune commande u(t) lui est applique.
Le principe de lapproche est alors, puisque lon dispose dun modle diffrenciable du
procd, dutiliser lalgorithme de rtropropagation en considrant le contrleur et le modle comme un seul rseau. Lerreur est propage travers le modle sans modifier ses
poids, et seuls ceux du rseau contrleur subissent une mise jour. On peut alors se ramener au cas de lquation 3.19 en faisant lapproximation
y
y
=
u
u
(2.20)
F IG . 2.11 Architecture de commande indirecte
Contrairement la mthode base sur lidentification du modle inverse prsente

prcdemment, o le systme de commande tend, pour amener le procd dans un tat
dsir, moyenner lensemble des solutions possibles, cette architecture conduit slectionner une solution particulire (Jordan, 1992). On aura remarqu que cette architecture
de base nutilise pas la sortie du modle neuronal du procd. Lorsque cela est ncessaire,
il est cependant possible dutiliser cette sortie pour raliser une adaptation en ligne du modle du procd. On se trouve alors avec un diagramme typique de commande adaptative
2.4. SYSTMES FLOUS
43
neuronale. Larticle de Narendra (Narendra et Parthasarathy, 1990) constitue une bonne

introduction dutilisation des rseaux de neurones dans le cadre adaptatif. Dans leur architecture, le contrleur neuronal est entrain de manire minimiser lcart entre la sortie
relle du systme et celle gnre par un modle de rfrence traduisant les performances
recherches.
2.4
Systmes flous
Les systmes flous peuvent tre considrs comme des systmes logiques qui utilisent des rgles linguistiques pour tablir des relations entre leurs variables dentre et
de sortie. Ils sont apparus pour la premire fois dans les annes soixante dix avec des
applications dans le domaine du contrle des processus (Mamdani et Assilian, 1975). Aujourdhui, les applications des systmes flous sont trs nombreuses outre la commande,
ils sont largement utiliss pour la modlisation (Kim et al., 1997; Wang et Langari, 1996),
le diagnostic et la reconnaissance de formes. Pour une meilleure comprhension de leur
fonctionnement, nous prsentons brivement quelques notions de base de ces systmes,
notamment les variables linguistiques.
2.4.1
Ensembles flous
La notion densemble flou a t propose par Zadeh (Zadeh, 1965) en introduisant un

caractre graduel de lappartenance dun lment un ensemble donn. Cela permet une
meilleure reprsentation des termes et des connaissances vagues que nous, les humains,
manipulons au quotidien.
Mathmatiquement, un ensemble flou A dun univers de discours U , est caractris par
une fonction dappartenance, note A , valeur dans lintervalle [0,1] et qui associe
chaque lment x de U un degr dappartenance A (x) indiquant le niveau dappartenance de x A. A (x) = 1 et A (x) = 0 correspondent respectivement lappartenance
et la non-appartenance.
Exemple: Evaluation de la temprature dun corps (figure 2.12):
44
F IG . 2.12 Reprsentation de la temprature dun corps par les ensembles classiques et

flous
a) En logique boolenne (Fig 3.12.a), le degr dappartenance ne peut prendre que

deux valeurs (0 ou 1). Dans ce cas le corps peut tre :
Froid:F roid = 1, T ide = 0, Chaud = 0
Tide:F roid = 0, T ide = 1, Chaud = 0
Chaud:F roid = 0, T ide = 0, Chaud = 1
La temprature du corps ne peut pas prendre deux qualificatifs la fois.
b) En logique floue, le degr dappartenance devient une fonction qui peut prendre une
valeur relle intermdiaire comprise entre 0 et 1 inclus. Dans ce cas, pour le qualificatif
tide, le corps peut tre considr la fois, comme froid avec un degr dappartenance de
0.3 et comme tide avec un degr dappartenance de 0.75 (figure 2.12.b).
Pour T=35 0 C : f roid (T ) = 0.3, T ide (T ) = 0.75, Chaud (T ) = 0.
F IG . 2.13 Diffrents types de fonctions dappartenance utilises
2.4. SYSTMES FLOUS
45
Lallure de la fonction dappartenance est choisir selon lapplication traite. La figure 2.13, illustre les diffrentes formes de fonctions dappartenance les plus utilises.
Cependant, dans certaines applications o lon doit driver la fonction dappartenance,
on choisira plutt des fonctions en S (sigmode) ou des fonctions de type gaussienne,
continuement drivables sur leur support.
2.4.2
Variables linguistiques
Une variable linguistique appele aussi attribut linguistique peut tre dfinie partir du
triplet (x,U,Tx ) o x est une variable dfinie sur lunivers de discours U et Tx = A1,A2,..
est un ensemble compos de sous ensembles flous de U qui caractrise x. On associe souvent chaque sous ensemble flou de TX une valeur ou un terme linguistique (tiquette).
La figure 2.14 illustre un exemple de la variable linguistique vitesse avec trois termes
linguistiques: petite, moyenne et grande.
F IG . 2.14 Variable linguistique
Il est gnralement impos que les ensembles flous Ai doivent satisfaire la condition
suivante:
x, i, Ai (x) 6= 0
(2.21)
Cette condition quon appelle dans la littrature, proprit dassurance (coverage property) (Pedrycz et Zadeh, 1995), exige que chaque lment soit affect au moins un
ensemble flou avec un degr dappartenance non nul. A cette condition, on ajoute souvent une proprit supplmentaire qui est le respect de la smantique : les sous ensembles
doivent interprter rellement les termes linguistiques qui leurs ont associs. Dans la partie infrieure de la figure 2.15, le recouvrement entre les ensembles flous est tel quils
46
peuvent tre ordonns, et donc interprts en termes linguistiques, par exemple de la trs
lente jusqu la trs rapide. La partie suprieure de la mme figure montre un bel exemple
dune partition ininterprtable: il est impossible dtiqueter les trois sous ensembles flous
centraux avec des termes linguistiques.
Le respect de ces deux proprits confre aux variables linguistiques une meilleure modlisation des connaissances imprcises en ralisant une rpartition de lespace de connaissance. Cette granulation est dfinie comme une dcomposition dun ensemble de rfrence, comprenant des informations vagues ou imprcises, en plusieurs sous ensembles
flous pour former des rpartitions de connaissance.
F IG . 2.15 La partition suprieure ne peut sinterprter en termes linguistiques
2.4.3
Rgles et oprateurs flous
On appelle proposition floue lmentaire, une proposition de type X est A o (X,U,Tx )

est une variable linguistique et A un sous ensemble de Tx . Une telle proposition possde
un degr de vrit gal A (x) o x est une valeur relle de X. Dune manire gnrale, on peut combiner ces propositions lmentaires laide des oprateurs logiques de
conjonction et de disjonction (et et ou) mis en uvre respectivement par des T-normes
et T-conormes (Klir et Yuan, 1994). Le degr de vrit des nouvelles propositions obtenues peut tre calcul entre autre par les quations suivantes:
Conjonction: (X est A) ET (Y est B)
minimum (A (x),B (y))
produit A (x) B (y)
2.4. SYSTMES FLOUS
47
Disjonction: (X est A) OU (Y est B)

maximum(A (x), B (y))
sommeA (x) + B (y) A (x) B (y)
Loprateur dimplication permet dintroduire la notion de rgle floue qui caractrise les
relations de dpendance entre plusieurs propositions floues:
(X1 est A1 ) ET (X2 est A2 ) = (Y est B)
(2.22)
o X1 , X2 et Y sont des variables linguistiques et A1 et A2 et B sont des sous ensembles

flous. Une telle rgle se trouve habituellement dans les systmes flous avec une formulation lgrement diffrente :
Si (X1 est A1 ) ET (X2 est A2 ) Alors (Y est B)
(2.23)
Dans cette dernire formulation la partie (X1 est A1 ) ET (X2 est A2 ) est appele
prmisse de la rgle et la partie (Y est B) est appele conclusion (consquent).
2.4.4
Structure interne dun systme flou
De manire classique, le fonctionnement interne dun systme flou repose sur la structure prsente par la figure 2.16 qui inclut quatre blocs:
F IG . 2.16 Structure interne dun systme flou
La base de connaissances
La fuzzification des variables dentre, avec ventuellement un prtraitement de
linformation.
48
Linfrence partir dune base de connaissance

La dfuzzification, avec ventuellement un post-traitement de linformation.
La base de connaissances : elle contient les dfinitions des fonctions dappartenance

(formes et paramtres) associes aux variables dentre/sortie ainsi que lensemble des
rgles floues.
La fuzzification consiste calculer, pour chaque valeur dentre numrique, les degrs
dappartenance aux ensembles flous associs et prdfinis dans la base de donnes du
systme flou. Ce bloc ralise la transformation des entres numriques en informations
symboliques floues utilisables par le mcanisme dinfrence.
Le mcanisme dinfrence consiste dune part calculer le degr de vrit des diffrentes
rgles du systme et dautre part associer chacune de ces rgles une valeur de sortie.
Cette valeur de sortie dpend de la partie conclusion des rgles qui peut prendre plusieurs
formes. Il peut sagir dune proposition floue, et lon parlera dans ce cas de rgle de type
Mamdani:
Si (.......) Alors Y estB, Bensemble f lou
Il peut galement sagir dune fonction relle des entres, et lon parlera dans ce cas de
rgle de type Sugeno:
Si (.......) Alors y = f (x1 ,x1 ,....,xn )
o x1 ,...,xn sont les valeurs relles des variables dentres.
Dans ce dernier cas, la valeur de sortie de la rgle est tout simplement donne par:
f (x1 ,x1 ,....,xn ).
o reprsente le degr de vrit de la rgle (i.e de la prmisse) quon peut calculer tous
simplement par lune des formules dcrites prcdemment sur la dtermination des valeurs de vrit des propositions floues. Dans le cas dune rgle de type Mamdani, la sortie
est un sous ensemble flou obtenu partir de celui prsent dans la conclusion de la rgle,
soit en lui appliquant un facteur dchelle gal au degr de vrit de la permisse, on parle
alors dans ce cas de la mthode dinfrence PRODUIT, soit en le tronquant la valeur
de ce degr de vrit et on parle dans ce cas de la mthode dinfrence MINIMUM (Lee,
1990).
2.4. SYSTMES FLOUS
49
F IG . 2.17 Infrence: MINIMUM et PRODUIT
La dfuzzification consiste remplacer lensemble des valeurs de sorties des diffrentes rgles rsultant de linfrence par une valeur numrique unique reprsentative de
cet ensemble. Dans le cas des rgles de type Sugeno, le calcul se fait simplement par une
somme normalise des valeurs associes aux rgles floues.
Dans le cas de rgles de Mamdani, le calcul de la valeur numrique de sortie seffectue
en deux tapes:
1. Composition des rgles
Une fois la phase dinfrence termine, il sagit de regrouper (par union) les sous ensemble flous issus de linfrence pour en obtenir un seul ensemble reprsentatif des
diffrentes conclusions des rgles floues. Comme mthode de composition, on peut
citer en particulier les compositions MAXIMUM (en gnral couple avec linfrence MINIMUM) et SOMME (en gnral couple avec linfrence PRODUIT) 1 .
La premire consiste caractriser lensemble de sorties par une fonction dappartenance gale au maximum des fonctions dappartenance des sous ensembles
flous. La deuxime consiste faire la somme de fonctions dappartenance des sous
ensembles issus de linfrence (figure 2.18).
1. Dans le littrature, on regroupe souvent les phases dinfrence et de composition sous le vocable gnrique dinfrence. Les qualitatifs MIN-MAX et PRODUIT-SOMME, couramment employs, caractrisent
les oprations retenues pour ces deux phases.
50
F IG . 2.18 Composions des ensembles flous issus de linfrence

2. Passage du symbolique vers le numrique
Cest la phase de dfuzzification proprement dite qui permet de gnrer une valeur
numrique partir de lensemble obtenu par composition des rgles. Il existe plusieurs mthode de dfuzzification (au moins une dizaine); les plus communment
employes sont:
(a) La mthode de centre de gravit COG
La dfuzzification par centre de gravit consiste calculer labscisse du centre
de gravit de la fonction dappartenance rsultante r de la phase de composition selon:
Z
y r (y)dy
y = Z
r (y)dy
En pratique, on estime le centre de gravit, en calculant la moyenne dun certain nombre de points chantillonns sur la fonction:
X
yi r (yi )dy
X
y =
r (yi )
(b) La mthode de maximum
Cette mthode, sapplique uniquement dans le cas o la fonction dappartenance associe lensemble de sortie nadmet quun seul maximum. On choisit comme sortie labscisse y correspondant ce maximum.
(c) La mthode de la moyenne des maxima MOM
Dans cette mthode, la valeur de sortie est estime par labscisse du point cor-
2.5. SYSTME NEURO-FLOU
51
respondant au centre de lintervalle M pour lequel la fonction dappartenance

est maximale. Cette valeur est fournie par lexpression:
y = (inf (M ) + sup(M ))/2
o inf (M ) et sup(M ) sont respectivement les bornes infrieure et suprieure
de lintervalle M .
(Lee, 1990) sest intress aux contrleurs flous, lune des applications les plus populaires
de systmes flous, il a donn quelques conclusions relatives ces diffrentes mthodes de
dfuzzification. De mme, dans (Braae et Rutherford, 1978), les auteurs prsentent une
tude comparative des stratgies de dfuzzification (COG, MOM) et concluent que la
mthode du centre de gravit donne de meilleurs rsultats. Nanmoins, on montre dans
(Scharf et Mandic, 1985) que la mthode de la moyenne des maxima assure de meilleures
performances de transition. Rcemment ltude mene dans (Mogharreban et Dilalla,
2006), montre que ces diffrentes approches de dfuzzification donnent des rsultats trs
semblables pour un problme danalyse de donnes. Il en ressort travers ces tudes comparatives que le choix dune meilleure mthode de dfuzzification dpend fortement de
lapplication considre, ainsi cest le cas de la mthode du maximum qui savre tre
trs efficace pour les problmes de classification mais pas autant pour les problmes de
commande.
2.5
Systme neuro-flou
Les principaux avantages dun systme flou sont lapproche naturelle de la modlisation et la bonne interprtabilit de la description, en employant des rgles linguistiques.
Cependant, il ny a aucune mthode formelle pour dterminer ses paramtres (fonctions
dappartenance et rgles floues). Dans ce sens, il serait intressant de disposer dalgorithmes permettant lapprentissage automatique de ces paramtres. Lune des approches
qui permette de rpondre ce besoin est les rseaux de neurones connus pour leur algorithme dapprentissage et leur prcision dans lajustement numrique en employant des
chantillons entre/sortie. De nombreux auteurs ont donc tout naturellement cherch
combiner ces deux approches depuis le dbut des annes 90 et ceci de plusieurs manires :
cooprative, concurrente et hybride. Nous nous portons ici notre attention sur la dernire
approche (hybride) qui permet de reprsenter sous forme dun rseau de neurones, les
52
diffrentes composantes dun systme flou. La structure du rseau ainsi obtenue dpend
du type de rgles floues et de mthodes dinfrence et de dfuzzification employes par le
systme flou. Les paramtres du systme flou (fonction dappartenance et rgles floues)
peuvent ensuite tre modifis par un algorithme dapprentissage conu initialement pour
lajustement des paramtres dun rseau de neurones.
2.5.1
Architecture neuro flou hybride
Plusieurs architectures, mettant en uvre cette approche hybride, sont dcrites dans la
littrature (Farag et al., 1998; Lee, 2005). Ces architectures peuvent tre classes en trois
groupes (Wang et Lee, 2001) selon le type de rgles floues quelles intgrent:
Si (X1 est A1 ) ET (X2 est A2 )ET...ET (XN est AN ) Alors (Y est C)

o:
C=
(typeI)
f (x1 ,x2 , ,xn ) (typeII)

(typeIII)
(2.24)
o Xi (i = 1,2, ,n), Y reprsentent respectivement les variables dentre et de sortie,

Aji les ensembles flous dentre; B, f (x1 ,x2 , ,xn ) et reprsentant respectivement,
lensemble flou de sortie,une fonction linaire des variables dentre et un composant singleton.
Notons que dans le paragraphe prcdent, nous avons considr uniquement deux types
de rgles (les type I et II de lquation 2.24 ) afin dune part dallger lexpos et dautre
part le type III est souvent considr dans la littrature comme un cas particulier du type
I (Sugeno, 1999).
La figure 2.19 montre les diffrentes architectures des systmes neuro-flous hybrides.
FALCON (a) et GARIC (b) interprtent la rgle floue du type I avec une structure organise en 5 couches, ANFIS (c) interprte la rgle floue du type II avec une structure
6 couches et NEFCLASS (d) interprte la rgle floue de type III avec une structure 4
couches.
2.5. SYSTME NEURO-FLOU
53
F IG . 2.19 Diffrentes architectures des systmes neuro-flous
2.5.1.1
ANFIS
ANFIS (Adaptive-Network-based Fuzzy Inference System) est un systme flou mis

en application dans le cadre des rseaux adaptatifs. Il a t propos par Jang (Jang, 1993).
Pour les utilisateurs de MATLAB, ANFIS est implant dans la boite outils Neurofuzzy accompagn de son algorithme dapprentissage hybride bas sur la rtropropagation et la mthode des moindres carrs. Ce modle donne de trs bons rsultats dapproximation de fonctions non linaires.
2.5.1.2
FALCON ET GARIC
IL sagit de modle 5 couches (Lin et Lee, 1991; Berenji et Khedkar, 1992) utilisant
la fuzzufication en entre et la dfuzzification en sortie. Ceci correspond une interprtation juste de la mthode de Mamdani. La prcision accrue des rsultats provoque une
lenteur dans lexcution du systme. Ce modle est rarement utilis en pratique mais il
donne de meilleurs rsultats en commande.
54
2.5.1.3
NEFCLASS
Modle utilis gnralement pour la classification, il est constitu de 3 couches: une

couche dentre avec les fonctions dappartenance, une couche cache reprsente par
lensemble des rgles et une couche de sortie dfinissant lensemble des classes. Ce modle est facile mettre en application, il vite ltape de dfuzzification, tout en tant
prcis dans le rsultat final, avec une rapidit suprieure aux autres modles.
2.6
Conclusion
Les rseaux de neurones, de part la quantit des travaux de recherche et des ralisations existantes, prsentent un certain nombre de points forts. En premier lieu, ils constituent des approximateurs universels capables de modliser des systmes complexes avec
la prcision voulue partir dun jeu de donnes entres /sorties et un processus doptimisation. Leur capacit dapprentissage permet de simplifier la synthse dun contrleur
dans la mesure o lon obtient celui-ci par un simple rglage de paramtres sans quil soit
ncessaire de faire appel au modle mathmatique du systme commander. Dans le cas
de systmes complexes, cela reprsente un avantage indniable par rapport la plupart
des autres mthodes qui sattachent utiliser un modle mathmatique souvent imprcis
ou difficile obtenir. Cependant, linconvnient majeur rside dans le fait que lon ne peut
pas incorporer les connaissances des experts, qualifies dune certaine intelligence, et qui
peuvent tre utiles soit pour acclrer le processus dapprentissage, soit pour obtenir des
structures interprtables. Contrairement aux rseaux de neurones, les systmes flous fonctionnent base de ce type de connaissances et permettent dsormais une meilleure exploitation de lintelligence humaine pour accomplir des tches complexes. Dans ce mmoire,
les contrleurs que nous dveloppons sont base de ces systmes flous. Le problme
doptimisation de la structure et des paramtres de ces contrleurs, qui reste nanmoins
plus difficile dans de nombreux cas, sera tudi dans le prochain chapitre en utilisant les
algorithmes gntiques. Les rseaux de neurones vont intervenir, comme nous allons le
voir, uniquement dans le cas des systmes flous avec des rgles de type Sugeno.
Chapitre 3
Conception de contrleurs flous par
algorithmes gntiques
3.1
Introduction
Les difficults rencontres dans la conception des contrleurs flous(CF), ont guid les
chercheurs sorienter vers lutilisation des algorithmes gntiques cause de leur caractristique dexploration globale dans un environnement complexe. On rencontre souvent,
dans la littrature, trois stratgies dapplication des AG pour la conception des contrleurs
flous.
1. La base de rgles floues est bien dfinie et leurs fonctions de stratgies sont optimises par lAG
2. Les fonctions dappartenance associes aux variables dentres et de sorties sont
fixes et lAG est utilis pour loptimisation des conclusions des rgles floues.
3. Les fonctions dappartenance et les rgles floues associes sont optimises simultanment
Une reprsentation graphique de ces types de stratgies est indique dans la figure 3.1.
55
56
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
F IG . 3.1 Reprsentation graphique des diffrentes approches doptimisation dun

contrleur flou par algorithme gntique
Dans notre travail, on sintresse la troisime stratgie, qui savre tre la plus efficace car, en toute logique, une mthode traitant globalement les diffrents paramtres
dun contrleur flou devrait donner de meilleures solutions.
Le chapitre est organis en trois parties. Dans la premire partie nous tudions loptimisation des paramtres dun CF de type Mamdani par algorithme gntique simple. Nous
examinons dabord les diffrents codages qui permettent de reprsenter les fonctions dappartenance et les rgles floues. Ensuite, nous prsentons la structure du chromosome et
les oprateurs gntiques adopts pour loptimisation simultane de lensemble des paramtres dun CF. Enfin pour mieux illustrer la mthode, nous traitons un exemple de
commande dun systme linaire de deuxime ordre.
Dans la deuxime partie, loptimisation des CF de Mamdani est effectue par les AGH.
Dans un premier temps, nous prsentons nos motivations pour lemploi de ce type dalgorithme. Ensuite, aprs la formulation de la structure du chromosome hirarchis, nous
dcrivons les oprateurs de mutation et de croisement qui sappliquent sur les gnes de
contrle du chromosome de lAGH. A la fin de cette deuxime partie, le mme problme
de commande est considr.
La troisime partie concerne loptimisation de contrleurs flous de type Sugeno par un
3.2. OPTIMISATION DES CONTRLEURS FLOUS DE TYPE MAMDANI PAR

ALGORITHMES GNTIQUES SIMPLES
57
algorithme hybride utilisant la rtropropagation et NSGA-II avec un codage hirarchis.
3.2
Optimisation des contrleurs flous de type Mam-
dani par algorithmes gntiques simples

On considre un contrleur deux entres, lerreur e(t) et sa variation e(t) et une
sortie u(t), la variation de la commande, qui permet dajuster chaque instant la commande u(t) applique au systme (figure 3.2):
u(t) = Gs u(t) + u(t 1)
(3.1)
avec Gs un facteur dchelle (scaling factor) en sortie.

Les rgles floues constituant la base du contrleur, dans ce cas, possdent deux prmisses
F IG . 3.2 Contrleur flou deux entres

et une seule conclusion:
Rgle i1 ,i2 : Si (e est A1i1 ) ET (e est A2i2 ) Alors u est Bj
o (A1i1 | i1 = 1, 2,..., Ne ), (A2i2 | i2 = 1, 2,..., Ne ) et Bj | j = 1, 2,..., Ns ) sont les
termes linguistiques qualifiant respectivement lerreur e , la variation de lerreur e et la
variation de la commande u. Ne , Ne et Ns reprsentent respectivement le nombre de
termes linguistiques associs e, e et u.
On dfinit alors Ne Ne rgles floues pour ce contrleur, organises couramment sous
forme dun tableau et dont le contenu correspond aux conclusions de toutes les configurations possibles de prmisses.
Un exemple de ce type de tableau est prsent ci-dessus: La conclusion dune rgle rep-
58
GNTIQUES
TAB . 3.1 Base de rgles floues

e
A22
A11
R11
R12
R1Ne
A12
..
.
R21
R22
..
.
R2Ne
Ri1 i2
..
.
R Ne 2
RNe Ne
A1i1
..
.
A1Ne
R Ne 1
A2i2
A21
A1Ne
re par les indices i1 et i2 est alors reprsente par un nombre Ri1 i2 dfini comme suit:
Ri1 i2 = j, j {1,2, ,Ns } si la conclusion de la rgle i1 i2 est Bj
Les paramtres de rglage dun tel contrleur (deux entres et une sortie) sont alors:
Deux facteurs dchelle en entre (Ge et Ge ) et un autre en sortie Gs .
Les fonctions dappartenance associes aux variables dentre et de sortie.
Les Ne Ne conclusions de la table de rgles.
Dans cette section, le rglage de ces paramtres sera tudi par les algorithmes gntiques simples. Comme ces derniers travaillent sur une population de chromosomes sur
lesquels sont cods les paramtres optimiser, il est ncessaire de dfinir la structure du
chromosome qui prend en compte lensemble des paramtres cits ci-dessus.
3.2.1
Reprsentation des fonctions dappartenance
Dans un contrleur flou, les rgles floues sont appliques sur des termes linguistiques.
Ces termes, qui permettent de qualifier une variable linguistique, sont dfinis par lintermdiaire de fonctions dappartenance. Les paramtres optimiser sont donc dfinis en
deux tapes : on doit dabord dfinir les paramtres de chaque fonction dappartenance,
puis lensemble des paramtres des fonctions dappartenance qui constituent la partition
floue de la variable linguistique.

59
3.2.1.1
Partitionnement avec des fonctions triangulaires
Une fonction dappartenance triangulaire dans un univers du discours [a,b]peut tre

dfinie par:
xx
1
x 1 x < x2
x2 x1
x3 x
A (x) =
x 2 x < x3
x3 x2
0
ailleurs
(3.2)
On constate que cette fonction dpend des trois paramtres x1 , x2 et x3 qui prennent leurs
valeurs dans lintervalle [a,b], comme indiqu par la figure ci-dessous.
F IG . 3.3 Fonction dappartenance triangulaire dfinie par trois paramtres
Cette fonction tant parfaitement dfinie par ces trois paramtres, on peut donc utiliser
la reprsentation suivante: o C[a,b] (xk ) est un code (binaire, rel, ..., etc) de la variable
C[a,b] (x1 ) C[a,b] (x2 ) C[a,b] (x3 )
xk qui prend ses valeurs dans lintervalle [a,b]. Les valeurs codes doivent satisfaire la
condition suivante:
x1 < x 2 < x 3
(3.3)
Dans un contrleur fou, chaque variable linguistique est dfinie par un ensemble de fonctions dappartenance des termes linguistiques, comme le montre la figure 3.4.
60
GNTIQUES
F IG . 3.4 Partition floue avec des fonctions dappartenance triangulaires
La partition floue peut tre donc reprsente par le codage suivant:

1
c(xA
3 )
Ai
Ai
i
c(xA
1 ) c(x2 ) c(x1 )
n
c(xA
2 )
A la condition (3.3), on ajoute dautres contraintes sur la plage de variation des paramtres de chaque fonction dappartenance afin dobtenir un partitionnement la fois
continu et interprtable. Ces contraintes sont traduites par la double condition ci-dessous:
(
i
x2 i1 < xA
2
i1
i
i
xA
< xA
1 < x3
3
(3.4)
Dans (Guenounou et Belmehdi, 2006), en adoptant ce type de reprsentation pour la commande de la vitesse dune machine asynchrone, nous avons pu obtenir des rsultats satisfaisants et un contrleur flou comprenant une base de rgles lisible et smantiquement interprtable. Linconvnient majeur de cette reprsentation est quelle introduit un nombre
important de contraintes et de paramtres qui peuvent limiter lefficacit de la procdure
de recherche de paramtres optimaux. Lee (Lee et Takagi, 1993) et Yubaziki (Yubazaki et
al., 1995) ont propos une autre mthode de partitionnement pour laquelle le nombre de
paramtres requis est rduit de manire significative (un rapport de 3 pour les fonctions
dappartenance de type triangulaire). Leur mthode repose sur lide de faire partager le
mme paramtre par plusieurs fonctions dappartenance.
La figure 3.5 illustre un exemple de partitionnement avec 5 fonctions dappartenance selon cette mthode.

61
F IG . 3.5 Partition avec 5 fonctions dappartenance daprs Lee et Yubaziki
Une partition floue comportant n termes linguistiques est compltement dfinie par
lintermdiaire de n points (x1 = a, x2 , , xn = b) en utilisant les fonctions dappartenance suivantes:
1
x < x1
x x
2
x 1 x < x2
A1 (x) =
x2 x1
0
x x2
x xi1
xi1 x < xi
xi xi1
xi+1 x
Ai (x) =
xi x < xi+1 i = 2, ,n 1
xi+1 xi
0
ailleurs
0
x < xn1
xx
n1
xn1 x < xn
An (x) =
x
n
n1
1
x xn
La partition floue peut tre donc reprsente par le codage de (n 2) points:
c[a,b] (x2 )
c[a,b] (xi )
c[a,b] (xn1 )
et par les (n 1) ingalits:

a = x1 < x2 < < xn1 < xn = b
(3.5)
62
GNTIQUES
3.2.1.2
Partitionnement avec des fonctions trapzodales
Une fonction dappartenance trapzodale dans un univers du discours fini [a,b] peut
tre dfinie par:
x x1
x2 x1
1
A (x) =
x4 x
x4 x3
x 1 x < x2
x2 x < x3
(3.6)
x 3 x < x4
ailleurs
Cette fonction est dfinie par quatre paramtres x1 , x2 , x3 et x4 qui prennent leurs valeurs
dans lintervalle [a, b].
La figure 3.6 illustre cette fonction, elle ncessite un paramtre de plus par rapport la
fonction triangulaire. En effet cette dernire est un cas particulier de la fonction trapzodale (lorsque x2 = x3 ).
F IG . 3.6 Fonction dappartenance trapzodale
La reprsentation de la fonction trapzodale fait intervenir les quatre paramtres suivants:

c[a,b] (x1 ) c[a,b] (x2 ) c[a,b] (x3 ) c[a,b] (x4 )
et les conditions aux limites associes sont:

x1 < x 2 x3 < x 3
(3.7)
La figure ci-dessous illustre un exemple de partitionnement flou avec 5 fonctions dappartenance trapzodales selon lide de Lee et Yubaziki.

63
F IG . 3.7 Partition avec 5 fonctions dappartenance trapzoidales daprs Lee et Yubaziki
Plus gnralement, une partition floue avec n fonctions trapzodales est dfinie par
2n paramtres (a = x1 , x2 , , xn = b) et par les quations suivantes:
1
x 1 x < x2
x x
3
x 2 x < x3
A1 (x) =
x3 x2
0
x x2
x x2i2
x2i1 x2i2
Ai (x) =
1
x2i+1 x
x2i+1 x2i
x < x2i2
x2i2 x < x2i1
x2i1 x < x2i
i = 2, ,n 1
x2i x < x2i+1

x x2i+1
0
x < x2n2
xx
2n2
x2n2 x < x2n1
An (x) =
x
2n1 x2n2
1
x x2n1
Dans ce cas,la reprsentation est:
c[a,b] (x1 )
c[a,b] (xi )
c[a,b] (x2n1 )
(3.8)
64
GNTIQUES
et les conditions aux limites sont de la forme:

a = x1 < x2 < < x2n1 < x2n = b
3.2.1.3
Fonction dappartenance Gaussienne
Une fonction dappartenance Gaussienne asymtrique dans lunivers de discours [a,b]

peut tre exprime sous la forme:
(x c)2
exp(
) x<c
2g2
A (x) =
(3.9)
(x c)2
exp(
) xc
2d2
Pour calculer cette fonction dappartenance, nous utilisons deux fonctions gaussiennes
possdant le mme centre c mais deux variances diffrentes (g2 et d2 ). La premire gaussienne est utilise lorsque la valeur dentre est infrieure la moyenne, et la deuxime
dans le cas oppos. Ceci permet de dfinir une fonction dappartenance asymtrique (voir
la figure 3.8) et dtre moins restrictif sur la classe des systmes flous que nous pouvons
reprsenter.
F IG . 3.8 Fonction dappartenance gaussienne asymtrique(ligne continue): La moyenne

est note c et les variances g2 et d2
La reprsentation dune fonction gaussienne asymtrique est alors donne par le code
suivant:

65
C(g ) C[a,b] (c) C(d )
Lorsquon utilise des termes linguistiques caractriss par des fonctions gaussiennes
asymtriques pour reprsenter une variable linguistique sur un univers de discours [a,b],
il est possible, comme dans le cas des fonctions triangulaire et trapzodale, de simplifier
la reprsentation en imposant des conditions sur les variances de chaque gaussienne:
(
g,i = d,i1
(3.10)
d,i = g,i+1
o g,i et d,i dsignent respectivement les variances gauche et droite de la ime gaussienne.
La figure ci-dessous montre un exemple de partitionnement avec 5 gaussiennes asymtriques quon peut obtenir en tenant compte de la condition 3.10.
F IG . 3.9 Partition avec 5 gaussiennes asymtriques
Le taux de chevauchement entre deux fonctions dappartenance adjacentes a t fix

0,5. On peut vrifier partir des quations 3.9 et 3.10 que le taux de chevauchement relie
la variance commune entre Ai et Ai+1 aux centres ci et ci+1 par la relation suivante:
s
d,i = g,i+1 =
(ci+1 ci )2
8 ln(i )
(3.11)
Une partition comportant n termes linguistiques peut tre alors reprsente par:
C(1 ) C[a,b] (c2 ) C(2 )
C[a,b] (ci ) C(i )
C[a,b] (cn1 ) C(n1 )
66
GNTIQUES
et les conditions aux limites sont:

a = c1 < c2 < < cn1 < cn = b i ]0,1[
3.2.2
Codage des paramtres des fonctions dappartenance
Comme nous venons de le voir, une variable linguistique est reprsente par un certain
nombre de paramtres qui dpendent la fois du nombre et du type de fonctions dappartenance utilises. Pour coder ces diffrents paramtres, on utilise souvent les chanes
binaires et les chanes relles.
Lorsque le nombre de paramtres est rduit et leurs plages de variations bien dfinies,
un algorithme gntique avec un codage binaire est largement suffisant pour retrouver les
paramtres optimaux. Par contre si le nombre de paramtres devient important, et que
lintervalle de variation de chaque paramtre nest pas bien connu, le codage rel est le
plus appropri. En ce qui concerne lutilisation du codage en base n, il y a eu trs peu de
travaux sur le sujet (Homaifar et MCCormick, 1993; Ng et Li, 1994). Le seul intrt est
de disposer dun type de codage homogne pour tous les paramtres du contrleur que
lon souhaite optimiser. Homaifar (Homaifar et MCCormick, 1993) a opt pour ce codage afin de reprsenter dans un mme chromosome les conclusions des rgles floues et
les paramtres de la fuzzification (paramtres des fonctions dappartenance associes aux
variables dentres). Nous verrons dans la suite de ce mmoire, quil est possible de regrouper les diffrents paramtres (paramtres des fonctions dappartenance, rgles floues
et facteurs dchelle) dans un mme chromosome, sans quil soit ncessaire dutiliser le
mme codage.
3.2.3
Reprsentation des rgles floues
Pour reprsenter lensemble des rgles du contrleur flou de la figure 3.2, on rorganise le tableau 3.1 en une liste de valeurs en le balayant ligne par ligne. Cela fournit
comme reprsentation:
R11
R12
R1Ne
R21
R22
RNe Ne
Afin de permettre un traitement par les algorithmes gntiques, chaque lment Rij de

67
la reprsentation ci-dessus doit tre cod pour tre insr dans un chromosome. Plusieurs
types de codage peuvent tre adopts.
3.2.4
Codage des rgles floues
3.2.4.1
Le codage binaire
Avec ce type de codage, la base de rgles est reprsente par une chaine binaire,
chaque lment Rij de la reprsentation tant cod sur m bits. Nous avons vu quun
lment Rij prend ses valeurs dans lensemble {1,2, ,N s}, o Ns dsigne le nombre
de termes linguistiques associs la variable de sortie u. Une sous-chaine dcrivant
une de ses valeurs doit donc comporter au minimum m = E(log2 (N s + 1)) bits, E(x)
dsignant la partie entire de x. Quand (Ns +1) nest pas une puissance de deux, certaines
configurations binaires ne constituent pas un codage valide. On doit alors ajouter une
condition sur la valeur reprsente par la sous-chaine binaire, qui doit tre infrieure o
gale Ns . Cette condition, quil faut tester chaque fois que lon ralise une opration
sur la chane binaire (croisement ou mutation), constitue un des principaux inconvnients
de lemploi du codage binaire.
3.2.4.2
Le codage rel
Ce type de codage est rarement utilis pour loptimisation des rgles floues de Mamdani cause de la nature des conclusions quelles prsentent. Par contre, comme nous le
verrons plus loin, ce codage sadapte facilement aux rgles de type Sugeno.
3.2.4.3
Codage en base n
Cest le codage le plus utilis pour la reprsentation des rgles floues de Mamdani
(Zhou et Lai, 2000; Cheong et Lai, 2000). Dans larticle (Homaifar et MCCormick, 1993),
Homaifar dcrit une procdure doptimisation des rgles floues dun contrleur dont les
sorties sont partitionnes en 5 valeurs linguistiques. Le nombre 6 (5+1) ntant pas une
puissance de deux, il propose dutiliser un codage en base 6, ce qui permet de coder
efficacement les 5 valeurs possibles de la conclusion dune rgle floue.
68
GNTIQUES
3.2.5
Structure du chromosome
Dans le paragraphe prcdent, nous avons prsent les mthodes de codage des paramtres permettant loptimisation des fonctions dappartenance et la base de rgles dun
contrleur flou de Mamdani. Prenant appui sur ces diffrentes mthodes, nous proposons
un codage mixte, qui permet de reprsenter simultanment les rgles floues, les paramtres de fonctions dappartenance et les facteurs dchelle. Le chromosome de lAG
ainsi obtenu est divis en trois parties: une premire partie, code en base n, reprsente
les conclusions des rgles floues, une deuxime partie, code en nombres rels, reprsente
les paramtres des fonctions dappartenance et une troisimes partie, code en binaire, reprsente les facteurs dchelle en entre et en sortie. Cette structure est reprsente par la
figure 3.10.
F IG . 3.10 Structure du chromosome de lAGS
3.2.6
Oprateurs gntiques
Puisque sur le mme chromosome, il existe trois types de chanes: chane en base
n, chane relle et chane binaire, il convient alors de spcifier pour chacune delle les
oprateurs gntiques permettant une meilleure exploration de lespace de recherche.
3.2.6.1
Oprateur de Croisement
Croisement en base n
Nous utilisons un croisement en deux points standard comme sil sagissait de chaines
binaires.
Croisement des chanes relles
Dans ce cas, on a le choix entre un croisement standard et un croisement arithmtique.

69
Nous utilisons un croisement arithmtique en deux points.

Croisement des chanes binaires
Nous utilisons aussi, ici un choisement standard en deux points. Les lieux de croisement
pour toutes les chanes sont choisis alatoirement et changent chaque gnration.
3.2.6.2
Oprateur de Mutation
Mutation des chaines en base n

La mutation des chanes codes en base n, consiste remplacer llment de la chane
muter par un chiffre en base n.
Lapplication directe dune telle mutation pour loptimisation des rgles floues savre
peu efficace et peut conduire une exploration chaotique cause du caractre graduel prsent dans les ensembles flous utiliss pour le partitionnement des variables du contrleur.
Considrant le contrleur de la figure 3.1 dont la sortie est partitionne en 7 valeurs linguistiques Ngative Grande (NG), Ngative Moyenne (NM), Ngative Petite (NP), Zro
(Z), Positive Petite (PP) et Positive Moyenne (PM) et Positive grande (PG) reprsentes
respectivement par les nombres 1, 2, 3, 4, 5, 6 et 7 de la base 8. Si maintenant le nombre
4, reprsentant une variation de commande gale zro, est ramen 1, aprs mutation,
la variation de commande code devient alors ngative grande, ce qui conduira probablement un mauvais rsultat. Par contre si ce mme nombre (4) est ramen 3, reprsentant
une variation de Ngative Petite, le rsultat peut tre amlior, ou au pire dtrior, avec
un degr moindre que dans le premier cas.
Il convient alors aprs la mutation dun lment de produire des lments voisins constituant le partitionnement de la variable de sortie. Ceci peut tre obtenu en adoptant la
mutation dfinie ci-dessous:
Ri1 i2 =
si Ri1 i2 = 1
Ri1 i2 1 si 1 < Ri1 i2 < Ns
N 1
si Ri1 i2 = Ns
s
o Ri1 i2 reprsente dans ce cas, le rsultat de la mutation de Ri1 i2 .

Mutation des chanes relles
La mutation non uniforme dcrite dans le chapitre 2 est choisie.
(3.12)
70
GNTIQUES
3.2.7
Initialisation des chromosomes
Habituellement, les chromosomes de la premire population sont initialiss avec des

valeurs alatoires ou avec des valeurs qui drivent le savoir-faire des experts pour acclrer la convergence de lalgorithme doptimisation. Nous avons utilis une combinaison
de ces deux mthodes, ainsi nous initialisons les paramtres des fonctions dappartenance
par des valeurs alatoires prises dans leur intervalle de variation. En ce qui concerne linitialisation de la base de rgles, nous utilisons le modle de rgles propos par MacvicarWhelan (Macvicar-Whelan, 1976). Ce modle est considr comme une extension de
la base de rgles utilise dans les premiers contrleurs flous dvelopps par Mamdani
(Mamdani et Assilian, 1975) et peut tre obtenu partir des mta rgles ci-dessous:
MR1 Si lerreur e(t) et sa variation e(t) sont zro (EZ) Alors maintenir le prsent
rglage.
MR2 Si lerreur e(t) tend vers zro (EZ) avec un rythme satisfaisant Alors maintenir le
prsent rglage.
MR3 Si lerreur e(t) nest pas auto corrective alors laction de commande u(t) est
diffrente de zro, son signe ainsi que son amplitude sont fonction de lerreur e(t)
et de sa variation e(t).
TAB . 3.2 Base de rgles gnre partir du modle de Macvicar-Whelan
u
e
NG NM
NP
PP
PM
PG
NG
NM
NP
PP
PM
PG
Dans le tableau 3.2, nous avons reprsent lensemble des rgles floues dfinies par le
modle de rgles de Macvicar-Whelan pour le contrleur flou considr (partitionnement
avec 7 fonctions dappartenance). Dans le cas gnral (partitionnement avec un nombre
quelconque de fonctions), une description dtaille de la procdure de gnration des

71
rgles, selon lapproche de Macvicar-Whelan, peut tre trouve dans louvrage de Yager
(Yager et Filev, 1994).
3.2.8
Exemple dapplication
Dans cette section, nous allons tester les performances de la mthode propose sur un
exemple de commande dun systme linaire de second ordre utilis dans (Cheong et Lai,
2000).
La fonction de transfert de ce systme est donne par :
G(p) =
2
p(p + 1.4) + 2
(3.13)
La figure 3.11 montre la rponse indicielle du systme en boucle ferme (sans contrleur),
obtenue sous Matlab en utilisant la mthode dintgration de Runge Kutta dordre 4 une
priode dchantillonnage de 0.1s.
F IG . 3.11 Rponse indicielle du systme en boucle ferme sans le contrleur flou
On remarque la prsence doscillations amorties en rgime transitoire qui steignent

au bout de 10s avec une erreur statique de 0.5.
La stratgie de commande adopte est celle donne en figure 3.2. Le contrleur reoit
par ses entres lerreur e(t) et sa variation e(t) et fournit en sortie la variation de commande u(t). Cette dernire sollicite lentre dun intgrateur dont la sortie est laction
de commande u(t). Au niveau de la structure interne, chaque variable est dfinie sur un
72
GNTIQUES
univers de discours normalis [+1, 1]. Ce dernier est partitionn en sept sous ensembles
flous {N G, N M, N P, EZ, P P, P M, P G}. Les fonctions dappartenance retenues pour
lensemble des variables du contrleur sont de type gaussiennes asymtriques. Le traitement des rgles floues, qui sont 49 au total, est effectu par la mthode MIN-MAX. La
grandeur de sortie du contrleur est gnre par la mthode de centre de gravit.
3.2.8.1
Critres de performance
En gnrale, lobjectif dun systme de commande est de minimiser lcart e(t) entre
la sortie dun systme et une valeur de consigne dsire. Cet cart peut tre d, soit un
changement de consigne, soit des perturbations agissant sur le systme. Pour choisir un
bon rglage du rgulateur, on prend en compte lamplitude maximum de lcart et la dure
ncessaire pour quil sannule aprs une perturbation ou un changement de consigne. Il
existe plusiers critres numriques permettant de mesurer la qualit dun rglage donn.
Parmi ces critres on peut citer:
Critre de lintgrale du carr de lerreur (ISE):
ISE =
L
X
[e(n.t)]2
(3.14)
n=0
o t et n sont respectivement la priode dchantillonnage et lindice dchantillon. [0, L] est lintervalle sur lequel est calcul le critre. En pratique, la valeur
de L est choisie de manire que lintervalle [0, L] contienne suffisamment le rgime
transitoire
Critre de lintgrale de la valeur absolue de lerreur(IAE):
IAE =
L
X
|e(n.t)|
(3.15)
n=0
Critre de lintgrale de lerreur absolue temporelle (ITAE):

IT AE =
L
X
(n.t) |e(n.t)|
(3.16)
n=0
Critre du pourcentage de dpassement(dep):

Dep(%) =
smax sf inal
100%
sf inal sinitial
(3.17)

73
Dans (Dorf et Bishop, 1995) on peut trouver une liste exhaustive de critres de performance dun systme de commande. Par la suite nous retiendrons ces deux derniers critres (IT AE et Dep). Ces critres permettent de conclure que le systme de commande
est dautant meilleur que les valeurs de IT AE et Dep sont plus faibles. Il sagit donc
dun problme de minimisation. Pour un algorithme gntique, ces critres vont servir
pour obtenir une fonction objectif exploitable par le processus slection.
3.2.8.2
Paramtres de lAG
Lalgorithme gntique exploitant le codage mixte des paramtres dcrits prcdemment doit permettre doptimiser simultanment les paramtres des fonctions dappartenance, les facteurs dchelle et les conclusions des rgles floues. Pour se faire, on doit
choisir soigneusement les valeurs des paramtres rgissant lvolution de la population
traite par cet algorithme gntique : taille de la population, probabilites de croisement
et de mutation. Dans ce travail, aprs une srie de tests, nous avons opt pour les paramtres du tableau 3.3
TAB . 3.3 Paramtres de lAGs
Chromosome de lAG standard
Reprsentation
Rgles floues
fonction dappartenance
facteurs dchelle
En base 8 (1, 2, , 7)
Relle
Binaire
Probabilit de croisement
Probabilit de mutation
0,65
0.01
0.01
Taille de la population
40
Nombre de gnrations
500
3.2.8.3
0.02
Fonction Objectif
On fixe comme objectif, la minimisation de lerreur e(t) entre la sortie et la consigne.

Cet objectif peut tre dfini par plusieurs indices numriques (ISE,IAE, IT AE, Dep.)
et seul le comportement dsir peut tre un paramtre prpondrant prendre en compte
pour faire un bon choix parmi ces indices. Dans notre propos, nous avons opt pour la
74
GNTIQUES
minimisation de lerreur absolue temporelle (IT AE) et le dpassement (Dep):
Ob1 = IT AE
(3.18)
Ob2 = Dep
(3.19)
Par ces deux critres, il est possible de minimiser lerreur en rgime permanent par lemploi de (IT AE) et de pnaliser les dpassements qui peuvent apparaitre durant le rgime
transitoire (en minimisant IT AE) par lemploi du critre (Dep).
3.2.8.4
Mthodes de slection
Nous avons vu, dans le chapitre 2 que la rsolution dun problme doptimisation
multi-objectif base dalgorithmes gntiques peut se faire selon deux approches: agrgative (approche non Pareto) et non agrgative (approche de Pareto).
Si on utilise comme mthode de rsolution, la premire approche, il devient alors ncessaire de combiner les deux objectif Ob1 et Ob2 en un seul objectif Ob reprsentatif,
soit :
Ob = 1 Ob1 + 1 Ob2
(3.20)
o 1 et 2 sont des poids de pondration. Comme on se retrouve avec un seul objectif

(Ob), une mthode de slection telle que le tournoi ou la roulette biasie seront suffisantes pour entamer la procdure doptimisation. Nanmoins, il faut noter que le choix
des valeurs de 1 et 2 nest pas toujours ais, seule la connaissance a priori des plages
de variation des deux objectifs Ob1 et Ob2 peut tre considre pour choisir les poids appropris.
Quant la deuxime approche (approche de Pareto), elle prsente lavantage de ne pas
ncessiter un choix de poids de pondration et permet de trouver en une seule excution
lensemble des solutions du front de Pareto.
Nous utilisons donc deux mthodes de slection. La premire est celle du tournoi (approche agrgative) et la deuxime est base sur le NSGA-II, lun des algorithmes reprsentatifs de lapproche non agrgative.

75
3.2.8.5
Rsultats de loptimisation pour la premire mthode (tournoi)
Les rsultats obtenus sont illustrs par les figures 3.12 3.15. La figure 3.12 montre
les fonctions dappartenance correspondantes au meilleur chromosome de la poulation
initiale. les valeurs des facteurs dchelle sont donns par le tableau 3.4.
F IG . 3.12 Fonctions dappartenance du meilleur chromosome de la premire gnration
TAB . 3.4 Facteurs dchelle du meilleure chromosome de la premire gnration

Ge
Ge
Gs
1,796 19,434 0,175
Ils donnent lieu des rsultats mdiocres, soit un dpassement de lordre de 5% et la
prsence doscillations entretenues en rgime permanent(figure 3.13) pour une consigne
76
GNTIQUES
dentre constitue de deux chelons: un chelon passant de 0 1 (front montant) dune

dure de 10s suivi par un autre chelon de 1 0 (front descendent) de mme dure. Lefficacit de lAGS est ressenti ds les premires gnrations du processus doptimisation,
titre dexemple lobjectif Ob pour le meilleure chromosome de la 60me gnration est
ramen 34,5161 alors quil tait initialement (premire gnration) de 69,3873, soit une
diminution dun rapport de 2. Les rsultats sont amliors au cours des gnrations (voir
lvolution Ob sur la figure 3.14) et ce nest qu partir de la gnration 210 ime quon atteint des performances trs apprciables. La figure 3.15 et les tableaux 3.5 et 3.6 donnent
les nouveaux paramtres correspondants au meilleur chromosome de cette gnration.
F IG . 3.13 Sortie du systme pour le meilleur chromosome de la premire gnration
F IG . 3.14 Evolution de lobjectif Ob travers les gnrations

77
F IG . 3.15 Fonctions dappartenance du meilleur chromosome de la 210 me gnration
TAB . 3.5 Facteurs dchelle du meilleur chromosome de la 210 gnration

Ge
Ge
Gs
1,998 19.623 0.181
TAB . 3.6 Base de rgle gnre partir du meilleur chromosome de la 210 me gnration
u
e
NG NM
NP
EZ PP
PM
PG
NG
NM
NP
EZ
PP
PM
PG
78
GNTIQUES
F IG . 3.16 Sortie du systme pour le meilleur chromosome de la 210 me gnration

On constate quils sont tous a fait diffrents de ceux obtenus au dbut du processus
doptimisation. Cela se justifie par le rle important que joue les oprateurs gntiques
en explorant de nouvelles solutions dans lespace de recherche. A la 500me gnration,
nous avons toujours le mme rsultat (un dpassement nul et une absence doscillation)
(voir figure 3.16-a).
3.2.8.6
Rsultats de loptimisation pour la deuxime mthode (NSGA-II)
F IG . 3.17 Rpartition de la population initiale

79
La figure 3.17 montre la rpartition des solutions de la premire population dans lespace objectifs (Ob1 : IT AE et Ob2 : Dep).
Il faut noter que ce sont, ces mmes solutions qui ont t utilises par lAGS prcdent
(slection par tournoi). On retrouve alors sur la figure, la meilleure solution obtenue prcdemment et qui se trouve sur lune des extrmits du front de Pareto. De gnration en
gnration le NSGA-II tend regrouper les populations autour du front de Pareto, tout en
minimisant les deux objectifs Ob1 et Ob2 . Ceci est bien illustr par les figures 3.18 qui reprsente deux chantillons de populations obtenus au cours du processus doptimisation.
F IG . 3.18 Evolution de la population
A la 500me gnration nous avons une rpartition meilleure des solutions. Sur le
front de Pareto, nous avons dune part un dpassement qui est pratiquement nul (dordre
104 ) pour toutes les solutions et dautre part une amlioration trs remarquable du critre
ITAE qui atteint des valeurs optimales comprises entre 28,55 et 28,79.
80
GNTIQUES
F IG . 3.19 Rpartition de la population finale
La figure 3.20 donne la rponse du systme pour une solution de test (voir carr bleu
de la figure 3.19) prise dans le front de Pareto. Nous avons un suivi de consigne satisfaisant (IT AE = 28.56, Dep = 0.12%). Les paramtres du contrleur correspondant sont
donns par la figure 3.21 et les tableaux 3.7 et 3.8.
F IG . 3.20 Sortie du systme pour la solution de test

81
F IG . 3.21 Fonctions dappartenance
TAB . 3.7 Facteurs dchelle

Ge
Ge
Gs
1,995 18.541 0.162
TAB . 3.8 Base de rgle gnre

u
e
NG NM
NP
EZ PP
PM
PG
NG
NM
NP
EZ
PP
PM
PG
82
GNTIQUES
3.3
Optimisation par algorithmes gntiques hi-
rarchiss
Nous avons vu, dans le deuxime chapitre, que les algorithmes gntiques hirarchiss prsentent des proprits plus intressantes que les AG standards quand on sintresse
loptimisation de la structure dun systme plutt qu loptimisation seule de ses paramtres. Pour le cas du contrleur flou, loptimisation structurelle consiste gnralement
soit optimiser le nombre de fonctions dappartenance de chaque variable du contrleur
(Acosta et Todorovich, 2003; Tang et al., 1998), soit optimiser le nombre de rgles
floues dans la base de rgles (Belarbi et al., 2005). Pour la premire approche, nous avons
vrifi travers deux applications diffrentes (Guenounou et Belmehdi, 2006; Guenounou
et al., 2006) quun partitionnement avec 5 ou 7 fonctions dappartenance est largement
suffisant pour obtenir une rgulation ou une poursuite de trajectoire satisfaisante. Quand
la deuxime approche, celle-ci nous semble plus importante, car la minimisation du
nombre de rgles permet dune part de rduire la complexit du contrleur et dautre part
de minimiser les charges de calcul, ncessaires pour valuer la sortie du contrleur, des
essentiellement au nombre de rgles quil faut vrifier chaque pas dchantillonnage.
Dans la suite de ce travail nous nous intressons cette dernire approche, non seulement
pour lintrt quelle prsente, mais galement pour remdier linconvnient de la premire mthode doptimisation, dcrite prcdemment. En effet, cette mthode permet de
gnrer dans beaucoup de cas une base de rgles brouille contenant des rgles qui nont
pas de sens.
F IG . 3.22 Bases de rgles contenant des rgles incohrentes
3.3. OPTIMISATION PAR ALGORITHMES GNTIQUES HIRARCHISS
83
Un exemple dune telle base est reprsent par les tableaux (a) et (b) de la figure 3.22.
Ces deux tableaux correspondent bien aux bases de rgles obtenues (tableau 3.6 et tableau
3.8) la fin du processus doptimisation pour les deux mthodes de slection considres
(tournoi et NSGA-II). Les cellules entoures correspondent aux conclusions des rgles
contradictoires avec le sens commun et le modle de rgles de Macvicar-Whelan.
3.3.1
Structure du chromosome hirarchis
Le codage que nous proposons cette fois ci (voir figure 3.23) diffre de celui de la
figure 3.10, par la prsence de gnes de contrle dans la nouvelle structure, et qui ont
comme rle lactivation ou la dsactivation des rgles floues. Le nombre de gnes de
contrle est gal la dimension initiale de la base de rgles: chaque rgle on fait correspondre un gne de contrle. Quand " 1 " est assign au gne de contrle (z i ), la rgle
floue correspondante devient active. Dans le cas contraire (un" 0 " est assign au gne
de contrle), cette rgle devient inactive (i.e limine de la base de rgles du contrleur).
Pour un contrleur deux entres et une seule sortie (figure 3.2) le nombre de gnes de
contrle est gal K = Ne Ne .
Ainsi, si z i = 0, i = 1,2, ,K, aucune rgle nest active dans la base de rgles du
contrleur, dans ce cas, le contrleur ne peut fournir une commande.
Pour contourner cette singularit, nous introduisons la contrainte suivante :
K
X
z i lr
(3.21)
i=1
avec lr le nombre minimal de rgles actives dans la base de rgles du contrleur flou.
F IG . 3.23 Structure du chromosome de lAGH appliqu pour loptimisation des paramtres dun CF
84
GNTIQUES
3.3.2
Oprateurs gntiques
Les oprateurs de croisement et de mutation peuvent sappliquer sur les gnes de

paramtres (partie 2 du chromosome) comme sil sagissait simplement dun algorithme
gntique standard. Afin de satisfaire la contrainte (3.16), le croisement et la mutation des
gnes de contrle sont effectus de la manire suivante :
1. Oprateur de Croisement: considrons les gnes de contrle des deux chromosomes parents ch1 et ch2 avant de les recombiner par croisement et supposons que
lr = 5 (au moins cinq gnes de contrle sont au niveau 1 pour chaque chromosome):
Gnes de contrle de ch1 : 1/0000/11110, contrainte satisfaite
Gnes de contrle de ch2 : 1/1111/11000, contrainte satisfaite.
Si un croisement est appliqu aux points indiqus par le symbole 0 /0 , les descendants
suivants sont produits :
0
ch1 : 1/1111/11110, contrainte satisfaite

0
ch2 : 1/0000/11000, violation de contrainte.

Afin de respecter toujours la contrainte, nous inter-changeons uniquement les premiers bits de ch2 pour lesquels la contrainte est satisfaite, ainsi aprs cette correction
nous obtenons:
0
ch2 : 1/0011/11000, contrainte satisfaite.

2. Oprateur de Mutation : comme pour le cas de loprateur de croisement, la mutation de certains gnes de contrle (quand 1 est mut zro), peut violer la contrainte
(3.16) comme illustr ci-dessous:
Considrons les gnes de contrle du chromosome de ch3 : 1100001101 pour lesquels la contrainte est satisfaite (lr = 5). Si maintenant une mutation est opre sur
le premier gne, on obtient la chane : 010001101, par consquent la contrainte est
viole. Pour la satisfaire on remet le bit mut 1 (annulation de la mutation).
3.3.3
Fonction objectif supplmentaire
Pour remdier au problme de prsence de rgles floues inutiles et/ou incohrentes

dans la base de rgles du contrleur optimis, nous introduisons, en plus des objectifs
prcdents relatifs aux performances du contrleur en termes derreur (ISE, IAE, ITAE,
Dep) un autre objectif supplmentaire qui favorise les solutions correspondantes un
85
nombre minimal de rgles actives. Cet objectif se traduit par une simple sommation des
gnes de contrle:
Ob2 =
K
X
zi
(3.22)
i=1
3.3.4
Evaluation des performances de lAGH
Pour valuer les performances du contrleur flou optimis par les AGH, des tests de
simulation ont t raliss sur le mme systme trait prcdemment par les AGS.
Nous avons considr le mme type et le mme nombre de fonctions dappartenance
pour dfinir les variables du contrleur sur leur univers de discours. Nous avons conserv
galement la mme procdure dinitialisation des chromosomes, les gnes de contrle
qui constituent ici une partie supplmentaire et qui prennent leur valeur dans lensemble
{0,1} sont initialiss par un processus alatoire o lon accorde plus de probabilit un
qu zro. De cette faon, on gnre initialement des solutions qui considrent un nombre
important de rgles floues de la base du contrleur.
Deux objectifs sont considrs:
Minimisation de lintgrale de lerreur absolue temporelle (ITEA) et le dpassement
Dep.(equation 3.20 avec = 50)
Minimisation de rgles floues (quation 3.22)
Les paramtres de LAGH sont ceux du tableau 3.3, dfinis prcdemment pour les AGS,
auxquels il faut ajouter la probabilit de mutation (pmc = 0.005) et de croisement (pcc =
0.45) des gnes de contrle et le nombre minimal (lr = 20) de rgles conserver dans la
base de du contrleur.
La figure 3.24 donne la rpartition sur le plan des objectifs (Ob1 , Ob2 ) des solutions de la
dernire gnration. On constate un regroupement des solutions autour du front de Parto.
Les quelques solutions qui se trouvent loignes du front de Pareto, sont dues principalement aux effets de la mutation et du croisement des gnes de contrle, qui peuvent tre
nocifs dans certains cas en dsactivant des rgles pertinentes et/ou en activant des rgles
incohrentes. Cest dailleurs la raison pour laquelle, les probabilits dapplication des
ces oprateurs ont t fixes des valeurs relativement faibles par rapport celle dun
algorithme gntique simple.
86
GNTIQUES
F IG . 3.24 Rpartition de la population finale
La figure 3.25 reprsente les solutions constituant le front de Pareto. Tout dabord il y
a lieu de constater que les deux objectifs Ob1 et ob2 sont contradictoires car en diminuant
le nombre de rgles, lobjectif Ob1 tend se dtriorer, notamment partir de moins de 20
rgles. Dautre part il faut noter que certaines configurations pour lesquelles nous avons
plus de 26 rgles actives (Ob2 > 26) ne font pas partie de ce front. Au-del de 26 rgles il
est difficile dapporter une amlioration lobjectif Ob1 , cest--dire dobtenir une valeur
de lobjectif Ob1 infrieur 27,367.
F IG . 3.25 Solutions constituant le front de Pareto
87
La figure 3.26 donne la rponse du systme correspondante une solution prise dans
le front de Pareto.
F IG . 3.26 Sortie du systme pour la solution de test
F IG . 3.27 Fonctions dappartenance
88
GNTIQUES
Avec uniquement 22 rgles (voir le carr bleu de la figure 3.25), nous avons des performances trs semblables celles obtenues en considrant la totalit des rgles floues
de la base du contrleur. Les diffrents paramtres correspondants cette solution sont
illustrs par la figure 3.27 et les tableaux 3.9 et 3.10
TAB . 3.9 Facteurs dchelle
Ge
Ge
Gs
2,015 18.541 0.162
TAB . 3.10 Base de rgles avec 22 rgles floues

u
e
NG NM
NG
3.4
NP
EZ PP
PM
NM
NP
EZ
4
5
PP
PM
PG
PG
5
6
Optimisation des contrleurs flous de type Su-
geno
La conception de contrleurs flous de types Sugeno par algorithmes gntiques (AGS
ou AGH) peut se faire de la manire expose prcdemment pour le cas du contrleur
de type Mamdani. Tout ce qui change est le codage des conclusions des rgles floues qui
sont de nature diffrente pour les deux types de contrleurs. En effet avec un contrleur
flou deux entres et une seule sortie tel quillustr par la figure 3.2, les rgles floues de
Sugeno sont dcrites par:
Rgle i1 ,i2 : Si (e est A1i1 ) ET (e est A2i2 ) Alors u = ai01 i2 + ai11 i2 e + ai21 i2 e
o ai01 i2 , ai11 i2 et ai21 i2 sont les paramtres associs la Rgle i1 ,i2 .
Dans ce cas, la conclusion dune rgle peut tre dfinie par les trois paramtres: a0 , a1 et
3.4. OPTIMISATION DES CONTRLEURS FLOUS DE TYPE SUGENO
89
a2 .
Tenant compte de cette considration, loptimisation par algorithme gntique de lensemble des paramtres du CF de Sugeno peut tre obtenue partir des structures illustres
par la figure ci-dessous.
F IG . 3.28 Structures du chromosome optimisant le contrleur de Sugeno
La partie suprieure de la figure correspond une structure simple qui fait intervenir
deux type de reprsentation: binaire pour les facteurs dchelle et relle pour le reste des
paramtres (paramtres des fonctions dappartenance et rgles floues). Dans la partie infrieure de la figure, la structure est un peu diffrente, elle prsente un niveau de gnes de
contrle supplmentaire qui a pour rle lactivation ou la dsactivation des rgles floues.
En exploitant ces structures, il est tout fait possible daboutir des rsultats semblables
ceux prsents dans les deux sections prcdentes. Toutefois linconvnient majeur de
cette mthode rside dans le fait que lon ne dispose pas de modle de rgles comme pour
le cas des contrleurs de Mamdani, pour initialiser la base de rgles du contrleur et qui
peut, par consquent, rendre la procdure de recherche couteuse en temps. Pour remdier
cet inconvnient, nous avons propos dans (Guenounou et al., 2009) une mthode dinitialisation en utilisant lalgorithme de rtropropagation du gradient. Comme ce dernier
sadapte mieux des structures multicouches (rseaux de neurones), le contrleur flou
est donc transform en un rseau multicouche (rseau neuro-flou) avant toute procdure
doptimisation. Dans ce qui suit, nous allons prsenter la structure du rseau neuro-flou
90
GNTIQUES
propose ainsi que son algorithme dapprentissage.
3.4.1
Structure du rseau Neuro-flou
Le rseau neuro-flou propos est une architecture cinq couches qui comprend les
lments dun systme flou de type Sugeno. Pour ne pas rester dans le cas dun contrleur
deux entres, nous considrons cette fois ci un cas plus gnral avec un rseau r
entres [x1 , x2 , x3 , ..., xr ] et une sortie y. En considrant la figure 3.29, explicitons le
fonctionnement du rseau, couche par couche.
F IG . 3.29 Structure du rseau neuro-flou
3.4.1.1
Premire couche (couche dentre)
Aucune fonction nest ralise avec les neurones de cette couche. Chaque neurone
transmet le signal dentre vers la deuxime couche.
Oi1 = u1i ,
u1i = xi
(3.23)
3.4.1.2
91
Deuxime couche (couche des fonctions dappartenance)
Les neurones de cette couche correspondent aux termes linguistiques (sous ensembles
flous) associs aux variables dentre du contrleur. La sortie de chaque neurone fournit
le degr dappartenance dune variable dentre au sous ensemble flou correspondant ce
neurone. Elle est donne par :
Oi2
(u2i ci )2
= exp(
)
2i2
O11
if i = 1,2,...,n1
if i = n1 + 1,...,n1 + n2
O2
2
ui =
Oj1 if i = n1 + .. + nj1 + 1,...,n1 + .. + nj
O1 if i = n + .. + n
1
r1 + 1,...,n1 + .. + nr
r
(3.24)
(3.25)
o n1 , n2 , ... et nr reprsentent respectivement le nombre de sous ensembles flous associs

aux varaibles du contrleur. ci et i sont les paramtres de la gaussienne du ime neurone.
3.4.1.3
Troisime couche(couche des prmisses)
Chaque neurone de cette couche correspond une rgle floue de la base de rgles.
Ses entres proviennent de tous les neurones de la deuxime couche qui participent dans
la partie prmisse de la rgle. La sortie de chaque neurone reprsente le degr de vrit
dune rgle, qui peut tre obtenu partir de:
Y
Oi3 =
u3j , u3j = Oj2 ,i = 1,2...K
(3.26)
avec K = n1 n2 nr le nombre total de rgles floues.
3.4.1.4
Quatrime couche(couche des conclusions)
Chaque neurone de cette couche correspond la conclusion dune rgle floue. Il y

a donc autant de neurones dans cette couche que dans la troisime couche. la sortie de
chaque neurone est obtenue par une simple somme pondre des variables dentre :
r
X
4
i
O i = a0 +
aij xj
(3.27)
j=1
aij
sont les paramtres correspondant la conclusion de la ime rgle floue.
92
GNTIQUES
3.4.1.5
Cinquime couche (couche de sortie)
Le neurone de cette couche ou neurone de sortie, correspond la variable de sortie

du contrleur. Il intgre toutes les actions prconises par les couches 3 et 4 de manire
raliser ltape de dfuzzification:
K
X
O5 =
Oj3 Oj4
j=1
K
X
(3.28)
Oj3
j=1
3.4.2
Optimisation des paramtres du rseau neuro-flou
Dans cette section, nous allons prsenter lalgorithme hybride propos pour lapprentissage (i.e optimisation) de la structure du rseau neuro-flou. Le principe de cet algorithme est trs simple: il consiste utiliser dans un premier temps lalgorithme de rtropropagation pour un ajustement de paramtres et dans un second temps un algorithme
gntique hirarchis pour un deuxime ajustement de paramtres tout en minimisant le
nombre de rgles floues.
3.4.2.1
Optimisation par lalgorithme de rtropropagation du gradient
Pour entraner le rseau, nous utilisons lalgorithme de rtropropagation du gradient

dj dcrit dans le chapitre 2 pour le cas dun perceptron multicouches. Les quations prsentes doivent cependant tre adaptes aux fonctions particulires des neurones utiliss.
Le critre minimiser pour la mesure de performance reste lerreur quadratique donne
par lquation:
J(t) = 0.5 (y(t) y d (t))2
(3.29)
o y(t)d et y(t) sont respectivement la sortie dsire et la sortie actuelle du rseau neuroflou.
Ladaptation des paramtres aij correspondant aux conclusions des rgles floues peut tre
obtenue par lquation ci-dessous:
aij (t + 1) = aij (t) 1
J(t)
aij (t)
(3.30)
avec
J(t)
Oi3 xj
d
=
(y(t)
y
(t))
K
aij (t)
X
Ok3
93
(3.31)
k=1
La loi dadaptation du paramtre ci , (centre de la i fonction dappartenance du rseau) est:

ci (t + 1) = ci (t) 2
J(t)
ci (t)
(3.32)
la driv du critre J(t) par apport ci peuvent tre obtenue partir de la dcomposition
ci-dessous :
J(t)
J(t) Oi2
=
ci (t)
Oi2 ci (t)
P
O3 (O1 ci )Oi2
= ( k k3 k2 )( l 2
)
Oi
i
(3.33)
avec
Ok4
k3 =
E(t + 1)
= (y(t + 1) y d (t + 1))
3
Ok
K
X
Oj3
j=1
K
X
Oj3 Oj4
j=1
K
X
(
Oj3 )2
(3.34)
j=1
et
Ok3 Y 2
Oj
=
Oi2
j6=i
(3.35)
Les quations dadaptation du paramtre i peut tre obtenues de la mme manire que
celles de ci et elles sont omises.
3.4.2.2
Optimisation par algorithme gntique
Une fois que les paramtres des fonctions dappartenance et ceux des rgles floues
sont obtenus, un algorithme gntique hirarchis peut tre appliqu pour un deuxime
rglage des paramtres tout en minimisant le nombre de rgles floues initiales. Lalgorithme fonctionne de manire identique celui dcrit dans la section 3.3 pour le cas dun
contrleur flou de type Mamdani. La seule diffrence rside dans ltape de gnration des
chromosomes composants la premire population. Pour mieux comprendre cette tape,
dans ce cas, nous la dtaillons ci-dessous travers un exemple dapplication.
94
GNTIQUES
3.4.3
Exemple
On ce propose, ici, de tester les performances de lalgorithme dapprentissage hybride

travers un problme classique de modlisation dun systme non linaire propos par
Narendra et Pathasarathy (1990).
3.4.3.1
Modle de simulation
Le systme non linaire modliser est dcrit par lquation aux diffrences suivante :
y(k) = [
y(k 1)y(k 2)(y(k 1) + 2.5)

+ u(k 1)]
1 + y 2 (k 1) + y 2 (k 2)
(3.36)
Nous avons choisi larchitecture srie-parallle car elle est considre comme plus stable
vu que le rseau est rgulirement recal en utilisant ltat rel du processus. Le modle
possde trois entres u(k 1), y(k 1) et y(k 2) de trois ensembles flous {N,Z,P }
chacune, 27 rgles floues correspondantes aux diffrentes combinaisons des ensembles
flous et une sortie y(k).
3.4.3.2
Rsultats de simulations
Premire phase
Dans cette premire phase, lalgorithme de retropropagation est utilis pour ladaptation
des paramtres des fonctions dappartenance et des rgles floues. Une base de donnes
de 500 points, gnrs partir de lquation (3.36) et une entre u(k) uniformment rpartie dans lintervalle [2,2], a t considre. Les paramtres de lalgorithme sont fixs
comme suit :1 = 0.12 et 2 = 0.05. Les paramtres des fonctions dappartenance et des
rgles floues rsultants sont rapports dans les tableaux 3.11 et 3.12 respectivement.
TAB . 3.11 Paramtres des fonctions dappartenance obtenus par rtropropagation
N
u(k 1)
-1.5183
1.2645
-0.0560
1.0001
1.3972
1.3857
y(k 1)
-2.2635
1.1603
2.1290
1.2138
5.2837
1.8343
y(k 2)
-2.1265
1.1331
2.6931
1.5531
5.8363
1.6604
95
TAB . 3.12 Base de rgles floues obtenue par rtropropagation

Rgle
Prmisses des rgles floues
Paramtres relatifs aux rgles floues

ai0
ai1
ai2
ai3
0.3819
-1.0990
0.5643
0.5282
0.1331
0.9036
-0.3076
0.0405
0.0375
-0.2100
0.4020
0.1568
-1.2384
1.2754
-0.2871
0.0209
-0.1550
0.7130
0.8397
-0.3301
-0.3562
0.1647
-0.0110
-0.1022
-0.2726
0.2397
-0.0472
-0.1973
0.2389
-0.0889
0.1119
0.0297
0.3798
0.5519
0.1797
0.2498
10
0.8673
0.6258
0.2077
-0.0758
11
-0.6847
1.0613
-0.0703
-0.2491
12
0.0319
-0.4731
0.1814
-0.1433
13
-0.9350
0.3343
-0.8489
-0.2357
14
0.5132
0.5598
0.8888
0.0130
15
0.3603
0.3775
0.3822
0.2313
16
-0.2939
-0.1890
0.2667
-0.3359
17
0.0990
-0.1465
0.1275
0.6254
18
0.1049
0.0452
0.4170
0.1453
19
1.5562
0.8578
0.4061
0.0614
20
0.2563
0.6218
0.0918
-0.1722
21
-0.1096
-0.0101
-0.0462
-0.3373
22
-0.1032
1.0483
-0.5471
0.4047
23
0.9238
0.7215
0.5852
0.3663
24
0.0615
0.7278
0.3912
0.0250
25
0.2687
0.2973
-0.2713
-0.0743
26
-0.2067
-0.0493
0.5624
1.1994
27
0.2293
0.1330
0.2190
0.7235
u(k 1)
y(k 1)
y(k 2)
4
5
Deuxime phase
Une fois la premire phase termine, le NSGA-II est utilis pour un deuxime ajustement
des paramtres. Deux objectifs ont t fixs :
1. Minimisation de lerreur quadratique moyenne dfinie par :
Ob1 =
N
1 X d
(y (k) y(k))2
N k=1
(3.37)
2. Minimisation du nombre de rgles floues (quation 3.22).

La figure 3.30 montre la distribution des objectifs correspondants aux chromosomes de
la premire population. On constate que lobjectif 1 prend ses valeurs dans lintervalle
[3.103 ,28.103 ] proche de la solution obtenue par rtropropagation (Ob1 = 3,063.103 ,
voir figure 3.30) tandis que lobjectif 2 prend ses valeurs autour de 27. Cette rpartition ne
96
GNTIQUES
F IG . 3.30 Rpartition des solutions de la premire gnration

reflte que la mthode adopte ici pour linitialisation des chromosomes. Contrairement
aux mthodes traditionnelles qui se basent sur un processus alatoire, dans notre cas nous
utilisons le rsultat obtenu par retropropagation pour gnrer la population initiale. Au
dbut un premier chromosome mre est cr par codage des paramtres du rseau conformment la structure illustre par la figure 3.28-b. Pour activer lensemble des rgles,
les gnes de contrle sont forcs 1. Ensuite les autres chromosomes sont gnrs par
mutation avec des taux faibles des gnes de paramtres et de contrle de ce premier chromosome. Cela permet comme lindique la figure 3.30 de crer des chromosomes puissants
au sens de Ob1 . Nous rappelons que la premire phase ne permet damliorer que lobjectif 1, lobjectif 2 tant fix 27 (toutes les rgles sont actives). Comme le NSGA-II,
est un algorithme doptimisation multi-objectif litiste, le rsultat obtenu la fin de la
premire phase ne risque pas de se perdre travers les gnrations, sil nest pas amlior
la dernire gnration, il sera au moins prserv. La figure 3.31 montre la rpartition
des objectifs relatifs aux chromosomes de la dernire gnration. On constate, un regroupement au tour du front de Pareto (figure 3.32) et une amlioration significative des deux
objectifs. Une fois lapprentissage accompli, les performances du rseau neur-flou sont
alors values sur un ensemble de test de 75 points gnrs partir dun signal dentre
sinusodal de la forme:
u(k) = sin(2k/25)
(3.38)
Le rsultat de simulation obtenu est donn par la figure 3.33. On constate que le rseau
neuro-flou ralise une bonne approximation du systme avec une erreur quadratique mo-
97
F IG . 3.31 Rpartition des solutions de la dernire gnration
F IG . 3.32 Rpartition des solutions du front de Pareto
yenne de 2,69.103 . Pour ce rsultat, nous avons choisi les paramtres relatifs au chromosome appartenant au front de Parto de la population finale et indiqu par un triangle.
Dans ce chromosome, uniquement 6 rgles floues ont t considres, le reste (21 rgles)
est dsactiv par les valeurs prises par les gnes de contrle (les gnes de contrle correspondant sont nuls).
98
GNTIQUES
F IG . 3.33 Test du modle
TAB . 3.13 Paramtres des fonctions dappartenance relatifs la solution de test

N
u(k 1)
-1.4652
1.7419
-0.2416
1.9084
0.9720
1.5988
y(k 1)
-2.0775
1.1299
2.1737
1.0939
y(k 2)
-1.6944
1.1538
2.7835
1.7626
5.6253
2.1412
TAB . 3.14 Base de rgles relative la solution de test

Rgle
Prmisses des rgles floues
Paramtres relatifs aux rgles floues
u(k 1)
y(k 1)
y(k 2)
ai0
ai1
ai2
ai3
-1.1995
0.7939
-0.1907
0.0211
0.1951
0.7252
0.8052
-0.2866
10
0.9245
0.9832
0.2813
0.0423
13
-1.2289
1.0474
-0.5949
-0.1234
21
-0.0420
0.1193
-0.3753
0.2551
23
1.2833
0.6592
0.4041
0.2518
Afin de montrer lefficacit de lalgorithme hybride propos, le mme problme de

modlisation est trait avec un autre rseau neuro-flou qui exploite des rgles floues de
types Mamdani et qui a t propos par Farag et al. (1998). Dans leur modle les auteurs
proposent un algorithme dapprentissage rparti en trois phases. Ils utilisent durant la premire phase lalgorithme de Kohonen pour trouver les fonctions dappartenance initiales
et dans la seconde phase lalgorithme MMFA (Maximum Matching-Factor Algorithm)
pour loptimisation des rgles floues et enfin un algorithme gntique pour un deuxime
3.5. CONCLUSION
99
rglage des fonctions dappartenance. Aussi le tableau (3.15) prsente une tude comparative avec dautres approches de modlisation utilisant les rgles floues de type Takagi
Sugeno. Dans (Wang et Langari, 1996), les fonctions dappartenance sont obtenues par
lalgorithme de classification floue fuzzy c-mean alors que les paramtres relatifs aux
rgles floues sont estims par la mthode des moindres carrs. Cest encore cette dernire
mthode qui est combine avec lalgorithme de rtropropagation dans lapproche de Jang
(1993). Les rsultats obtenus, montrent que les performances de notre approche sont suprieures celles des autres modles mme avec un nombre rduit de rgles floues. Il est
aussi important de noter que notre algorithme hybride aboutit un ensemble de solutions
optimales en sens de Pareto au lieu dune unique solution, ensemble qui pourra tre filtr
et affin par lutilisateur.
TAB . 3.15 Comparaison avec dautres modles
Structure
Variables dentre
Notre modle
EQM
EQM
Nombre de rgles
(Apprentissage)
(test)
0.00520
0.00269
u(k 1)
0.00469
0.00260
y(k 1)
11
0.00372
0.00250
y(k 2)
16
0.00295
0.00189
22
0.00245
0.00179
22
0.00357
0.00214
12
0.01321
0.01200
0.00980
0.01150
Modle de Mamdani
u(k 1)
(Farag et al., 1998)
y(k 1)
y(k 2)
Modle de Sugeno
u(k 1)
(Jang, 1993)
y(k 1)
y(k 2)
Modle de Sugeno
u(k 1)
(Wang et Langari, 1996)
y(k 1)
y(k 2)
3.5
Conclusion
Dans ce chapitre nous avons dcrit les trois mthodes proposes pour la conception
dun contrleur flou par algorithmes gntiques.
Nous avons donc prsent dans un premier temps la mthode de synthse dun contrleur
flou de type Mamdani base sur un algorithme gntique simple. Cette mthode consiste
en loptimisation simultane des fonctions dappartenance, de la base de rgles et des facteurs dchelle. Pour cela, nous avons dabord propos une mthode de reprsentation de
lensemble des paramtres du contrleur. Cette reprsentation fait intervenir trois types de
100
GNTIQUES
codage savoir un codage en base n, un codage en nombre rels et un codage en binaire.

Ensuite nous avons dcrit ltape dinitialisation des chromosomes en sattardant sur la
partie du chromosome correspondant aux rgles floues. Enfin pour tester lefficacit de
la mthode, un problme de commande dun systme de deuxime ordre a t considr.
Les rsultats obtenus montrent limportance et lintrt des AG dans lamlioration des
performances du contrleur. Nanmoins lanalyse des la base de rgles, rsultante la
fin du processus doptimisation, montre la prsence de rgles incohrentes. Pour palier
cet inconvnient, nous avons utilis les AGH cause de la structure de leurs chromosomes qui ont permis en plus du codage des paramtres du contrleur, lactivation et la
dsactivation des rgles floues. En introduisant alors un deuxime objectif (minimisation
du nombre de rgles) qui dfavorise les solutions avec un nombre important de rgles, il
est possible dliminer les rgles incohrentes comme le montre les rsultats de simulations qui ont t faites sur le mme systme du deuxime ordre. Il faut noter que les deux
mthodes doptimisation par AGS et AGH peuvent tre couteuses en temps de calcul (parcourir un nombre important de gnrations), dans le cas dun contrleur plus de deux
variables dentre, vu le manque de modles de rgles utiliser pour linitialisation des
chromosomes. Nous nous sommes donc intresss au contrleur de Sugeno, qui facilite
lexploitation des algorithmes dapprentissage classiques (moindres carrs, descente du
gradient) pour lajustement de leurs paramtres, incluant ceux correspondant aux rgles
floues. Nous avons propos pour ce type de contrleurs, une mthode dapprentissage hybride qui utilise lalgorithme de rtropropagation pour linitialisation des chromosomes et
le NSGA-II pour un lajustement des paramtres tout en minimisant le nombre de rgles
floues
Chapitre 4
Application un bioprocd
4.1
Introduction
Dans ce chapitre, nous allons dabord dcrire le procd de fermentation sujet de notre
application et le modle retenu pour sa conduite. Ensuite nous allons procder lapplication des approches de commande dveloppes dans le chapitre prcdent.
La bio-industrie a connu ces dernires annes un progrs considrable. Une grande diversit de produits (alcools, protines, enzymes, pesticides, antibiotiques,..etc.) sont aujourdhui obtenus par fermentation.
Le but recherch dans ce domaine suivant dun point de vue automatique est loptimisation de la productivit, lamlioration de la qualit des produits et la dtection prcoce des
anomalies de fonctionnement, par la surveillance et la conduite automatique des bioracteurs.
Les procds biotechnologiques tels que la fermentation sont des procds complexes
cause du caractre vivant du processus. Ils sont non linaires, non stationnaires et caractriss par un manque de capteurs fiables et /ou peu coteux. Cependant, les performances
des mthodes classiques de commande se dgradent dautant plus que la dynamique du
modle utilis sloigne de celle du procd.
101
102
CHAPITRE 4. APPLICATION UN BIOPROCD
4.2
Procd de fermentation
La fermentation microbienne est un procd qui a pour finalit de faire crotre une
population de micro-organismes (levures, bactries, champignons, etc.) aux dpens de
certains substrats carbons, lintrieur dun bioracteur soumis des conditions environnementales (temprature, pH, aration, etc.) variable celon le rsultat voulu. Chaque
type de micro-organismes possde des caractristiques lies son matriel gntique et
ses mcanismes de rgulation interne. Ainsi, la fermentation peut avoir diffrentes utilisation:
Production de micro-organismes: lobjectif premier est la croissance de la masse
cellulaire elle-mme. Cest le cas des cultures visant produire la levure de boulanger.
Production mtabolique: dans ce cas, cest la production de substances organiques
rsultantes de lactivit mtabolique qui est favorise (alcools, antibiotiques, etc.)
Consommation du substrat: ici, cest la dgradation du substrat qui est privilgie.
On retrouvera dans cette catgorie les procds de dpollution (traitement biologique des eaux uses)
A titre dexemple, la fermentation thylique sous certaines conditions denvironnement,
consiste dgrader biologiquement du glucose (substrat) par des levures (biomasse) en
anarobie, de manire produire de lthanol (produit). Cette transformation est illustre
par la figure (4.1).
F IG . 4.1 Schma simplifi dune culture de levure
Trois modes de fonctionnement des bioprocds sont habituellement considrs dans

la littrature (Dochain, 2001).
4.3. MODLISATION DES BIOPROCDS
103
le mode discontinu: le substrat est introduit initialement dans le bioracteur contenant les souches microbiennes. Les ractions seffectuent volume constant et le
procd sarrte par puisement du substrat ou inhibition de la biomasse ou le produit.
le mode semi-continu: le substrat est introduit dans le bioracteur au fur mesure
des besoins des micro-organismes et le volume est donc variable.
le mode continu: le racteur est aliment en substrat avec un flux constant et le
milieu ractionnel est soutir en permanence avec le mme flux, le volume est donc
constant dans le racteur.
4.3
Modlisation des bioprocds
Contrairement une large gamme de systmes physiques (machines lectriques, organes mcaniques, systmes hydrauliques, etc.) o il existe des lois connues depuis des
sicles, la plupart des modles en biologie reposent sur des lois empiriques. De ce fait, la
modlisation des systmes biologiques nest pas bien matrise et on trouve actuellement
une bibliographie abondante de modles mentionns dans la littrature.
Pour donner une description physique satisfaisante du processus de fermentation, il faut
combiner les quations cintiques qui reprsentent le modle microbien avec les quations
de bilans de matires. Le modle microbien qui dcrit la rponse des micro-organismes
au changement de son environnement peut tre soit structur soit non structur. Dans le
cas des modles non structurs, la constante de temps des mcanismes est trs faible et
ladaptation est donc trs rapide. Les modles structurs sont utiliss pour tenir compte
de lvolution de la composition et du mtabolisme interne des micro-organismes qui ont
des constantes de temps plus importantes.
4.3.1
Modles non structurs
Les modles non structurs sont bass sur lobservation des cintiques macroscopiques au sein du bioracteur. Ils sont dit non structurs car ils ne tiennent pas compte
de la composition intracellulaire des cellules. La biomasse est reprsente par une seule
104
variable qui est sa concentration dans le milieu ractionnel. Ces modles sont gnralement bass sur lquation de Monod (Monod, 1942) ou des quations du mme type
globalisant les diffrentes ractions enzymatiques. Les constantes apparaissant dans ces
quations sont empiriques et souvent dtermines par optimisation partir de donnes exprimentales. Dautres quations dcrivant la consommation du substrat et la production
des produits sont ncessaires pour dcrire le procd.
Ce sont les modles non structurs qui sont exclusivement employs, au LAAS (DISCO),
dans le cas de la fermentation alcooliques (Maher, 1995; Vasilache, 2000; Kabbaj, 2004;
Li, 2006).
4.3.2
Modles structurs
Les modles structurs ont t dvelopps pour tenir compte de lvolution de la structure du mtabolisme interne des micro-organismes. Dans ces modles, les composs de la
biomasse sont dcrits par des variables clefs qui dcrivent le comportement cellulaire. Par
ce moyen, lactivit microbienne devient non seulement une fonction de variables abiotiques (temprature, pH, etc.) qui peuvent changer avec des faibles constantes de temps
mais aussi une fonction de la composition cellulaire qui dpend de lhistorique de la cellule (Bideaux, 2000).
Ces modles sont trs riches en informations et peuvent tre utiliss la place des modles non structurs dans le cas o ceux-ci sont insuffisants. Toutefois, la difficult de la
vrification exprimentale qui requiert parfois la mesure des composants intracellulaires
selon diffrentes conditions opratoires constitue lun des freins lutilisation de ce type
de modles. Dans notre travail, cest le modle non structur qui sera utilis pour dcrire
la dynamique du procd de fermentation alcoolique.
4.4
Modlisation de la fermentation alcoolique
Considrons un bioracteur infiniment mlang au sein duquel une population de

micro-organismes C se dveloppe en consommant du substrat S et en produisant un produit P . Gnralement le modle dynamique dun tel procd dcoule directement de lexpression de bilans de matires applique aux diffrentes variables (biomasse, substrat et
produit) du bioracteur, auquel sajoute lquation dcrivant la variation du volume rac-
4.4. MODLISATION DE LA FERMENTATION ALCOOLIQUE
105
tionnel:
dC
Fs
= C km C C
(4.1)
dt
V
dS
1
Fs
Fs
=
(4.2)
C mC + Sa S
dt
yc/s
V
V
yp/s
dP
Fs
=
(4.3)
C P
dt
yc/s
V
dV
= Fe Fs
(4.4)
dt
o C, S, P reprsentent respectivement les concentrations en biomasse, en substrat et en
produit dans le bioracteur, Sa est la concentration en substrat dans lalimentation, km le
taux de mortalit naturelle des cellules,m le coefficient de maintenance de la biomasse
sur le substrat, Fe le dbit dalimentation en substrat et Fs le dbit de soutirage.
Le taux de croissance est un paramtre ncessaire pour dcrire lvolution de la biomasse. Mme si ce paramtre dpend fortement de plusieurs facteurs tels que les conditions opratoires (temprature, pH, etc.) et le milieu opratoire (concentration en composs carbons, azots, phosphors, en produits), lexpression la plus couramment utilise
est le modle de Monod, introduit ds le dbut du sicle par Michalis-Menten pour dcrire une raction enzymatique :
S
(4.5)
Ks + S
est le taux maximum de croissance et Ks , appele constante de Michalis = max
o max
Menten, correspond laffinit des micro-organismes pour le substrat limitant S. Les

valeurs numriques des ces paramtres ainsi que celles des rendements de conversion(
yc/s et yp/s ) sont dtermines en fonction des rsultats exprimentaux.
A partir de ces quations gnrales, on retrouve les trois modes de fonctionnement de la
fermentation dcrits prcdemment :
4.4.1
Mode discontinu
Au dpart, tout le milieu de culture est introduit dans le fermenteur en prsence des
micro-organismes. Ces derniers se dveloppent en consommant le substrat du milieu de
culture et la fin de la fermentation on extrait le produit intressant. Cela se traduit par :
Fe = Fs = 0
(4.6)
106
4.4.2
Mode semi-continu
La fermentation se droule avec un volume initial V0 infrieur au volume maximal Vm

du fermenteur. Le milieu nutritif est apport, avec un dbit contrl en cours de la fermentation au fur et mesure de la consommation du substrat par les micro-organismes. On
arrte la fermentation lorsquon atteint le volume maximal puis les produits intressants
sont extraits. Cela se traduit par :
Fe 6= 0 et Fs = 0
(4.7)
On utilise une variable D(t), appele taux de dilution, pour exprimer le dbit par unit de
volume.
D(t) =
4.4.3
Fe (t)
V (t)
(V0 V (t) Vm )
(4.8)
Mode continu
Le procd fermentaire continu nentrane aucune variation du volume ractionnel. Le

fermenteur est aliment en milieu de culture et soutir avec le mme dbit en permanence.
Fe = Fs = Fc
(4.9)
et le taux de dilution est donn par:

D(t) =
Fc
V
(4.10)
avec V (t) = Vc = Constante

Les variables denvironnement, sont maintenues fixes suivant le mode de fonctionnement
considr. Elles sont donnes par le tableau suivant:
TAB . 4.1 Variables denvironnement maintenues au cours de la fermentation
Variables
Valeurs
Discontinu
Semi-continu
Continu
Temprature ( C)
30
30
30
pH
3,8
3,8
3,8
Volume actif (l)
30
30
30
Agitation (tr/m)
200
300
200
Aration (l/h)
32
4.4.4
107
Modle dynamique
Le modle retenu pour une fermentation alcoolique en mode continu est donn par les
quations suivantes :
dC
= C(t) D(t)C(t)
dt
(4.11)
dS
1
=
C(t) mC(t) + D(t)Sa D(t)S(t)
dt
yc/s
(4.12)
Yp/s
dP
=
C(t) D(t)P (t)
dt
yc/s
(4.13)
dV
= Fe Fs = 0
dt
(4.14)
(t) = max (t)
S(t)
Ks + S(t)
(4.15)
Nous avons simul le modle pour diffrents taux de dilution. La rsolution des quations
du modle est faite par une mthode dintgration de Runge-Kutta dordre 4 sous Matlab
6.5.
4.4.5
Simulation du modle en mode discontinu
D(t) = 0 caractrise une fermentation en mode batch (discontinu) ce qui nest pas reprsentatif de la culture continue. Le modle en discontinu, est simul sous les conditions
et les paramtres de synthse suivants: C(0) = 0.2g/l, S(0) = 90g/l, P (0) = 0.2g/l,
max = 0.38h1 Sa = 100g/l, Ks = 2, Yc/s = 0.07 Yp/s = 0.44
108
F IG . 4.2 Evolution des concentrations en substrat, biomasse, produit et du taux de

croissance pour une fermentation en mode batch
Daprs les rsultats obtenus, on constate pour de fortes concentrations en substrat,

entranent une inhibition de la croissance en biomasse et en produit. Cependant, son absence (substrat) un effet limitant sur ces derniers (Figure 4.2-a). Paralllement, le taux de
croissance dcrit par le modle de Monod, est en fonction de la concentration en substrat.
Une forte concentration de celui-ci limite le taux de croissance (Fig. 4.2-b), et linhibe
pour des faibles concentrations.
4.4.6
Simulation du modle en mode continu
Pour avoir un bon fonctionnement en mode continu, il faut appliquer un taux de dilution positif et infrieur la borne suprieure de la croissance (D(t) max ), cela, pour
viter le phnomne de lessivage ou rinage, qui entrane lanantissement et lextinction de la population cellulaire. De mme, si le taux de dilution est trs faible (au voisinage
de zro), le temps de rsidence des cellules dans le fermenteur crot et engendre une mortalit cellulaire. En tenant compte des contraintes du taux de dilution nous avons simul
le modle du bioprocd en mode continu. Les conditions initiales et les paramtres de
synthse utiliss sont: C(0) = 5g/l, S(0) = 5g/l, P (0) = 0.2g/l, max = 0.38h1
Sa = 100g/l, Ks = 2, Yc/s = 0.07 Yp/s = 0.44
Lvolution des diffrentes variables du systme est donne par la figure (4.3).
109
F IG . 4.3 Evolution des variables dtat pour une fermentation en mode continu
Nous avons appliqu un taux de dilution avec changement de consigne donn sur la
figure 4.3-a, pour tudier la cintique des variables dtat du bioprocd. On remarque,
que pour les conditions initiales utilises, le taux spcifique de croissance suit approximativement le taux de dilution appliqu.
Conjointement, lvolution de la concentration en biomasse et celle du produit (Figure
4.3-b) et (Figure 4.3-c), sont disproportionnelles au taux spcifique de croissance et au
taux de dilution appliqu (Figure 4.3-a). Cela se traduit, par une croissance de la biomasse et du produit au dtriment (avec dgradation) du substrat (Figure 4.3-d), qui est
une fonction du taux spcifique de croissance.
110
4.5
Application des approches intelligentes pour
la conduite du bioprocd
La commande des bioprocds, a pour objectif la maximisation de la productivit, la
minimisation des dpenses nergtiques et lamlioration de la qualit des produits obtenus.
Les performances dun bioprocd fonctionnant en mode continu, peuvent tres obtenues en deux tapes. Dabord, on dfinit exprimentalement des profils optimaux pour
les variables dintrt, ensuite, on dveloppe une commande qui se charge de rguler ces
variables dintrt autour des profils prdfinis.
Dans notre cas, lobjectif de la commande est de dterminer le taux de dilution D(t) permettant de rguler la concentration en substrat suivant une consigne (profil) de rfrence
Sr (t).
4.5.1
Optimisation du contrleur flou par algorithme gntique simple
Pour rguler la concentration du substrat lintrieur du racteur, nous utilisons la

structure de rglage illustre ci-dessous.
F IG . 4.4 Principe de la commande floue optimise par algorithme gntique
Le contrleur flou reoit dans ses deux entres, lerreur de la concentration en substrat
et sa variation et fournit en sortie la variation du taux de dilution D(t) qui sert ajuster
4.5. APPLICATION DES APPROCHES INTELLIGENTES POUR LA CONDUITE DU

BIOPROCD
111
le signal de commande D(t) :

u(t) = D(t) = Gs D(t) + u(t 1)
(4.16)
Afin dobtenir une rponse optimale, les paramtres du contrleur flou (fonction dappartenance, rgles floues et facteurs dchelle) sont optimiss par un algorithme gntique
simple.
4.5.1.1
Rsultats de simulation
Le bioprocd en mode continu est simul partir des quations (4.11-4.15) en utilisant la mthode dintgration de Runge-Kutta dordre 4.
Les conditions initiales et les paramtres de synthse utiliss sont: C(0) = 5g/l, S(0) =
5g/l, P (0) = 44g/l, max = 0.38g/l, Sa = 100g/l, Ks = 5, Yc/s = 0.07, Yp/s = 0.44.
Deux structures du contrleur flou ont t testes.
La premire correspond un partitionnement avec 5 fonctions dappartenance de type
gaussiennes {NG: Ngatif Grand, NM: Ngatif Moyen, EZ: Zro, P: Positif, PG: Positif
Grand} pour chacune des variables du contrleur et 25 rgles floues.
Dans la deuxime, nous utilisons galement le mme type de fonctions dappartenance
mais avec un partitionnement plus fin de 7 ensembles flous {NG, NM, NP, EZ, PP, PM,
PG}. La base de rgles correspondante possde alors une taille de 49 rgles. Nous rappelons que la taille de la base de rgles demeure constante durant tout le processus doptimisation.
Les intervalles de variation des centres des fonctions dappartenance sont donns dans le
tableau 4.2.
TAB . 4.2 Intervalles de variation des centres des fonctions dappartenance
Premire structure Deuxime structure
Ensembles Flous
Min
Max
Min
Max
NG
-1
-0,5
-1
-0,70
NM
-0,35
-0,05
-0,69
-0,40
NP
-0,39
-0,05
EZ
-0,04
0,04
-0,04
0,04
PP
0,05
0,39
PM
0,05
0,35
0,40
0,69
PG
0,50
0,70
112
Ils sont dtermins de manire obtenir la fin du processus doptimisation des partitions lisibles dont les ensembles flous interprtent rellement les termes linguistiques qui
leur sont associs. Le niveau de chevauchement entre deux fonctions voisines est dfini
dans lintervalle [0.05, 0.6]
Les intervalles de variations des facteurs dchelle en entre du contrleur flou sont obtenus partir du profil de rfrence. En effet la connaissance de la variation maximale
du profil de rfrence (voir figure 4.7) et de la variation de la concentration en substrat
conduit la dfinition des intervalles suivant:
TAB . 4.3 Intervalles de variation des facteurs dchelle
Facteurs dchelle
Ge
Ge
Gu
Min
0,05
Max
10
0,15
Quant lintervalle de variation du gain Gu (tableau), il est choisi de manire faire

un compromis entre rapidit et stabilit.
a.Fonction objectif
La mise au point du contrleur flou est ralise en minimisant un critre qui comprend
lintgrale de lerreur absolue (IAE) et lintgrale de lerreur absolue temporelle (ITAE):
Ob = IAE + IT AE
(4.17)
Par cette combinaison, il est possible de minimiser lerreur durant la priode transitoire
(IAE), et en rgime permanent par lemploi de (ITAE).
b.Paramtres de lAG
Comme pour beaucoup dalgorithmes, les paramtres de lalgorithme gntique doivent
tre soigneusement choisis pour obtenir de bons rsultats. Dans notre cas, nous avons
utilis les paramtres suivants:
Longueur du chromosome:
1. Premire structure: 76 (27 pour les fonctions dappartenance, 25 pour les
rgles floues et 24 (3*8) pour les facteurs dchelle)
2. Deuxime structure: 112 (39 pour les fonctions dappartenance, 49 pour les
rgles floues et 24 pour les facteurs dchelle)
Probabilit de croisement: 0,85

BIOPROCD
113
Probabilit de mutation: 0,01

Taille de la population: 30
Maximum de gnrations: 500
Mthode de slection: tournoi combin aves une approche litiste.
Premire structure
Les rsultats obtenus pour cette premire structure sont ports sur les figures 4.5-4.8.
F IG . 4.5 Evolution de lobjectif (Ob) travers les gnrations-structure 5*5*5
Nous remarquons que les rsultats diffrent de gnration en gnration. La valeur du

critre de performance Ob est rapidement amliore au cours des premires gnrations,
et est ramene de 661,01 23,65 au bout de 20 gnrations seulement. Elle atteint sa valeur optimale (Ob = 17,85) aprs 463 gnrations puisque cest toujours cette valeur qui
revient jusqu la fin du processus doptimisation.
Les figure 4.6 donnant lvolution des paramtres des fonctions dappartenance justifie
bien le rle des oprateurs gntiques (slection, croisement et mutation) en exploitant
des points diffrents dans lespace de recherche des paramtres. Il est important de noter
que les variations des paramtres sont relativement importantes au cours des premires
gnrations par rapport au reste des gnrations.
114
F IG . 4.6 Evolution des paramtres du contrleur flou travers les gnrations-structure

5*5*5

BIOPROCD
115
Pour mieux illustrer lvolution des rsultats, nous portons dans les figures ci-aprs
lvolution de la concentration en substrat, du signal de commande et des paramtres du
contrleur, obtenus lors de la premire et de la dernire gnration (1, 500).
F IG . 4.7 Evolution de la concentration en Substrat pour le meilleur chromosome de la

premire gnration-structure 5*5*5
La figure (4.7) prsente lvolution de la concentration en substrat pendant 45 heures

de fermentation continue, correspondant au meilleur chromosome de la premire gnration. Nous remarquons la prsence doscillations qui stalent sur des intervalles de temps
trs importants.
TAB . 4.4 Facteur dchelle correspondants au meilleur chromosome de la premire
gnration-structure 5*5*5
Facteurs dchelle
Valeur
Ge
Ge
Gu
1,6059
1,2431
0,1000
116
F IG . 4.8 Fonctions dappartenance correspondantes au meilleur chromosome de la premire gnration-structure 5*5*5
TAB . 4.5 Base de rgles floues correspondante au meilleur chromosome de la premire

u
e
NG NM
EZ PM
PG
NG
NP
EZ
PM
PG

BIOPROCD
117
Le rsultat de la dernire gnration est nettement meilleur. On peut constater la disparation des oscillations lexception de quelques-unes qui apparaissent aux instants des
changements de consignes. Ces dernires sont rapidement attnues par une action optimale du contrleur flou et les paramtres (figure 4.10 , tableaux 4.6 et 4.7) sont trs
diffrents de ceux obtenus au dbut du processus doptimisation.
F IG . 4.9 Evolution de la concentration en Substrat et le taux de dilution pour la dernire

TAB . 4.6 Facteur dchelle correspondants au meilleur chromosome de la dernire

Facteurs dchelle
Valeur
Ge
Ge
Gu
0,8706
1,0392
0,1024
118
F IG . 4.10 Fonctions dappartenance correspondantes au meilleur chromosome de la

dernire gnration-structure 5*5*5
TAB . 4.7 Base de rgles floues correspondante au meilleur chromosome de la dernire

u
e
NG NM
EZ PM
PG
NG
EZ
PG

BIOPROCD
119
Deuxime structure
Pour cette partie et par manque despace, nous reprsentons uniquement lvolution
du critre de performances travers les gnrations, les paramtres du contrleur flou et
la sortie du procd correspondants au meilleur chromosome de la dernire gnration.
F IG . 4.11 Evolution de lobjectif (Ob) travers les gnrations-structure 7*7*7
La figure (4.11) dcrit lvolution de lobjectif Ob en fonction du nombre de gnrations parcourues. De mme que pour la premire structure, on remarque que le critre de
performance diminue rapidement durant les premires gnrations ([0, 20] et [20,135]). Il
continue diminuer lentement jusqu atteindre la valeur 16,56 la 200me gnration.
A partir de cette gnration, on enregistre de trs faibles variations de la fonction objectif
(Ob) soit une diffrence de 0,02 jusqu la 500me gnration.
Les concentrations en substrat et du taux de dilution obtenus pour la 500me gnration
sont donns sur la figure 4.12.
120
F IG . 4.12 Evolution de la concentration en Substrat et le taux de dilution pour la dernire gnration-structure 7*7*7
Cette variable suit bien le profil dsir, soit une erreur nulle en rgime permanent et un
temps de rponse trs rduit sans quil y ait de dpassements et doscillations aux instants
de changements de consigne.
Les facteurs dchelle, les paramtres des fonctions dappartenance et la base de rgles
correspondants sont respectivement donns par le tableau 4.8, la figure 4.13 et le tableau
4.9.
TAB . 4.8 Facteur dchelle correspondants au meilleur chromosome de la dernire

Facteurs dchelle
Valeur
Ge
Ge
Gu
1,0529
1,0078
0,0871

BIOPROCD
121
F IG . 4.13 Fonctions dappartenance correspondantes au meilleur chromosome de la

dernire gnration-structure 7*7*7
TAB . 4.9 Base de rgles floues correspondante au meilleur chromosome de la dernire

u
e
NG NM
NP
PP
PM
PG
NG
NM
NP
PP
PM
PG
122
Notons bien quune attention particulire doit tre porte sur les bases de rgles obtenues, pour les deux structures, en fin du processus doptimisation. Celles-ci prsentent
des rgles incohrentes (cellules noires des tableaux 4.7 et 4.9) qui peuvent avoir un effet
ngatif sur la rponse du contrleur. Pour lAGS, la prsence de ces rgles ne peut tre
ressenti tant que le critre numrique base duquel les individus sont valus, nest pas
dtrior. Pour palier cet inconvnient, nous introduisons donc un deuxime objectif qui
est la minimisation du nombre de rgles floues. Ce dernier permet de privilgier, durant
le processus doptimisation, les contrleurs flous avec un minimum de rgles ce qui permettra dliminer les rgles inutiles.
4.5.2
Optimisation du contrleur flou par algorithme gntique hirar-
chis
La stratgie de commande reste la mme (fig.4.4), seule la mthode doptimisation des
paramtres du contrleur flou diffre. On utilise cette fois ci un AGH la place dun AGS
ce qui permet dune part de coder par le biais des gnes des paramtres, les paramtres
des fonctions dappartenance, les facteurs dchelle et les conclusions des rgles floues,
comme sil sagissait dun algorithme gntique simple et dautre part lactivation ou la
dsactivation des rgles floues par le biais des gnes de contrle, chose qui diffre dun
AG simple. En effet, dans les deux cas prcdents (premire et deuxime structure) toutes
les rgles floues et parmi elles les rgles incohrentes, sont restes actives.
4.5.2.1
Objectifs de la stratgie de commande
Deux objectifs sont considr le premier est lamlioration des performances du systme de commande et le deuxime concerne la rduction de la complexit du contrleur :
Ob1 = IAE + IT AE
Ob2 =
49
X
zi
(4.18)
(4.19)
i=1
Comme il sagit dun problme doptimisation multi-objectif (Ob1 et Ob2 ), nous avons
opt pour le NSGA-II comme algorithme de rsolution (mthode de slection).

BIOPROCD
123
4.5.2.2
Rsultats de simulation
Pou vrifier les performances de la mthode doptimisation, nous utilisons un contrleur flou configur selon la deuxime structure dj prsente prcdemment.
Les intervalles de variation de lensemble des paramtres du contrleur restent les mmes.
On garde galement le mme profil de consigne.
Les paramtres du NSGA-II sont rsums ainsi:
Longueur du chromosome: 161(49 pour les gnes de contrle, 39 pour les fonctions
dappartenance, 49 pour les rgles floues et 24 (3*8) pour les facteurs dchelle)
probabilit de croisement des gnes de paramtres : 0.85
Probabilit de croisement des gnes de contrle : 0.45
Probabilit de mutation des gnes de paramtres : 0.01
Probabilit de mutation des gnes de contrle: 0.005.
Taille de la population: 40
Maximum de gnration : 1000
La figure (4.14) donne la rpartition des chromosomes de la premire gnration dans
lespace des objectifs.
F IG . 4.14 Rpartition de solutions de la premire gnration
124
On constate que la valeur de lobjectif Ob2 est maintenue 49 pour tous les chromosomes. Cela permet de considrer, pour chaque solution, la totalit des rgles floues durant la premire gnration (tous les gnes de contrle sont initialiss 1). Les diffrentes
valeurs de lobjectif Ob1 sont dues linitialisation alatoire des gnes de paramtres correspondants aux fonctions dappartenance et aux facteurs dchelle.
De gnration en gnration, la valeur dOb1 est considrablement amliore, toute en
minimisant le nombre de rgles floues actives.
Nous reprsentons ci-aprs la rpartition des chromosomes obtenue la fin du processus
doptimisation (figure 4.15). Il est important de noter les amliorations apportes simultanment aux deux objectifs Ob1 et Ob2 .
Nous avons pour la plupart des solutions, notamment celles appartenant au premier front
de Pareto, un rsultat meilleur que celui correspondant au meilleur chromosome de la
population initiale.
F IG . 4.15 Rpartition de solutions de la dernire gnration
La figure 4.16 donne lvolution de la concentration en substrat et le signal de commande obtenus pour une solution de test choisie du front de Parto.
Pour cette solution uniquement 26 rgles sont considres (tableau 4.10), les autres rgles
(23 rgles) sont annules par les gnes de contrle.

BIOPROCD
125
F IG . 4.16 Evolution de la concentration en Substrat et le taux de dilution
On a un bon suivi du profil de rfrence et des performances trs comparables avec

celles obtenues par algorithme gntique simple (figures 4.9 et 4.12) en considrant toutes
les 49 rgles floues.
TAB . 4.10 Base de rgles correspondant la solution de test

u
e
NG NM
NG
NP
EZ PP
PM
NM
e
PG
6
NP
EZ
PP
PM
PG
5
7
126
4.5.3
Optimisation du contrleur flou de type Sugeno
Le schma de principe utilis pour loptimisation du contrleur flou de type Sugeno

est reprsent dans la figure 4.17
F IG . 4.17 Schma de principe de loptimisation dun contrleur flou de type Sugeno
On distingue deux tapes doptimisation dans ce schma: la rtropropagation qui ralise un premier ajustement des paramtres (premire tape) et un AGH permettant de
modifier encore une deuxime fois les paramtres et de minimiser le nombre de rgles
floues (deuxime tape).
La squence de rfrence dsire Sr (t) est gnre par le modle
dSr (t)
+ 0.33Sr (t) = 0.33S (t)
dt
(4.20)
avec S (t) est la consigne de la concentration en substrat et dont les valeurs sont prises
comme suit:
S (t) =
6g/l pour 0h < t 22,5h
8g/l pour 22,5h < t 45h
6g/l pour 22,5h < t 67,5h
Le contrleur flou reoit par ses deux entres la concentration dsire en substrat Sr (t)
et la valeur passe de la concentration en substrat S(t 1). Il fournit en sortie le taux de
dilution D(t) qui alimente le bioracteur avec une priode dchantillonnage de 9 minutes

BIOPROCD
127
(0,15h).
Au niveau de la structure interne, chaque variable du contrleur est partitionne en 7
ensembles flous (A1 , A2 , .., A7 pour Sr (t) et B1 , B2 , .., B7 pour S(t 1)) et dfinie sur
lunivers de discours [4.8, 8,2]. La table de rgles associe, comporte alors 49 rgles de
la forme:
Ri : Si Sr (t) est Ai et S(t 1) est Bi Alors D(t) = ai0 + ai1 .Sr (t) + ai2 .S(t 1) (4.21)
avec ai0 , ai1 et ai2 sont les paramtres relatifs la rgle Ri .
4.5.3.1
Premire tape: optimisation par rtropropagation
Ladaptation des paramtres du contrleur est ralise en minimisant chaque instant

dchantillonnage le critre quadratique:
1
J(t) = (S(t) Sr (t))2
2
(4.22)
laide dune technique de descente du gradient:
p(t + 1) = p(t) + p(t)

J(t) S(t) D(t)
J(t)
p(t)
=
=
p(t)
S(t) D(t) p(t)
(4.23)
J(t)
S(t)
S(t) S(t 1)
= S(t)Sr (t) et
est grossirement approxim par: signe(
).
S(t)
D(t)
D(t) D(t 1)
D(t)
Le terme
se calcule selon lalgorithme de rtropropagation dcrit dans la section
p(t)
4 du chapitre 3.
avec
Comme notre objectif, en plus de la minimisation du critre numrique J(t), est dobtenir
un contrleur flou avec des partitionnements interprtables, ladaptation par rtropropagation est limite uniquement aux paramtres aij relatifs aux conclusions des rgles floues.
Les centres est les variances des fonctions dappartenance restent donc constants durant
cette premire tape doptimisation. Ils sont initialiss de manire obtenir des ensembles
flous uniformment rpartis sur leur univers de discours ([4.8, 8.2]).
Le suivi de la trajectoire de rfrence lissue de cette premire tape est dj satisfaisant
et est reprsent dans la figure 4.18
128
F IG . 4.18 Evolution de la concentration en Substrat et le taux de dilution aprs la

premire phase doptimisation
Les fonctions dappartenance et la base de rgles du contrleur flou sont donnes

respectivement par la figure 4.19 et le tableau 4.11
F IG . 4.19 Fonctions dappartenance initiales

BIOPROCD
129
TAB . 4.11 Base de rgles obtenue aprs la rtropropagation

Rgle
Prmisses des
Paramtres relatifs
rgles floues
aux rgles floues
Rgle
Prmisses des
Paramtres relatifs
rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
A1
B1
0.0039
0.0205
0.0085
A1
B2
0.0052
0.0021
A1
B3
0.0008
A1
B4
0.0035
A1
B5
A1
aux rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
26
A4
B5
0.0070
0.0129
0.0123
0.0099
27
A4
B6
0.0029
0.0052
0.0098
0.0084
0.0089
28
A4
B7
0.0019
0.0061
0.0102
0.0057
0.0026
29
A5
B1
0.0084
0.0473
0.0316
0.0069
0.0040
0.0090
30
A5
B2
0.0068
0.0268
0.0203
B6
0.0001
0.0038
0.0100
31
A5
B3
0.0133
0.0304
0.0319
A1
B7
0.0008
0.0036
0.0082
32
A5
B4
0.0041
0.0208
0.0163
A2
B1
0.0070
0.0246
0.0117
33
A5
B5
0.0057
0.0162
0.0148
A2
B2
0.0090
0.0109
0.0187
34
A5
B6
0.0011
0.0110
0.0125
10
A2
B3
0.0072
0.0036
0.0017
35
A5
B7
0.0083
0.0078
0.0126
11
A2
B4
0.0068
0.0038
0.0096
36
A6
B1
0.0081
0.0458
0.0344
12
A2
B5
0.0064
0.0008
0.0072
37
A6
B2
0.0046
0.0256
0.0215
13
A2
B6
0.0065
0.0005
0.0034
38
A6
B3
0.0046
0.0343
0.0269
14
A2
B7
0.0063
0.0063
0.0058
39
A6
B4
0.0102
0.0237
0.0262
15
A3
B1
0.0077
0.0149
0.0175
40
A6
B5
0.0049
0.0216
0.0152
16
A3
B2
0.0057
0.0232
0.0192
41
A6
B6
0.0046
0.0162
0.0136
17
A3
B3
0.0071
0.0182
0.0165
42
A6
B7
0.0103
0.0086
0.0134
18
A3
B4
0.0051
0.0114
0.0121
43
A7
B1
0.0047
0.0091
0.0085
19
A3
B5
0.0013
0.0075
0.0011
44
A7
B2
0.0075
0.0041
0.0095
20
A3
B6
0.0094
0.0007
0.0051
45
A7
B3
0.0023
0.0124
0.0111
21
A3
B7
0.0042
0.0067
0.0038
46
A7
B4
0.0086
0.0195
0.0238
22
A4
B1
0.0087
0.0552
0.0349
47
A7
B5
0.0020
0.0186
0.0136
23
A4
B2
0.0068
0.0199
0.0208
48
A7
B6
0.0114
0.0155
0.0189
24
A4
B3
0.0076
0.0184
0.0229
49
A7
B7
0.0030
0.0188
0.0100
25
A4
B4
0.0122
0.0156
0.0156
4.5.3.2
Deuxime tape: optimisation par AGH
Au cours de la seconde et dernire tape doptimisation, lensemble des paramtres

du contrleur (paramtres relatifs aux fonctions dappartenance et aux conclusions des
rgles floues) sont optimiss tout en minimisant le nombre de rgles floues.
Deux objectifs sont considrs:
1. Minimisation de lerreur quadratique moyenne (EQM) de la concentration en substrat:
Ob1 = EQM =
1
(S(t) Sr (t))2
N
avec N est la taille du profil de rfrence Sr (t)

2. Minimisation du nombre de rgles floues (quation 3.22)
(4.24)
130
4.5.4
Paramtres de lAGH
Les paramtres utiliss sont donnes dans le tableau ci-dessous:

TAB . 4.12 Paramtres de lAGH
Chromosome de lAGH
Gnes de contrle
Gnes de paramtres
fonctions dappartenance
Reprsentation
binaire
Type de croisement
Probabilit de croisement
Types de mutation
relle
en deux points
0.2
standard
Probabilit de mutation
paramtres aij
0.005
0,85
non uniforme
gaussienne
quations 1.2 et 1.3
quation 1.4
0.01
0.008
Mthode de slection
NSGA-II
Taille de la population
40
Nombre de gnrations
1500
lr = 15
Contrainte
La figure 4.20 donne, dans lespace objectifs, la rpartition des solutions de la premire gnration dont laquelle on retrouve la solution obtenue par rtropropagation (cercle
noire: Ob1 = 7,209.104 , Ob2 = 49).
F IG . 4.20 Solutions de la premire gnration

BIOPROCD
131
La figure 4.21 illustre la rpartition des solutions de la dernire gnration. Nous remarquons pour la plupart des solutions une amlioration considrable des deux objectifs.
F IG . 4.21 Solutions de la dernire gnration
F IG . 4.22 Solutions du front de Pareto
Pour toutes les solutions du front de Pareto (figure 4.22), nous avons un bon suivi de
la trajectoire de rfrence (ob1 [2,538.104 , 5,784.104 ]). Comme exemple illustratif,
nous avons reprsent dans la figure 4.23 lvolution de la concentration en substrat pour
une solution du front de Pareto (carr bleu de la figure 4.22). Le suivi de la trajectoire de
rfrence est meilleur que celui obtenu aprs la rtropropagation. La commande applique
132
au bioracteur est douce et ne dpasse pas la valeur de max (D(t) < 0,38h1 , condition
quil faut toujours satisfaire, sans quoi, le bioracteur risque dtre lav).
F IG . 4.23 Evolution de la concentration en Substrat et le taux de dilution pour la solution de test

Pour cet exemple, uniquement 17 rgles floues sont considres (tableau 4.13), les
autres rgles (32 au total) sont annules par les gnes de contrle. Les fonctions dappartenance trouves pour cet exemple, sont donnes par la figure 4.24
F IG . 4.24 Fonctions dappartenance correspondant la solution de test
4.6. CONCLUSION
133
TAB . 4.13 Base de rgles relative la solution de test

Rgle
Prmisses des
Paramtres relatifs
rgles floues
aux rgles floues
Rgle
Prmisses des
Paramtres relatifs
rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
A1
B1
0.0043
0.0193
0.0089
A1
B2
0.0032
0.0013
A2
B1
0.0069
A2
B2
0.0090
10
A2
B3
16
A3
17
aux rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
26
A4
B5
0.0074
0.0110
0.0128
0.0099
32
A5
B4
0.0047
0.0210
0.0176
0.0256
0.0117
33
A5
B5
0.0068
0.0164
0.0148
0.0104
0.0180
34
A5
B6
0.0012
0.0116
0.0119
0.0072
0.0012
0.0020
40
A6
B5
0.0049
0.0214
0.0142
B2
0.0061
0.0265
0.0194
42
A6
B7
0.0100
0.0095
0.0142
A3
B3
0.0064
0.0181
0.0170
48
A7
B6
0.0082
0.0169
0.0186
18
A3
B4
0.0057
0.0098
0.0121
49
A7
B7
0.0025
0.0185
0.0102
24
A4
B3
0.0062
0.0203
0.0235
4.6
Conclusion
Ce chapitre a montr les diffrentes applications de la commande hybride GA/CF sur

un procd de fermentation en mode continu. Nous avons dabord prsent le modle
mathmatique du procd tabli partir des quations de bilan de matire. Ensuite des simulations en mode Batch et continu ont permi de retrouver les courbes classiques pour les
diffrentes variables, ce qui nous a permi de vrifier lexactitude des programmes crits
sous lenvironnement Matlab. La premire hybridation concerne loptimisation des paramtres dun contrleur flou de type Mamdani par algorithme gntique simple. Les rsultats obtenus sont satisfaisants dans la mesure o la sortie du procd (concentration en
substrat) suit bien le profil de rfrence. Nanmoins, linconvnient de la mthode rside
en niveau de la base de rgles obtenue la fin du processus doptimisation. Cette dernire
prsente des rgles incohrentes difficiles dtecter par lAG. Cest entre autres, pour
remdier ce problme que nous avons propos une deuxime hybridation du contrleur
flou avec le NSGA-II et un codage hirarchis. Un autre objectif supplmentaire peut
tre alors considr, celui de la minimisation du nombre de rgles floues. Lefficacit de
lapproche est bien justifie travers les simulations effectues pour le mme profil de
rfrence. Nous avons toujours un bon suivi de consignes mme avec un nombre rduit
de rgles.
La troisime et la dernire hybridation concerne le contrleur flou de type Sugeno. La
mise au point de ce dernier (optimisation des fonctions dappartenance et des rgles
floues) est ralise travers la poursuite dune trajectoire de rfrence, et ce, laide
dun algorithme hybride bas sur une technique de descente du gradient (rtropropaga-
134
tion) et un algorithme gntique hirarchis.

L aussi, les rsultats de simulations ont confirm lintrt de la mthode: le nombre de
rgles floues est considrablement rduit (15 27 rgles) pour lensemble des solutions
du front de Pareto et la poursuite de la trajectoire de rfrence est toujours satisfaisante.
Conclusion et perspectives
Nous nous sommes intresss dans cette thse, au problme de la conception de
contrleurs flous par algorithmes gntiques. La difficult de lobtention de la base de
rgles et des fonctions dappartenance est en effet trs pnalisante lors de lutilisation des
techniques floues.
Cette thse sinscrit donc dans la continuit des travaux existants visant simplifier ltape
de conception en proposant quelques mthodes par hybridation des techniques du soft
compting. Ainsi, nous avons prsent dans un premier temps la mthode de conception
par algorithme gntique simple qui optimise simultanment:
Les fonctions dappartenance des variables dentres et de sortie du contrleur,
Les facteurs dchelle en entre et en sortie,
Les conclusions des rgles floues
Nous avons dcrit le principe de codage mixte des paramtres du contrleur dans un seul
chromosome divis en trois parties dont la premire est code en base n, la seconde en
nombres rels et la troisime en binaire. Nous avons ensuite prsent les oprateurs gntiques permettant dexploiter le codage mixte. La mthode de slection est celle du
tournoi. Pour ne pas rester dans un cadre descriptif, nous avons prsent une application
de cette mthode partir dun problme de commande dun systme linaire du second
ordre. Bien que les rsultats obtenus soient satisfaisants en terme derreur, la mthode,
comme la plupart des mthodes proposes dans la littrature, prsente un inconvnient
majeur qui est celui de lobtention de rgles floues incohrentes la fin du processus
doptimisation. Pour remdier cet inconvnient nous avons introduit dans un second
temps les AGH. Ces derniers permettent par le biais de leurs chromosomes un codage
plus complet qui offre, en plus du codage des paramtres, lactivation ou la dsactivation des rgles floues. Pour viter dobtenir, comme pour le cas des AGS, une base de
135
136
CONCLUSION GNRALE
rgles comprenant des rgles incohrntes, un autre objectif a t considr (minimisation

du nombre de rgles floues), ce qui constitue un problme doptimisation multiobjectifs.
Devant un tel problme nous avons utilis le NSGA-II comme mthode de rsolution
cause des caractristiques quelle prsente en particulier la rapidit de tri et llitisme. Les
rsultats de simulation obtenus sur le mme systme sont trs concluants quant lefficacit de la mthode du moment que nous avons toujours les mme performances en terme
derreur entre la sortie dsire et la sortie du systme, tout en considrant dans le contrleur un nombre rduit de rgles floues et en liminant dventuelles rgles incohrentes
qui peuvent se prsenter.
Pour obtenir de bonnes performances en un nombre rduit de gnrations, linitialisation
de la partie correspondante aux rgles floues, dans la structure des chromosomes, est effectue par le modle de rgles de Macvicar Whelan. Ce modle, exploit par la plupart
des contrleurs flous, permet de crer des chromosomes performants et donc de dbuter le
processus doptimisation avec une bonne population initiale. Nanmoins ce modle nest
valable que pour des contrleurs deux entres (lerreur et sa variation (ie. drive de
lerreur)). Pour un cas plus gnral nous avons prfr les contrleurs de Sugeno, cause
de la nature des rgles quil prsente (expressions analytiques des variables dentre) et
offrant une meilleure possibilit dexploitation des techniques doptimisation classiques
(descente du gradient, moindres carrs, etc). Nous avons donc propos une mthode de
synthse hybride des CF de type Sugeno qui utilise dabord lalgorithme de rtropropagation pour un premier ajustement de lensemble des paramtres du contrleur, puis
lalgorithme gntique hirarchis pour un deuxime ajustement des paramtres, tout en
minimisant le nombre de rgles floues. Les performances de lalgorithme ont t vrifies travers un exemple de modlisation dun systme non linaire. La comparaison, de
point de vue performance, entre cet algorithme et dautres algorithmes reports dans la littrature a permi de montrer que lalgorithme propos donne lieu de meilleurs rsultats.
Lensemble de ces hybridations a t appliqu, dans le dernier chapitre de ce mmoire,
un modle de simulation dune fermentation alcoolique. Le contrleur flou optimis permet de rguler la concentration en substrat lintrieur du bioracteur en agissant sur le
taux de dilution.
En conclusion, nous pouvons dire que les algorithmes gntiques reprsentent un outil
trs puissant pour la conception de contrleurs intelligents. Pour cela il faut dabord dfinir les variables dentre et de sortie du contrleur ainsi que les critres de performances
permettant de distinguer les bonnes et les mauvaises solutions. Ensuite, vient le choix
du codage et de la mthode de slection. Le premier choix est conditionn par plusieurs
CONCLUSION GNRALE
137
facteurs savoir le type des variables optimiser (continus ou discrets) et la prcision

recherche. Quant au choix de la mthode de slection, il faut tenir compte du nombre
de critres de performance dfini, sil sagit dun seul critre, la mthode de slection par
tournoi peut tre considre dans un premier coup. Si par contre, le nombre de critre est
suprieur un et sils sont non commensurables ou contradictoires, il faut opter pour une
mthode de slection utilisant le principe de dominance au sens de Pareto.
Perspectives
Les travaux dcrits dans cette thse peuvent se poursuivre sur plusieurs voies de recherche. Tout dabord, il serait intressant dtendre la premire et la deuxime mthode
de synthse des contrleurs de Mamdani sur un espace dentre suprieur deux. Pour
viter dobtenir durant le processus doptimisation des solutions pour lesquelles aucune
rgle nest active, nous avons impos une contrainte qui consiste garder un nombre minimal de rgles lr active et quil faut fixer ds la premire gnration.
Une tude visant modifier la valeur de ce nombre lr au cours des gnrations est galement une problmatique intressante quil faut aborder.
BIBLIOGRAPHIE
139
Bibliographie
Acosta, G. et E. Todorovich (2003). Genetic algorithms and fuzzy control: a practical
synergism for industrial applications. Computers in Industry 52, 183195.
Belarbi, K., F. Titela, W. Bourebiaa et K. Benmahammed (2005). Engineering applications of artificial intelligence. Design of mamdani fuzzy logic controllers with rule base
minimisation using genetic algorithm 18, 875880.
Berenji, H.R. et P. Khedkar (1992). Learning and tuning fuzzy logic controllers through
reinforcements. IEEE Transactions on Neural Networks 3(5), 724740.
Bideaux, C. (2000). Modlisation stchiomtrique des productions microbiennes par descripteur mtabolique au moyen du calcul formel. Validation sur le modle Kluyveromyces marxianus. Thse de doctorat. Institut National des Sciences Appliques de
Toulouse.
Braae, M. et D.A. Rutherford (1978). Fuzzy relations in control setting. Kybernetes
7(3), 185188.
Burns, R.S. (2001). Advanced Control Engineering. butterworth heinemann ed.
Chen, C.C. et C.C. Wong (2002). Self-generating rule-mapping fuzzy controller design
using a genetic algorithm. In: IEE Proceedings on Control Theory and Applications.
Vol. 49. pp. 143148.
Cheong, F. et R. Lai (2000). Constraining the optimization of a fuzzy logic controller using an enhanced genetic algorithm. IEEE Transactions on Systems, Man, and
Cybernetics-Part B:Cybernetics 30(1), 3146.
Cordon, O., F. Herrera et P. Villar (2001). Generating the knowledge base of a fuzzy
rule-based system by thegenetic learning of the data base. IEEE Transactions on Fuzzy
Systems 9(4), 667674.
Corne, D., J.D. Knowles et M.J. Oates (2000). The pareto envelope-based selection algorithm for multi-objective optimization. In: Proceedings of the sixth International
Conference on Parallel Problem Solving from Nature. pp. 839848.
140
BIBLIOGRAPHIE
Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems 2, 303314.
Deb, K., A. Pratap, S. Agarwal et T. Meyarivan (2002). A fast and elitist multiobjective genetic algorithm: Nsga-ii. IEEE Transactions on Evolutionary Computation 6(2), 182
197.
Dochain, D. (2001). Automatique des bioprocds. Hermes Science.
Dorf, R.C. et R.H. Bishop (1995). Modern control systems. Addison Wesley.
Farag, W.A., V.H. Quintana et G.Lambert-Torres (1998). A genetic-based neuro-fuzzy
approach for modeling and control of dynamical systems. IEEE Transactions on Neural
Networks 9(5), 756767.
Fonseca, C.M. et P.J. Fleming (1993). Genetic algorithms for multiobjective optimization: Formulation, discussion and generalization. In: Proceedings of the Fifth International Conference on Genetic Algorithms (S. Forrest, Ed.). Morgan Kaufmann. San
Mateo,California. pp. 416423.
Glover, F. (1989). Tabu search-part 1. ORSA Journal on Computing 1, 190206.
Goldberg, D.E. (1994). Algorithmes gntiques. Exploration, optimisation et apprentissage automatique. Addison-Wesley. France.
Goldberg, D.E. et J. Richardson (1987). Genetic algorithms with sharing for multimodal
function optimization. In: Second International Conference on Genetic Algorithms and
their application. Cambridge, Massachusetts, United States. pp. 4149.
Guenounou, O., A. Belmehdi et B. Dahhou (2006). Optimisation des contrleurs flous
par algorithmes gntiques hirarchiss-application la commande dun bioprocd.
In: Seventh International Conference on Sciences and Techniques of Automatic control
STA 2006. Hammamet,Tunisia. pp. 110.
Guenounou, O., A. Belmehdi et B. Dahhou (2009). Multi-objective optimization of tsk
fuzzy model. Expert Systems with Applications 36(4), 74167423.
Guenounou, O. et A. Belmehdi (2006). Optimisation des contrleurs flous par algorithmes
gntiques hirarchiss-application sur actionneur asynchrone. In: Proceedings de la
confrence internationale sur le gnie lectrique. Batna,Algrie. pp. 600605.
Hagan, M.T. et M.B. Menhaj (1994). Training feedforward networks with marquardt algorithm. IEEE Transaction On Neural Networks 5(6), 989993.
Herrera, F., M. Lozano et J.L. Verdegay (1995). Tuning fuzzy logic controllers by genetic
algorithms. International Journal of Approximate Reasoning 12, 299315.
BIBLIOGRAPHIE
141
Herrera, F., M. Lozano et J.L. Verdegay (1998). A learning process for fuzzy control rules
using genetic algorithms. Fuzzy Sets and Systems 100, 143158.
Holland, J. (1992). Adaptation in natural and artificial and systems. 2nd edition. IT Press.
Homaifar, A. et E. MCCormick (1993). Simultaneous design of membership functions
and rule sets for fuzzy controllers using genetic algorithms. IEEE transactions on fuzzy
systems 3(2), 129139.
Horn, J. et N. Napfliotis (1994). Multiobjective optimization using the niched pareto genetic algorithm. In: Proceedings of the First IEEE Conference on Evolutionary Computation, IEEE World Congress on Computational Intelligence. Vol. 1. pp. 8287.
Hornik, K., M. Stinchcombe et H. White (1989). Multilayer feedforward networks are
universal approximators. Neural Networks 2(5), 359366.
Hwang, H.S. (1999). Automatic design of fuzzy rule base for modelling and control
using evolutionary programming. IEE Proceedings on Control Theory and Applications pp. 916.
Jang, J.-S.R. (1993). Anfis: adaptive-network-based fuzzy inference system. IEEE Transaction on System Man and Cybernetics 23(3), 665685.
Jordan, M.I. (1992). Forward models: Supervised learning with a distal teacher. Cognitive
Science 16, 307354.
Kabbaj, M.N. (2004). Dveloppement damgorithmes de dtection et disolation de dfauts pour la supervision des bioprocds. Thse de doctorat. Universit de Perpignan.
Karr, C.L. (1991). Applying genetics to fuzzy logic. AI Expert 6(3), 38U43.
Karr, C.L. et E.J. Gentry (1993). Fuzzy control of ph using genetic algorithms. IEEE
Transactions on Fuzzy Systems 1(1), 4653.
Kim, E., M. Park, S. Ji et M. Park (1997). A new approach to fuzzy modeling. IEEE
Transactions on Fuzzy Systems 5(3), 328337.
Kirkpatrick, S., C. Gelatt et M. Vecchi (1983). Optimization by simulated annealing.
Science 220(4598), 671680.
Klir, G.J. et B. Yuan (1994). Fuzzy sets and fuzzy logic: theory and applications. PrenticeHall. Inc. Upper Saddle River, NJ, USA.
Lee, C.C. (1990). Fuzzy logic in control systems: Fuzzy logic controller, part ii. IEEE
Transactions on Systems, Man. and Cybernetics 20(2), 419435.
Lee, C.S. Ouyang W.J. Lee S.J. (2005). A tsk-type neurofuzzy network approach to
system modeling problems. IEEE Transactions on Systems, Man and Cybernetics
35(4), 751767.
142
BIBLIOGRAPHIE
Lee, M. A. et H. Takagi (1993). Dynamic control of genetic algorithms using fuzzy logic
techniques. In: Proceedings of International conference on Genetic Algorithms. San
Mateo, CA. pp. 7683.
Li, Z. (2006). Contribution llaboration dalgorithmes disolation et didentification de
dfauts dans les systmes non linaires. Thse de doctorat. Universit Paul Sabatier de
Toulouse.
Lin, C.T. et C.S.G. Lee (1991). Neural-network-based fuzzy logic control and decision
system. IEEE Transactions on Computers 40(12), 1320.
Liska, J. et S.S. Melsheimer (1994). Complete design of fuzzy logic systems using genetic algorithms. In: Proceedings of the Third IEEE International Conference on Fuzzy
Systems. Vol. 2. Orlando, FL, USA. pp. 1377U1382.

Macvicar-Whelan, P.J. (1976). Fuzzy sets for man-machine interaction. International
Journal of Man-Machine Studies 8, 687697.
Magoulasb, G.D., M.N. Vrahatis et G.S. Androulakis (1999). Improving the convergence
of the backpropagation algorithm using learning rate adaptation methods. Neural Computation 11, 17691796.
Maher, M. (1995). Modlisation et laboration dalgorithmes destimation et de commande: Application un bioprocd. Thse de doctorat. Universit Paul Sabatier de
Toulouse.
Mamdani, E.H. et S. Assilian (1975). An experiment in linguistic synthesis with a fuzzy
logic controller. International Journal of Man-Machine Studies 7(1), 115.
Man, K. F. et W.A. Halang (1997). Genetic algorithms for control and signal processing.
In: Proceedings of the 23rd International Conference on Industrial Electronics,Control
and Instrumentation. Vol. 4. New Orleans, LA, USA. pp. 15411555.
Man, K.F., K.S. Tang et S. Kwong (1996). Genetic algorithms: Concepts and applications.
IEEE Transaction on industrial electronics 43, 519534.
Michalewicz, Z. (1992). Genetic Algorithms + Data Structures = Evolution Programs.
Springer-Verlag.
Mogharreban, N. et L.F. Dilalla (2006). Comparison of defuzzification techniques for
analysis of non-interval data. In: Fuzzy Information Processing Society, 2006. NAFIPS
2006.Annual meeting of the North American. pp. 257260.
Monod, J. (1942). Recherche sur la croissance des cultures bactriennes. Hermann, Paris.
Narendra, K.S. et K. Parthasarathy (1990). Identification and control of dynamical systems using neural networks. IEEE Transaction on Neural Networks 1(1), 427.
BIBLIOGRAPHIE
143
Ng, K.C. et Y. Li (1994). Design of sophisticated fuzzy logic controllers using genetic
algorithms. In: IEEE World Congress on Computational. Vol. 3. USA. pp. 17081712.
Pedrycz, W. et L.A. Zadeh (1995). Fuzzy Set Engineering. CRC Press. Boca Raton,USA.
Psaltis, D., A. Sideris et A. Yamamura (1987). Neural controllers. In: Proceedings of the
International Conference on Neural Networks. Vol. 4. San Diego. pp. 551558.
Psaltis, D., A. Sideris et A.A. Yamamura (1988). A multilayered neural network controller. IEEE Control Systems Magazine 8, 1721.
Rumelhart, D.E. et J. L. McClelland (1986). Parallel Distributed Processing:Explorations
in the Microstructure of Cognition. Vol. 1. M.I.T. Press.
Saerens, M. et A. Soquet (1991). Neural controller based on back-propagation algorithm.
In: IEE Proceedings-F on Radar and Signal Processing. Vol. 138. pp. 5562.
Sastry, P.S., G. Santharam et K.P. Unnikrishnan (1994). Memory neuron networks for
identification and control of dynamical systems. IEEE Transactions on Neural Networks 5(2), 306319.
Schaffer, J.D. (1985). Multiple objective optimization with vector evaluated genetic algorithms. In: Proceedings of the 1st International Conference on Genetic Algorithms.
pp. 93100.
Scharf, E.M. et N.J. Mandic (1985). The application of a fuzzy controller to the control of
a multi-degree-freedom robot arm. Industrial Application of fuzzy control pp. 4161.
Srinivas, V. et K. Deb (1993). Muiltiobjective optimization using nondominated sorting
in genetic algorithms. Evolutionary Computation 2(3), 221248.
Sugeno, M. (1999). On stability of fuzzy systems expressed by fuzzy rules with singleton
consequents. IEEE Transactions on Fuzzy Systems 7(2), 201224.
Tang, K.S., C.Y. Chan, K. F. Man et S. Kwong (1995). Genetic structure for nn topology and weights optimization. In: Conference on Genetic Algorithms in Engineering
Systems:Innovations and Applications. IEE. pp. 250255.
Tang, K.S., K.F. Man, Z.F. Liu et S. Kwong (1998). Minimal fuzzy memberships and
rules using hierarchical genetic algorithms. IEEE Transactions on Industrial Electronics 45(1), 162169.
Thrift, P. (1991). Fuzzy logic synthesis with genetic algorithms. In: Proceedings of the
Fourth International Conference on Genetic Algorithms. pp. 509U513.

Vasilache, A. (2000). Ler Rseaux de neurones pour la modlisation et la conduite des
procds biotechnologiques. Thse de doctorat. Institut National des Sciences Appliques de Toulouse.
144
BIBLIOGRAPHIE
Vogl, T.P., J.K. Mangis, A.K. Zigler, W.T. Zink et D.L. Alkon (1988). Accelerating the
convergence of the back-propagation method. Biological Cybernetics 59, 256264.
Wang, J.S. et C.S.G. Lee (2001). Efficient neuro-fuzzy control systems for autonomous
underwater vehicle control. In: Proceedings of the IEEE International Conference on
Robotics and Automation. Vol. 3. Seoul, Korea. pp. 29862991.
Wang, L. et R. Langari (1996). Complex systems modeling via fuzzy logic. IEEE Transactions On Systems, Man, And Cybernetics-Part B: Cybernetics 26(1), 100106.
Wu, C.J. et G.Y. Lin (1999). Design of fuzzy logic controllers using genetic algorithms.
In: Proceedings of IEEE International Conference on Systems, Man, and Cybernetics.
Vol. 6. SAAA. pp. 104109.
Xiang, T., K.F. Man, K.M. Luk et C.H. Chan (2006). Design of multiband miniature
handset antenna by mom and hga. IEEE Antennas and wireless propagation letters
5, 179182.
Yager, R.R. et D.P. Filev (1994). Essentials of fuzzy modeling and control. WileyInterscience. New York, NY, USA.
Yubazaki, N., M. Otani, T. Ashida et K. Hirota (1995). Dynamic fuzzy control method
and its application to positioning of induction motor. In: Proceedings of Fourth IEEE
International Conference on Fuzzy Systems. Japan. pp. 10951102.
Zadeh, L.A (1965). fuzzy sets. Informatic and Control 8, 338353.
Zhou, Y.S. et L.Y. Lai (2000). Optimal design for fuzzy controllers by genetic algorithms.
IEEE Transactions on Industry Applications 36(1), 9397.
Zitzler, E. et L. Thiele (1999). Multiobjective evolutionary algorithms: A comparative
case study and the strength pareto approach. IEEE Transactions on Evolutionary Computation 3(4), 257271.
Mthodologie de conception de contrleurs intelligents par lapproche gntique

- application un bioprocd
Rsum : Dans ce travail, le problme de conception de contrleurs flous est tudi. Dans une premire
partie, on prsente un tat de lart sur les techniques utilises savoir les algorithmes gntiques et ses
diffrentes variantes, les rseaux de neurones, la logique floue et leurs hybridations. Prenant appui sur cet
tat de lart nous proposons une premire mthode de conception des contrleurs flous de Mamdani par
algorithmes gntiques simples.
Cette mthode est en suite amliore par lemploi des algorithmes gntiques hirarchiss. Ces derniers
permettent par le biais de la structure de leurs chromosomes, une meilleure optimisation des paramtres
du contrleur tout en liminant les rgles incohrentes qui peuvent se prsenter, comme pour la premire
mthode, la fin du processus doptimisation.
La dernire mthode propose concerne la synthse des contrleurs flous de Sugeno. Elle est base sur une
procdure dapprentissage hybride qui se droule en deux tapes. Durant la premire tape, le contrleur
flou est reprsent sous forme dun rseau de neurones multicouches dont les paramtres sont optimiss par
lalgorithme de rtropropagation. Dans la deuxime tape, les paramtres obtenus lissue de la premire
phase sont extraits et optimiss par le NSGA-II suivant un codage hirarchis.
Lensemble des ces mthodes est appliqu pour la conduite dun procd de fermentation alcoolique en
mode continu.
Mots-cls : Algorithmes gntiques simples, Algorithmes gntiques hirarchiss,contrleur flou, rseaux
de neurones, NSGA-II, bioprocd.
Design methodology of intelligent controllers based on genetic approach

- Application to a bioprocess
Abstract : In this work, the problem of design of fuzzy controllers is studied. In a first part, we present a
state of art on the techniques used, namely the genetic algorithms and its various alternatives, the neural
networks, fuzzy logic and their hybridizations. Taking support on this state of art, we propose a first design
method of the fuzzy controllers of Mamdani by simple genetic algorithms.
Thereafter, this method is improved by the use of the hierarchical genetic algorithms. These algorithms
allow, by the means of the structure of their chromosomes, a better optimization of the controller parameters
while eliminating the incoherent rules which can arise, as well as for the first method, at the end of the
optimization process.
The last method suggested relates to the synthesis of the fuzzy controllers of Sugeno. It is based on a hybrid
procedure of training which proceeds in two stages. During the first stage, the fuzzy controller is represented
in the form of a network of multi-layer neural networks, whose parameters are optimized by the algorithm
of retro propagation. In the second phase, the parameters obtained at the end of the first phase are extracted
and optimized by the NSGA-II according to a coding arranged hierarchically. These methods are applied
for control of an alcoholic fermentation process in continuous mode.
Keywords: Genetic algorithms, Hierarchical genetic algorithms, Fuzzy controller, neural networks, NSGAII, bioprocess

Guenounou Ouahib PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Guenounou Ouahib PDF

Uploaded by

Copyright:

Available Formats

THSE

DOCTORAT DE LUNIVERSIT DE TOULOUSE

Prsente et soutenue par Ouahib GUENOUNOU

Ecole doctorale : Ecole Doctoral Systme

Table des matires

liste des figures

liste des Tableaux

Codage et population initiale . . . . . . . . . . . . . . . . . . . .

Slection par tournoi . . . . . . . . . . . . . . . . . . .

TABLE DES MATIRES

Algorithmes Gntiques Hirarchiss . . . . . . . . . . . . . . . . . . .

Formulation du chromosome hirarchis . . . . . . . . . . . . . .

Mthode non agrgative . . . . . . . . . . . . . . . . . . . . . .

Vector evaluated genetic algorithm (VEGA) . . . . . .

Multiple Objectives Genetic Algorithm (MOGA) . . .

NSGA (Nondominated Sorting Genetic Algorithm) . .

Niched Pareto Genetic Algorithm (NPGA) . . . . . . .

Rseaux de neurones et systmes flous

Rseaux non boucls . . . . . . . . . . . . . . . . . . . . . . . .

Apprentissage dans les rseaux de neurones . . . . . . . . . . . .

Algorithme de rtropropagation du gradient . . . . . .

TABLE DES MATIRES

Identification par rseaux de neurones . . . . . . . . . . . . . . .

Rseaux de neurones pour la commande . . . . . . . . . . . . . . . . . .

Imitation dun contrleur existant . . . . . . . . . . . . . . . . .

Utilisation directe de lerreur en sortie du procd . . . . . . . . .

Identification du modle inverse . . . . . . . . . . . . . . . . . .

Architecture indirecte dapprentissage . . . . . . . . . . . . . . .

Apprentissage indirect du systme de commande . . . . . . . . .

Rgles et oprateurs flous . . . . . . . . . . . . . . . . . . . . .

Structure interne dun systme flou . . . . . . . . . . . . . . . .

Architecture neuro flou hybride . . . . . . . . . . . . . . . . . .

Conception de contrleurs flous par algorithmes gntiques

Optimisation des contrleurs flous de type Mamdani par algorithmes g-

Reprsentation des fonctions dappartenance . . . . . . . . . . .

TABLE DES MATIRES

Partitionnement avec des fonctions triangulaires . . . .

Partitionnement avec des fonctions trapzodales . . . .

Fonction dappartenance Gaussienne . . . . . . . . . .

Codage des paramtres des fonctions dappartenance . . . . . . .

Reprsentation des rgles floues . . . . . . . . . . . . . . . . . .

Codage des rgles floues . . . . . . . . . . . . . . . . . . . . . .

Initialisation des chromosomes . . . . . . . . . . . . . . . . . . .

Rsultats de loptimisation pour la premire mthode

Rsultats de loptimisation pour la deuxime mthode

TABLE DES MATIRES

Optimisation par algorithmes gntiques hirarchiss . . . . . . . . . . .

Structure du chromosome hirarchis . . . . . . . . . . . . . . .

Fonction objectif supplmentaire . . . . . . . . . . . . . . . . . .

Evaluation des performances de lAGH . . . . . . . . . . . . . .

Optimisation des contrleurs flous de type Sugeno . . . . . . . . . . . . .

Structure du rseau Neuro-flou . . . . . . . . . . . . . . . . . . .

Premire couche (couche dentre) . . . . . . . . . . .

Deuxime couche (couche des fonctions dappartenance) 91

Troisime couche(couche des prmisses) . . . . . . . .

Quatrime couche(couche des conclusions) . . . . . . .

Cinquime couche (couche de sortie) . . . . . . . . . .

Optimisation des paramtres du rseau neuro-flou . . . . . . . . .

Optimisation par algorithme gntique . . . . . . . . .

Optimisation par lalgorithme de rtropropagation du

Procd de fermentation . . . . . . . . . . . . . . . . . . . . . . . . . . 102

TABLE DES MATIRES

Modlisation des bioprocds . . . . . . . . . . . . . . . . . . . . . . . . 103