Professional Documents
Culture Documents
En vue de l'obtention du
JURY
Gilles ROUX, Professeur l'UPS de Toulouse, Prsident
Monique POLIT, Professeur l'universit de Perpignan, Rapporteur
Sad DJENNOUN, Professeur l'universit de Tizi Ouzou, Rapporteur
Boubekeur MENDIL, Professeur L'universit de Bjaa, Examinateur
Avant propos
Les travaux prsents dans le mmoire ont t effectus dans le cadre dune cotutelle entre
luniversit Paul Sabatier Toulouse III et luniversit A.Mira de Bejaia. Ils ont t raliss
au Laboratoire dAnalyse et dArchitecture des Systmes du CNRS et au Laboratoire de
technologie Industrielle et de linformation de luniversit A. mira de Bejaia. A ce titre je
remercie le service de lAgence Universitaire de Francophonie (AUF) qui par son financement ma aid effectuer mes travaux dans de bonnes conditions.
Je remercie Messieurs Malik GHALLAB et Raja CHATILA, respectivement ancien et
actuel Directeurs du LAAS CNRS et Madame Louise TRAVE-MASSUYES, responsable
du groupe DISCO.
Je remercie galement Monsieur Ali BELMEHDI, Directeur du LTII.
Je tiens remercier vivement Monsieur Gilles Roux, Professeur lUPS de Toulouse pour
avoir accept dexaminer ce travail et pour mavoir fait lhonneur de prsider la commission dexamen.
Je tiens galement remercier trs sincrement Madame Monique Polit, Professeur
luniversit de Perpigan et Monsieur Sad Djennoune, Professeur de luniversit Mouloud
Mameri de Tizi ouzou, pour lhonneur quils mont fait dexaminer cette tude et den
tre les rapporteurs. Je remercie galement Monsieur Boubekeur Mendil, Professeur de
lUniversit A. Mira de Bjaia davoir accept dexaminer cette thse.
Jexprime ma profonde reconnaissance mon directeur de thse ct franais, Monsieur
Boutaib Dahhou, Professeur lUPS de Toulouse, et je le remercie pour son soutien scientifique et pour la confiance quil ma accorde tout au long de mes travaux.
Je ne saurais exprimer ma sympathie et ma reconnaissance envers mon directeur de thse
ct Algrien, Monsieur Ali Belmehdi, Professeur de lUniverist A. Mira de Bjaia pour
le soutien quil a pu mapporter, pour ses orientations, sa disponibilit et ses conseils.
Quil soit assur de ma respectueuse reconnaissance.
Finalement, je remercie sincrement tous mes amis en particulier Nassim pour le soutien
quil ma apport durant les sjours effectus Toulouse.
vii
xi
Introduction
Algorithmes gntiques
1.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Algorithmes gntiques . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
1.2.1.1
Codage binaire . . . . . . . . . . . . . . . . . . . . . .
1.2.1.2
Codage rel . . . . . . . . . . . . . . . . . . . . . . .
1.2.1.3
Codage en base n . . . . . . . . . . . . . . . . . . . .
1.2.2
Oprateur de croisement . . . . . . . . . . . . . . . . . . . . . .
1.2.3
Oprateur de mutation . . . . . . . . . . . . . . . . . . . . . . .
11
1.2.4
Fonction dvaluation . . . . . . . . . . . . . . . . . . . . . . .
12
1.2.5
Oprateur de slection . . . . . . . . . . . . . . . . . . . . . . .
13
1.2.5.1
14
ii
1.3
1.4
1.5
1.2.5.2
Sharing . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.2.5.3
Elitisme . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
1.3.1
16
1.3.2
Oprateurs gntiques . . . . . . . . . . . . . . . . . . . . . . .
18
Optimisation multi-objectifs . . . . . . . . . . . . . . . . . . . . . . . .
18
1.4.1
Mthode agrgative . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.4.2
22
1.4.2.1
22
1.4.2.2
23
1.4.2.3
23
1.4.2.4
24
1.4.2.5
NSGA-II . . . . . . . . . . . . . . . . . . . . . . . . .
24
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
29
2.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.2
Rseaux de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.2.1
Le neurone formel . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.2.2
31
2.2.3
Rseaux boucls . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2.4
33
2.2.4.1
34
2.2.5
2.3
2.4
2.5
2.6
iii
36
38
2.3.1
38
2.3.2
39
2.3.3
40
2.3.4
41
2.3.5
42
Systmes flous . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4.1
Ensembles flous . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4.2
Variables linguistiques . . . . . . . . . . . . . . . . . . . . . . .
45
2.4.3
46
2.4.4
47
Systme neuro-flou . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
2.5.1
52
2.5.1.1
ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . .
53
2.5.1.2
FALCON ET GARIC . . . . . . . . . . . . . . . . . .
53
2.5.1.3
NEFCLASS . . . . . . . . . . . . . . . . . . . . . . .
54
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
55
55
ntiques simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
3.2.1
58
iv
3.2.1.1
59
3.2.1.2
62
3.2.1.3
64
3.2.2
66
3.2.3
66
3.2.4
67
3.2.4.1
Le codage binaire . . . . . . . . . . . . . . . . . . . .
67
3.2.4.2
Le codage rel . . . . . . . . . . . . . . . . . . . . . .
67
3.2.4.3
Codage en base n . . . . . . . . . . . . . . . . . . . .
67
3.2.5
Structure du chromosome . . . . . . . . . . . . . . . . . . . . .
68
3.2.6
Oprateurs gntiques . . . . . . . . . . . . . . . . . . . . . . .
68
3.2.6.1
Oprateur de Croisement . . . . . . . . . . . . . . . .
68
3.2.6.2
Oprateur de Mutation . . . . . . . . . . . . . . . . . .
69
3.2.7
70
3.2.8
Exemple dapplication . . . . . . . . . . . . . . . . . . . . . . .
71
3.2.8.1
Critres de performance . . . . . . . . . . . . . . . . .
72
3.2.8.2
Paramtres de lAG . . . . . . . . . . . . . . . . . . .
73
3.2.8.3
Fonction Objectif . . . . . . . . . . . . . . . . . . . .
73
3.2.8.4
Mthodes de slection . . . . . . . . . . . . . . . . . .
74
3.2.8.5
3.2.8.6
75
78
3.3
3.4
82
3.3.1
83
3.3.2
Oprateurs gntiques . . . . . . . . . . . . . . . . . . . . . . .
84
3.3.3
84
3.3.4
85
88
3.4.1
90
3.4.1.1
90
3.4.1.2
3.4.1.3
91
3.4.1.4
91
3.4.1.5
92
92
3.4.2
3.4.2.1
gradient . . . . . . . . . . . . . . . . . . . . . . . . .
92
93
Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
3.4.3.1
Modle de simulation . . . . . . . . . . . . . . . . . .
94
3.4.3.2
Rsultats de simulations . . . . . . . . . . . . . . . . .
94
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
3.4.2.2
3.4.3
3.5
Application un bioprocd
101
4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2
vi
4.3
4.4
4.5
4.3.2
4.4.2
4.4.3
4.4.4
4.4.5
4.4.6
4.5.2
4.5.3
4.5.4
4.6
4.5.2.1
4.5.2.2
4.5.3.2
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
1.1
1.2
10
1.3
11
1.4
15
1.5
16
1.6
17
1.7
Front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.8
21
1.9
21
25
1.11 Distance de crowding (les points noirs sont des solutions appartenant au
mme front) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.1
30
2.2
31
2.3
33
2.4
37
vii
viii
2.5
37
2.6
38
2.7
38
2.8
Apprentissage spcialis . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.9
40
41
42
44
44
45
46
47
49
50
53
3.1
56
3.2
57
3.3
59
3.4
60
3.5
61
3.6
62
3.7
3.8
ix
63
Fonction dappartenance gaussienne asymtrique(ligne continue): La moyenne est note c et les variances g2 et d2 . . . . . . . . . . . . . . . . .
64
65
68
71
3.9
75
76
76
77
78
78
79
80
80
81
82
3.23 Structure du chromosome de lAGH appliqu pour loptimisation des paramtres dun CF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
86
86
87
87
89
90
96
97
97
98
4.1
4.2
4.3
Evolution des variables dtat pour une fermentation en mode continu . . 109
4.4
4.5
4.6
Evolution des paramtres du contrleur flou travers les gnrationsstructure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.7
4.8
4.9
xi
xiii
3.1
58
3.2
70
3.3
Paramtres de lAGs . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3.4
75
3.5
77
3.6
77
3.7
Facteurs dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
3.8
81
3.9
Facteurs dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
88
94
95
98
98
99
4.1
xiv
4.2
4.3
4.4
4.5
Base de rgles floues correspondante au meilleur chromosome de la premire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . 116
4.6
4.7
Base de rgles floues correspondante au meilleur chromosome de la dernire gnration-structure 5*5*5 . . . . . . . . . . . . . . . . . . . . . . 118
4.8
4.9
Base de rgles floues correspondante au meilleur chromosome de la dernire gnration-structure 7*7*7 . . . . . . . . . . . . . . . . . . . . . . 121
Introduction
Historique
Les outils intelligents sont de plus en plus utiliss dans la conception, la modlisation
et la commande de systmes complexes tels que les robots, les procds biologiques, les
vhicules routiers . On entend par outils intelligents les techniques du soft computing
savoir : les rseaux de neurones, la logique floue et les algorithmes gntiques.
Les rseaux de neurones sont apparus dans les annes cinquante mais nont reu cependant un intrt considrable qu partir des annes 80 avec lapparition de lalgorithme
de rtropropagation (Rumelhart et McClelland, 1986). Leur capacit dapprentissage et
dapproximation de fonctions leur procure un intrt considrable de la part des chercheurs. Il suffit de voir les nombreuses applications industrielles qui en dcoulent partir
des annes 90 et de consulter labondante littrature sur le sujet pour sen convaincre.
La logique floue introduite par Zadeh (1965) dans les annes soixante constitue un outil
trs puisant pour la reprsentation des termes et des connaissances vagues. Elle est issue
de la capacit de lhomme dcider et agir dune manire intelligente malgr limprcis
et lincertitude des connaissances disponibles. Son utilisation dans le domaine du contrle
(contrle flou) a t lune des premires applications de cette thorie dans lindustrie avec
les travaux de Mamdani et Assilian (1975). Depuis, les applications de la logique floue se
sont multiplies pour toucher des domaines trs divers.
Lutilisation de la commande floue est particulirement intressante lorsquon ne dispose
pas de modle mathmatique prcis, voir inexistant, du systme commander ou lorsque
ce dernier prsente de fortes non linarits. Contrairement aux approches classiques de
lautomatique, qui se basent en grande partie sur un modle mathmatique, la commande
par logique floue, repose sur une collection de rgles linguistiques de la forme " Si
Alors " qui traduisent la stratgie de contrle dun oprateur humain.
1
INTRODUCTION
Les algorithmes gntiques sont des mthodes stochastiques bases sur une analogie avec
des systmes biologiques. Ils reposent sur un codage de variables organises sous forme
de structures chromosomiques et prennent modle sur les principes de lvolution naturelle de Darwin pour dterminer une solution optimale au problme considr. Ils ont
t introduits par Holland (Holland, 1975) pour des problmes doptimisation complexe.
Contrairement aux mthodes doptimisation classique, ces algorithmes sont caractriss
par une grande robustesse et possdent la capacit dviter les minimums locaux pour
effectuer une recherche globale. De plus, ces algorithmes nobissent pas aux hypothses
de drivabilit qui contraignent pas mal de mthodes classiques destines traiter des
problmes rels.
Au cours de ces dernires annes, la combinaison de ces techniques a attir lattention
de beaucoup de chercheurs. Plusieurs hybridations ont t alors proposes dont les plus
rencontres sont: Algorithme Gntique /Contrleur flou (AG/CF) et Rseau de neurones/Contrleur flou (RN/CF).
La premire combinaison (AG/CF) vise la conception des CF par algorithmes gntiques. Karr et Gentry (1993) utilisent un algorithme gntique standard (codage binaire,
oprateurs de croisement et de mutation simples) pour loptimisation des paramtres des
fonctions dappartenance. Le nombre de termes linguistiques associ chaque variable
du contrleur est diffrent, mais il reste fixe durant tout le processus doptimisation. Plusieurs mthodes ont t proposes par la suite, dont certaines diffrent par le type de codages et/ou des fonctions dappartenance utilises (Liska et Melsheimer, 1994; Herrera et
al., 1995). Rcemment, les algorithmes hirarchiss ou AGH sont aussi impliqus. Dans
(Acosta et Todorovich, 2003), on utilise un AGH avec un seul niveau de gnes de contrle
pour chercher le nombre minimal de fonctions dappartenance associer chacune des
variables du contrleur flou.
Thrift (1991) est le premier dcrire une mthode doptimisation des rgles floues par
algorithme gntique standard, en utilisant trois bits pour coder chaque rgle. A la mme
poque, Karr propose une mthode permettant de faire intervenir dans le contrleur flou
la fois des rgles spcifies par un expert humain et des rgles optimises par un algorithme gntique (Karr, 1991). Quelques amliorations ont t apportes par la suite
(Herrera et al., 1998; Chen et Wong, 2002; Belarbi et al., 2005).
Homaifar et MCCormick (1993) proposent une mthode doptimisation qui prend en
compte simultanment les fonctions dappartenance des variables dentres et les rgles
floues. Les diffrents paramtres sont cods sur le mme chromosome en base 6. Dans
(Lee et Takagi, 1993), les auteurs partagent la mme ide de Hamaifar et MCCormik (co-
INTRODUCTION
Problmatique
Loptimisation indpendante, des paramtres des fonctions dappartenance ou des
rgles floues par algorithme gntique est juste mais reste incomplte car les deux parties
(fonctions dappartenance et rgles floues) ne peuvent tre dissocies. Par consquent,
pour obtenir de meilleurs rsultats, il faudrait prvoir un codage qui prend en charge simultanment les fonctions dappartenance et les rgles floues. En raison dune part dun
espace de recherche trs grand (fonctions dappartenance + rgles floues) et dautre part
de lutilisation dune procdure dinitialisation des chromosomes base souvent sur un
processus alatoire, les mthodes proposes ncessitent gnralement un nombre important de gnrations. De plus loptimisation aveugle des algorithmes gntiques, dont le
seul objectif est lamlioration dun critre numrique, conduit souvent la prsence de
rgles floues incohrentes (brouilles) en fin du processus doptimisation. Lamlioration de ltape dinitialisation des chromosomes ainsi que lutilisation dune procdure de
slection qui dfavorise lapparition de rgles incohrentes peut tre une solution fiable
pour contourner ces inconvnients. Cest dans ce cadre que se situent nos motivations et
intrts pour la conception de contrleurs flous par algorithmes gntiques.
INTRODUCTION
Chapitre 1
Algorithmes gntiques
1.1
Introduction
Les ingnieurs se heurtent quotidiennement des problmes de complexit grandissante, qui surgissent dans des secteurs trs divers, comme le traitement dimages, la
conception de systmes de commande et de diagnostic, etc . . .. Le problme rsoudre
peut souvent tre considr comme un problme doptimisation dans lequel on dfinit
une ou plusieurs fonctions objectif, ou fonctions de cot, que lon cherche minimiser
(ou maximiser) par apport lensemble des paramtres concerns. La rsolution dun tel
problme a conduit les chercheurs proposer des mthodes de rsolution de plus en plus
performantes, parmi lesquelles on peut citer les mtaheuristiques. Ces dernires qui comprennent notamment la mthode du recuit simul (Kirkpatrick et al., 1983), la mthode de
recherche Tabou (Glover, 1989), les algorithmes de colonies de fourmis, les algorithmes
gntiques etc . . ., prsentent des caractristiques communes, qui sont:
1. Raisonnement par analogie avec les systmes rels (physique, biologie, thologie,
).
2. Stochastiques
et partagent aussi les mmes inconvnients :
1. Difficult de rglage des paramtres de la mthode
2. Temps de calcul lev.
5
Dans ce chapitre, nous allons nous intresser uniquement aux algorithmes gntiques qui
ont connu ces quinze dernires annes un dveloppement considrable grce laugmentation vertigineuse de la puissance des calculateurs et notamment suite lapparition des
architectures massivement parallles qui exploitent leur paralllisme intrinsque.
Le chapitre est organis en trois parties. La premire est consacre aux algorithmes gntiques comme tant une mthode doptimisation mono-objectif. Aprs une prsentation
gnrale du principe de fonctionnement dun algorithme gntique, nous ferons une description dtaille de ses diffrentes composantes. La deuxime partie est consacre aux
algorithmes gntiques hirarchiss (AGH), une version amliore des AGS. Ils diffrent
de ces derniers dans la structure de leurs chromosomes qui prsente un niveau hirarchique et se compose de deux types de gnes: les gnes de contrle et les gnes de paramtres. Enfin la dernire partie traite de loptimisation multi-objectifs par algorithmes
gntiques. Nous commenons dabord par un bref rappel sur les spcificits dun problme plusieurs objectifs, puis nous voquons le concept de dominance et la notion
doptimalit au sens de Pareto qui caractrise cette classe de problmes. Enfin, nous dtaillons quelques algorithmes gntiques, ddis loptimisation multi-objectifs tout en
accordant plus dimportance un algorithme litiste de rfrence (NSGA-II) qui sera utilis dans la suite de ce travail.
1.2
Algorithmes gntiques
Les algorithmes gntiques (AG) dvelopps par J. Holland (Holland, 1992) prsentent des qualits intressantes pour la rsolution de problmes doptimisation complexes. Leurs fondements thoriques furent exposs par Goldberg (Goldberg, 1994). Ils
tentent de simuler le processus dvolution des espces dans leur milieu naturel: soit une
transposition artificielle de concepts basiques de la gntique et des lois de survie noncs
par Darwin. Rappelons que la gntique reprsente un individu par un code, cest--dire
un ensemble de donnes (appeles chromosomes), identifiant compltement lindividu.
La reproduction est, dans ce domaine, un mixage alatoire de chromosomes de deux individus, donnant naissance des individus enfants ayant une empreinte gntique nouvelle,
hrite des parents. La mutation gntique est caractrise dans le code gntique de lenfant par lapparition dun chromosome nouveau, inexistant chez les individus parents.
Ce phnomne gntique dapparition de " mutants" est rare mais permet dexpliquer
les changements dans la morphologie des espces, toujours dans le sens dune meilleure
adaptation au milieu naturel. La disparition de certaines espces est explique par " les
lois de survie " selon lesquelles seuls les individus les mieux adapts auront une longvit
suffisante pour gnrer une descendance. Les individus peu adapts auront une tendance
disparatre. Cest une slection naturelle qui conduit de gnration en gnration une
population compose dindividus de plus en plus adapts.
Un algorithme gntique est construit de manire tout fait analogue. Dans lensemble
des solutions dun problme doptimisation, une population de taille N est constitue de
N solutions (les individus de la population) convenablement marques par un codage qui
les identifie compltement. Une procdure dvaluation est ncessaire la dtermination
de la force de chaque individu de la population. Viennent ensuite une phase de slection
(en slectionnant les individus au prorata de leur force) et une phase de recombinaison
(oprateurs artificiels de croisement et de mutation) qui gnrent une nouvelle population
dindividus, qui ont de bonnes chances dtre plus forts que ceux de la gnration prcdente. De gnration en gnration, la force des individus de la population augmente et
aprs un certain nombre ditrations, la population est entirement constitue dindividus
tous forts, soit de solutions quasi-optimales du problme pos.
En, le fonctionnement dun AG est alors bas sur les phases suivantes :
1. Initialisation : une population initiale de taille N chromosomes est tire alatoirement.
2. Evaluation : chaque chromosome est dcod puis valu.
3. Reproduction: cration dune nouvelle population de N chromosomes par lutilisation dune mthode de slection approprie.
4. Oprateurs gntiques: croisement et mutation de certains chromosomes au sein
de la nouvelle population.
5. Retour la phase 2 tant que la condition darrt du problme nest pas satisfaite.
1.2.1
existe principalement trois types de codage : le codage binaire, le codage rel et le codage
en base n.
1.2.1.2
Codage rel
Il a le mrite dtre simple. Chaque chromosome est en fait un vecteur dont les composantes sont les paramtres du processus doptimisation. Par exemple, si on recherche
loptimum dune fonction de n variables f (x1 , x2 , . . . , xn1 , xn ), on peut utiliser tout
simplement un chromosome ch contenant les n variables: Avec ce type de codage, la proch:
x1
x2
xn1
xn
cdure dvaluation des chromosomes est plus rapide vu labsence de ltape de transcodage (du binaire vers le rel). Les rsultats donns par Michalewicz (Michalewicz, 1992)
montrent que la reprsentation relle aboutit souvent une meilleure prcision et un gain
important en termes de temps dexcution.
1.2.1.3
Codage en base n
Dans ce type de codage, les gnes constituant un chromosome sont des chiffres exprims dans une base de numration n, ce qui permet de reprsenter n valeurs discrtes.
LAG dmarre avec une population compose de N individus dans le codage retenu. Le
choix des individus conditionne fortement la rapidit de lalgorithme. Si la position de
loptimum dans lespace de recherche est totalement inconnue, il est intressant que la
population soit rpartie sur tout lespace de recherche. Si par contre des informations
priori sur le problme sont disponibles, il parat vident de gnrer les individus dans
un espace particulier afin dacclrer la convergence. Disposant dune population initiale
souvent non homogne, la diversit de la population doit tre entretenue aux cours des
gnrations afin dexplorer le plus largement possible lespace de recherche. Cest le rle
des oprateurs de croisement et de mutation.
1.2.2
Oprateur de croisement
Le croisement est le principal oprateur agissant sur la population des parents. Il permet de crer de nouveaux individus par lchange dinformation entre les chromosomes
par leur biais de leur combinaison. La population courante est divise en deux sous populations de mme taille (N/2) et chaque couple form par un membre provenant de chaque
sous population participe un croisement avec une probabilit (pc ) souvent suprieure
0,5. Si le croisement a eu lieu entre deux chromosomes parents (ch1 et ch2 ), constitus de
l gnes, on tire alatoirement une position de chacun des parents. On change ensuite les
deux sous chanes terminales de chacun des chromosomes, ce qui produit deux enfants
0
10
Ce type de croisement est trs efficace et peut stendre nimporte quel type de
chanes (relles, en base n, etc...). Nanmoins certains auteurs (Wu et Lin, 1999) prfrent utiliser dans le cas des chanes relles, un croisement de type barycentre: deux
gnes ch1 (i) et ch2 (i) sont slectionns dans chacun des parents la mme position i. Ils
0
dfinissent deux nouveaux gnes ch1 (i) et ch2 (i) par combinaison linaire :
(
(1.1)
o est un paramtre de pondration alatoire qui prend gnralement ses valeurs dans
lintervalle [0.5, 1.5] (ceci permet de gnrer des points entre ou lextrieur des deux
gnes considrs).
Quoi quil en soit, il se peut que leffet de loprateur de croisement soit insuffisant pour
assurer une meilleure exploration de lespace de recherche. Ainsi dans le cas du codage
binaire, certaines chanes peuvent totalement disparatre de la population. Par exemple, si
aucun chromosome de la population initiale ne contient de 1 en premire position et que ce
1 fasse partie de la chane optimale trouver, aucun croisement ne peut faire apparatre cet
lment. Ce dernier ne peut sintroduire dans la population que si lon introduit un autre
oprateur et cest, entre autre, pour remdier ce problme que loprateur de mutation
est utilis.
1.2.3
11
Oprateur de mutation
Le rle de cet oprateur est de modifier alatoirement la valeur dun gne dans un
chromosome. Dans le cas du codage binaire, chaque bit ai {0,1} est remplac par son
complmentaire ai = 1 ai . Dans lexemple de la figure 1.3, une mutation a eu lieu sur
le troisime gne du chromosome ch et elle a transform ce gne de 1 en 0.
Pour les chaines codes en base n, la mutation consiste remplacer le gne initial par
un chiffre en base n tir au sort.
Dans le cas dun codage rel, on utilise principalement deux oprateurs de mutation: la
mutation uniforme et la mutation non uniforme (Michalewicz, 1992). En supposant fixe
la probabilit de mutation pm , un tirage au sort pour chaque gne xk dun chromosome ch
permet de dcider si ce gne doit tre ou non modifi. Nous supposons que le gne prend
max
ses valeurs dans un intervalle [xmin
].
k ,xk
Pour la mutation uniforme, qui est une simple extension de la mutation binaire, on rem0
place le gne xk slectionn par une valeur quelconque xk tire alatoirement dans linmax
tervalle [xmin
].
k ,xk
Pour la mutation non uniforme, le calcul de la nouvelle valeur dun gne est un peu plus
complexe. Le gne xk subit des modifications importantes durant les premires gnrations, puis graduellement dcroissantes au fur et mesure que lon progresse dans le
processus doptimisation. Pour une gnration t, on tire au sort une valeur binaire qui
0
xk =
xk + 4(t,xmax
xk )
k
si rand = 0
xmin
k )
si rand = 1
xk 4(t,xk
(1.2)
o 4(t,y) est une fonction qui dfinit lcart entre la nouvelle valeur et la valeur initiale
12
4(t,y) = y (1 r(1t/T ) )
(1.3)
xk = xk + N (0,)
(1.4)
o reprsente la variance.
La mutation est traditionnellement considre comme un oprateur intervenant la marge,
dans la mesure o sa probabilit est en gnral assez faible (de lordre de 1%). Mais
elle confre aux algorithmes gntiques une proprit trs importante : lergodicit (tous
les points de lespace de recherche peuvent tre atteints). Cet oprateur est donc dune
grande importance et il est loin dtre marginal, dailleurs un algorithme gntique peut
converger sans loprateur de croisement et certaines applications fonctionnent de cette
manire (Hwang, 1999).
1.2.4
Fonction dvaluation
(1.5)
avec:
: loi de composition de fonctions
g: fonction de transformation, pouvant tre linaire, exponentielle, logarithmique, etc . . ..
h: fonction objectif ou de cot, elle dpend de lobjectif recherch.
1.2.5
13
Oprateur de slection
f (chi )
N
X
(1.6)
f (chj )
j=1
Plus la performance dun individu est leve par rapport celle des autres, plus il a une
chance dtre reproduit dans la population. Les individus ayant une grande fitness relative
ont donc plus de chance dtre slectionns. On parle alors de slection proportionnelle.
Le nombre de copies espres pour chaque individu chi qui va rsulter de la slection est
alors gal :
ni = N p(chi ) =
f (chi )
f (chi )
=
N
f
1 X
f (chj )
N j=1
(1.7)
14
1.2.5.1
1.2.5.2
Sharing
Le sharing consiste ajuster la fitness des individus pour viter quils se concentrent
dans une niche principale (optimum globale). La technique de partage de la fitness (fitness
sharing), introduite par Goldberg et Richardson (Goldberg et Richardson, 1987), rduit la
fitness de chaque individu dun facteur correspondant environ au taux dagrgation de la
population autour de son voisinage :
f 0 (chi ) =
f (chi )
mi
(1.8)
mi =
N
X
sh(dij )
(1.9)
j=1
1 ( dij )
shar
sh(dij ) =
(1.10)
sinon
La figure 1.4 montre deux exemples de rpartition de populations dans le cas dune fonction multimodale: le premier sans sharing et le deuxime avec sharing.
15
Si le principe de sharing a t utilis initialement dans lespace de paramtres (le critre de distance tant fonction des paramtres), il est tout a fait possible de ladapter dans
lespace des objectifs. Cest dailleurs cette ide qui est exploite dans les algorithmes
gntiques multi-objectifs.
1.2.5.3
Elitisme
16
1.3
En dpit des avantages des algorithmes gntiques standards (AGS) pour la rsolution
des problmes doptimisation difficiles o dautres techniques ont chou, ils prsentent
quand mme des limites, quand on sintresse loptimisation de la topologie dun systme plutt qu loptimisation seule de ses paramtres, car le chromosome et la structure
du phnotype dans lAGS sont fixs ou prdfinis, ce qui conduit lutilisation des AGH
qui surmontent ces contraintes (Tang et al., 1995; Xiang et al., 2006). Les AGH diffrent
des AGS dans la structure des chromosomes. Ils prsentent une structure hirarchique et
se composent de deux types de gnes : les gnes de contrle et les gnes de paramtres.
Les gnes de contrle ont un rle dactivation ou de dsactivation des blocs, tandis que
les gnes de paramtres dfinissent la valeur des coefficients dans chaque bloc.
1.3.1
Dans ce cas-l, lactivation des gnes paramtriques est rgie par la valeur du premier niveau du gne de contrle, qui est rgi son tour par la valeur du deuxime niveau
17
La structure dun chromosome contient la fois des gnes actifs et inactifs. Il faut
noter que les gnes inactifs existent toujours dans le chromosome et peuvent tre transmis
ensuite aux nouvelles gnrations. Cette architecture hirarchique implique que le chromosome contient plus dinformations que celle de la structure conventionnelle des AG.
Par consquent, la puissance artificielle est largement amliore.
18
1.3.2
Oprateurs gntiques
Les oprateurs gntiques de base peuvent tre utiliss sans aucune contrainte. La
mutation et le croisement peuvent tre appliqus indpendamment chaque niveau de
gnes de contrle. Cependant, les oprateurs gntiques qui affectent les niveaux hauts
des gnes de contrle et produisent des changements des gnes actifs mnent des changements multiples dans les niveaux infrieurs. Cest la raison pour laquelle, un AGH est
capable dobtenir le meilleur ensemble de paramtres dun systme avec une topologie
ou structure minimise.
1.4
Optimisation multi-objectifs
(1.11)
o n est le nombre de fonctions objectifs, X = [x1 ,x2 ,...xm ] est le vecteur reprsentant les variables de dcision. C reprsente lensemble des solutions ralisables associ
des contraintes dgalit et dingalit et F (X) = (f1 (X),f2 (X)...fn (X)) est le vecteur
dobjectifs.
Dans un problme doptimisation multi-objectifs, il y a plus quune fonction dobjectif
(n 2), chaque fonction peut avoir un optimum diffrent. Le but dun problme multiobjectifs est donc de trouver de "bons compromis" plutt quune seule solution ( moins
quune solution soit optimale pour toutes les fonctions objectifs, ce qui est rarement le
cas). Lorsquil y a plusieurs objectifs, la notion doptimum change, elle est remplace par
les notions de dominance et doptimalit de Pareto.
Dfinition 1 (la dominance): une solution A domine une solution B pour un problme
de minimisation (resp. maximisation) si et seulement si:
i {1, 2, . . . ,n} : fi (A) fi (B) (resp. fi (A) fi (B))
et j {1,2,...,n} : fj (A) < fj (B) (resp. fj (A) > fj (B))
(1.12)
19
On dit que B est domine par A ou entre les deux solutions, A est la solution non domine.
Dfinition 2 (Pareto optimum): un vecteur X C est un optimum de Pareto sil
nexiste aucune solution X de C qui domine X .
Au lieu dune solution unique, loptimisation multi-objectifs donne lieu un ensemble
de solutions optimales. Toute solution de cet ensemble est optimale dans le sens quil est
impossible damliorer les performances, sur un critre de cette solution, sans que cela
entrane une dgradation des performances, sur au moins un autre critre. Ces solutions
optimales forment lensemble de solutions Pareto optimales, elles sont aussi connues sous
le nom de solutions efficaces, non infrieures et non domines. La reprsentation de ces
solutions non domines dans lespace dobjectif est appele front de Pareto. La figure 1.7
montre un exemple de front de Pareto pour un problme de minimisation deux objectifs.
Lensemble de points blancs reprsentent le front de Pareto.
Les algorithmes gntiques, avec un bon rglage de leurs paramtres, constituent une
approche intressante pour la rsolution des problmes doptimisation multi-objectifs. De
plus, ce domaine est trs dynamique et ne cesse de se dvelopper. Il a t propos plusieurs mthodes pour le traitement des problmes multiobjectifs. Ces mthodes peuvent
tre classes principalement en deux catgories: La premire catgorie enveloppe les mthodes "agrgatives", qui transforment le problme en un problme uni-objectif utilisant
20
une fonction objectif quivalente. La deuxime famille comporte les mthodes dites "non
agrgatives", dans ces mthodes il ny a pas fusion dobjectifs pour se ramener un problme doptimisation mono-objectif.
1.4.1
Mthode agrgative
Cest lune des premires mthodes utilise pour rsoudre les problmes doptimisation multiobjectifs (MO). Elle consiste transformer le problme MO en un problme
monoobjectif en combinant les composantes fi du vecteur objectif du problme en une
seule fonction scalaire f . Il existe dans la pratique, diffrentes faons de construire la
fonction f . La plus classique et la plus utilise se ramne une simple somme pondre
des objectifs fi (agrgation additive):
f=
n
X
i fi
(1.13)
i=1
21
Toutefois, une variation uniforme des poids ne garantit pas la dtermination des solutions Pareto optimales uniformment rparties sur le front.
22
1.4.2
Comme nous lavons signal prcdemment, la mthode agrgative peut tre utilise de faon squentielle pour obtenir le front de Pareto pour un problme doptimisation multi-objectifs. Toutefois, cette approche nest gnralement pas satisfaisante car le
nombre dexcutions successives ncessaires pour dterminer les diffrents compromis
conduit alors un nombre dvaluations de critres prohibitif. Ainsi, pour surmonter cette
difficult, on prfre utiliser des mthodes permettant dune part de trouver lensemble
de solutions Pareto optimales en une seule excution et dautre part de saffranchir des
problmes de mise lchelle des objectifs. Parmi ces mthodes on peut citer :
Vector Evaluated Genetic Algorithm (VEGA)
Multiple Objective Genetic algorithm (MOGA)
Niched Pareto genetic algorithm (NPGA)
Nondominated sorting genetic algorithm (NSGA) et sa deuxime version (NSGAII)
1.4.2.1
1.4.2.2
23
Cet algorithme, propos par Fonseca et Fleming (1993), utilise la notion de dominance
pour ranger les individus de la population. Il diffre de lalgorithme gntique standard
uniquement dans la manire dont la fitness est assigne pour chaque solution. Pour dmarrer lalgorithme, les relations de domination sont dabord calcules pour chaque solution.
Puis, pour une solution i, un rang gal un plus le nombre de solutions ni qui dominent
la solution i est attribu. Une fitness est ensuite attribue chaque solution en fonction
de son rang, les individus avec les rangs les plus faibles ayant les meilleures fitness. Afin
de maintenir la diversit entre les solutions non domines, les auteurs utilisent une fonction de partage (Sharing). La mthode permet dobtenir des solutions de bonne qualit et
simplante facilement. Toutefois, les performances sont trs dpendantes de la valeur du
paramtre shar utilis dans le sharing.
1.4.2.3
Dans lalgorithme NSGA propos par Srinivas et Deb (1993), le calcul de fitness seffectue en divisant dabord la population en plusieurs fronts en fonction du degr de dominance au sens de Pareto de chaque individu. Les individus non domins de la population
courante constituent le premier front de Pareto. On attribue alors tous les individus de ce
front la mme valeur de fitness factice. Cette valeur est suppose donner une chance gale
de reproduction tous ces individus. Mais pour maintenir la diversit de la population, il
est ncessaire dappliquer une fonction de partage sur cette valeur. En suite, ce premier
groupe dindividus est temporairement supprim de la population. On recommence cette
procdure jusqu lidentification des solutions du deuxime front. La valeur factice de
fitness attribue ce second groupe est infrieure la plus petite fitness, aprs application
de la fonction de partage sur le premier front. Ce mcanisme est rpt jusqu ce que lon
ait trait tous les individus. Lalgorithme se droule ensuite comme un algorithme gntique standard. Grce sa procdure dassignement de fitness base la fois sur la notion
de dominance et la fonction de partage, le NSGA semble le plus appropri maintenir la
diversit de la population et rpartir plus efficacement les solutions sur le front de Pareto.
Nanmoins, cet algorithme prsente quelques insuffisances en raison de sa complexit de
calcul et de sa sensibilit au choix de la valeur shar .
24
1.4.2.4
Cette mthode propose par Horn et Napfliotis (1994) utilise une slection par tournoi
en se basant sur la notion de dominance de Pareto. Le NPGA excute les mmes tapes
que lAG standard, la seule chose qui diffre tant la mthode de slection. A chaque
tournoi, deux individus candidats A et B sont pris au hasard dans la population courante.
Au lieu de limiter la comparaison aux deux individus (comme cest le cas pour lAG standard), une sous population (ou ensemble de comparaison) de taille tdom est galement
choisie au hasard. Les deux candidats slectionns sont compars chaque individu du
sous-groupe. Si lun des candidats est domin par lensemble de comparaison et le second
ne lest pas, ce dernier est alors positionn dans la population suivante. Dans les autres
cas, une fonction de partage est applique pour choisir le candidat gagnant. Le paramtre
tdom permet de contrler la pression de slection ou de dominance.
Lalgorithme NPGA est considr comme tant lalgorithme le plus rapide parmi les approches prcdentes car chaque gnration la comparaison nest applique que sur une
portion de la population. Le principal inconvnient de cet algorithme est quil ncessite,
en plus de spcifier le paramtre de sharing shar , un autre paramtre supplmentaire qui
est la taille du tournoi tdom .
1.4.2.5
NSGA-II
Toutes les mthodes que nous venons de prsenter ne conservent pas leurs solutions
Pareto-optimales trouves au cours des gnrations. Elles sont dites non litistes. Pour
rsoudre cette difficult, de nouvelles techniques ont t appliques. Nous avons choisi
de prsenter uniquement le NSGA-II car il a t utilis dans nos travaux. Nous ne ferons
que citer les deux autres mthodes les plus connues savoir Strength Pareto Evolutionary
Algorithm (SPEA) et Pareto Envelope-based Selection Algorithm (PESA) prsentes plus
amplement dans les rfrences (Zitzler et Thiele, 1999) et (Corne et al., 2000).
En proposant le NSGA II, Deb (Deb et al., 2002) a tent de rsoudre toutes les critiques
faites sur NSGA: non litiste, complexit de calcul et utilisation de sharing qui implique
le rglage dun ou plusieurs paramtres. Dans cet algorithme, chaque gnration t une
population de parents (Pt ) de taille N et une population denfants (Qt ) de mme taille
sont assembles pour former une population (Rt ) de taille 2N , comme indiqu sur la
figure 1.10. Cet assemblage permet dassurer llitisme. La population (Rt ) est ensuite
25
rpartie en plusieurs fronts (F1 , F2 , . . .) par une procdure de tri, plus rapide que celle
propose dans la premire version de NSGA. Une nouvelle population parent (Pt+1 ) est
forme en ajoutant les fronts au complet (premier front F1 , second front F2 , etc...) tant
que ce ceux-ci ne dpassent pas N . Si le nombre dindividus prsents dans (Pt+1 ) est
infrieur N , une procdure de crowding est applique sur le premier front suivant Fi
non inclus dans (Pt+1 ). Le but de cet oprateur est dinsrer les (N Pt+1 ) meilleurs
individus de Fi qui manquent dans la population (Pt+1 ). Une fois que les individus de
la population (Pt+1 ) sont identifis, une nouvelle population enfant (Qt+1 ) est cre par
slection, croisement et mutation. La slection par tournoi est utilise mais le critre de
slection est maintenant bas sur loprateur de comparaison (<n ) dfini ci-dessous. Le
processus se rpte dune gnration une autre jusqu satisfaction dun critre darrt.
26
6. On recommence les tapes partir de 3 jusqu ce que tous les points soient traits.
Cet algorithme est dune complexit de O(k.N 2 ), alors que celui utilis dans la premire
version est de O(k.N 3 ). k tant la taille du vecteur objectifs
Distance de crowding
La dernire critique faite sur le NSGA est lutilisation du sharing. Une mthode qui exige
le rglage dun ou plusieurs paramtre(s). Dans NSGA-II, Deb et al remplacent la procdure de sharing par une procdure de crowding, base sur un calcul de distance (distance
de crowding) qui ne ncessite aucun paramtrage et qui est galement dune complexit
algorithmique moindre que celle de sharing. La distance de crowding dune solution particulire i se calcule en fonction du primtre de lhypercube ayant comme sommets les
points les plus proches de i sur chaque objectif. Sur la figure 1.11, est reprsent lhypercube en deux dimensions associ au point i. Le calcul de la distance de crowding
ncessite, avant tout, le tri des solutions selon chaque objectif, dans un ordre ascendant.
Ensuite, pour chaque objectif, les individus possdant des valeurs limites se voient associs une distance infinie. Pour les autres solutions intermdiaires, on calcule une distance
de crowding gale la diffrence normalise des valeurs des fonctions objectifs de deux
solutions adjacentes. Ce calcul est ralis pour chaque objectif. La distance de crowding
dune solution est obtenue en sommant les distances correspondantes chaque objectif.
27
F IG . 1.11 Distance de crowding (les points noirs sont des solutions appartenant au
mme front)
i+1
i1
fm
fm
)
M ax
M in
fm
fm
i+1
i1
Dans cet algorithme, fm
et fm
reprsentent respectivement les valeurs de la mime
M ax
M in
fonction objectif des solutions i + 1 et i 1 alors que les paramtres fm
et fm
dsi-
28
Entre deux solutions de fronts diffrents, on prfre la solution avec le plus petit front.
Pour deux solutions qui appartiennent au mme front, on prfre la solution situe dans
une rgion dpeuple, cest--dire la solution possdant la plus grande valeur de distance
de crowding.
1.5
Conclusion
Dans ce chapitre, nous avons dcrit le fonctionnement et les diffrents oprateurs dun
algorithme gntique standard, technique doptimisation mono-objectif. Nous avons vu
que ces algorithmes prsentent des inconvnients lorsquon sintresse loptimisation
de la topologie dun systme plutt qu loptimisation seule des ses paramtres. Cela
nous a conduits introduire une autre version dalgorithmes mieux adapte cette classe
de problmes nomme "algorithmes gntiques hirarchiss". Nous avons galement dcrit dans ce chapitre le problme doptimisation multi-objectifs et quelques algorithmes
gntiques de rsolution rapports dans la littrature. Parmi les algorithmes examins, le
NSGA-II semble tre aujourdhui lune des techniques de rfrence qui garantit la diversit des solutions Pareto-optimal sans quil soit ncessaire de connatre le rayon de
niche.
Chapitre 2
Rseaux de neurones et systmes flous
2.1
Introduction
Lutilisation des rseaux de neurones (RN) et des systmes flous (SF) pour la synthse
des systmes de commande a connu un essor important au cours de ces dernires annes.
Dans ce chapitre, nous allons dcrire ces outils ainsi que les modalits de leur utilisation.
Le chapitre est organis en trois parties. La premire partie fait lobjet dune tude dtaille sur lemploi des rseaux de neurones pour la commande. Aprs une brve prsentation de quelques notions gnrales sur les rseaux de neurones, nous prsentons les deux
grandes familles de structures neuronales les plus utilises. Nous abordons galement le
problme dapprentissage des paramtres de ces structures, nous nous intressons particulirement lalgorithme de rtropropagation. Nous exposons dans un deuxime temps,
la classification des principales approches de la commande par rseaux de neurones rencontres dans la littrature. Notre but nest pas de dresser une liste complte mais plutt
de dgager les lignes directrices communes. Certaines architectures sont ainsi absentes
dans cette classification mais on peut gnralement les rattacher lune des classes proposes. La deuxime partie sera consacre aux systmes flous. Aprs une prsentation
gnrale de quelques notions sur les ensembles flous, nous prsentons en dtail la structure interne dun contrleur flou. Ce dernier est considr comme lune des applications
les plus importantes des systmes flous. Dans la troisime partie, nous aborderons la technique dhybridation entre ces deux paradigmes (SF et RN), employe frquemment pour
la modlisation et la commande des systmes complexes.
29
30
2.2
Rseaux de neurones
2.2.1
Le neurone formel
ij xj + bi
(2.1)
31
Un rseau de neurones (RN) est un systme informatique qui a des caractristiques semblables aux rseaux de neurones biologiques. Il est constitu de plusieurs units (neurones) organises sous forme de niveaux diffrents appels couches du rseau. Les neurones appartenant la mme couche possdent les mmes caractristiques et utilisent le
mme type de fonction dactivation. Entre deux couches voisines les connexions se font
par lintermdiaire de poids qui jouent le rle des synapses. Linformation est porte par
la valeur de ses poids, tandis que la structure du rseau de neurones ne sert qu traiter
linformation et lacheminer vers la sortie. La structure ou la topologie dun rseau de neurones est la manire dont les neurones sont connects. Les structures rsultantes peuvent
tre trs varies mais elles sont souvent rparties en deux grandes familles savoir : les
rseaux de neurones non boucls et les rseaux de neurones boucls (Burns, 2001).
2.2.2
Dans ce type de structure dite feedforward, la propagation de linformation se fait uniquement de lentre vers la sortie. Les neurones de la mme couche peuvent se connecter
uniquement avec les neurones de la couche suivante. Larchitecture la plus utilise est le
Perceptron multicouches. Les neurones composant ce rseau sorganisent en N couches
successives (N 3). Dans lexemple suivant (figure 2.2), nous prsentons un perceptron
trois couches. Les neurones de la premire couche, nomme couche dentre, voient
leur activation force la valeur dentre. La dernire couche est appele couche de sortie. Elle regroupe les neurones dont les fonctions dactivation sont gnralement de type
linaire. Les couches intermdiaires sont appeles couches caches. Elles constituent le
cur du rseau. Les fonctions dactivation utilises sont de type sigmode.
32
Sur la figure 2.2, les termes bli et ijl dsignent respectivement le biais du neurone i de
la couche l et le poids de connexion entre le neurone j de la couche l 1 et le neurone i
de la couche l.
Tenant compte de ces notations, la sortie du neurone i dans la couche l est peut tre donne
par :
Nl1
Uil
(2.2)
Oil = g l (Uil )
(2.3)
l = 1,2
o g l (.) est la fonction dactivation des neurones de la couche l.
On peut rcrire les quations ci-dessus sous forme matricielle comme suit :
U l = W l Ol1 + bl
(2.4)
Ol = g l (U l )
(2.5)
l T
avec : U l = (U1l ,U2l ,.....,UNl l )T , Ol = (O1l ,O2l ,.....,ON
) , bl = (bl1 ,bl2 ,.....,blNl )T et
l
l
11
l
21
l
12
l
22
l
1N
l1
l
2N
l1
l
W = .
.
.
..
..
..
l
l
l
N
12
Nl Nl1
l1
Le perceptron multicouche prsente une alternative prometteuse pour la modlisation des
systmes complexes. Avec une seule couche cache, il constitue un approximateur universel. Les tudes menes dans (Hornik et al., 1989; Cybenko, 1989) montrent quil peut tre
entrain de manire approximer nimporte quelle fonction sous rserve de mettre suffisamment de neurones dans la couche cache et dutiliser des sigmodes comme fonctions
dactivation.
2.2.3
33
Rseaux boucls
Un rseau dynamique ou rcurrent possde la mme structure quun rseau multicouches munie de rtroactions. Les connexions rtroactives peuvent exister entre tous les
neurones du rseau sans distinction, ou seulement entre certains neurones (les neurones
de la couche de sortie et les neurones de la couche dentre ou les neurones de la mme
couche par exemple). La figure 2.3 montre deux exemples de rseaux rcurrents. Le premier est un simple multicouches qui utilise un vecteur dentre qui contient les copies des
activations de la couche de sortie du rseau et le deuxime est un rseau mmoire se
distingue du premier par la prsence des units mmoires (Sastry et al., 1994).
2.2.4
Lapprentissage dans le contexte des rseaux de neurones, est le processus de modification des poids de connexions (y compris les biais) ou plus rarement du nombre de
couches et de neurones (Man et Halang, 1997), afin dadapter le traitement effectu par le
rseau une tache particulire.
On distingue trois familles dapprentissage :
apprentissage supervis: Dans ce cas, un superviseur(ou expert humain) fournit
une valeur ou un vecteur de sortie (appel cible ou sortie dsire), que le rseau de
neurones doit associer un vecteur dentre. Lapprentissage consiste dans ce cas
34
ajuster les paramtres du rseau afin de minimiser lerreur entre la sortie dsire et
la sortie relle du rseau.
apprentissage semi-supervis ou apprentissage par renforcement: Ce mode dapprentissage, suppose quun comportement de rfrence nest pas possible, mais en
revanche, il est possible dobtenir des indications qualitatives (vrai, faux, ...) sur les
performances du rseau.
apprentissage non supervis: Dans cet apprentissage, les donnes ne contiennent
pas dinformation sur la sortie dsire. Il ny a pas de superviseur. La tche du
rseau consiste, par exemple dans ce cas, crer des regroupements de donnes
selon des proprits communes (classification).
2.2.4.1
Lalgorithme de rtropropagation (backpropagation) est lun des algorithmes supervis les plus utiliss pour lapprentissage des rseaux de neurones. Cest dailleurs sa
dcouverte au dbut des annes 80 (Rumelhart et McClelland, 1986) que lon doit le
renouveau dintrt pour les rseaux de neurones. Lobjectif de cet algorithme est de modifier les poids du rseau dans le sens contraire du gradient du critre de performance.
Dans ce qui suit, nous allons prsenter les quations constituant lalgorithme en utilisant
un rseau multicouches. Une mise sous forme matricielle sera aussi faite afin de faciliter
limplantation de lalgorithme sous un logiciel bien adapt aux calculs matriciels.
Considrons le rseau multicouche dcrit prcdemment. Pour allger lexpos, on suppose que lapprentissage se fait chaque prsentation dun couple entre/sortie de lensemble dapprentissage. Le critre de performance minimiser peut tre alors exprim
par :
J(t) = 0.5
NL
X
(2.6)
i=1
avec:
J(t)est la valeur du critre linstant t.
di (t) est la ime sortie dsire linstant t.
Les paramtres du rseau sont modifis suivant la rgle du gradient comme suit:
J(t)
ijl (t)
J(t)
bli (t + 1) = bli (t) l
bi (t)
(2.7)
(2.8)
35
b
J(t)
J(t)
Uil (t)
=
ijl (t)
Uil (t) ijl (t)
(2.9)
J(t)
J(t)
Uil (t)
=
bli (t)
Uil (t)
bli (t)
(2.10)
En posant, il (t) =
Uil (t)
= Ojl1
l
ij (t)
(2.11)
Uil (t)
= 1
bli (t)
(2.12)
J(t)
on obitent:
Uil
J(t)
= il (t) Ojl1
l
ij (t)
J(t)
= il (t)
l
bi (t)
(2.13)
(2.14)
La quantit il exprime la sensibilit du critre de performance aux changements du potentiel Uil du neurone i de la couche l. Dans le cas o i est lindice dun neurone de sortie
(l = L), on obtient :
iL (t) =
J(t)
J(t) OiL
=
(2.15)
avec
dg L (UiL (t))
dUiL (t)
Dans le cas o i est lindice dun neurone cach (1 < l < L 1), on peut vrifier
g L (UiL (t)) =
aisment que les fonctions de sensibilit satisfont la relation rcurrente ci-dessous (Hagan
et Menhaj, 1994):
l = G l (U l ) (W l+1 )T l+1
o
l
l
G (U ) =
(U1l (t))
0
..
.
0
0
g
(U2l (t))
..
.
0
(2.16)
0
g l (U1l (t))
0
..
.
(2.17)
36
Pour rsumer, lalgorithme de mise jour des paramtres du rseau se droule comme
suit : premirement le vecteur dentre U 0 = (x1 ,x2 , ,xN0 )T est propag vers la sortie
en utilisant les quations (2.2) et (2.3). Ensuite, on calcule les fonctions de sensibilits par
rtropropagation de lerreur de sortie laide des quations (2.15) et (2.16). Finalement
on modifie les poids et les biais en utilisant les quations (2.13), (2.14), (2.7) et (2.8).
Cet algorithme, prsent ici dans sa version la plus simple, possde de nombreuses variantes. Elles correspondent pour la plupart ladaptation du coefficient dapprentissage
(Magoulasb et al., 1999), ou lutilisation de mthodes du deuxime ordre pour le calcul
du gradient (Hagan et Menhaj, 1994). Nous pouvons galement citer parmi ces variantes
la mthode avec un terme de momentum (Vogl et al., 1988), qui utilise une version lgrement diffrente des quations (3.7) et (3.8) pour ajuster les paramtres du rseau:
p(t + 1) = p(t)
J(t)
+ p(t)
p(t)
(2.18)
2.2.5
Lidentification des systmes linaires est actuellement un domaine bien matris par
lautomaticien. Cependant, de nombreux processus rels sont complexes et prsentent des
dynamiques non linaires. De plus, sur ces mmes systmes, les connaissances des phnomnes physico-chimiques mises en jeu ne sont pas forcment mesures. Le recours
des modles de type "boite noire" devient ncessaire et lidentification du modle est ralise autour dun ensemble de donnes entres/sorties. Un rseau de neurone, qualifi de
bote noire, prsente un outil incontournable pour lidentification de tels systmes.
La figure 2.4 montre le schma gnral didentification neuronale. Sur cette figure, le rseau de neurones est utilis en parallle avec un processus de type boite noire identifier.
La sortie y du processus est compare la sortie y du rseau de neurones puis lerreur
ei = y y est utilise par un algorithme dapprentissage appropri (exemple la rtropropagation) pour ajuster les paramtres du rseau neuronal.
37
38
2.3
2.3.1
39
2.3.2
Dans cette mthode, le rseau neuronal utilise lerreur e, mesure en sortie du processus, pour adapter ses paramtres en ligne. Plusieurs stratgies sont possibles. La plus
simple consiste utiliser directement cette erreur comme sil sagissait de lerreur ec ,
en sortie du contrleur. Cette approche ne peut donner de bons rsultats que si ces deux
erreurs sont fortement corrles. La mthode la plus utilise consiste considrer le processus comme une couche supplmentaire du rseau travers laquelle on rtropropage
lerreur.
Pour pouvoir utiliser cette stratgie, il est ncessaire de connaitre le Jacobien du proy
cessus, cest--dire la quantit
. Il est alors possible dutiliser lalgorithme de rtroprou
pagation en considrant que le processus est une extension fixe du rseau. Le calcul du
gradient du critre doptimisation J (J = f (e)) par rapport aux poids du rseau se fait en
appliquant la rgle:
J
J
y u
=
p
y
u p
(2.19)
40
Le terme
J
y
dpend du critre doptimisation choisi,
est le Jacobien du processus
y
u
u
est obtenu par lalgorithme de rtropropagation du gradient. Comme lobtention
p
y
du Jacobien
est souvent difficile, Psaltis (Psaltis et al., 1988) propose de lapproxiu
mer par une mthode base sur la perturbation des entres, alors que Saerens (Saerens
et
et Soquet, 1991) le remplace par celui dun systme linaire approchant le procd pour
lequel on dduit aisment le Jacobien. Il est galement possible de nutiliser que le signe
du Jacobien, plus facile connatre que le Jacobien lui-mme.
2.3.3
La mthode prsente un inconvnient majeur li ltape dapprentissage: le modle appris ne garantit pas forcment la ralisation correcte dun comportement dsir du
41
moment que tous les tats dsirs possibles, non pas ncessairement, t rencontrs lors
de lapprentissage. Une autre difficult apparat quand le modle inverse du processus est
mal conditionn (i.e. il existe plusieurs commandes correspondant un comportement dsir). Les algorithmes dapprentissage superviss ragissent gnralement ce problme
par une commande gale la moyenne des solutions admissibles rencontres, ce qui peut
tre catastrophique dans certains cas. Cette approche a cependant, t utilise avec succs
par de nombreux auteurs.
2.3.4
Cette mthode, propose par Psaltis (Psaltis et al., 1987), correspond une mise en
uvre particulire de la commande par modle inverse, dans laquelle, le modle neuronal
en cours dapprentissage, sert aussi commander le processus. La sortie dsire y (t) est
propage travers le premier rseau neuronal pour produire une commande u1 (t) qui est
applique au systme. La sortie y(t) obtenue est alors utilise comme entre du deuxime
rseau (identique au premier rseau) qui produit une commande u2 (t). La diffrence entre
u1 (t) et u2 (t) sert de signal derreur ec (t) afin dassurer lapprentissage des paramtres
des rseaux par rtropropagation. Le point positif de lapproche est que lentranement
est ralis dans lespace objectif, permettant ainsi de faire parcourir au processus lensemble de ses tats possibles, ou tout au moins lensemble des tats qui seront utiliss
lors du fonctionnement. Nanmoins, lide exploite par cette approche (la minimisation
de lerreur commise sur la commande entrane la minimisation de lerreur en sortie du
processus) nest pas souvent juste, ce qui rend lapproche peu utilisable.
42
2.3.5
Cette mthode diffre des approches prsentes prcdemment par lusage dun modle neuronal du procd dans la structure de commande prsente par la figure 2.11. La
mthode ncessite, donc au pralable, une tape de modlisation du procd par un rseau
de neurones. On cherche ainsi obtenir, par un rseau neuronal, une bonne approximation
de la sortie du procd y(t) lorsquune commande u(t) lui est applique.
Le principe de lapproche est alors, puisque lon dispose dun modle diffrenciable du
procd, dutiliser lalgorithme de rtropropagation en considrant le contrleur et le modle comme un seul rseau. Lerreur est propage travers le modle sans modifier ses
poids, et seuls ceux du rseau contrleur subissent une mise jour. On peut alors se ramener au cas de lquation 3.19 en faisant lapproximation
y
y
=
u
u
(2.20)
43
2.4
Systmes flous
Les systmes flous peuvent tre considrs comme des systmes logiques qui utilisent des rgles linguistiques pour tablir des relations entre leurs variables dentre et
de sortie. Ils sont apparus pour la premire fois dans les annes soixante dix avec des
applications dans le domaine du contrle des processus (Mamdani et Assilian, 1975). Aujourdhui, les applications des systmes flous sont trs nombreuses outre la commande,
ils sont largement utiliss pour la modlisation (Kim et al., 1997; Wang et Langari, 1996),
le diagnostic et la reconnaissance de formes. Pour une meilleure comprhension de leur
fonctionnement, nous prsentons brivement quelques notions de base de ces systmes,
notamment les variables linguistiques.
2.4.1
Ensembles flous
44
45
Lallure de la fonction dappartenance est choisir selon lapplication traite. La figure 2.13, illustre les diffrentes formes de fonctions dappartenance les plus utilises.
Cependant, dans certaines applications o lon doit driver la fonction dappartenance,
on choisira plutt des fonctions en S (sigmode) ou des fonctions de type gaussienne,
continuement drivables sur leur support.
2.4.2
Variables linguistiques
Une variable linguistique appele aussi attribut linguistique peut tre dfinie partir du
triplet (x,U,Tx ) o x est une variable dfinie sur lunivers de discours U et Tx = A1,A2,..
est un ensemble compos de sous ensembles flous de U qui caractrise x. On associe souvent chaque sous ensemble flou de TX une valeur ou un terme linguistique (tiquette).
La figure 2.14 illustre un exemple de la variable linguistique vitesse avec trois termes
linguistiques: petite, moyenne et grande.
Il est gnralement impos que les ensembles flous Ai doivent satisfaire la condition
suivante:
x, i, Ai (x) 6= 0
(2.21)
Cette condition quon appelle dans la littrature, proprit dassurance (coverage property) (Pedrycz et Zadeh, 1995), exige que chaque lment soit affect au moins un
ensemble flou avec un degr dappartenance non nul. A cette condition, on ajoute souvent une proprit supplmentaire qui est le respect de la smantique : les sous ensembles
doivent interprter rellement les termes linguistiques qui leurs ont associs. Dans la partie infrieure de la figure 2.15, le recouvrement entre les ensembles flous est tel quils
46
peuvent tre ordonns, et donc interprts en termes linguistiques, par exemple de la trs
lente jusqu la trs rapide. La partie suprieure de la mme figure montre un bel exemple
dune partition ininterprtable: il est impossible dtiqueter les trois sous ensembles flous
centraux avec des termes linguistiques.
Le respect de ces deux proprits confre aux variables linguistiques une meilleure modlisation des connaissances imprcises en ralisant une rpartition de lespace de connaissance. Cette granulation est dfinie comme une dcomposition dun ensemble de rfrence, comprenant des informations vagues ou imprcises, en plusieurs sous ensembles
flous pour former des rpartitions de connaissance.
2.4.3
47
(2.22)
(2.23)
Dans cette dernire formulation la partie (X1 est A1 ) ET (X2 est A2 ) est appele
prmisse de la rgle et la partie (Y est B) est appele conclusion (consquent).
2.4.4
De manire classique, le fonctionnement interne dun systme flou repose sur la structure prsente par la figure 2.16 qui inclut quatre blocs:
La base de connaissances
La fuzzification des variables dentre, avec ventuellement un prtraitement de
linformation.
48
49
La dfuzzification consiste remplacer lensemble des valeurs de sorties des diffrentes rgles rsultant de linfrence par une valeur numrique unique reprsentative de
cet ensemble. Dans le cas des rgles de type Sugeno, le calcul se fait simplement par une
somme normalise des valeurs associes aux rgles floues.
Dans le cas de rgles de Mamdani, le calcul de la valeur numrique de sortie seffectue
en deux tapes:
1. Composition des rgles
Une fois la phase dinfrence termine, il sagit de regrouper (par union) les sous ensemble flous issus de linfrence pour en obtenir un seul ensemble reprsentatif des
diffrentes conclusions des rgles floues. Comme mthode de composition, on peut
citer en particulier les compositions MAXIMUM (en gnral couple avec linfrence MINIMUM) et SOMME (en gnral couple avec linfrence PRODUIT) 1 .
La premire consiste caractriser lensemble de sorties par une fonction dappartenance gale au maximum des fonctions dappartenance des sous ensembles
flous. La deuxime consiste faire la somme de fonctions dappartenance des sous
ensembles issus de linfrence (figure 2.18).
1. Dans le littrature, on regroupe souvent les phases dinfrence et de composition sous le vocable gnrique dinfrence. Les qualitatifs MIN-MAX et PRODUIT-SOMME, couramment employs, caractrisent
les oprations retenues pour ces deux phases.
50
Z
y r (y)dy
y = Z
r (y)dy
En pratique, on estime le centre de gravit, en calculant la moyenne dun certain nombre de points chantillonns sur la fonction:
X
yi r (yi )dy
X
y =
r (yi )
(b) La mthode de maximum
Cette mthode, sapplique uniquement dans le cas o la fonction dappartenance associe lensemble de sortie nadmet quun seul maximum. On choisit comme sortie labscisse y correspondant ce maximum.
(c) La mthode de la moyenne des maxima MOM
Dans cette mthode, la valeur de sortie est estime par labscisse du point cor-
51
2.5
Systme neuro-flou
Les principaux avantages dun systme flou sont lapproche naturelle de la modlisation et la bonne interprtabilit de la description, en employant des rgles linguistiques.
Cependant, il ny a aucune mthode formelle pour dterminer ses paramtres (fonctions
dappartenance et rgles floues). Dans ce sens, il serait intressant de disposer dalgorithmes permettant lapprentissage automatique de ces paramtres. Lune des approches
qui permette de rpondre ce besoin est les rseaux de neurones connus pour leur algorithme dapprentissage et leur prcision dans lajustement numrique en employant des
chantillons entre/sortie. De nombreux auteurs ont donc tout naturellement cherch
combiner ces deux approches depuis le dbut des annes 90 et ceci de plusieurs manires :
cooprative, concurrente et hybride. Nous nous portons ici notre attention sur la dernire
approche (hybride) qui permet de reprsenter sous forme dun rseau de neurones, les
52
diffrentes composantes dun systme flou. La structure du rseau ainsi obtenue dpend
du type de rgles floues et de mthodes dinfrence et de dfuzzification employes par le
systme flou. Les paramtres du systme flou (fonction dappartenance et rgles floues)
peuvent ensuite tre modifis par un algorithme dapprentissage conu initialement pour
lajustement des paramtres dun rseau de neurones.
2.5.1
Plusieurs architectures, mettant en uvre cette approche hybride, sont dcrites dans la
littrature (Farag et al., 1998; Lee, 2005). Ces architectures peuvent tre classes en trois
groupes (Wang et Lee, 2001) selon le type de rgles floues quelles intgrent:
C=
(typeI)
(typeIII)
(2.24)
53
2.5.1.1
ANFIS
2.5.1.2
FALCON ET GARIC
IL sagit de modle 5 couches (Lin et Lee, 1991; Berenji et Khedkar, 1992) utilisant
la fuzzufication en entre et la dfuzzification en sortie. Ceci correspond une interprtation juste de la mthode de Mamdani. La prcision accrue des rsultats provoque une
lenteur dans lexcution du systme. Ce modle est rarement utilis en pratique mais il
donne de meilleurs rsultats en commande.
54
2.5.1.3
NEFCLASS
2.6
Conclusion
Les rseaux de neurones, de part la quantit des travaux de recherche et des ralisations existantes, prsentent un certain nombre de points forts. En premier lieu, ils constituent des approximateurs universels capables de modliser des systmes complexes avec
la prcision voulue partir dun jeu de donnes entres /sorties et un processus doptimisation. Leur capacit dapprentissage permet de simplifier la synthse dun contrleur
dans la mesure o lon obtient celui-ci par un simple rglage de paramtres sans quil soit
ncessaire de faire appel au modle mathmatique du systme commander. Dans le cas
de systmes complexes, cela reprsente un avantage indniable par rapport la plupart
des autres mthodes qui sattachent utiliser un modle mathmatique souvent imprcis
ou difficile obtenir. Cependant, linconvnient majeur rside dans le fait que lon ne peut
pas incorporer les connaissances des experts, qualifies dune certaine intelligence, et qui
peuvent tre utiles soit pour acclrer le processus dapprentissage, soit pour obtenir des
structures interprtables. Contrairement aux rseaux de neurones, les systmes flous fonctionnent base de ce type de connaissances et permettent dsormais une meilleure exploitation de lintelligence humaine pour accomplir des tches complexes. Dans ce mmoire,
les contrleurs que nous dveloppons sont base de ces systmes flous. Le problme
doptimisation de la structure et des paramtres de ces contrleurs, qui reste nanmoins
plus difficile dans de nombreux cas, sera tudi dans le prochain chapitre en utilisant les
algorithmes gntiques. Les rseaux de neurones vont intervenir, comme nous allons le
voir, uniquement dans le cas des systmes flous avec des rgles de type Sugeno.
Chapitre 3
Conception de contrleurs flous par
algorithmes gntiques
3.1
Introduction
Les difficults rencontres dans la conception des contrleurs flous(CF), ont guid les
chercheurs sorienter vers lutilisation des algorithmes gntiques cause de leur caractristique dexploration globale dans un environnement complexe. On rencontre souvent,
dans la littrature, trois stratgies dapplication des AG pour la conception des contrleurs
flous.
1. La base de rgles floues est bien dfinie et leurs fonctions de stratgies sont optimises par lAG
2. Les fonctions dappartenance associes aux variables dentres et de sorties sont
fixes et lAG est utilis pour loptimisation des conclusions des rgles floues.
3. Les fonctions dappartenance et les rgles floues associes sont optimises simultanment
Une reprsentation graphique de ces types de stratgies est indique dans la figure 3.1.
55
56
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
Dans notre travail, on sintresse la troisime stratgie, qui savre tre la plus efficace car, en toute logique, une mthode traitant globalement les diffrents paramtres
dun contrleur flou devrait donner de meilleures solutions.
Le chapitre est organis en trois parties. Dans la premire partie nous tudions loptimisation des paramtres dun CF de type Mamdani par algorithme gntique simple. Nous
examinons dabord les diffrents codages qui permettent de reprsenter les fonctions dappartenance et les rgles floues. Ensuite, nous prsentons la structure du chromosome et
les oprateurs gntiques adopts pour loptimisation simultane de lensemble des paramtres dun CF. Enfin pour mieux illustrer la mthode, nous traitons un exemple de
commande dun systme linaire de deuxime ordre.
Dans la deuxime partie, loptimisation des CF de Mamdani est effectue par les AGH.
Dans un premier temps, nous prsentons nos motivations pour lemploi de ce type dalgorithme. Ensuite, aprs la formulation de la structure du chromosome hirarchis, nous
dcrivons les oprateurs de mutation et de croisement qui sappliquent sur les gnes de
contrle du chromosome de lAGH. A la fin de cette deuxime partie, le mme problme
de commande est considr.
La troisime partie concerne loptimisation de contrleurs flous de type Sugeno par un
3.2
(3.1)
58
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
A22
A11
R11
R12
R1Ne
A12
..
.
R21
R22
..
.
R2Ne
Ri1 i2
..
.
R Ne 2
RNe Ne
A1i1
..
.
A1Ne
R Ne 1
A2i2
A21
A1Ne
re par les indices i1 et i2 est alors reprsente par un nombre Ri1 i2 dfini comme suit:
Ri1 i2 = j, j {1,2, ,Ns } si la conclusion de la rgle i1 i2 est Bj
Les paramtres de rglage dun tel contrleur (deux entres et une sortie) sont alors:
Deux facteurs dchelle en entre (Ge et Ge ) et un autre en sortie Gs .
Les fonctions dappartenance associes aux variables dentre et de sortie.
Les Ne Ne conclusions de la table de rgles.
Dans cette section, le rglage de ces paramtres sera tudi par les algorithmes gntiques simples. Comme ces derniers travaillent sur une population de chromosomes sur
lesquels sont cods les paramtres optimiser, il est ncessaire de dfinir la structure du
chromosome qui prend en compte lensemble des paramtres cits ci-dessus.
3.2.1
Dans un contrleur flou, les rgles floues sont appliques sur des termes linguistiques.
Ces termes, qui permettent de qualifier une variable linguistique, sont dfinis par lintermdiaire de fonctions dappartenance. Les paramtres optimiser sont donc dfinis en
deux tapes : on doit dabord dfinir les paramtres de chaque fonction dappartenance,
puis lensemble des paramtres des fonctions dappartenance qui constituent la partition
floue de la variable linguistique.
3.2.1.1
x 1 x < x2
x2 x1
x3 x
A (x) =
x 2 x < x3
x3 x2
0
ailleurs
(3.2)
On constate que cette fonction dpend des trois paramtres x1 , x2 et x3 qui prennent leurs
valeurs dans lintervalle [a,b], comme indiqu par la figure ci-dessous.
Cette fonction tant parfaitement dfinie par ces trois paramtres, on peut donc utiliser
la reprsentation suivante: o C[a,b] (xk ) est un code (binaire, rel, ..., etc) de la variable
xk qui prend ses valeurs dans lintervalle [a,b]. Les valeurs codes doivent satisfaire la
condition suivante:
x1 < x 2 < x 3
(3.3)
Dans un contrleur fou, chaque variable linguistique est dfinie par un ensemble de fonctions dappartenance des termes linguistiques, comme le montre la figure 3.4.
60
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
Ai
Ai
i
c(xA
1 ) c(x2 ) c(x1 )
n
c(xA
2 )
A la condition (3.3), on ajoute dautres contraintes sur la plage de variation des paramtres de chaque fonction dappartenance afin dobtenir un partitionnement la fois
continu et interprtable. Ces contraintes sont traduites par la double condition ci-dessous:
(
i
x2 i1 < xA
2
i1
i
i
xA
< xA
1 < x3
3
(3.4)
Dans (Guenounou et Belmehdi, 2006), en adoptant ce type de reprsentation pour la commande de la vitesse dune machine asynchrone, nous avons pu obtenir des rsultats satisfaisants et un contrleur flou comprenant une base de rgles lisible et smantiquement interprtable. Linconvnient majeur de cette reprsentation est quelle introduit un nombre
important de contraintes et de paramtres qui peuvent limiter lefficacit de la procdure
de recherche de paramtres optimaux. Lee (Lee et Takagi, 1993) et Yubaziki (Yubazaki et
al., 1995) ont propos une autre mthode de partitionnement pour laquelle le nombre de
paramtres requis est rduit de manire significative (un rapport de 3 pour les fonctions
dappartenance de type triangulaire). Leur mthode repose sur lide de faire partager le
mme paramtre par plusieurs fonctions dappartenance.
La figure 3.5 illustre un exemple de partitionnement avec 5 fonctions dappartenance selon cette mthode.
Une partition floue comportant n termes linguistiques est compltement dfinie par
lintermdiaire de n points (x1 = a, x2 , , xn = b) en utilisant les fonctions dappartenance suivantes:
1
x < x1
x x
2
x 1 x < x2
A1 (x) =
x2 x1
0
x x2
x xi1
xi1 x < xi
xi xi1
xi+1 x
Ai (x) =
xi x < xi+1 i = 2, ,n 1
xi+1 xi
0
ailleurs
0
x < xn1
xx
n1
xn1 x < xn
An (x) =
x
n
n1
1
x xn
La partition floue peut tre donc reprsente par le codage de (n 2) points:
c[a,b] (x2 )
c[a,b] (xi )
c[a,b] (xn1 )
(3.5)
62
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.1.2
Une fonction dappartenance trapzodale dans un univers du discours fini [a,b] peut
tre dfinie par:
x x1
x2 x1
1
A (x) =
x4 x
x4 x3
x 1 x < x2
x2 x < x3
(3.6)
x 3 x < x4
ailleurs
Cette fonction est dfinie par quatre paramtres x1 , x2 , x3 et x4 qui prennent leurs valeurs
dans lintervalle [a, b].
La figure 3.6 illustre cette fonction, elle ncessite un paramtre de plus par rapport la
fonction triangulaire. En effet cette dernire est un cas particulier de la fonction trapzodale (lorsque x2 = x3 ).
(3.7)
La figure ci-dessous illustre un exemple de partitionnement flou avec 5 fonctions dappartenance trapzodales selon lide de Lee et Yubaziki.
Plus gnralement, une partition floue avec n fonctions trapzodales est dfinie par
2n paramtres (a = x1 , x2 , , xn = b) et par les quations suivantes:
1
x 1 x < x2
x x
3
x 2 x < x3
A1 (x) =
x3 x2
0
x x2
x x2i2
x2i1 x2i2
Ai (x) =
1
x2i+1 x
x2i+1 x2i
x < x2i2
x2i2 x < x2i1
x2i1 x < x2i
i = 2, ,n 1
0
x < x2n2
xx
2n2
x2n2 x < x2n1
An (x) =
x
2n1 x2n2
1
x x2n1
Dans ce cas,la reprsentation est:
c[a,b] (x1 )
c[a,b] (xi )
c[a,b] (x2n1 )
(3.8)
64
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.1.3
(x c)2
exp(
) x<c
2g2
A (x) =
(3.9)
(x c)2
exp(
) xc
2d2
Pour calculer cette fonction dappartenance, nous utilisons deux fonctions gaussiennes
possdant le mme centre c mais deux variances diffrentes (g2 et d2 ). La premire gaussienne est utilise lorsque la valeur dentre est infrieure la moyenne, et la deuxime
dans le cas oppos. Ceci permet de dfinir une fonction dappartenance asymtrique (voir
la figure 3.8) et dtre moins restrictif sur la classe des systmes flous que nous pouvons
reprsenter.
La reprsentation dune fonction gaussienne asymtrique est alors donne par le code
suivant:
Lorsquon utilise des termes linguistiques caractriss par des fonctions gaussiennes
asymtriques pour reprsenter une variable linguistique sur un univers de discours [a,b],
il est possible, comme dans le cas des fonctions triangulaire et trapzodale, de simplifier
la reprsentation en imposant des conditions sur les variances de chaque gaussienne:
(
g,i = d,i1
(3.10)
d,i = g,i+1
o g,i et d,i dsignent respectivement les variances gauche et droite de la ime gaussienne.
La figure ci-dessous montre un exemple de partitionnement avec 5 gaussiennes asymtriques quon peut obtenir en tenant compte de la condition 3.10.
(ci+1 ci )2
8 ln(i )
(3.11)
Une partition comportant n termes linguistiques peut tre alors reprsente par:
C(1 ) C[a,b] (c2 ) C(2 )
66
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.2
Comme nous venons de le voir, une variable linguistique est reprsente par un certain
nombre de paramtres qui dpendent la fois du nombre et du type de fonctions dappartenance utilises. Pour coder ces diffrents paramtres, on utilise souvent les chanes
binaires et les chanes relles.
Lorsque le nombre de paramtres est rduit et leurs plages de variations bien dfinies,
un algorithme gntique avec un codage binaire est largement suffisant pour retrouver les
paramtres optimaux. Par contre si le nombre de paramtres devient important, et que
lintervalle de variation de chaque paramtre nest pas bien connu, le codage rel est le
plus appropri. En ce qui concerne lutilisation du codage en base n, il y a eu trs peu de
travaux sur le sujet (Homaifar et MCCormick, 1993; Ng et Li, 1994). Le seul intrt est
de disposer dun type de codage homogne pour tous les paramtres du contrleur que
lon souhaite optimiser. Homaifar (Homaifar et MCCormick, 1993) a opt pour ce codage afin de reprsenter dans un mme chromosome les conclusions des rgles floues et
les paramtres de la fuzzification (paramtres des fonctions dappartenance associes aux
variables dentres). Nous verrons dans la suite de ce mmoire, quil est possible de regrouper les diffrents paramtres (paramtres des fonctions dappartenance, rgles floues
et facteurs dchelle) dans un mme chromosome, sans quil soit ncessaire dutiliser le
mme codage.
3.2.3
Pour reprsenter lensemble des rgles du contrleur flou de la figure 3.2, on rorganise le tableau 3.1 en une liste de valeurs en le balayant ligne par ligne. Cela fournit
comme reprsentation:
R11
R12
R1Ne
R21
R22
RNe Ne
Afin de permettre un traitement par les algorithmes gntiques, chaque lment Rij de
la reprsentation ci-dessus doit tre cod pour tre insr dans un chromosome. Plusieurs
types de codage peuvent tre adopts.
3.2.4
3.2.4.1
Le codage binaire
Avec ce type de codage, la base de rgles est reprsente par une chaine binaire,
chaque lment Rij de la reprsentation tant cod sur m bits. Nous avons vu quun
lment Rij prend ses valeurs dans lensemble {1,2, ,N s}, o Ns dsigne le nombre
de termes linguistiques associs la variable de sortie u. Une sous-chaine dcrivant
une de ses valeurs doit donc comporter au minimum m = E(log2 (N s + 1)) bits, E(x)
dsignant la partie entire de x. Quand (Ns +1) nest pas une puissance de deux, certaines
configurations binaires ne constituent pas un codage valide. On doit alors ajouter une
condition sur la valeur reprsente par la sous-chaine binaire, qui doit tre infrieure o
gale Ns . Cette condition, quil faut tester chaque fois que lon ralise une opration
sur la chane binaire (croisement ou mutation), constitue un des principaux inconvnients
de lemploi du codage binaire.
3.2.4.2
Le codage rel
Ce type de codage est rarement utilis pour loptimisation des rgles floues de Mamdani cause de la nature des conclusions quelles prsentent. Par contre, comme nous le
verrons plus loin, ce codage sadapte facilement aux rgles de type Sugeno.
3.2.4.3
Codage en base n
Cest le codage le plus utilis pour la reprsentation des rgles floues de Mamdani
(Zhou et Lai, 2000; Cheong et Lai, 2000). Dans larticle (Homaifar et MCCormick, 1993),
Homaifar dcrit une procdure doptimisation des rgles floues dun contrleur dont les
sorties sont partitionnes en 5 valeurs linguistiques. Le nombre 6 (5+1) ntant pas une
puissance de deux, il propose dutiliser un codage en base 6, ce qui permet de coder
efficacement les 5 valeurs possibles de la conclusion dune rgle floue.
68
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.5
Structure du chromosome
Dans le paragraphe prcdent, nous avons prsent les mthodes de codage des paramtres permettant loptimisation des fonctions dappartenance et la base de rgles dun
contrleur flou de Mamdani. Prenant appui sur ces diffrentes mthodes, nous proposons
un codage mixte, qui permet de reprsenter simultanment les rgles floues, les paramtres de fonctions dappartenance et les facteurs dchelle. Le chromosome de lAG
ainsi obtenu est divis en trois parties: une premire partie, code en base n, reprsente
les conclusions des rgles floues, une deuxime partie, code en nombres rels, reprsente
les paramtres des fonctions dappartenance et une troisimes partie, code en binaire, reprsente les facteurs dchelle en entre et en sortie. Cette structure est reprsente par la
figure 3.10.
3.2.6
Oprateurs gntiques
Puisque sur le mme chromosome, il existe trois types de chanes: chane en base
n, chane relle et chane binaire, il convient alors de spcifier pour chacune delle les
oprateurs gntiques permettant une meilleure exploration de lespace de recherche.
3.2.6.1
Oprateur de Croisement
Croisement en base n
Nous utilisons un croisement en deux points standard comme sil sagissait de chaines
binaires.
Croisement des chanes relles
Dans ce cas, on a le choix entre un croisement standard et un croisement arithmtique.
3.2.6.2
Oprateur de Mutation
Ri1 i2 =
si Ri1 i2 = 1
N 1
si Ri1 i2 = Ns
s
(3.12)
70
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.7
NP
PP
PM
PG
NG
NM
NP
PP
PM
PG
Dans le tableau 3.2, nous avons reprsent lensemble des rgles floues dfinies par le
modle de rgles de Macvicar-Whelan pour le contrleur flou considr (partitionnement
avec 7 fonctions dappartenance). Dans le cas gnral (partitionnement avec un nombre
quelconque de fonctions), une description dtaille de la procdure de gnration des
rgles, selon lapproche de Macvicar-Whelan, peut tre trouve dans louvrage de Yager
(Yager et Filev, 1994).
3.2.8
Exemple dapplication
Dans cette section, nous allons tester les performances de la mthode propose sur un
exemple de commande dun systme linaire de second ordre utilis dans (Cheong et Lai,
2000).
La fonction de transfert de ce systme est donne par :
G(p) =
2
p(p + 1.4) + 2
(3.13)
La figure 3.11 montre la rponse indicielle du systme en boucle ferme (sans contrleur),
obtenue sous Matlab en utilisant la mthode dintgration de Runge Kutta dordre 4 une
priode dchantillonnage de 0.1s.
72
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
univers de discours normalis [+1, 1]. Ce dernier est partitionn en sept sous ensembles
flous {N G, N M, N P, EZ, P P, P M, P G}. Les fonctions dappartenance retenues pour
lensemble des variables du contrleur sont de type gaussiennes asymtriques. Le traitement des rgles floues, qui sont 49 au total, est effectu par la mthode MIN-MAX. La
grandeur de sortie du contrleur est gnre par la mthode de centre de gravit.
3.2.8.1
Critres de performance
En gnrale, lobjectif dun systme de commande est de minimiser lcart e(t) entre
la sortie dun systme et une valeur de consigne dsire. Cet cart peut tre d, soit un
changement de consigne, soit des perturbations agissant sur le systme. Pour choisir un
bon rglage du rgulateur, on prend en compte lamplitude maximum de lcart et la dure
ncessaire pour quil sannule aprs une perturbation ou un changement de consigne. Il
existe plusiers critres numriques permettant de mesurer la qualit dun rglage donn.
Parmi ces critres on peut citer:
Critre de lintgrale du carr de lerreur (ISE):
ISE =
L
X
[e(n.t)]2
(3.14)
n=0
o t et n sont respectivement la priode dchantillonnage et lindice dchantillon. [0, L] est lintervalle sur lequel est calcul le critre. En pratique, la valeur
de L est choisie de manire que lintervalle [0, L] contienne suffisamment le rgime
transitoire
Critre de lintgrale de la valeur absolue de lerreur(IAE):
IAE =
L
X
|e(n.t)|
(3.15)
n=0
L
X
(n.t) |e(n.t)|
(3.16)
n=0
smax sf inal
100%
sf inal sinitial
(3.17)
Dans (Dorf et Bishop, 1995) on peut trouver une liste exhaustive de critres de performance dun systme de commande. Par la suite nous retiendrons ces deux derniers critres (IT AE et Dep). Ces critres permettent de conclure que le systme de commande
est dautant meilleur que les valeurs de IT AE et Dep sont plus faibles. Il sagit donc
dun problme de minimisation. Pour un algorithme gntique, ces critres vont servir
pour obtenir une fonction objectif exploitable par le processus slection.
3.2.8.2
Paramtres de lAG
Lalgorithme gntique exploitant le codage mixte des paramtres dcrits prcdemment doit permettre doptimiser simultanment les paramtres des fonctions dappartenance, les facteurs dchelle et les conclusions des rgles floues. Pour se faire, on doit
choisir soigneusement les valeurs des paramtres rgissant lvolution de la population
traite par cet algorithme gntique : taille de la population, probabilites de croisement
et de mutation. Dans ce travail, aprs une srie de tests, nous avons opt pour les paramtres du tableau 3.3
TAB . 3.3 Paramtres de lAGs
Chromosome de lAG standard
Reprsentation
Rgles floues
fonction dappartenance
facteurs dchelle
En base 8 (1, 2, , 7)
Relle
Binaire
Probabilit de croisement
Probabilit de mutation
0,65
0.01
0.01
Taille de la population
40
Nombre de gnrations
500
3.2.8.3
0.02
Fonction Objectif
74
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
Ob1 = IT AE
(3.18)
Ob2 = Dep
(3.19)
Par ces deux critres, il est possible de minimiser lerreur en rgime permanent par lemploi de (IT AE) et de pnaliser les dpassements qui peuvent apparaitre durant le rgime
transitoire (en minimisant IT AE) par lemploi du critre (Dep).
3.2.8.4
Mthodes de slection
Nous avons vu, dans le chapitre 2 que la rsolution dun problme doptimisation
multi-objectif base dalgorithmes gntiques peut se faire selon deux approches: agrgative (approche non Pareto) et non agrgative (approche de Pareto).
Si on utilise comme mthode de rsolution, la premire approche, il devient alors ncessaire de combiner les deux objectif Ob1 et Ob2 en un seul objectif Ob reprsentatif,
soit :
Ob = 1 Ob1 + 1 Ob2
(3.20)
3.2.8.5
Les rsultats obtenus sont illustrs par les figures 3.12 3.15. La figure 3.12 montre
les fonctions dappartenance correspondantes au meilleur chromosome de la poulation
initiale. les valeurs des facteurs dchelle sont donns par le tableau 3.4.
76
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
TAB . 3.6 Base de rgle gnre partir du meilleur chromosome de la 210 me gnration
u
e
NG NM
NP
EZ PP
PM
PG
NG
NM
NP
EZ
PP
PM
PG
78
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.2.8.6
La figure 3.17 montre la rpartition des solutions de la premire population dans lespace objectifs (Ob1 : IT AE et Ob2 : Dep).
Il faut noter que ce sont, ces mmes solutions qui ont t utilises par lAGS prcdent
(slection par tournoi). On retrouve alors sur la figure, la meilleure solution obtenue prcdemment et qui se trouve sur lune des extrmits du front de Pareto. De gnration en
gnration le NSGA-II tend regrouper les populations autour du front de Pareto, tout en
minimisant les deux objectifs Ob1 et Ob2 . Ceci est bien illustr par les figures 3.18 qui reprsente deux chantillons de populations obtenus au cours du processus doptimisation.
A la 500me gnration nous avons une rpartition meilleure des solutions. Sur le
front de Pareto, nous avons dune part un dpassement qui est pratiquement nul (dordre
104 ) pour toutes les solutions et dautre part une amlioration trs remarquable du critre
ITAE qui atteint des valeurs optimales comprises entre 28,55 et 28,79.
80
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
La figure 3.20 donne la rponse du systme pour une solution de test (voir carr bleu
de la figure 3.19) prise dans le front de Pareto. Nous avons un suivi de consigne satisfaisant (IT AE = 28.56, Dep = 0.12%). Les paramtres du contrleur correspondant sont
donns par la figure 3.21 et les tableaux 3.7 et 3.8.
NP
EZ PP
PM
PG
NG
NM
NP
EZ
PP
PM
PG
82
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.3
rarchiss
Nous avons vu, dans le deuxime chapitre, que les algorithmes gntiques hirarchiss prsentent des proprits plus intressantes que les AG standards quand on sintresse
loptimisation de la structure dun systme plutt qu loptimisation seule de ses paramtres. Pour le cas du contrleur flou, loptimisation structurelle consiste gnralement
soit optimiser le nombre de fonctions dappartenance de chaque variable du contrleur
(Acosta et Todorovich, 2003; Tang et al., 1998), soit optimiser le nombre de rgles
floues dans la base de rgles (Belarbi et al., 2005). Pour la premire approche, nous avons
vrifi travers deux applications diffrentes (Guenounou et Belmehdi, 2006; Guenounou
et al., 2006) quun partitionnement avec 5 ou 7 fonctions dappartenance est largement
suffisant pour obtenir une rgulation ou une poursuite de trajectoire satisfaisante. Quand
la deuxime approche, celle-ci nous semble plus importante, car la minimisation du
nombre de rgles permet dune part de rduire la complexit du contrleur et dautre part
de minimiser les charges de calcul, ncessaires pour valuer la sortie du contrleur, des
essentiellement au nombre de rgles quil faut vrifier chaque pas dchantillonnage.
Dans la suite de ce travail nous nous intressons cette dernire approche, non seulement
pour lintrt quelle prsente, mais galement pour remdier linconvnient de la premire mthode doptimisation, dcrite prcdemment. En effet, cette mthode permet de
gnrer dans beaucoup de cas une base de rgles brouille contenant des rgles qui nont
pas de sens.
83
Un exemple dune telle base est reprsent par les tableaux (a) et (b) de la figure 3.22.
Ces deux tableaux correspondent bien aux bases de rgles obtenues (tableau 3.6 et tableau
3.8) la fin du processus doptimisation pour les deux mthodes de slection considres
(tournoi et NSGA-II). Les cellules entoures correspondent aux conclusions des rgles
contradictoires avec le sens commun et le modle de rgles de Macvicar-Whelan.
3.3.1
Le codage que nous proposons cette fois ci (voir figure 3.23) diffre de celui de la
figure 3.10, par la prsence de gnes de contrle dans la nouvelle structure, et qui ont
comme rle lactivation ou la dsactivation des rgles floues. Le nombre de gnes de
contrle est gal la dimension initiale de la base de rgles: chaque rgle on fait correspondre un gne de contrle. Quand " 1 " est assign au gne de contrle (z i ), la rgle
floue correspondante devient active. Dans le cas contraire (un" 0 " est assign au gne
de contrle), cette rgle devient inactive (i.e limine de la base de rgles du contrleur).
Pour un contrleur deux entres et une seule sortie (figure 3.2) le nombre de gnes de
contrle est gal K = Ne Ne .
Ainsi, si z i = 0, i = 1,2, ,K, aucune rgle nest active dans la base de rgles du
contrleur, dans ce cas, le contrleur ne peut fournir une commande.
Pour contourner cette singularit, nous introduisons la contrainte suivante :
K
X
z i lr
(3.21)
i=1
avec lr le nombre minimal de rgles actives dans la base de rgles du contrleur flou.
F IG . 3.23 Structure du chromosome de lAGH appliqu pour loptimisation des paramtres dun CF
84
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.3.2
Oprateurs gntiques
3.3.3
85
nombre minimal de rgles actives. Cet objectif se traduit par une simple sommation des
gnes de contrle:
Ob2 =
K
X
zi
(3.22)
i=1
3.3.4
Pour valuer les performances du contrleur flou optimis par les AGH, des tests de
simulation ont t raliss sur le mme systme trait prcdemment par les AGS.
Nous avons considr le mme type et le mme nombre de fonctions dappartenance
pour dfinir les variables du contrleur sur leur univers de discours. Nous avons conserv
galement la mme procdure dinitialisation des chromosomes, les gnes de contrle
qui constituent ici une partie supplmentaire et qui prennent leur valeur dans lensemble
{0,1} sont initialiss par un processus alatoire o lon accorde plus de probabilit un
qu zro. De cette faon, on gnre initialement des solutions qui considrent un nombre
important de rgles floues de la base du contrleur.
Deux objectifs sont considrs:
Minimisation de lintgrale de lerreur absolue temporelle (ITEA) et le dpassement
Dep.(equation 3.20 avec = 50)
Minimisation de rgles floues (quation 3.22)
Les paramtres de LAGH sont ceux du tableau 3.3, dfinis prcdemment pour les AGS,
auxquels il faut ajouter la probabilit de mutation (pmc = 0.005) et de croisement (pcc =
0.45) des gnes de contrle et le nombre minimal (lr = 20) de rgles conserver dans la
base de du contrleur.
La figure 3.24 donne la rpartition sur le plan des objectifs (Ob1 , Ob2 ) des solutions de la
dernire gnration. On constate un regroupement des solutions autour du front de Parto.
Les quelques solutions qui se trouvent loignes du front de Pareto, sont dues principalement aux effets de la mutation et du croisement des gnes de contrle, qui peuvent tre
nocifs dans certains cas en dsactivant des rgles pertinentes et/ou en activant des rgles
incohrentes. Cest dailleurs la raison pour laquelle, les probabilits dapplication des
ces oprateurs ont t fixes des valeurs relativement faibles par rapport celle dun
algorithme gntique simple.
86
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
La figure 3.25 reprsente les solutions constituant le front de Pareto. Tout dabord il y
a lieu de constater que les deux objectifs Ob1 et ob2 sont contradictoires car en diminuant
le nombre de rgles, lobjectif Ob1 tend se dtriorer, notamment partir de moins de 20
rgles. Dautre part il faut noter que certaines configurations pour lesquelles nous avons
plus de 26 rgles actives (Ob2 > 26) ne font pas partie de ce front. Au-del de 26 rgles il
est difficile dapporter une amlioration lobjectif Ob1 , cest--dire dobtenir une valeur
de lobjectif Ob1 infrieur 27,367.
87
La figure 3.26 donne la rponse du systme correspondante une solution prise dans
le front de Pareto.
88
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
Avec uniquement 22 rgles (voir le carr bleu de la figure 3.25), nous avons des performances trs semblables celles obtenues en considrant la totalit des rgles floues
de la base du contrleur. Les diffrents paramtres correspondants cette solution sont
illustrs par la figure 3.27 et les tableaux 3.9 et 3.10
TAB . 3.9 Facteurs dchelle
Ge
Ge
Gs
2,015 18.541 0.162
3.4
NP
EZ PP
PM
NM
NP
EZ
4
5
PP
PM
PG
PG
5
6
geno
La conception de contrleurs flous de types Sugeno par algorithmes gntiques (AGS
ou AGH) peut se faire de la manire expose prcdemment pour le cas du contrleur
de type Mamdani. Tout ce qui change est le codage des conclusions des rgles floues qui
sont de nature diffrente pour les deux types de contrleurs. En effet avec un contrleur
flou deux entres et une seule sortie tel quillustr par la figure 3.2, les rgles floues de
Sugeno sont dcrites par:
Rgle i1 ,i2 : Si (e est A1i1 ) ET (e est A2i2 ) Alors u = ai01 i2 + ai11 i2 e + ai21 i2 e
o ai01 i2 , ai11 i2 et ai21 i2 sont les paramtres associs la Rgle i1 ,i2 .
Dans ce cas, la conclusion dune rgle peut tre dfinie par les trois paramtres: a0 , a1 et
89
a2 .
Tenant compte de cette considration, loptimisation par algorithme gntique de lensemble des paramtres du CF de Sugeno peut tre obtenue partir des structures illustres
par la figure ci-dessous.
La partie suprieure de la figure correspond une structure simple qui fait intervenir
deux type de reprsentation: binaire pour les facteurs dchelle et relle pour le reste des
paramtres (paramtres des fonctions dappartenance et rgles floues). Dans la partie infrieure de la figure, la structure est un peu diffrente, elle prsente un niveau de gnes de
contrle supplmentaire qui a pour rle lactivation ou la dsactivation des rgles floues.
En exploitant ces structures, il est tout fait possible daboutir des rsultats semblables
ceux prsents dans les deux sections prcdentes. Toutefois linconvnient majeur de
cette mthode rside dans le fait que lon ne dispose pas de modle de rgles comme pour
le cas des contrleurs de Mamdani, pour initialiser la base de rgles du contrleur et qui
peut, par consquent, rendre la procdure de recherche couteuse en temps. Pour remdier
cet inconvnient, nous avons propos dans (Guenounou et al., 2009) une mthode dinitialisation en utilisant lalgorithme de rtropropagation du gradient. Comme ce dernier
sadapte mieux des structures multicouches (rseaux de neurones), le contrleur flou
est donc transform en un rseau multicouche (rseau neuro-flou) avant toute procdure
doptimisation. Dans ce qui suit, nous allons prsenter la structure du rseau neuro-flou
90
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.4.1
Le rseau neuro-flou propos est une architecture cinq couches qui comprend les
lments dun systme flou de type Sugeno. Pour ne pas rester dans le cas dun contrleur
deux entres, nous considrons cette fois ci un cas plus gnral avec un rseau r
entres [x1 , x2 , x3 , ..., xr ] et une sortie y. En considrant la figure 3.29, explicitons le
fonctionnement du rseau, couche par couche.
3.4.1.1
Aucune fonction nest ralise avec les neurones de cette couche. Chaque neurone
transmet le signal dentre vers la deuxime couche.
Oi1 = u1i ,
u1i = xi
(3.23)
3.4.1.2
91
Les neurones de cette couche correspondent aux termes linguistiques (sous ensembles
flous) associs aux variables dentre du contrleur. La sortie de chaque neurone fournit
le degr dappartenance dune variable dentre au sous ensemble flou correspondant ce
neurone. Elle est donne par :
Oi2
(u2i ci )2
= exp(
)
2i2
O11
if i = 1,2,...,n1
if i = n1 + 1,...,n1 + n2
O2
2
ui =
Oj1 if i = n1 + .. + nj1 + 1,...,n1 + .. + nj
O1 if i = n + .. + n
1
r1 + 1,...,n1 + .. + nr
r
(3.24)
(3.25)
3.4.1.3
Chaque neurone de cette couche correspond une rgle floue de la base de rgles.
Ses entres proviennent de tous les neurones de la deuxime couche qui participent dans
la partie prmisse de la rgle. La sortie de chaque neurone reprsente le degr de vrit
dune rgle, qui peut tre obtenu partir de:
Y
Oi3 =
u3j , u3j = Oj2 ,i = 1,2...K
(3.26)
3.4.1.4
aij
92
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.4.1.5
O5 =
Oj3 Oj4
j=1
K
X
(3.28)
Oj3
j=1
3.4.2
Dans cette section, nous allons prsenter lalgorithme hybride propos pour lapprentissage (i.e optimisation) de la structure du rseau neuro-flou. Le principe de cet algorithme est trs simple: il consiste utiliser dans un premier temps lalgorithme de rtropropagation pour un ajustement de paramtres et dans un second temps un algorithme
gntique hirarchis pour un deuxime ajustement de paramtres tout en minimisant le
nombre de rgles floues.
3.4.2.1
(3.29)
o y(t)d et y(t) sont respectivement la sortie dsire et la sortie actuelle du rseau neuroflou.
Ladaptation des paramtres aij correspondant aux conclusions des rgles floues peut tre
obtenue par lquation ci-dessous:
aij (t + 1) = aij (t) 1
J(t)
aij (t)
(3.30)
avec
J(t)
Oi3 xj
d
=
(y(t)
y
(t))
K
aij (t)
X
Ok3
93
(3.31)
k=1
J(t)
ci (t)
(3.32)
la driv du critre J(t) par apport ci peuvent tre obtenue partir de la dcomposition
ci-dessous :
J(t)
J(t) Oi2
=
ci (t)
Oi2 ci (t)
P
O3 (O1 ci )Oi2
= ( k k3 k2 )( l 2
)
Oi
i
(3.33)
avec
Ok4
k3 =
E(t + 1)
= (y(t + 1) y d (t + 1))
3
Ok
K
X
Oj3
j=1
K
X
Oj3 Oj4
j=1
K
X
(
Oj3 )2
(3.34)
j=1
et
Ok3 Y 2
Oj
=
Oi2
j6=i
(3.35)
Les quations dadaptation du paramtre i peut tre obtenues de la mme manire que
celles de ci et elles sont omises.
3.4.2.2
Une fois que les paramtres des fonctions dappartenance et ceux des rgles floues
sont obtenus, un algorithme gntique hirarchis peut tre appliqu pour un deuxime
rglage des paramtres tout en minimisant le nombre de rgles floues initiales. Lalgorithme fonctionne de manire identique celui dcrit dans la section 3.3 pour le cas dun
contrleur flou de type Mamdani. La seule diffrence rside dans ltape de gnration des
chromosomes composants la premire population. Pour mieux comprendre cette tape,
dans ce cas, nous la dtaillons ci-dessous travers un exemple dapplication.
94
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
3.4.3
Exemple
3.4.3.1
Modle de simulation
Le systme non linaire modliser est dcrit par lquation aux diffrences suivante :
y(k) = [
(3.36)
Nous avons choisi larchitecture srie-parallle car elle est considre comme plus stable
vu que le rseau est rgulirement recal en utilisant ltat rel du processus. Le modle
possde trois entres u(k 1), y(k 1) et y(k 2) de trois ensembles flous {N,Z,P }
chacune, 27 rgles floues correspondantes aux diffrentes combinaisons des ensembles
flous et une sortie y(k).
3.4.3.2
Rsultats de simulations
Premire phase
Dans cette premire phase, lalgorithme de retropropagation est utilis pour ladaptation
des paramtres des fonctions dappartenance et des rgles floues. Une base de donnes
de 500 points, gnrs partir de lquation (3.36) et une entre u(k) uniformment rpartie dans lintervalle [2,2], a t considre. Les paramtres de lalgorithme sont fixs
comme suit :1 = 0.12 et 2 = 0.05. Les paramtres des fonctions dappartenance et des
rgles floues rsultants sont rapports dans les tableaux 3.11 et 3.12 respectivement.
TAB . 3.11 Paramtres des fonctions dappartenance obtenus par rtropropagation
N
u(k 1)
-1.5183
1.2645
-0.0560
1.0001
1.3972
1.3857
y(k 1)
-2.2635
1.1603
2.1290
1.2138
5.2837
1.8343
y(k 2)
-2.1265
1.1331
2.6931
1.5531
5.8363
1.6604
95
ai1
ai2
ai3
0.3819
-1.0990
0.5643
0.5282
0.1331
0.9036
-0.3076
0.0405
0.0375
-0.2100
0.4020
0.1568
-1.2384
1.2754
-0.2871
0.0209
-0.1550
0.7130
0.8397
-0.3301
-0.3562
0.1647
-0.0110
-0.1022
-0.2726
0.2397
-0.0472
-0.1973
0.2389
-0.0889
0.1119
0.0297
0.3798
0.5519
0.1797
0.2498
10
0.8673
0.6258
0.2077
-0.0758
11
-0.6847
1.0613
-0.0703
-0.2491
12
0.0319
-0.4731
0.1814
-0.1433
13
-0.9350
0.3343
-0.8489
-0.2357
14
0.5132
0.5598
0.8888
0.0130
15
0.3603
0.3775
0.3822
0.2313
16
-0.2939
-0.1890
0.2667
-0.3359
17
0.0990
-0.1465
0.1275
0.6254
18
0.1049
0.0452
0.4170
0.1453
19
1.5562
0.8578
0.4061
0.0614
20
0.2563
0.6218
0.0918
-0.1722
21
-0.1096
-0.0101
-0.0462
-0.3373
22
-0.1032
1.0483
-0.5471
0.4047
23
0.9238
0.7215
0.5852
0.3663
24
0.0615
0.7278
0.3912
0.0250
25
0.2687
0.2973
-0.2713
-0.0743
26
-0.2067
-0.0493
0.5624
1.1994
27
0.2293
0.1330
0.2190
0.7235
u(k 1)
y(k 1)
y(k 2)
4
5
Deuxime phase
Une fois la premire phase termine, le NSGA-II est utilis pour un deuxime ajustement
des paramtres. Deux objectifs ont t fixs :
1. Minimisation de lerreur quadratique moyenne dfinie par :
Ob1 =
N
1 X d
(y (k) y(k))2
N k=1
(3.37)
96
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
(3.38)
Le rsultat de simulation obtenu est donn par la figure 3.33. On constate que le rseau
neuro-flou ralise une bonne approximation du systme avec une erreur quadratique mo-
97
yenne de 2,69.103 . Pour ce rsultat, nous avons choisi les paramtres relatifs au chromosome appartenant au front de Parto de la population finale et indiqu par un triangle.
Dans ce chromosome, uniquement 6 rgles floues ont t considres, le reste (21 rgles)
est dsactiv par les valeurs prises par les gnes de contrle (les gnes de contrle correspondant sont nuls).
98
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
u(k 1)
-1.4652
1.7419
-0.2416
1.9084
0.9720
1.5988
y(k 1)
-2.0775
1.1299
2.1737
1.0939
y(k 2)
-1.6944
1.1538
2.7835
1.7626
5.6253
2.1412
u(k 1)
y(k 1)
y(k 2)
ai0
ai1
ai2
ai3
-1.1995
0.7939
-0.1907
0.0211
0.1951
0.7252
0.8052
-0.2866
10
0.9245
0.9832
0.2813
0.0423
13
-1.2289
1.0474
-0.5949
-0.1234
21
-0.0420
0.1193
-0.3753
0.2551
23
1.2833
0.6592
0.4041
0.2518
3.5. CONCLUSION
99
rglage des fonctions dappartenance. Aussi le tableau (3.15) prsente une tude comparative avec dautres approches de modlisation utilisant les rgles floues de type Takagi
Sugeno. Dans (Wang et Langari, 1996), les fonctions dappartenance sont obtenues par
lalgorithme de classification floue fuzzy c-mean alors que les paramtres relatifs aux
rgles floues sont estims par la mthode des moindres carrs. Cest encore cette dernire
mthode qui est combine avec lalgorithme de rtropropagation dans lapproche de Jang
(1993). Les rsultats obtenus, montrent que les performances de notre approche sont suprieures celles des autres modles mme avec un nombre rduit de rgles floues. Il est
aussi important de noter que notre algorithme hybride aboutit un ensemble de solutions
optimales en sens de Pareto au lieu dune unique solution, ensemble qui pourra tre filtr
et affin par lutilisateur.
TAB . 3.15 Comparaison avec dautres modles
Structure
Variables dentre
Notre modle
EQM
EQM
Nombre de rgles
(Apprentissage)
(test)
0.00520
0.00269
u(k 1)
0.00469
0.00260
y(k 1)
11
0.00372
0.00250
y(k 2)
16
0.00295
0.00189
22
0.00245
0.00179
22
0.00357
0.00214
12
0.01321
0.01200
0.00980
0.01150
Modle de Mamdani
u(k 1)
y(k 1)
y(k 2)
Modle de Sugeno
u(k 1)
(Jang, 1993)
y(k 1)
y(k 2)
Modle de Sugeno
u(k 1)
y(k 1)
y(k 2)
3.5
Conclusion
Dans ce chapitre nous avons dcrit les trois mthodes proposes pour la conception
dun contrleur flou par algorithmes gntiques.
Nous avons donc prsent dans un premier temps la mthode de synthse dun contrleur
flou de type Mamdani base sur un algorithme gntique simple. Cette mthode consiste
en loptimisation simultane des fonctions dappartenance, de la base de rgles et des facteurs dchelle. Pour cela, nous avons dabord propos une mthode de reprsentation de
lensemble des paramtres du contrleur. Cette reprsentation fait intervenir trois types de
100
CHAPITRE 3. CONCEPTION DE CONTRLEURS FLOUS PAR ALGORITHMES
GNTIQUES
Chapitre 4
Application un bioprocd
4.1
Introduction
Dans ce chapitre, nous allons dabord dcrire le procd de fermentation sujet de notre
application et le modle retenu pour sa conduite. Ensuite nous allons procder lapplication des approches de commande dveloppes dans le chapitre prcdent.
La bio-industrie a connu ces dernires annes un progrs considrable. Une grande diversit de produits (alcools, protines, enzymes, pesticides, antibiotiques,..etc.) sont aujourdhui obtenus par fermentation.
Le but recherch dans ce domaine suivant dun point de vue automatique est loptimisation de la productivit, lamlioration de la qualit des produits et la dtection prcoce des
anomalies de fonctionnement, par la surveillance et la conduite automatique des bioracteurs.
Les procds biotechnologiques tels que la fermentation sont des procds complexes
cause du caractre vivant du processus. Ils sont non linaires, non stationnaires et caractriss par un manque de capteurs fiables et /ou peu coteux. Cependant, les performances
des mthodes classiques de commande se dgradent dautant plus que la dynamique du
modle utilis sloigne de celle du procd.
101
102
4.2
Procd de fermentation
La fermentation microbienne est un procd qui a pour finalit de faire crotre une
population de micro-organismes (levures, bactries, champignons, etc.) aux dpens de
certains substrats carbons, lintrieur dun bioracteur soumis des conditions environnementales (temprature, pH, aration, etc.) variable celon le rsultat voulu. Chaque
type de micro-organismes possde des caractristiques lies son matriel gntique et
ses mcanismes de rgulation interne. Ainsi, la fermentation peut avoir diffrentes utilisation:
Production de micro-organismes: lobjectif premier est la croissance de la masse
cellulaire elle-mme. Cest le cas des cultures visant produire la levure de boulanger.
Production mtabolique: dans ce cas, cest la production de substances organiques
rsultantes de lactivit mtabolique qui est favorise (alcools, antibiotiques, etc.)
Consommation du substrat: ici, cest la dgradation du substrat qui est privilgie.
On retrouvera dans cette catgorie les procds de dpollution (traitement biologique des eaux uses)
A titre dexemple, la fermentation thylique sous certaines conditions denvironnement,
consiste dgrader biologiquement du glucose (substrat) par des levures (biomasse) en
anarobie, de manire produire de lthanol (produit). Cette transformation est illustre
par la figure (4.1).
103
le mode discontinu: le substrat est introduit initialement dans le bioracteur contenant les souches microbiennes. Les ractions seffectuent volume constant et le
procd sarrte par puisement du substrat ou inhibition de la biomasse ou le produit.
le mode semi-continu: le substrat est introduit dans le bioracteur au fur mesure
des besoins des micro-organismes et le volume est donc variable.
le mode continu: le racteur est aliment en substrat avec un flux constant et le
milieu ractionnel est soutir en permanence avec le mme flux, le volume est donc
constant dans le racteur.
4.3
Contrairement une large gamme de systmes physiques (machines lectriques, organes mcaniques, systmes hydrauliques, etc.) o il existe des lois connues depuis des
sicles, la plupart des modles en biologie reposent sur des lois empiriques. De ce fait, la
modlisation des systmes biologiques nest pas bien matrise et on trouve actuellement
une bibliographie abondante de modles mentionns dans la littrature.
Pour donner une description physique satisfaisante du processus de fermentation, il faut
combiner les quations cintiques qui reprsentent le modle microbien avec les quations
de bilans de matires. Le modle microbien qui dcrit la rponse des micro-organismes
au changement de son environnement peut tre soit structur soit non structur. Dans le
cas des modles non structurs, la constante de temps des mcanismes est trs faible et
ladaptation est donc trs rapide. Les modles structurs sont utiliss pour tenir compte
de lvolution de la composition et du mtabolisme interne des micro-organismes qui ont
des constantes de temps plus importantes.
4.3.1
Les modles non structurs sont bass sur lobservation des cintiques macroscopiques au sein du bioracteur. Ils sont dit non structurs car ils ne tiennent pas compte
de la composition intracellulaire des cellules. La biomasse est reprsente par une seule
104
variable qui est sa concentration dans le milieu ractionnel. Ces modles sont gnralement bass sur lquation de Monod (Monod, 1942) ou des quations du mme type
globalisant les diffrentes ractions enzymatiques. Les constantes apparaissant dans ces
quations sont empiriques et souvent dtermines par optimisation partir de donnes exprimentales. Dautres quations dcrivant la consommation du substrat et la production
des produits sont ncessaires pour dcrire le procd.
Ce sont les modles non structurs qui sont exclusivement employs, au LAAS (DISCO),
dans le cas de la fermentation alcooliques (Maher, 1995; Vasilache, 2000; Kabbaj, 2004;
Li, 2006).
4.3.2
Modles structurs
Les modles structurs ont t dvelopps pour tenir compte de lvolution de la structure du mtabolisme interne des micro-organismes. Dans ces modles, les composs de la
biomasse sont dcrits par des variables clefs qui dcrivent le comportement cellulaire. Par
ce moyen, lactivit microbienne devient non seulement une fonction de variables abiotiques (temprature, pH, etc.) qui peuvent changer avec des faibles constantes de temps
mais aussi une fonction de la composition cellulaire qui dpend de lhistorique de la cellule (Bideaux, 2000).
Ces modles sont trs riches en informations et peuvent tre utiliss la place des modles non structurs dans le cas o ceux-ci sont insuffisants. Toutefois, la difficult de la
vrification exprimentale qui requiert parfois la mesure des composants intracellulaires
selon diffrentes conditions opratoires constitue lun des freins lutilisation de ce type
de modles. Dans notre travail, cest le modle non structur qui sera utilis pour dcrire
la dynamique du procd de fermentation alcoolique.
4.4
105
tionnel:
dC
Fs
= C km C C
(4.1)
dt
V
dS
1
Fs
Fs
=
(4.2)
C mC + Sa S
dt
yc/s
V
V
yp/s
dP
Fs
=
(4.3)
C P
dt
yc/s
V
dV
= Fe Fs
(4.4)
dt
o C, S, P reprsentent respectivement les concentrations en biomasse, en substrat et en
produit dans le bioracteur, Sa est la concentration en substrat dans lalimentation, km le
taux de mortalit naturelle des cellules,m le coefficient de maintenance de la biomasse
sur le substrat, Fe le dbit dalimentation en substrat et Fs le dbit de soutirage.
Le taux de croissance est un paramtre ncessaire pour dcrire lvolution de la biomasse. Mme si ce paramtre dpend fortement de plusieurs facteurs tels que les conditions opratoires (temprature, pH, etc.) et le milieu opratoire (concentration en composs carbons, azots, phosphors, en produits), lexpression la plus couramment utilise
est le modle de Monod, introduit ds le dbut du sicle par Michalis-Menten pour dcrire une raction enzymatique :
S
(4.5)
Ks + S
est le taux maximum de croissance et Ks , appele constante de Michalis = max
o max
4.4.1
Mode discontinu
Au dpart, tout le milieu de culture est introduit dans le fermenteur en prsence des
micro-organismes. Ces derniers se dveloppent en consommant le substrat du milieu de
culture et la fin de la fermentation on extrait le produit intressant. Cela se traduit par :
Fe = Fs = 0
(4.6)
106
4.4.2
Mode semi-continu
(4.7)
On utilise une variable D(t), appele taux de dilution, pour exprimer le dbit par unit de
volume.
D(t) =
4.4.3
Fe (t)
V (t)
(V0 V (t) Vm )
(4.8)
Mode continu
(4.9)
Fc
V
(4.10)
Semi-continu
Continu
Temprature ( C)
30
30
30
pH
3,8
3,8
3,8
30
30
30
Agitation (tr/m)
200
300
200
Aration (l/h)
32
4.4.4
107
Modle dynamique
Le modle retenu pour une fermentation alcoolique en mode continu est donn par les
quations suivantes :
dC
= C(t) D(t)C(t)
dt
(4.11)
dS
1
=
C(t) mC(t) + D(t)Sa D(t)S(t)
dt
yc/s
(4.12)
Yp/s
dP
=
C(t) D(t)P (t)
dt
yc/s
(4.13)
dV
= Fe Fs = 0
dt
(4.14)
S(t)
Ks + S(t)
(4.15)
Nous avons simul le modle pour diffrents taux de dilution. La rsolution des quations
du modle est faite par une mthode dintgration de Runge-Kutta dordre 4 sous Matlab
6.5.
4.4.5
D(t) = 0 caractrise une fermentation en mode batch (discontinu) ce qui nest pas reprsentatif de la culture continue. Le modle en discontinu, est simul sous les conditions
et les paramtres de synthse suivants: C(0) = 0.2g/l, S(0) = 90g/l, P (0) = 0.2g/l,
max = 0.38h1 Sa = 100g/l, Ks = 2, Yc/s = 0.07 Yp/s = 0.44
108
4.4.6
Pour avoir un bon fonctionnement en mode continu, il faut appliquer un taux de dilution positif et infrieur la borne suprieure de la croissance (D(t) max ), cela, pour
viter le phnomne de lessivage ou rinage, qui entrane lanantissement et lextinction de la population cellulaire. De mme, si le taux de dilution est trs faible (au voisinage
de zro), le temps de rsidence des cellules dans le fermenteur crot et engendre une mortalit cellulaire. En tenant compte des contraintes du taux de dilution nous avons simul
le modle du bioprocd en mode continu. Les conditions initiales et les paramtres de
synthse utiliss sont: C(0) = 5g/l, S(0) = 5g/l, P (0) = 0.2g/l, max = 0.38h1
Sa = 100g/l, Ks = 2, Yc/s = 0.07 Yp/s = 0.44
Lvolution des diffrentes variables du systme est donne par la figure (4.3).
109
F IG . 4.3 Evolution des variables dtat pour une fermentation en mode continu
Nous avons appliqu un taux de dilution avec changement de consigne donn sur la
figure 4.3-a, pour tudier la cintique des variables dtat du bioprocd. On remarque,
que pour les conditions initiales utilises, le taux spcifique de croissance suit approximativement le taux de dilution appliqu.
Conjointement, lvolution de la concentration en biomasse et celle du produit (Figure
4.3-b) et (Figure 4.3-c), sont disproportionnelles au taux spcifique de croissance et au
taux de dilution appliqu (Figure 4.3-a). Cela se traduit, par une croissance de la biomasse et du produit au dtriment (avec dgradation) du substrat (Figure 4.3-d), qui est
une fonction du taux spcifique de croissance.
110
4.5
la conduite du bioprocd
La commande des bioprocds, a pour objectif la maximisation de la productivit, la
minimisation des dpenses nergtiques et lamlioration de la qualit des produits obtenus.
Les performances dun bioprocd fonctionnant en mode continu, peuvent tres obtenues en deux tapes. Dabord, on dfinit exprimentalement des profils optimaux pour
les variables dintrt, ensuite, on dveloppe une commande qui se charge de rguler ces
variables dintrt autour des profils prdfinis.
Dans notre cas, lobjectif de la commande est de dterminer le taux de dilution D(t) permettant de rguler la concentration en substrat suivant une consigne (profil) de rfrence
Sr (t).
4.5.1
Le contrleur flou reoit dans ses deux entres, lerreur de la concentration en substrat
et sa variation et fournit en sortie la variation du taux de dilution D(t) qui sert ajuster
(4.16)
Afin dobtenir une rponse optimale, les paramtres du contrleur flou (fonction dappartenance, rgles floues et facteurs dchelle) sont optimiss par un algorithme gntique
simple.
4.5.1.1
Rsultats de simulation
Le bioprocd en mode continu est simul partir des quations (4.11-4.15) en utilisant la mthode dintgration de Runge-Kutta dordre 4.
Les conditions initiales et les paramtres de synthse utiliss sont: C(0) = 5g/l, S(0) =
5g/l, P (0) = 44g/l, max = 0.38g/l, Sa = 100g/l, Ks = 5, Yc/s = 0.07, Yp/s = 0.44.
Deux structures du contrleur flou ont t testes.
La premire correspond un partitionnement avec 5 fonctions dappartenance de type
gaussiennes {NG: Ngatif Grand, NM: Ngatif Moyen, EZ: Zro, P: Positif, PG: Positif
Grand} pour chacune des variables du contrleur et 25 rgles floues.
Dans la deuxime, nous utilisons galement le mme type de fonctions dappartenance
mais avec un partitionnement plus fin de 7 ensembles flous {NG, NM, NP, EZ, PP, PM,
PG}. La base de rgles correspondante possde alors une taille de 49 rgles. Nous rappelons que la taille de la base de rgles demeure constante durant tout le processus doptimisation.
Les intervalles de variation des centres des fonctions dappartenance sont donns dans le
tableau 4.2.
TAB . 4.2 Intervalles de variation des centres des fonctions dappartenance
Premire structure Deuxime structure
Ensembles Flous
Min
Max
Min
Max
NG
-1
-0,5
-1
-0,70
NM
-0,35
-0,05
-0,69
-0,40
NP
-0,39
-0,05
EZ
-0,04
0,04
-0,04
0,04
PP
0,05
0,39
PM
0,05
0,35
0,40
0,69
PG
0,50
0,70
112
Ils sont dtermins de manire obtenir la fin du processus doptimisation des partitions lisibles dont les ensembles flous interprtent rellement les termes linguistiques qui
leur sont associs. Le niveau de chevauchement entre deux fonctions voisines est dfini
dans lintervalle [0.05, 0.6]
Les intervalles de variations des facteurs dchelle en entre du contrleur flou sont obtenus partir du profil de rfrence. En effet la connaissance de la variation maximale
du profil de rfrence (voir figure 4.7) et de la variation de la concentration en substrat
conduit la dfinition des intervalles suivant:
TAB . 4.3 Intervalles de variation des facteurs dchelle
Facteurs dchelle
Ge
Ge
Gu
Min
0,05
Max
10
0,15
(4.17)
Par cette combinaison, il est possible de minimiser lerreur durant la priode transitoire
(IAE), et en rgime permanent par lemploi de (ITAE).
b.Paramtres de lAG
Comme pour beaucoup dalgorithmes, les paramtres de lalgorithme gntique doivent
tre soigneusement choisis pour obtenir de bons rsultats. Dans notre cas, nous avons
utilis les paramtres suivants:
Longueur du chromosome:
1. Premire structure: 76 (27 pour les fonctions dappartenance, 25 pour les
rgles floues et 24 (3*8) pour les facteurs dchelle)
2. Deuxime structure: 112 (39 pour les fonctions dappartenance, 49 pour les
rgles floues et 24 pour les facteurs dchelle)
Probabilit de croisement: 0,85
Premire structure
Les rsultats obtenus pour cette premire structure sont ports sur les figures 4.5-4.8.
114
Pour mieux illustrer lvolution des rsultats, nous portons dans les figures ci-aprs
lvolution de la concentration en substrat, du signal de commande et des paramtres du
contrleur, obtenus lors de la premire et de la dernire gnration (1, 500).
Ge
Ge
Gu
1,6059
1,2431
0,1000
116
e
NG NM
EZ PM
PG
NG
NP
EZ
PM
PG
Le rsultat de la dernire gnration est nettement meilleur. On peut constater la disparation des oscillations lexception de quelques-unes qui apparaissent aux instants des
changements de consignes. Ces dernires sont rapidement attnues par une action optimale du contrleur flou et les paramtres (figure 4.10 , tableaux 4.6 et 4.7) sont trs
diffrents de ceux obtenus au dbut du processus doptimisation.
Ge
Ge
Gu
0,8706
1,0392
0,1024
118
e
NG NM
EZ PM
PG
NG
EZ
PG
Deuxime structure
Pour cette partie et par manque despace, nous reprsentons uniquement lvolution
du critre de performances travers les gnrations, les paramtres du contrleur flou et
la sortie du procd correspondants au meilleur chromosome de la dernire gnration.
La figure (4.11) dcrit lvolution de lobjectif Ob en fonction du nombre de gnrations parcourues. De mme que pour la premire structure, on remarque que le critre de
performance diminue rapidement durant les premires gnrations ([0, 20] et [20,135]). Il
continue diminuer lentement jusqu atteindre la valeur 16,56 la 200me gnration.
A partir de cette gnration, on enregistre de trs faibles variations de la fonction objectif
(Ob) soit une diffrence de 0,02 jusqu la 500me gnration.
Les concentrations en substrat et du taux de dilution obtenus pour la 500me gnration
sont donns sur la figure 4.12.
120
F IG . 4.12 Evolution de la concentration en Substrat et le taux de dilution pour la dernire gnration-structure 7*7*7
Cette variable suit bien le profil dsir, soit une erreur nulle en rgime permanent et un
temps de rponse trs rduit sans quil y ait de dpassements et doscillations aux instants
de changements de consigne.
Les facteurs dchelle, les paramtres des fonctions dappartenance et la base de rgles
correspondants sont respectivement donns par le tableau 4.8, la figure 4.13 et le tableau
4.9.
Ge
Ge
Gu
1,0529
1,0078
0,0871
e
NG NM
NP
PP
PM
PG
NG
NM
NP
PP
PM
PG
122
Notons bien quune attention particulire doit tre porte sur les bases de rgles obtenues, pour les deux structures, en fin du processus doptimisation. Celles-ci prsentent
des rgles incohrentes (cellules noires des tableaux 4.7 et 4.9) qui peuvent avoir un effet
ngatif sur la rponse du contrleur. Pour lAGS, la prsence de ces rgles ne peut tre
ressenti tant que le critre numrique base duquel les individus sont valus, nest pas
dtrior. Pour palier cet inconvnient, nous introduisons donc un deuxime objectif qui
est la minimisation du nombre de rgles floues. Ce dernier permet de privilgier, durant
le processus doptimisation, les contrleurs flous avec un minimum de rgles ce qui permettra dliminer les rgles inutiles.
4.5.2
chis
La stratgie de commande reste la mme (fig.4.4), seule la mthode doptimisation des
paramtres du contrleur flou diffre. On utilise cette fois ci un AGH la place dun AGS
ce qui permet dune part de coder par le biais des gnes des paramtres, les paramtres
des fonctions dappartenance, les facteurs dchelle et les conclusions des rgles floues,
comme sil sagissait dun algorithme gntique simple et dautre part lactivation ou la
dsactivation des rgles floues par le biais des gnes de contrle, chose qui diffre dun
AG simple. En effet, dans les deux cas prcdents (premire et deuxime structure) toutes
les rgles floues et parmi elles les rgles incohrentes, sont restes actives.
4.5.2.1
Deux objectifs sont considr le premier est lamlioration des performances du systme de commande et le deuxime concerne la rduction de la complexit du contrleur :
Ob1 = IAE + IT AE
Ob2 =
49
X
zi
(4.18)
(4.19)
i=1
Comme il sagit dun problme doptimisation multi-objectif (Ob1 et Ob2 ), nous avons
opt pour le NSGA-II comme algorithme de rsolution (mthode de slection).
4.5.2.2
Rsultats de simulation
Pou vrifier les performances de la mthode doptimisation, nous utilisons un contrleur flou configur selon la deuxime structure dj prsente prcdemment.
Les intervalles de variation de lensemble des paramtres du contrleur restent les mmes.
On garde galement le mme profil de consigne.
Les paramtres du NSGA-II sont rsums ainsi:
Longueur du chromosome: 161(49 pour les gnes de contrle, 39 pour les fonctions
dappartenance, 49 pour les rgles floues et 24 (3*8) pour les facteurs dchelle)
probabilit de croisement des gnes de paramtres : 0.85
Probabilit de croisement des gnes de contrle : 0.45
Probabilit de mutation des gnes de paramtres : 0.01
Probabilit de mutation des gnes de contrle: 0.005.
Taille de la population: 40
Maximum de gnration : 1000
La figure (4.14) donne la rpartition des chromosomes de la premire gnration dans
lespace des objectifs.
124
On constate que la valeur de lobjectif Ob2 est maintenue 49 pour tous les chromosomes. Cela permet de considrer, pour chaque solution, la totalit des rgles floues durant la premire gnration (tous les gnes de contrle sont initialiss 1). Les diffrentes
valeurs de lobjectif Ob1 sont dues linitialisation alatoire des gnes de paramtres correspondants aux fonctions dappartenance et aux facteurs dchelle.
De gnration en gnration, la valeur dOb1 est considrablement amliore, toute en
minimisant le nombre de rgles floues actives.
Nous reprsentons ci-aprs la rpartition des chromosomes obtenue la fin du processus
doptimisation (figure 4.15). Il est important de noter les amliorations apportes simultanment aux deux objectifs Ob1 et Ob2 .
Nous avons pour la plupart des solutions, notamment celles appartenant au premier front
de Pareto, un rsultat meilleur que celui correspondant au meilleur chromosome de la
population initiale.
La figure 4.16 donne lvolution de la concentration en substrat et le signal de commande obtenus pour une solution de test choisie du front de Parto.
Pour cette solution uniquement 26 rgles sont considres (tableau 4.10), les autres rgles
(23 rgles) sont annules par les gnes de contrle.
NP
EZ PP
PM
NM
e
PG
6
NP
EZ
PP
PM
PG
5
7
126
4.5.3
On distingue deux tapes doptimisation dans ce schma: la rtropropagation qui ralise un premier ajustement des paramtres (premire tape) et un AGH permettant de
modifier encore une deuxime fois les paramtres et de minimiser le nombre de rgles
floues (deuxime tape).
La squence de rfrence dsire Sr (t) est gnre par le modle
dSr (t)
+ 0.33Sr (t) = 0.33S (t)
dt
(4.20)
avec S (t) est la consigne de la concentration en substrat et dont les valeurs sont prises
comme suit:
S (t) =
Le contrleur flou reoit par ses deux entres la concentration dsire en substrat Sr (t)
et la valeur passe de la concentration en substrat S(t 1). Il fournit en sortie le taux de
dilution D(t) qui alimente le bioracteur avec une priode dchantillonnage de 9 minutes
(0,15h).
Au niveau de la structure interne, chaque variable du contrleur est partitionne en 7
ensembles flous (A1 , A2 , .., A7 pour Sr (t) et B1 , B2 , .., B7 pour S(t 1)) et dfinie sur
lunivers de discours [4.8, 8,2]. La table de rgles associe, comporte alors 49 rgles de
la forme:
Ri : Si Sr (t) est Ai et S(t 1) est Bi Alors D(t) = ai0 + ai1 .Sr (t) + ai2 .S(t 1) (4.21)
avec ai0 , ai1 et ai2 sont les paramtres relatifs la rgle Ri .
4.5.3.1
(4.22)
(4.23)
J(t)
S(t)
S(t) S(t 1)
= S(t)Sr (t) et
est grossirement approxim par: signe(
).
S(t)
D(t)
D(t) D(t 1)
D(t)
Le terme
se calcule selon lalgorithme de rtropropagation dcrit dans la section
p(t)
4 du chapitre 3.
avec
Comme notre objectif, en plus de la minimisation du critre numrique J(t), est dobtenir
un contrleur flou avec des partitionnements interprtables, ladaptation par rtropropagation est limite uniquement aux paramtres aij relatifs aux conclusions des rgles floues.
Les centres est les variances des fonctions dappartenance restent donc constants durant
cette premire tape doptimisation. Ils sont initialiss de manire obtenir des ensembles
flous uniformment rpartis sur leur univers de discours ([4.8, 8.2]).
Le suivi de la trajectoire de rfrence lissue de cette premire tape est dj satisfaisant
et est reprsent dans la figure 4.18
128
Prmisses des
Paramtres relatifs
rgles floues
Rgle
Prmisses des
Paramtres relatifs
rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
A1
B1
0.0039
0.0205
0.0085
A1
B2
0.0052
0.0021
A1
B3
0.0008
A1
B4
0.0035
A1
B5
A1
Sr (t)
S(t 1)
ai0
ai1
ai2
26
A4
B5
0.0070
0.0129
0.0123
0.0099
27
A4
B6
0.0029
0.0052
0.0098
0.0084
0.0089
28
A4
B7
0.0019
0.0061
0.0102
0.0057
0.0026
29
A5
B1
0.0084
0.0473
0.0316
0.0069
0.0040
0.0090
30
A5
B2
0.0068
0.0268
0.0203
B6
0.0001
0.0038
0.0100
31
A5
B3
0.0133
0.0304
0.0319
A1
B7
0.0008
0.0036
0.0082
32
A5
B4
0.0041
0.0208
0.0163
A2
B1
0.0070
0.0246
0.0117
33
A5
B5
0.0057
0.0162
0.0148
A2
B2
0.0090
0.0109
0.0187
34
A5
B6
0.0011
0.0110
0.0125
10
A2
B3
0.0072
0.0036
0.0017
35
A5
B7
0.0083
0.0078
0.0126
11
A2
B4
0.0068
0.0038
0.0096
36
A6
B1
0.0081
0.0458
0.0344
12
A2
B5
0.0064
0.0008
0.0072
37
A6
B2
0.0046
0.0256
0.0215
13
A2
B6
0.0065
0.0005
0.0034
38
A6
B3
0.0046
0.0343
0.0269
14
A2
B7
0.0063
0.0063
0.0058
39
A6
B4
0.0102
0.0237
0.0262
15
A3
B1
0.0077
0.0149
0.0175
40
A6
B5
0.0049
0.0216
0.0152
16
A3
B2
0.0057
0.0232
0.0192
41
A6
B6
0.0046
0.0162
0.0136
17
A3
B3
0.0071
0.0182
0.0165
42
A6
B7
0.0103
0.0086
0.0134
18
A3
B4
0.0051
0.0114
0.0121
43
A7
B1
0.0047
0.0091
0.0085
19
A3
B5
0.0013
0.0075
0.0011
44
A7
B2
0.0075
0.0041
0.0095
20
A3
B6
0.0094
0.0007
0.0051
45
A7
B3
0.0023
0.0124
0.0111
21
A3
B7
0.0042
0.0067
0.0038
46
A7
B4
0.0086
0.0195
0.0238
22
A4
B1
0.0087
0.0552
0.0349
47
A7
B5
0.0020
0.0186
0.0136
23
A4
B2
0.0068
0.0199
0.0208
48
A7
B6
0.0114
0.0155
0.0189
24
A4
B3
0.0076
0.0184
0.0229
49
A7
B7
0.0030
0.0188
0.0100
25
A4
B4
0.0122
0.0156
0.0156
4.5.3.2
1
(S(t) Sr (t))2
N
(4.24)
130
4.5.4
Paramtres de lAGH
Gnes de paramtres
fonctions dappartenance
Reprsentation
binaire
Type de croisement
Probabilit de croisement
Types de mutation
relle
en deux points
0.2
standard
Probabilit de mutation
paramtres aij
0.005
0,85
non uniforme
gaussienne
quation 1.4
0.01
0.008
Mthode de slection
NSGA-II
Taille de la population
40
Nombre de gnrations
1500
lr = 15
Contrainte
La figure 4.20 donne, dans lespace objectifs, la rpartition des solutions de la premire gnration dont laquelle on retrouve la solution obtenue par rtropropagation (cercle
noire: Ob1 = 7,209.104 , Ob2 = 49).
La figure 4.21 illustre la rpartition des solutions de la dernire gnration. Nous remarquons pour la plupart des solutions une amlioration considrable des deux objectifs.
Pour toutes les solutions du front de Pareto (figure 4.22), nous avons un bon suivi de
la trajectoire de rfrence (ob1 [2,538.104 , 5,784.104 ]). Comme exemple illustratif,
nous avons reprsent dans la figure 4.23 lvolution de la concentration en substrat pour
une solution du front de Pareto (carr bleu de la figure 4.22). Le suivi de la trajectoire de
rfrence est meilleur que celui obtenu aprs la rtropropagation. La commande applique
132
au bioracteur est douce et ne dpasse pas la valeur de max (D(t) < 0,38h1 , condition
quil faut toujours satisfaire, sans quoi, le bioracteur risque dtre lav).
4.6. CONCLUSION
133
Prmisses des
Paramtres relatifs
rgles floues
Rgle
Prmisses des
Paramtres relatifs
rgles floues
Sr (t)
S(t 1)
ai0
ai1
ai2
A1
B1
0.0043
0.0193
0.0089
A1
B2
0.0032
0.0013
A2
B1
0.0069
A2
B2
0.0090
10
A2
B3
16
A3
17
Sr (t)
S(t 1)
ai0
ai1
ai2
26
A4
B5
0.0074
0.0110
0.0128
0.0099
32
A5
B4
0.0047
0.0210
0.0176
0.0256
0.0117
33
A5
B5
0.0068
0.0164
0.0148
0.0104
0.0180
34
A5
B6
0.0012
0.0116
0.0119
0.0072
0.0012
0.0020
40
A6
B5
0.0049
0.0214
0.0142
B2
0.0061
0.0265
0.0194
42
A6
B7
0.0100
0.0095
0.0142
A3
B3
0.0064
0.0181
0.0170
48
A7
B6
0.0082
0.0169
0.0186
18
A3
B4
0.0057
0.0098
0.0121
49
A7
B7
0.0025
0.0185
0.0102
24
A4
B3
0.0062
0.0203
0.0235
4.6
Conclusion
134
Conclusion et perspectives
Nous nous sommes intresss dans cette thse, au problme de la conception de
contrleurs flous par algorithmes gntiques. La difficult de lobtention de la base de
rgles et des fonctions dappartenance est en effet trs pnalisante lors de lutilisation des
techniques floues.
Cette thse sinscrit donc dans la continuit des travaux existants visant simplifier ltape
de conception en proposant quelques mthodes par hybridation des techniques du soft
compting. Ainsi, nous avons prsent dans un premier temps la mthode de conception
par algorithme gntique simple qui optimise simultanment:
Les fonctions dappartenance des variables dentres et de sortie du contrleur,
Les facteurs dchelle en entre et en sortie,
Les conclusions des rgles floues
Nous avons dcrit le principe de codage mixte des paramtres du contrleur dans un seul
chromosome divis en trois parties dont la premire est code en base n, la seconde en
nombres rels et la troisime en binaire. Nous avons ensuite prsent les oprateurs gntiques permettant dexploiter le codage mixte. La mthode de slection est celle du
tournoi. Pour ne pas rester dans un cadre descriptif, nous avons prsent une application
de cette mthode partir dun problme de commande dun systme linaire du second
ordre. Bien que les rsultats obtenus soient satisfaisants en terme derreur, la mthode,
comme la plupart des mthodes proposes dans la littrature, prsente un inconvnient
majeur qui est celui de lobtention de rgles floues incohrentes la fin du processus
doptimisation. Pour remdier cet inconvnient nous avons introduit dans un second
temps les AGH. Ces derniers permettent par le biais de leurs chromosomes un codage
plus complet qui offre, en plus du codage des paramtres, lactivation ou la dsactivation des rgles floues. Pour viter dobtenir, comme pour le cas des AGS, une base de
135
136
CONCLUSION GNRALE
CONCLUSION GNRALE
137
Perspectives
Les travaux dcrits dans cette thse peuvent se poursuivre sur plusieurs voies de recherche. Tout dabord, il serait intressant dtendre la premire et la deuxime mthode
de synthse des contrleurs de Mamdani sur un espace dentre suprieur deux. Pour
viter dobtenir durant le processus doptimisation des solutions pour lesquelles aucune
rgle nest active, nous avons impos une contrainte qui consiste garder un nombre minimal de rgles lr active et quil faut fixer ds la premire gnration.
Une tude visant modifier la valeur de ce nombre lr au cours des gnrations est galement une problmatique intressante quil faut aborder.
BIBLIOGRAPHIE
139
Bibliographie
Acosta, G. et E. Todorovich (2003). Genetic algorithms and fuzzy control: a practical
synergism for industrial applications. Computers in Industry 52, 183195.
Belarbi, K., F. Titela, W. Bourebiaa et K. Benmahammed (2005). Engineering applications of artificial intelligence. Design of mamdani fuzzy logic controllers with rule base
minimisation using genetic algorithm 18, 875880.
Berenji, H.R. et P. Khedkar (1992). Learning and tuning fuzzy logic controllers through
reinforcements. IEEE Transactions on Neural Networks 3(5), 724740.
Bideaux, C. (2000). Modlisation stchiomtrique des productions microbiennes par descripteur mtabolique au moyen du calcul formel. Validation sur le modle Kluyveromyces marxianus. Thse de doctorat. Institut National des Sciences Appliques de
Toulouse.
Braae, M. et D.A. Rutherford (1978). Fuzzy relations in control setting. Kybernetes
7(3), 185188.
Burns, R.S. (2001). Advanced Control Engineering. butterworth heinemann ed.
Chen, C.C. et C.C. Wong (2002). Self-generating rule-mapping fuzzy controller design
using a genetic algorithm. In: IEE Proceedings on Control Theory and Applications.
Vol. 49. pp. 143148.
Cheong, F. et R. Lai (2000). Constraining the optimization of a fuzzy logic controller using an enhanced genetic algorithm. IEEE Transactions on Systems, Man, and
Cybernetics-Part B:Cybernetics 30(1), 3146.
Cordon, O., F. Herrera et P. Villar (2001). Generating the knowledge base of a fuzzy
rule-based system by thegenetic learning of the data base. IEEE Transactions on Fuzzy
Systems 9(4), 667674.
Corne, D., J.D. Knowles et M.J. Oates (2000). The pareto envelope-based selection algorithm for multi-objective optimization. In: Proceedings of the sixth International
Conference on Parallel Problem Solving from Nature. pp. 839848.
140
BIBLIOGRAPHIE
Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems 2, 303314.
Deb, K., A. Pratap, S. Agarwal et T. Meyarivan (2002). A fast and elitist multiobjective genetic algorithm: Nsga-ii. IEEE Transactions on Evolutionary Computation 6(2), 182
197.
Dochain, D. (2001). Automatique des bioprocds. Hermes Science.
Dorf, R.C. et R.H. Bishop (1995). Modern control systems. Addison Wesley.
Farag, W.A., V.H. Quintana et G.Lambert-Torres (1998). A genetic-based neuro-fuzzy
approach for modeling and control of dynamical systems. IEEE Transactions on Neural
Networks 9(5), 756767.
Fonseca, C.M. et P.J. Fleming (1993). Genetic algorithms for multiobjective optimization: Formulation, discussion and generalization. In: Proceedings of the Fifth International Conference on Genetic Algorithms (S. Forrest, Ed.). Morgan Kaufmann. San
Mateo,California. pp. 416423.
Glover, F. (1989). Tabu search-part 1. ORSA Journal on Computing 1, 190206.
Goldberg, D.E. (1994). Algorithmes gntiques. Exploration, optimisation et apprentissage automatique. Addison-Wesley. France.
Goldberg, D.E. et J. Richardson (1987). Genetic algorithms with sharing for multimodal
function optimization. In: Second International Conference on Genetic Algorithms and
their application. Cambridge, Massachusetts, United States. pp. 4149.
Guenounou, O., A. Belmehdi et B. Dahhou (2006). Optimisation des contrleurs flous
par algorithmes gntiques hirarchiss-application la commande dun bioprocd.
In: Seventh International Conference on Sciences and Techniques of Automatic control
STA 2006. Hammamet,Tunisia. pp. 110.
Guenounou, O., A. Belmehdi et B. Dahhou (2009). Multi-objective optimization of tsk
fuzzy model. Expert Systems with Applications 36(4), 74167423.
Guenounou, O. et A. Belmehdi (2006). Optimisation des contrleurs flous par algorithmes
gntiques hirarchiss-application sur actionneur asynchrone. In: Proceedings de la
confrence internationale sur le gnie lectrique. Batna,Algrie. pp. 600605.
Hagan, M.T. et M.B. Menhaj (1994). Training feedforward networks with marquardt algorithm. IEEE Transaction On Neural Networks 5(6), 989993.
Herrera, F., M. Lozano et J.L. Verdegay (1995). Tuning fuzzy logic controllers by genetic
algorithms. International Journal of Approximate Reasoning 12, 299315.
BIBLIOGRAPHIE
141
Herrera, F., M. Lozano et J.L. Verdegay (1998). A learning process for fuzzy control rules
using genetic algorithms. Fuzzy Sets and Systems 100, 143158.
Holland, J. (1992). Adaptation in natural and artificial and systems. 2nd edition. IT Press.
Homaifar, A. et E. MCCormick (1993). Simultaneous design of membership functions
and rule sets for fuzzy controllers using genetic algorithms. IEEE transactions on fuzzy
systems 3(2), 129139.
Horn, J. et N. Napfliotis (1994). Multiobjective optimization using the niched pareto genetic algorithm. In: Proceedings of the First IEEE Conference on Evolutionary Computation, IEEE World Congress on Computational Intelligence. Vol. 1. pp. 8287.
Hornik, K., M. Stinchcombe et H. White (1989). Multilayer feedforward networks are
universal approximators. Neural Networks 2(5), 359366.
Hwang, H.S. (1999). Automatic design of fuzzy rule base for modelling and control
using evolutionary programming. IEE Proceedings on Control Theory and Applications pp. 916.
Jang, J.-S.R. (1993). Anfis: adaptive-network-based fuzzy inference system. IEEE Transaction on System Man and Cybernetics 23(3), 665685.
Jordan, M.I. (1992). Forward models: Supervised learning with a distal teacher. Cognitive
Science 16, 307354.
Kabbaj, M.N. (2004). Dveloppement damgorithmes de dtection et disolation de dfauts pour la supervision des bioprocds. Thse de doctorat. Universit de Perpignan.
Karr, C.L. (1991). Applying genetics to fuzzy logic. AI Expert 6(3), 38U43.
Karr, C.L. et E.J. Gentry (1993). Fuzzy control of ph using genetic algorithms. IEEE
Transactions on Fuzzy Systems 1(1), 4653.
Kim, E., M. Park, S. Ji et M. Park (1997). A new approach to fuzzy modeling. IEEE
Transactions on Fuzzy Systems 5(3), 328337.
Kirkpatrick, S., C. Gelatt et M. Vecchi (1983). Optimization by simulated annealing.
Science 220(4598), 671680.
Klir, G.J. et B. Yuan (1994). Fuzzy sets and fuzzy logic: theory and applications. PrenticeHall. Inc. Upper Saddle River, NJ, USA.
Lee, C.C. (1990). Fuzzy logic in control systems: Fuzzy logic controller, part ii. IEEE
Transactions on Systems, Man. and Cybernetics 20(2), 419435.
Lee, C.S. Ouyang W.J. Lee S.J. (2005). A tsk-type neurofuzzy network approach to
system modeling problems. IEEE Transactions on Systems, Man and Cybernetics
35(4), 751767.
142
BIBLIOGRAPHIE
Lee, M. A. et H. Takagi (1993). Dynamic control of genetic algorithms using fuzzy logic
techniques. In: Proceedings of International conference on Genetic Algorithms. San
Mateo, CA. pp. 7683.
Li, Z. (2006). Contribution llaboration dalgorithmes disolation et didentification de
dfauts dans les systmes non linaires. Thse de doctorat. Universit Paul Sabatier de
Toulouse.
Lin, C.T. et C.S.G. Lee (1991). Neural-network-based fuzzy logic control and decision
system. IEEE Transactions on Computers 40(12), 1320.
Liska, J. et S.S. Melsheimer (1994). Complete design of fuzzy logic systems using genetic algorithms. In: Proceedings of the Third IEEE International Conference on Fuzzy
BIBLIOGRAPHIE
143
Ng, K.C. et Y. Li (1994). Design of sophisticated fuzzy logic controllers using genetic
algorithms. In: IEEE World Congress on Computational. Vol. 3. USA. pp. 17081712.
Pedrycz, W. et L.A. Zadeh (1995). Fuzzy Set Engineering. CRC Press. Boca Raton,USA.
Psaltis, D., A. Sideris et A. Yamamura (1987). Neural controllers. In: Proceedings of the
International Conference on Neural Networks. Vol. 4. San Diego. pp. 551558.
Psaltis, D., A. Sideris et A.A. Yamamura (1988). A multilayered neural network controller. IEEE Control Systems Magazine 8, 1721.
Rumelhart, D.E. et J. L. McClelland (1986). Parallel Distributed Processing:Explorations
in the Microstructure of Cognition. Vol. 1. M.I.T. Press.
Saerens, M. et A. Soquet (1991). Neural controller based on back-propagation algorithm.
In: IEE Proceedings-F on Radar and Signal Processing. Vol. 138. pp. 5562.
Sastry, P.S., G. Santharam et K.P. Unnikrishnan (1994). Memory neuron networks for
identification and control of dynamical systems. IEEE Transactions on Neural Networks 5(2), 306319.
Schaffer, J.D. (1985). Multiple objective optimization with vector evaluated genetic algorithms. In: Proceedings of the 1st International Conference on Genetic Algorithms.
pp. 93100.
Scharf, E.M. et N.J. Mandic (1985). The application of a fuzzy controller to the control of
a multi-degree-freedom robot arm. Industrial Application of fuzzy control pp. 4161.
Srinivas, V. et K. Deb (1993). Muiltiobjective optimization using nondominated sorting
in genetic algorithms. Evolutionary Computation 2(3), 221248.
Sugeno, M. (1999). On stability of fuzzy systems expressed by fuzzy rules with singleton
consequents. IEEE Transactions on Fuzzy Systems 7(2), 201224.
Tang, K.S., C.Y. Chan, K. F. Man et S. Kwong (1995). Genetic structure for nn topology and weights optimization. In: Conference on Genetic Algorithms in Engineering
Systems:Innovations and Applications. IEE. pp. 250255.
Tang, K.S., K.F. Man, Z.F. Liu et S. Kwong (1998). Minimal fuzzy memberships and
rules using hierarchical genetic algorithms. IEEE Transactions on Industrial Electronics 45(1), 162169.
Thrift, P. (1991). Fuzzy logic synthesis with genetic algorithms. In: Proceedings of the
144
BIBLIOGRAPHIE
Vogl, T.P., J.K. Mangis, A.K. Zigler, W.T. Zink et D.L. Alkon (1988). Accelerating the
convergence of the back-propagation method. Biological Cybernetics 59, 256264.
Wang, J.S. et C.S.G. Lee (2001). Efficient neuro-fuzzy control systems for autonomous
underwater vehicle control. In: Proceedings of the IEEE International Conference on
Robotics and Automation. Vol. 3. Seoul, Korea. pp. 29862991.
Wang, L. et R. Langari (1996). Complex systems modeling via fuzzy logic. IEEE Transactions On Systems, Man, And Cybernetics-Part B: Cybernetics 26(1), 100106.
Wu, C.J. et G.Y. Lin (1999). Design of fuzzy logic controllers using genetic algorithms.
In: Proceedings of IEEE International Conference on Systems, Man, and Cybernetics.
Vol. 6. SAAA. pp. 104109.
Xiang, T., K.F. Man, K.M. Luk et C.H. Chan (2006). Design of multiband miniature
handset antenna by mom and hga. IEEE Antennas and wireless propagation letters
5, 179182.
Yager, R.R. et D.P. Filev (1994). Essentials of fuzzy modeling and control. WileyInterscience. New York, NY, USA.
Yubazaki, N., M. Otani, T. Ashida et K. Hirota (1995). Dynamic fuzzy control method
and its application to positioning of induction motor. In: Proceedings of Fourth IEEE
International Conference on Fuzzy Systems. Japan. pp. 10951102.
Zadeh, L.A (1965). fuzzy sets. Informatic and Control 8, 338353.
Zhou, Y.S. et L.Y. Lai (2000). Optimal design for fuzzy controllers by genetic algorithms.
IEEE Transactions on Industry Applications 36(1), 9397.
Zitzler, E. et L. Thiele (1999). Multiobjective evolutionary algorithms: A comparative
case study and the strength pareto approach. IEEE Transactions on Evolutionary Computation 3(4), 257271.
Rsum : Dans ce travail, le problme de conception de contrleurs flous est tudi. Dans une premire
partie, on prsente un tat de lart sur les techniques utilises savoir les algorithmes gntiques et ses
diffrentes variantes, les rseaux de neurones, la logique floue et leurs hybridations. Prenant appui sur cet
tat de lart nous proposons une premire mthode de conception des contrleurs flous de Mamdani par
algorithmes gntiques simples.
Cette mthode est en suite amliore par lemploi des algorithmes gntiques hirarchiss. Ces derniers
permettent par le biais de la structure de leurs chromosomes, une meilleure optimisation des paramtres
du contrleur tout en liminant les rgles incohrentes qui peuvent se prsenter, comme pour la premire
mthode, la fin du processus doptimisation.
La dernire mthode propose concerne la synthse des contrleurs flous de Sugeno. Elle est base sur une
procdure dapprentissage hybride qui se droule en deux tapes. Durant la premire tape, le contrleur
flou est reprsent sous forme dun rseau de neurones multicouches dont les paramtres sont optimiss par
lalgorithme de rtropropagation. Dans la deuxime tape, les paramtres obtenus lissue de la premire
phase sont extraits et optimiss par le NSGA-II suivant un codage hirarchis.
Lensemble des ces mthodes est appliqu pour la conduite dun procd de fermentation alcoolique en
mode continu.
Mots-cls : Algorithmes gntiques simples, Algorithmes gntiques hirarchiss,contrleur flou, rseaux
de neurones, NSGA-II, bioprocd.