Le Best Pour L'annlyse

Techniques Adaptatives Du Contrle Neuronal Utilisant un Modle linaire De Rfrence Pour Les Systmes Dynamiques Non Linaires Complexes
(Applications Sociaux Humaines)

N.Benbrahim Dp. D'lectronique, Fac. Des Sciences de L ingnieur, Universit Hadj Lakhdar, Rue Chahid Boukhlouf Batna ALGERIE Tel/Fax : +213 033 80 54 94 E-Mail: nas_benbrahim@yahoo.fr
Abstract - The purpose of this paper is to present a new methodology to control non linear systems. This approach results from a combination of the adaptive and predictive properties of artificial neural networks and the Generalized Predictive control strategy. This new methodology is called generalized predictive Neural Control with Reference Model GPNCRM, Where the control of processes output behavior to the processes constraint, leads to track trajectories with respecting the imposed constraints. The example used for application here is a model of a manipulator robot auctioneer; Simulation results are given in the case of nominal and mismatched parameters on the nonlinear model. This strategy can be used in many applications of non linear processes that control problems also become difficult to handle because of the dynamic behavior linked to the high performance applications. Key words - Generalized Predictive Control GPC, Neural Networks, Quadratic Optimization, Adaptive Control, Retro Propagation RTP learning.
1 Introduction
On cherche concevoir une commande neuronale prdictive adaptative pour contrler un systme ayant un comportement dynamique non linaire multivariables pour raliser un suivi de trajectoire gnre par la sortie dun modle de rfrence, linaire, appropri. En ralisant la linarisation par retour du processus non linaire tel que lerreur de sortie est rtro propage au rseau contrleur qui est une combinaison du rseau contrleur entran et le rseau modle (prdicteur j pas en avant), dont la rsolution du problme doptimisation se fait le long dun horizon fuyant[1, 4], la linarisation se fait en chaque laps de temps dchantillonnage par extraction dun modle linaire du processus en ajustant les biais et les poids du rseau prdicteur intgr dan le rseau contrleur pour donner la commande optimale appliquer au processus command pour quil se comporte comme le modle linaire de rfrence appropri. La commande est gnralise, adaptative en temps rel, ce qui permet dadresser aux non-linarits du processus command. Tel que pour des processus dynamiques non linaires l'adaptation des rseaux de neurones est le moyen le plus efficace pour que l'excution du contrleur soit maintenue.
MASHS 2008, Creteil
Lapplication est souple, optimale, pourra tre gnralise et implmente pour des institutions industrielles, conomiques ou sociaux humaines tels que la commande du mouvement dun fauteuil roulant qui permet de faciliter la vie aux handicapes, ou la commande du mouvement dun bras manipulateur pour l'utilisation aux svices sociaux multitches.
2 Commandes neuronales prdictives

La capacit d'approximation et laspect prdictif universel des rseaux de neurones s'adapter selon le comportement dsir (dmontr dans le chapitre prcdent) largie leurs utilisations pour l'identification, et la commande des systmes dynamiques. Ils ont ralis un grand succs pour rsoudre les problmes d'identification, et doptimisation de la commande adaptative en temps rel pour les systmes linaires et non linaires; Les rseaux de neurones artificiels RNA sont beaucoup plus appliqus en Robotique, pour identifier et commander des bras manipulateurs; Aussi pour rsoudre les problmes doptimisation convexe des processus de contrle des systmes dynamiques complexes, et non linaires complexes [2, 5,6]. Selon Plusieurs applications et techniques de programmation [30], dont plusieurs stratgies de commande non linaires ont t implmentes avec succs. Pratiquement il existe plusieurs stratgies de la commande par rseau de neurones prdictifs [7,8], tel que ces stratgies se diffrent selon le critre d'apprentissage, on distingue: Cas ou le rseau est entran hors-ligne: pour tre utilis par la suite comme modle de rfrence sans modification de ses paramtres. Cas ou le rseau effectue un apprentissage enligne: Commande de prdiction adaptative: ou les poids et les biais du rseau (modle prdicteur) continuent tre adapts pendant son utilisation.
Plusieurs techniques adaptatives permettent de raliser la commande d'un processus dynamique, non linaire complexe, qui peuvent tres: La commande supervise La commande non supervise, en utilisant un modle neuronale inverse du processus command, ou en utilisant un modle de rfrence direct. Pour notre application on s'intresse par ce dernier vu son adaptabilit directe au caractre prdictif.
3 Formulation dune CNPMR

Pour la formulation dune commande neuronale prdictive modle de rfrence CNPMR, on vas traiter limplmentation dun algorithme utilisant la mthode de rtro propagation de lerreur de poursuite a une estimation qui se base sur loutil des moindres carres rcursifs. En bnficiant de lapplication dune stratgie rcursive, ou peu de calculs sont effectuer en chaque itration; Ce qui permet de simplifier limplmentation du contrleur, dont le problme doptimisation est rsolu en chaque temps dchantillonnage, ou les squences de contrle optimale
Guidelines for Proceedings Manuscripts future sont dterminer. Les applications ont dmontr quun horizon de contrle large conduit un signale de contrle plus agressif, permettant une meilleur performance; Mais pour un horizon de contrle plus troit le systme de contrle devient plus robuste. Pour cela il suffit de prendre Nu =1 suffisant pour avoir une utilisation flexible pour plusieurs applications.
4 Problmatique
On veut commander un systme non linaire SNL, pour quil se comporte asymptotiquement en sortie comme un modle linaire de rfrence qui sera choisi par lutilisateur; Pour faire on a besoin dun rseau modle reprsentant Le processus non linaire, pour entraner le rseau contrleur RNC. Soit pour commander le processus pour avoir un comportement dfini par des tats dsirs, dlivrs par le modle de rfrence. on utilise le rseau modle pour prdire le changement dtat dsir du processus. Lorsque le processus tait dans ces tats initiaux le problme est que lerreur entre la sortie qui reprsente le comportement actuel du processus command lors de son fonctionnement, et la sortie dsire reprsente par une trajectoire consigne (de rfrence future) pour reprsenter le comportement dsir du processus command doit tre minimise.
4.1 La question est: Comment utiliser cette erreur pour ajuster le contrleur? 4.2 Schmatisation de la stratgie
Dans le cas non linaire; lide de base de la commande neuronale prdictive est dutiliser un modle du processus pour avoir les variations convenables des entres de commandes dans le futur, en procdant de la minimisation de la diffrence entre les sorties prdites et celles dsirables dtermines partir dune trajectoire future suivre; En utilisant une optimisation on-line, en plus de la possibilit dincorporation des contraintes en chaque temps dchantillonnage; ainsi que les variations de la squence de contrle reprsentants la puissance dentre ncessaire au processus pour changer ltat. Ce qui est apte pour stabiliser les systmes non linaires modliss par RNA autour dun point dquilibre, avec le choix dun horizon de prdiction raisonnable, en tenant compte des dynamiques inverses du systme modlises par le rseau modle. La technique repose sur lide de prdiction de la variable de sortie du systme (j pas en avant) ; Limplmentation de cette stratgie sous forme d'une commande neuronale prdictive par modle de rfrence RNMR est schmatise par la figure suivante.
PTIM LRM
y(t +1)
Processus
u (t )
ydes(t + j+1)
RNC
y(t+ j)
Fig1. Schmatisation de la CNPMR Pour faire lapprentissage du rseau contrleur RNC on propose la stratgie suivante:
MASHS 2008, Creteil
MR
Etat/cond Rfrence
RNM RNC
+ -
Commande
Fig2. Stratgie dapprentissage du RNC
4.3 Modle prdicteur

En utilisant la reprsentation tendue des systmes dynamiques non linaires en supposant que le systme commander est reprsent par un modle NNARX (neural non linaire auto regressive with exogenous inputs), ou la reprsentation est gnrale avantage pour le cas multi variables. Ralis par un RNA non rcurrent, aliment en avant (feed forward) pour modliser les tracs non linaires entre lentre et la sortie du processus command, pour permettre une prdiction avec une exactitude arbitraire ce qui garanti la formulation prdictive gnralise du modle du processus non linaire, dont la prdiction un pas en avant est formule comme suit:
y(t)=f(y(t ), y(t 2),... 1 y(t-Ny) u(t ), u(t2),....u(tNu .(1) ,( 1 ))

Avec : f(.) :Est un vecteur des fonctions non linaires ralises par le rseau de neurones, Ny, Nu :Reprsentent lhorizon de prdiction et de contrle; u(t), y(t) : Reprsentent les vecteurs entres et sorties respectivement. En gnral le vecteur f(.) prend la forme dun polynme petit ordre reprsentant les fonctions dactivation du rseau de neurones, dont il y a trois formes possibles formuler en utilisant le modle NARX: globalement rcurrent, localement rcurrent, et non rcurrent. Pour notre application on va utiliser le dernier type (non rcurrent, feed forward ) qui reprsente un type de RNA gnralis et standard. Ce dernier a t largement utilis cause de la simplicit en implmentation et son adaptabilit dapprentissage. Pour rsoudre le problme doptimisation dune commande de suivi dune trajectoire dsire, travers un horizon de temps de prdiction future, en utilisant un RNA modle dynamique du processus command. Lalgorithme utilise un optimiser convexe qui est souhaitable surtout pour les cas multivariables, sous contraintes de commande qui caractrisent les conditions denvironnement ou de fonctionnement du processus industriel command.
4.4 Optimisation
La minimisation du critre doptimisation de la commande dun systme non linaire, ou les prdictions sont dterminer par des relations non linaire entre les entres de contrle et les sorties futures, ce qui forme un problme doptimisation non linaire complexe, qui demande un temps de rponse long et une grande puissance de calcul ncessaire; Mais dans notre cas:
Guidelines for Proceedings Manuscripts Loptimisation se fait automatiquement, et dune manire implicite, ne dpendant pas des paramtres numriques de conception qui ncessite un ajustement propre pour aboutir une performance satisfaisante, dont lobjectif est de chercher la squence optimale u(t +i 1); i =1,2,......Nu qui minimise une fonction objective (de cot). Lobjective minimiser reprsente une fonction quadratique de forme: j=E(t)T E(t)+u(t)T u(t) .. (2) Avec :
E(t) : Reprsente le vecteur derreurs en sortie; E(t)=y des(t)y(t) .(3) u(t) : Reprsente le vecteur des variations de la cadence de contrle u(t)=u(t)u(t 1) .. (4)
T T j(t, u(t))=[ydes(t)y(t)] [ydes(t)y(t)]+[u(t)] [u(t)] (5)
Dou la formulation suivante: Avec :
ydest)=ydest+ ) ydest+2).........(t+NyT : vecteur des sorties dsires ( [ ( 1 ( ydes )] y(t)=[y(t +1) y(t +2).........(t +Ny)]T : vecteur des sorties prdites y u(t)=[u(t) u(t +1).........u(t + Nu 1)]T .(6)
La plupart des applications industrielles ont utilis lapproximation des modles dynamiques linaires, dont la technique base sur les rseaux de neurones adaptatifs pour dvelopper les modles dynamiques non linaires en se basant sur lide principale dun horizon de prdiction caractrisant la stratgie du contrle prdictif gnralis qui se base sur le modle prdicteur (j pas en avant), qui peut tre driv pour une large gamme de processus dynamiques linaires. Lapproche est flexible pour plusieurs applications industrielles comme un outil puissant pour stabiliser les processus linaires instables en boucle ouverte, et processus a non minimum de phase, comme cest tendu pour les systmes non linaires complexes En procdant par la rsolution dun problme doptimisation convexe pour les actions de contrle en chaque temps dchantillonnage, loptimiser calcul les actions de contrles futures qui minimisent la diffrence entre la sortie du modle et celle du processus travers un horizon de temps futur dont la formulation dun problme de programmation non linaire est utilis pour minimiser une fonction objective de la forme suivante:
J= e(t+ j)]T Q[e(t+ j)]+ u(t+ j)]T R[u(t+ j)] (7) [ [

j =1 j =0
j =NY
Nu1
Sous les contraintes:
umin u(t + j)umax pour j =0,1,....Nu 1 umin u(t + j)umax // // // . (8) Avec : e(t + j)=yref (t + j)y(t+ j) ; j=1,2,...Ny ....(9) u(t + j)=u(t + j)u(t + j1) ; j=0,1,...Nu1 ...(10)
Avec : y ref (t+ j) : est le vecteur des trajectoires dsires suivre par les sorties du processus command; y(t+ j) est le vecteur des sorties prdites par le rseau modle commandes par le rseau contrleur; Nu et Ny reprsentent lhorizon de contrle et de prdiction respectivement ; Q et R sont les matrices de pondration. En utilise P modles prdicteurs en cascade pour avoir
MASHS 2008, Creteil un horizon de prdiction de taille P, ou on fait reboucler la sortie vers lentre durant P tapes en gardant les entres/sorties prdites travers un horizon de taille P
y(t +1/t)= f(y(t),...y(t Ny+1), u(t),.....u(t Nu+1) y(t +2/t)= f(y(t +1),...y(t Ny+2), u(t),.....u(t Nu+2) y(t + j /t)= f(y(t),...y(t j+1), u(t)) ;pour Nu jNY ... (11)
Lobjectif est davoir une action de contrle future, optimale, ( travers un horizon de prdiction fini) qui sera applique lentre du processus command, et la procdure sera rpte au prochain temps dchantillonnage, ou le problme doptimisation sera rsolu pour gnrer la prochaine action de contrle optimal future; La procdure doptimisation sera rpte en chaque temps dchantillonnage et garde toujours la convexit de la fonction objective minimiser.
4.5 Paramtres de rglage

Les paramtres de rglage sont: Lhorizon de prdiction, et la matrice de pondration , en gnral un long horizon de contrle rend laction de commande plus agressive; Mais pour des raisons de simplification de limplmentation on limite lhorizon de contrle un et usuellement une forme diagonale de la matrice de pondration est gnralement adopte.
5 Algorithme dapprentissage
Lapprentissage du rseau est un problme doptimisation non linaire, en utilisant la mthode de rtro propagation gradient descendant dont lobjectif est de minimiser la somme des carrs des erreurs entre les sorties du rseau est celles dsires en ajustant les poids:
minf = y j d j
j =1
.. (12)
p est le nombre ditrations valables pour lapprentissage

Un algorithme de rtro propagation standard est utilis pour la mise jour des poids: w(t +1)= w(t)+d(t) .. (13) Avec : d est le pas de recherche de direction gradient descendant
d(t)=g(t)=
j w
(14)
Dans cet algorithme, la recherche de direction actuelle est une combinaison linaire du vecteur gradient et la direction de recherche prvue, ne demande pas un grand nombre ditrations, en plus il permet davoir une grande puissance de calcul compar aux mthodes de second ordre qui se basent sur le calcul des matrices Hessiennes. On va essayer de concevoir une commande neuronale, de prdiction adaptative dun systme non linaire on procdant du contrle de ces variables de sortie, En utilisant comme exemple lactionneur dune antenne arme, ou le bras dun robot. On va contrler la position par commande des variations de langle, et la vitesse angulaire du mouvement du moteur actionneur. On va concevoir un rseau contrleur qui prend les tats initiaux et cibles comme des entres, et la sortie le courant (puissance) appliquer au moteur pour avoir ltat cible (dsir) au prochain temps dchantillonnage pour la conception du rseau contrleur on doit avoir des exemples
Guidelines for Proceedings Manuscripts dtats initiaux et cibles en prenant toutes les combinaisons possibles avec un ensemble de plusieurs tats initiaux en tenant en compte des conditions initiales (position et vitesse), en prenant toutes les combinaisons possibles de ces valeurs avec un ensemble des tats initiaux, on obtient une matrice comprenant les informations [tats/entres conditions] ou les tats reprsentent langle et la vitesse angulaire ; et lentre reprsente le courant appliquer linducteur du moteur; ainsi chacune de ces combinaisons (tats/conditions dentre) est applique au modle linaire de rfrence, et ses tats futures sont mesurs, les tats futures consistent en langle dsir et la vitesse correspondante aprs chaque laps de temps. Les rsultats sont regroups dans une matrice deux tats futures (angle et vitesse). Pour le contrleur on utilise des rseaux ayant 8 neurones en couche cache et un neurone en couche de sortie donnant le courant. Le rseau de neurones a pour but de fournir, chaque instant d'chantillonnage, la variation de la commande u =u(t)u(t 1) ; et lerreur future de la sortie permet de corriger chaque instant la commande qui permet de minimiser lcart entre la sortie et la rfrence. A partir des valeurs antrieures des entres/sorties; Pour raliser la commande prdictive par modle de rfrence on passe par trois tapes principales qui sont : 1. L'identification du modle neuronal du processus 2. Conception du rseau contrleur associ 3. La gnralisation de la commande Pour l'apprentissage du rseau, on utilise la mthode de rtro propagation de l'erreur de sortie, les poids et le biais sont initialiss des valeurs alatoires de distribution uniforme avec la contrainte de limitation du signal de commande u(t) entre 0.5 et +0.5. Le gain d'adaptation " " est fix convenablement la performance d'volution de la sortie prdite, tous le fichier entres/sorties est prsent au rseau durant un nombre d'itrations "N" assez important. Aprs l'apprentissage les matrices des poids et les vecteurs de biais sont sauvegards sous forme de tableaux. Qu' partir desquels on peut expliciter et tracer l'volution de tous les poids et les biais de la couche d'entre et de la couche cache. Pour vrifier la qualit d'apprentissage on utilise les mmes signaux que l'on applique au rseau dont les poids et les biais sont figs aux valeurs finales, la comparaison de la variation de commande en sortie du modle et celles du fichier tats initiaux et tats cibles. Prenons le cas du mouvement dun bras dun robot, ou dune antenne arme; li un moteur actionneur modlis par le modle non linaire suivant:
x1 = x 2 ... (15) x1 =9.81sin(x1)2x2 +u .(16)

Avec : x1 : Reprsente langle dvolution; x2 reprsente la vitesse angulaire dvolution. u : Reprsente la puissance applique au moteur ; 9.81sin(x1) et 2x2 : Reprsentent la force de gravit, et de frottement respectivement.
MASHS 2008, Creteil
6 Applications
On veut commander le processus non linaire pour que son comportement en boucle ferme soit quivalent un systme linaire de rfrence dsire. Soit pour notre exemple, ou le modle de rfrence linaris est le suivant: x1 = x2 .(17) x1 =10x1 2x2 +10d ... (18) Avec : d : Reprsente langle dsir; En utilisant des valeurs quelconques couvrant la plage de fonctionnement du processus Pour faire lapprentissage du rseau modle On propose les valeurs exemples suivantes: angle (radiants) = 0 0.52 1..04 1.57 0.52 1.04 2.09 2.61 3.14 3.14 3.00 2.09
vitesse (radient/sec) = 0 puissance ( watts) = angledes (radiants) = 0 0
1.57 2.09 2.61 2.00 2.50 1.39
0.50 1.00 1.50 0.34 0.69 1.04
1.74
On sauvegarde toutes les combinaisons de ces donns dans un fichier (base de donnes) pour lapprentissage du rseau modle du processus.
6.1 Conception et apprentissage du rseau modle

On fait la conception dun rseau ayant: une entre/deux sorties; et 4 neurones en couche cache, dans une architecture non rcurrente, en utilisant les fonctions de transfert tansig pour la couche cache et purlin pour la sortie; En utilisant une frquence de progression = 5 en fonction des poques dapprentissage sur un horizon de 200 poques, une erreur prs=0.0015^2=2.25e-006 (Mean-squared error goal). Le tableau suivant montre les rsultats dapprentissage du rseau modle du processus non linaire, ce qui montre la diminution du gradient, avec la diminution de lerreur rtro propage au rseau pour lajustage des poids et des biais, le processus dajustage sarrte lors que lerreur atteint sa valeur minimale.
6.2 Vrification de la rponse du rseau modle entran

Pour tester le comportement du rseau modle entran par les donnes entres /sorties du processus non linaire: On va simuler sa rponse aux conditions initiales (angle=2 deg ; vitesse=0 ; puissance=0), durant 10 secondes: En boucle ouverte; Puis sa rponse en boucle ferme, en les comparant celles du processus modlis (ici on a utilis un modle mathmatique).
6.2.1 Rponse en boucle ouverte

La rponse en boucle ouverte du rseau modle entran et superpose celle du processus non linaire dans la (Fig.) suivante:
Guidelines for Proceedings Manuscripts
300 Angle (deg) 200 100 0
R p o n se d u p ro ce ssu s R p o n se d u r se a u mo d le +
4 T e mp s (se c)
10
300 Vitesse (deg/sec) 200 100 0 -1 0 0 0 2 4 T e mp s (se c) 6 8 10 R p o n se e n b o u cle o u ve rte
Fig3. Courbes comparatives des rponses en boule ouverte
6.2.2 Rponse en boucle ferme

Comme prcdemment la courbe de la rponse en boucle ferme du rseau modle entran et superpose celle du processus non linaire dans la Fig4 suivante:
300 Angle (deg) 200 100 0
4 T e m p s (se c)
10
300 Vitesse (deg/sec) 200 100 0 -1 0 0 0 2 4 T e m p s (se c) 6 8 10
Fig4 Courbes comparatives des rponses en boucle ferme Daprs les rsultats obtenus (les courbes sont bien superposes) il savre que le rseau modle entran se comporte comme le systme non linaire (reprsent par le modle mathmatique) mis en question. Donc lapprentissage est russissant. On va voir par la suite comment utiliser ce rseau modle pour la conception du rseau contrleur.
6.3 Conception et apprentissage du rseau contrleur

Le rseau contrleur est entran en utilisant le rseau modle du processus non linaire pour rtro propager lerreur du systme au contrleur pour commander lvolution en sorti dun systme non linaire ayant un comportement dynamique non linaire durant son volution. Le systme entier est accord un modle linaire de rfrence MRL appropri. Pour faire: On ralise la stratgie indique en Fig.2 en utilisant le rseau modle entran caractris par ses (poids et biais).
MASHS 2008, Creteil Prenons comme exemple de donnes entres/ sorties reprsentants les tats initiaux et tats cibles avec des conditions initiales, et contraintes de limitation sur lentre: Etats initiaux: -Angle = [0:20:180]deg ; vitesse ang = [0:20:180]deg/sec ; -Cond initiales:angle =0 ; vitesseang =0 ; puissance = 0 -Contrainte sur la commande: -5 Puissance +5 -Les tats cibles sont obtenus par simulation du modle linaire de rfrence.
6.4 Test et gnralisation de la commande

Aprs lapprentissage du rseau contrleur, on fait des applications de test et de gnralisation de commande du processus non linaire, pour ladaptation du rseau modle prdicteur associ au contrleur. On mesure et on trace la rponse du systme pour quatre secondes.
7 Rsultats de tests
10
0
10
-1
P e r fo r m a n c e : 0 .0 0 1 6 0 6 7 7 , G o a l : 2 .2 5 e - 0 0 6
10
-2
10
-3
10
-4
10
-5
10
-6
20
40 60 100 Epochs
80
100
Fig5. Rsultats dapprentissage du rseau contrleur (prdicteur 3pas en avant) aprs 100 itrations
100 Angle (deg)
50
Rponse dsire ... Rponse commande -
0.5
1.5
2.5
3.5
100 Vitesse (deg/sec) 50 0 -50
0.5
1.5
2 2.5 Temps (sec)
3.5
Fig6. Rsultats du test du contrleur prdicteur 3pas en avant Entran en 100 itrations
Guidelines for Proceedings Manuscripts

0
10
10
-1
P e r f o r m a n c e : 1 . 2 2 1 8 4 e - 0 0 5 , G o a l: 2 . 2 5 e - 0 0 6 10
-2
10
-3
10
-4
10
-5
10
-6
100
200
300 600 Epochs
400
500
600
Fig7. Rsultat dapprentissage du rseau contrleur (prdicteur 3pas en avant ) aprs 600 itrations
100 Angle (deg) R p o n s e d s ir e ... R ponse command -
50
0 .5
1 .5
2 .5
3 .5
100 Vitesse (deg/sec)
50
0 .5
1 .5
2 2 .5 T e m p s (se c)
3 .5
Fig8. Rsultats du test du contrleur (prdicteur 3pas en avant) Entran par 600 itration
100 Angle (deg)
50
0.5
1.5
2.5
3.5
100 Vitesse (deg/sec)
50
0.5
1.5
2 2.5 Temps (sec)
3.5
Fig9. Rsultats du test du contrleur (prdicteur 6pas en avant) Entran en 100 itration
8. Conclusion
Lapplication montr que lamlioration de la performance de sortie du systme non linaire command est ralise avec laugmentation du nombre ditrations dapprentissage du rseau contrleur pour quil soit capable de modliser les dynamiques non linaires du processus. Ceci se
MASHS 2008, Creteil voit bien en comparant entre les rsultats dapprentissage du rseau contrleur. En faisant augmenter lhorizon de prdiction en gardant le mme nombre ditrations dapprentissage. On constate une amlioration de la performance en ralisant un suivi asymptotique de la trajectoire de sortie du modle linaire de rfrence. Dans ce cas on a fait une Feedback linarisation du problme doptimisation dune commande neuronale prdictive le long dun horizon de prdiction fuyant du processus non linaire, ou la linarisation se fait en chaque temps dchantillonnage par extraction dun modle linaire du processus en ajustant les biais et les poids du rseau prdicteur intgr dans le rseau contrleur pour gnrer la commande optimale appliquer au processus non linaire pour quil se comporte en comme le modle linaire de rfrence appropri. La commande est prdictive gnralise, adaptative en temps rel.
Rfrences
[1] Ahmed. K and Shutharsanan S. I, "Identification and Decentralized Adaptative Control Using Dynamical Neural Networks with Application to Robotic Manipulator", IEEE. Trans. On Neural Networks, Vol. 3. pp 919-929, October 1992. [2] Balestino. A et al, "Non linear Adaptive Control, Model Following Control", Automatica, Vol 20, N5, pp. 559-568, 1984. [3] Biggs M. C, "Constrained Minimization Using Recursive Quadratic Programming", Towards Global Optimization (L.C.W.Dixon and G.P.Szergo, eds.), North-Holland, pp. 341-349, 1975. [4] Boucher..P, Dumur. D, Giaffreda. D, "Delta Constrained Receding Horizon Predictive Control", IEEE, International Conference on Control Application Proceeding , Hartford, Ct October 5-7, 1997. [5] Carlos. B and Eduardo F. Camacho, "Generalized Predictive Controller For a Wide Class of Industrial Processes", IEEE Transaction on control systems technology, Vol. 6, NO. 3,MAY 1998. [6] Chen F.C, "Back-Propagation Neural Networks for Non linear Self-Tuning Adaptive Control", IEEE Control Systems Magazine. Vol. 10,N3, April, 1990. [7] Hilbert J. L, Guez. A and Kam. M, "Neural Networks Architecture for Control", IEEE Control Systems Magazine, 1988. [8] Freeman, J.D and Skapura. M, "Neural Networks Algorithms, Applications, and Programming Technique", Addison Wesley Company, 1992.

Le Best Pour L'annlyse

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Le Best Pour L'annlyse

Uploaded by

Copyright:

Available Formats

Techniques Adaptatives Du Contrle Neuronal Utilisant un Modle linaire De Rfrence Pour Les Systmes Dynamiques Non Linaires Complexes

(Applications Sociaux Humaines)

MASHS 2008, Creteil

2 Commandes neuronales prdictives

3 Formulation dune CNPMR

MASHS 2008, Creteil

Fig2. Stratgie dapprentissage du RNC

4.3 Modle prdicteur

y(t)=f(y(t ), y(t 2),... 1 y(t-Ny) u(t ), u(t2),....u(tNu .(1) ,( 1 ))

Dou la formulation suivante: Avec :

J= e(t+ j)]T Q[e(t+ j)]+ u(t+ j)]T R[u(t+ j)] (7) [ [

Sous les contraintes:

4.5 Paramtres de rglage

p est le nombre ditrations valables pour lapprentissage

x1 = x 2 ... (15) x1 =9.81sin(x1)2x2 +u .(16)

MASHS 2008, Creteil

vitesse (radient/sec) = 0 puissance ( watts) = angledes (radiants) = 0 0

1.57 2.09 2.61 2.00 2.50 1.39

0.50 1.00 1.50 0.34 0.69 1.04

6.1 Conception et apprentissage du rseau modle

6.2 Vrification de la rponse du rseau modle entran

6.2.1 Rponse en boucle ouverte

Guidelines for Proceedings Manuscripts

300 Angle (deg) 200 100 0

300 Vitesse (deg/sec) 200 100 0 -1 0 0 0 2 4 T e mp s (se c) 6 8 10 R p o n se e n b o u cle o u ve rte

Fig3. Courbes comparatives des rponses en boule ouverte

6.2.2 Rponse en boucle ferme

300 Vitesse (deg/sec) 200 100 0 -1 0 0 0 2 4 T e m p s (se c) 6 8 10

6.3 Conception et apprentissage du rseau contrleur

6.4 Test et gnralisation de la commande

100 Angle (deg)

Rponse dsire ... Rponse commande -

100 Vitesse (deg/sec) 50 0 -50

2 2.5 Temps (sec)

Guidelines for Proceedings Manuscripts

300 600 Epochs

100 Vitesse (deg/sec)

100 Vitesse (deg/sec)

2 2.5 Temps (sec)

You might also like