Professional Documents
Culture Documents
1 Introduction
On cherche concevoir une commande neuronale prdictive adaptative pour contrler un systme ayant un comportement dynamique non linaire multivariables pour raliser un suivi de trajectoire gnre par la sortie dun modle de rfrence, linaire, appropri. En ralisant la linarisation par retour du processus non linaire tel que lerreur de sortie est rtro propage au rseau contrleur qui est une combinaison du rseau contrleur entran et le rseau modle (prdicteur j pas en avant), dont la rsolution du problme doptimisation se fait le long dun horizon fuyant[1, 4], la linarisation se fait en chaque laps de temps dchantillonnage par extraction dun modle linaire du processus en ajustant les biais et les poids du rseau prdicteur intgr dan le rseau contrleur pour donner la commande optimale appliquer au processus command pour quil se comporte comme le modle linaire de rfrence appropri. La commande est gnralise, adaptative en temps rel, ce qui permet dadresser aux non-linarits du processus command. Tel que pour des processus dynamiques non linaires l'adaptation des rseaux de neurones est le moyen le plus efficace pour que l'excution du contrleur soit maintenue.
Lapplication est souple, optimale, pourra tre gnralise et implmente pour des institutions industrielles, conomiques ou sociaux humaines tels que la commande du mouvement dun fauteuil roulant qui permet de faciliter la vie aux handicapes, ou la commande du mouvement dun bras manipulateur pour l'utilisation aux svices sociaux multitches.
Plusieurs techniques adaptatives permettent de raliser la commande d'un processus dynamique, non linaire complexe, qui peuvent tres: La commande supervise La commande non supervise, en utilisant un modle neuronale inverse du processus command, ou en utilisant un modle de rfrence direct. Pour notre application on s'intresse par ce dernier vu son adaptabilit directe au caractre prdictif.
Guidelines for Proceedings Manuscripts future sont dterminer. Les applications ont dmontr quun horizon de contrle large conduit un signale de contrle plus agressif, permettant une meilleur performance; Mais pour un horizon de contrle plus troit le systme de contrle devient plus robuste. Pour cela il suffit de prendre Nu =1 suffisant pour avoir une utilisation flexible pour plusieurs applications.
4 Problmatique
On veut commander un systme non linaire SNL, pour quil se comporte asymptotiquement en sortie comme un modle linaire de rfrence qui sera choisi par lutilisateur; Pour faire on a besoin dun rseau modle reprsentant Le processus non linaire, pour entraner le rseau contrleur RNC. Soit pour commander le processus pour avoir un comportement dfini par des tats dsirs, dlivrs par le modle de rfrence. on utilise le rseau modle pour prdire le changement dtat dsir du processus. Lorsque le processus tait dans ces tats initiaux le problme est que lerreur entre la sortie qui reprsente le comportement actuel du processus command lors de son fonctionnement, et la sortie dsire reprsente par une trajectoire consigne (de rfrence future) pour reprsenter le comportement dsir du processus command doit tre minimise.
4.1 La question est: Comment utiliser cette erreur pour ajuster le contrleur? 4.2 Schmatisation de la stratgie
Dans le cas non linaire; lide de base de la commande neuronale prdictive est dutiliser un modle du processus pour avoir les variations convenables des entres de commandes dans le futur, en procdant de la minimisation de la diffrence entre les sorties prdites et celles dsirables dtermines partir dune trajectoire future suivre; En utilisant une optimisation on-line, en plus de la possibilit dincorporation des contraintes en chaque temps dchantillonnage; ainsi que les variations de la squence de contrle reprsentants la puissance dentre ncessaire au processus pour changer ltat. Ce qui est apte pour stabiliser les systmes non linaires modliss par RNA autour dun point dquilibre, avec le choix dun horizon de prdiction raisonnable, en tenant compte des dynamiques inverses du systme modlises par le rseau modle. La technique repose sur lide de prdiction de la variable de sortie du systme (j pas en avant) ; Limplmentation de cette stratgie sous forme d'une commande neuronale prdictive par modle de rfrence RNMR est schmatise par la figure suivante.
PTIM LRM
y(t +1)
Processus
u (t )
ydes(t + j+1)
RNC
y(t+ j)
Fig1. Schmatisation de la CNPMR Pour faire lapprentissage du rseau contrleur RNC on propose la stratgie suivante:
MR
Etat/cond Rfrence
RNM RNC
+ -
Commande
4.4 Optimisation
La minimisation du critre doptimisation de la commande dun systme non linaire, ou les prdictions sont dterminer par des relations non linaire entre les entres de contrle et les sorties futures, ce qui forme un problme doptimisation non linaire complexe, qui demande un temps de rponse long et une grande puissance de calcul ncessaire; Mais dans notre cas:
Guidelines for Proceedings Manuscripts Loptimisation se fait automatiquement, et dune manire implicite, ne dpendant pas des paramtres numriques de conception qui ncessite un ajustement propre pour aboutir une performance satisfaisante, dont lobjectif est de chercher la squence optimale u(t +i 1); i =1,2,......Nu qui minimise une fonction objective (de cot). Lobjective minimiser reprsente une fonction quadratique de forme: j=E(t)T E(t)+u(t)T u(t) .. (2) Avec :
E(t) : Reprsente le vecteur derreurs en sortie; E(t)=y des(t)y(t) .(3) u(t) : Reprsente le vecteur des variations de la cadence de contrle u(t)=u(t)u(t 1) .. (4)
T T j(t, u(t))=[ydes(t)y(t)] [ydes(t)y(t)]+[u(t)] [u(t)] (5)
ydest)=ydest+ ) ydest+2).........(t+NyT : vecteur des sorties dsires ( [ ( 1 ( ydes )] y(t)=[y(t +1) y(t +2).........(t +Ny)]T : vecteur des sorties prdites y u(t)=[u(t) u(t +1).........u(t + Nu 1)]T .(6)
La plupart des applications industrielles ont utilis lapproximation des modles dynamiques linaires, dont la technique base sur les rseaux de neurones adaptatifs pour dvelopper les modles dynamiques non linaires en se basant sur lide principale dun horizon de prdiction caractrisant la stratgie du contrle prdictif gnralis qui se base sur le modle prdicteur (j pas en avant), qui peut tre driv pour une large gamme de processus dynamiques linaires. Lapproche est flexible pour plusieurs applications industrielles comme un outil puissant pour stabiliser les processus linaires instables en boucle ouverte, et processus a non minimum de phase, comme cest tendu pour les systmes non linaires complexes En procdant par la rsolution dun problme doptimisation convexe pour les actions de contrle en chaque temps dchantillonnage, loptimiser calcul les actions de contrles futures qui minimisent la diffrence entre la sortie du modle et celle du processus travers un horizon de temps futur dont la formulation dun problme de programmation non linaire est utilis pour minimiser une fonction objective de la forme suivante:
j =NY
Nu1
umin u(t + j)umax pour j =0,1,....Nu 1 umin u(t + j)umax // // // . (8) Avec : e(t + j)=yref (t + j)y(t+ j) ; j=1,2,...Ny ....(9) u(t + j)=u(t + j)u(t + j1) ; j=0,1,...Nu1 ...(10)
Avec : y ref (t+ j) : est le vecteur des trajectoires dsires suivre par les sorties du processus command; y(t+ j) est le vecteur des sorties prdites par le rseau modle commandes par le rseau contrleur; Nu et Ny reprsentent lhorizon de contrle et de prdiction respectivement ; Q et R sont les matrices de pondration. En utilise P modles prdicteurs en cascade pour avoir
MASHS 2008, Creteil un horizon de prdiction de taille P, ou on fait reboucler la sortie vers lentre durant P tapes en gardant les entres/sorties prdites travers un horizon de taille P
y(t +1/t)= f(y(t),...y(t Ny+1), u(t),.....u(t Nu+1) y(t +2/t)= f(y(t +1),...y(t Ny+2), u(t),.....u(t Nu+2) y(t + j /t)= f(y(t),...y(t j+1), u(t)) ;pour Nu jNY ... (11)
Lobjectif est davoir une action de contrle future, optimale, ( travers un horizon de prdiction fini) qui sera applique lentre du processus command, et la procdure sera rpte au prochain temps dchantillonnage, ou le problme doptimisation sera rsolu pour gnrer la prochaine action de contrle optimal future; La procdure doptimisation sera rpte en chaque temps dchantillonnage et garde toujours la convexit de la fonction objective minimiser.
5 Algorithme dapprentissage
Lapprentissage du rseau est un problme doptimisation non linaire, en utilisant la mthode de rtro propagation gradient descendant dont lobjectif est de minimiser la somme des carrs des erreurs entre les sorties du rseau est celles dsires en ajustant les poids:
minf = y j d j
j =1
.. (12)
d(t)=g(t)=
j w
(14)
Dans cet algorithme, la recherche de direction actuelle est une combinaison linaire du vecteur gradient et la direction de recherche prvue, ne demande pas un grand nombre ditrations, en plus il permet davoir une grande puissance de calcul compar aux mthodes de second ordre qui se basent sur le calcul des matrices Hessiennes. On va essayer de concevoir une commande neuronale, de prdiction adaptative dun systme non linaire on procdant du contrle de ces variables de sortie, En utilisant comme exemple lactionneur dune antenne arme, ou le bras dun robot. On va contrler la position par commande des variations de langle, et la vitesse angulaire du mouvement du moteur actionneur. On va concevoir un rseau contrleur qui prend les tats initiaux et cibles comme des entres, et la sortie le courant (puissance) appliquer au moteur pour avoir ltat cible (dsir) au prochain temps dchantillonnage pour la conception du rseau contrleur on doit avoir des exemples
Guidelines for Proceedings Manuscripts dtats initiaux et cibles en prenant toutes les combinaisons possibles avec un ensemble de plusieurs tats initiaux en tenant en compte des conditions initiales (position et vitesse), en prenant toutes les combinaisons possibles de ces valeurs avec un ensemble des tats initiaux, on obtient une matrice comprenant les informations [tats/entres conditions] ou les tats reprsentent langle et la vitesse angulaire ; et lentre reprsente le courant appliquer linducteur du moteur; ainsi chacune de ces combinaisons (tats/conditions dentre) est applique au modle linaire de rfrence, et ses tats futures sont mesurs, les tats futures consistent en langle dsir et la vitesse correspondante aprs chaque laps de temps. Les rsultats sont regroups dans une matrice deux tats futures (angle et vitesse). Pour le contrleur on utilise des rseaux ayant 8 neurones en couche cache et un neurone en couche de sortie donnant le courant. Le rseau de neurones a pour but de fournir, chaque instant d'chantillonnage, la variation de la commande u =u(t)u(t 1) ; et lerreur future de la sortie permet de corriger chaque instant la commande qui permet de minimiser lcart entre la sortie et la rfrence. A partir des valeurs antrieures des entres/sorties; Pour raliser la commande prdictive par modle de rfrence on passe par trois tapes principales qui sont : 1. L'identification du modle neuronal du processus 2. Conception du rseau contrleur associ 3. La gnralisation de la commande Pour l'apprentissage du rseau, on utilise la mthode de rtro propagation de l'erreur de sortie, les poids et le biais sont initialiss des valeurs alatoires de distribution uniforme avec la contrainte de limitation du signal de commande u(t) entre 0.5 et +0.5. Le gain d'adaptation " " est fix convenablement la performance d'volution de la sortie prdite, tous le fichier entres/sorties est prsent au rseau durant un nombre d'itrations "N" assez important. Aprs l'apprentissage les matrices des poids et les vecteurs de biais sont sauvegards sous forme de tableaux. Qu' partir desquels on peut expliciter et tracer l'volution de tous les poids et les biais de la couche d'entre et de la couche cache. Pour vrifier la qualit d'apprentissage on utilise les mmes signaux que l'on applique au rseau dont les poids et les biais sont figs aux valeurs finales, la comparaison de la variation de commande en sortie du modle et celles du fichier tats initiaux et tats cibles. Prenons le cas du mouvement dun bras dun robot, ou dune antenne arme; li un moteur actionneur modlis par le modle non linaire suivant:
6 Applications
On veut commander le processus non linaire pour que son comportement en boucle ferme soit quivalent un systme linaire de rfrence dsire. Soit pour notre exemple, ou le modle de rfrence linaris est le suivant: x1 = x2 .(17) x1 =10x1 2x2 +10d ... (18) Avec : d : Reprsente langle dsir; En utilisant des valeurs quelconques couvrant la plage de fonctionnement du processus Pour faire lapprentissage du rseau modle On propose les valeurs exemples suivantes: angle (radiants) = 0 0.52 1..04 1.57 0.52 1.04 2.09 2.61 3.14 3.14 3.00 2.09
1.74
On sauvegarde toutes les combinaisons de ces donns dans un fichier (base de donnes) pour lapprentissage du rseau modle du processus.
R p o n se d u p ro ce ssu s R p o n se d u r se a u mo d le +
4 T e mp s (se c)
10
4 T e m p s (se c)
10
Fig4 Courbes comparatives des rponses en boucle ferme Daprs les rsultats obtenus (les courbes sont bien superposes) il savre que le rseau modle entran se comporte comme le systme non linaire (reprsent par le modle mathmatique) mis en question. Donc lapprentissage est russissant. On va voir par la suite comment utiliser ce rseau modle pour la conception du rseau contrleur.
MASHS 2008, Creteil Prenons comme exemple de donnes entres/ sorties reprsentants les tats initiaux et tats cibles avec des conditions initiales, et contraintes de limitation sur lentre: Etats initiaux: -Angle = [0:20:180]deg ; vitesse ang = [0:20:180]deg/sec ; -Cond initiales:angle =0 ; vitesseang =0 ; puissance = 0 -Contrainte sur la commande: -5 Puissance +5 -Les tats cibles sont obtenus par simulation du modle linaire de rfrence.
7 Rsultats de tests
10
0
10
-1
P e r fo r m a n c e : 0 .0 0 1 6 0 6 7 7 , G o a l : 2 .2 5 e - 0 0 6
10
-2
10
-3
10
-4
10
-5
10
-6
20
40 60 100 Epochs
80
100
Fig5. Rsultats dapprentissage du rseau contrleur (prdicteur 3pas en avant) aprs 100 itrations
50
0.5
1.5
2.5
3.5
0.5
1.5
3.5
Fig6. Rsultats du test du contrleur prdicteur 3pas en avant Entran en 100 itrations
10
10
-1
P e r f o r m a n c e : 1 . 2 2 1 8 4 e - 0 0 5 , G o a l: 2 . 2 5 e - 0 0 6 10
-2
10
-3
10
-4
10
-5
10
-6
100
200
400
500
600
Fig7. Rsultat dapprentissage du rseau contrleur (prdicteur 3pas en avant ) aprs 600 itrations
100 Angle (deg) R p o n s e d s ir e ... R ponse command -
50
0 .5
1 .5
2 .5
3 .5
50
0 .5
1 .5
2 2 .5 T e m p s (se c)
3 .5
Fig8. Rsultats du test du contrleur (prdicteur 3pas en avant) Entran par 600 itration
100 Angle (deg)
50
0.5
1.5
2.5
3.5
50
0.5
1.5
3.5
Fig9. Rsultats du test du contrleur (prdicteur 6pas en avant) Entran en 100 itration
8. Conclusion
Lapplication montr que lamlioration de la performance de sortie du systme non linaire command est ralise avec laugmentation du nombre ditrations dapprentissage du rseau contrleur pour quil soit capable de modliser les dynamiques non linaires du processus. Ceci se
MASHS 2008, Creteil voit bien en comparant entre les rsultats dapprentissage du rseau contrleur. En faisant augmenter lhorizon de prdiction en gardant le mme nombre ditrations dapprentissage. On constate une amlioration de la performance en ralisant un suivi asymptotique de la trajectoire de sortie du modle linaire de rfrence. Dans ce cas on a fait une Feedback linarisation du problme doptimisation dune commande neuronale prdictive le long dun horizon de prdiction fuyant du processus non linaire, ou la linarisation se fait en chaque temps dchantillonnage par extraction dun modle linaire du processus en ajustant les biais et les poids du rseau prdicteur intgr dans le rseau contrleur pour gnrer la commande optimale appliquer au processus non linaire pour quil se comporte en comme le modle linaire de rfrence appropri. La commande est prdictive gnralise, adaptative en temps rel.
Rfrences
[1] Ahmed. K and Shutharsanan S. I, "Identification and Decentralized Adaptative Control Using Dynamical Neural Networks with Application to Robotic Manipulator", IEEE. Trans. On Neural Networks, Vol. 3. pp 919-929, October 1992. [2] Balestino. A et al, "Non linear Adaptive Control, Model Following Control", Automatica, Vol 20, N5, pp. 559-568, 1984. [3] Biggs M. C, "Constrained Minimization Using Recursive Quadratic Programming", Towards Global Optimization (L.C.W.Dixon and G.P.Szergo, eds.), North-Holland, pp. 341-349, 1975. [4] Boucher..P, Dumur. D, Giaffreda. D, "Delta Constrained Receding Horizon Predictive Control", IEEE, International Conference on Control Application Proceeding , Hartford, Ct October 5-7, 1997. [5] Carlos. B and Eduardo F. Camacho, "Generalized Predictive Controller For a Wide Class of Industrial Processes", IEEE Transaction on control systems technology, Vol. 6, NO. 3,MAY 1998. [6] Chen F.C, "Back-Propagation Neural Networks for Non linear Self-Tuning Adaptive Control", IEEE Control Systems Magazine. Vol. 10,N3, April, 1990. [7] Hilbert J. L, Guez. A and Kam. M, "Neural Networks Architecture for Control", IEEE Control Systems Magazine, 1988. [8] Freeman, J.D and Skapura. M, "Neural Networks Algorithms, Applications, and Programming Technique", Addison Wesley Company, 1992.