You are on page 1of 22

6.

Control Adaptable
Dr. Martn Velasco Villa

Secci
on de Mecatr
onica
Abril de 2015

Control Adaptable

El control adaptable es una forma alternativa de resolver problemas de control


sujetas a incertidumbres en el modelo.

En un control adaptable los parametros del controlador varan en el tiempo,


basado en un mecanismo que considera las se
nales del sistema y, por lo tanto, el
ajuste en los parametros se realiza en lnea.

Existen dos enfoques principales:


a). Control adaptable basado en modelo de referencia.
b). M
etodo de autosintonizaci
on.
Estos enfoques presentan las siguientes configuraciones generales

Basado en modelo de referencia (a.


Parametros estimados)

Basado en autosintonizaci
on

N
otese que:
f 0 ; f converge
a). El hecho que f 0 no implica que f (t ) tiene un lmite cuando t .
cos(log t )
f (t ) =
0 cuando t pero f (t ) se mantiene oscilando (cada vez
t
mas peque
no).
b). f converge ; f 0.
El hecho que f (t ) tenga un limite cuando t no implica que f (t ) 0

f (t ) = e t sin e 2t .

c). Si f es acotada por abajo y decreciente f 0 entonces f converge a un limite.
Bajo que condiciones f converge a cero?
Lema 1 (Barbalat)
Si la funci
on diferenciable f (t ) tiene un lmite (finito) cuando t , y si f es
uniformemente continua, entonces f (t ) 0 cuando t .
I

Una condici
on suficiente para que una funci
on diferenciable sea uniformemente
continua es que su derivada sea acotada.

Modelo de Referencia

En un esquema basado en modelo de referencia, el modelo de referencia provee el


valor deseado de la salida del sistema.

La planta tiene una estructura conocida con parametros desconocidos.

El modelo de referencia constituye la respuesta ideal del sistema.

La ley de adaptaci
on ajusta los parametros de la ley de control.

Para ejemplificar este enfoque considere el sistema,


mx (t ) = u (t )

(1)

que representa el movimiento de una masa libre de fricci


on, donde u (t ) es la se
nal de
entrada (fuerza).

Suponga que se desea seguir una trayectoria xm generada a partir del modelo din
amico,
xm + 1 x m + 2 xm = r (t ) ,

1 , 2 > 0,

r (t ) : entrada

(2)

Idealmente, se pide que la masa m sigua la trayectoria especificada por la entrada r (t )


amortiguada a partir de la din
amica (2) (sistema masa-resorte).
Si la masa se conoce de manera exacta, la retroalimentaci
on,

u = m xm + 2x 2 x , x = x xm
(3)
consigue el seguimiento del sistema ya que en lazo cerrado se obtiene,
x + 2x 2 x = 0.

(4)

Considere ahora que la masa no es conocida exactamente y que se utiliza un valor


estimado m
tal que m
=m
m. Entonces la retroalimentaci
on (3) toma la forma

2
u=m
xm + 2x x .
(5)

En lazo cerrado se obtiene,


mx = m
xm 2x 2 x


= (m + m ) xm 2x 2 x .
Esto es,


mx m xm 2x 2 x = m
xm 2x 2 x


m x + 2x + 2 x = m
xm 2x 2 x

m x + x + x + 2 x = mv

m (x + x + (x + x )) = mv

entonces
m (s + s ) = mv

(6)

donde
s = x + x,

v = xm 2x 2 x.

(7)

Considere ahora la ley de adaptaci


on,
m
= vs

(8)

como m
=m
m, se obtiene considerando m = 0,
m
= vs

(9)

lo cual permite considerar el sistema en lazo cerrado


ms
m

=
=

ms + mv

vs.

(10)

Como el sistema tiene un equilibrio en cero, se considera la funci


on candidata de
Lyapunov
1
1
V = ms 2 + m
2
(11)
2
2

Entonces,
1
V = ms s + m
m

= s (ms + mv
)+

1
m
(vs )

= ms 2
Como el sistema produce V semidefinida negativa se tiene probada su estabilidad.
Para probar que lm st = 0 se utiliza el lema de Barbalat lo cual concluye la prueba.
N
otese que
V = 2ms s = 2s (ms + mv
)

= 2m2 s 2 2s mv

Como V es acotada, V es uniformemente continua y por lo tanto se cumple que


V 0; lo que a su vez implica que s 0.
Aunque s 0, no es cierto que m
0 por lo tanto m
6= m.
Como s = x + x = 0 x = x con lo cual x 0 cuando t lo que produce
que x xm .

Control adaptable de manipuladores

Considere el robot manipulador


D (q ) q + C (q, q ) q + B q + g (q ) = .

(12)

Las ecuaciones de movimiento son lineales con respecto a los parametros de la matriz
de inercia (masas, distancias, momentos de inercia) en el sentido de que existe una
funci
on Y (q, q,
q ) R nl y un vector R l tal que la acuacion (12) puede
escribirse en la forma,
= D (q ) q + C (q, q ) q + B q + g (q ) = Y (q, q,
q ) .

(13)

La funci
on Y (q, q,
q ) se conoce como Regresor y es el Vector de parametros.

La dimensi
on del espacio de par
ametros (el n
umero de par
ametros utilizado) no
es u
nica.

En general un cuerpo rgido es descrito por 10 parametros: La masa total, seis


entradas del tensor de inercia y las tres coordenadas del centro de masa.

Un robot de n eslabones tiene un m


aximo de 10n par
ametros.

Como los movimientos de los robots est


an restringidos por la configuraci
on de sus
eslabones, el n
umero de parametros necesarios es menor a 10n.

Encontrar el n
umero mnimo de par
ametros es una tarea compleja.

Robot rotacional de 2 grados de libertad

D (q ) q + C (q, q ) q + g (q ) =

(14)

Equivalentemente,



m1 lc21 + m2 l1 + lc22 + 2l1 lc2 cos q2 + I1zz + I2zz m2 lc22 + l1 lc2 cos q2 + I2zz
q
2
2
m2 lc2 + I2zz
m2 lc2 + l1 lc2 cos q2 + I2zz
  


hq 2 h (q 1 + q 2 )
(m1 lc1 + m2 l1 ) g cos q1 + m2 glc2 cos (q1 + q2 )
+
q +
= 1
m2 lc2 g cos (q1 + q2 )
2
hq 1
0
(15)
donde
h = m2 l1 lc2 sin q2 .


Definiendo entonces,

1 = m1 lc21 + m2 l12 + lc22 + I1 + I2

(16)

2 = m2 l1 lc2
3 = m2 lc22 + I2 .
Los elementos de la matriz de Inercia toman la forma,
d11 = 1 + 22 cos q2

(17)

d12 = d21 = 3 + 2 cos q2


d22 = 3 .
Los elementos de C (q, q ) pueden escribirse en funci
on de
h = 2 sin q2 .

(18)

Los t
erminos gravitacionales son independientes de D (q ) por lo que requieren
par
ametros adicionales
4 = m1 lc1 + m2 l1 ,

5 = m2 lc2

(19)

de donde
g1 = 4 g cos q1 + 5 g cos (q1 + q2 ) ,

g2 = 5 g cos (q1 + q2 )

(20)

Por lo tanto se obtiene,

(1 + 22 cos q2 ) q1 + (3 + 2 cos q2 ) q2 2 sin q2 q 2 q 1 2 sin q2 (q 1 + q 2 ) q 2


+4 g cos q1 + 5 g cos (q1 + q2 ) = 1
1 q1 + 2 (2 cos q2 q1 + cos q2 q2 sin q2 q 2 q 1 sin q2 (q 1 + q 2 ) q 2 )
+3 q2 + 4 g cos q1 + 5 g cos (q1 + q2 ) = 1


1 q1 + 2 cos q2 (2q1 + q2 ) sin q2 q 22 + 2q 1 q 2 + 3 q2
+4 g cos q1 + 5 g cos (q1 + q2 ) = 1
por otra parte,

(3 + 2 cos q2 ) q1 + 3 q2 + 2 sin q2 q 1 q 1 + 5 g cos (q1 + q2 ) = 2




2 q1 cos q2 + q 12 sin q2 + 3 (q2 + q1 ) + 5 g cos (q1 + q2 ) = 2

Equivalentemente, definiendo =

T

=


q1
0

cos (q2 ) (2q1 + q2 ) sin q2 q 22 + 2q 1 q 2


cos (q2 ) q1 + sin (q2 ) q 12

q2
q1 + q2

g cos q1
0


1
 2
g cos (q1 + q2 )

g cos (q1 + q2 ) 3
4
5

A partir de los parametros i es posible entonces conocer el valor de


combinaciones de los parametros originales.
N
otese que R 5 mientras que
z = [m1 , m2, l1 , lc1 , lc2, I1 , I2 ]T R 7

Dependiendo del espacio de parametros elegido, es posible obtener una relaci


on
biyectiva entre z y . Esto no siempre es necesario para prop
ositos de control.

Esquema de control adaptable

Considere las siguientes definiciones,


q = q qd

(21)

q r = q d q
s = q q r = q + q
De acuerdo a la propiedad de linealidad en los par
ametros de un manipulador, es
posible escribir sus ecuaciones de movimiento en la forma,
D (q ) q + C (q, q ) q + B (q ) q + g (q ) = = Y (q, q,
q )

(22)

donde Y (q, q,
q ) es el regresor y es el vector de par
ametros.
I

Si no se conoce el valor real del vector de par


ametros, entonces es necesario

utilizar tan solo una aproximaci


on del valor real, denotada .

Como el vector es desconocido, se considera que puede variar en el tiempo,


esta variaci
on puede obtenerse (estimarse) mediante una ley de adaptaci
on.

Teorema 2
Sea qr una se
nal continua, acotada con por lo menos primera y segunda derivadas
continuas y acotadas y considere > 0 en (21). La ley de retroalimentaci
on,
= D (q ) qr + C (q, q ) q r + B q r + g (q ) kv s = Ya kv s

(23)

con kv > 0 y Ya = Y (qr , q r , qr ) junto con la ley de adaptaci


on
= 1 YaT s
con =

(24)

> 0, aplicada al sistema (22),


D (q ) q + C (q, q ) q + B (q ) + g (q ) =

garantizan el seguimiento asint


otico de las trayectorias deseadas qd , q d , y el error
par
ametrico = permanece acotado.

(25)

Demostraci
on. Sea qr una se
nal continua, acotada y considere los cambios de variable
dados en (21). La retroalimentaci
on (23) se reescribe como,

=
=

D qr + C q r + B q r + g kv s = D qr + C q r + B q r + g kv s
+ D D qr + C C q r + B B q r + (g g )
D qr + C q r + B q r + g kv s + Ya ( ) .

(26)

Entonces la din
amica del sistema en lazo cerrado esta dada por,
D (q ) q + C (q, q ) q + B q + g (q ) = D qr + C q r + B q r + g kv s + Ya

(27)

con lo cual,
D (q ) s + C (q, q ) s + Bs + kv s = Ya

D (q ) s + C (q, q ) s + kBv s = Ya ,

(28)
kBv = B + kv .

Para probar el resultado del teorema, considere la funci


on candidata de Lyapunov,
V =

1 T
1

s D (q ) s +
2
2

(29)

con respecto al sistema (28)-(24).


Su derivada temporal a lo largo de (28) produce,
1
V (t ) = s T D (q ) s + s T D (q ) s + T
2
1

= s T [C (q, q ) s kBv s + Ya ] + s T D (q ) s s T Ya T .
2
Considerando que es sim
etrica,
V (t )
V (t )

=
=



s T kBv s s T C 12 D s
T
s kBv s.

(30)

Es claro que el sistema (28) es tan solo estable ya que V es semidefinida negativa.

Para probar que


lm s = 0

(31)

es necesario utilizar el Lema de Barbalat, Entonces se requiere probar que V (t ) es


uniformemente continua, para lo cual basta demostrar que V (t ) es acotada. Entonces
V (t )

=
=
=

2s T kBv s

2s T kBv D 1 (C (q, q )) s kBv s + Ya
2s T kBv D 1 [C (q, q ) s + kBv s Ya ]

(32)

Como V 0, todas las variables anteriores est


an al menos acotadas, entonces (31) es
v
alida.
El lema de Barbalat muestra que V 0 y por lo tanto, por continuidad, se tiene que
s 0.

Notes que cuando s 0, se tiene que q + q 0 lo que produce,


q q

(33)

produciendo la convergencia al origen de q,


y por lo tanto, el seguimiento de
trayectorias buscado.
Dado que V 0, la convergencia de s a cero no implica la convergencia de a cero y
por lo tanto permanece acotado en una vecindad del origen. Esto implica que
9 y por lo tanto no se logra convergencia param
etrica.

En la demostraci
on anterior se ha considerado un sistema formado por el estado [s, ]
junto con la funci
on de Lyapunov (29).
Estrictamente, el sistema en lazo cerrado esta formado por las ecuaciones.
D (q + qd ) s + c (q + qd , q + q d ) s + kBv s = Ya
= 1 YaT s
q = q + s
con lo cual el estado del sistema (34) esta formado por
q ]
[s, ,
lo cual implica la modificaci
on de la funci
on de Lyapunov (29), para considerar
tambi
en el estado q.

N
otese que el punto de equilibrio del sistema (34) sigue siendo el origen.

(34)

You might also like