You are on page 1of 32

5.

Estartegias B
asicas de Control
Dr. Martn Velasco Villa

Secci
on de Mecatr
onica
Abril de 2015

Control Proporcional Derivativo (PD) y control PD aumentado


(PD+)

Una ley de control Proporcional-Derivativo PD puede obtenerse en el caso de un


manipulador al linealizar su din
amica alrededor de un punto de equilibrio y de
esta forma, mediante el uso de la teora de control para sistemas lineales, obtener
una retroalimentaci
on PD que resuelva el problema de regulaci
on o seguimiento
de trayectorias.

En este caso es f
acil probar la estabilidad local del sistema al analizar la ubicaci
on
de los polos de lazo cerrado resultante.

En el caso no lineal, como resulta el modelo de un manipulador, el an


alisis de
estabilidad en lazo cerrado puede llevarse a cabo considerando un enfoque basado
en t
ecnicas de Lyapunov.

Control PD

Considere un manipulador en el cual los t


erminos de amortiguamiento y de gravedad
son nulos, esto es,
M (q ) q + C (q, q ) q = u.
(1)
En su forma m
as simple, una ley de control PD esta dada por
u = kv q kp q
donde q = q qd con qd representando una posici
on deseada de las coordenadas
generalizadas.
I

La retroalimentaci
on (2) no contiene un t
ermino integral cl
asico (PID) ya que
esto puede complicar la determinaci
on de la estabilidad del sistema.

(2)

El problema de regulaci
on para el manipulador (1) se resuelve a partir del siguiente
resultado en el cual se prueba que la posici
on de las coordenadas generalizadas q (t )
converge a su posici
on deseada qd (t ).
Teorema 1
Si q d = 0 y Kv , Kp > 0 (Matrices definidas positivas) entonces el sistema en lazo
cerrado (1)-(2) tiene un punto de equilibrio q = qd globalmente asint
oticamente
estable.
Demostraci
on. Considerando q d = 0, el sistema en lazo cerrado es,
M (q ) q + C (q, q ) q + Kv q + kp (q qd ) = 0.
N
otese que el punto de equilibrio del sistema anterior resulta
q 0 = qd
entonces, sin perdida de generalidad, se puede considerar qd = 0.

(3)

Recu
erdese que si qd 6= 0, existe un cambio de coordenadas p = q q 0 , p = q que
transforma el sistema (3) en un nuevo sistema en las coordenadas p = q q 0 , p = q
el cual tiene presenta un equilibrio en el origen.
I

Por lo tanto puede considerarse qd = 0.

Considere la funci
on candidata de Lyapunov,
V (q, q ) =

1 T
1
q M (q ) q + q T Kp q.
2
2

Entonces, V es radialmente no acotada y definida positiva.

(4)

Derivando V a lo largo de las trayectorias del sistema,


V (q, q )

q T M (q ) q + 12 q T M (q ) q + q T Kp q

z }| {
z}|{
q T C (q, q ) q Kv q kp q + 12 q T M (q ) q + q T Kp q

=
=

q T Kv q + 21 q T M
 (q ) q q C (q, q ) q
q T Kv q + 12 q T M (q ) 2C (q, q ) q.

(5)

Como M (q ) 2C (q, q ) es antisim


etrica,
V (q, q ) = q T Kv q

(6)

donde V resulta semidefinida negativa por lo que solo se obtiene estabilidad del punto
de equilibrio.

Considerando el Teorema de LaSalle, el conjunto S para el cual V = 0 resulta,




S = q, q | V = 0 = {q = 0} .

(7)

Para encontrar el m
aximo conjunto invariante contenido en S, se sustituye q = 0 en la
ecuaci
on de lazo cerrado (3), donde se considera,
q = 0 q = 0
y por lo tanto se obtiene,
Kp q = 0.

(8)

Como Kp es definida positiva, Kp es de rango pleno y por lo tanto q = 0, de donde se


prueba que el equilibrio del sistema es asint
oticamente estable.

Control PD aumentado (PD+)

Considere ahora el modelo general,


M (q ) q + C (q, q ) q + B (q ) q + g (q ) = u

(9)

y el problema de control en el cual q d 6= 0.


En este caso se pretende lograr el seguimiento de una trayectoria de referencia y no
solo estabilizar el equilibrio del sistema.
En este caso, la retroalimentaci
on (2) puede modificarse como
u = M (q ) qd + C (q, q ) qd + B q d + g (q ) Kv q Kp q

(10)

Teorema 2
Bajo el conocimiento de q, q,
la ley de control (10) aplicada al sistema (9), resulta en
un seguimiento asint
otico de la trayectoria deseada si Kv , Kp > 0.
Demostraci
on. El sistema en lazo cerrado (9)-(10) toma la forma,
M (q ) q + C (q, q ) q + B q + Kv q + Kp q = 0
que puede reescribirse en la forma,
M (q ) q + C (q, q ) q + KBv q + Kp q = 0,

KBv = B + Kv .

(11)

N
otese que el punto de equilibrio del sistema (11) resulta q = 0, q = 0.
La ecuaci
on (11) representa la din
amica del error de seguimiento q del sistema en lazo
cerrado (9)-(10).
Utilizando de nueva cuenta la funci
on candidata de Lyapunov (4),
V (q,
q ) =

1 T
1
q M (q ) q + q T Kp q
2
2

(12)

Se obtiene,
V

=
=
=
=

q T M (q ) q + 21 q T M (q ) q + q T Kp q

z }| {
z}|{
q T C (q, q ) q KBv q kp q + 21 q T M (q ) q + q T Kp q


q T C (q, q ) + 12 M (q ) q q T KBv q
T
q KBv q

(13)

lo cual prueba la estabilidad del error.


La utilizaci
on del Teorema de LaSalle prueba la estabilidad asint
otica del sistema en
lazo cerrado. En este caso el conjunto S para el cual V = 0 resulta,
S = {q = 0} .
Y el m
aximo conjunto invariante contenido en S resulta,
q = q = 0
de donde se obtiene el resultado buscado.

(14)

Control por Par Calculado

Considere el modelo general de un robot manipulador,


M (q ) q + C (q, q ) q + B (q ) q + g (q ) = u.

(15)

Se desea encontrar una estrategia de control que sea robusta con respecto al error de
seguimiento ocasionado por las condiciones iniciales, al ruido de los sensores y a
incertidumbres param
etricas.
Despreciando la din
amica de los actuadores y conservando solamente t
erminos de
amortiguamiento en el mecanismo, el modelo (15) puede escribirse como,
D (q ) q + C (q, q ) q + B (q ) q + g (q ) = .

(16)

Una estrategia simple consiste en cancelar las no linealidades del sistema e imponer el
torque necesario que venza las inercias del manipulador.

Considere entonces la retroalimentaci


on,
= D (q ) qd + C (q, q ) q + B (q ) + g (q )

(17)

donde qd es la se
nal de referencia deseada.
Sustituyendo (17) en (16) se obtiene en lazo cerrado,
D (q ) q
D (q ) q

=
=

D (q ) qd
0

donde q = q qd .
Como D (q ) es definida positiva y por lo tanto invertible, la ecuaci
on (18) es
equivalente a
q = 0 = q = qd .

(18)

(19)

Por lo tanto, si la posici


on y la velocidad inicial del manipulador son igual a cero
(q = q = 0), el robot seguira la trayectoria deseada.

Si el error inicial no es cero, la ley de control (17) no puede corregirlo.

Suponga que (19) se satisface y que q (t0 ) = a y q (t0 ) = b, entonces


Z t
t0

q ( ) d = q (t ) q (t0 ) = q (t ) b

entonces
Z tZ t
t0

t0

q ( ) d =

Z t
t0

(q ( ) b ) d = q (t ) q (t0 ) b (t t0 )

= q (t ) a b (t t0 ) = 0.
Por lo tanto, es claro que aunque q (t ) = 0, la ley (19) no garantiza la convergencia
de q,
q a cero ya que conforme t se obtiene,
q b,

q a + b (t t0 ) .

(20)

Para mejorar el desempe


no de la ley de control anterior, considere ahora la
retroalimentaci
on,
= D (q ) (qd Kv q Kp q ) + C (q, q ) q + B q + g (q )

(21)

donde, como se ha definido anteriormente,


q = q qd
con qd la trayectoria deseada y kv , kp matrices constantes definidas positivas.
I

La ecuaci
on (21) describe el denominado Par calculado.

Sustituyendo (21) en (15) se obtiene,


D (q ) q = D (q ) (qd Kv q Kp q )
esto es,
D (q ) (q + Kv q + Kp q ) = 0
y como D (q ) es invertible se obtiene,
q + Kv q + Kp q = 0
que representa un sistema lineal f
acilmente estabilizable mediante la elecci
on
apropiada de las matrices Kv , Kp .

(22)

En el caso m
as simple, Kv , Kp se eligen como matrices diagonales, produciendo los
sistemas desacoplados de primer orden
q i + Kvii q i + Kpii qi = 0

(23)

d
onde los polos deben de colocarse en el lado izquierdo del plano complejo.
La ley de control por Par Calculado consiste de dos partes. La ecuaci
on (21) se puede
escribir como,
= D (q ) qd + C (q, q ) q + B (q ) + g (q ) + D (q ) (Kv q Kp q ).
|
{z
} |
{z
}
ff

(24)

fb

Al t
ermino ff se le conoce como la componente predictiva y provee la cantidad
de momento necesaria para llevar al sistema a lo largo de la trayectoria nominal.

El t
ermino fb es la componente de retroalimentaci
on que reduce los errores de
seguimiento de trayectoria.

Teorema 3
Considere el manipulador (15) en lazo cerrado con la retroalimentaci
on (21). Si Kv ,
Kp > 0 son matrices constantes (definidas positivas) entonces la retroalimentaci
on,
= D (q ) (qd Kv q Kp q ) + C (q, q ) q + B (q ) + g (q )
aplicada al sistema (15), resulta en un seguimiento exponencial.
Demostraci
on. La din
amica (22) se puede escribir como,

 


d
q
0
I
q
=

q
Kp Kv
q
dt

(25)

que bajo la consideraci


on de,
q1 = q,

q2 = q,

q = [q1 , q2 ]T

se obtiene,


q 1
q 2

0
Kp

I
Kv



q1
q2

q = Aq.
Para probar la convergencia exponencial del error basta con probar que los valores
propios de A tienen parte real negativa.


Sea C un valor propio de A correspondiente al vector propio v = v1
con v 6= 0 y v C2n . Entonces [v = Av , (I A) v = 0],

 

 

v1
0
I
v1
v2

=
=
v2
Kp Kv
v2
Kp v1 Kv v2

v2

N
otese que:
I
I

Si = 0 entonces v = 0 y por lo tanto = 0 no es un valor propio de A.




v2 = 0 implica que v1 = 0
Si 6= 0,
v1 = 0 implica que v2 = 0

Por lo tanto v1 , v2 6= 0.

T

(26)

Recu
erdese que en el caso complejo:
1

kv k = (v v ) 2
donde (v v ) es el producto interior complejo definido como,

(u w ) = u1 w 1 + ... + un w n = w u
con w i representando el complejo conjugado de wi y w = w T la transpuesta
hermitiana de w .
Sup
ongase sin p
erdida de generalidad que kv1 k = 1, entonces,
v1 2 v1 = 2 v1 v1 = 2 kv1 k2 = 2
Entonces,

2 = v1 2 v1 = v1 (v1 ) = v1 v2
= v1 (Kp v1 Kv v2 )
= v1 Kp v1 v1 Kv v1

(27)

Como v1 Kp v1 > 0 y v1 Kv v1 > 0 ya que son formas cuadr


aticas se tiene entonces,
2 + + = 0
con , > 0 lo que permite concluir que la parte real de es negativa.

(28)

El teorema anterior puede demostrarse alternativamente al considerar la funci


on de
Lyapunov
1
1

(29)
V = q T q + q T Kp q.
2
2
N
otese que el equilibrio de (22) es el origen y que V es definida positiva cuando
Kp > 0. Entonces
V = q T q + q T Kp q = q T (Kv q Kp q ) + q T Kp q = q T Kv q.

Kv se puede descomponer en la forma,


Kv =

 1

1
Kv + KvT +
Kv KvT = A + B
2
2

donde A > 0 es sim


etrica y B > 0 antisim
etrica. Por lo tanto,
V = q T Aq.

Dado que
2

min (A) kq k q T Aq max (A) kq k


se tiene entonces,

2
V min (A) kq k .

(30)

Como V es semidefinida negativa, se ha probado hasta este momento que el sistema


es solamente estable.
Considerando de nuevo el Teorema de LaSalle,


S = q,
q | V = 0 = {q = 0} .
El m
aximo conjunto invariante contenido en S se obtiene al sustituir q = 0 en (22)
obteniendo,
Kp q = 0
dado que q = 0. Entonces (q,
q ) = (0, 0) es el m
aximo conjunto invariante contenido
en S y por lo tanto se prueba la estabilidad asint
otica.
La estabilidad exponencial se obtiene del hecho que (22) es un sistema lineal.

Control basado en la estructura pasiva de robots rgidos


Considere las siguientes variables,
q = q qd
q r = q d q
s = q q r = q + q

(44)

La siguiente retroalimentaci
on garantiza un seguimiento asint
otico sin utilizar el
Teorema de LaSalle.
Teorema 4
Considere el robot manipulador,
D (q ) q + C (q, q ) q + B q + g (q ) = .

(45)

Sea qd una se
nal continua, acotada y con primera y segunda derivadas continuas y
acotadas; si > 0 en (44), entonces la ley de control,
= D (q ) qr + C (q, q ) q r + B q r + g (q ) Kv s

(46)

con Kv > 0, en lazo cerrado con el sistema (45) produce un seguimiento asint
otico de
las trayectorias deseadas qd , q d .

Demostraci
on. El sistema en lazo cerrado toma la forma,
D (q ) q + C (q, q ) q + B q + g (q ) = D (q ) qr + C (q, q ) q r + B q r + g (q ) Kv s
esto es,
D (q ) s + C (q, q ) s + Bs + Kv s
D (q ) s + C (q, q ) s + KBv s

=
=

0
0

donde KBv = B + Kv .
Considere ahora la funci
on,
1 T
s D (q ) s.
2
Su derivada temporal a lo largo de (47) produce,
V (t ) =

1
V (t ) = s T D (q ) s + s T D (q ) s
2
1
= s T [C (q, q ) s KBv s ] + s T D (q ) s
2


T 1
= s
D (q ) C (q, q ) s s T KBv s
2

= s T KBv s.
Por lo tanto,
lm s = 0.

(47)

Demostraci
on alterna

N
otese que la ecuaci
on (47) no solo depende de s sino tambi
en de la variable q. De la
ecuaci
on (44) es posible ver que estas dos variables se relacionan din
amicamente a
partir de
q = q + s.
Por lo tanto, el sistema en lazo cerrado (45)-(46) puede describirse formalmente a
partir del sistema aumentado,
D (q ) s + C (q, q ) s + KBv s = 0
q = q + s.

(48)

La prueba anterior se realiza a partir de la convergencia de una funci


on de Lyapunov
que depende solo de s y por lo tanto no esta completa formalmente ya que no se toma
en cuenta la din
amica de q.
La ecuaci
on (48) debe reescribirse en la forma,
D (q + qd ) s + C (q + qd , q + q d ) s + KBv s = 0
q = q + s
donde se ha considerado que q = q + qd .

(49)

El sistema (49) tiene un equilibrio en el origen, por lo tanto, considerando la funci


on
de Lyapunov,
1
1
V = s T Ds + q T q.

2
2
Se obtiene entonces,
1
+ q T q
V = s T D s + s T Ds
2
1
+ q T [q + s ]
= s T [Cs KBv s ] + s T Ds
2


1
= sT
D C s s T KBv s q T q + q T s
2

= s T KBv s q T q + q T s.
Por lo tanto,
V min (KBv ) ks k2 min () kq k2 + kq k ks k




 min (KBv )
21
ks k
ks k kq k
kq k
21
min ()

Entonces, el sistema resulta asint


oticamente estable si
min (KBv ) min ()

1
> 0,
4

min (KBv ) min () >

1
4

lo cual siempre puede satisfacerse ya que KBv y son matrices de dise


no.
De lo anterior se obtiene la convergencia de s y q lo cual implica
q 0 y s 0
y entonces
q qd y s q 0 q q d .

(50)

Dise
no en el espacio de trabajo

Basado en un cambio de coordenadas al espacio cartesiano.


I

Se desea que el efector final siga una trayectoria predeterminada.

Conociendo la trayectoria cartesiana del efector final, el uso de la cinem


atica
inversa permite obtener una trayectoria articular deseada equivalente.

Alternativamente, es posible realizar la tarea de control en el espacio Cartesiano,


lo que se conoce como Control en el espacio de trabajo.

Sea f : Q R p un mapeo suave e invertible entre las variables articulares q Q y las


variables del espacio de trabajo x R p .
I

El caso
optimo es aquel en el cual n = p, esto es, el n
umero de grados de libertad
del robot es igual al n
umero de variables del espacio de trabajo.

Si p < 6, las variables del espacio de trabajo s


olo proporcionan una
parametrizaci
on parcial de SE (3) = R 3 SO (3).

La din
amica de un manipulador esta dada en general por:
D (q ) q + C (q, q ) q + B q + g (q ) =

(51)

Rp

La relaci
on de velocidad entre la posici
on Cartesiana x
del efector final y las
variables articulares se obtiene al considerar el Jacobiano del sistema,
x = J (q ) q,

J (q ) =

f
.
q

(52)

Considerando que f es un mapeo suave e invertible, se puede escribir,


q = J 1 x

q = J 1 x +


d
J 1 x.

dt

Definiendo la notaci
on,
J T = J 1

T

la ecuaci
on (51) produce,



d
D (q ) J 1 x +
J 1 x + C (q, q ) J 1 x + BJ 1 x + g (q ) =
dt



d
1
D (q ) J x + C (q, q ) J 1 + D (q )
J 1 x + BJ 1 x + g (q ) =
dt

(53)

Equivalentemente, como J (q ) es invertible,




d
J T D (q ) J 1 x + J T C (q, q ) J 1 + J T D (q ) dt
J 1 x
+J T BJ 1 x + J T g (q ) = J T

(54)

Lo que produce la nueva representaci


on,
D (q ) x + C (q, q ) x + B x + g (q ) = F

(55)

donde,
D (q ) = J T D (q ) J 1 ,


C (q, q ) = J T C (q, q ) J 1 + D (q )

d
dt

J 1


(56)

B = J T BJ 1 ,

g (q ) = J T g (q ) ,

F = J T .

N
otese que (55) se encuentra en t
erminos de q y q.
Es posible considerar que,

x = f (q ) , q = f 1 (x ) = q = J 1 (q ) q =f 1 (x ) x

(57)

y de esta forma realizar completamente el cambio de coordenadas y evitar el uso de q,


q.
Para prop
ositos de control
esto es innecesario por lo que se acostumbra utilizar la
representaci
on (55).

La ecuaci
on (55) tiene la misma estructura que la ecuaci
on (51).
Esto nos permite demostrar las siguientes propiedades:
Lema 5
La ecuaci
on (55) satisface las siguientes propiedades
1. D (q ) es sim
etrica, definida positiva.
(q ) 2C (q, q ) R nn es una matriz antisim
2. D
etrica.
Demostraci
on: La propiedad (1) es trivial. Para demostrar (2) n
otese que,



(q ) 2C (q, q ) = J T D (q ) J 1 + d J T D (q ) J 1 + J T D (q ) d J 1
D
dt
dt



d
2J T C (q, q ) J 1 + D (q )
J 1 .
dt

Entonces,




(q ) 2C (q, q ) = J T D (q ) 2C (q, q ) J 1 + 2 d J T D (q ) J 1
D
dt

d
T
1
2J D (q )
J
dt

d  T 
d
=2
J
D (q ) J 1 2J T D (q )
J 1
dt
dt
= T .
Por lo tanto (recu
erdese que para cualquier matriz antisim
etrica A, se satisface
A + AT = 0),


T

T
 
(q ) 2C (q, q ) + D
(q ) 2C (q, q )
= T + T
=0
D

Las dos propiedades anteriores permiten el empleo inmediato de las leyes de


control desarrolladas en el espacio de coordenadas articulares.

(58)

Control por par calculado en el espacio de trabajo

Sistema:
D (q ) x + C (q, q ) x + B x + g (q ) = F

(59)

F = D (q ) (xd Kv x Kp x ) + C (q, q ) x + B x + g (q )

(60)

= JT F .

(61)

Retroalimentaci
on:

de donde

xd representa la trayectoria deseada en el espacio de trabajo.

x representa el error de seguimiento en el espacio de trabajo, x = x xd .

El sistema en lazo cerrado produce,


D (q ) x = D (q ) (xd Kv x Kp x ) .

(62)

Con lo cual, como D (q ) es invertible, se obtiene la din


amica,
x + kv x + kp x = 0

(63)

donde kv y kp se eligen tales que (63) resulta una ecuaci


on asint
oticamente
(exponencialmente) estable.
I

Recu
erdese que una condici
on necesaria y suficiente para estabilidades que kv y
kp son matrices definidas positivas. En particular, eligiendo kv y kp diagonales se
resuelve f
acilmente el problema.

La prueba final sigue los pasos del problema resuelto anteriormente en el espacio
articular.

You might also like