You are on page 1of 32

Una breve introducci on al control de sistemas

lineales
Jose Fermi Guerrero Castellanos
Verano 2011

Indice general
1. Introduccion 2
2. Control en el espacio de estado 4
2.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . 4
2.2. Espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Representacion de estado de sistemas dinamicos diferenciales 7
2.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4.1. Sistema Masa Resorte Amortiguador . . . . . . . . . . 9
2.4.2. Pendulo simple . . . . . . . . . . . . . . . . . . . . . . 10
2.4.3. Transformaciones Lineales . . . . . . . . . . . . . . . . 11
2.5. Estabilidad de un sistema LTI . . . . . . . . . . . . . . . . . . 12
2.6. Solucion de la ecuacion de estado . . . . . . . . . . . . . . . . 14
3. Controlabilidad 15
3.0.1. Criterio General de Controlabilidad . . . . . . . . . . 16
3.0.2. Control de mnima energa . . . . . . . . . . . . . . . 17
3.0.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . 17
4. Control por retroalimentacion de estado 21
4.1. Dise no del lazo de retroalimentacion para sistemas monova-
riables en forma controlable . . . . . . . . . . . . . . . . . . . 23
4.1.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2. Representacion en la forma controlable . . . . . . . . . . . . . 27
4.3. Dise no de servosistemas . . . . . . . . . . . . . . . . . . . . . 29
4.3.1. Regulador lineal cuadratico LQR (problema del hori-
zonte innito) . . . . . . . . . . . . . . . . . . . . . . . 30
1
Captulo 1
Introducci on
El control automatico es una rama de los sistemas dinamicos, hermana
del tratamiento de se nales y de las telecomunicaciones. Su objetivo principal
es manipular las variables de entrada de un sistema dado, con el objetivo de
que la salida de este siga a una se nal o una trayectoria de referencia determi-
nada. En apenas aproximadamente cincuenta a nos el control automatico ha
detonado un interes no solo cientco y tecnologico, sino tambien economico,
ya que a diferencia de otras disciplinas, el control automatico trasciende las
fronteras de los campos tradicionales de la ingeniera y se involucra direc-
tamente con la mecanica, electrica, qumica, biologa, informatica medicina,
etc.
Las Ecuaciones Diferenciales Ordinarias, introducidas por Sir Isaac New-
ton en el siglo XVII se han convertido en una poderosa y profunda herra-
mienta para comprender y controlar los fenomenos en este mundo. A nales
del siglo XIX Henri Poincare introdujo el enfoque cualitativo en las ecua-
ciones diferenciales ordinarias, conociendose este enfoque como los Sistemas
Dinamicos. Poincare intuyo la necesidad de una teora general de los sistemas
dinamicos en funcion de conjuntos de ecuaciones diferenciales de primer or-
den, e introdujo la ahora familiar idea de considerar el conjunto de variables
del sistema como la trayectoria de un punto en un espacio n-dimensional.
Este enfoque al problema de sistemas dinamicos rapidamente se popularizo
y se conocio como el metodo del espacio de estado, donde el concepto de va-
riable de estado se mostro fundamental. Las variables de estado representan
la mnima cantidad de informacion y nos resumen todo el pasado dinamico
del sistema y es todo lo que necesitamos conocer para poder predecir su
evolucion futura frente a cualquier se nal de entrada que le apliquemos. La
utilizacion del tratamiento del espacio de estados condujo rapidamente a
2
una comprension mas profunda de los problemas cientcos y matematicos
del control automatico y su introduccion hace del Control Automatico una
disciplina cientca y madura. En los a nos 60 y ante la importancia creciente
de los metodos del espacio de estados, el cientco R.E. Kalman investiga
la relacion entre las representaciones en el espacio de estado y la funcion de
transferencia, motivando la introduccion de los conceptos estructurales fun-
damentales para la comprension de los sistemas dinamicos: controlabilidad
y observabilidad. A partir de estas consideraciones el estudio de los sistemas
lineales invariantes en el tiempo, tanto en tiempo continuo como discreto,
es sin lugar a dudas uno de los recursos que cualquier especialista en control
automatico debe estudiar y por supuesto dominar.
El curso de Sistemas lineales que sera impartido en la Maestra en cien-
cias en Ingeniera pretende abordar los temas necesarios para una compren-
sion de los sistemas dinamicos lineales utilizando un formalismo de espacio
de estados. El curso contendra un gran material teorico, pero sera desarro-
llado alrededor de ejemplos ilustrativos no convencionales y de aplicacion
industrial. El amplio uso del software MATLAB/ Simulink conjuntamente
con el Toolbox Virtual Reality para la simulacion de sistemas dinamicos,
permitira al alumno comprender y asimilar los conocimientos vistos en cla-
se. Al nal del curso el alumno sera capaz de analizar la estabilidad de un
sistema lineal, analizar la controlabilidad y observabilidad de un sistema
dado y entonces proponer y dise nar controladores por retroalimentacion de
estado. Ademas, el alumno tendra las competencias necesarias para dise nar
sensores virtuales por medio del dise no de observadores de estado y utili-
zarlos dentro del lazo de control, garantizando la estabilidad exponencial
del sistema completo. El alumno debera mostrar las competencias adquiri-
das en un proyecto nal que implique todos los pasos del dise no de control
utilizando las tecnicas de control lineal.
3
Captulo 2
Control en el espacio de
estado
2.1. Conceptos preliminares
Si tratamos de precisar el concepto de sistemas dinamicos, podramos
decir burdamente que se trata del estudio de sistemas deterministas, es de-
cir, consideramos situaciones que dependan de alg un parametro dado, que
frecuentemente suponemos es el tiempo, y que varan de acuerdo a leyes
establecidas. De manera que el conocimiento de la situacion en un momento
dado, nos permite reconstruir el pasado y predecir el futuro.
Siendo un poco mas formales, se puede decir que un sistema dinamico es un
modo de describir el recorrido a lo largo del tiempo de todos los puntos de
un espacio dado S. Matem aticamente S puede ser el espacio euclidiano o un
subconjunto abierto de un espacio euclidiano. Un sistema dinamico para S
nos dice que para cada x S, donde x esta una unidad de tiempo mas tarde,
dos unidades de tiempo mas tarde y as sucesivamente. Denotaremos estas
nuevas posiciones de x como x(1), x(2) respectivamente. En el instante cero,
x = x(0). Una unidad antes del instante cero esta en x(1). Si se extrapola
para cubrir todos los n umeros reales, se obtiene una trayectoria x(t) t 0 .
Denicion 1 (Sistema Dinamico) Un sistema dinamico es una aplica-
cion : G S S de clase C

, donde S un conjunto abierto en el espa-


cio euclidiano tal que escribiendo (t, x) =
t
(x), la aplicacion
t
: S S
satisface:

0
: S S es la funcion identidad.
4

s

t
=
s+t
, s, t R
De lo anterior es claro que los sistemas dinamicos evolucionan en el
tiempo y su comportamiento en el futuro depende de la condiciones iniciales.
En general estudiamos dos tipos de sistemas:
Tiempo continuo, i.e., t R
Tiempo discreto, i.e., t Z
En cada caso, existen muchas aplicaciones que se pueden poner en el esquema
de un sistema dinamico:
Tiempo continuo
Ecuaciones diferenciales ordinarias (EDO)
Ecuaciones de difusion
Procesos estocasticos
Tiempo discreto
Metodos iterativos
Iteracion de Mapas
Como se puede ver en la denicion de un sistema dinamico es un tanto
abstracta, por lo que podemos acudir a diferentes areas de la matematica
para obtener representaciones equivalentes. Por mencionar algunas tenemos
la representacion de sistemas dinamicos en la geometra diferencial, en la
topologa , analisis matem atico y en particular la representacion mediante
ecuaciones diferenciales ordinarias (EDO) de las cuales se desprenden dos
formalismos:
Funcion de transferencia (Descripcion entrada-salida)
Espacio de estados
2.2. Espacio de estados
La teora moderna del control esta basada en el conocimiento del com-
portamiento interno de los sistemas, reejado en las variables que inuyen
en su dinamica. Estas variables constituyen el concepto de estado del siste-
ma. El conocimiento de la evolucion de todas las variables que inuyen en
5
la dinamica del sistema, permite efectuar un control mas potente de esta y
su utilizacion en sistemas mas complejos.
La teora moderna del control se desarrolla para solventar algunos de los
problemas en los que presenta fuertes limitaciones la denominada teora
clasica, basada en el modelado de la funcion de transferencia de los sistemas
dinamicos lineales de parametros constantes. Las ventajas de la teora mo-
derna del control en contraposicion a la teora clasica son fundamentalmente
las siguientes:
Es aplicable a sistemas multivariables en los que existe un elevado
grado de interaccion entre las variables del sistema.
Es aplicable a sistemas con relaciones no lineales.
Es aplicable a sistemas en los que sus parametros varan en el tiempo
a velocidades comparables con la evolucion de sus variables.
Es aplicable a sistemas complejos de control, en los que existe un
gran n umero de variables internas que condicionan el comportamiento
futuro de la salida.
Denicion 2 (Estado de un Sistema) Se dene el estado de un sistema
como la mnima cantidad de informacion necesaria en un instante para que,
conociendo la entrada a partir de ese instante, se pueda determinar la salida
en cualquier instante posterior.
Denicion 3 (Variables de estado) La cantidad mnima de informacion
que dene el estado viene representada por un conjunto de variables x
i
,
i = 1, ..., n cuyos valores dependen del instante t considerado, denominadas
variables de estado del sistema.
Denicion 4 (Vector de estado) Sean x
1
(t), ..., x
n
(t) variables de esta-
do de un sistema dinamico. Con esto podemos denir una funcion vectorial
x : A R R
n
tal que t (x
1
(t), ..., x
n
(t)) de forma equivalente
x(t) = (x
1
(t), ..., x
n
(t)). Por comodidad diremos simplemente que x(t) R
n
es el vector de estado.
Ahora, si representamos al conjunto de variables de entrada mediante el
vector u(t), la anterior denicion puede representarse de forma matematica
como:
x(t) = (t, t
0
, x(t
0
), u(t)) (2.1)
6
Al hablar del vector de estado, bien podemos preguntarnos a que espacio
vectorial pertenece, por lo que respondemos a esa cuestion en la siguiente
denicion.
Denicion 5 (Espacio de estados) Es el espacio vectorial en el cual cual-
quier vector de estado toma valores, teniendo tanto la misma dimensi on que
el n umero de elementos de dicho vector.
Las trayectorias que describe el vector de estado del sistema dentro del espa-
cio de estado estan sujetas a las siguientes condiciones ligadas a la denicion
de estado del sistema:
1. Unicidad:
t t
0
, x
0
= x(t
0
), u()t
0
t x(t) es unica
2. Continuidad:
Las trayectorias en el espacio de estado son funciones continuas:
lm
tt
0
x(t) = x(t
0
), t, t
0
3. Transitividad:
Se considera en un trayectoria en el espacio de estado de tres tiempos
t
0
, t
1
, t
2
el valor del estado en estos tiempos esta relacionado por esta
propiedad de transicion:
(t
2
, t
0
, x(t
0
), u()) = x(t
2
) = (t
2
, t
1
, x(t
1
), u())
(t
1
, t
0
, x(t
0
), u()) = x(t
1
)
(t
2
, t
0
, x(t
0
), u()) = (t
2
, (t
1
, t
0
, x(t
0
), u()), u()). Esto signica
que para conocer el estado en el instante t
2
da lo mismo conocer el
estado en t
0
y la entrada entrante entre t
0
y t
2
que conocer el estado
en t
1
y la entrada entrante entre t
1
y t
2
.
4. Causabilidad:
En el estado y la salida son causales; x(t) e y(t) dependen de los valores
de la entrada unicamente en instantes anteriores al instante t.
2.3. Representaci on de estado de sistemas dinami-
cos diferenciales
Los sistemas dinamicos diferenciales se caracterizan porque pueden ser
representados por una ecuacion que incluye la informacion del estado y que
es de la forma:
x(t) = f (t, x(t), u(t)) (2.2)
7
y(t) = (t, x(t), u(t)) (2.3)
la ecuacion (2.2) se le llama ecuacion de estado, la cual representa la
dinamica de la evolucion del estado del sistema y la ecuacion (2.3) se le lla-
ma ecuacion de salida. La solucion de (2.2) da lugar a la Ecuacion (2.1).
El sistema representado por (2.2) puede ser, variante o invariante en el tiem-
po o puede ser no lineal o lineal. En lo que sigue de este texto nosotros
consideraremos solamente sistemas lineales e invariantes en el tiempo. Por
lo tanto, es pertinente mencionar las siguientes deniciones.
Denicion 6 (Sistemas dinamicos invariantes) Un sistema, con un es-
tado inicial dado por x
0
= x(t
0
) sometido a una entrada u
1
(), t
0
< < t,
y que produce como salida la se nal y
1
(t), se dice que es invariable si T,
partiendo del mismo estado x
0
pero en el instante t
0
+T; excitado con una
entrada u
2
( + T) = u
1
(), t
0
< < t, responde a una salida que es
y
2
(t + ) = y
1
(t).
Para saber si un si un sistema dinamico dado es lineal o no, es nece-
sario ver si cumple con el principio de superposicion, el cual consiste en lo
siguiente:
Denicion 7 (Principio de superposicion) Se tiene un sistema que par-
tiendo de un estado inicial x
1
(t
0
), con una entrada u
1
(), t
0
t,
responde con una salida y
1
(t), y a partir de ese estado inicial x
2
(t
0
) con
la entrada u
2
(), t
0
t, responde con otra salida y
2
(t). Se dice
que dicho sistema es lineal si a, b R, partiendo de un estado inicial
x
3
(t
0
) = ax
1
(t
0
) + bx
2
(t
0
), con una entrada u
3
(t
0
) = au
1
(t
0
) + bu
2
(t
0
),
t
0
t, la salida es y
3
(t
0
) = ay
1
(t
0
) + by
2
(t
0
).
Esta propiedad de linealidad en sistemas diferenciales se traduce en que
las funciones f y de (2.2),(2.3) son lineales con respecto a x y u. Esta
propiedad de linealidad se verica si y solo si las ecuaciones del modelo de
estado se pueden expresar en forma matricial. Esto es:
x = A(t)x(t) +B(t)u(t) (2.4)
y(t) = C(t)x(t) +D(t)u(t) (2.5)
donde:
x(t) R
n
es el vector de estado.
u(t) R
m
es el vector de entradas.
8
y(t) R
p
es el vector de salidas.
A(t) R
nn
es la matriz del sistema.
B(t) R
nm
es la matriz de entrada.
C(t) R
pn
es la matriz de salida.
D(t) R
pm
(en la mayora de los casos se anula).
Si el sistema representado por (2.4) y (2.5) es invariante, entonces las
matrices A, B, C, D son contantes y entonces decimos que el sistema es
lineal invariante en el tiempo LTI (por sus siglas en ingles de Linear Time
Invariant). En consecuencia, (2.4) y (2.5) se escriben simplemente:
x(t) = Ax(t) +Bu(t) (2.6)
y(t) = Cx(t) +Du(t) (2.7)
2.4. Ejemplos
2.4.1. Sistema Masa Resorte Amortiguador
Consideremos el sistema masa-resorte-amortiguador mostrado en la -
gura 3.3, donde la posicion es denotada por q, siendo q = 0 la posicion de
reposo del resorte. Aplicando las leyes de Newton, el sistema esta modelado
Figura 2.1: Sistema masa-resorte-amortiguador
por la siguiente ecuacion diferencial de segundo orden.
m q = kq c q + F (2.8)
siendo k la constante de restitucion del resorte y c la constante de viscosa.
En este caso se tomo una relacion lineal entre la fuerza de friccion del amor-
tiguador y la velocidad (para grandes velocidades esta relacion es no lineal).
9
Como comentamos anteriormente, la idea de espacio de estados es transfor-
mar una ecuacion diferencial ordinaria de orden n, en n ecuaciones diferen-
ciales ordinarias de orden uno. Para este sistema, se tendra entonces, dos
ecuaciones diferenciales ordinarias de orden uno. Seleccionemos las siguien-
tes variables de estado:
_
x
1
= q
x
2
= q

_
x
1
= q
x
2
= q
De esta forma, la representacion en variables de estado del sistema (2.8) es:
_
x
1
= x
2
x
2
=
k
m
x
1

c
m
x
2
+
F
m
(2.9)
y en forma matricial
_
x
1
x
2
_
=
_
0 1

k
m

c
m
__
x
1
x
2
_
+
_
0
1
m
_
F (2.10)
Note que este sistema es LTI, puesto que es lineal (cumple con el principio de
superposicion y ademas puede representarse en forma matricial) e invariante
en el tiempo (sus parametros son constantes).
2.4.2. Pendulo simple
Consideremos el sistema pendulo simple mostrado en la gura 2.2.
Figura 2.2: Pendulo simple
10
El modelo dinamico del sistema de la gura 2.2 dado por
J

= mgl sin b

+ (2.11)
donde
J: Momento de inercia
m: Masa del pendulo
g: Fuerza de Gravedad
l: Longitud al centro de masa de pendulo
b: Friccion del pendulo
: Par aplicado.
Seleccionemos las siguientes variables de estado:
_
x
1
=
x
2
=


_
x
1
=

x
2
=

De esta forma, la representacion en variables de estado del sistema (2.11)


es:
_
x
1
= x
2
x
2
=
mgl
J
sin x
1

b
J
x
2
+

J
(2.12)
Note que el sistema no se puede representar de manera matricial, debido al
termino sin x
1
, entonces el sistema es no lineal.
Observacion 1 En un apartado posterior veremos como podemos obtener
un modelo lineal del pendulo, alrededor de sus puntos de equilibrio.
2.4.3. Transformaciones Lineales
En el apartado anterior vimos la representacion de sistemas dinamicos
invariantes en el tiempo (LTI). Sin embargo, la representacion en el espa-
cio de estados de un sistema cualquiera puede ser de diferentes maneras
sin afectar el comportamiento del sistema. En este apartado veremos co-
mo podemos transformar la representacion de un sistema por medio de una
transformacion lineal. Se parte de una representacion cualquiera de estado
x
x(t) = Ax(t) +Bu(t)
y(t) = Cx(t) +Du(t)
11
y se dene una matriz T R
nn
con la particularidad de que no sea singular.
Se dene un nuevo vector de estado a partir de x mediante la expresion:
x(t) = T x(t) x(t) = T
1
x(t) (2.13)
derivando x(t), se tiene

x(t) =

T
1
x(t) +T
1
x(t)
puesto que la matriz T es constante se obtiene

x(t) = T
1
[Ax(t) +Bu(t)]
= T
1
[AT x(t) +Bu(t)]
= T
1
AT x(t) +T
1
Bu(t)
La ecuacion de salida es simplemente
y(t) = CT x(t) +Du(t)
As la nueva representacion del sistema es:

x(t) =

Ax(t) +

Bu(t)
y(t) =

C x(t) +Du(t)
donde

A = T
1
AT

B = T
1
B

C = CT

D = D
2.5. Estabilidad de un sistema LTI
En este apartado veremos las condiciones que debe cumplir un sistema
representado en espacio de estados para decir que es asintoticamente estable.
Se parte de la expresion de un sistema LTI:
x(t) = Ax(t) +Bu(t)
y(t) = Cx(t) +Du(t)
12
Ahora se encontrara la funcion de transferencia a partir de esta ecuacion de
estado y para eso se toma la transformada de Laplace y se establecera la
relacion entre la entrada y la salida. En principio todas las variables son
vectores:
sX(s) x(0) = AX(s) +BU(s)
donde x(0) es el vector de condiciones iniciales. Si x(0) = 0 y tomado D = 0,
entonces tenemos
[sI A]X(s) = BU(s)
X(s) = [sI A]
1
BU(s)
Y(s) = CX(s) = C[sI A]
1
BU(s)
entonces la funcion de transferencia es
G(s) =
Y(s)
U(s)
= C[sI A]
1
B = C
Adj[sI A]
T
det([sI A])
B (2.14)
se concluye que el polinomio caracterstico del sistema es
P(s) = det([sI A]) (2.15)
por lo que los polos del sistema coinciden con los valores propios de la matriz
A.
polos = valores propios de A
Observacion 2 Observe que el polinomio caracteristico solo depende de la
matriz A, tambien ha de ser as con la estabilidad del sistema. La posicion
de los ceros del sistema viene dada por las matrices A, B, C.
Teorema 1 Considere el sistema LTI
x(t) = Ax(t) +Bu(t)
y(t) = Cx(t) +Du(t)
este sistema es asintoticamente estable si y solo si la parte real de los valores
propios de la matriz A son estrictamente menores que cero.
13
2.6. Solucion de la ecuacion de estado
La solucion de la ecuacion 2.6 esta dada por la expresion:
x(t) = e
A(tt
0
)
x(t
0
) +
_
t
t
0
e
A(t)
Bu()d
= (t, t
0
)x(t
0
) +
_
t
t
0
(t, )Bu()d
(2.16)
El primer termino corresponde la evolucion libre del sistema y el cual depen-
de de las condiciones iniciales, el segundo termino corresponde a la evolucion
debida a la entrada exterior.
La matriz (t, t
0
) = e
A(tt
0
)
se le llama matriz de transicion y como su
nombre lo indica es la matriz que se encarga de hacer pasar de un estado a
otro.
Observacion 3 Note que la solucion de la ecuaci on de estado se basa en el
calculo de la matriz de transicion.
Observacion 4 La matriz de transici on, para un sistema cualquiera puede
ser calculada por:
Transformada de Laplace
Transformacion lineal (Metodo de Jordan)
Estos metodos fueron explicados en la presentaciones dadas en el curso, con
sus correspondientes ejemplos.
Observacion 5 La matriz de transicion tiene propiedades muy interesantes
las cuales fueron mencionadas en las diapositivas del curso.
14
Captulo 3
Controlabilidad
El estudio de la controlabilidad de un sistema determina los puntos del
espacio de estado que pueden ser alcanzados por un sistema actuando so-
bre las entradas de este; puntos que determinan los denominados estados
controlables. Este estudio abarca dos cuestiones a tener en cuenta:
Considerando un sistema, un estado inicial y un estado nal, se desea
determinar la existencia de una entrada que lleve al sistema entre
ambos en un tiempo nito.
Si un sistema no es controlable, la siguiente cuestion que surge es
determinar los puntos del espacio de estado que pueden ser alcanzados
partiendo de un estado inicial dado.
Denicion 8 (Controlabilidad de un punto en un instante de tiempo)
Se dice que un punto en el espacio de estado de un sistema, x
1
, es controlable
desde el estado x
0
en [t
0
, t
1
] si existe una entrada u denida en el intervalo
[t
0
, t
1
] tal que transera el estado del sistema desde x
0
en t
0
hasta x
1
en t
1
.
Denicion 9 (Controlabilidad de un sistema en un intervalo de tiempo)
Un sistema se dice controlable en [t
0
, t
1
] si todos los puntos de su espacio de
estado son controlables en [t
0
, t
1
].
Denicion 10 (Sistema controlable) Un sistema se dice controlable si
todos los puntos del espacio de estado son controlables.
Denicion 11 (Conjunto alcanzable o controlable) Sea el sistema
lineal
x = Ax(t) +Bu(t)
15
Se dene el conjunto alcanzable como el conjunto de todos los puntos x
f
tal
que existe una entrada u(t), 0 t T, que lleve al sistema de x(0) = x
0
a
x(T) = x
f
, i. e.,
R(x
0
, T) = {x
f
R
n
|u(t) : x
0
x
f
}
Figura 3.1: Conjunto controlable
3.0.1. Criterio General de Controlabilidad
Si el sistema multivariable es descrito por la relacion x = Ax(t)+Bu(t),
hemos visto que al instante t
1
el estado se escribe como:
x(t
1
) = e
A(t
1
t
0
)
x(t
0
) +
_
t
1
t
0
e
A(t
1
)
Bu()d (3.1)
Esta ultima ecuacion puede ser reescrita utilizando la formula de Sylves-
ter: e
At
=

n1
i=0
b
i
(t)A
i
x(t
1
) = e
A(t
1
t
0
)
x(t
0
) +
n1

i=0
A
i
B
_
t1
t
0
b
i
(t)u()d (3.2)
o tambien
_
B AB A
n1
B

_
_
t
1
t
0
b
0
(t
1
)u()d
_
t
1
t
0
b
1
(t
1
)u()d
.
.
.
_
t
1
t
0
b
n1
(t
1
)u()d
_

_
= x(t
1
) + e
A(t
1
t
0
)
x(t
0
(3.3)
el cual es un sistema de n ecuaciones algebraicas lineales que posee una
solucion unica si y solo si la matriz
_
B AB A
n1
B

es de rango
pleno.
16
Teorema 2 (Criterio de Controlabilidad de Kalman) Sea el sistema
lineal con un ecuacion de estado:
x = Ax(t) +Bu(t)
es controlable si y solo si la matriz de controlabilidad Q
c
, denida de la
siguiente forma:
_
B AB A
n1
B

(3.4)
es de rango maximo, es decir, n.
Teorema 3 (Controlabilidad de sistemas lineales) En general un sis-
tema lineal (variante o invariante en el tiempo) con un ecuacion de estado:
x = A(t)x(t) +B(t)u(t)
es controlable en [t
0
, t
1
] si y solo si la matriz W(t
1
, t
0
) denida por:
W
c
(t
1
, t
0
) =
_
t
1
t
0
(t
1
, )B()B
T
()
T
(t
1
, )d (3.5)
es no singular. A esta matriz se le conoce como el Gramiano de controlabi-
lidad.
3.0.2. Control de mnima energa
Sin entrar en todos los detalles, resulta que la ley de control denida por:
u(t) = B
T
e
A
T
(t
1
t)
W
1
c
(t
1
, t
0
)(e
At
1
x
0
x
1
) (3.6)
es la que usa mnima energa en transferir x
0
a x
1
en el tiempo t
1
.
3.0.3. Ejemplos
Pendulo invertido
Considere el sistema mostrado en la gura.
Las ecuaciones de movimiento para este sistema son no lineales y son
dadas por:
(M + m) p ml cos

= c p ml sin

2
+ F
(J + ml
2
)

ml cos p =

+ mgl sin
17
Figura 3.2: Sistema masa-resorte-amortiguador
Linearlizando alrededor del punto de equilibrio x
e
= (p, 0, 0, 0) obtene-
mos:
A =
_
_
_
_
_
0 0 1 0
0 0 0 1
0
m
2
l
2
g

0 0
0
Mtmgl

0 0
_
_
_
_
_
B
_
_
_
_
_
0
0
Jt

lm

_
_
_
_
_
donde = M
t
J
t
m
2
l
2
, M
t
= M + m y J
t
= J + ml
2
. La matriz de
controlabilidad resulta en:
Q = [B AB A
2
B A
3
B] R
44
El determinante de esta matriz es det(Q) =
g
2
l
4
m
4

4
= 0 entonces Q es de
rango pleno y el sistema es controlable. La controlabilidad garantiza que
existe un control u capaz de llevar la posicion del carro a una posicion p y
el angulo y sus derivadas a cero, en un tiempo nito.
Plataforma de suspension
La gura muestra una plataforma de las utilizadas para estudiar sistemas
de suspension para autom oviles. Las constantes de los resortes se asumen
1 y los coecientes de friccion viscosa 2 y 1 respectivamente. Tomando los
18
desplazamientos de la posicion de equilibrio de los extremos de la platafor-
ma como variables de estado, tenemos que la siguiente ecuacion de estados
describe este sistema:
Figura 3.3: Sistema masa-resorte-amortiguador
x =
_
0,5 0
0 1
_
x +
_
0,5
1
_
u
Puesto que los valores propios son reales y negativos, si la posicion inicial
de la plataforma es diferente del equilibrio, la plataforma regresara a ese
equilibrio de manera exponencial. La pregunta es: Es posible encontrar
una fuerza que lleve la plataforma a su posicion de equilibrio en 2 seg?
Calculando el rango de la matriz de controlabilidad, tenemos:
rank[A B] = rank
_
0,5 0,25
1 1
_
= 2
Entonces, el sistema es controlable y para cualquier x(0), existe una entrada
que transera al sistema de x(0) a su posicion de equilibrio en 2 segundos.
Calculando la matriz
W
c
(2, 0) =
_
2
0
__
e
0,5
0
0 e

__
0,5
1
_
_
0,5 1
_
_
e
0,5
0
0 e

__
d
W
c
(2, 0) =
_
0,2162 0,3167
0,3167 0,4908
_
As la fuerza
u
2
(t) =
_
0, 5 1
_
_
e
0,5(2)
0
0 e
(2)
_
W
1
c
(2)
_
e
1
0
0 e
2
__
10
1
_
19
u
2
(t) = 58,82e
0,5t
+ 27, 96e
t
para t [0, 2] lleva al estado del sistema de x(0) = [10, 1] a [0, 0] en 2
segundos.
Actividades
1. Realice una simulaci on para comprobar el resultado anterior.
2. Calcule la fuerza necesaria para transferir el estado de x
0
al equilibrio
en 4 segundos.
3. Cual sera la fuerza necesaria si t ?
4. Analice la controlabilidad del sistema, asumiendo que los resortes y
los coecientes de friccion viscosa son iguales a 1.
20
Captulo 4
Control por
retroalimentaci on de estado
En este captulo se va a estudiar el control de un sistema mediante la
retroalimentacion de sus variables de estado, poniendo de maniesto la po-
tencia de esta estructura de control para jar las caractersticas del compor-
tamiento dinamico de un sistema. Primeramente se realiza un analisis de la
dinamica del sistema cuando se efect ua la retroalimentacion de sus variables
de estado mediante una matriz constante, despues se aborda el dise no de la
matriz de retroalimentacion del estado con el objeto de jar el comporta-
miento dinamico del sistema, justicando la asignacion directa de los polos
de la parte controlable del sistema.
Consideremos el sistema dinamico LTI
x(t) = Ax(t) +Bu(t) (4.1)
y(t) = Cx(t) +Du(t) (4.2)
el cual es representado por la gura 4.1
Se desea encontrar una estructura de control u tal que el comportamiento
dinamico del sistema 2.6 sea el deseado.
La estructura que se propone es
u = Kx + k
r
r (4.3)
donde la matriz K se llama matriz de retroalimentacion de estados y
k
r
es una precompensacion para que el sistema alcance el estado estacionario
en la se nal de referencia r.
21
Figura 4.1: Diagrama de bloques del sistema 2.6
La estructura de control 4.3 aplicada al sistema 2.6 est

A represemtada
por la gura 4.2.
Figura 4.2: Diagrama de bloques del sistema con control por retroalimenta-
cion de estado
Ahora, sustituyendo la estructura de control 4.3 en el sistema 2.6, se
tiene lo siguiente: x(t) = Ax(t) + Bu(t) x(t) = Ax(t) + B(Kx + k
r
r)
x(t) = (ABK)x(t) +Bk
r
r
x(t) = Ax(t) +Bk
r
r (4.4)
donde A = ABK y le llamamos A aumentada.
22
Kx: Feed-back
K
r
r: Feed-Forward
Se ha obtenido un nuevosistema LTI, cuya matriz es A, matriz que da
informacion acerca de la dinamica del sistema.
Por el teorema ??, si los valores propios de la matriz del sistema 4.4 tienen
parte real estrictamente negativa, entonces el sistema 4.4 seran estable.
Observacion 6 Note que objetivo en el dise no del control, es encontrar la
matriz de retroalimentacion K tal que A tenga todos los valores propios con
parte real estrictamente menor que cero, i.e Re(vp(A) < 0.
4.1. Dise no del lazo de retroalimentacion para sis-
temas monovariables en forma controlable
Considere el sistema representado por la siguiente funcion de transferen-
cia:
H(s) =
Y (s)
U(s)
=
1
s
n
+ a
n1
s
n1
+ a
n2
s
n2
+ + a
1
s + a
0
(4.5)
La ecuacion diferencial correspondiente a esta funcion de transferencia es:
y
n
+ a
n1
y
n1
+ a
n2
y
n2
+ ... + a
1
y + a
0
y = u (4.6)
donde, y es la respuesta del sistema, u es la se nal de entrada a la que es
sometida el sistema.
Despejando la derivada de mayor orden, se tiene que:
y
n
= a
n1
y
n1
a
n2
y
n2
... a
1
y a
0
y + u (4.7)
escogiendo las siguientes variables de estado, tenemos:
_

_
x
1
= y
x
2
= y
.
.
.
x
n1
= y
(n2)
x
n
= y
(n1)
=
_

_
x
1
= x
2
x
2
= x
3
.
.
.
x
n1
= x
n
x
n
= a
n1
x
n
a
n2
x
n1
... a
1
x
2
a
0
x
1
+ u
(4.8)
23
Expresando en forma matricial el cambio de variable 4.8, se tiene lo
siguiente:
_
_
_
_
_
_
_
_
_
_
x
1
x
2
.
.
.
x
n1
x
n
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
0 1 0 . . . 0
0 0 1 . . . 0
. . . . .
. . . . .
. . . . .
0 0 0 . . . 1
a
0
a
1
. . . a
n2
a
n1
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
x
1
x
2
.
.
.
x
n1
x
n
_
_
_
_
_
_
_
_
_
_
+
_
_
_
_
_
_
_
_
_
_
0
0
.
.
.
0
1
_
_
_
_
_
_
_
_
_
_
u
(4.9)
La ecuacion de salida se deduce de la funcion de transferencia para la cual
la salida es Y (s), en el dominio del tiempo esta se nal es y(t) = x
1
. En
consecuencia la ecuacion de salida es:
y(t) = (1 0 0)
_
_
_
_
_
_
_
_
_
_
x
1
x
2
.
.
.
x
n1
x
n
_
_
_
_
_
_
_
_
_
_
= Cx(t) (4.10)
Ahora si se retroalimenta como mencionamos anteriormente, pero consi-
derando que r = 0, es decir, queremos llevar todas la variables de estado (y
en consecuencia la salida) a cero tenemos que la ley de control es u = Kx.
Aplicando esta ley de control sobre el sistema 4.10, se obtiene la matriz
24
aumentada ABK, siguiente:
A =
_
_
_
_
_
_
_
_
_
_
_
_
0 1 0 . . . 0
0 0 1 . . . 0
. . . . .
. . . . .
. . . . .
0 0 0 . . . 1
a
0
a
1
. . . a
n2
a
n1
_
_
_
_
_
_
_
_
_
_
_
_

_
_
_
_
_
_
_
_
_
_
0
0
.
.
.
0
1
_
_
_
_
_
_
_
_
_
_
(k
1
k
2
k
n
)
=
_
_
_
_
_
_
_
_
_
_
0 1 0 . . . 0
0 0 1 . . . 0
. . . . .
. . . . .
. . . . .
0 0 0 . . . 1
k
1
a
0
k
2
a
1
. . . k
n1
a
n2
k
n
a
n1
_
_
_
_
_
_
_
_
_
_
(4.11)
La matriz de salida C permanece sin cambios. La funcion de transferen-
cia de este sistema retroalimentado tiene como coecientes del numerador
los mismos que tena la funcion de transferencia sin retroalimentar y como
coecientes del denominador los que aparecen en la ultima la de la matriz
aumentada.
G(s) =
1
s
n
+ (k
n
+ a
n1
)s
n1
+ (k
n1
+ a
n2
)s
n2
+ + (k
2
+ a
1
)s + (k
1
+ a
0
)
Observacion 7 Observe que con la matriz K se modican los polos del
sistema original como sea conveniente, lo que implica modicar la dinamica
del sistema. Lo unico que el dise nador debe hacer, es decidir es la ubicacion
de los polos del sistema retroalimentado (valores propios de A).
Observacion 8 Observe que utilizando una ley de control de la forma u =
Kx, no se modican los ceros del sistema original (la funci on de transferen-
cia de este sistema retroalimentado tiene como coecientes del numerador
los mismos que tena la funci on de transferencia sin retroalimentar) enton-
ces no se modica el comportamiento del sistema en estado estacionario.
En un apartado posterior, veremos como poder modicar esto, de tal forma
que la salida siga una se nal de referencia. Esto es lo que se le conoce como
dise no de un servosistema.
25
Observacion 9 Observe que el dise no del control parte del hecho que todas
la variables de estado son medibles. En el proximo captulo se abordara el
caso en el cual algunas de las variables de estado no son medibles, por lo
que se necesitara dise nar un observador de estado que permita estimar estas
variables, las cuales, entonces, podran ser utilizadas por el controlador para
estabilizar a todo el sistema.
4.1.1. Ejemplos
Ejemplo 1
Sea la funcion de transferencia:
H(s) =
3s + 5
s
3
+ 3s
2
+ 7s + 1
Se desea dise nar un control por retroalimentacion de estado tal que situe los
polos del sistema en lazo cerrado en s
1,2
= 1j y s
3
= 10. Observe que el
del denominador de la funcion de transferencia en lazo cerrado, tendra que
ser de la siguiente forma:
P(s) = (s + 10)(s
2
+ 2s + 2) = s
3
+ 12s
2
+ 22s + 20
en consecuencia el vector K se calcula de la siguiente forma
20 = 1 + k
1
22 = 7 + k
2
12 = 3 + k
3
y entonces K = [19 15 9].
Ejemplo 2 (Sistema Masa-Resorte-Amortiguador) Considere el
sistema Masa-Resorte-Amortiguador visto anteriormente, con se nal de con-
trol u=F. Con nes de simplicidad, se considera que m = c = k = 1,
obteniendo el siguiente modelo en espacio de estados
_
x
1
x
2
_
=
_
0 1
1 1
__
x
1
x
2
_
+
_
0
1
_
u (4.12)
El objetivo es utilizar una ley de control de la forma u = Kx y encontrar
K tal que el sistema en lazo cerrado tenga valores propios
1,2
= 3 j.
Entonces el polinomio caracterstico (deseado) del sistema en lazo cerrado
es:
26
P() = ( + 3 j)( + 3 + j) =
2
+ 6 + 82
Por otro lado, el polinomio caracterstico de la matriz aumentada es:
P
LC
() = det(I

A) = det(I (ABK)) =
2
+ (1 + k
2
) + (1 + k
1
)
I es la matriz identidad con dimensiones iguales a las de la matriz A. Ahora
igualando los coecientes P() y P
LC
() podemos obtener los valores de k
i
.
82 = 1 + k
1
6 = 1 + k
2
y entonces K = [5 81].
Observacion 10 En el anterior ejemplo, la seleccion de variables de estado
permite expresar al sistema en su forma controlable, como en 4.10, sin em-
bargo un sistema cualquiera puede tener una innidad de representaciones,
por lo que para poder utilizar la metodologa vista anteriormente, es necesa-
rio expresar al sistema en la forma controlable, lo cual se obtiene por medio
de una transformacion lineal. En la siguiente seccion veremos como realizar
tal cambio de variable.
4.2. Representaci on en la forma controlable
En este apartado se aborda la metodologa que permite expresar cual-
quier sistema LTI en su forma controlable, tambien conocida como repre-
sentacion en variables de fase. Partiendo de la matriz de controlabilidad:
Q
c
=
_
B AB A
n1
B

nn
se supone que el sistema es controlable, as que rango(Q
c
) = n y por lo
tanto Q
1
c
existe:
Q
1
c
=
_
_
_
_
_
e
T
1
e
T
2
.
.
.
e
T
n
_
_
_
_
_
27
A partir de la ultima la de esta matriz, se construye una matriz que se le
denominara T
1
c
, y que es la inversa de la matriz de transformacion. Esta
matriz de construye de la siguiente forma:
T
1
c
=
_
_
_
_
_
e
T
n
e
T
n
A
.
.
.
e
T
n
A
n1
_
_
_
_
_
La matriz de cambio es T
c
, la inversa de esta ultima. Si con esta matriz se
hace una transformacion de estado, se obtiene el sistema representado en la
forma controlable ( representacion en variables de fase) a partir de cualquier
otra representacion.
x(t) = T
c
x(t)

A = T
1
c
AT
c
=
_
_
_
_
_
_
_
_
_
_
_
_
0 1 0 . . . 0
0 0 1 . . . 0
. . . . .
. . . . .
. . . . .
0 0 0 . . . 1
a
0
a
1
. . . a
n2
a
n1
_
_
_
_
_
_
_
_
_
_
_
_

B = T
1
c
B =
_
_
_
_
_
_
_
_
_
_
0
0
.
.
.
0
1
_
_
_
_
_
_
_
_
_
_
Si se aplica a estas matrices, el procedimiento descrito en el apartado
anterior, se obtiene una matriz de retroalimentacion

K, correspondiente a
la representacion en forma controlable ( representacion en variables de fase)
, que se han de convertir a las variables medibles o accesibles del sistema,
seg un se muestra en la gura 4.3. La se nal de control entonces viene dada
por:
u =

K x(t) =

KT
1
c
x(t) K =

KT
1
c
28

K T
1
c
x(t)
K
Figura 4.3: Transformacion de la matriz de retroalimentacion K
4.3. Dise no de servosistemas
En el apartado anterior se hizo la suposicion de que r = 0, teniendo
una ley de control de la forma u = Kx. Ahora veremos el caso para
r = 0 y entonces la ley de control es como mencionamos al inicio, esto es,
u = Kx + k
r
r. Antes de continuar mencionemos la siguiente denicion.
Denicion 12 (Punto de equilibrio) Se dice que un punto x
e
, en el es-
pacio de estado es un punto de equilibrio del sistema, si tiene la propiedad de
que independientemente de cual sea la condicion inicial de la trayectoria del
vector de estado, esta converge a x
e
y permanece en el para todo el tiempo
futuro.
Observacion 11 Observe que x
e
= 0 ya que en ese punto el sistema no se
mueve.
Cuando r = 0 lo que se busca es que la salida del sistema siga una
se nal de referencia deseada, i.e. y r, esto es lo que se le conoce como
un servosistema. Si la matriz K ha sido encontrada tal que el la matriz del
sistema en lazo cerrado tenga los valores propios en las posiciones deseadas,
entonces, el vector de estado tiende a un punto de equilibrio, i.e. x x
e
.
Entonces por la observacion 12 se tiene que:
0 = Ax
e
+Bk
r
r
Bk
r
r = Ax
e
x
e
=

A
1
Bk
r
r
29
por lo que la salida del sistema viene dada por:
y = Cx
e
y = C

A
1
Bk
r
r
Ahora, dado que el objetivo es que y

r cuando t , para que esto


suceda es necesario que la matriz k
r
sea:
k
r
= (C

A
1
B)
1
= (C(ABK)
1
B)
1
(4.13)
Ejemplo
Consideremos el ejemplo del sistema Masa-Resorte-Amortiguador y supon-
gamos que queremos estabilizar el sistema a una posicion constante x
1
=
y = 2. En este caso es necesario utilizar la ley de control u = Kx+k
r
r. La
matriz K = [5 81] ya fue encontrada en el ejemplo anterior. Ahora se tiene
que que encontrar k
r
. Note que la matriz A y B son conocidas y ademas en
este caso la salida del sistema es x
1
es decir la posicion, entonces, C = (1 0).
Usando la relacion 4.13, se tiene, que k
r
= 6.
4.3.1. Regulador lineal cuadratico LQR (problema del hori-
zonte innito)
Considere la siguiente funcion de costo
J =
_

0
[x
T
Q
x
x +u
T
Q
u
u]dt (4.14)
El objetivo es minimizar la funcion J (ecuacion 4.14) sujeta a la restriccion:
x(t) = Ax(t) +Bu(t)
donde Q
x
, Q
u
son matrices simetricas denidas positivas, llamadas matrices
de ponderacion.
La funcion de costo 4.14 representa un compromiso entre la distancia del
estado al origen y la magnitud de la se nal de control u que lleva al vector
de estado a un punto de equilibrio.
Escogiendo Q
x
y Q
u
, podemos balancear la velocidad de convergencia con
la magnitud del control.
La solucion al problema de control optimo (sin demostracion) es
u = Q
1
u
B
T
Px (4.15)
donde P R
nn
: P > 0 y satisface la ecuacion algebraica de Riccati
PA+A
T
PPBQ
1
u
B
T
P+Q
x
= 0
30
Observacion 12 (Matriz de retroalimentacion K optima) La solucion
al problema del control optimo 4.15 tambien resuelve de forma optima el pro-
blema de control por retroalimentacion de estados, ya que nos da la matriz
de retroalimentacion K optimizada mediante la expresion: K = Q
1
u
B
T
P.
Observacion 13 (LQR en Matlab) La funcion en Matlab que resuelve
el problema del control optimo y nos da la matriz K de retroalimentacion
optima es:
K = lqr(A, B, C, D)
31

You might also like