# 6 - Edson Simões Dos Santos

UNIVERSIDADE CANDIDO MENDES UCAM
PROGRAMA DE PS-GRADUAO EM PESQUISA OPERACIONAL E INTELIGNCIA COMPUTACIONAL

CURSO DE MESTRADO EM PESQUISA OPERACIONAL E INTELIGNCIA COMPUTACIONAL
Edson Simes Dos Santos
PROJETO E CONSTRUO DE UM CONTROLADOR ADAPTATIVO

POR REALIMENTAO DE ESTADOS DE UM PNDULO INVERTIDO
UTILIZANDO INTELIGNCIA COMPUTACIONAL
CAMPOS DOS GOYTACAZES, RJ

Novembro de 2013
UNIVERSIDADE CANDIDO MENDES - UCAM

PROGRAMA DE PS-GRADUAO EM PESQUISA OPERACIONAL E INTELIGNCIA COMPUTACIONAL
CURSO DE MESTRADO EM PESQUISA OPERACIONAL E INTELIGNCIA COMPUTACIONAL
Edson Simes Dos Santos
PROJETO E CONSTRUO DE UM CONTROLADOR ADAPTATIVO

POR REALIMENTAO DE ESTADOS DE UM PNDULO INVERTIDO
Dissertao apresentada ao Programa de

Ps-Graduao em Pesquisa Operacional e
Inteligncia Computacional, da Universidade
Candido
Mendes
Campos
dos
Goytacazes/RJ, para obteno do grau de
MESTRE EM PESQUISA OPERACIONAL E
INTELIGNCIA COMPUTACIONAL.
Orientador: Prof. talo de Oliveira Matias, D.Sc.
CAMPOS DOS GOYTACAZES, RJ

Novembro de 2013
EDSON SIMES DOS SANTOS
PROJETO E CONSTRUO DE UM CONTROLE ADAPTATIVO POR

REALIMENTAO DE ESTADOS DE UM PNDULO INVERTIDO
Dissertao apresentada ao Programa de

Ps-Graduao em Pesquisa Operacional e
Inteligncia Computacional, da Universidade
Candido
Mendes
Campos
dos
Goytacazes/RJ, para obteno do grau de
MESTRE EM PESQUISA OPERACIONAL E
INTELIGNCIA COMPUTACIONAL.
Aprovada em 29 de novembro de 2013.
Orientador: Prof. talo de Oliveira Matias, D.Sc.
BANCA EXAMINADORA
_________________________________________________________
Prof. talo de Oliveira Matias, D.Sc.- orientador
Universidade Candido Mendes
_________________________________________________________
Prof. Eduardo Shimoda, D.Sc.
Universidade Candido Mendes
________________________________________________________
Prof. Adelson Siqueira Carvalho, D.Sc.
Instituto Federal Fluminense
CAMPOS DOS GOYTACAZES / RJ

NOVEMBRO 2013
AGRADECIMENTOS
Agradeo a Deus pela sua infinita misericrdia.

Ao meu orientador, professor talo de Oliveira
Matias, pela compreenso e dedicao que foram
fundamentais na concretizao deste trabalho.
A minha querida namorada Lunara pelo carinho e
apoio incondicional.
Aos alunos Fbio Barradas, Camila Lins, Elias
Barreto e Ana Laura Lisboa, pela contribuio dada
durante algumas fases no desenvolvimento deste
projeto.
Aos meus amigos por me incentivar e pela fora
dada nos momentos de dificuldade.
Ao Instituto Federal de Educao, Cincia e
Tecnologia Fluminense pela disponibilizao de
seus laboratrios.
Saber muito no lhe torna inteligente. A

inteligncia se traduz na forma que voc recolhe,
julga, maneja e, sobretudo, onde e como aplica
esta informao.
Carl Sagan
RESUMO
PROJETO E CONSTRUO DE UM CONTROLE ADAPTATIVO POR

REALIMENTAO DE ESTADOS DE UM PNDULO INVERTIDO UTILIZANDO
INTELIGNCIA COMPUTACIONAL
Algoritmos de otimizao baseados em mtodos heursticos tm sido largamente

utilizados na sintonia automtica de controladores, principalmente quando uma
soluo analtica no se apresenta vivel em relao ao custo e tempo de obteno
de uma soluo satisfatria. Tambm se torna crescente o emprego da Inteligncia
Computacional (IC) em demanda da complexidade dos sistemas e variaes das
condies de operao, exigindo cada vez mais sistemas de controle robustos e
adaptativos a ambientes dinmicos. O objetivo deste estudo projetar um sistema
de controle adaptativo utilizando inteligncia computacional, em conjunto com um
sistema capaz de alto-configurar a Rede Neural Artificial (RNA) utilizada no
controlador, atendendo as restries estipuladas no projeto. No presente trabalho
aborda-se projeto e construo de um controlador adaptativo por ganho agendado,
implementado via RNA. O projeto apresenta a obteno e a representao do
modelo no linear do pndulo invertido em Espao de Estados. O modelo do sistema
classificado como variante no tempo devido variao de massa, e exige um
controle adaptativo devido s variaes dos parmetros de operao, como tempo
de acomodao e sobressinal. A estratgia de controle adotada o controle por
realimentao de estados, caracterizado pela alocao dos polos de malha fechada
no plano complexo. Um Algoritmo Gentico (AG) responsvel pela alocao dos
polos, obtidos a partir de uma busca num espao de soluo no linear. Este
algoritmo tambm responsvel pela configurao automtica da RNA. O algoritmo
evolutivo utilizado (AG) manipula a quantidade de camadas ocultas, nmero de
neurnios das camadas e funes de ativao para obter uma melhoria na
arquitetura da rede utilizada no problema proposto, sem que um conhecimento
especialista do sistema seja exigido. Estratgia de crossover, mutao e elitismo,
so utilizadas na evoluo da populao do AG. As operaes de otimizao neste
trabalho ocorrem num espao de busca limitado pelo autor. Aps os testes, um
simulador construdo com animao em 2D, permitindo ao usurio interagir com o
modelo e acompanhar a resposta deste em tempo real. O sistema de controle
adaptativo desenvolvido e implementado computacionalmente no presente trabalho
atendeu as condies de variao de massa, sobressinal e tempo de acomodao,
atuando dentro da faixa de operabilidade estabelecida em projeto. O mtodo de
configurao automtica da RNA por AG obteve uma configurao de rede, e
retornou o menor erro aps o treinamento num determinado conjunto de solues.
PALAVRAS-CHAVE: Controle Adaptativo,
Computacional, Redes Neurais Artificiais.
Algoritmo
Gentico,
Inteligncia
ABSTRACT
DESIGN AND CONSTRUCTION OF ADAPTIVE CONTROL BY STATE FEEDBACK

OF AN INVERTED PENDULUM USING COMPUTATIONAL INTELLIGENCE
Optimization algorithms based on heuristics have been extensive used in automatic

tuning of controllers, especially when an analytical solution is not available relation to
cost and time of obtaining a satisfactory solution. The use of Computational
intelligence (CI) increases by the demand system complexity and variations of the
operating conditions, requiring increasingly robust control and adaptive in dynamic
environment. This bacharol1s work aims to show the design and development of an
adaptive controller for gain scheduled, implemented via Artificial Neural Network
(ANN). The objective of this study is to design an adaptive control system using
computational intelligence, together with a system capable of high-configure the
Artificial Neural Network (ANN) used in the control, according the restrictions
stipulated in the project .The project presents a nonlinear model of the inverted
pendulum in State Space. The system model is classified as time-varying due to
mass variation and is adaptive control due to the variation of operating parameters
such as settling time and overshoot. The adopted control strategy is the state
feedback control, characterized by the allocation of the closed-loop poles in the
complex plane. A Genetic Algorithm (GA) is responsible for allocating the poles
obtained from a search in the space of nonlinear solution. This algorithm is also
responsible for the automatic configuration of the ANN. The evolutionary algorithm
used (GA) manipulates the amount of hidden layers , number of layers of neurons
and transfer functions for an improved network architecture used in the proposed
problem without the necessity of great knowledge about the system. Crossover,
mutation and elitism strategies are used in the GA population evolution. Operations
for optimization are a search in a limited space by the author. After the tests, a
simulator is developed with 2D animation, allowing the user to interact with the model
and monitor this response in real time. The adaptive control system developed and
implemented computationally in this work meets the conditions of mass variation,
overshoot and settling time, acting within the range of operability established in the
project. The method auto-configuration of ANN by GA obtained a network
configuration that returned the smallest error after training in a set of particular
solutions.
KEYWORDS: Adaptive Control, Genetic Algorithm, Computational Intelligence,
Artificial Neural Networks.
LISTA DE FIGURAS
Figura 1: Sistema pndulo invertido.
14
Figura 2: a) Brinquedos bpedes; b) Veculo de um eixo; c) Exoesqueleto.
17
Figura 3: Citaes do artigo Identification and Control of Dynamical Systems using

Neural Networks.
24
Figura 4: Representao de um indivduo binrio
35
Figura 5: Fluxograma padro
36
Figura 6: Indivduos pertencentes mesma populao.
37
Figura 7: Ciclo de reproduo.
38
Figura 8: Processo de mutao de um indivduo.
38
Figura 9: Modelo de neurnio biolgico.
40
Figura 10: Modelo Neural Artificial.
41
Figura 11: Funes de ativao.
42
Figura 12: Arquitetura feedforward.
43
Figura 13: Fases do Algoritmo backpropagation.
46
Figura 14: Fluxograma do Treinamento usando o algoritmo Levenberg Marquardt.

49
Figura 15: a) Sistema simplificado do pndulo invertido; b) Representao do
movimento vertical e horizontal; c) Centroide da haste.
59
Figura 16: Cromossomo representado na base binria.
64
Figura 17: Gerao de descendentes por crossover.
67
Figura 18: a) Tempo de acomodao b) Sobressinal c) Massa.
71
Figura 19: Matriz A e b de inequaes.
72
Figura 20: Grfico da evoluo dos melhores indivduos.
74
Figura 21: Grfico da resposta do sistema ao distrbio.
76
Figura 22: Grfico da resposta do sistema ao distrbio, aps variaes das variveis
de estado.
77
Figura 23: Grfico da resposta do sistema ao distrbio, ao final da simulao.
78
Figura 24: Sistema representado por diagrama de blocos.
79
Figura 25: Animao do pndulo invertido.
79
Figura 26: Boto para insero de distrbios.
80
LISTA DE TABELAS
Tabela 1: Quantidades de publicaes por rea.
22
Tabela 2: Quantidades de publicaes por pas.
22
Tabela 3: Quantidades de publicaes por Lngua de publicao.
22
Tabela 4: Quantidades de publicaes por rea para sistemas no lineares.
23
Tabela 5: Quantidades de publicaes por pas para sistemas no lineares.
23
Tabela 6: Quantidades de publicaes por Lngua de publicao para sistemas no

lineares.
23
Tabela 7: Quantidades de publicaes por rea, para o sistema pndulo invertido. 25
Tabela 8: Quantidades de publicaes por pases, para o sistema pndulo invertido.
26
Tabela 9: Tabela de indivduos para seleo por meio de roleta.
37
Tabela 10: Diferena dos parmetros com penalizao.
67
Tabela 11: Polos utilizados no Treinamento da RNA.
73
Tabela 12: Evoluo dos melhores indivduos.
74
LISTA DE SIGLAS
ACO
Colony Optimization Algorithm
AE
Algoritmos evolutivos
AG
Algoritmo Gentico
AI
Artificial Intelligence
ANN
Artificial Neural Network
EP
Evolutionary Programming
EPNet
Evolutionary Programming Network
GA
Genetic Algorithm
GPS
General Problem Solver
IA
Inteligncia Artificial
MIMO
Multiple Input Multiple Output
MLP
Multilayer Perceptron
PID
Proporcional Integrativo e Derivativo
RNA
Rede Neural Artificial
SIMO
Single Input Multiple Output
SISO
Single Input Single Output
IC
Inteligncia Computacional
CI
Computational intelligence
CE
computao evolutiva
SUMRIO
INTRODUO
13
1.1 OBJETIVO
16
1.1.1 Objetivo Geral
16
1.1.2 Objetivos Especficos
16
1.2 JUSTIFICATIVA
17
1.3 ABORDAGEM DO TEMA NA PESQUISA
18
1.4 ORGANIZAO E DISPOSIO DOS CAPTULOS
18
2 PESQUISA TEMTICA
21
2.1 ANLISE BIBLIOMTRICA
21
2.2 ESTADO DA ARTE
26
3 REVISO DE LITERATURA
30
3.1 INTELIGNCIA ARTIFICIAL
30
3.2 - ALGORITMO GENTICO (AG)
32
3.2.1 Pseudocdigo
36
3.3 REDES NEURAIS ARTIFICIAIS (RNAS)
39
3.3.1 Neurnios
40
3.3.2 Configurao das RNAs
43
3.3.3 Aprendizado das RNA's
44
3.3.3.1 Algoritmo Backpropagation
45
3.3.3.2 Mtodos de Segunda Ordem
46
3.3.3.3 Mtodo de Newton
46
3.3.3.4 Levemberg Marquardt
47
3.4 CONTROLE MODERNO
49
3.4.1 Projeto de Sistemas de Controle no Espao de Estados
52
3.4.2 Controle Adaptativo
53
3.4.3 Ganho programado
54
3.5 METODOLOGIA DA SIMULAO
55
3.5.1 Sistemas e modelos
56
3.5.2 Tipos de modelos
57
3.5.3 Plataforma de simulao
58
4 DESENVOLVIMENTO
59
4.1 MODELO NO LINEAR DO PNDULO INVERTIDO
59
4.2 MODELAGEM NO ESPAO DE ESTADOS
60
4.3 PROJETO DO CONTROLADOR ADAPTATIVO
64
4.3.1 Algoritmo de Otimizao
64
4.3.2 Projeto da Rede Neural
68
4.3.3 Projeto do Ganho Agendado
69
4.4 SIMULAO
70
4.4.1 Configurao do controlador
70
4.4.2 Configurao do Projeto da RNA
71
5 RESULTADOS E DISCUSSES
73
CONSIDERAES FINAIS
81
6.1 CONCLUSO
81
6.2 SUGESTES PARA TRABALHOS FUTUROS
83
REFERNCIAS BIBLIOGRFICAS.
84
ANEXO I: ARTIGOS CIENTFICOS
91
13
INTRODUO
O pndulo invertido um sistema didtico muito utilizado na rea de controle

devido as suas caractersticas de instabilidade. A anlise deste sistema possibilita
trabalhar desde as teorias de modelagem para sistemas no lineares, linearizao,
aplicao de controle convencional quando linearizado e controle moderno.
Este sistema pode ser comparado ao controle de posio de um foguete na
fase de lanamento, em que o objetivo manter o foguete na posio vertical
(OGATA, 2010). A linearizao do modelo para este caso pode ser aplicado com
eficincia devido ao foguete partir prximo da posio de equilbrio e sofrer
pequenos distrbios. Aps o lanamento, a massa do foguete diminui com a queima
do combustvel e com o desacoplamento dos propulsores, passando a se comportar
diferentemente do momento em que se encontrava na base lanamento, ficando
sujeito a distrbios maiores. Nesta situao um modelo no linear e variante no
tempo que melhor descreve o sistema, contudo exige um controle mais sofisticado,
bem como metodologia e teorias mais complexas.
As teorias de controle e estatsticas por algum tempo apresentaram certas
limitaes que motivaram o surgimento e crescimento da rea de Inteligncia
Artificial (IA). Esta que inicialmente surgiu como uma rebelio a tais limitaes, agora
inclui estes campos em sua rea de pesquisa (MCALLESTER, 1998, apud RUSSEL,
2003).
Segundo Russell (2003), nos ltimos anos, uma revoluo aconteceu na rea
de IA, no que tange o seu contedo e sua metodologia, sendo mais comum usar as
teorias existentes, em vez de propor uma nova, fundamentando suas bases atravs
de evidncias experimentais rgidas e destacando a relevncia nas aplicaes em
14
sistemas reais. Estes sistemas podem ser distribudos em diversas reas.

Atualmente a IA apresenta firmes mtodos cientficos. Cabe lembrar que no basta
simplesmente aplicar tais metodologias, pois uma hiptese para ser aceita deve ser
submetida a rigorosos testes empricos, seus resultados devem ser acompanhados
de analises estatsticos de acordo com sua relevncia (COHEN, 1995, apud
RUSSEL, 2003).
O estudo na rea de controle moderno aplicado a sistemas no lineares tem
sido utilizado em inmeras reas, possibilitando aplicaes de solues diversas, de
maneira a contornar os problemas encontrados no controle convencional, que exige
linearizao de modelos, limitados a sistemas monovariveis, e por no possurem
bom desempenho quando aplicado a sistemas com grandes variaes de
parmetros ou condies de operao.
Para este tipo de sistema o controle adaptativo recomendado para atender
as restries de projeto. Segundo Bolton (2010), o controle adaptativo utilizado em
situaes de controle em que os parmetros da planta variam com o tempo ou,
talvez, com a carga. Assim, com a mudana da funo de transferncia da planta,
necessria uma nova sintonia do sistema de controle para que as condies de
otimizao sejam atendidas.
Segundo Rekdalsbakken (2006), vrios modelos fsicos de pndulo invertido
tm sido construdos e muitas estratgias de controle tm sido exploradas.
Recentemente, o foco na construo de sistemas de controle tem sido a inteligncia
artificial (IA), mtodos como a lgica Fuzzy, Redes Neurais Artificiais (RNAs) e
Algoritmos Genticos (AGs). Combinaes destes mtodos so tambm muito
relevantes na rea da computao evolutiva (CE).
A Figura 1 apresenta um sistema pndulo invertido num base de carro.
Figura 1: Sistema pndulo invertido.

Fonte: Lins e De Souza, 2013. Adaptada pelo autor.
15
A computao evolutiva uma rea da cincia da computao que utiliza as

ideias de evoluo biolgica para resolver problemas computacionais. Muitos destes
problemas exigem uma procura num espao enorme de possibilidades de solues,
tais como um vasto nmero de possveis arranjos de circuitos de hardware, para
uma configurao que produz comportamento desejado por um conjunto de
equaes, que ditar o comportamento de um sistema como um conjunto de regras
a controlar um rob, fazendo com que este navegue num ambiente. Tais problemas
computacionais muitas vezes requerem um sistema de controle adaptativo,
permitindo manter um bom desempenho em um ambiente em mudana. Problemas
como estes exigem solues complexas que geralmente so difceis para
programadores humanos conceber. A rede neural artificial (RNA) um exemplo
desta filosofia evolutiva da computao (MITCHELL, 1999). Embora as RNAs
apresentem bom desempenho na resoluo destes problemas, ainda existe uma
carncia no quesito metodologia ou regras exatas para obter a melhor configurao
da rede. Em sua maioria, a configurao se caracteriza mais como arte do que
cincia, pois demanda uma considervel experincia de cada projetista.
Em alguns casos, os mtodos exatos tendem a ser inadequados para
problemas de elevada complexidade, pois geralmente possuem alto custo para sua
obteno e podem no estabelecer uma soluo de boa qualidade dentro de um
tempo razovel. Em contrapartida, os mtodos heursticos, apesar de no
garantirem a melhor soluo, costumam pelo menos obter solues de boa qualidade
em um tempo razovel (LAFET, 2010).
Estudos na rea de IA mostraram que os exemplos naturais de aprendizagem

e adaptao so tesouros de procedimentos e estruturas para construo de
algoritmos de busca robustos. Estes so procedimentos de busca probabilsticos
projetados para trabalhar em grandes espaos. Destaque entre eles para o
Algoritmo Gentico (GOLBERG, 1988).
No presente trabalho o sistema pndulo invertido ser representado num
carro-pndulo. Ser simulada a variao da massa do modelo, que exigir um
controle adaptativo, por se tratar de um sistema variante no tempo. A escolha do
modelo no linear simplificado, desprezando atrito e momento de inrcia, se d em
funo de possibilitar a simulao com maiores distrbios, obtendo uma resposta
diferente do modelo linearizado, e por no haver a inteno, neste estudo, de ser
implementado num sistema fsico para comparao de resultados.
16
A otimizao feita pelo mtodo heurstico AG foi escolhida por apresentar fcil
implementao computacional, obter solues viveis com maior simplicidade,
exigindo somente uma funo de custo. A RNA como parte do sistema de controle
adaptativo apresenta menor custo computacional quando comparado programao
convencional estruturada para checagem e resposta das condicionais na variao
do sistema. Para contornar o problema enfrentado na configurao da Rede Neural,
um AG ser utilizado como mecanismo de configurao e otimizao, determinando
a quantidade de camadas ocultas, suas funes de ativao, e tambm o nmero de
neurnios nas camadas ocultas. Um AG tambm ser utilizado para escolher a
localizao dos novos polos da equao caracterstica, responsvel por gerar o
vetor de controle.
1.1 OBJETIVO
1.1.1 Objetivo Geral
Projetar e construir um controlador adaptativo para sistema pndulo invertido

de massa varivel que apresenta variao nas condies de operao, atendendo
os requisitos de sobressinal e tempo de acomodao estabelecidos no projeto, em
conjunto ser aplicado um mtodo capaz de autoconfigurar a arquitetura de uma
RNA para ser utilizada como controlador adaptativo.
1.1.2 Objetivos Especficos
Implementar um algoritmo de otimizao (AG) para alocao dos polos da

equao caracterstica do sistema de controle adaptativo, por realimentao no
espao de estados.
Implementar AG para otimizar a configurao (funes de ativao, nmero
de neurnios da camada oculta, quantidade de camadas ocultas) da RNA que ser
utilizado como base do controle agendado.
Prover animao num ambiente em 2D, que permita a visualizao da
17
dinmica do sistema em tempo real, e interface que permita ao usurio a insero de

distrbio no sistema.
Analisar o comportamento do sistema de otimizao off-line em relao s
estratgias aplicadas.
Analisar o comportamento da RNA como base no controle agendado,
destacar as avaliaes positivas ou negativas encontradas durante a simulao.
Verificar se o controlador adaptativo consegue atender os requisitos
estipulados no projeto.
1.2 JUSTIFICATIVA
Estudos sobre controle moderno tm sido realizados utilizando Inteligncia

Computacional. Investe-se cada vez mais em sistemas autnomos e com grande
capacidade de adaptao em ambientes dinmicos, sujeitos a grandes variaes de
operao. Uma busca constante realizada na aplicao das metodologias j
existentes em aplicaes nas mais diversificadas reas do mundo real,
determinando sua viabilidade e desempenho. A rea de controle moderno um
excelente laboratrio para testes, devido a sua ampla aplicao nas diversas
ferramentas e objetos, nos mais variados ambientes, alguns exemplos so
encontrados na Figura 2.
Figura 2: a) Brinquedos bpedes; b) Veculo de um eixo; c) Exoesqueleto.

Fonte: a) http://www.informacaovirtual.com/ b) http://www.segway.com/
c) http://www.targethd.net/tecnologia
18
Na Figura 2.a tem-se como exemplo um rob de brinquedo bpede que exige
um sistema de controle para seu equilbrio. Na Figura 2.b um veculo de um eixo que
requer um controle robusto para ter agilidade e proporcionar suavidade em sua
conduo e na Figura 2.c um exoesqueleto utilizado para propiciar equilbrio ao
deficiente fsico, auxiliando-o em sua locomoo, substituindo a utilizao de uma
cadeira de rodas. Assim nos trs exemplos de reas distintas pode-se identificar as
possibilidades de aplicao das teorias de controle moderno.
1.3 ABORDAGEM DO TEMA NA PESQUISA
Ser apresentada uma aplicao especfica para simulao computacional,

realizando um estudo dirigido na implementao de um sistema de controle
adaptativo, em que sero abordadas as metodologias de modelagem de sistemas
fsicos, simulao, otimizao utilizando tcnicas evolutivas e aplicao de sistemas
inteligentes no reconhecimento de padres de controle, mostrando a viabilidade de
aplicao dessas metodologias no problema abordado.
1.4 ORGANIZAO E DISPOSIO DOS CAPTULOS
Captulo 1: Introduo: Neste captulo apresentada uma contextualizao

dos temas abordados na rea de controle, algoritmos evolutivos, inteligncia artificial
e Redes Neurais Artificiais. Expem-se os objetivos, justificativas e a forma como o
tema organizado e abordado nos captulos.
Captulo 2: Pesquisa Temtica. Neste captulo feito um breve

levantamento histrico relacionado ao tema proposto na dissertao, sua evoluo e
metodologias utilizadas ao longo do tempo. Apresenta um estudo realizado sobre as
publicaes mais recentes dos temas abordados, como estes tm sido tratados
academicamente, os mtodos utilizados para obteno de respostas para os
problemas abordados e reas de aplicaes.
19
Captulo 3: Reviso da Literatura. Neste captulo faz-se uma breve

introduo sobre IA, seu surgimento e sua evoluo, reas de atuao e definio
do conceito IA. Aborda-se algoritmos evolutivos, algoritmos genticos, sua
metodologia, e uma exemplificao atravs de um pseudocdigo. Tambm introduz
o conceito de RNA, sua arquitetura, seu funcionamento, comparao com o neurnio
biolgico, conceito de aprendizado, tipos de aprendizado e algoritmos de
treinamento. Na teoria de controle moderno apresenta-se a sua representao e
controle no espao de estados, controle por realimentao de estados, mtodo para
alocao dos polos de malha fechada, controle adaptativo e ganho programado.
Finaliza este captulo com a conceituao de modelos, classifica alguns destes
quanto ao seu tipo, define a ideia de simulao e apresenta de forma resumida a
plataforma de simulao utilizada neste trabalho. Para o leitor familiarizado com o
tema, a leitura deste captulo torna-se dispensvel.
Captulo 4: Desenvolvimento. Neste captulo apresentado o modelo no

linear do pndulo invertido, a forma que se concebeu o projeto do AG, do ganho
agendado com RNA e do controlador adaptativo. Apresenta alguns passos para a
construo do simulador e identifica as estratgias utilizadas. Relata as
configuraes utilizadas na simulao para as diferentes metodologias.
Captulo 5: Resultados e discusses. Neste captulo so apresentados,

atravs de grficos, tabelas e quadros, os resultados obtidos aps a simulao do
sistema.
Captulo 6: Consideraes finais. Este captulo apresenta a concluso e

sugestes para trabalhos futuros.
Concluso. Neste utiliza-se os resultados apresentados para fazer uma

anlise e responder se os objetivos estipulados na apresentao deste trabalho
foram alcanados e o quanto se alcanou.
Sugestes para trabalhos futuros. Neste so apresentadas algumas

sugestes pra trabalhos futuros, de modo a aproveitar os dados gerados e a
metodologia aplicada no desenvolvimento deste trabalho.
20
Referncias Bibliogrficas. Lista os trabalhos que serviram como base para

o desenvolvimento desta pesquisa.
21
2 PESQUISA TEMTICA
2.1 ANLISE BIBLIOMTRICA
A seguir apresentada uma breve anlise bibliomtrica sobre o tema

abordado neste trabalho. Ressalta-se que as informaes apresentadas so
referentes a uma base de pesquisa especfica num determinado perodo. O tema
abordado controle adaptativo de sistemas no lineares utilizando algoritmos de
otimizao e inteligncia artificial.
Para esta pesquisa, foi utilizada a base SCOPUS no dia 28/02/2013. O tema
Simulao Computacional com Controle Adaptativo de Sistemas Dinmicos
(computer simulation) AND (adaptive control) AND (dynamical systems) foi
introduzido na ferramenta de busca, retornando 5.666 publicaes, com o trabalho
mais antigo publicado em 1974 por Davidson, J.M., Durbin, L.D com o tema Model
reference adaptive control specification for a steam heated finned tube heat
exchanger. Este trabalho objetivava melhorar o desempenho dinmico no controle
de um sistema cuja funo de transferncia do modelo variava em relao ao tempo.
A distribuio destas publicaes foi levantada em categorias como
quantidade de publicaes na rea de pesquisa, pases de publicao e idioma de
publicao. Quantidade de publicaes em relao a reas de publicao, mostrado
na Tabela 1.
22
Tabela 1: Quantidades de publicaes por rea.
Classificao
1
2
3
4
5
rea Temtica
Engenharia
Cincia da Computao
Matemtica
Fsica e Astronomia
Neuro cincias
Quantidade
3611
2206
1133
621332
243
Fonte: Tabela extrada da base SCOPUS.

Disponvel em:< http://www.scopus.com/.>. Acesso em: fevereiro de 2013.
Pases em relao quantidade de publicaes, representado na Tabela 2.

Tabela 2: Quantidades de publicaes por pas.
Classificao
Pas
Quantidade
1
Estados Unidos
1357
2
China
1332
3
Reino Unido
389
4
Taiwan
330
5
Japo
263
6
Alemanha
253
7
Canad
249
8
Frana
229
9
Singapura
173
21
Brasil
70
A quantidade de publicaes por idioma mostrada na Tabela 3.

Tabela 3: Quantidades de publicaes por Lngua de publicao.
Classificao Lngua Quantidade

1
Ingls
5442
2
Chins
213
3
Japons
8
4
Portugus
4
5
Francs
2
Disponvel em: <http://www.scopus.com/.>. Acesso em: fevereiro de 2013.
Na dcada de 90 o tema de pesquisa agregado a sistemas no lineares AND

(nonlinear) comea a ser tratado com utilizao de inteligncia computacional. A
busca retorna 4.262 publicaes. A relao dos resultados encontrados por
categorias so apresentadas nas tabelas 4, 5 e 6.
23
Tabela 4: Quantidades de publicaes por rea para sistemas no lineares.
Classificao
rea Temtica
Quantidade
1
Engenharia
2817
2
Cincia da Computao
1679
3
Matemtica
920
4
Fsica e Astronomia
211
5
Engenharia Qumica
243
Disponvel em: <http://www.scopus.com/>. Acesso em: fevereiro de 2013.
Tabela 5: Quantidades de publicaes por pas para sistemas no lineares.
Classificao
Pas
Quantidade
1
China
1084
2
Estados Unidos
988
3
Taiwan
278
4
Reino Unido
273
5
Canad
190
6
Frana
167
7
Japo
166
8
Alemanha
154
9
Singapura
143
20
Brasil
52
Tabela 6: Quantidades de publicaes por Lngua de publicao para sistemas no lineares.
Classificao Lngua Quantidade

1
Ingls
4097
2
Chins
156
3
Japons
5
4
Portugus
3
5
Francs
2
Disponvel em:<http://www.scopus.com/>. Acesso em: fevereiro de 2013.
O trabalho Identification and control of dynamical systems using neural

networks (1990) por Narendra, Kumpati S; Parthasarathy, Kannan aborda na
simulao a eficcia da utilizao das RNA's para identificao e controle de
sistemas dinmicos no lineares, mostrando-se vivel como sistema de controle
adaptativo. Este trabalho apresentou grande relevncia, sendo citado em 3.396
artigos correlacionado ao tema como mostra o grfico da Figura 3.
24
Figura 3: Citaes do artigo Identification and Control of Dynamical Systems using Neural Networks.
Fonte: Grfico extrada da base SCOPUS.
Disponvel em: <http://www.scopus.com/>. Acesso em: fevereiro de 2013.
Dando continuidade na pesquisa no dia 01 / 03 / 2013, utilizando as mesmas

palavras chaves, e adicionando a busca por Redes Neurais Artificiais AND (neural
network), a busca retorna 2.300 publicaes. O artigo Adaptive neural control of
uncertain mimo nonlinear systems de Ge, S.S., Wang, C., refora a eficcia da
utilizao das RNAs nos sistemas de controle adaptativo para sistemas de mltiplas
entradas e mltiplas sadas (MIMO) com modelos no lineares. Publicado em 2004,
este trabalho foi citado em 218 publicaes. O Quadro 1 mostra as citaes deste
trabalho ao longo do tempo.
Quadro 1: Citao do artigo Adaptive neural control of uncertain MIMO nonlinear systems, ao longo
dos anos.
Fonte: Quadro extrado da base SCOPUS.

Disponvel em:<http://www.scopus.com/.>. Acesso em: maro de 2013.
Mtodos hbridos tambm so muito utilizados para otimizao destes

sistemas. Um desses mtodos que tem se apresentado com bastante eficincia, e
se mostrado de fcil implementao, a combinao das RNAs com AG (Algoritmo
Gentico). Ao refinar a busca com o algoritmo evolutivo AND (genetic algorithm),
tem-se um retorno de 347 registros na base de busca. O artigo A hybrid neural-
25
genetic multimodel parameter estimation algorithm, publicado em 1998, de Petridis,

V., Paterakis, E., Kehagias, A, aborda este tema, implementando um algoritmo
hbrido chamado de Neural-Gentico para estimao de parmetros de um
manipulador robtico planar e uma estao de tratamento de gua. Este Algoritmo
hbrido tambm utilizado na identificao de sistemas dinmicos no lineares. A
Rede Neural utilizada para atribuir um valor de custo ou aptido. O algoritmo
Gentico fica com a funo de utilizar este custo aplicado a probabilidades de
seleo para a produo de novas geraes de uma populao. Este trabalho foi
citado em 18 novas publicaes.
Este trabalho apresentado como dissertao de mestrado na rea de
Inteligncia Computacional e Pesquisa Operacional tem como principal objetivo a
otimizao e o controle adaptativo do pndulo invertido, uma busca na base com a
palavra chave AND (inverted pendulum), retornando 12 publicaes, todas
publicadas na lngua inglesa.
A distribuio destes trabalhos em relao rea de publicao dada na
Tabela 7.
Tabela 7: Quantidades de publicaes por rea, para o sistema pndulo invertido.
Classificao
rea Temtica
Quantidade
1
Engenharia
9
2
Cincia da Computao
8
3
Matemtica
3
Disponvel em: <http://www.scopus.com/.>. Acesso em: maro de 2013.
Relao de publicaes do tema pesquisado em relao aos pases de

origem destas publicaes e encontrado na Tabela 8.
26
Tabela 8: Quantidades de publicaes por pases, para o sistema pndulo invertido.
Classificao
Pas
Quantidade
1
Itlia
2
2
Coreia do Sul
2
3
Arglia
1
4
Canad
1
5
China
1
6
Iran
1
7
Malsia
1
8
Paquisto
1
9
Taiwan
1
10
Turquia
1
Disponvel em: <http://www.scopus.com/.>. Acesso em: maro de 2013.
Os doze artigos retornados na pesquisa so apresentados no Anexo I:

Este foi o procedimento adotado na busca de textos cientficos de referncia
ao tema abordado neste trabalho. O resumo dos principais artigos abordado no
Estado da Arte.
2.2 ESTADO DA ARTE
As informaes apresentadas sobre o estado da arte est em ordem com a

proximidade do tema desta trabalho, ser apresentado na ordem do tema mais geral
para o mais especfico, ou seja para o mais proximo do tema desta dissertao.
Algoritmos de otimizao tm sido largamente utilizados para sintonia
automtica de controladores. Os controladores Proporcional Integrativo e Derivativo
(PID) classificados como controladores convencionais, so aplicados em sistemas
lineares ou linearizveis univariveis com boa eficincia. Uma rea de aplicao
desta estratgia de controle a rea da robtica. Moghaddas (2012) aplica um AG
na otimizao da sintonia de um controlador PID em conjunto com equaes de
busca no lineares num pndulo invertido de massa constante. No entanto, Dastranj
et al. (2011), alerta que o mtodo de projeto de controle linear concebido com base
na aplicao principal do amplo leque de frequncia, mas em determinadas
situaes possui uma fraca aplicao por no conseguir compensar completamente
o efeito no linear dos sistemas.
Em sistemas que possuem um maior range de operao, pode apresentar
27
comportamento no linear caracterstico. Controladores utilizando mtodos com

Inteligncia Artificiais como lgica nebulosa (Controlador Fuzzy) e RNA so
aplicados com bom desempenho (BOGDANOV, 2004), pois alm de possurem
aes de controle no linear, podem trabalhar com sistemas que apresentam
respostas no lineares. Controles adaptativos tambm so aplicados para autoregulagem utilizada em conjunto com algoritmos de otimizao. O AG tem sido
largamente utilizado como ferramenta de otimizao em sistemas de controle por IA,
pela facilidade de trabalhar em espao de busca no linear. Um exemplo o
trabalho de Rekdalsbakken (2006), que utiliza o AG para atribuir valores de pesos e
bias numa RNA utilizada como controlador num pndulo invertido de massa
constante.
Mohamad et al. (2012), tambm aplica este mtodo no controle de
posio, num pndulo virtual, tambm de massa constante, utilizando um

controlador Fuzzy, sendo as funes de pertinncia do controlador ajustadas pelo
AG.
Sistemas como bpedes, tambm podem ser simplificados como um sistema
pndulo invertido para que seja projetado o seu sistema de controle. Ghorbani, Wu e
Wang (2007), investigam a estabilidade de controle de um bpede, utilizando a
simplificao anteriormente citada. O controle implementado por uma Rede Neural
que o estabiliza para uma posio prxima da vertical, e um controle PID faz o
controle na regio quando o erro tende a zero (regio linearizvel). O bpede tem
massa constante, o AG utilizado tem a funo de minimizar o fator custo de energia
durante o processo.
Recentemente, pesquisas sobre rede neural tem recebido cada vez mais
ateno, pelo potencial de aprender e reconstruir relaes no lineares, e tem sido
amplamente estudadas por pesquisadores da rea de controle na indentificao,
anlise e projeto de sistemas de controle. O tamanho da rede, muitas vezes
medida pelo nmero de unidades de neurnios em camadas ocultas, que reflete na
capacidade da RNA para aproximar uma funo arbitrria. Surgindo assim a
questo: qual o tamanho necessrio da rede neural para resolver um problema
especfico? Pesquisas tm sido realizadas para poder solucionar esta questo.
Yao (1997) utilizam um algoritmo de evoluo denominado EPNet
(Evolutionary Programming Network), para a evoluo de Redes Neurais Artificiais.
O algoritmo evolutivo utilizado na EPNet baseia-se na programao evolutiva de
Fogels (PE). O Algoritmo utilizado d nfase na mutao, evolui a arquitetura e
28
pesos das conexes. Para evitar o problema da permutao, o crossover no

adotado como estratgia, e sim a evoluo dos indivduos. A RNA utilizada do tipo
feedforward e a funo de ativao a funo sigmide.
Gutirrez et al. (2005), utiliza um esquema de codificao construtivo
indireto, com base na abordagem celular autnoma (Cellular automata), proposto
para encontrar automaticamente uma arquitetura de RNA apropriado para um
determinado problema. Um Algortimo Gentico utilizado para gerao de uma
populao e sua manuteno, atividades com crescimento celular e poda ocorrem
durante a otimizao. A funo de ativao utilizada na RNA uma funo
sigmoidal.
Rivero et al. (2008), utiliza um AG para configurao automtica da RNA.
Caractersticas como nmero de camadas ocultas, pesos e bias so alteradas para
promover a evoluo. Tcnicas de crossover e mutao tambm so adotadas. A
codificao utilizada do tipo grfica (Graph Codification). Este trabalho no
menciona a funo de ativao utilizada ou se esta sofre alterao.
Hassen (2012), sugere trabalhar com uma arquitetura de RNA fixa quadrada
de tamanho significativo e suficiente para descrever a regio de trabalho, utilizando
como funo de ativao uma funo de base radial. Tambm prope uma rede
autoorganizvel variando sua estrutura dinamicamente de modo a adicionar ou
remover Funes Gaussianas de base radial, de modo a assegurar a preciso e
aproximao desejada e ao mesmo tempo manter a complexidade de rede
apropriada. O tamanho das redes afetado pela distcia entre os pontos
necessrios para descrever a funo aproximada dentro de uma dada preciso.
No trabalho de Schuma (2013), o algoritmo de treinamento utilizado para
essas redes evolutivo. Uma populao de RNA gerada e mantida, uma funo
de aptido para a aplicao especfica aplicada a cada rede na populao. Redes
com maior aptido so preferencialmente selecionadas para a reproduo. A cada
seleo, duas redes com relativamente alta aptido so selecionadas e as
operaes de cruzamento e mutao so escolhidas com alguma probabilidade. As
operaes de cruzamento e de mutao no afetam apenas os pesos das sinapses,
mas o nmero de neurnios e o nmero de sinapses. No foi possvel identificar
neste trabalho a funo de ativao utilizada.
A proposta do presente trabalho acrescentar a variao de massa ao
sistema, com a variao de requisitos de controle num modelo de simulao no
29
linear, numa faixa de operao, em conjunto com a construo de um controlador

adaptativo. Para configurao automtica da rede, adicionou como opo no
algoritmo utilizado, quatro funes de ativao, alm da opo de quantidade de
camadas ocultas e nmeros de neurnios nas camadas. Estas so as variaes
deste trabalho em relao s publicaes apresentadas neste captulo.
30
3 REVISO DE LITERATURA
3.1 INTELIGNCIA ARTIFICIAL
Segundo Luger (2004) definir Inteligncia Artificial (IA) no uma tarefa

simples, comeando na definio do conceito de inteligncia em si, como: a
inteligncia uma faculdade nica ou apenas um nome dado a um conjunto de
habilidades distintas e no correlacionadas? Qual o limite da aprendizagem sem um
conhecimento prvio existente? Como a inteligncia representada no tecido de um
ser vivo? O que rege o aprendizado? possvel definir inteligncia a partir do
comportamento observvel ou necessria existncia de uma forma de
mecanismo interno particular? O que necessrio para projetar uma mquina
inteligente? Tais perguntas levam a outras questes paradoxais num campo de
estudo que inclui como objetivo sua prpria definio, algo considerado apropriado
por se tratar de uma rea jovem com limites no claramente definidos como outros
ramos mais antigos da cincia.
De acordo com Russell (2003), os primeiros trabalhos reconhecidos como IA
foram realizados por Warren (1943), baseando-se em trs fontes: conhecimento da
fisiologia bsica dos neurnios, anlise formal da lgica proporcional criada por
Russell e Whitehead, e a teoria da computao de Turing, em que um neurnio
artificial responde ao estmulo emitido por um nmero suficiente de neurnios
artificiais vizinhos, provocando uma mudana no seu estado. Allan Turing em seu
trabalho publicado em 1950 com ttulo Computing Machinery Intelligence foi o
primeiro a apresentar uma viso mais completa da IA com o teste de Turing,
aprendizagem de mquina, algoritmos genticos e aprendizagem por esforo.
Segundo Turing
(1950), quando se levanta a questo mquinas podem
31
pensar?, pode-se levar anlise separada das palavras mquinas e pensar como
usualmente so definidas, levando a concluses no adequadas para a pergunta, e
a tentativa de substituir tal questo por outra para tentar definir a questo levantada,
s levar a outra questo que estar intimamente relacionada com a primeira.
Prope-se: ao invs de procurar uma definio para a questo, pode-se descrever
atravs da soluo de um determinado problema.
Com a dificuldade de definir a IA, torna-se mais fcil formar uma ideia atravs
dos objetivos no estudo da IA, como proposto por Nascimento e Yoneyama (2004),
que relatam que a IA busca prover mquinas com capacidade de realizar algumas
atividades mentais do ser humano, atravs de alguns recursos computacionais com
variadas arquiteturas. Estas atividades podem envolver a sensopercepo como
tato, audio, viso, as capacidades intelectuais como aprendizagem, raciocnio
dedutivo, memria, a linguagem sendo verbais ou grficas; ateno, nas tomadas de
deciso sob um estmulo, a orientao, tendo um conhecimento sob sua situao
temporal e espacial num dado ambiente, a conceituao que busca captar a
essncia dos objetos e agrup-los em classe.
De acordo com Bittencourt (2001), o objetivo central da IA simultaneamente
a criao de teorias e modelos para capacidade cognitiva, prtica, com
implementao computacional, podendo mostrar-se com objetivo semelhante a do
estudo da psicologia, sendo diferenciado pela sua implementao computacional,
tornando-o autnomo de certa forma. Desta forma o modelo ou teoria de IA no
precisa ser provada atravs da comparao com os resultados previstos com o
comportamento humano.
Desviando das consideraes filosficas que abrange a IA pode-se afirmar
que existem duas reas que concentram as atenes dos pesquisadores em IA: a
representao de conhecimento e busca. A primeira trata de capturar um problema
numa linguagem formal e adequada para que este seja manipulado num
computador, fornecendo todo conhecimento necessrio para um comportamento
inteligente. A segunda a tcnica de soluo que explora o espao de estados do
problema, estgios sucessivos e alternativos no processo de soluo, que permite
numa busca gerar diferentes alternativas de resposta para diferentes escolhas
(LUGER, 2004).
Na construo de sistemas inteligentes existem duas principais linhas de
pesquisas: a linha conexionista e a linha simblica. A linha conexionista visa
32
modelagem da inteligncia humana atravs da simulao dos componentes do

crebro, e as interligaes de seus neurnios. A linha simblica segue a tradio
lgica estabelecendo-se a manipulao simblica de uma grande quantidade de
fatos especializados num domnio restrito na construo de sistemas inteligentes
(BITTENCOURT, 2001).
Na formalizao do problema e a busca da soluo, o conhecimento
especialista de suma importncia para obteno de sucesso na resoluo de
problemas especficos e complexos. No incio do estudo da IA, utilizava-se o
conhecimento genrico na soluo de problemas gerais por meio de sistemas GPS
(General Problem Solver). Conhecidos como mecanismos de busca geral, tais
abordagens foram chamadas de mtodos fracos, pois no suportavam um aumento
na escala do problema, apresentando um desempenho insatisfatrio para problemas
grandes e difceis (RUSSELL, 2003). A soluo de problemas complexos exige uma
combinao de entendimento terico e emprico sobre um problema especfico,
apoiado por um conjunto de regras heursticas (conhecimento do maior nmero de
estados possveis assumidos no processo de soluo) (LUGER, 2004). Entretanto,
hoje, alguns pesquisadores acreditam que grandes conjuntos de "regras complexas"
so demasiado custosas para os cientistas. Em vez disso, acredita-se que o melhor
caminho para a inteligncia artificial atravs de um paradigma em que os seres
humanos s devem escrever conjuntos de regras simples e fornecer um meio para
que o sistema se adapte. Comportamentos complexos como a inteligncia vo
emergir da aplicao paralela e interao destas regras (MITCHELL, 1999). Assim,
os sistemas especialistas devem ser construdos atravs da extrao do
conhecimento de um especialista humano utilizando IA para soluo de problemas
similares (LUGER, 2004).
3.2 - ALGORITMO GENTICO (AG)
Otimizao um mecanismo utilizado para determinao de uma ao que

proporciona um mximo de benefcio, medido por um critrio de desempenho prestabelecido, em que o critrio de desempenho deve ser minimizado caso
represente um custo, ou maximizado, caso seja associado a retorno (NASCIMENTO
JNIOR, 2004).
33
Segundo Bueno (2009), mtodos heursticos so algoritmos exploratrios que

buscam resolver problemas que, geralmente, no envolvem a implementao
computacional de um conhecimento especializado. Por este motivo, muitas vezes,
esses mtodos so classificados como busca cega. Uma soluo tima de um
problema nem sempre o alvo dos mtodos heursticos, uma vez que, tendo como
ponto de partida uma soluo vivel, baseiam-se em sucessivas aproximaes
direcionadas a um ponto timo.
No estudo das metas heursticas, podemos citar o surgimento do conceito de
evoluo. A evoluo biolgica uma fonte atraente de inspirao para abordar
difceis problemas computacionais. A evoluo , na verdade, um mtodo de busca
entre um grande nmero de possibilidades, por exemplo, o conjunto de sequncias
de genes possveis para - "Solues" que permitem que os organismos, sobrevivam
e se reproduzam em seus ambientes. Evoluo tambm pode ser visto como um
mtodo para a adaptao mudana de ambientes. As "regras" da evoluo podem
ser vistas de modo simples: As espcies evoluem por meio da variao aleatria (via
mutao, recombinao e outros operadores), seguida pela seleo natural em que
os mais aptos tendem a sobreviver e reproduzir-se, assim, propagar seu material
gentico para as geraes futuras. Este conjunto de regras responsvel pela
extraordinria variedade e complexidade que vemos na biosfera. Existem vrias
abordagens que tm sido seguidas em matria de Algoritmos evolutivos (AE). A
forma mais utilizada de algoritmos evolutivos so algoritmos genticos (AG's)
(MITCHELL, 1999).
Com o aumento do recurso computacional, as tcnicas de busca que
anteriormente eram bastante simples, tornaram-se mais elaboradas e hoje existe um
foco maior em buscas baseadas em populao. Citando como exemplo, tem-se os
Algoritmos Evolucionrios (EA) e o algoritmo baseado em Colnia de Formigas
(ACO) que hoje so utilizados em uma gama de problemas, tais como otimizao
numrica, combinatria, bioinformtica, problemas de alocao, entre outros (SILVA,
2008).
De acordo com Fernandes (2008), os AGs so mtodos adaptativos, que
podem ser usados para resolver problemas de busca e otimizao. Este se baseia
na teoria evolutiva postulado em Darwin (1859), onde as populaes evoluem na
natureza de acordo com os princpios de seleo natural e sobrevivncia dos mais
aptos. Imitando este processo, os AGs so capazes de fornecer solues para os
34
problemas do mundo real.

Segundo Michalewicz (1999), a evoluo do programa (implementao do
AG) se d atravs de um algoritmo probabilstico, que contm uma populao
principal de indivduos para cada interao. Cada indivduo pertencente populao
representa uma soluo potencial para o problema. A mensurao do potencial de
soluo de cada indivduo dada atravs do fitness, um valor numrico obtido
atravs de uma funo de avaliao fit, mesurando sua aptido em relao ao
meio, que pode ser obtida atravs de um custo ou retorno. Enquanto uma condio
de parada no for satisfeita, uma nova populao formada atravs da seleo
individual, tm-se novos indivduos so inseridos na populao em substituio de
alguns outros, fornecendo um novo conjunto de solues.
No processo de evoluo, a mutao uma pequena transformao a que um
indivduo est sujeito em suas caractersticas. Ao sofrer uma mutao, este ser
considerado um novo indivduo na populao, com uma nova aptido. Novos
indivduos tambm so formados atravs do cruzamento entre dois ou mais
indivduos da populao, gerando descendentes que compartilham as caractersticas
de seus pais. Quanto menor for sua aptido, menor ser a probabilidade de ser
selecionado para reproduo. Desta forma, uma nova populao gerada com
possveis solues, substituindo a anterior e apresentando caractersticas mais
promissoras para a soluo do problema. Desta forma as melhores caractersticas
so repassadas para as novas geraes, enquanto as caractersticas no
promissoras tendero a extino, convergindo para espaos de busca mais
promissores (MICHALEWICZ, 1999).
O Algoritmo Gentico pode ser implementado computacionalmente de
diversas formas. Para melhor compreenso a representao binria ser adotada
para exemplificar atravs de um pseudocdigo e simbolicamente um AG simples,
tambm conhecido como Algoritmo Gentico cannico. O individuo binrio
representado por um conjunto de gene denominado cromossomo. Cada gene
representado por um bit, e os subconjuntos de bits (genes) do cromossomo
representam suas caractersticas como mostra a Figura 4.
35
Figura 4: Representao de um indivduo binrio

Fonte: Prprio autor.
Na Figura 4, dois indivduos de populaes diferentes so representados por

um cromossomo de 12 genes (bits). O indivduo da populao A possui 4
caractersticas, enquanto o indivduo pertencente populao B possui um conjunto
de 3 caractersticas. A quantidade de genes e caractersticas dos indivduos de uma
populao depende da formulao do problema, sua preciso
particularidades do modelo.
Na Figura 5, apresentado um fluxograma padro do AG.
e outras
36
Figura 5: Fluxograma padro

Fonte: Elaborada pelo autor.
3.2.1 Pseudocdigo
No pseudocdigo do AG abaixo, exemplifica e explica passo a passo as
etapas do fluxograma anterior.
1- Incio {Algoritmo Gentico simples}
2- Gera populao inicial de tamanho n: a populao gerada aleatoriamente
com conjunto de caractersticas pr-definidas. Se tratando de problemas numricos,
estes possuem intervalos numricos definidos, exemplificados na Figura 6.
37
Figura 6: Indivduos pertencentes mesma populao.

A Figura 6 exemplifica indivduos distintos pertencentes a uma populao

qualquer.
3- Calcula aptido de cada indivduo: atribui, em cada indivduo, um valor de
aptido individual (fitness), atravs de uma funo de avaliao. Em seguida, uma
avaliao feita em cada indivduo em relao populao total (fitness global).
4- Ciclo reprodutivo: seleciona dois indivduos da populao baseado numa
probabilidade de seleo proporcional aptido de cada indivduo. Define-se uma
taxa de reproduo em relao populao.
4.1- Seleo: o mtodo roleta um dos mais aplicados para seleo dos
indivduos, em que um valor aleatrio gerado numa faixa de 0% a 100% (entre 0 e
1), que corresponde a aptido do indivduo em relao populao. A Tabela 9
mostra a relao do fitness individual, relacionando-os com o fitness global.
Tabela 9: Tabela de indivduos para seleo por meio de roleta.
Indivduo Aptido Global Aptido Acumulada

1
2
3
0,1
0,15
0,05
0,10
0,25
0,30
n-2
n-1
n
0,11
0,02
0,07
0,82
0,93
1,00
Fonte: Elaborado pelo autor.
4.2- Cruzamento: variadas tcnicas de cruzamento podem ser aplicadas,

cada uma delas podendo dar um retorno particular em relao melhora da espcie.
O mais usual que dois novos indivduos (descendentes) sejam gerados a partir de
dois pais. Seus cromossomos sero compostos pela soma das metades das
38
caractersticas genticas dos indivduos reprodutores, este processo conhecido

como crossover, como mostra na Figura 7.
Figura 7: Ciclo de reproduo.

A Figura 7 representa o crossover sendo aplicado na gerao de dois

descendentes. O primeiro filho recebe a primeira metade do material gentico do
reprodutor 01 e a segunda metade do material gentico do reprodutor 02. O inverso
aplicado na gerao do descendente 02.
5- Mutao: no processo de mutao, um ou mais genes podem ser selecionados
para alterao da(s) caracterstica(s) de um indivduo. Uma taxa de mutao prdeterminada em relao populao para possibilitar fugas de timos locais como
mostra a Figura 8. O mtodo roleta pode ser adotado para seleo do indivduo que
sofrer a mutao.
Figura 8: Processo de mutao de um indivduo.

A Figura 8 mostra um gene que sofre mutao, o bit tem seu valor modificado de 0
para 1. Aps a mutao o valor de fitness individual e global atualizado.
Michalewicz (1999), adota uma taxa de cruzamento de 0,25 garantindo a
renovao de no mximo metade da populao neste processo, e mutao de 0,01.
6- Caso no atenda a condio de parada retorna ao passo 5. A condio de
parada pode ser uma condio de convergncia ou atendimento de um conjunto de
restries.
7- Fim
Outras estratgias de crossover, mutao podem ser adotadas na
39
implementao dos AGs, assim como taxas diferentes das mencionadas podem ser
escolhidas no objetivo de melhorar a convergncia do algoritmo.
3.3 REDES NEURAIS ARTIFICIAIS (RNAS)

O modelo biolgico do crebro humano, constitudo de neurnios e sistema
nervoso, serviu como inspirao para o surgimento das Redes Neurais Artificiais
(RNA), implementada atravs de uma arquitetura computacional com funcionamento
similar. Em conjunto com a ideia central de Inteligncia Artificial na dcada de 1950,
tambm surgiu um conjunto de tcnicas que permitiriam o desenvolvimento de
sistemas suficientemente genricos para resolver problemas gerais, condicionados
sua devida representao. Assim, as RNAs, tambm chamadas de abordagem
conexionista, surgiram como uma alternativa abordagem simblica, que se
baseava na lgica (KRATZER, 1991).
Os primeiros modelos propostos por McCulloch (1943) tinham como objetivo
imitar a realidade biolgica. Tal preocupao hoje no compartilhada por muitos
pesquisadores. Com a teoria de que o aprendizado biolgico baseava-se no reforo
das ligaes sinpticas entre os nodos, Hebb a descreve em forma matemtica e,
por meio da variao dos pesos de entrada dos nodos, demonstra a capacidade de
aprendizagem de uma RNA. Mais tarde, Widrow e Hoff sugeriram uma regra de
aprendizado conhecida como regra delta (AZEVEDO, 2000), mas foi em 1958, com
Rosenblatt, que foi demostrado que, se fossem acrescidas sinapses ajustveis s
RNA's, essas poderiam ser treinadas para reconhecer certos tipos de padres. A
rede utilizada era chamada de Perceptron (ROSENBLATT, 1958).
O trabalho Minsky e Papert em 1969 rendeu duras crticas ao perceptron,
expondo a sua incapacidade de resolver problemas que no eram linearmente
separveis, e o fato de que o modelo de aprendizado, que garantia a convergncia
para modelo perceptrons com nica camada, no acontecia para redes
multicamadas. A euforia, que havia sido perdida, basicamente s foi retomada em
1986, com o algoritmo de retropropagao do erro (backpropagation) (BRAGA,
2011).
40
3.3.1 Neurnios
Apesar da complexidade do crebro humano, este formado por estruturas
relativamente simples, chamadas de neurnios. O neurnio biolgico mostrado na
Figura 9 dividido em trs sees: corpo celular, os dendritos e o axnio. Cada uma
possui uma funo especfica, porm estes so complementares.
Figura 9: Modelo de neurnio biolgico.

Fonte: Mota, (2007, p.25.)
Os dendritos tm por funo receber as informaes dos neurnios vizinhos

conectados e conduzi-las at o corpo celular. Neste, a informao processada e
novos impulsos so gerados e transmitidos a outros neurnios atravs do axnio at
os dendritos dos neurnios seguintes (BRAGA, 2011). Segundo Steiner (1995), o
crebro possui as seguintes caractersticas: uma rede altamente interconectada;
apresenta paralelismo macio, muitos neurnios operam ao mesmo tempo; o
processamento distribudo de modo que a informao no localizada, podendo
um fato corresponder ativao de um conjunto de neurnios; admite tolerncia a
falhas, assim, o prejuzo a poucos neurnios no afetam de modo significo a
operao do crebro.
O modelo de um neurnio artificial, mostrado na Figura 10, dividido em trs
elementos bsicos do modelo neural.
41
Figura 10: Modelo Neural Artificial.

Fonte: Mota (2007, p. 25.)
O conjunto de sinapses ou elos de conexo caracterizado por um peso que

ser atribudo entrada associada. O somador responsvel pela soma dos sinais
de entrada ponderados pelas respectivas sinapses. A funo de ativao restringe a
amplitude do sinal de sada e o intervalo permissvel de amplitude do sinal de sada
(HAYKIN, 2007). Os grficos da Figura 11 apresentam alguns exemplos de funo
de ativao como: tangente hiperblica sigmide (tansig), funo sigmide (logsig),
funo linear (purelin), funo de base radial (radbas) e funo degrau ou limiar
(hard-limit).
42
Figura 11: Funes de ativao.

Fonte: Matlab R2013a.
Disponvel em: <http://www.mathworks.com/help>. Acesso em: outubro de 2013.
Normalmente, as funes no lineares so as mais utilizadas. Outra prtica

comum a de utilizar uma mesma funo de ativao para todos os elementos de
uma mesma camada numa rede e, at mesmo, para toda a rede. Entretanto, no
uma regra (MOTA, 2007). Vale lembrar que as funes de ativao devem ser
escolhidas de acordo com as caractersticas da massa de dados. Algumas funes
de ativao requerem a normalizao destes dados na entrada, consequentemente
tambm emitindo uma resposta normalizada.
Segundo Haykin (2007), o modo pelo qual os neurnios de uma rede esto
estruturados se d de modo ntimo ao algoritmo de aprendizado utilizado em seu
treinamento. Basicamente, existem trs tipos de arquitetura fundamentalmente
diferentes: as redes de camada nica alimentadas adiante, as redes de mltiplas
camadas alimentadas adiante e as redes recorrentes.
Redes alimentadas adiante (feedforward): possui uma nica camada
apresentando como a forma mais simples de rede. Todo calculo feito na camada
de sada.
Redes alimentadas adiante (feedforward) com mltiplas camadas (multilayer):
nesta, a camada de entrada continua no sendo considerada, apenas as camadas
intermedirias e a camada de sada.
Redes alimentadas adiante com laos de realimentao (redes recorrentes):
se distingue das anteriores por haver pelo menos um lao de realimentao. As trs
43
estruturas so representadas na Figura 12.
Figura 12: Arquitetura feedforward.

Fonte: Mota (2007, p.28).
3.3.2 Configurao das RNAs
Uma feedforward Perceptron de Mltiplas Camadas (MLP- Multilayer

Perceptron), com duas ou mais camadas ocultas pode ser considerada como um
aproximador universal, pois consegue realizar um mapeamento com relao
entrada/sada, uma caracterstica existencial. Isto porque, cada neurnio, na
primeira camada, cria uma salincia e a prxima camada combina estas salincias
em regies disjuntas do espao. Entretanto, um problema ainda sem soluo, a
determinao do nmero timo de camadas escondidas e do nmero de neurnios
em cada camada para um dado problema, faltando um mecanismo sistemtico de se
chegar rede neural mais indicada em cada aplicao. Alm dos desafios
associados ao processo de otimizao de parmetros e determinao da estrutura
44
da RNA na etapa de aprendizado supervisionado, outro desafio est associado

capacidade de generalizao da rede. Deste modo deve-se controlar a flexibilidade
do mapeamento resultante, sem que este se apresente mais complexo do que o
necessrio para melhorar o desempenho no treinamento (GEMAN et al., 1992 apud
RAVIV, 1999).
Propostas so apresentadas com abordagem evolutiva para a otimizao da
configurao estrutural das RNAs e similares, como EP (evolutionary programming)
encontrado na literatura de YAO (1997), porm pelo fato de explorar uma regio de
busca contendo todas as arquiteturas possveis, tornam-se extremamente custosas
computacionalmente, embora sejam capazes de produzir bons resultados.
Indivduos diferentes, mas com mesma aptido tambm podem levar a dificuldades
numa abordagem evolutiva.
3.3.3 Aprendizado das RNA's

Segundo Fischler (1987), o conhecimento refere-se a um conjunto de
informaes armazenadas, ou modelos utilizados por uma pessoa ou mquina para
interpretar, prever ou responder apropriadamente aos estmulos do mundo exterior.
De acordo com Haykin (2007), so duas as principais caractersticas da
representao do conhecimento: informao realmente tornada explicita e como a
informao codificada fisicamente para posterior utilizao. A informao
codificada servir como um conjunto de dados ou amostra para treinamento da RNA
atravs de um algoritmo de aprendizagem apropriado.
Algoritmos de aprendizagem uma caracterstica importante da RNA e seu
algoritmo de aprendizagem. O processo de aprendizagem de uma rede neural o
ajuste dos pesos sobre os valores de entrada para uma determinada regra de
aprendizado controlado. Dependendo da finalidade h uma regra de aprendizagem
para cada configurao de RNA. Hoje, os mais utilizados so baseados em regras
de
Hebb.
Dois
tipos
de
aprendizagem
podem
ser
citados:
monitorada
(supervisionada) e aprendizado no supervisionado. Neste ltimo caso, a rede,

durante o processo de aprendizagem, no controla o valor de sada com um valor de
referncia externo. No treinamento supervisionado, a RNA aprende com valores de
entrada pr-classificados (padres) para uma certa classe (sada padro). O treino
45
dado, neste caso, a partir de uma referncia exterior, comparando a um alvo real,
gerando um erro. Este erro usado pela rede para o mapeamento dos valores de
entrada para o aprendizado (ajustes dos valores de pesos e bias) de uma
determinada classe. Aprender atravs de correo de erro o mecanismo de
aprendizagem mais utilizado (TAWIL,1999).
3.3.3.1 Algoritmo Backpropagation
O Algoritmo de aprendizagem backpropagation, utilizado no treinamento da

rede neural multicamadas um procedimento de treino supervisionado. Varias
abordagens foram feitas na ltima dcada para a sua aplicabilidade em numerosas
aplicaes (BRYAN, 2011). Este possui um bom desempenho quando no se dispe
de hardware potente. O treinamento de uma rede por backpropagation possui os
seguintes estgios: a apresentao dos padres rede, a comparao do valor
obtido com o valor desejado, a retropropagao do erro e o ajuste dos pesos
sinpticos. De maneira mais simples, pode-se dividir em duas as fases de
treinamento, em que a primeira, chamada de forward, utilizada para definir a sada
da rede para um padro de entrada e backward, que utiliza a sada da rede com a
sada desejada para ajustar os pesos de suas conexes (BRAGA, 2011). A Figura 13
ilustra as duas fases.
Segundo Braga (2011), uma dificuldade encontrada numa rede MLP com o
algoritmo backpropagation est associada sensibilidade da caracterstica da
superfcie do erro, em baixo gradiente e mnimos locais encontra dificuldades para
convergncia, exigindo a aplicao de outras abordagens para acelerar o algoritmo e
escapar dos mnimos locais.
46
Figura 13: Fases do Algoritmo backpropagation.

Fonte: Mota, 2007, p.31.
3.3.3.2 Mtodos de Segunda Ordem

Estes algoritmos so concebidos a partir de um rigor matemtico baseado em
modelos de otimizao no linear, no apresentando o vnculo natural com a
inspirao biolgica inicialmente proposta para as RNA's. Hoje estes mtodos so
considerados os mais eficientes no treinamento de redes neurais do tipo MLP
(SHEPHERD, 1997).
3.3.3.3 Mtodo de Newton

O mtodo de Newton pode ser considerado como o mtodo local bsico que
utiliza informaes de segunda ordem. Este aponta para um extremo local da funo
erro. Deve-se ter cuidado ao aplicar no treinamento das redes perceptrons
multicamadas, pois este exigir o clculo da matriz Hessiana, exigindo a sua
47
inverso, que representa um elevado custo computacional, anlise espectral e

armazenagem de uma matriz quadrada que da ordem do nmero de parmetros P
a serem ajustados (ZANETTI et al., 2007).
3.3.3.4 Levemberg Marquardt

O algoritmo proposto por Levemberg Marquardt um dos algoritmos de
segunda ordem mais rpidos para o treinamento de RNAs de tamanho moderado
(JONES et al., 2005), sendo este uma variao do mtodo de Newton (EDGAR,
1988) e melhora o mtodo de Gauss-Newton por meio da utilizao de uma taxa de
aprendizado varivel.
Uma explicao simplificada do clculo do algoritmo de treinamento
mostrado neste trabalho, a partir da descrio de Hao Yuand et. al. (2011).
Como o mtodo de Newton aplicado para a atualizao dos pesos, a fim de
obter matriz Hessiana H, a derivada de segunda da funo erro total tambm deve
ser calculado o que pode ser muito complicado. A fim de simplificar o processo de
clculo, a matriz Jacobiana J introduzido como:
O gradiente g utilizado para convergncia pode ser encontrado atravs da

relao da matriz jacobiana e da matriz de erro, sendo g = Je. O vetor erro e tem a
48
seguinte forma:
Como o pressuposto bsico do mtodo de Newton, tem-se que H J J.

Por combinao de equaes pode-se extrair a regra de atualizao do
algoritmo de Gauss-Newton dada como:
eq. 01
O algoritmo de Levenberg-Marquardt introduz outra aproximao da matriz
T
Hessiana H J J+ I. Sendo sempre positivo chamado coeficiente de

combinao, I a matriz identidade da prpria equao, garantindo que os
elementos da diagonal principal da matriz Hessiana aproximada ser maior do que
zero, garantindo que a matriz H inversvel. Assim a regra de atualizao dos pesos
no algoritmo de Levenberg Marquardt pode ser apresentado como:
eq. 02
Assim quando o coeficiente de combinao quase zero, a equao z
aproxima se para equao x, utilizando o mtodo Gauss-Newton, quando o
coeficiente de combinao muito grande utiliza o mtodo do gradiente. A taxa de
aprendizagem pode ser obtida da relao = 1/ .
O algoritmo utilizado para o treinamento pelo mtodo de Levenberg Marquardt
apresentado atravs do fluxograma da Figura 14.
49
Figura 14: Fluxograma do Treinamento usando o algoritmo Levenberg Marquardt.

Fonte: Hao Yuand et. al. (2011). Adaptada pelo autor.
3.4 CONTROLE MODERNO
Ogata (2010) diz que a teoria de controle moderno tem sido desenvolvida em
razo da necessidade de atender s crescentes e rigorosas exigncias de
desempenho dos sistemas de controle, ao aumento da complexidade dos sistemas e
ao acesso fcil e em larga escala aos computadores. Esta teoria , tambm,
essencialmente, uma abordagem no domnio de tempo, enquanto a teoria de
controle convencional uma abordagem no domnio da frequncia complexa. A
teoria de controle moderno enquadra sistemas de entradas e sadas mltiplas,
lineares ou no lineares e variantes ou invariantes no tempo.
A representao de um sistema em Espaos de Estados consiste da
representao de n funes de transferncias na forma matricial. A modelagem de
50
um problema no espao de estados elaborada utilizando um conjunto de

operaes de transformao de estados para, a partir de um estado inicial, chegar a
um estado final conforme desejado.
Para melhor compreenso so definidos alguns termos a seguir:
Estado O estado de um sistema dinmico como o menor conjunto de
variveis (variveis de estado) (OGATA, 2010), tais que o conhecimento dessas
variveis num instante inicial, juntamente com o conhecimento da entrada que o
sistema est submetido, determina completamente o comportamento do sistema em
qualquer instante futuro (DORF, 2009).
Variveis de estado As variveis de estado de um sistema dinmico so
aquelas que constituem o menor conjunto de variveis capaz de determinar o estado
desse sistema dinmico. Este conjunto capaz de descrever completamente o
comportamento de um sistema dinmico no futuro, desde que seja conhecido o seu
estado inicial (OGATA, 2010). A quantidade de variveis de estado igual
quantidade de condies iniciais que est associado ordem do sistema.
Dorf (2009) definem vetor de estado como a matriz coluna que consiste nas
variveis de estado.
Espao de estados Segundo Ogata (2010), o espao de n dimensional,
cujos eixos coordenados so formados pelas variveis de estado. Qualquer estado
pode ser representado por um ponto no espao de estados, definindo a configurao
instantnea do sistema.
Equaes no espao de estados A representao no espao de estados
envolve trs tipos de variveis que esto presentes na modelagem de sistemas
dinmicos: variveis de entrada, variveis de sada e variveis de estado (OGATA,
2010).
Na representao no espao de estados, a matriz A denominada a matriz
de estado do sistema, a matriz X, o vetor de estados composta pelas variveis de
estado, B a matriz de entrada, U o vetor de entrada, sinal proveniente de uma
ao externa, vetor manipulado como sinal de controle. A matriz C chamada de
matriz de sada e D a matriz de transmisso direta. A matriz composta pela
derivada de X () representa a equao de estado, e Y equao de sada. A
seguir, so dadas as equaes de estados e sada em espao de estados.
(t) = AX(t) + Bu(t)
eq. (03)
51
Y(t) = CX(t) + Du(t)
eq. (04)
A equao de estado esta representada sob a forma simplificada para

sistemas invariantes no tempo que admitam serem linearizadas num dado ponto.
A representao de um sistema no espao de estados no nica no que diz
respeito ao conjunto de variveis de estados (DORF; BISHOP 2009). Tambm
existem diversas formas de representao. A mais usual utilizada para controle por
realimentao de estados a forma cannica controlvel, que possui uma relao
de dualidade com a forma cannica observvel. Dada uma representao de uma
funo de transferncia.
A representao na forma cannica dada:
A construo da matriz cannica uma relao dos coeficientes da(s)

funo(es) de transferncia do sistema.
Dado:
52
Na construo de sistemas de controle por realimentao de estados

necessrio que o sistema seja de estado completamente controlvel, condio
necessria para que cada ao de controle afete o estado do sistema. Tambm
necessrio que as variveis de estado estejam disponveis para realimentao. Caso
num sistema real, alguma destas variveis no possam ser medidas diretamente, as
mesmas devero ser estimadas. Logo, exigir que o sistema seja observvel. Em
simulaes puramente computacionais, o sistema deve ser observvel.
Segundo Ogata (2010), para estabelecer se o sistema completamente
controlvel, necessrio que os vetores da matriz de controlabilidade [B, AB, ... ,
An1 B ] sejam linearmente independentes, ou seja, o posto da matriz igual ao
nmero de linhas da matriz de controlabilidade. Para observabilidade a mesma idia

aplicada na matriz de controlabilidade [Ct, CtAt, ... , Ct(At)n-1].
3.4.1 Projeto de Sistemas de Controle no Espao de Estados

Segundo Dorf (2009), para a realizao do projeto de controle por
realimentao de estado, tem que haver a possibilidade de todos os polos do
sistema em malha fechada serem arbitrariamente posicionados no plano complexo.
Se o sistema for controlvel e observvel, ento pode-se realizar o objetivo de
projeto de alocar os polos precisamente nas posies desejadas para se atender s
especificaes de desempenho.
No projeto do controlador, basicamente casa-se os coeficientes da equao
caracterstica do sistema com a da nova equao resultante da alocao dos novos
polos. Este obtido atravs de um vetor de ganho ou sinal de controle que ser do
tipo u = - Kx(t), o que significa que o sinal de controle determinado por um estado
instantneo (configurao instantnea do sistema). A matriz K1n denominada
matriz de ganho de realimentao de estado (OGATA, 2010).
Adotando u = - Kx(t) a nova equao de estado passa a ser:

x = ( A - Bk )x
A partir da equao caracterstica da matriz A, tem-se,
eq. (05)
53
sI A = s n + a1s n-1 +...+ an1s + an
form. (01)
deve-se determinar os valores de a1 , a2 ,..., an .
Utilizando os autovalores desejados (polos desejados de malha fechada),

escreve-se o polinmio caracterstico desejado:
(s 1 )(s 2 )...(s n ) = s n + 1s n-1 + ...+ n1s + n
form. (02)
e determina-se os valores de 1 ,2 ,...,n .
A matriz de ganho K de realimentao de estado requerida pode, ento, ser

determinada por:
K = n an n1 an1 ... 2 a2 1 a1 T 1
form. (03)
Dispondo de um bom modelo, o desafio para projetar o controlador

encontrar a alocao dos novos polos no plano complexo que d um resultado
satisfatrio em relao s restries de projeto.
3.4.2 Controle Adaptativo

Desde o momento de lanamento at a entrada em rbita de um foguete,
variaes severas acontecem no ambiente de navegao, como variao da
gravidade, densidade do meio, arraste aerodinmico, perda de massa e outras,
exigindo um sistema de controle robusto que se adapte para suportar tais mudanas
e manter-se em condies de operabilidade dentro do especificado em projeto.
Franklin, (1998), relata que as variaes na planta de um sistema de controle
podem causar impactos severos no desempenho e estabilidade. Por este motivo, os
projetos de sistema de controle tm um algoritmo que se reformula de acordo com
as alteraes na planta. Este o principal assunto do controle adaptativo. Vale a
pena notar que sempre existe uma amigvel discusso entre os engenheiros de
controle sobre esta definio. Uma definio que o controlador adaptativo um
54
sistema de controle que projetado de um ponto de vista adaptativo. Outra que o

controle adaptativo qualquer sistema de controle que monitora e realiza ajustes
para melhorar a performance. Segundo
strm (1995), o controle adaptativo pode
ser definido como um sistema de controle composto de um loop rpido para controle
e um loop lento ajuste de controle. Nesse caso, a definio do termo adaptativo
para modificar de acordo com as mudanas de circunstncias. Quase todos os
sistemas de controles adaptativos modificam-se sob as mudanas de circunstncias.
Segundo Bolton (2010), o controle adaptativo utilizado em situaes de
controle em que os parmetros da planta variam com o tempo ou, talvez com a
carga. Com a mudana da funo de transferncia da planta, necessria uma nova
sintonia do sistema de controle para que as condies de otimizao sejam
atendidas.
Para se projetar um sistema de controle, devem ser definidos quatro
critrios bsicos:
1) Um modelo de planta que seja controlvel e o range de sua validade.
2) Os valores dos parmetros do modelo e suas esperadas variaes.
3) Os objetivos de desempenho
4) As restries do projeto, como os custos das aes de controle, limites
de autoridade do controle e o custo pretendido do controlador.
3.4.3 Ganho programado

Segundo Flanklin, (1998), os algoritmos de controles so escolhidos
baseados em algumas condies de operao, assim o ganho programado
classificado como adaptativo. Desde que os parmetros de controle sejam
projetados off-line com a informao da prioridade do sistema, a principal
contribuio do ganho programado a identificao adequada do vetor de controle
que ser usado.
As simulaes so geralmente usadas para examinar a transio de uma
regio para a outra, ou seja, deve-se usar um ganho fixo, ou um ganho programado.
Deve-se notar que frequentes questes de estabilidade so contornadas pela
existncia de vrias pequenas regies e assegurando que o controlador passar de
uma para outra sem ficar preso em fronteiras. Assim, o controlador ser capaz de
55
realizar o controle em diversas regies sejam elas de ganho fixo ou agendado. Est
fundamentado que, para poucas regies que so alteradas raramente, ou possuem
parmetros que so alterados muito devagar, a estabilidade do sistema pode ser
assegurada se cada parte da lei de linearidade for examinada, isso se essas leis
forem fixadas. Portanto, o ganho programado geralmente considerado como
dependente de alguma variao lenta de parmetro (FLANKLIN, 1998).
Segundo o autor (op. Cit.), este mtodo um sofisticado conceito,
frequentemente usado para avaliar a estabilidade do sistema. Na prtica, a anlise
de
estabilidade
do
ganho
programado
consiste
na
realizao
de
um
acompanhamento mais prximo dos sistemas de simulaes.
3.5 METODOLOGIA DA SIMULAO

Segundo Freitas Filho (2008), a simulao permite realizar estudos sobre um
determinado sistema modelado para responder algumas questes do tipo: o que
aconteceria se? O principal objetivo no uso deste mtodo que tais perguntas
podem ser respondidas sem que o sistema sob investigao, sofra qualquer
distrbio, uma vez que a simulao seja computacional, permitindo que tais estudos
sejam realizados sobre sistemas que ainda no existem, direcionando a
desenvolvimento de sistemas eficientes, antes que alteraes fsicas sejam
realizadas. Um estudo simulado permite a percepo de comportamentos sutis no
modelo em que no sistema real poderia passar despercebido, e, com a possibilidade
de aplicar animaes, tambm permite que o comportamento do modelo seja
visualizado.
Um modelo uma abstrao da realidade, aproximando do verdadeiro
comportamento do sistema, mas sempre com menor complexidade que o sistema
real. A complexidade de um sistema real principalmente relacionada natureza
dinmica e na aleatoriedade, que podem ser reproduzidos com boa fidelidade pelo
modelo computacional (CHWIF, 2007).
A simulao pode ser caracterizada em trs categorias bsicas: simulao
Monte Carlo, em que o tempo no considerado explicitamente como varivel, e
utiliza-se de geradores de nmeros aleatrios para simular sistemas fsicos ou
matemticos; simulao contnua, em que os estados das variveis mudam
56
continuamente no tempo e simulao discreta, que mudam seu estado em

momentos discretos no tempo, a partir da ocorrncia de um evento. Em alguns
modelos de simulao pode haver a necessidade de combinar as trs categorias
bases, o que denominado simulao hbrida ou combinada (CHWIF, 2007).
3.5.1 Sistemas e modelos

Representar atravs de um modelo um sistema ou fenmeno observvel pode
se apresentar como um desafio, dependendo de sua complexidade, principalmente
quando surge a necessidade de se obter um modelo matemtico a partir de dados
observado, que chamado de modelagem emprica, que requer pouco ou nenhum
conhecimento prvio do sistema, e no partindo das equaes matemticas que
regem a fsica do processo, chamadas de modelagem fenomenolgica ou conceitual
que requer conhecimento aprofundado do fenmeno e exige grande demanda de
tempo, podendo se tornar invivel. Nos dois tipos de modelo, tcnicas e requisitos
distintos so utilizadas para sua obteno (AGUIRRE, 2007).
Freitas Filho (2008) nos diz que a modelagem pressupe um processo de
criao e descrio, que possui um certo grau de abstrao, direcionando para uma
simplificao do modelo real. Geralmente estas descries so feitas na forma
matemtica ou lgica que, no seu todo, chamamos de modelo. Simulao um dos
muitos mtodos que podemos utilizar para analisar e estudar sistemas os problemas
em questo. Os modelos matemticos no so os nicos utilizados no estudo de
simulao. Outros tipos podem ser empregados como modelos fsicos, como
maquete, prottipos, tnel de vento e outros. Os modelos computacionais so
utilizados para a simulao computacional. Sua aplicao depende da natureza do
sistema em estudo, como exemplo, existem modelos computacionais voltados para
simulao de sistemas modelados de modo discreto e para sistemas modelados de
modo continuo no tempo.
Segundo Taylor (1970 apud CHWIF, 2006), sistema como um conjunto de
objetos que podem encontrar ou definir algum tipo de relao, atuando e interagindo,
com o propsito de alcanar determinado objetivo ou propsito lgico.
O modelo desenvolvido para um determinado sistema apenas uma
representao aproximada, consequentemente no existe o modelo do sistema, mas
57
sim uma famlia de modelos com caractersticas e desempenhos variados

(AGUIRRE, 2007), contendo em si apenas algumas caractersticas do sistema real.
3.5.2 Tipos de modelos

Modelos estticos ou dinmicos: Os modelos estticos relacionam s
variveis sem quantificar sua dependncia temporal. Se a evoluo do sistema for
temporal, desejado um modelo dinmico (AGUIRRE, 2007). Vale lembrar que
estamos classificando a obteno do modelo e no o sistema, pois, em muitos
casos, para um mesmo sistema, podemos ter modelos de classificaes diferentes,
dependendo do interesse em estudo.
Modelos
determinsticos:
em
sua
modelagem
no
so
inseridos
componentes de incerteza de nenhuma natureza (AGUIRRE, 2007). Neste tipo de

modelo se obtm a mesma resposta para diferentes simulaes, se as condies
das variveis de estado e o conjunto de dados utilizado para alimentar o modelo
forem os mesmos.
Modelos estocsticos: so modeladas incertezas na forma de variveis
aleatrias, (AGUIRRE, 2007). Neste modelo, mesmo que as condies de uma
simulao anterior sejam mantidas, o modelo retornar valores numricos diferentes,
sempre que a semente do gerador de nmero aleatrio for mudada. importante
ressaltar que valores diferentes obtidos numa simulao no significam exatamente
resultados diferentes, pois em muitas das vezes se faz necessrio recorrer s
estatsticas para comprovar a diferena dos resultados.
A caracterizao de um modelo dada em funo de como as variveis de
estado de um sistema mudam no tempo. Esta mudana se dar de modo discreta ou
contnua. Nos modelos de mudana discreta: as variveis que representam o
estado do sistema s mudam em pontos bem definidos de tempo, mesmo que
ocorra variao do tempo. Nos modelos de mudana contnua, as variveis que
representam o estado do sistema podem variar continuamente junto com a variao
do tempo (FREITAS FILHO, 2008).
Segundo Freitas Filho (2008), os modelos tambm podem ser classificados
em funo do seu propsito e tipo de processo decisrio envolvido, diferenciando
das classificaes anteriores que envolviam as caractersticas fsicas do sistema que
58
era atribuda ao modelo. Estes podem ser do tipo: modelos voltados previso:
podem utilizar a simulao partindo de algumas suposies do seu comportamento
no presente para determinar seu estado em um ponto futuro; modelos voltados
investigao: baseia-se em simulaes voltadas a levantamento de informaes e
ou hipteses sobre a natureza do fenmeno estudado e seu comportamento;
modelos voltados comparao: um dos mais populares. Avalia-se a
performance obtida nas mudanas das variveis de controle, a partir da comparao
entre os resultados obtidos em diferentes rodadas de simulao; modelos
especficos: so projetados e utilizados no auxlio tomada de deciso em
diferentes nveis gerenciais, podendo ser aplicados em situaes nicas e
especficas dentro de uma empresa e outros .
3.5.3 Plataforma de simulao

O MATLAB e o Simulink so ambientes integrados que permitem a anlise,
simulao e reviso dos modelos em qualquer ambiente e em qualquer ponto
(KARRIS, 2008). Utilizado na simulao de sistemas dinmicos, o Simulink opera
com o MATLAB com o objetivo de permitir a especificao de diferentes sistemas
dinmicos e determinar as suas condies de simulao. Dispe de uma biblioteca
de mdulos bsicos, utilizados na operao dos diagramas que especificam o
sistema (POLLONI et al., 2010).
59
4 DESENVOLVIMENTO
4.1 MODELO NO LINEAR DO PNDULO INVERTIDO
O pndulo invertido foi modelado analiticamente como um sistema dinmico,

determinstico e continuo no tempo. Segundo Ogata (2010) o modelo mecnico do
sistema pode ser obtido conforme mostrado na Figura 12.
Figura 15: a) Sistema simplificado do pndulo invertido; b) Representao do movimento vertical e

horizontal; c) Centroide da haste.
Fonte: Ogata, (2010, p.61-62). Adaptada pelo autor.
A Figura 15.a mostra o pndulo com a grandeza fora como entrada do

sistema u(t) responsvel pela movimentao horizontal do corro. Esta fora ter sua
intensidade variada de acordo com o sinal de controle. A massa do carrinho M(t)
variante no tempo, simulando uma perda de massa. A massa da haste m
considerada constante. A Figura 15.b mostra a fora horizontal H e vertical V de
contra momento no ponto de apoio da haste. A Figura 15.c mostra a haste sendo
60
simplificada com a concentrao da massa no centro gravitacional que possui

comprimento l.
A modelagem do sistema pode ser obtida atravs das anlises do momento
angular na haste e da fora resultante no carro conforme explica Ogata (2010). Este
sistema classificado como tipo SIMO (Single Input, Multiple outputs), em que o
vetor de controle dado pela fora u(t) a entrada do sistema e as variveis de
estado ngulo, frequncia angular, posio e velocidade linear do carro so as
sadas do sistema.
As variveis presentes no modelo so:
- inclinao da haste em relao linha vertical;
(XG , YG) - Centro de gravidade do pndulo (CG);
- Distncia entre uma extremidade e o centro de gravidade do pndulo;
M - Massa da plataforma (carro);
m - Massa do pndulo, concentrada num ponto;
I - Momento de inrcia do pndulo em relao ao CG;
u(t) - Fora externa, contnua no tempo, aplicada pelo motor plataforma.
= fora referente ao eixo vertical;
= fora referente ao eixo horizontal;
= fora peso.
Modelando o sistema obtemos as seguintes equaes:
eq. (06)
eq. (07)
4.2 MODELAGEM NO ESPAO DE ESTADOS
Por se tratar de um sistema com quatro variveis de entrada e sada,

consideraremos o nosso vetor x, como:
61
Onde:
(movimentos em funo do ngulo) e
(movimentos em funo da
posio)
Considerando:
Resumindo, tem-se:
Considerando
e substituindo:
Admitindo:
A representao no espao de estados e dado pelas seguintes matrizes:
62
Admitindo:
A matriz de estados A.
Onde,
Matriz de entrada B.
Onde:
e,
63
A matriz de sada C.
A matriz de transmisso direta D.
Com a representao das matrizes, podemos ento formular as equaes no

espao de estados e projetar o sistema de controle. A representao no Espao de
Estados na forma cannica obtida numericamente por uma matriz de
transformao T. A representao da mesma no ser mostrada devido ao tamanho
das equaes obtidas na transformao.
A funo caracterstica do sistema :
Assim o vetor de ganho K pode ser calculado com a seguinte equao:
Onde os coeficientes da nova equao caracterstica e representado por

os coeficientes da antiga equao caracterstica.
64
T a matriz de transformao de qualquer base, para a base cannica

controlvel. Se a representao do sistema j estiver na base cannica controlvel T
ser uma matriz identidade.
4.3 PROJETO DO CONTROLADOR ADAPTATIVO
Para projetar um sistema de controle adaptativo necessrio dispor de um

mecanismo de checagem do sistema para identificar sua variao, e em conjunto um
mecanismo para adequar o sistema de controle a esta nova condio identificada.
4.3.1 Algoritmo de Otimizao
A metodologia proposta por Michalewicz (1999), foi utilizada neste trabalho

para implementao computacional do AG. Pequenas adaptaes para o crossover
foram feitas no algoritmo utilizado e mostrado em seu pseudocdigo. Um benefcio
em trabalhar com AG que este no depende da obteno de gradiente para a
otimizao. Neste trabalho o clculo do gradiente teria alto custo matemtico.
O AG binrio utilizado neste estudo possui uma populao pr-determinada.
Cada indivduo possui trs conjuntos de genes que so responsveis por trs
caractersticas distintas: o primeiro conjunto de genes representa a caracterstica
(valor) da parte real do polo complexo a, o segundo conjunto de genes representa a
caracterstica (valor) da parte imaginria b e o terceiro conjunto representa a
caracterstica (valor) do polo real duplo c, como mostrado na Figura 16, estas
caractersticas so geradas aleatoriamente, dentro de um intervalo de valores prdefinidos.
Figura 16: Cromossomo representado na base binria.

Fonte: Prprio Autor.
65
O grande desafio para projetar um controlador no espao de estados

definir o local dos polos que atenda os requisitos de projeto, como observado no
trabalho de Pasemann (1998), onde optou-se por utilizar uma RNA para
balanceamento (alocao) dos polos no projeto do controlador de um pndulo
invertido com massa constante. Neste trabalho, um AG utilizado ao invs de uma
RNA.
A sintonia do controlador dada pelos novos ganhos do vetor de controle
u(t). Para encontrar as novas alocaes de polos e consequentemente um novo
vetor de ganho, o Algoritmo Gentico utilizado para determinar os valores dos
polos complexos conjugados e dos dois polos reais. Para simplificar a busca por
otimizao do AG, sero determinados polos reais iguais (polos reais duplos). O
controle do pndulo feito na posio vertical (ngulo igual zero) e posio
horizontal igual zero.
A Figura 16 a tem representao binria 10101 e valor inteiro 21, b tem
representao binria 01010 e valor inteiro 10 e c tem representao binria
10101 e valor inteiro 21. A representao dos polos nesta ilustrao seria
P=(S+21+10i)( S+21-10i)(S+21)(S+21), aps a representao, com a nova alocao
dos polos, o fitness calculado.
Assim a funo caracterstica P com a nova alocao dos polos, pode ser
descrita da seguinte forma:
P = (S + a + bi) (S + a - bi) (S + c) (S + c)
P = S4 + (2a+2c) S3 + (a2+4ac+b2+c2) S2 + [2ac2 + (2a2+2b2) c)] S + c2(a2+b2)
E a nova alocao dos polos dada por:

P = (s 1 )(s 2 ) ... (s n ) s n 1 s n-1 ... n1 s n
1= (2a+2c); 2 = (a2+4ac+b2+c2); 3 = [2ac2 + (2a2+2b2)c]; 4 = c2(a2+b2)
Cabe lembrar que o vetor de controle ser:
66
Como a massa do sistema varia com o tempo M(t), em conjunto com os

critrios de tempo de acomodao e sobressinal, novas alocaes para os polos
precisam ser determinados para satisfazer os critrios. Assim, os coeficientes da
funo da nova alocao dos polos n tambm variam com a nova alocao. Para
solucionar este problema de variao nas condies de operao e variao dos
parmetros, um controle adaptativo empregado.
Com o vetor de ganho definido, aplicado um distrbio padro no sistema
atravs da equao de estado com a nova alocao de polos.
x (A - Bk)x
Y= CX
O fitness calculado atravs dos valores do sobressinal (mp) e tempo de

acomodao (ts) obtidos para o ngulo, relacionando-os com os requisitos (Mp e Ts).
fit = [( |mp-Mp| )10]5 + [( |ts-Ts| )4]5
Considera-se uma soluo aceitvel quando os polos fornecem uma diferena

de sobressinal de 0,1 ([( |mp-Mp| 0,1) e tempo de acomodao de 0,25 segundos
([( |ts-Ts| 0,25). Na equao do fitness na primeira parte [( |mp-Mp| )10]5 aplicando
a teoria de limite, quando |mp-Mp| = 0,1, [( |mp-Mp| )10]5 = 1; para |mp-Mp| 0,1 ou
para |mp-Mp| 0,1 tende a ampliar o valor ([( |mp-Mp| )10]5 1), para |mp-Mp| = 0, [(
|mp-Mp| )10]5 = 0. A mesma operao aplicada na segunda metade da equao do
fitness [( |ts-Ts| )4]5. Assim consegue-se evidenciar o indivduo que no atende
simultaneamente as duas condies. O expoente com valor igual a cinco, foi
escolhido de modo emprico, aps apresentar a distino entre individuas que
tinham uma diferena de 10% dentro da tolerncia e 10% fora desta (fit = 0,9 5 + 1,15
= 2,20), atribuindo-lhes uma penalizao estipulada pelo autor de 10%, ou seja, a
soma dos dois parmetros seria 0,90+1,10=2 acrescentando a penalizao 2,20,
resultado prximo ao obtido com expoente igual a cinco. A tabela 10 compara estes
valores.
67
Tabela 10: Diferena dos parmetros com penalizao.
Diferenas entre parmetros

Expoente
mp-MP
ts-TS
2
3
4
5
6
0,90
1,10
2,02 2,06 2,12 2,20 2,30
1,00
1,00
2,00 2,00 2,00 2,00 2,00
Fonte: prprio autor.
O indivduo que obtiver fit = 0 considerado o indivduo perfeito a melhor

soluo, mas no nica, pois pode existir vrios indivduos perfeitos numa mesma
populao, se 0 fit 1 indivduo atende as restries (fornece soluo aceitvel,
garantia de soluo), se 1 fit 2 o indivduo tem a possibilidade de atender as
restries (indivduos com potencial de soluo, mas no tem garantia de soluo,
pois neste caso o indivduo pode atender apenas uma das restries), os indivduos
com fit 2 no atendem as restries. A funo de custo foi concebida de maneira
que caracteriza problema de otimizao como problema de minimizao.
Neste AG as geraes so criadas a partir do cruzamento correspondente a
25% dos melhores indivduos da populao (fitness mais baixo). A estratgia
utilizada mostrada na Figura 17.
Figura 17: Gerao de descendentes por crossover.

Na Figura 17, o cruzamento ocorre da seguinte maneira: divide-se o

cromossomo em trs partes, onde um descendente recebe duas partes do pai e uma
da me e o segundo recebe duas da me e uma parte do pai.
A mutao aplicada em 5% dos indivduos da populao global atravs do
mtodo de roleta (valor arbitrado), onde um gene modificado de uma posio
aleatria do cromossomo.
O nmero de geraes tambm pr-determinado. O AG utilizado neste
trabalho tem o seguinte pseudocdigo:
1- Gera populao (aleatoriamente num intervalo pr-estabelecido)
68
2- Atribui fitness individual e calcula o fitness global

3- Aplica o Crossover
4- Aplica a Mutao
5- Atualiza fitness individual e global
6- Seleciona melhor indivduo
7- Se condio de n de geraes no atendida e no houver indivduo(s) com
fitness menor que 1, retorna ao passo 3.
8- Fim
4.3.2 Projeto da Rede Neural

Projeto 1
Para configurar a RNA, foi utilizado o mesmo AG citado anteriormente. O AG

retorna trs valores a, b e c. A caracterstica a representa a quantidade de
camadas ocultas com a funo de ativao tansig; b representa a quantidade de
camadas ocultas com a funo de ativao radbas e c, a quantidade de camadas
ocultas com a funo de ativao purelin. O nmero de neurnios (n) em cada
camada oculta est relacionado quantidade de camadas ocultas, tal que n=
2(caracterstica)+5, sendo o nmero mnimo de neurnios em uma camada igual a
7 quando se tem uma camada oculta referente a uma funo de ativao, e o
nmero mximo igual a 19 para 7 camadas ocultas para uma funo de ativao. Se
a, b e c igual a 7, teremos 21 camadas ocultas, cada uma com 19 neurnios.
A RNA utilizada neste segundo projeto do tipo feedforward. Em seu
treinamento utiliza-se o algoritmo de aprendizagem Levemberg- Marquartd, onde os
valores de pesos e bias iniciais so atribudos aleatoriamente. A rede possui trs
camadas de entrada (ts, mp, M) e trs camadas de sada (a, b, c). A funo de custo
retorna a performance obtida no trino da RNA.
O nmero mximo de iteraes foi estipulado em 3000, gradiente mnimo de
10-20, falha na validao e checagem aceitvel igual a 50, o desempenho da rede
calculado atravs do erro mdio quadrtico (mse).
Projeto 2
69
Um segundo AG foi utilizado para configurao da RNA. Este pode ser

acessado pelo comando do Matlab ga(@funo_de_avaliao, numero_variveis,
A,b), onde A e b so matrizes das inequaes (A b), estas matrizes determinam a
range das variveis. A funo de avaliao possui nove parmetros a, b, c, A, B, C,
, , .
Os parmetros a, b e c so responsveis pela quantidade de camadas ocultas.
A, B e C so parmetros responsveis pelas funes de ativao que sero
utilizadas nas camadas ocultas (a, b e c), que podero ser: tangente sigmoide, base
radial, linear e funo logartmica sigmoide. O nmero de neurnios de cada camada
definido pelos parmetros , e .
Este algoritmo iniciado com uma populao de 20 indivduos, a nova
populao ser gerada com 80% dos indivduos provenientes de crossover. A
mutao aleatria aplicada num valor de 1 de desvio padro, utilizando uma curva
Gaussiana na populao inicial, este valor decresce linearmente para 0 ao final das
geraes. Dois melhores indivduos so passados para nova populao utilizando a
estratgia de elitismo. Ocorre uma migrao de 20% da populao antiga para a
nova populao. O nmero mximo de geraes foi limitado em 100. A funo de
custo retorna a performance obtida no treino da RNA. A configurao do AG pode
ser visualizada inserindo o comando options = gaoptimset(@ga) no workspace.
Os parmetros da RNA no foram alterados, sendo iguais para os dois
projetos.
4.3.3 Projeto do Ganho Agendado
No projeto do controlador adaptativo por ganho agendado, utilizada uma

RNA, que recebe as variaes de tempo de acomodao, sobressinal e massa e
aloca os polos para o controle por realimentao de estados.
70
4.4 SIMULAO
4.4.1 Configurao do controlador
A seguir so dadas as configuraes utilizadas na simulao com o AG na

busca dos polos.
1- O intervalo inicial de a b e c varia de 0,1 a 150,0 com preciso de trs casas
decimais.
2- De acordo com Aguirre (2007), bons resultados so obtidos quando o periodo de
amostragem escolhido com valores entre um dcimo e um tero da menor
constante de tempo do sistema. O valor de c mximo encontrado foi de 10,061, logo,
a constante de tempo de 0,0994s. Nos testes realizados constatou-se que para um
periodo de amostragem maior que 0,01, obtinha-se tempos de acomodao e
sobresinais distintos com variao em 0,1, e para valores menores que 0,01 estas
variaes eram menores que 0,001. Neste trabalho o perodo de amostragem foi
aproximado pra 0,01s, uma vez que os critrios de tempo de acomodao e
sobresinal fora estipulados com 2 algarismo significativo.
3- Aps encontrar o primeiro indivduo que satisfaa as restries de prejeto, este
utilizado como ponto para formar uma regio de busca local para os novos
indivduos com limites superior e inferior igual a 10. Se o primeiro encontrado
[5,5701, 149,8177, 80,0921], a nova regio de busca ser: (5,5701-10) a
(5,5701+10), (149,8177-10) b (149,8177+10) e (80,0921-10) c (80,0921+10).
Para resultados de limite inferior menor que zero (5,5701-10), este fixado em zero.
Com esta estratgia a regio de busca torna-se varivel.
4- Determinou-se uma populao inicial de 125 indivduos, um limite de 50 geraes
para a primeira busca, visto que a busca ocorre numa regio maior (global), e 15
geraes para as demais, pois as buscas passam a ser local.
5- As variaes de tempo de acomodao, sobressinal e massa so representadas
pelos blocos do simulink Matlab, um ambiente de simulao dinmica, na Figura 18.
71
Figura 18: a) Tempo de acomodao b) Sobressinal c) Massa.

Fonte: Simulink, Matlab 2012b.
Na Figura 18.a o tempo de acomodao tem valor inicial de 2,0s e fica mais
rgido com o passar do tempo, estabilizando prximo do valor de 0,5s. Na Figura
18.b o valor inicial do sobressinal igual a 0,4 no incio da simulao (requisito
inicial do sistema), tende a 0,1 para tempos maiores que 600s. A Figura 18.c mostra
a variao da massa do carro ao decorrer da simulao representada pelo diagrama
de blocos. Este comea com valor de massa inicial de 5,0kg, e tende a se estabilizar
no valor de 2,0kg aps um intervalo de tempo de 600s.
4.4.2 Configurao do Projeto da RNA

No projeto 1 adotou-se as seguintes configuraes: 0 a 7, 0 b 7, 0 c
7. Estas variveis possuem valores inteiros, portanto ajustou-se o AG para 0, casa
decimal de preciso. Optou-se por limitar o tamanho da RNA entre 20 a 30 camadas
ocultas devido ao custo computacional requerido. A populao inicial foi de 64, um
limite de geraes foi definido igual a 5, taxa de crossover e mutao so as
mesmas adotadas no projeto de alocao de polos. No foi utilizada a estratgia de
elitismo neste AG.
No projeto 2 utilizou-se a seguinte configurao: a Figura 19 mostra as
matrizes A e b.
72
Figura 19: Matriz A e b de inequaes.

A funo de avaliao deste AG possui nove variveis (a,b,c,A,B,C,,,), o

intervalo destas so definidos pelas matrizes de inequao, 0 a 10, 0 b 10, 0
c 10, 1 A 4, 1 B 4, 1 C 4, 1 30, 1 30, 1 30. Estas variveis
trabalham somente com valores inteiros, portanto ajustou-se o AG para 0 casa
decimal de preciso.
Para treino nos projetos 1 e 2 das RNAs foi utilizado o mesmo conjunto de
polos encontrados pelo AG.
73
5 RESULTADOS E DISCUSSES
Com o AG, montou-se uma tabela de polos para o ganho agendado

(implementado por meio de uma RNA) que atende as restries de projeto.
A Tabela 11 foi construda aps uma otimizao. A menor tabela que pode ser
construda com os dados dos Ganhos Agendados uma tabela que contenha
somente indivduos perfeitos. A tabela utilizada para treino foi a menor encontrada,
porm no h garantia de ser a menor tabela que pode ser construda atendendo as
restries. Os polos utilizados no aprendizado so mostrados na Tabela 11.
Tabela 11: Polos utilizados no Treinamento da RNA.
5,764
6,296
6,218
7,551
8,884
12,806
20,531
24,257
30,884
26,610
67,188
68,639
67,345
61,267
52,286
54,835
47,345
52,482
54,875
48,012
2,151
10,061
0,453
3,708
1,120
2,375
2,845
1,512
0,806
0,178
Ts
1,830
1,657
1,634
1,410
1,245
1,128
0,818
0,695
0,550
0,500
ts
ts
ts
ts
ts
ts
ts
ts
ts
ts
mp
2,000
1,830
1,657
1,634
1,410
1,245
1,128
0,818
0,695
0,550
0,366
0,331
0,327
0,282
0,249
0,226
0,164
0,139
0,110
0,100
ts
ts
ts
ts
ts
ts
ts
ts
ts
ts
M
0,400
0,366
0,331
0,327
0,282
0,249
0,226
0,164
0,139
0,110
4,661
4,313
4,267
3,820
3,490
3,257
2,637
2,390
2,100
2,000
ts
ts
ts
ts
ts
ts
ts
ts
ts
ts
5,000
4,661
4,313
4,267
3,820
3,490
3,257
2,637
2,390
2,100
O AG utilizado no projeto 1 retornou seguinte configurao de RNA: 7

camadas ocultas, 19 neurnios em cada camada oculta, todas com a funo de
ativao tangente sigmoide.
74
O erro mdio quadrtico (fitness) encontrado aps o treino foi igual a 0,0697.
A Tabela 12 mostra a evoluo do erro, at encontrar o melhor indivduo n.
Tabela 12: Evoluo dos melhores indivduos.
Indivduo n-10 n-9 n-8 n-7 n-6 n-5 n-4 n-3 n-2 n-1 n
Erro
22,71 2,41 1,66 1,51 1,33 1,30 1,09 1,00 0,99 0,96 0,07
A Figura 20 mostra a evoluo dos melhores indivduos atravs do grfico.
Figura 20: Grfico da evoluo dos melhores indivduos.

O AG utilizado no projeto 2 retornou a seguinte configurao de RNA: 5

camadas ocultas com 5 neurnios em cada camada, com a funo de ativao
tangente sigmoide.
A configurao do melhor indivduo encontrado neste projeto mostrada no
Quadro 2.
75
Quadro 2: Configurao do melhor indivduo.
Camadas Ocultas
Funo de Ativao
N de Neurnios
Camada Camada Camada Camada Camada Camada Camada Camada Camada
1
2
3
1
2
3
1
2
3
5
0
0
1
2
3
5
3
4
O indivduo do Quadro 2 possui um total de 5 camadas ocultas (5+0+0),

composto pela funo de ativao 1 (tangente sigmoide), o primeiro conjunto de
camadas possui 5 neurnios, como as camadas 2 e 3 so iguais a zero, as outras
caractersticas tornam-se sem efeito (clulas em vermelho).
O erro mdio quadrtico encontrado aps o treinamento foi igual a 0,8704.
Para Construir o controlador Adaptativo por ganho Agendado escolheu-se a
configurao do projeto 1, por ter retornado o menor erro. Para melhorar o
desempenho no treinamento da RNA, aumentou-se a matriz de dados utilizada no
treinamento, onde a nova matriz passa a ter dados repetidos. Os dados para o
treinamento foram tratados de modo que, cada entrada distinta possui sada
singular, garantindo o ineditismo dos dados utilizados na aprendizagem, no foi
necessrio inserir atraso nos dados para treinamento da rede por no ser
influenciada pela taxa de variao das entradas. A funo que a RNA aproxima
uma funo do tipo f(ts,mp,M), onde ts(t), mp(t) e M(t), assim a rede varia em funo
dos requisitos de operao do sistema e da massa. A realimentao da rede no foi
necessria, pois nenhuma relao anterior, e (ou) velocidade interferem na alocao
dos novos polos do sistema.
O erro mdio quadrtico retornado aps o treino foi igual a 0,0340, em 148
iteraes. A matriz de pesos e bias pode ser extrada da rede atravs do comando
getwb(net), a matriz extrada da RNA aps o treino possui a dimenso de 2416
linhas e 1 coluna, esta
no foi apresentada neste trabalho em virtude do seu
tamanho. Para gerar o bloco da RNA no simulink aps o treino, utiliza-se o comando
gensim(net).
Os resultados obtidos na plataforma de simulao com o controlador
adaptativo em relao a varivel de estado ngulo pode ser visualizado atravs das
Figuras 21, 22, e 23.
76
Figura 21: Grfico da resposta do sistema ao distrbio.

O grfico da Figura 21 representa a resposta do sistema ao distrbio pra os

requisitos ts=2,000, mp=0,400 e M=5,000:
Resposta com polos (5,7639; 67,1883; 2,1507) alocados com o AG, retorna ts=2,08,
mp=0,311 e fitness=0,558 (curva 1).
Resposta com polos (5,7741; 67,2108; 2,0849) alocados com o Controlador
com Ganho Agendado (RNA), retorna ts=2,06, mp=0,308 e fitness=0,565 (curva 2).
As duas curvas esto no mesmo grfico da Figura 21, porm por no haver
diferena significativa estas se sobrepem.
No grfico da Figura 22, representa a resposta do sistema ao distrbio pra os
requisitos ts=1,2524, mp=0,2505 e M=3,5047.
Resposta com polos (8,8843; 52,2863; 1,1196) alocados com o AG, retorna ts=1,260,
mp=0,424 e fitness=0,843, curva 1. Resposta com polos (8,7162; 52,2287; 1,2708)
77
alocados com o Controlador com Ganho Agendado (RNA), retorna ts=1,440,

mp=0,352 e fitness=1,305, curva 2.
Figura 22: Grfico da resposta do sistema ao distrbio, aps variaes das variveis de estado.
Ao final da simulao, obtm-se o grfico da Figura 23, representa a resposta

do sistema ao distrbio pra os requisitos ts= 0,5042, mp= 0,1008 e M= 2,0085.
Resposta com polos (26,6098; 48,0118; 0,1784) alocados com o AG, retorna
ts=0,560, mp=0,182 e fitness=0,350, curva 1.
Resposta com polos (26,6098; 48,0118; 0,1784) alocados com o Controlador com
Ganho Agendado (RNA), retorna ts=0,560, mp=0,183 e fitness=0,373, curva 2.
78
Figura 23: Grfico da resposta do sistema ao distrbio, ao final da simulao.

A simulao foi construda na plataforma de simulao contnua Simulink

Matlab. A Figura 24 mostra a configurao do modelo atravs da linguagem de
diagramas de blocos.
79
Figura 24: Sistema representado por diagrama de blocos.

Fonte: Simulink, Matlab 2012b.
Na Figura 24, tem-se o controle por ganho agendado atravs da RNA, blocos
responsveis por variar o tempo de acomodao, sobressinal e massa. Os
integradores representam as variveis de estado e uma chave para inserir o
distrbio no sistema;
A Figura 25 apresenta a animao feita no wonderware Intouch verso
acadmica.
Figura 25: Animao do pndulo invertido.

Fonte: Wonderware Intouch 9.5, verso acadmica.
Para validao e verificao do modelo, utilizaram-se dados com respostas

conhecidas para alimentao do modelo. A animao em 2D tambm foi utilizada
80
como ferramenta de verificao, pois segundo Freitas Filho (2008) esta ferramenta
empregada no estudo simulado permite a percepo de comportamentos sutis no
modelo em que no sistema real poderia passar desapercebido.
A Figura 25 mostra a tela com a animao em 2D do simulador do pndulo
invertido. Nesta tela pode-se acompanhar a variao de massa do sistema, a
mudana dos requisitos sobressinal Mp e tempo de acomodao Ts, valores
instantneos de ngulo de inclinao da haste, frequncia angular, posio,
velocidade linear do carro, grficos de tendncia real e a dinmica do carro pndulo .
A seta horizontal vermelha presente na Figura 25 do simulador representa o sentido
em que a fora est atuando no carro, a seta vertical superior indica a posio do
carro e a seta vertical inferior indica o referencial zero horizontal. Quando estas duas
setas se alinham, significa que o carro se encontra na posio zero.
Durante a simulao, possvel interagir com o sistema atravs do boto
com ttulo distrbio. Quando utilizado, este muda sua cor de vermelho, Figura 25,
para verde, apresentado na Figura 26.
Figura 26: Boto para insero de distrbios.

Fonte: Wonderware Intouch 9.5, verso acadmica.
O distrbio inserido no sistema transitrio para que o pndulo volte para o

equilbrio. Na Figura 25, o grfico ngulo representa a posio angular (dado em
grau) com escala de -2 a 2, em relao ao tempo (dado em segundo). O grfico com
ttulo Posio descreve a posio (dado em metro) com escala de -25 a 25, em
relao ao tempo (dado em segundo).
81
CONSIDERAES FINAIS
Neste captulo so apresentadas as concluses dos resultados obtidos e

sugestes para trabalhos futuros.
6.1 CONCLUSO
Os resultados obtidos pelo AG na alocao de polos se mostraram viveis,

uma vez que atenderam os critrios impostos no inicio do trabalho como: variao
entre o sobressinal obtido e desejado menor igual a 0,1 e variao do tempo de
acomodao desejado e obtido menor igual a 0,25s. Mesmo apresentando uma
regio de busca no linear e com certo grau de complexidade, a construo da
funo de avaliao relativamente simples, o resultado obtido num tempo
satisfatrio para a otimizao off-line.
Sem a necessidade dos novos polos encontrados que atendam as novas
condies de operaes estarem prximos dos polos anteriores, a estratgia com
busca global seguida de buscas locais se mostrou eficiente, retornando uma soluo
num menor intervalo de tempo quando comparado a implementao, que utilizava
somente buscas globais, bastando fornecer o melhor indivduo para estabelecer uma
nova e menor regio de busca (elitismo), em casos de timos locais sem atender os
requisitos uma busca global era aplicada.
O AG tambm mostrou-se satisfatrio na configurao da RNA, mesmo no
tendo a garantia desta ser a melhor configurao, o mtodo permite encontrar uma
82
configurao que atenda os objetivos com o menor erro aps o treino das
arquiteturas analisadas. Desta forma pode-se obter uma configurao sem que fosse
fundamental o conhecimento de um especialista em relao s funes de ativao,
a quantidade de camadas ocultas e o nmero de neurnios destas camadas para
configurar a RNA.
A RNA no foi utilizada como controlador pela complexidade da massa de
dados que esta exigiria, pois a superfcie que descreve o comportamento do sinal da
ao de controle para determinado distrbio, combinado com mudana de massa,
tempo de acomodao e sobressinal de extrema complexidade exigindo uma
grande quantidade de camadas ocultas e um grande nmero de neurnios nestas
camadas para minimizao do erro, algo que demanda muita capacidade de
processamento, apresentando um elevado tempo de resposta, inviabilizando a
simulao devido ao tempo de resposta da RNA ser maior que o perodo mnimo de
amostragem do sistema.
A RNA no foi utilizada para interpolao na alocao dos polos, por exigir um
intenso mapeamento para gerar uma tabela de dados capaz de representar
significativamente a superfcie do modelo com as mudanas das condies de
operao. Na tentativa de interpolar polos com distncias significativas entre si, para
atender diferentes condies de operao (sobressinal e tempo de acomodao),
este retornar um resultado insatisfatrio com condies de operao diferentes do
requerido para a massa de dados utilizada neste trabalho.
Embora tenha sido considerado satisfatrio o resultado obtido pelo AG na
configurao da RNA, tendo retornado a configurao de rede com o menor erro
dentre as configuraes presentes na otimizao, o comando utilizado para a
aplicao do algoritmo de aprendizagem train(net,x,y) aloca inicialmente um valor
aleatrio de pesos e bias, podendo retornar um valor significativamente diferente
entre dois treinos consecutivos com o mesmo tipo de RNA e com as mesmas
configuraes, dificultando a avaliao de aptido de indivduos iguais ou similares.
O controle agendado apresentou bom desempenho com a alocao fixa dos
polos, pois todos os polos apresentados atendiam os critrios de sobressinal e
tempo
de
acomodao
estabelecidos
no
incio
deste
trabalho.
Tambm
comportando-se diferentemente de quando se tem um ganho fixo para um modelo

linear, quando a estratgia de ganho fixo aplicada a um modelo no linear, no
consegue manter o melhor desempenho estipulado no projeto, pois o mtodo
83
consiste na alocao dos polos e este varia com o ganho constante devido
variao angular. No controlador desenvolvido os polos alocados no variam com a
variao angular, reproduzindo com melhor preciso o estipulado em projeto.
Mesmo que a soluo em Espaos de Estados seja baseada em sistemas
lineares, a soluo deste modelo baseia-se na linearizao, em cada instante de
operao aumentando sua eficincia, apresentando uma soluo numrica a para
cada posio angular.
6.2 SUGESTES PARA TRABALHOS FUTUROS

Para projetos que objetivam a implementao num sistema real, algumas
consideraes devem ser feitas como: extrair um modelo com maior preciso do
sistema levando em considerao momento de inrcia, coeficiente de atrito cintico
e dinmico. A funo de avaliao deve ter uma penalizao para indivduos que
apresentem um sinal de controle superior ao valor mximo disponibilizado pelo
atuador.
Num conjunto de solues que atendam as restries de projeto, pode-se
otimizar o que consuma menor energia.
Simular o controle adaptativo com inteligncia artificial otimizado num pndulo
invertido com dois graus de liberdade.
Construir um pndulo invertido utilizando a placa microcontrolada Arduino
com sistema de controle embarcado, visto que, muitas aplicaes tem sido
realizadas utilizando esta ferramenta de software livre.
Aplicar uma otimizao on-line para o sistema pndulo invertido, com variao
lenta dos requisitos de operao e massa ao longo do tempo.
84
REFERNCIAS BIBLIOGRFICAS.
AGUIRRE, L. A. Introduo a Identificao de Sistemas: tcnicas lineares e no

lineares aplicadas a sistema real. 3. ed. Belo Horizonte: UFMG, 2007.
ASTROM, K. J.; WITTENMARK, B.

Massachusetts: Addison-Wesley, 1995.
BITTENCOURT, G. Inteligncia
Florianpolis: UFSC, 2001.
Adaptive
Artificial:
Control
ferramentas
Systems.
2.ed.
teorias.
2.ed.
BOGDANOV, A. Optimal Control of a Double Inverted Pendulum on a Cart.

Technical Report CSE-04-006, December 2004.
BOLTON, W. Mecatrnica - Uma abordagem multidisciplinar. 4. ed. Porto Alegre:

Bookmann, 2010.
CHWIF, L.; MEDINA, A. C. Modelagem e Simulao de Eventos Discretos: teoria

e prtica. 2. ed. So Paulo: Bravarte, 2007.
DASTRANJ, M. R. et al. Design of optimal PID controller using genetic algorithm.

Australian Journal of Basic and Applied Sciences, 5(10), p.996-1001, 2011.
DAVIDSON, J. M., & DURBIN, L. D. Model Reference Adaptive Control

Specification For a Steam Heated Finned Tube Heat Exchanger. Texas, USA:
A&M University, 1974. p.474-483, 1974.
85
DIP G.; PRAHLAD V.; KIEN P. D. Genetic algorithm-based optimal bipedal

walking gait synthesis considering tradeoff between stability margin and
speed, Robtica, v. 27, n. 3, p.355365, 2009. Disponvel em :<
journals.cambridge.org/article_S026357470800475X>, acessado em: 25/01/2014.
DORF, R. C.; BISHOP, R. H. Sistemas de Controle Moderno.11.ed. Rio de
Janeiro: LTC,. 2009.
EDGAR, T. F. E HIMMELBLAU, D. M. Optimization of Chemical Processes. New

York: Mc Graw Hill Book, 1988.
ELE LITEX 2: Disciplina EE-09 Inteligncia Artificial. Sntese de uma das reas da
Inteligncia Artificial. Disponvel em: <http://www.ele.ita.br/~flavios/listex2.htm>.
Acesso em: 22/ out/2013.
FERNANDES, A. M. Inteligncia Artificial: noes gerais. 3. ed. Florianpolis:

Visual Books, 2008.
FRANKLIN, G. F.; POWELL, J. D.; WORKMAN, M. L. Digital Control of Dynamic

Systems. 3.ed. Menlo Park, California: Ellis-Kagle Press, 1998.
FREITAS FILHO, P. J. Introduo Modelagem e Simulao de Sistemas com

Aplicao em Arena. 2. ed. Florianpolis: Visual Books, 2008.
GE, S. S., WANG, C. Adaptive neural control of uncertain MIMO nonlinear

systems. IEEE Transactions on Neural Networks, 15(3), p.674-692, 2004.
Disponvel:
<http://www.ncbi.nlm.nih.gov/pubmed/15384555>.
Acessado em
18/out/2013.
GEMAN, S.; BIENENSTOCK, E.

DOURSAT, R. Neural Networks and the
Bias/Variance Dilemma. Journal Neural Computation, v. 4, n. 1, p. 1-58, 1992.
Disponvel: < http://www.mitpressjournals.org/loi/neco>. Acessado em 18/out/2013.
GHORBANI, R.; WU, Q.; WANG, G. G. Nearly optimal neural network stabilization of
bipedal standing using genetic algorithm. Journal Engineering Applications of
Artificial
Intelligence,
n.
20,
p.
473480,
2007.
Disponvel
<http://www.journals.elsevier.com/engineering-applications-of-artificial-intelligence/>.
Acessado em 18/out/2013.
86
GOLBERG D.E., HOLLAND J.H.Genetic algorithms and machine learning. Mach

Learn,
v.
3,
p.
9599,
1988.
Disponvel:
<http://link.springer.com/article/10.1023%2FA%3A1022602019183>. Acessado em
18/out/2013.
GORSE, D., SHEPHERD, A. J., TAYLOR, J. G. The new ERA in supervised

learning. Neural Network, 10(2), p. 343-352, 1997. Disponvel em:
<http://discovery.ucl.ac.uk/79386/>. Acessado em 18/out/2013.
GUTIRREZ, G.; et al. Non-Direct Encoding Method Based on Cellular Automata to

Design Neural Network Architectures. Computing and Informatics, V. 24, 1001
1023,
2005-Oct-18.
Disponvel
em:
<http://earchivo.uc3m.es/bitstream/handle/10016/4118/non-irect_encoding_CI_2005.pdf>.
HAO YUAND; BOGDAN M.; WILAMOWSKI.The industrial Electronics Handbook:

Intelligent Systems. 2. ed. Boca Raton: CRC Press, 2011.
HASSEN, M.; MOHAMED, C. Variable Structure Neural Networks for Real Time
Approximation of Continuous Time Dynamical Systems Using Evolutionary Artificial
Potential Fields. Wseas Transactions on Systems, n. 2, p. 7584, 2012.
Disponvel: < http://www.wseas.org/multimedia/journals/systems/2012/54-886.pdf>.
HAYKIN, S. Redes Neurais: princpios e prticas. 2 ed. Porto Alegre: Bookmann,

2007.
HUNG L. C.; CHUNG H. Y. Decoupled control using neural network-based

sliding-mode controller for nonlinear systems. Expert Systems with Applications,
vl.
32,
no.
4,
p.
11681182,
2007.
Disponvel
em:
<
www.sciencedirect.com/.../pii/S0957417406000935>, acessado em 25/01/2014.
HUNG L.;CHUNG H. Decoupled sliding-mode with fuzzy-neural network
controller for nonlinear systems. International Journal of Approximate Reasoning
46 , p. 7497, 2007. <www.sciencedirect.com/.../pii/S0957417406000935>,
acessado em 25/01/2014.
INFORMTICA VIRTUAL. Tenha o seu prprio Rob. Disponvel em: <

http://www.informacaovirtual.com/tecnologia/tenha-seu-proprio-robo>. Acesso em
25/out/2013.
87
JONES, D. M., WATTON, J., E BROWN, K. J. Comparison of hot rolled steel

mechanical property prediction models using linear multiple regression, nonlinear multiple regression and non-linear artifical neural networks. 32(5), p.435
442,
2005.
Disponvel:
<http://www.ingentaconnect.com/content/maney/ias/2005/00000032/00000005/art00
014>. Acessado em 18/out/2013.
JUANG J.-G. Fuzzy neural network approaches for robotic gait synthesis. IEEE
Transactions on Systems, Man and Cybernetics, Part B. p.594-601, Aug 2000.
Disponvel: <ieeexplore.ieee.org/iel5/3477/18734/00865178.pdf>, acessado em
25/01/2014.
KAYNAK O.; ERBATUR K.; ERTUGNRL M. The fusion of computationally
intelligent methodologies and sliding-mode control-a survey. IEEE Trans. on
Industrial Electronics, vol. 48, no. 1, pp. 4-17, Feb 2001. Disponvel:
<ieeexplore.ieee.org/iel5/3477/18734/00865178.pdf>, acessado em 25/01/2014.
KRATZER, K. P. Neuronale Netze Grundlagen und Anwendungen. Disponvel
em < http://link.springer.com/chapter/10.1007%2F978-3-322-89950-7_4>. Acessado
em 18/out/2013.
LAFET, Thiago Fiallho Queiroz. Enxame de Partculas Aplicado ao Problema

Geral de Dimensionamento de Lotes. Monografia (Cincia da Computao).
Universidade Federal de Lavras, Lavras-MG, 2010.
LINS, C., De SOUSA, F,V., Desenvolvimento de um Simulador Didtico de um

Pndulo Invertido com Modelagem e Controle em Espao de Estados.
Monografia (Engenharia de Controle e Automao). Instituto Federal Fluminense,
Campos dos Goytacazes-RJ, 106 p., 2013.
LUGER, G. F. Inteligncia Artificial: estruturar e estratgias para soluo de
problemas complexos. 4 ed. Porto Alegre: Bookmann, 2004.
MATWORKS. Multilayer neural network architecture. Disponvel em:
<http://www.mathworks.com/help/nnet/ug/multilayer-neural-network-rchitecture.html>.
Acesso em: 22 de outubro de 2013.
MICHALEWICZ, W. Genetic Algorithms + Data Structures = Evolution Programs.
3.ed. New York: Springer, 1999.
MITCHELL, M, TAYLOR, C. E. Evolutionary computation: An overview. Annual
Review of Ecology and Systematics, v.30, p. 593-616, 1999. Disponvel em:
<http://www.annualreviews.org/doi/abs/10.1146/annurev.ecolsys.30.1.593>.
88
MOGHADDAS, M. et al. Design of Optimal PID Controller for Inverted Pendulum

Using Genetic Algorithm. International Journal of Innovation, Management and
Technology,
V.
3,
No.
4,
August
2012.
Disponvel
em:
<http://www.ijimt.org/papers/271-D0373.pdf>. Acessado em 18/out/2013.
MOHAMAD, R. D. et al. Robust Control of Inverted Pendulum Using Fuzzy Sliding
Mode Control and Genetic Algorithm. International Journal of Information and
electronics Engineering. v. 2, n. 5, September 2012. Disponvel em:
<http://www.ijiee.org/papers/205-S240.pdf>. Acessado em 18/out/2013.
MUHAMMAD A. Fuzzy and evolutionary modelling of nonlinear control systems.
Mathematical and Computer Modelling, v. 33, Issues 45, p. 533551, February
March 2001. Disponvel: <dl.acm.org/citation.cfm?id=2258782>, acessado em
25/01/2014.
NARENDRA, K. S; PARTHASARATHY, K. Identification and Control of Dynamical
Systems Using Neural Networks. IEEE Transactions on Neural Networks, 1(1),
p.4-27,
1990.
Disponvel
em:
<http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=80202&url=http%3A%2F%2F
ieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D80202>. Acessado em
18/out/2013.
NASCIMENTO JNIOR., C. L.; YONEYAMA, T. Inteligncia Artificial em Controle
e Automao. 3. ed. So Paulo: Edgar Blucher, 2004.
NANDI G. C.; IJSPEERT A. J.; CHAKRABORTY P.; NANDI A. Development of

Adaptive Modular Active Leg (AMAL) using bipedal robotics technology.
Robotics and Autonomous Systems 57(6-7): p.603-616, 2009.Disponvel em <
www.sciencedirect.com/.../pii/S0921889009000402>, acessado em 25/01/2014.
NGUYEN V. B., MORRIS A. S. Using a genetic algorithm to fully optimise a fuzzy

logic controller for a two-link-flexible robot arm. Robtica 27(5): p.677-687,
2009.Disponvel em:
<dl.acm.org/citation.cfm?id=2258782>, acessado em
25/01/2014.
OGATA, K. Engenharia de Controle Moderno. 5. ed. So Paulo: Pearson, 2010.

PASEMANN, F. Evolving Neurocontrollers for Balancing an Inverted Pendulum.
Network, Computation in Neural Systems, 9, p.495-511, 1998. Disponvel:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.6851>. Acessado em
18/out/2013.
PETRIDIS, V., PATERAKIS, E; KEHAGIAS, A. A hybrid Neural-Genetic Multimodel
Parameter Estimation Algorithm. IEEE Transactions on Neural Networks, 9(5),
p.862-876, 1998. Disponvel em: < http://www.ncbi.nlm.nih.gov/pubmed/18255772>.
89
POLLONI, E.; FEDELI, R.; PERES, F. E. Introduo cincia da computao.

2.ed. So Paulo: Cengage Learning, 2010.
QIAN, S. AND LEE, Y.C. Adaptive Stochastic Cellular Automata: Applications.

Physica
D,
45(1-3):
181-188,
1990.
Disponvel
em:
<
www.sciencedirect.com/.../pii/016727899090181N>, acessado em 25/01/2014.
RAVIV, Y. INTRATOR, N. Variance reduction via noise and bias constraints. In:
Combining Artificial Neural Nets: Ensemble and Modular Multi-Net Systems.
London, Springer-Verlag, p. 163-175, 1999.
REKDALSBAKKEN, W. Feedback Control of an Inverted Pendulum with the use of
Artificial Intelligence. Computational Cybernetics. IEEE International Conference.
p.
16,
2006.
Disponvel
em:
<http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=4097653&url=http%3A%2F%
2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D4097653>.
RIVERO, D; et al. Artificial Neural Network Development by means of Genetic
Programming with Graph Codification. World Academy of Science, Engineering
and
Technology,
v.
21,
p.
880885,
2008.
Disponvel
em:
<http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.193.5826&rep=rep1&type
=pdf>. Acessado em 18/out/2013.
ROSENBLATT, F. The Perceptron: A Probabilistic Model for Information Storage and
Organization in the Brain. Psychological Review. V. 65, p. 386-408, 1958.
Disponvel em: <http://psycnet.apa.org/index.cfm?fa=buy.optionToBuy&id=195909865-001>. Acessado em 18/out/2013.
RUSSELL, S.; NORVIG, P. Inteligncia Artificial. 2. ed. Rio de Janeiro: Elsevier,
2003.
SAMAN R., BRYAN A. T. A new formulation forfeed forward Neural Networks. IEEE
Trans. NeuralNetw., v.22, 10, p. 1588-1598, 2011. Disponvel em:
<http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5993545&url=http%3A%2F%
2Fieeexplore.ieee.org%2Fiel5%2F72%2F4359168%2F05993545.pdf%3Farnumber
%3D5993545>. Acessado em 18/out/2013.
SEGWAY
SIMPLY
MOVING:
Vehicle
patrol.
<http://www.segway.com/patrol>. Acesso em 25/out/2013.
Disponvel
em:
SCHUMA, C. D.; BIRDWELL, J. D. Variable structure dynamic artificial neural

networks. Biologically Inspired Cognitive Architectures. n. 6, p. 126130, 2013.
Disponvel em:< http://www.citeulike.org/user/jpsantos/article/12417518>. Acessado
90
em 18/out/2013
SILVA, T. Estratgias de Aplicaes Sequenciais e Paralelas da Metaheurstica
Otimizao por Enxame de Partculas ao Problema do Caixeiro Viajante.
Mestrado (Engenharia de Produo). Universidade Federal do Rio Grande do Norte,
Natal-RN, 2008.
TARGETHD: TECNOLOGIA. O esqueleto mecnico Rex poder substituir as

cadeiras de roda no futuro. Disponvel em: < http://www.targethd.net/tecnologia >.
Acesso em 25/out/2013.
TURING, A. M. Computing Machinery Intelligence. Computing machinery and

intelligence. Mind, v. 59, n. 236, p. 433460, 1950. Disponvel em:
<http://www.loebner.net/Prizef/TuringArticle.html>. Acessado em 18/out/2013
YAO, X; LIU, Y. A new evolutionary system for evolving artificial neural networks.
IEEE Transactions on Neural Networks, v. 8, n.3, p. 694-713, 1997. Disponvel em:
< http://www.cs.bham.ac.uk/~axk/evoNN2.pdf>. Acessado em 18/out/2013
ZANETTI, S.S; et al. Estimating evapotranspiration using artificial neural network

and minimum climatological data. Journal of Irrigation and Drainage Engineering,
Reston, v.33, n.2, p.83-89, 2007. Disponvel em: < http://scitation.aip.org/>.
Acessado em 18/out/2013
WORDEN K.; STASZEWSKI W.J.; HENSMAN J.J. Natural computing

mechanical systems research: A tutorial overview. Mechanical Systems
Signal
Processing,
25(1):
p.4-111,
2011.
Disponvel
www.sciencedirect.com/science/article/pii/S0888327010002499>,
acessado
25/01/2014.
for
and
em:
em
WONG C. C , HER S. M. A self-generating method for fuzzy system design.

Fuzzy
Sets
Syst.
103:
p.1325,
1999.
Disponvel
em
<
dl.acm.org/citation.cfm?id=314970>, acessado em 25/01/2014.
WU J. C.; LIU T. S. Fuzzy control of rider-motorcycle system using genetic

algorithm and auto-tuning. Mechatronics, 5(4):441455, June 1995. Disponvel em:
www.sciencedirect.com/science/.../09574158950000>, acessado em 25/01/2014.
91
ANEXO I: ARTIGOS CIENTFICOS
Os doze artigos retornados na pesquisa utilizando os filtros citados na

pesquisa bibliogrfica so apresentados a seguir:
1. QIAN, S. AND LEE, Y.C. Adaptive Stochastic Cellular Automata:
Applications, 1990;
2. WU J. C.; LIU T. S. Fuzzy control of rider-motorcycle system using genetic
algorithm and auto-tuning, 1995;
3. WONG C. C , HER S. M. A self-generating method for fuzzy system
design. Fuzzy, 1999;
4. JUANG J.-G. Fuzzy neural network approaches for robotic gait synthesis,
2000;
5. MUHAMMAD A. Fuzzy and evolutionary modelling of nonlinear control
systems, 2001;
6. KAYNAK O.; ERBATUR K.; ERTUGNRL M. The fusion of computationally
intelligent methodologies and sliding-mode control-a survey, 2001;
7. HUNG L. C.; CHUNG H. Y. Decoupled control using neural network-based
sliding-mode controller for nonlinear systems, 2007;
8. HUNG L.;CHUNG H. Decoupled sliding-mode with fuzzy-neural network
controller for nonlinear systems, 2007;
9. NANDI G. C.; IJSPEERT A. J.; CHAKRABORTY P.; NANDI A.
Development of Adaptive Modular Active Leg (AMAL) using bipedal
robotics technology, 2009;
10. DIP G.; PRAHLAD V.; KIEN P. D. Genetic algorithm-based optimal bipedal
92
walking gait synthesis considering tradeoff between stability margin and

speed, 2009;
11. NGUYEN V. B., MORRIS A. S. Using a genetic algorithm to fully optimise a
fuzzy logic controller for a two-link-flexible robot arm, 2009;
12. WORDEN K.; STASZEWSKI W.J.; HENSMAN J.J. Natural computing for
mechanical systems research: A tutorial overview, 2011.

# 6 - Edson Simões Dos Santos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

# 6 - Edson Simões Dos Santos

Uploaded by

Copyright:

Available Formats

UNIVERSIDADE CANDIDO MENDES UCAM

PROGRAMA DE PS-GRADUAO EM PESQUISA OPERACIONAL E INTELIGNCIA COMPUTACIONAL

Edson Simes Dos Santos

PROJETO E CONSTRUO DE UM CONTROLADOR ADAPTATIVO

CAMPOS DOS GOYTACAZES, RJ

UNIVERSIDADE CANDIDO MENDES - UCAM

Edson Simes Dos Santos

PROJETO E CONSTRUO DE UM CONTROLADOR ADAPTATIVO

Dissertao apresentada ao Programa de

Orientador: Prof. talo de Oliveira Matias, D.Sc.

CAMPOS DOS GOYTACAZES, RJ

EDSON SIMES DOS SANTOS

PROJETO E CONSTRUO DE UM CONTROLE ADAPTATIVO POR

Dissertao apresentada ao Programa de

Aprovada em 29 de novembro de 2013.

Orientador: Prof. talo de Oliveira Matias, D.Sc.

CAMPOS DOS GOYTACAZES / RJ

Agradeo a Deus pela sua infinita misericrdia.

Saber muito no lhe torna inteligente. A

PROJETO E CONSTRUO DE UM CONTROLE ADAPTATIVO POR

Algoritmos de otimizao baseados em mtodos heursticos tm sido largamente

DESIGN AND CONSTRUCTION OF ADAPTIVE CONTROL BY STATE FEEDBACK

Optimization algorithms based on heuristics have been extensive used in automatic

Figura 2: a) Brinquedos bpedes; b) Veculo de um eixo; c) Exoesqueleto.

Figura 3: Citaes do artigo Identification and Control of Dynamical Systems using

Figura 5: Fluxograma padro

Figura 6: Indivduos pertencentes mesma populao.

Figura 7: Ciclo de reproduo.

Figura 8: Processo de mutao de um indivduo.

Figura 9: Modelo de neurnio biolgico.

Figura 10: Modelo Neural Artificial.

Figura 11: Funes de ativao.

Figura 12: Arquitetura feedforward.

Figura 13: Fases do Algoritmo backpropagation.

Figura 14: Fluxograma do Treinamento usando o algoritmo Levenberg Marquardt.

Figura 17: Gerao de descendentes por crossover.

Figura 18: a) Tempo de acomodao b) Sobressinal c) Massa.

Figura 19: Matriz A e b de inequaes.

Figura 20: Grfico da evoluo dos melhores indivduos.

Figura 21: Grfico da resposta do sistema ao distrbio.

Figura 24: Sistema representado por diagrama de blocos.

Figura 25: Animao do pndulo invertido.

Figura 26: Boto para insero de distrbios.

Tabela 2: Quantidades de publicaes por pas.

Tabela 3: Quantidades de publicaes por Lngua de publicao.

Tabela 4: Quantidades de publicaes por rea para sistemas no lineares.

Tabela 5: Quantidades de publicaes por pas para sistemas no lineares.

Tabela 6: Quantidades de publicaes por Lngua de publicao para sistemas no

Tabela 10: Diferena dos parmetros com penalizao.

Tabela 11: Polos utilizados no Treinamento da RNA.

Tabela 12: Evoluo dos melhores indivduos.

Colony Optimization Algorithm

Artificial Neural Network

Evolutionary Programming Network

General Problem Solver

Multiple Input Multiple Output

Proporcional Integrativo e Derivativo

Rede Neural Artificial

Single Input Multiple Output

Single Input Single Output

1.1.1 Objetivo Geral

1.1.2 Objetivos Especficos

1.3 ABORDAGEM DO TEMA NA PESQUISA

1.4 ORGANIZAO E DISPOSIO DOS CAPTULOS