Professional Documents
Culture Documents
Resumo— Este trabalho apresenta um Sistema de Acompan- fortemente do sentido visual. Uma destas importantes capaci-
hamento Visual de Alvo por Robô com rodas (SAVAR) para dades é a de rastrear os objetos.
ambientes semi-estruturados, capaz de controlar dois graus de O ser humano ao rastrear um alvo móvel concentra boa
liberdade do robô e de uma câmera de rede embarcada. Dois
controladores são usados, um para a plataforma robótica e outro parte da atenção no objeto de interesse, mas mantém relativa
para a câmera, com o objetivo de permitir a independência de percepção do entorno para detecção dos objetos móveis e
movimentos da câmera e do robô na execução da tarefa de estáticos, quando na sua condução em direção ao alvo. Para
acompanhamento com desvio de obstáculos. A configuração do isso aplicamos métodos distintos para rastrear um objeto,
sistema em malha fechada é realizada sob uma WLAN(Wireless navegar e evitar colisões. Assim, é natural esperar-se que um
Local Area Network) com tecnologia padrão 802.11b/g. Nesta
abordagem o maior custo computacional é realizado por um sistema artificial cognitivo seja desenvolvido para, até certo
computador (host) e algoritmos de baixo custo computacional ponto, ser capaz de demonstrar capacidades semelhantes.
embarcados no hardware do robô. São empregados os sensores Em se tratando de robôs, os aspectos relacionados à visão se
inerciais (giroscópios, compasso digital e acelerômetro) como referem à sua capacidade de perceber visualmente o ambiente
suporte à orientação e navegação. e com ele interagir. A visão do robô para o cumprimento de
Palavras-Chave— Robôs móveis, Visão computacional, Sen- suas tarefas se estende ao campo da visão computacional, não
sores inerciais, Sistemas embarcados. sendo uma entidade isolada, mas parte de um sistema mais
Abstract— This paper presents a visual tracking system of complexo. Com isso as informações visuais foram incluı́das
targets by wheeled mobile robots on semi-structured environ- na malha de realimentação das formulações de controle da
ments(Sistema de Acompanhamento Visual de Alvos por Robô postura do robô. Esta estratégia de controle é atualmente
- SAVAR), capable of controlling two degrees of freedom robot
and a network camera loaded. Two controllers are used, one conhecida como controle servo visual [1].
for the robotic platform and another for the camera, in order Na detecção de objetos, uma qualidade desejável de um
to allow the independence movements of the camera and the ponto de interesse é a sua invariância a mudanças na
robot in performing the task of tracking with obstacle avoidance. iluminação e do ponto de vista da câmera. Na literatura,
The configuration in the closed loop system is performed under os detectores de ponto de interesse mais usados incluem: o
a WLAN(Wireless Local Area Network) technology standard
802.11b/g. In this approach, the major computational cost is detector Harris [?]; o detector KLT [3] e o detector SIFT(Scale
achieved by a computer (host) and low computational cost Invariant Feature Transform) [4]. Eles são usados para lo-
algorithms are embedded in the hardware of the robot. Inertial calizar pontos de interesse em imagens que tem uma expres-
sensors (gyroscopes, digital compass and accelerometer) are used siva textura em suas respectivas localidades. Mikolajczyk e
as support to the guidance and navigation. Schmid [5] apresentam uma avaliação empı́rica.
Keywords— Mobile robot, Computer vision, Inertial sensors, Outra abordagem muito comum é executar a subtração
Embedded system. de um modelo de fundo do quadro da imagem observada;
a parte da imagem que difere significativamente do modelo
de fundo, representa os objetos em movimento. Resultados
I. I NTRODUÇ ÃO
experimentais comparativos de diversos métodos [6], mostram
Para muitas espécies vivas a percepção visual desempenha que as técnicas mais simples, como a mediana filtragem
um papel fundamental em seu comportamento. A capacidade adaptativa pode produzir bons resultados com uma menor
de coordenação do tipo mão-olho dá a flexibilidade, a destreza complexidade computacional .
e robustez de movimento que uma máquina ainda não pode A literatura chama de detecção ao processo de identificação
executar. Para os seres humanos localizar e identificar objetos de um objeto em uma imagem estática. Cada processo exige
estáticos ou em movimento, bem como compreender e de- um método para detectar um objeto em cada quadro ou
terminar a forma de lidar com estes, muitas vezes depende do primeiro objeto que aparece no vı́deo. Alguns métodos
de detecção de objetos fazem uso da informação temporal
Ricardo Figueiredo Machado, Paulo Fernando Ferreira Rosa, Antônio calculada a partir de uma sequência de quadros para reduzir
E. Carrilho da Cunha, Diego Félix de Almeida¸ Seção de Engenharia o número de falsas detecções. Essa informação temporal é
de Defesa, Instituto Militar de Engenharia, Rio de Janeiro, Brasil, E-
mails: rfm61@hotmail.com, rpaulo@ime.eb.br, carrilho@ime.eb.br, diegob- geralmente sob a forma de diferenciação de quadros, o que
ill@gmail.com. Este trabalho é parte de tema de dissertação de Mestrado. evidencia a mudança das regiões de busca em quadros consec-
utivos. A detecção de objetos requer uma pesquisa particular Com base nos resultados de trabalhos recentes e o fato de
do objeto de interesse. Os métodos mais utilizados neste não existir um sistema para rastreamento visual para os robôs
contexto, devido a precisão são os detectores pontuais [7]. do laboratório do IME, surgiu a inspiração para a presente
Assim sendo, a elaboração de sistemas de acompanhamento trabalho.
visual por robôs móveis que possa lidar com objetos móveis ou
estáticos no seu ambiente de trabalho, assume uma relevante III. A PRESENTAÇ ÃO DO P ROBLEMA
importância para aplicações robóticas civis e militares.
No cenário semi-estruturado, resolveremos o problema de
O artigo está estruturado em cinco seções distintas: a seção
acompanhamento visual por um robô móvel terrestre dotado
II apresenta uma sı́ntese de trabalhos correlatos; a seção III
apenas de uma câmera como seu único sistema sensorial.
trata do enunciado do problema; a seção IV apresenta a visão
Na maioria das atividades industriais automatizadas o robô
geral do Sistema, os aspectos teóricos do desenvolvimento de
tem conhecimento exato de sua posição, da posição dos objetos
um robô experimental e sua eletrônica embarcada e ao final,
e obstáculos, operando assim em ambientes completamente
na seção V a conclusão e as referências.
estruturados, a exemplo dos robôs industriais utilizados em
linha de montagem. Por ambiente estruturado entende-se, um
II. T RABALHOS CORRELATOS ambiente no qual algumas pré-condições podem ser estabele-
cidas e garantidas, como o tipo de solo para navegação, que
Um sistema de detecção e rastreamento visual de faces hu-
seja adequado a anatomia do robô e a existência de marcos
manas em tempo real, para um robô humanoide, foi proposto
confiáveis à navegação, entre outros.
por [8], usando um computador embarcado. O autor utiliza o
Em ambientes onde estas condições iniciais não podem
método baseado de gradientes de intensidade e histogramas de
ser totalmente garantidas e respeitados, semi-estruturado, um
cores. As imagens são transmitidas por sinal de rádio para um
certo grau de autonomia deve ser dado ao sistema de controle
computador, que processa o algoritmo de visão que gerencia
do robô, para que a execução da tarefa seja realizada com
e executa o rastreamento visual. O desempenho do sistema
segurança. Também nesses ambientes é fundamental que a
consumiu 112ms para processamento da imagem a taxas de
resposta do sistema robótico seja adequada à dinâmica não-
9, 8 quadros/segundo e 0, 21 segundo/imagem para rastrear.
linear do meio e à sua interação em tempo real. Assim se
Trabalhos recentes como [9], [10] e [11] utilizam o plano
faz necessário um aumento da quantidade de sensores para
da imagem para rastreamento visual. Os dois primeiros são
interação com o meio, o que acarreta um aumento dos custos
baseados na estimativa de erro, controle de robôs móveis
e maior complexidade do sistema robótico.
e controle robusto baseado em método direto de Lyapunov,
assegurando uma estabilidade global assintótica da malha
fechada do sistema de monitoramento visual. O último utiliza IV. V IS ÃO G ERAL DO S ISTEMA
uma dual jacobiana, de forma à acoplar o controle do modelo Neste trabalho propomos um Sistema de Acompanhamento
do robô e do alvo. Como estimador foi utilizado um filtro de de Alvo móvel por Robô (SAVAR) capaz de controlar dois
Kalman auto ajustável. O modelo é robusto em relação as leis graus de liberdade do robô e de uma câmera embarcada. São
de controle, entretanto tem restrições, devido a distribuição usados dois controladores: um para a plataforma robótica e
Gaussiana incerta e taxa de amostragem uniforme. O sistema outro para a câmera.
visual é dotado de um grau de liberdade. A utilização de dois controladores se deve à existência de
A indústria começa a se desenvolver e adotar soluções diferentes tempos de discretização nos processos de rastrea-
RTE(Real-Time Ethernet) e atualmente já são conhecidas mais mento visual e controle do robô, como também para permitir
de dez propostas de soluções e as normas IEC(International a independência de movimentos da câmera e do robô quando
Electrotechnical Commission) estão buscando estabelecer uma na execução da tarefa de acompanhamento com desvio de
orientação e critérios de seleção reconhecidas com base em obstáculos. Propõe-se ainda, na configuração do sistema, a
indicadores para o usuário [12], assim as aplicações com utilização de uma rede ethernet sem fio e o uso de uma câmera
robôs de serviço tendem a crescer, e inversamente proporcional de rede. Nesta abordagem o maior custo computacional será
serão os custos finais de seu desenvolvimento, pela menor realizado por um computador (host) e algoritmos de baixo
complexidade de seu hardware. custo computacional embarcados no hardware do robô.
O controle de um motor DC brushless em tempo real foi O uso da tecnologia WLAN e protocolos TCP/IP, introduz
realizado sobre uma rede ethernet, com dois controladores benefı́cios consideráveis ao sistema pela possibilidade de tele-
distintos [13], onde a malha de realimentação foi fechada sob operação de robôs e reutilização do sistema com pouca ou
a rede e supervisionada por um outro computador também nenhuma alteração no hardware do robô e no software em-
remoto. barcado. Estes incluem ainda reduções substanciais no projeto
Um rastreador usando uma câmera de rede PTZ(Pan, Til e no esforço futuros para desenvolvimento de novos contro-
e Zoom) em tempo real é apresentado por [14], onde são ladores, através da utilização de componentes padronizados
utilizados filtros de partı́culas em duas fases de multi-escala, de hardware e de software. Potencialmente amplas vantagens
juntamente com o algoritmo de KLT e um mecanismo de operacionais surgem, em especial a possibilidade de operação
multi-threading. Apesar da latência de transferência de dados remota de qualquer local com ligação à Internet.
sobre uma rede ethernet um controle robusto em tempo real O sistema exerce, a priori, as seguintes funções básicas:
foi alcançado. detecta, estima e persegue um alvo de interesse; desvia de
obstáculos; identifica marcos e exerce o controle cinemático do Feitas as considerações para sua formulação [15], para a
robô para acompanhamento do alvo, usando a imagem como descrição de sua posição, Figura 3, toma-se por base o plano
único sensor do robô. do seu movimento. Nele é fixado uma base inercial ortonormal
→
− → −
arbitrária {0, X i , Z i }. Define-se um ponto arbitrário P sobre
→
− → −
V. S UBSISTEMA ROB Ô -C ÂMERA o quadro do robo na base arbitrária {0, X m , Z m }, aplicada
Neste subsistema são realizadas a captura da imagem do ao seu quadro. A posição é completamente definida por três
alvo, de obstáculos e marcos seguros à navegação, além
do controle do robô e do mecanismo PTZ. Duas portas
independentes do módulo de comunicação WiFi são usadas
para o fluxo de dados do módulo de controle dos motores
e da câmera de rede para o computador cliente, cuja as
realimentações das plantas são realizadas sob a rede ehternet
em um cliente remoto. A Figura 1 apresenta o diagrama em
blocos do subsistema.
C. Eletrônica embarcada
A utilização de uma câmera de rede, tem como principal
diferença e vantagem, o fato de que uma saı́da de vı́deo em
formato digital é fornecida e pode ser conectada diretamente
a um switch Ethernet ou roteador, possibilitando o acesso
a imagem através de uma rede IP. Todos os parâmetros de
configuração da imagem podem ser facilmente controlados
Fig. 5. Diagrama em blocos - Subsistema de acompanhamento visual
por métodos HTTP do tipo POS/GET sendo possı́vel mover
nas direções vertical (Tilt) e horizontal (Pan), tornando mais
fácil ajustar o ângulo de visão. O SAVAR utiliza o modelo caracterı́sticas, são utilizados estimadores de rastreamento
Axis214 PTZ (Axis Communications), que possui o recurso visual do alvo e de caminhos seguros ao deslocamento do robô.
de zoom, muito útil para se obter informações detalhadas Com base nessas estimativas, são realizados o rastreamento
do alvo. Essa informações é uma das questões-chave para o visual e aplicado um interpolador de pontos mediais (nós) no
rastreamento visual, pois proporciona um melhor resultado no interior das áreas livres de obstáculos. Parte da informação do
processamento da imagem pelo detector de caracterı́sticas. estimador visual é utilizada na atualização do estimador de
O projeto de hardware usa módulos padrão da indústria Wi- caminho. Segue-se a aplicação de leis de controle especı́ficas
Fi IEEE 802.11a/b/g. para implementação de conectividade a cada processo. Por fim, as diretivas de comandos são
sem fio com a Ethernet/Internet. Estes módulos, MatchPort sincronizadas e enviadas aos controladores de movimentos
b/g e XPort (Lantronix
, R Inc. ) , são do tipo servidor Serial- da câmera e do robô. Para cada novo quadro capturado ou
Ethernet. A placa para interface com os módulos e o sistema conjunto de quadros este processo é repetido.
A realimentação do sistema é realizada pela rede, com base padronizados ethernet/serial. Um robô móvel diferencial ex-
nas informações enviadas do controlador do robô (velocidade perimental foi desenvolvido para uso pelo sistema e um algo-
e odometria) e de um parâmetro de erro fixo ε, introduzido ritmo preliminar de acompanhamento visual, baseado somente
no estimador visual. Este parâmetro é imposto, por não ser na cor, foi testado com sucesso.
possı́vel obter a realimentação diretamente do controlador Entre os trabalhos futuros estão a validação do modelo
da câmera (arquitetura proprietária) e de erros intrı́nsecos e a implementação do SAVAR, onde múltiplos algoritmos
ao modelo do robô. Todos os processos de controle são serão executados, habilitando o robô ao acompanhamento e
referenciados ao plano da imagem. navegação em ambientes semi-estruturados.