Dissertacao Andre Freitas

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PS-GRADUAO EM ENGENHARIA
ELTRICA E COMPUTAO
Interface Crebro-Computador: uma abordagem exploratria
Andr Freitas Barbosa
Orientador: Prof. Dr. Ana Maria Guimares Guerreiro Co-orientador: Prof. Dr. Antnio Pereira Jnior
Natal, Fevereiro de 2012
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PS-GRADUAO EM ENGENHARIA
ELTRICA E COMPUTAO
Um sistema inteligente de classificao de sinais de EEG para Interface-Crebro Computador
Andr Freitas Barbosa
Orientador: Profa. Dra. Ana Maria Guimares Guerreiro Co-orientador: Prof. Dr. Antnio Pereira Jnior
Dissertao de Mestrado apresentada ao Programa de Ps-Graduao em Engenharia Eltrica e de Computao da UFRN como parte dos requisitos para obteno do ttulo de Mestre em Cincias.
Sumrio
Lista de Figuras .......................................................................................................................... 4 Lista de Tabelas .......................................................................................................................... 5 1 Introduo............................................................................................................................ 6 1.1 1.2 1.3 2 2.1 Apresentao do Problema .......................................................................................... 6 Objetivos e contribuies buscadas no trabalho .......................................................... 8 Organizao do texto ................................................................................................... 9 Eletroencefalograma .................................................................................................. 10 Bases biolgicas do eletroencefalograma ........................................................... 10 Bandas de freqncia do EEG ............................................................................ 12 ICCs baseadas em EEG ...................................................................................... 15
Fundamentao Terica .................................................................................................... 10 2.1.1 2.1.2 2.1.3 2.2 2.3 2.4
Anlise de Componentes Independentes ................................................................... 18 Anlise de Componentes Principais .......................................................................... 19 Redes Neurais Artificiais ........................................................................................... 21 Classificao de Padres .................................................................................... 21 Conceitos e contextualizao histrica das redes neurais .................................. 23 Perceptron de Mltiplas Camadas ...................................................................... 26
2.4.1 2.4.2 2.4.3 3 3.1
Metodologia ...................................................................................................................... 29 Experimento I ............................................................................................................ 31 Aquisio de Dados ............................................................................................ 31 Pr-processamento .............................................................................................. 33 Extrao de Caractersticas ................................................................................. 33 Classificadores .................................................................................................... 34 Aquisio de Dados ............................................................................................ 34 Pr-processamento .............................................................................................. 35 Extrao de Caractersticas ................................................................................. 35 Classificadores .................................................................................................... 35 3.1.1 3.1.2 3.1.3 3.1.4 3.2 3.2.1 3.2.2 3.2.3 3.2.4
Experimento II ........................................................................................................... 34
Resultados ......................................................................................................................... 37 4.1 4.2 Experimento I ............................................................................................................ 37 Experimento II ........................................................................................................... 39
Concluso .......................................................................................................................... 43
Referncias Bibliogrficas ........................................................................................................ 45
LISTA DE FIGURAS
FIGURA 2.1:DEMONSTRAO DA INFLUNCIA DO SINAL CAPTADO DECORRENTE DE DIFERENTES

AFERNCIAS.[9] .................................................................................................................. 12
FIGURA 2.1 DEMONSTRAO DA INFLUNCIA DO SINAL CAPTADO DECORRENTE DE DIFERENTES

AFERNCIAS.[9] .................................................................................................................. 12
FIGURA 2.2: A) ATIVIDADE RPIDA B) ATIVIDADE MISTURADA C) ATIVIDADE MISTURADA D) PREDOMINNCIA DE ALFA (8 AT 13 HZ) E) PREDOMINNCIA DE TETA (4 AT 8 HZ) F) ATIVIDADE MISTA ENTRE TETA E DELTA G) PREDOMINNCIA DE ONDAS DELTA (<4 HZ). . 15 FIGURA 2.3: MAPA SOMATOTPICO DO CRTEX MOTOR PRIMRIO. .......................................... 18 FIGURA 2.5: EXEMPLO DE USO DE PCA. .................................................................................... 20 FIGURA 2.6: MODELO DE SISTEMA SUPERVISIONADO. ............................................................... 22 FIGURA 2.8: MODELO DE PERCEPTRON ...................................................................................... 24 FIGURA 2.9: PADRO LINEARMENTE SEPARVEL. ..................................................................... 25 FIGURA 3.2: DISTRIBUIO DOS ELETRODOS PELO ESCALPO SEGUINDO O SISTEMA INTERNACIONAL 10/20. ...................................................................................................... 31 FIGURA 3.3: TELAS MOSTRADAS AOS SUJEITOS COM AS 03 TAREFAS . ....................................... 32
LISTA DE TABELAS
TABELA 3.1: IMAGEM REFERENTE A NOVA TAREFA. .................................................................. 35 TABELA 4.1: DESEMPENHO DOS CLASSIFICADORES TERNRIOS. ................................................ 38 TABELA 4.2: DESEMPENHO DOS CLASSIFICADORES BINRIOS. .................................................. 38 TABELA 4.3:TAXA DE TRANSFERNCIA DE INFORMAO PARA O EXPERIMENTO I. ................... 39 TABELA 4.4: CLASSIFICADORES QUATERNRIOS. ..................................................................... 40 TABELA 4.5: CLASSIFICADORES BINRIOS. ............................................................................... 40 TABELA 4.6: DESEMPENHO DOS CLASSIFICADORES HIERRQUICOS. BIN E QUAD, ENTRE
PARNTESES, INDICAM SE O RESULTADO DO CLASSIFICADOR BINRIO OU DO QUATERNRIO. AO LADO, INDICADO QUAL O CLASSIFICADOR BINRIO UTILIZADO: MLP, PARA A REDE MLP, LIN, PARA SVM COM KERNEL LINEAR E RBF, PARA SVM COM KERNEL
RBF. .................................................................................................................................. 41 TABELA 4.7: TAXA DE TRANSFERNCIA DE INFORMAO PARA O EXPERIMENTO II. ................. 42
1 INTRODUO
1.1
Apresentao do Problema
A segunda metade do sculo XX presenciou um avano cientfico-tecnolgico sem precedentes. Algumas reas novas do conhecimento, como a computao, praticamente nasceram nesse perodo. Outras mais antigas, como as neurocincias, passaram por um verdadeiro renascimento, devido a introduo de novas ferramentas tecnolgicas. As cincias da computao acompanham o desenvolvimento de outras disciplinas, tanto absorvendo quanto oferecendo idias. Ela e a neurocincia so velhas conhecidas, com um dos primeiros encontros datando ainda dos anos 1940, com o modelo de neurnio de McCuloch e Pitts. Um dos frutos desta unio so as interfaces crebro-computador, objeto deste trabalho. As interfaces crebro-computador (ICC) tm como objetivo estabelecer uma via de comunicao com o sistema nervoso central (SNC) que seja independente das vias padro (nervos, msculos), visando o controle de algum dispositivo(WOLPAW, JONATHAN R, 2007). As aplicaes desta tecnologia so inmeras, desde restaurao de movimento e da capacidade de se comunicar, at a restaurao da capacidade de processar sinais sensoriais, passando pelo extremo de se controlar um corpo inteiramente artificial(LEBEDEV; NICOLELIS, 2006). Conceitualmente, importante destacar que numa ICC a comunicao deve ser feita diretamente com o SNC. Este detalhe a diferencia de outros projetos, como o Luke Arm, cuja via de comunicao utiliza os nervos do sistema nervoso perifrico para estabelecer o controle de um dispositivo. Essa independncia do sistema nervoso perifrico necessria para que a tecnologia seja aplicada a pacientes com sndrome do aprisionamento, incapazes de se mover, mas com capacidade cognitiva intacta. A sndrome do aprisionamento pode resultar de esclerose lateral amiotrfica e derrame do tronco enceflico. As ICCs
oferecem uma maneira de esses pacientes interagirem com o ambiente que os cerca, j que a maioria incapaz de coisas simples como falar e alguns at mesmo de piscar os olhos. Os primeiros trabalhos de ICC datam ainda da dcada de 1970(VIDAL, 1973). No entanto, apenas no incio dos anos 1990 que o estudo desta tecnologia comeou a se espalhar pelos laboratrios do mundo. Divididas de acordo com a forma de captao do sinal, as ICCs so divididas em invasivas (necessitam de cirurgia para a insero dos eletrodos) e noinvasivas (registram a informao neurofisiolgica sem necessidade de qualquer procedimento cirrgico) (figura 1.1). A primeira categoria utiliza quase exclusivamente animais como objeto experimental, por razes ticas bvias. possvel, em pacientes submetidos neurocirurgia para remoo de foco epilptico, por exemplo, aproveitar a oportunidade para captar sinais eltricos diretamente no parnquima cerebral(MAK; WOLPAW, J.R., 2010). Apesar das dificuldades, como bio-compatibilidade dos eletrodos e dos custos altos, muitos avanos foram feitos nesse tipo de ICC, com especial destaque para o trabalho do brasileiro Miguel Nicolelis(LEBEDEV; NICOLELIS, 2006)(CARMENA et al., 2003). As ICCs no-invasivas podem utilizar vrias tecnologias para o registro do sinal neural, como magnetoencefalografia (MEG), imageamento por ressonncia magntica funcional (IRMf) e, principalmente, eletroencefalografia (EEG). A preferncia do EEG para registro deve-se no s a sua preciso temporal e portabilidade, mas tambm pelo seu custo, da ordem de 10 a 100 vezes menor do que os equipamentos que fazem as outras formas de registro noinvasivo. Maiores informaes sobre EEG e suas aplicaes em ICCs sero vistas na seo 2.1. Um grande problema enfrentado pelas ICCs no-invasivas a baixa taxa de transferncia de informao, normalmente entre 10 e 25 bits/minuto(WOLPAW, JONATHAN R et al., 2002). Isso acaba limitando as possveis aplicaes dessa tecnologia, deixando de fora sistemas que requerem uma alta taxa de transferncia de informao para serem controlados em tempo real, como o controle de um brao mecnico. Essa baixa taxa pode ter essencialmente duas razes: um sistema muito lento e/ou uma baixa confiabilidade (o erro do sistema base para o clculo da taxa de transferncia). Aprimorar essa taxa pode ser a diferena entre a viabilidade ou no de um sistema ICC. Essa dissertao de Mestrado compreende o estudo comparado de diferentes abordagens objetivando a melhoria taxa de transferncia de informao de uma ICC no-invasiva off-line baseada em EEG. Um estudo amplo pode identificar quais os pontos chaves para o
desenvolvimento de um sistema robusto e eficiente para o desenvolvimento futuro de uma ICC on-line.
Figura 1.1: Diviso das ICCs segundo forma de registro
1.2 Objetivos e contribuies buscadas no trabalho
Os objetivos principais da presente pesquisa so: Desenvolver uma ICC off-line que separe os diferentes padres de EEG resultantes de uma tarefa puramente mental realizada por um sujeito experimental. O uso de tarefas exclusivamente mentais busca simular as limitaes de um paciente com Sndrome do Aprisionamento. Comparar a eficcia de diferentes abordagens de pr-processamento do sinal, com destaque para Anlise de Componentes Principais e Anlise de Componentes
Independentes, objetivando ampliar as diferenas entre os padres, tornando-os mais facilmente separveis. Identificar a melhor maneira de extrair caractersticas para o classificador neuronal, com enfoque para abordagens no domnio da freqncia. Avaliar o emprego de diferentes algoritmos de classificaopara separar os padres extrados dentro de um tempo aceitvel, com nfase para as redes neurais artificiais e mquinas de vetor de suporte (detalhes na seo 2.2). O eventual sucesso desse trabalho trar como possveis frutos um maior entendimento sobre as ICCs baseadas em EEG e a identificao da melhor abordagem para classificao de padres de tarefas mentais em EEG. Com esse conhecimento em mos seria possvel projetar uma ICC on-line com um desempenho de classificao semelhante ao de uma ICC off-line e todos os ganhos que a realimentao em tempo real pode dar para esse tipo de sistema.
1.3 Organizao do texto

O restante do texto est dividido da seguinte maneira: Captulo 2 apresenta a fundamentao terica para a pesquisa, abordando temas como eletroencefalograma (EEG), classificao de padres e Redes Neurais Artificiais; Captulo 3 descreve a abordagem metodolgica deste trabalho, com a descrio da forma de aquisio, de pr-processamento, de extrao e de classificao propostas; Captulo 4 resultados obtidos pelo projeto; Captulo 5 - concluso sobre os resultados do projeto.
2 FUNDAMENTAO TERICA
2.1 Eletroencefalograma
2.1.1 Bases biolgicas do eletroencefalograma O eletroencefalograma (EEG) o registro eletrofisiolgico da atividade eltrica pssinptica de uma grande quantidade de neurnios piramidais do crtex cerebral. O mdico ingls Richard Caton creditado como autor da primeira descrio de um registro eletroencefalogrfico, em 1875, em macacos e coelhos(ERNST NIEDERMEYER, 2005). Anteriormente, em 1870, G. Fritsch & Julius Hitzig j haviam demonstrado que crtex do co podia ser estimulado eletricamente, gerando contraes musculares contralaterais
localizadas(LEBEDEV; NICOLELIS, 2006). Este ltimo trabalho foi um marco importante porque demonstrou que o crebro no era um rgo uniforme que abrigava as mesmas funes. Outros pioneiros continuaram a aperfeioar a tcnica de registro eletrofisiolgico do EEG em animais, como Adolf Beck e Vladimir Pravdich-Nemisnky, mas o psiquiatra alemo Hans Berger creditado como o primeiro a realizar registros do EEG humano em 1924(ERNST NIEDERMEYER, 2005)(SWARTZ; GOLDENSOHN, 1998). O desenvolvimento da tecnologia do EEG abriu um novo leque de possibilidades no estudo funcional do crebro. Com o EEG se tornou possvel avaliar a atividade eltrica do crtex humano de maneira noinvasiva, ou seja, sem necessidade de cirurgia. A utilidade do EEG no auxlio do diagnstico de algumas patologias do sistema nervoso central (SNC), como as epilepsias, foi prontamente estabelecida e at hoje uma das ferramentas mais utilizadas no diagnstico e tratamento desta doena. Em seguida, o EEG passou tambm a ser bastante utilizado no estudo das variaes nas atividades cerebrais associadas com ciclo sono-viglia. Um erro freqente cometido ao se analisar o registro grfico do EEG achar que o sinal captado proveniente dos potenciais de ao disparados pelos neurnios corticais. Na verdade, o que se capta com o EEG o somatrio das correntes sinpticas induzidas por aferentes excitatrios em um conjunto de neurnios (milhes) localizados sob o eletrdio de
registro. Mas no so todos os tipos de neurnios cuja atividade eltrica influencia o sinal do EEG: devido sua arquitetura, com os seus dendritos apicais alinhados perpendicularmente superfcie cortical, apenas os neurnios piramidais contribuem significativamente para o sinal registrado. Esses neurnios, que recebem esse nome graas sua morfologia, so o tipo mais comum de neurnio excitatrio do crtex cerebral. Antes de explicar como gerado esse sinal, faz-se necessrio uma explicao breve sobre o potencial ps-sinptico. O neurnio a clula especializada na transmisso de informao no sistema nervoso. A estrutura do neurnio polarizada, com uma regio recebendo e integrando informao proveniente de outros neurnios, composta por dendritos e corpo celular, e outra especializada na transmisso dos resultados dessa computao para outros neurnios na cadeia de processamento, o axnio e os terminais axonais. A comunicao entre neurnios realizada atravs de uma estrutura complexa chamada de sinapse. Na sinapse, o sinal eltrico contendo a informao a ser transmitida transformado em sinal qumico no terminal pr-sinptico e depois transformado novamente em sinal eltrico no neurnio ps-sinptico. Dependendo se a sinapse inibitria ou excitatria, a variao de potencial de membrana evocada no neurnio ps-sinptico chamada de potencial inibitrio ps-sinptico (PIPS) ou potencial excitatrio ps-sinptico (PEPS), respectivamente. A gerao de um PIPS significa que o potencial de membrana da clula vai ficar mais hiperpolarizado e, conseqentemente, ser mais difcil evocar um potencial de ao. O PEPS, por outro lado, contribui para trazer o potencial de membrana mais prximo do limiar para gerao de um potencial de ao atravs da criao de uma corrente inica positiva para o interior da clula, deixando o meio extracelular relativamente mais negativo naquela regio (sorvedouro). Nas clulas piramidais do crtex cerebral, a maior parte dos contatos sinpticos de entrada ocorre no dendrito apical e suas ramificaes. A corrente inica positiva interna gerada no sorvedouro, ao sair em outra parte do dendrito apical, vai gerar no meio extracelular prximo a esta regio uma zona localizada de positividade relativa (fonte). O resultado a criao de um dipolo eltrico orientado perpendicularmente superfcie cortical (figura 2.1). A contribuio de vrios dipolos eltricos em paralelo, devido ao arranjo dos dendritos apicais das clulas piramidais, a origem do sinal do EEG. Os terminais axonais de origem talmica so excitatrios e a sua ativao generalizada evoca PEPSs em todas as clulas piramidais contactadas por estes aferentes. Essa atividade macia e sincronizada dos neurnios piramidais de uma regio pelos terminais talmicos contribui para aumentar a amplitude do sinal captado pelo EEG(KANDEL, 1999).
Na figura 2.1, os neurnios piramidais na parte esquerda da figura recebem aferncia talmica localizada na camada 4, relativamente distante do eletrodo localizado no escalpo acima. Assim, o dipolo eltrico ser orientado com a fonte em cima, mais prximo do eletrdio e o sorvedouro abaixo. Isso induz um sinal positivo no eletrodo. De forma oposta, o agrupamento neuronal da direita recebe aferncias do hemisfrio contralateral, dirigidas para as camadas 2/3, muito mais prximas do eletrodo. Nesta configurao do dipolo eltrico, a corrente de sorvedouro estar mais prxima do eletrodo e a fonte mais distante. Dessa forma, um valor negativo de tenso ser captado pelo EEG.
Figura 2.1:Demonstrao 2.1 Demonstrao da influncia do sinal captado decorrente de diferentes aferncias.[9]
2.1.2 Bandas de freqncia do EEG Como visto acima, o EEG capta o somatrio das influncias no meio extracelular dos potenciais ps-sinpticos nos neurnios piramidais do crtex. Esse sinal gera uma onda complexa e que varia com o tempo. medida que os estudos utilizando EEG foram avanando, foi-se descobrindo que os padres de onda registrados possuem uma relao estreita com o estado cerebral do sujeito e proporcionam uma janela para o funcionamento da mente. Dentre as alteraes observadas no sinal eletroencefalogrfico em seres humanos, uma
das mais conspcuas a variao do espectro de freqncia associado com diversos estados mentais(ERNST NIEDERMEYER). Antes de falar sobre essas variaes, apresentamos uma breve explicao sobre a teoria matemtica da composio de frequncias de um sinal. H cerca de dois sculos, JeanBaptiste Joseph Fourier, fsico e matemtico francs, fez uma descoberta importantssima: toda srie temporal peridica pode ser decomposta numa soma de exponenciais complexas (senos e cossenos). A combinao adequada de senos e cossenos que permite a descrio precisa de um sinal chamada de srie de Fourier, enquanto que a quebra de uma srie temporal nesse somatrio uma operao conhecida como transformada de Fourier. Um sinal senoidal caracterizado por trs parmetros: amplitude, freqncia e fase. Na srie e na transformada de Fourier, a amplitude um indicativo da importncia da senide (de uma determinada freqncia) que esta multiplica. Nem a srie nem a transformada de Fourier fazem qualquer referncia fase da senide. Voltando ao sinal de EEG, aos poucos os cientistas foram correlacionando a intensidade de uma determinada faixa de freqncia com algum estado cerebral especfico do sujeito. Essa correlao mais evidente durante o ciclo sono-viglia. Com isso, foram descobertas o que hoje so chamadas de faixas de freqncia bsicas do EEG: delta (1 a 4 Hz), teta (4 a 8 Hz), alfa (8 a 13 Hz), beta (13 a 30 Hz) e gama (>30 Hz). Delta e teta, as duas menores faixas de freqncias, oscilam em torno de 2 Hertz e 6 Hertz, respectivamente. Apesar de estarem sempre presentes em grande intensidade (a freqncia e a potncia de um sinal so inversamente proporcionais no EEG), elas esto muito mais ligadas ao chamado sono no-REM(ERNST NIEDERMEYER), tambm conhecido como sono de ondas lentas. O sono no-REM caracterizado por um alto grau de sincronizao da atividade neuronal cerebral, se refletindo na amplitude elevada do sinal. Essa sincronia se d em baixas freqncias de ativao, fazendo com que as bandas mais baixas sejam mais predominantes nessa fase do sono. Frequncias delta na faixa de 1 a 2 Hz esto associadas com sono profundo e vrios estados de coma ou anestsicos(ERNST NIEDERMEYER). Alfa uma onda intermediria, oscilando entre 8 e 13 Hz. Apesar de ser um ritmo mais tpico da viglia, ele est relacionado com o relaxamento e a sonolncia. Tambm surge no lobo occipital quando uma pessoa fecha os olhos. Dentro da faixa alfa, encontra-se um ritmo conhecido como Mu. A frequncia mais comum do ritmo mu de 10 Hz, mas pode variar entre 8 e 11 Hz. Outra caracterstica do ritmo mu a presena de espculas compostas de uma fase rpida negativa e uma mais lenta positiva(ERNST NIEDERMEYER). Esse ritmo
relacionado principalmente com o crtex motor, mas tambm ocorre em reas somestsicas. No sistema 10-20 de localizao de eletrodos, o ritmo mu mais bem captado pelos eletrdios localizados sobre o giro pr-central, C3 e C4. Mu pode ser atenuado, dentre outras formas, atravs de movimento, real ou imaginado, de partes do corpo contralaterais quela em que se deseja atenuar o Mu(DUNTLEY et al., 2001). Por fim, beta e gama so os ritmos de maior freqncia do EEG. O gama pode abranger freqncias at 100 Hertz, enquanto que Beta tem freqncia que oscilam em torno dos 20 Hertz, podendo chegar at 30 Hertz. Como mencionado anteriormente, mesmo na viglia, caracterizada por altas freqncias, a potncia dentro dessas bandas menor do que nas de menor freqncia (delta e teta). Isso se explica pelo fato de beta e gama serem ritmos de baixa amplitude, uma vez que so gerados em um processo caracterizado por baixa sincronizao neuronal. O aumento da presena dessas bandas decorrente de uma atividade cortical relacionada com alta concentrao, processos mentais complexos, atividade motora e qualquer tipo de tarefa cognitiva que exija uma maior concentrao(ERNST
NIEDERMEYER). Na figura 2.2 possvel observar algumas das diferentes faixas de frequncia tpicas do registro eletroencefalogrfico. Como demonstrado, diferentes bandas de freqncias esto relacionadas com diferentes estados mentais. Logo, observar variaes na intensidade dessas bandas pode ajudar a inferir a presena de processos cognitivos especficos subjacentes. Todavia bom ressaltar que as bandas de freqncia no so a nica forma de se retirar informao de um sinal de EEG. Na prxima sesso veremos as formas mais usadas em ICCs.
Figura 2.2: A) Atividade Rpida B) Atividade Misturada C) Atividade Misturada D) Predominncia de alfa (8 at 13 Hz) E) Predominncia de teta (4 at 8 Hz) F) Atividade mista entre teta e delta G) Predominncia de ondas delta (<4 Hz).
2.1.3 ICCs baseadas em EEG Nas sesses anteriores vimos um pouco sobre a gnese do sinal do EEG. Nessa sesso falaremos um pouco sobre o estado-da-arte das ICCs que utilizam o EEG como fonte de informao, dando um enfoque um pouco maior nas que utilizam tarefas mentais para gerar diferenas no sinal de EEG. Alguns pesquisadores da rea(WOLPAW, JONATHAN R et al., 2002) propuseram uma diviso das implementaes de ICCs que utilizam EEG em quatro categorias principais, de acordo com o processo fisiolgico subjacente utilizado. So elas: potencial visual evocado, potencial cortical lento, P300 e ritmos Mu e beta. O potencial visual evocado foi a base da primeira tentativa sistemtica de se desenvolver uma forma de interface entre o crebro e um computador. Durante a dcada de 1970, Jacques props uma implementao que permitia determinar em que ponto o olhar do sujeito est fixado(VIDAL, 1973). Para tanto, Vidal(VIDAL, 1973)(VIDAL, 1977) props registrar o potencial visual evocado (PVE) do sujeito para estmulos visuais que piscavam com freqncias distintas. A lgica do experimento era de que estas freqncias seriam
sincronizadas com o EEG captado no crtex visual, tornando capaz a identificao do objeto para o qual a pessoa estivesse olhando(WOLPAW, JONATHAN R et al., 2002). O potencial cortical lento (SCP, do ingls slow cortical potential) um termo que denomina as freqncias mais baixas captadas pelo EEG, aquelas com perodo de oscilao entre 0,5s e 10,0s. Enquanto SCPs negativas esto ligadas a movimento e outras formas de ativao cortical, as positivas esto relacionadas a uma baixa ativao cortical. H dcadas, vrios estudos tm demonstrado que as pessoas so capazes de controlar esses potenciais. Apesar de suas alteraes lentas serem um fator limitante, assim como o extensivo treinamento necessrio para se aprender a controlar esse tipo de potencial, muitos trabalhos tem sido feitos na rea de ICC utilizando SCP(BIRBAUMER, N. et al., 2000)(WOLPAW, JONATHAN R et al., 2002)(BIRBAUMER, NIELS, 2006). Ao contrrio do potencial visual evocado e do P300 (ver adiante), as ICCs baseadas em SCP no so dependentes de algum estmulo. Isso aumenta o leque de aplicaes em que se pode utilizar essa categoria de interface, j que desta forma o usurio comanda o sistema sem precisar estar respondendo a qualquer tipo de estmulo. Existem algumas formas propostas para se aumentar a velocidade das aplicaes dessas ICCs. Por exemplo, uma maneira das possveis maneiras de se incrementar a velocidade do sistema seria aprimorar a aplicao que controlada pelo SCP, como utilizar um sistema de auto-completar em um programa de soletrar. O P300 recebe esse nome por ser um potencial positivo que surge 300ms aps o estmulo desencadeador. Ao contrrio do potencial visual evocado, o P300 no surge necessariamente com todo e qualquer estmulo, apenas com aqueles que tm algum grau de novidade ou significncia para o sujeito. O P300 mais evidente no crtex parietal e tem seu uso em implementaes de ICCs onde a expectativa do sujeito um fator importante, sendo bastante usado em implementaes de soletradores. Para entender melhor o uso desse potencial em ICCs, vejamos um exemplo de soletrador: uma matriz de MxN caracteres (onde M a quantidade de linhas e N a de colunas) piscaria linha por linha e coluna por coluna, seqencialmente. A interface localizaria a linha pelo potencial gerado no crtex parietal 300ms aps a linha onde est a letra escolhida pelo sujeito piscar. Dessa mesma forma, a coluna seria descoberta, revelando a letra escolhida em, no mximo, M+N passos. Uma vantagem desse mtodo sobre os outros que o P300 no precisa ser aprendido, j que um tipo de resposta cerebral intrnseca em resposta ao aparecimento de um estmulo escolhido ou desejado(WOLPAW, JONATHAN R et al., 2002)(DONCHIN et al., 2000). A quarta e ltima categoria de ICC baseada em EEG so as que utilizam os ritmos Mu e beta. Como mencionado na sesso 2.1.2, a diminuio da intensidade do ritmo mu est muito
ligada ao movimento, real ou imaginrio(DUNTLEY et al., 2001). De forma semelhante, o ritmo beta tambm tende a ter sua potncia reduzida com a presena de um movimento. Na verdade, a realizao de um movimento ou da simples preparao de um movimento gera uma dessincronizao na atividade neuronal, o que reduz a presena dos ritmos Mu e beta. De forma parecida, o fim do movimento, seguido de relaxamento, acaba por gerar uma maior sincronia dessa atividade, o que causa um aumento dos ritmos Mu e beta. Um fato muito importante que a presena de sincronizao ligada a um determinado evento (ERS, do ingls event-related synchronization) e dessincronizao ligada a evento (ERD, do ingls eventrelated desynchronization) no so exclusivas da execuo do movimento, aparecendo tambm na imagtica motora (isto , apenas a imaginao do movimento). E exatamente essa imagtica motora que costuma ser usada nas ICCs desse tipo. Para aprofundar a discusso sobre essa categoria de ICCs interessante falar um pouco sobre a lateralizao das funes cerebrais. No ano de 1863, o cientista francs Pierre-Paul Broca demonstrou que os dois hemisfrios cerebrais no tm as mesmas funes: a rea responsvel pela fala, por exemplo, est localizada no hemisfrio esquerdo da maioria dos pacientes. Quase 150 anos depois, muito j foi descoberto sobre as diferenas funcionais dos dois hemisfrios. Sabe-se que praticamente todas as funes sensoriomotoras so cruzadas, por exemplo. Isso significa que boa parte das entradas sensoriais e todas as sadas motoras de um lado do corpo so recebidas/emitidas pelo hemisfrio contralateral. Muitas das funes cognitivas tambm so especficas de um lado do crebro. Alm da linguagem, vrias competncias cognitivas so representadas preferencialmente em um dos hemisfrios. Vrios trabalhos tm utilizado os conceitos de ERD/ERS e da lateralizao das funes mentais para criar ICCs que se baseiam em tarefas mentais. A idia que cada tarefa mental, por acionar uma regio diferente do crebro (muitas vezes at hemisfrios diferentes), poderiam ser diferenciados entre si com certa facilidade, atravs de mtodos como o EEG. Dessa forma, alm da variao de freqncia resultantes do ERD/ERS, ainda existe o aspecto espacial como parmetro informativo. Diversos trabalhos utilizam apenas a imagtica motora para gerar padres distintos de EEG(HUNG et al., 2005)(REZAEI et al., 2006). Nesses casos, o mais comum usar a imaginao do movimento das mos. Na figura 2.3, possvel ver que a posio da regio do crtex motor que controla o movimento das mos localizada mais lateralmente no hemisfrio cerebral. Essa posio mais lateral permite uma maior resoluo espacial para diferenciar a atividade das mos direita e esquerda (figura 4.1). Existem trabalhos que usam, alm das mos, a imagtica motora dos ps e at da lngua(OBERMAIER
et al., 2001)(KRONEGG et al., 2007)(WOLPAW, JONATHAN R et al., 2002)(GENG et al., 2007). Por fim, ainda h aqueles trabalhos que utilizam outras tarefas mentais no motoras para gerar padres de onda diferenciveis pelo EEG, como por exemplo, tarefas matemticas, de linguagem, at mesmo musicais(LOTTE et al., 2007).
Figura 2.3: Mapa somatotpico do crtex motor primrio.
2.2 Anlise de Componentes Independentes
Figura 2.4: Exemplo de problema resolvvel por ICA.
Em uma festa com muitas pessoas conversando ao redor, ouve-se um rudo resultante da combinao de todas as conversas. Se quisssemos ouvir em separado o que cada pessoa est falando, como faramos para separar a voz de cada um dos presentes? O problema da festa de coquetel um problema clssico de Separao Cega de Fontes (BSS, do ingls Blind Source Separation) e uma das maneiras de resolv-lo atravs da Anlise de Componentes Independentes (ICA, do ingls Independent Component Analysis). Apesar do problema de separao de voz, como o ilustrado acima, ser um dos mais tradicionais na rea de BSS, no o nico tipo de aplicao possvel. Na verdade, as aplicaes so abrangentes ao ponto de englobar coisas como processamento de arranjo de antenas, registros biomdicos multi-sensoriais e anlise de dados do mercado financeiro. Apesar de bem distintas entre si, todas essas aplicaes de ICA fazem suposies estatsticas a respeito das fontes a serem separadas: independncia estatstica mtua das fontes e a nogaussianidade de cada uma dessas. A ltima condio essencial para o funcionamento do algoritmo, enquanto que a primeira vai dificultar a separao apropriada das fontes. Se as fontes forem totalmente independentes, o ICA conseguir separ-las de forma adequada. No entanto, na prtica o ICA buscar fontes o to estatisticamente independente quanto for possvel. O ICA incapaz de determinar a quantidade real de fontes de um ambiente. Ele parte do pressuposto de que existe uma fonte de sinal para cada sensor (ilustrado na figura 2.4 por microfones). Cada entrada de um sensor considerada como sendo uma combinao linear das fontes, como mostrado na equao abaixo. Assim, o conjunto dos registros dos sensores, num determinado instante de tempo, dado pelo produto da matriz de combinao com o vetor s de sinais gerados pelas fontes (equao 2.2). Ento, o que queremos uma matriz de separao W que descubra s, a partir de x. Todavia, como A desconhecido, fica impossvel se descobrir o W exato. O que o ICA faz descobrir uma matriz W* que gere um vetor y que seja o mais prximo possvel de s.
(2.1) (2.2) (2.3) (2.4)
2.3
Anlise de Componentes Principais
Problemas matemticos de alta dimensionalidade (como o proposto neste trabalho) trazem uma gama de dificuldades, como grande custo computacional e impossibilidade de visualizao dos dados. Alm do mais, um alto nmero de dimenses no implica necessariamente numa melhor descrio dos dados, j que algumas podem estar ser redundantes ou apenas irrelevantes. Aplicar um algoritmo de reduo de dimensionalidade resolveria esses problemas, no entanto preciso ter extremo cuidado para no se perder informao relevante. Uma das tcnicas mais utilizadas para isso a anlise de componentes principais (PCA, do ingls Principal Component Analysis). PCA consiste em um procedimento matemtico que usa uma transformao ortogonal de forma a converter um conjunto de variveis possivelmente correlacionadas em um conjunto no correlacionado denominado componentes principais. Ele executa um mapeamento linear de maneira a reduzir a uma quantidade menor de dimenses de tal forma que a varincia desse novo conjunto de dados seja maximizada. A primeira componente ter a maior influncia (varincia), a segunda ter a segunda maior e assim sucessivamente. Idealmente, minimiza-se a perda de informao por reduo de dimensionalidade para um valor desprezvel.
Figura 2.5: Exemplo de uso de PCA.
O clculo das componentes principais feito a partir da matriz de covarincia dos dados. Extraem-se os autovalores e autovetores desta matriz, em seguida ordenando esses ltimos decrescentemente de acordo com os seus autovalores equivalentes (o autovetor do maior autovalor primeiro e assim sucessivamente). feito esse ordenamento para os maiores
p autovetores, onde p a nova dimenso de entrada. Cada valor do novo vetor de entrada ser uma combinao linear do vetor original, onde cada elemento deste vetor multiplicado pelo elemento do autovetor equivalente. Ou seja, cada elemento do novo vetor de entrada ser o produto linear entre o vetor original e o respectivo autovetor. Os componentes da PCA s so garantidamente independentes caso a distribuio conjunta dos dados seja normal. Mas, segundo Jolliffe(JOLLIFFE, 2002), apesar de distribuies multivariadas no-normais no darem uma importncia to grande a linearidade e a covarincia (que tem papel muito importante em PCA), no se deve ignorar a utilidade da aplicao dessa tcnica nesse tipo de situao.
2.4 Redes Neurais Artificiais
Neste trabalho, alm da aquisio do sinal de EEG e processamento do mesmo atravs de PCA e ICA, utilizaremos tambm Redes Neurais Artificiais para realizar a classificao de diferentes padres desse sinal.
2.4.1
Classificao de Padres O reconhecimento de objetos uma tarefa considerada trivial por muitas pessoas. Uma
cobra na mata, por exemplo, associada imediatamente com uma ameaa integridade fsica, independente da cor ou tamanho. Entretanto, implementar essa capacidade de reconhecimento de objetos em mquinas ainda uma tarefa complexa que no est completamente resolvida. Um sistema artificial de reconhecimento de objetos no consegue resolver todas as ambigidades inerentes identificao de objetos em ambientes naturais. Quando tentamos tornar uma mquina capaz de realizar uma tarefa de identificao de objetos, estamos aplicando o conceito de reconhecimento de padres, uma subrea de aprendizado de mquina. O reconhecimento de padres tenta solucionar um grande leque de problemas complexos: desde reconhecimento de fala, at diagnstico mdico, passando por reconhecimento de faces. Um reconhecedor de padro composto por trs mdulos: um sensor que capta os dados brutos para o sistema, um mdulo que extrai as caractersticas (atributos) mais importantes do padro de atributos e, por fim, o algoritmo responsvel por identificar em qual classe ou categoria esse padro de atributos se enquadra (ver figura 3.1). Existe uma grande gama de algoritmos, desenvolvidos ao longo de mais de meio sculo, que
podem ser utilizados para resolver problemas especficos de reconhecimento de padres. Entretanto, essa ainda uma rea em franca expanso na cincia da computao. Existem vrios peridicos e congressos especficos na rea, onde novas aplicaes e solues so propostas. Dentre os mtodos mais comuns podemos destacar os classificadores bayesianos, as rvores de deciso, as mquinas de vetor de suporte e as redes neurais artificiais. Daremos um maior enfoque a este ltimo mtodo nas Sesses 2.2.2 e 2.2.3. possvel dividir os algoritmos usados para reconhecimento (ou classificao) de padres utilizando duas categorizaes distintas. A primeira relacionada ao modo como o sistema aprende a identificar qual a classe correspondente a cada padro. Uma parcela desses algoritmos aprende a tarefa baseado num conjunto de exemplos prvios, para os quais j se sabe a resposta correta, o chamado aprendizado supervisionado (figura 2.6 mais detalhes sobre aprendizado supervisionado na sesso 2.2.2 e 2.2.3). De forma oposta, a mquina em um regime de aprendizado no-supervisionado (figura 2.7) aprende a separar os padres em classes sem ter nenhum exemplo rotulado disponvel. O algoritmo faz suas inferncias baseando-se apenas na semelhana estatstica dos padres de entrada. O segundo tipo de categorizao separa os classificadores em estatstico e estrutural. O primeiro utiliza o preceito de que o que gera o padro um sistema probabilstico, fazendo ento a caracterizao dos padres de maneira adequada a esta premissa. Os classificadores bayesianos so um exemplo de classificador estatstico. J os classificadores estruturais fazem todo o reconhecimento tendo em vista uma inter-relao das caractersticas dos padres. As redes neurais artificiais se enquadram nesse grupo.
Figura 2.6: Modelo de sistema supervisionado.
Figura 2.7: Modelo de sistema no-supervisionado.
2.4.2 Conceitos e contextualizao histrica das redes neurais
Uma rede neural artificial (RNA) um modelo computacional biologicamente-inspirado que procura simular o funcionamento dos neurnios e, a partir disso, resolver problemas complexos. Tambm conhecido simplesmente como redes neurais, esse tipo de sistema baseia-se na premissa de que o crebro soluciona problemas de uma maneira qualitativamente distinta dos computadores eletrnicos. Essa maneira particular do crebro, com vrias unidades simples trabalhando em paralelo, mais do que capaz de resolver problemas que para um computador digital so extremamente complexas. Apesar de uma parte da funcionalidade bsica do crebro ser inata, talvez o mais impressionante desse rgo (especialmente o humano) seja a sua capacidade de reter novas informaes e de aprender a realizar novas tarefas. A unidade bsica de processamento de informao do sistema nervoso o neurnio, que se comunica com outros neurnios atravs da sinapse (ver sesso 2.1). No ano de 1943, McCulloch e Pitts publicaram um artigo com o primeiro modelo matemtico de uma rede neural. Eles mostraram que, com uma quantidade suficiente de neurnios conectados de maneira apropriada e ativados de maneira sncrona, era possvel realizar qualquer funo computvel, a princpio. Esse modelo considerado o ponto de partida das redes neurais artificiais(HAYKIN, 1999). Anos mais tarde, em 1949, Donald Hebb, no seu livro The Organization of Behavior, lanou o postulado do aprendizado, descrevendo como varia a
eficincia sinptica entre neurnios conectados, dependendo da sincronizao de atividade entre os mesmos: o peso sinptico aumenta quando existe uma relao causal entre o disparo de dois neurnios e diminui quando disparam dessincronizadamente. No final da dcada de 1950, com o desenvolvimento da computao, comearam a surgir aplicaes do modelo desenvolvido por McCulloch e Pitts. No ano de 1958, Rosemblatt apresentou uma nova ferramenta para reconhecimento de padres: o perceptron. O perceptron usa muito dos conceitos originais de McCulloch e Pitts (1943), acrescentando a propriedade de aprendizado atravs de alterao dos pesos sinpticos proposta por Hebb.
Figura 2.8: Modelo de perceptron
A figura 2.8 mostra o diagrama esquemtico de um perceptron. Nele, o vetor X representa a camada de entrada (o estmulo da rede), enquanto o vetor W representa os pesos sinpticos, que multiplicam o valor equivalente de entrada (W1 multiplica X1, W2 multiplica X2, etc.). O ajuste desses pesos feito a partir de um algoritmo de aprendizado supervisionado: preciso treinar o perceptron e fazer os ajustes necessrios nos pesos para que a rede aprenda a fornecer a resposta correta. Esses ajustes so realizados comparando a sada desejada com a sada obtida. A equao 2.5 descreve como feita essa atualizao.
(2.5)
Na equao,
(k) indica o j-simo peso, do vetor de pesos W, numa iterao k
qualquer (momento atual). y(k) a sada esperada do sistema, no momento atual, enquanto que f(X(k)) a sada do sistema, gerada por uma funo de ativao que recebe o vetor de entradas X como parmetro. a j-sima posio desse vetor de entrada. Por fim, uma
constante chamada de taxa de aprendizado. Quanto maior o valor dessa taxa, maior a mudana dos pesos em cada iterao. Valores muito grandes podem fazer com que a rede nunca convirja, impedindo-a de chegar ao seu ajuste timo (ou at mesmo a um ajuste satisfatrio). A partir do momento em que a sada considerada satisfatria (ou a quantidade de iteraes chegam a um valor determinado), os pesos sinpticos so fixados e o sistema sai
da fase de aprendizado e vai para a fase de operao. Alguns sistemas, denominados adaptativos, podem jamais sair da fase de aprendizado. Na dcada que seguiu publicao do trabalho de Rosemblatt (1958), muitos outros foram publicados baseados nesse modelo, especialmente classificadores e filtros. Muitas pessoas achavam que as redes neurais eram chaves-mestras capazes de resolver qualquer problema. Mas toda essa empolgao com a ferramenta arrefeceu em 1969, com um livro lanado por Minsky e Papert chamado de Perceptrons. Nesse livro, os autores mostraram que o perceptron era capaz de resolver apenas problemas lineares (ou linearmente separveis, figura 2.9), sendo incapaz de resolver um problema relativamente simples como o do OU exclusivo (XOR), que no - linearmente separvel (figura 2.10)(MARVIN MINSKY, SEYMOUR PAPERT, 1969). A partir do lanamento deste livro, os pesquisadores (e os recursos) comearam a se distanciar das redes neurais. Afinal de contas, a maior parte dos problemas realmente interessantes no-linear, como o prprio funcionamento do crebro.
Figura 2.9: Padro linearmente separvel.
Figura 2.10: Padro no-linearmente separvel.
Esse vcuo de produo cientfica relevante (houve trabalhos importantes com formas alternativas de rede neural, entretanto) na rea das redes neurais artificiais durou apenas at a dcada de 1980. Em 1986, a criao do algoritmo de retropropagao do erro (error back propagation algorithm) possibilitou o surgimento de um novo tipo de rede neural: o perceptron de mltiplas camadas (Multilayer perceptron)(RUMELHART, D.E.;
MCCLELLAND, J.L., 1986). Esse novo tipo de arquitetura de rede tornou possvel a resoluo de problemas mais complexos usando e recolocou essa ferramenta em destaque. Como o foco principal do presente trabalho so as redes perceptron de mltiplas camadas, maiores detalhes sobre o algoritmo de retropropagao do erro e sobre perceptron de mltiplas camadas sero vistos na sesso 2.2.3. Todavia, importante ressaltar que existem muitos outros tipos de redes neurais (supervisionadas e no-supervisionadas) alm daquelas descritas neste captulo.
2.4.3 Perceptron de Mltiplas Camadas
O perceptron de mltiplas camadas (MLP) um modelo de rede neural artificial cuja estratgia de aprendizado supervisionada, ou seja, o ajuste dos pesos feito atravs da correo do erro na sada. Entretanto, as redes MLP possuem uma organizao de camadas bem diferente daquela do perceptron simples (de nica camada), que possui apenas a camada de entrada, representada pelos estmulos que a rede recebe a cada iterao, e a camada de sada, composta pelo perceptron (ou n) de sada. Logo, quando uma sada da rede diferente da desejada, possvel corrigir todos os pesos a partir do valor do erro. Nas MLPs, por outro lado, existe o conceito de camadas de ns (neurnios) ocultos ou internos (Figura 2.11). Essas camadas adicionais so as principais responsveis pela computao do estmulo (camada de entrada), possibilitando a rede realizar clculos mais complexos do que um perceptron nico. Infelizmente, a insero dessas camadas extras torna o ajuste a partir do erro uma tarefa muito mais complexa, uma vez que difcil determinar qual a sada desejada de um n interno. A resoluo desse problema se d atravs do algoritmo de retropropagao do erro (backpropagation).
Figura 2.11: Modelo de perceptron de mltiplas camadas.
2.4.3.1 Algoritmo backpropagation O algoritmo backpropagation tem seu funcionamento dividido em duas fases. Num primeiro momento, a entrada da rede estimula toda a rede at chegar camada de sada. A partir de ento, comea a segunda fase de correo dos pesos (caso a resposta da rede seja incorreta). Inicialmente, ocorre o ajuste dos ns da camada de sada. Esse ajuste idntico ao ajuste feito para um nico perceptron (Equao 2.5) j que, para a camada de sada, possvel medir a diferena sada desejada sada obtida. Na segunda fase do funcionamento, como o prprio nome do algoritmo implica, o erro vai se propagar para as camadas mais internas da rede. O clculo do erro realizado de acordo com a equao abaixo, sendo d k (n) a resposta desejada do n k no instante n e y k (n) a resposta obtida pelo mesmo neurnio no mesmo instante.
e k (n) d k (n) y k (n)
(2.6)
Assim, tendo em mos a definio de erro, podemos calcular a chamada funo de energia ou funo custo, cujo valor queremos minimizar.
(2.7) Sendo I o nmero de neurnios na camada de sada. Agora que temos uma funo de custo, podemos calcular a contribuio de cada peso sinptico para a variao desta funo (Equao 2.8).
(2.8)
Aps uma srie de dedues, e sabendo que um n k qualquer tem como funo de ativao _k(v_k(n)), chegamos equao abaixo.
(2.9)
A partir daqui podemos aplicar a regra delta e descobrir como os pesos sinpticos dos ns que se situam em camadas que no a de sada contribuem para o erro nesta (equao 2.10). importante observar que, para se aplicar o algoritmo da retropropagao, a funo de ativao utilizada deve ser derivvel em todos os pontos(HAYKIN, 1999). (2.10)
3 METODOLOGIA
Figura 3.1: Modelo de Interface Crebro-Computador.
Inmeros pacientes no mundo inteiro sofrem de algum tipo de limitao severa do movimento, que pode surgir de uma leso na coluna cervical, de acidente vascular cerebral no tronco enceflico, de alguma doena degenerativa, como esclerose lateral amiotrfica, e de qualquer outro mal que tenha como conseqncia a paralisia dos quatro membros. Alm da incapacidade de se movimentar e interagir fisicamente com o meio que os cerca, muitos pacientes tem um grau to avanado de paralisia, que at mesmo a capacidade de falar lhes negada. Um caso muito famoso dessa condio o do jornalista francs Jean-Dominique Bauby, que sofreu um acidente vascular cerebral em 1995, tendo seus movimentos voluntrios reduzidos a piscar o olho esquerdo. Mesmo em tais condies, ainda publicou um livro, O Escafandro e a Borboleta, 10 dias antes da sua morte, em 1997, e que foi ditado letra a letra por um cdigo baseado no nico movimento que lhe restou, da plpebra esquerda (JEAN-DOMINIQUE BAUBY, 1997).
Esses pacientes, incapazes de interagir de qualquer maneira com o mundo, mas com capacidades cognitivas plenas, sofrem do que se chama de sndrome do aprisionamento ou do encarceramento. Ao lembrarmos de que uma das mentes mais brilhantes atualmente, o fsico ingls Stephen Hawking, sofre de uma condio muito semelhante a essa, fica muito claro o quanto essas pessoas ainda podem contribuir para a sociedade. Sem mencionar o drama pessoal desses pacientes, cujos pensamentos e vontades esto trancafiados na priso sem muros da mente. preciso libertar esses pacientes dessa condio limitada. E as Interfaces Crebro-Computador so a chave desta priso. Por serem independentes das vias motoras, as ICCs podem ser controladas por pacientes em estado avanado, como Jean-Dominique. O uso desta tecnologia teria permitido ao jornalista redigir sozinho, sem precisar do auxlio de um decodificador humano. Alm disso, com a implementao das funcionalidades adequadas no programa controlado, seria possvel muito mais do que apenas se comunicar, poderia interagir e at controlar uma cadeira de rodas. As ICCs, no entanto, tm uma limitao sria sua massificao: os padres de EEG so muito diferentes de uma pessoa para outra. Logo, para uma ICC ter seu desempenho otimizado, ela precisa ser feita de forma personalizada. Assim, alguns modelos iro funcionar para alguns pacientes, mas no para outros. E, mesmo que seu modelo se aplique, o treinamento do sistema deve ser feito com dados individualizados. O trabalho presente se divide em dois momentos, cada um com objetivos distintos. A primeira parte, que chamaremos de Experimento I, consistiu em uma busca por uma tcnica de pr-processamento que melhorasse o desempenho dos classificadores e de qual seria o melhor tamanho para o janelamento dos dados. Em acrscimo, testamos duas configuraes de perceptron de mltiplas camadas. A segunda fase, que chamaremos de Experimento II, tem um maior enfoque em torno dos classificadores. Nessa fase, buscamos testar outras abordagens de classificao. Em cada um dos experimentos, participaram quatro sujeitos que nunca haviam participado de experimentos do gnero. Todo o processo foi feito off-line, exatamente para serem feitos vrios e combinaes de pr-processamento e classificadores. Maiores detalhes sobre ambos os experimentos sero vistos na sesso 3.1 e 3.2.
3.1 Experimento I
3.1.1 Aquisio de Dados
Para a aquisio do sinal eletroencefalogrfico foi utilizado um aparelho de EEG (BrainNet BNT-36) de 22 canais, com uma frequncia de amostragem de 400 Hz e caractersticas listadas abaixo: 1) Ganho dos Canais: 250. 2) Impedncia de entrada, a qual de 10 M Ohms. 3) Filtro passa faixa: 0.1-100 Hertz. 4) Rejeio de modo-comum: Maior que 90 dB. 5) Cross Talk: Menor que 3 bits (lsb). 6) Resoluo da converso A/D: 16 bits (preciso de 0,3 V); 7) Tipo de converso analgica: Aproximao Sucessiva clssica. 8) Filtro notch em 60 Hz (filtro de rudo de linha).
Figura 3.2: Distribuio dos eletrodos pelo escalpo seguindo o Sistema Internacional 10/20.
A montagem dos eletrodos foi feita de acordo com o sistema internacional 10/20 (figura 3.2) no escalpo de voluntrios saudveis (trs homens destros e um canhoto). O procedimento experimental realizado durante o registro eletrofisiolgico o seguinte: os sujeitos realizaram
3 sesses, com 42 repeties cada, onde cada repetio era composta pela apresentao da tarefa a ser executada (durao de 3 segundos), intervalo para execuo da tarefa (7s) e, por fim, apresentao de uma tela de descanso (2s) (ver figura 3.4). Em cada sesso, as seguintes tarefas eram apresentadas aleatoriamente (14 vezes por tarefa): imaginao de movimento da mo esquerda (L), imaginao de movimento da mo direita(R) e operao matemtica de soma (Sum). Todas as tarefas eram executadas continuamente, a partir de um comando escrito em um monitor de computador, at o aparecimento da tela de descanso. No intervalo entre as sesses, era dado ao sujeito um intervalo de 5 minutos para descanso.
Figura 3.3: Telas mostradas aos sujeitos com as 03 tarefas .
Figura 3.4: Exemplo de trial.
3.1.2 Pr-processamento
Depois de finalizada a fase de aquisio do sinal eletrofisiolgico, iniciou-se a fase de processamento off-line dos dados, realizada integralmente no ambiente do software MATLAB. A primeira etapa desta fase foi o pr-processamento do sinal de EEG, sendo que 06 formas distintas foram testadas: nenhum pr-processamento, apenas ICA, apenas PCA, PCA seguido de ICA (PCA+ICA), seleo manual de eletrodos correlacionados com a tarefa (8CHNL) e essa mesma seleo seguida de ICA (8CHNL+ICA). O objetivo do uso de ICA ampliar a diferena da atividade captada pelos eletrodos, j que muito comum que um eletrodo capte a atividade dos eletrodos vizinhos. O ICA poderia remover essa redundncia e tornar os sinais mais claramente correlacionados com a atividade da sua regio de registro. J o PCA poderia colaborar extraindo os elementos mais relevantes e reduzindo a dimensionalidade do problema, o que poderia facilitar o treinamento do classificador, j que potencialmente reduziria as entradas irrelevantes para o sistema. A combinao de PCA com ICA j naturalmente sugerida pela literatura(HAYKIN, 1999) devido complexidade computacional do ltimo. Alm disso, tnhamos como objetivo tambm combinar os possveis ganhos de uma tcnica com os da outra. Enquanto isso, as selees manuais de eletrodos servem como controle do PCA, afinal, por mais correlacionados que os eletrodos sejam com as trs tarefas escolhidas, o PCA no deve ter desempenho inferior a essa seleo, uma vez que a seleo de atributos feita pelo PCA maximiza a informao, dado que esta seja mais bem descrita pela varincia dos dados. Assim, selecionamos uma quantidade de eletrodos sempre igual quantidade de componentes da PCA. Desta forma, daqui para frente, ao mencionarmos o sinal de EEG, ele no estar se limitando ao sinal bruto, mas ao sinal que passou pelos tipos de pr-processamento descritos acima. 3.1.3 Extrao de Caractersticas Devido s caractersticas intrnsecas do sinal de EEG, decidimos concentrar nossos esforos em abordagens que utilizassem a informao proveniente do espectro de frequncia deste. A extrao de atributos foi feita calculando-se o espectro de potncia (utilizando a funo pwelch() do toolbox de processamento de sinais) dentro de uma janela deslizante de
Hamming, de passo igual a sua largura, contendo 200 amostras (intervalo de 500ms) ou 100 amostras (250ms) de largura para cada um dos canais, durante o intervalo de execuo da tarefa. Em seguida, calculou-se o valor acumulado dessa potncia dentro das cinco bandas fundamentais de EEG: Delta (0.5-4 Hz), Teta (4-7 Hz), Alfa (7-14 Hz), Beta (14-20 Hz) e Gama (20-50 Hz). A abordagem escolhida utiliza simplesmente como padro de entrada a potncia das 05 bandas para os 22 canais de EEG. Assim, cada padro de classificao era composto por, no mximo (caso todas as bandas fossem utilizadas), 110 atributos (22 canais x 05 bandas), todos normalizados segundo a equao 3.1, sendo X i o vetor de dados do i-simo atributo, mdia() a funo que calcula a mdia e std() a funo que calcula o desvio padro desse vetor de dados.
X i (X i - mdia(X i ))/std(Xi )
(3.1)
3.1.4 Classificadores O enfoque principal deste trabalho no era se avaliar comparativamente as diferentes formas de classificao. De maneira que usamos apenas a rede MLP. Duas arquiteturas foram escolhidas de maneira arbitrria: uma camada oculta de 30 neurnios e duas camadas ocultas de 15. O coeficiente de aprendizado usado foi de 0,01 e o mtodo Powell-Beale de gradiente conjugado, devido sua alta velocidade.
3.2 Experimento II
3.2.1 Aquisio de Dados Para a aquisio do sinal eletroencefalogrfico foi utilizado um aparelho de EEG da marca Nihon Kohden de 19 canais, com uma frequncia de amostragem de 1000 Hz e ganho dos canais de 1000. A montagem dos eletrodos foi feita de acordo com o sistema internacional 10/20 (figura 3.2) no escalpo de voluntrios saudveis (dois homens e duas mulheres). O procedimento experimental realizado durante o registro eletrofisiolgico deste experimento foi similar ao executado no Experimento I, com as seguintes diferenas: o acrscimo de uma tarefa, relaxamento de olhos abertos (Rest), totalizando quatro tarefas neste experimento; o aumento tambm da quantidade de sesses, tambm para quatro; por fim, a quantidade de repeties por sesso foi reduzida a 40 (10 repeties por tarefa). Em todos os outros aspectos, o procedimento igual ao proposto na seo 3.1.1.
3.2.2 Pr-processamento Tendo em vista o isolamento das variveis de estudo, no foi feito qualquer prprocessamento especial no sinal. Sendo assim, a extrao de caractersticas foi feita toda em cima do sinal bruto de EEG.
Tabela 3.1: Imagem referente a nova tarefa do Experimento II.
3.2.3 Extrao de Caractersticas No Experimento II procuramos ratificar as concluses obtidas pelo Experimento I. Dessa maneira, foram feitos testes com tamanhos distintos de janela (os mesmos 250ms e 500ms) e com duas combinaes de bandas de freqncias: Alfa+Beta+Gama (ABG) e todas as cinco bandas (ALL). Todavia, como o objetivo apenas reforar os resultados obtidos no experimento anterior, apenas uma pequena quantidade de testes com a janela de 500ms e com as bandas ABG foi feito. Assim, a janela padro de 250ms e a combinao de bandas com todas as cinco. Em todos os outros aspectos foi realizado o mesmo processo de extrao de caractersticas do Experimento I, alterando-se apenas o fato de que so 19 e no 22 canais de EEG. Dessa forma, cada padro de entrada composto por at 95 caractersticas, ao invs dos 110 mencionados anteriormente. 3.2.4 Classificadores
A escolha de um classificador que melhor se adqe aos requisitos do sistema fundamental. Um sistema que precisa ser rpido, no pode ter um processamento muito pesado, enquanto que um sistema crtico necessita de um classificador robusto. As caractersticas dos dados que o desenvolvedor tem em mos outro fator de extrema relevncia para a escolha do algoritmo de classificao. No caso do sistema que desenvolvemos, o tempo de processamento do treinamento pode ser longo, uma vez que se
realizaria off-line. Todavia, seu tempo de processamento da sada ps-treino precisa ser pequeno. Dois classificadores que se encaixam nesse perfil so as redes perceptrons de mltiplas camadas (MLP) e Mquinas de Vetor de Suporte. As redes MLP, descritas na sesso 2.2, operam com um treinamento lento, mas em contrapartida possuem um processamento entrada-sada bastante veloz. Utilizaremos este classificador como base e de forma similar ao utilizado no Experimento I: para separar em todas as quatro classes ou para separar os pares de tarefa. Neste experimento utilizaremos uma nica camada oculta de 30 neurnios, uma vez que no foram achadas diferenas significativas de desempenho com relao a duas camadas ocultas de 15 neurnios (ver sesso 4.1). O coeficiente de aprendizado foi mantido em 0.01, assim como o mtodo Powell-Beale de gradiente conjugado, pelo mesmo critrio de velocidade. De maneira semelhante s redes MLP, as Mquinas de Vetor de Suporte tambm possuem uma lenta fase de treinamento, mas um processamento rpido de entrada-sada. Aqui utilizamos dois tipos de funo de ncleo: kernel linear e kernel RBF (utilizando =3). No entanto, a SVM teve seu uso limitado neste trabalho a uma estrutura de classificao diferente: um classificador hierrquico. O classificador hierrquico, na verdade dois classificadores em sequncia, tem como objetivo final separar entre as quatro tarefas. Todavia, agora este classificador possuir como entrada extra, alm das caractersticas usuais, a sada de um classificador anterior. Esse classificador binrio separa entre duas categorias, cada uma composta por duas tarefas. Desta forma, h, por exemplo, um classificador que separa entre as duas tarefas de imagtica motora e as tarefas de no-imagtica. J a sada deste, ajuda na tarefa do classificador quaternrio de identificar exatamente qual a tarefa sendo executada.
4 RESULTADOS
4.1 Experimento I
Os classificadores ternrios tiveram dificuldades para classificar entre as tarefas (tabela 4.1), de modo que nenhuma das redes ultrapassou os 60% de acerto mdio. Apesar de termos realizado testes para diferentes combinaes de bandas, os melhores resultados foram obtidos quando utilizamos todas as 05. Devido quantidade enorme de redes geradas (mais de uma centena), mostraremos apenas os resultados das combinaes com todas as 05 bandas e a combinao Alfa + Beta (ALL e A+B, respectivamente). Nenhuma das tcnicas de prprocessamento utilizadas ampliou de maneira significativa o desempenho dos classificadores. A nica melhoria real foi a reduo da dimenso do problema usando PCA. A reduo do tamanho da janela de amostragem diminui ligeiramente a taxa de acerto em quase todas as ocasies. Esta pequena reduo normalmente compensada pelo ganho de velocidade da ICC, uma vez que a velocidade do sistema dobra (ver tabela 4.3). Os classificadores binrios mostraram resultados melhores, apesar de nenhum apresentar mais que 75% de acerto (tabela 4.2). O melhor desempenho de classificao normalmente compensa a menor quantidade de tarefas em termos de taxa de transferncia de informao, como pode ser visto na tabela 4.3. Podemos notar tambm a dificuldade que os sistemas tiveram de separar as tarefas de imagtica motora. A nossa hiptese de que a proximidade espacial e o fato da representao da mo estar presente em ambos os hemisfrios possa ter contribudo para isso.
(4.1)
Combinao/Sujeito ALL 500 ALL 250 A+B 500 A+B 250 PCA_ALL 500 PCA_ALL 250 ICA_ALL 500 ICA_ALL 250 PCA+ICA ALL 500 PCA+ICA ALL 250 8CHNL 500 8CHNL 250 8CHNL+ ICA 500 8CHNL+ ICA 250 PCA A+B 500 PCA A+B 250 ICA A+B 500 ICA A+B 250 PCA+ICA A+B 500 PCA+ICA A+B 250 8CHNL A+B 500 8CHNL A+B 250 8CHNL+ICA A+B 500 8CHNL+ICA A+B 250 Combinao/Sujeito LxR 500 LxR 250 LxSum 500 LxSum 250 RxSum 500 RxSum 250
S1 52.3% 51.8% 45.4% 43.9% 37.3% 36.7% 37.5% 38.9% 37.6% 36.8% 43.6% 42.5% 35.1% 37.2% 36.4% 34.4% 35.2% 35.6% 35.1% 35.6% 39.7% 39.4% 34.7% 34.3% S1 59.9% 60.8% 72.7% 67.8% 74.8% 69.7%
S2 40.0% 43.0% 36.1% 39.7% 36.0% 35.8% 40.8% 38.7% 36.8% 38.6% 37.3% 38.3% 38.1% 36.6% 32.9% 35.6% 35.9% 35.1% 35.0% 34.0% 33.5% 33.5% 31.5% 34.5% S2 54.2% 50.8% 60.0% 60.5% 62.6% 62%
S3 40.6% 36.3% 37.2% 38.1% 35.7% 37.4% 35.3% 34.6% 34.0% 35.3% 35.4% 36.6% 32.6% 34.1% 36.9% 34.5% 33.3% 35.1% 33.1% 34.4% 36.2% 34.0% 33.9% 35.1% S3 52.7% 54% 56.3% 60% 58.4% 58.6%
S4 48.8% 47.8% 48.7% 45.3% 33.3% 34.8% 35% 38.6% 37.2% 36.8% 45.1% 46.1% 35.4% 36.9% 34.4% 33.9% 37.2% 36.0% 32.5% 34.7% 44.9% 43.5% 37.5% 36.0% S4 52.4% 52.2% 66.3% 62.5% 66.3% 64.4%
Tabela 4.1: Desempenho dos classificadores ternrios.
Tabela 4.2: Desempenho dos classificadores binrios.
Apesar da taxa de acerto ser a forma mais usual de mensurar a qualidade de um classificador, no caso das ICCs, no a melhor forma de medir a sua eficincia. Wolpaw e colaboradoress. (WOLPAW, J.R. et al., 1998) sugeriram outro parmetro: taxa de transferncia de informao, que calculada de acordo com a equao 4.1. Onde V a velocidade da ICC (2 para a janela de 500ms e 4 para a de 250ms), N o nmero de tarefas e P a taxa de classificao correta. Com exceo de S3, todos os sujeitos obtiveram ao menos um sistema com taxa mdia dentro do esperado pela literatura: 10-25 bits/minuto (tabela 4.3, em azul). Inclusive, duas combinaes do sujeito S1 obtiveram valores acima do esperado (tabela 4.3, em azul e negrito).
Combinao/Sujeito ALL 500 ALL 250 A+B 500 A+B 250 PCA_ALL 500 PCA_ALL 250 ICA_ALL 500 ICA_ALL 250 PCA+ICA ALL 500 PCA+ICA ALL 250 8CHNL 500 8CHNL 250 8CHNL+ ICA 500 8CHNL+ ICA 250 PCA A+B 500 PCA A+B 250 ICA A+B 500 ICA A+B 250 PCA+ICA A+B 500 PCA+ICA A+B 250 8CHNL A+B 500 8CHNL A+B 250 8CHNL+ICA A+B 500 8CHNL+ICA A+B 250 LxR 500 LxR 250 LxSum 500 LxSum 250 RxSum 500 RxSum 250
S1 13.3 25.5 5.9 8.5 0.9 1.1 1.2 3.0 1.0 1.4 5.0 6.3 0.3 0.9 0.6 0.6 0.7 1.0 0.6 0.8 1.8 3.2 0.3 0.4 3.9 9.1 19.2 22.6 23.1 29.2
S2 2.0 7.5 0.9 3.3 0.6 0.8 3.0 3.1 1.0 2.7 1.0 1.9 1.1 2.0 0.6 0.9 0.8 0.9 0.9 1.2 0.4 0.4 0.7 0.4 1.2 0.7 4.1 8.8 7.0 10.4
S3 2.5 4.2 0.9 2.6 1.2 1.9 0.8 0.5 0.2 1.0 1.5 0.9 0.5 0.3 0.7 0.9 0.6 0.5 0.2 0.5 0.5 0.6 0.5 0.9 1.1 2.0 2.0 7.2 2.9 6
S4 8.9 15.6 9.2 10.9 0.1 0.7 0.6 2.9 0.9 1.6 6.1 12.8 0.9 0.6 0.3 0.0 0.9 1.2 0.4 1.1 5.1 8.2 1.5 1.0 0.6 2.0 10.3 11.7 10.3 15.2
Tabela 4.3:Taxa de transferncia de informao para o Experimento I.
4.2 Experimento II
O acrscimo de uma tarefa neste experimento em nada facilitou a tarefa de separao de padres. Em complemento ao Experimento I, realizamos dois testes com os dados obtidos: variao do tamanho da janela de amostragem e um subconjunto de bandas. No caso das
janelas, utilizamos os mesmos dois tamanhos do Experimento I: 250ms e 500ms. No caso das bandas de frequncia, utilizamos, alm de todas as 05 bandas, o subconjunto composto por alfa, beta e gama (ABG). Como pode ser visto na Tabela 4.4, os resultados obtidos com uma janela maior (500ms) foram piores para todos os sujeitos, quando no caso de todas as bandas, ou foram piores ou estatisticamente equivalentes no caso de trs bandas. Com relao reduo de bandas, o desempenho de todos os classificadores foi pior do que seu equivalente com as cinco (05) bandas, corroborando, dessa forma, o que foi visto durante o Experimento I.
Combinao/Sujeito NICC01 ALL 250 ALL 500 ABG 250 ABG 500 36.4% 34.7% 31.2% 24.3%
NICC02 34.7% 31.5% 26.9% 27.8%
NICC03 30.1% 28% 25.9% 26.1%
NICC04 29.2% 25.5% 25.6% 24.3%
Tabela 4.4: Classificadores Quaternrios.
Prosseguindo com a aplicao das estratgias de classificao adotadas no Experimento I, utilizamos classificadores binrios para separar as entradas relativas a cada par de tarefas. Podemos ver aqui uma dificuldade ainda maior de separao entre os padres das tarefas do que observado no primeiro experimento. Nenhuma das combinaes, em nenhum dos sujeitos, conseguiu um valor mdio de classificao maior do que 65%.
Combinao/Sujeito LxR 250 LxSum 250 LxRest 250 RxSum 250 RxRest 250 SumxRest 250
NICC01 61.7% 62.5% 61.0% 61.5% 59.8% 64.4%
NICC02 59.8% 59.2% 60.4% 60.8% 61.2% 61.9%
NICC03 55.4% 51.2% 59.9% 57.8% 56.3% 61.9%
NICC04 54.4% 56.1% 56.8% 53.6% 54.1% 54.8%
Tabela 4.5: Classificadores Binrios.
Os resultados aqum do esperado durante esta primeira fase do Experimento II nos incentivaram a buscar uma nova abordagem de classificao. A estratgia escolhida foi uma estratgia hierrquica seqencial, na qual temos dois classificadores, o primeiro binrio e o seguinte quaternrio, treinados separadamente, mas onde a sada do classificador binrio treinado utilizada como entrada adicional no quaternrio. Para o classificador binrio, cada
classe uma combinao de duas tarefas. Assim, temos trs separadores possveis: L+R x Sum+Rest, L+Sum x R+Rest e L+Rest x R+Sum. Utilizamos trs classificadores binrios distintos: MLP, SVM com kernel linear e SVM com kernel RBF.
Combinao/Sujeito L+R x Sum+Rest (Bin) MLP L+R x Sum+Rest (Quat) MLP L+Sum x R+Rest (Bin) MLP L+Sum x R+Rest (Quat) MLP L+Rest x R+Sum (Bin) MLP L+Rest x R+Sum (Quat) - MLP L+R x Sum+Rest (Bin) LIN L+R x Sum+Rest (Quat) LIN L+Sum x R+Rest (Bin) LIN L+Sum x R+Rest (Quat) LIN L+Rest x R+Sum (Bin) LIN L+Rest x R+Sum (Quat) - LIN L+R x Sum+Rest (Bin) RBF L+R x Sum+Rest (Quat) RBF L+Sum x R+Rest (Bin) RBF L+Sum x R+Rest (Quat) RBF L+Rest x R+Sum (Bin) RBF L+Rest x R+Sum (Quat) - RBF
NICC01 NICC02 NICC03 NICC04 56.0% 57.9% 55.3% 53.2% 35.6% 34.3% 31.5% 30.3% 59.5% 57.0% 56.7% 54.1% 35.2% 33.8% 29.6% 27.8% 58.1% 57.9% 54.1% 54.4% 35.5% 34.2% 30.1% 28.9% 56.2% 56.5% 56.6% 55.7% 36.0% 35.1% 32.2% 28.6% 59.2% 56.9% 58.6% 55.7% 35.6% 33.8% 32.0% 29.6% 58.1% 56.9% 53.3% 54.3% 35.5% 34.1% 31.7% 27.7% 61.9% 66.9% 57.1% 56.1% 38.7% 39.9% 31.5% 29.4% 63.8% 66.0% 59.6% 55.5% 41.1% 46.2% 34.0% 31.7% 61.3% 64.8% 58.9% 54.3% 41.3% 46.8% 36.0% 31.2%
Tabela 4.6: Desempenho dos classificadores hierrquicos. Bin e Quad, entre parnteses, indicam se o resultado do classificador binrio ou do quaternrio. Ao lado, indicado qual o classificador binrio utilizado: MLP, para a rede MLP, LIN, para SVM com kernel linear e RBF, para SVM com kernel RBF.
Na Tabela 4.6 possvel ver uma melhora no desempenho dos classificadores quaternrios operando no sistema hierrquico com relao aos resultados dos classificadores quaternrios puros (Tabela 4.4). Isso fica mais claro quando utilizamos a mtrica anteriormente mencionada de taxa de transferncia de informao, alterando o N para quatro quando classificador for quaternrio. Na Tabela 4.7 vemos todas as estratgias testadas no Experimento II, comparadas em termos dessa mtrica. De forma semelhante, na tabela abaixo foram destacados em azul todas as combinaes que possuem valor mdio de taxa de transferncia maior ou igual a 10 bits/min, em azul e negrito as duas combinaes do sujeito NICC02 que ultrapassaram o limite superior esperado de 25 bits/min e em vermelho as interfaces que no conseguiram atingir o limiar dos 10 bits/min. No Experimento II, assim como no Experimento I, apenas um nico sujeito, no caso o NICC04, no teve nenhuma interface com taxa de transferncia de informao dentro da faixa esperada. A abordagem hierrquica gerou os melhores classificadores para todo e cada um dos sujeitos, apesar de algumas vezes no haver diferena significativa com determinadas
combinaes. Vemos claramente como o uso das SVMs, em especial com o kernel RBF, melhorou sensivelmente o desempenho para todos os quatro sujeitos. Combinao/Sujeito ALL 250 ALL 500 ABG 250 ABG 500 LxR 250 LxSum 250 LxRest 250 RxSum 250 RxRest 250 SumxRest 250 L+R x Sum+Rest (Bin) MLP L+R x Sum+Rest (Quat) MLP L+Sum x R+Rest (Bin) MLP L+Sum x R+Rest (Quat) MLP L+Rest x R+Sum (Bin) MLP L+Rest x R+Sum (Quat) - MLP L+R x Sum+Rest (Bin) LIN L+R x Sum+Rest (Quat) LIN L+Sum x R+Rest (Bin) LIN L+Sum x R+Rest (Quat) LIN L+Rest x R+Sum (Bin) LIN L+Rest x R+Sum (Quat) - LIN L+R x Sum+Rest (Bin) RBF L+R x Sum+Rest (Quat) RBF L+Sum x R+Rest (Bin) RBF L+Sum x R+Rest (Quat) RBF L+Rest x R+Sum (Bin) RBF L+Rest x R+Sum (Quat) - RBF NICC01 NICC02 NICC03 NICC04 12.0 8.4 3.1 2.3 4.2 2.4 0.9 0.4 3.8 0.7 1.0 0.1 0.5 0.8 0.2 0.5 11.5 8.6 2.6 2.2 12.0 6.9 1.1 3.8 9.8 8.6 7.6 3.7 9.9 8.9 5.2 2.3 7.4 9.0 3.6 1.8 15.2 11.4 10.2 2.6 2.8 4.7 2.1 1.0 9.9 8.0 4.3 3.1 6.8 3.5 3.8 1.7 9.6 7.2 2.8 1.7 4.9 5.0 1.5 1.7 10.0 7.5 2.9 1.7 2.8 3.1 3.4 2.4 10.6 9.3 4.9 1.4 6.1 3.7 5.4 2.7 10.0 7.0 4.5 2.2 5.0 3.8 1.1 1.8 9.9 7.4 4.7 1.0 10.4 20.5 3.8 3.0 15.9 18.7 3.9 2.2 13.7 18.1 6.5 2.4 21.9 7.3 4.1 36.5 9.6 15.5 5.7 1.6 22.2 10.5 3.7 38.8
Tabela 4.7: Taxa de transferncia de informao para o Experimento II.
Neste captulo mostramos os diversos resultados que obtivemos com os experimentos realizados. Os experimentos tiveram como objetivo analisar o sistema proposto, primeiro analisando as tcnicas de pr-processamento e depois os mtodos de classificao atravs da utilizao de MLPs e SVM. Notamos que as tcnicas de pr-processamento tem papel fundamental para a diminuio da complexidade computacional da RNA, enquanto que a abordagem com as SVMs obtiveram o melhor resultado.
5 CONCLUSO
O problema da identificao de padres em sinais eletroencefalogrficos uma tarefa difcil em sistemas artificiais. Tanto isso verdade, que a taxa de classificao mais alta obtida por qualquer tipo de classificador testado neste trabalho inferior a 75% de acerto. Boa parte desta dificuldade se deve a baixa qualidade do sinal de EEG, com uma relao sinal/rudo prxima de zero e at mesmo negativa. Com essa grande quantidade de rudo, com grande parcela de rudo branco (em todas as freqncias), identificar as variaes sutis das ondas cerebrais no um problema trivial. Apesar disso, considerando a mtrica sugerida de taxa de transferncia de informao, o nosso trabalho foi bem-sucedido em propor sistemas capazes de identificar as tarefas mentais realizadas em ambos os experimentos. Com relao ao Experimento I, no foi possvel implementar uma estratgia de prprocessamento ou seleo do conjunto de entrada (reduo da quantidade de bandas ou eletrodos) para reduzir o grau de dificuldade da tarefa de separao de padres. Na verdade, boa parte das abordagens testadas reduziu significativamente o desempenho do classificador. Uma possvel justificativa para a seleo de bandas ter piorado o desempenho dos classificadores a existncia de informao correlacionada s tarefas distribuda pelas cinco bandas fundamentais do EEG, de modo que o aumento da presena de uma banda de alta freqncia diminuiria a presena de bandas de freqncia mais baixas. A remoo de eletrodos de regies no diretamente ligadas s tarefas tambm pode estar removendo informao correlacionada com as tarefas. No entanto, so necessrias investigaes
adicionais para chegar a alguma concluso a esse respeito. No que diz respeito s tcnicas de pr-processamento utilizadas, uma possvel razo para o seu no funcionamento a relao sinal/rudo. possvel que uma baixa razo sinal/rudo esteja atrapalhando o melhor funcionamento do PCA e do ICA. O Experimento II teve como principal objetivo testar uma abordagem inovadora no contexto das Interfaces Crebro-Computador: a classificao hierrquica. No entanto,essa
estrutura, por utilizar dois classificadores (no nosso melhor caso SVM com kernel RBF seguido de MLP) agrava o problema da sintonia dos parmetros, que j existe em classificadores como SVM e MLP. Identificar quais parmetros deveriam ser utilizados de modo a otimizar o desempenho do sistema, por mais importante que seja, foge do propsito e escopo deste trabalho. No entanto, pode haver um caminho promissor nessa linha de investigao. Podemos concluir que este trabalho cumpriu seus objetivos, tendo achado, de forma exploratria, abordagens em que o sistema estivesse ao menos dentro da faixa esperada de 1025 bits/min.Em trs combinaes ns tivemos 75% dos sujeitos dentro dessa faixa: RxSum 250, durante o Experimento I, e SumxRest 250 e L+Rest x R+Sum (Quat) RBF, ambos no Experimento II.Tendo em vista que nos dois experimentos houve sujeitos (um em cada) cujos desempenhos jamais atingiram essa faixa, devido provavelmente a uma baixa razo sinal/rudo, podemos afirmar a funcionalidade dos sistemas propostos para todos os sujeitos, desde de que o sinal possua uma razo sinal/rudo satisfatria.
REFERNCIAS BIBLIOGRFICAS
BIRBAUMER, N.; KBLER, A.; GHANAYIM, N. et al. The thought translation device (TTD) for completely paralyzed patients. IEEE Transactions on Rehabilitation Engineering: A Publication of the IEEE Engineering in Medicine and Biology Society , v. 8, n. 2, p. 190193, 2000. BIRBAUMER, NIELS. Brain-computer-interface research: Coming of age. Clinical Neurophysiology, v. 117, n. 3, p. 479483. doi: 10.1016/j.clinph.2005.11.002, 2006. CARMENA, J. M.; LEBEDEV, M. A.; CRIST, R. E. et al. Learning to Control a Brain Machine Interface for Reaching and Grasping by Primates. PLoS Biol, v. 1, n. 2, p. e42. doi: 10.1371/journal.pbio.0000042, 2003. DONCHIN, E.; SPENCER, K. M.; WIJESINGHE, R. The mental prosthesis: assessing the speed of a P300-based brain-computer interface. IEEE Transactions on Rehabilitation Engineering: A Publication of the IEEE Engineering in Medicine and Biology Society , v. 8, n. 2, p. 174179, 2000. DUNTLEY, S. P.; KIM, A. H.; SILBERGELD, D. L.; MILLER, J. W. Characterization of the mu rhythm during rapid eye movement sleep. Clinical Neurophysiology, v. 112, n. 3, p. 528531. doi: 10.1016/S1388-2457(00)00559-9, 2001. ERNST NIEDERMEYER. Historical Aspects. Electroencephalography: Basic Principles, Clinical Applications and Related Fields. p.1-16. Baltimore MD: Lippincott Williams & Wilkins, 2005. ERNST NIEDERMEYER. The Normal EEG of the Waking Adult. Electroencephalography: Basic Principles, Clinical Applications and Related Fields . p.167-192. Baltimore MD: Lippincott Williams & Wilkins. ERNST NIEDERMEYER. Sleep and EEG. Electroencephalography: Basic Principles, Clinical Applications and Related Fields. p.193-208. Baltimore MD: Lippincott Williams & Wilkins. GENG, T.; DYSON, M.; TSUI, C. S. L.; GAN, J. Q. A 3-class asynchronous BCI controlling a simulated mobile robot. Conference Proceedings: ... Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE Engineering in Medicine and Biology Society. Conference, v. 2007, p. 25242527. doi: 10.1109/IEMBS.2007.4352842, 2007. HAYKIN, S. Neural networks: a comprehensive foundation. 2o ed. Upper Saddle River N.J.: Prentice Hall, 1999. HUNG, C.-I.; LEE, P.-L.; WU, Y.-T. et al. Recognition of Motor Imagery Electroencephalography Using Independent Component Analysis and Machine Classifiers. Annals of Biomedical Engineering, v. 33, n. 8, p. 1053-1070. doi: 10.1007/s10439-0055772-1, 2005. JEAN-DOMINIQUE BAUBY. Le scaphandre et le papillon. Paris: Vintage International, 1997. JOLLIFFE, I. Principal component analysis. 2o ed. New York: Springer, 2002.
KANDEL, E. Principles of neural science. 4o ed. East Norwalk Conn. ;Hemel Hempstead: Appleton & Lange;;Prentice Hall, 1999. KRONEGG, J.; CHANEL, G.; VOLOSHYNOVSKIY, S.; PUN, T. EEG-Based Synchronized Brain-Computer Interfaces: A Model for Optimizing the Number of Mental Tasks. Neural Systems and Rehabilitation Engineering, IEEE Transactions on , v. 15, n. 1, p. 5058. doi: 10.1109/TNSRE.2007.891389, 2007. LEBEDEV, M. A.; NICOLELIS, M. A. L. Brain-machine interfaces: past, present and future. Trends in Neurosciences, v. 29, n. 9, p. 536546. doi: 10.1016/j.tins.2006.07.004, 2006. LOTTE, F.; CONGEDO, M.; LCUYER, A.; LAMARCHE, F.; ARNALDI, B. A review of classification algorithms for EEG-based braincomputer interfaces. Journal of Neural Engineering, v. 4, n. 2, p. R1-R13. doi: 10.1088/1741-2560/4/2/R01, 2007. MAK, J. N.; WOLPAW, J.R. Clinical Applications of Brain-Computer Interfaces: Current State and Future Prospects. IEEE Reviews in Biomedical Engineering. doi: 10.1109/RBME.2009.2035356, 2010. MARVIN MINSKY, SEYMOUR PAPERT. Perceptron: An Introduction to Computational Geometry. Cambridge, MA: MIT Press, 1969. OBERMAIER, B.; NEUPER, C.; GUGER, C.; PFURTSCHELLER, G. Information transfer rate in a five-classes brain-computer interface. IEEE Transactions on Neural Systems and Rehabilitation Engineering: A Publication of the IEEE Engineering in Medicine and Biology Society, v. 9, n. 3, p. 283288. doi: 10.1109/7333.948456, 2001. REZAEI, S.; TAVAKOLIAN, K.; NASRABADI, A. M.; SETAREHDAN, S. K. Different classification techniques considering brain computer interface applications. Journal of Neural Engineering, v. 3, n. 2, p. 139-144. doi: 10.1088/1741-2560/3/2/008, 2006. RUMELHART, D.E.; MCCLELLAND, J.L. Parallel distributed processing: explorations in the microstructure of cognition. Volume 1. Foundations. Cambridge, MA: MIT Press, 1986. SWARTZ, B. E.; GOLDENSOHN, E. S. Timeline of the history of EEG and associated fields. Electroencephalography and Clinical Neurophysiology, v. 106, n. 2, p. 173-176, 1998. VIDAL, J. J. Toward direct brain-computer communication. Annual Review of Biophysics and Bioengineering, v. 2, p. 157180. doi: 10.1146/annurev.bb.02.060173.001105, 1973. VIDAL, J. J. Real-time detection of brain events in EEG. Proceedings of the IEEE, v. 65, n. 5, p. 633641, 1977. WOLPAW, JONATHAN R. Braincomputer interfaces as new brain output pathways. The Journal of Physiology, v. 579, n. Pt 3, p. 613619. doi: 10.1113/jphysiol.2006.125948, 2007. WOLPAW, J.R.; RAMOSER, H.; MCFARLAND, D.J.; PFURTSCHELLER, G. EEG-based communication: improved accuracy by response verification. IEEE Transactions on Rehabilitation Engineering, v. 6, n. 3, p. 326-333. doi: 10.1109/86.712231, 1998. WOLPAW, JONATHAN R; BIRBAUMER, NIELS; MCFARLAND, DENNIS J; PFURTSCHELLER, GERT; VAUGHAN, T. M. Brain-computer interfaces for communication and control. Clinical Neurophysiology: Official Journal of the International Federation of Clinical Neurophysiology, v. 113, n. 6, p. 767791, 2002.

Dissertacao Andre Freitas

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Dissertacao Andre Freitas

Uploaded by

Copyright:

Available Formats

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PS-GRADUAO EM ENGENHARIA

Interface Crebro-Computador: uma abordagem exploratria

Andr Freitas Barbosa

Natal, Fevereiro de 2012

Um sistema inteligente de classificao de sinais de EEG para Interface-Crebro Computador

Andr Freitas Barbosa

Fundamentao Terica .................................................................................................... 10 2.1.1 2.1.2 2.1.3 2.2 2.3 2.4

2.4.1 2.4.2 2.4.3 3 3.1

Referncias Bibliogrficas ........................................................................................................ 45

FIGURA 2.1:DEMONSTRAO DA INFLUNCIA DO SINAL CAPTADO DECORRENTE DE DIFERENTES

FIGURA 2.1 DEMONSTRAO DA INFLUNCIA DO SINAL CAPTADO DECORRENTE DE DIFERENTES

Figura 1.1: Diviso das ICCs segundo forma de registro

1.2 Objetivos e contribuies buscadas no trabalho

1.3 Organizao do texto

Figura 2.3: Mapa somatotpico do crtex motor primrio.

2.2 Anlise de Componentes Independentes

Figura 2.4: Exemplo de problema resolvvel por ICA.

(2.1) (2.2) (2.3) (2.4)

Anlise de Componentes Principais

Figura 2.5: Exemplo de uso de PCA.

2.4 Redes Neurais Artificiais

Figura 2.6: Modelo de sistema supervisionado.

Figura 2.7: Modelo de sistema no-supervisionado.

2.4.2 Conceitos e contextualizao histrica das redes neurais

Figura 2.8: Modelo de perceptron

(k) indica o j-simo peso, do vetor de pesos W, numa iterao k

Figura 2.9: Padro linearmente separvel.

Figura 2.10: Padro no-linearmente separvel.

2.4.3 Perceptron de Mltiplas Camadas

Figura 2.11: Modelo de perceptron de mltiplas camadas.

Figura 3.1: Modelo de Interface Crebro-Computador.

Figura 3.3: Telas mostradas aos sujeitos com as 03 tarefas .

Figura 3.4: Exemplo de trial.

Tabela 3.1: Imagem referente a nova tarefa do Experimento II.

Tabela 4.1: Desempenho dos classificadores ternrios.

Tabela 4.2: Desempenho dos classificadores binrios.

Tabela 4.3:Taxa de transferncia de informao para o Experimento I.

NICC02 34.7% 31.5% 26.9% 27.8%

NICC03 30.1% 28% 25.9% 26.1%

NICC04 29.2% 25.5% 25.6% 24.3%

Tabela 4.4: Classificadores Quaternrios.

NICC01 61.7% 62.5% 61.0% 61.5% 59.8% 64.4%

NICC02 59.8% 59.2% 60.4% 60.8% 61.2% 61.9%

NICC03 55.4% 51.2% 59.9% 57.8% 56.3% 61.9%

NICC04 54.4% 56.1% 56.8% 53.6% 54.1% 54.8%

Tabela 4.5: Classificadores Binrios.

Tabela 4.7: Taxa de transferncia de informao para o Experimento II.

You might also like