You are on page 1of 8

MODELO MATEMTICO PARA A TEORIA COGNITIVISTA DOS FENMENOS MENTAIS

Paulo Franca Bandel (IC)1 & Marcos Antonio Botelho

Labmat

Laboratrio de Matemtica Experimental Departamento de Matemtica Instituto Tecnolgico de Aeronutica 12.228-900 So Jos dos Campos SP Brazil bandel@h8.ita.br botelho@mat.ita.br

RESUMO Este trabaho apresenta a construo de uma formalizao matemtica que permite interpretar as correntes behaviorista e cognitivista em termos da teoria da realizao cannica da Teoria de Controle de Sistemas Lineares. Em particular, aqui mostrado que a representao de aspectos externos e comportamentais em termos de estados internos implica no conexionismo, ou seja, no crebro como um emaranhado de redes neurais. ABSTRACT This work presents the construction of a mathematical formalization that allows one to interpret behaviorism and cognitivism in terms of a canonical realization from the Linear Systems Control Theory. In particular, it is shown that the representation of external and behavioral aspects in terms of internal states implies connectionism, that is, the mind as a manifold of neural networks.

Palavras-chave: Controle; realizao; fenmenos mentais. 1 INTRODUO Este trabalho procura aplicar mtodos da teoria de controle de sistemas lineares para abordar questes bsicas sobre o modelamento de funes cerebrais e prover um fundamento sistmico-teortico para contribuirmos no debate de algumas questes polmicas antagonizadas pelas escolas behaviorista e cognitivista de psiclogos. Em ltima anlise, porm, nossa proposta apresentar um modelo matemtico que nos permita representar aspectos relevantes de qualquer tipo de objeto de processamento de informaes que possa desempenhar atividades funcionais tais como, por exemplo, lembrar estmulos externos ou executar instrues para atividades como andar, ver e falar. Na primeira metade do sculo XX, a atitute behaviorista para livrar-se dos impasses de uma viso dualista mente-corpo foi eliminar toda noo de mente, estados mentais e representaes mentais do foco das investigaes tericas e concentrar somente nos padres
0 1

Trabalho feito em iterao com o Departamento de Matemtica e Fsica da Universidade de Taubat. Bolsista do PIBIC/CNPq.

de estmulo-resposta dos comportamentos observveis. Mais recentemente, uma proposta advogada por pesquisadores em Cincias Cognitivas tem sido considerar que um estado mental pode ser denido por suas relaes causais com outros estados mentais, e que tais estados mentais podem ser realizados por muitos sistemas. Em funo destes aspectos gerais das duas escolas, parece-nos bastante natural, no presente estudo, representar a posio behaviorista atravs de um formalismo calcado nas relaes de entrada-sada em sistemas de controle. Por outro lado, a proposta cognitivista pode ser representada atravs da descrio interna de sistemas de controle envolvendo a noo de estado, alm das de entrada e de sada. Com isto, estaremos aqui usando o teorema da realizao da teoria matemtica de sistemas para comparar estas duas vises e explorar o formalismo introduzido para abordar vrias questes sobre os processos do conhecimento e as inevitveis consideraes sobre as limitaes desta abordagem matemtica. Em linhas gerais, nosso problema ser o de, a partir da representao externa de um comportamento inteligente atravs de padres observveis de estmulo-resposta, fazer corresponder uma descrio em termos de relaes causais de estados internos que explique ou seja compatvel com a representao externa. Para uma representao matemtica do problema, vamos concentrar a abordagem em termos da teoria de sistemas lineares com evoluo temporal discreta. Para a representao externa, a maneira como as respostas (ou sinais de sada) dependem dos estmulos (ou sinais de entrada) pode ser descrita por uma relao de entrada/sada (ou estmulo/resposta) expressa por um terno = (; ; f ), onde e so espaos vetoriais de dimenso nita e f uma aplicao f : ! . Supondo que temos um objeto processador de informaes L; um padro de estmulo-resposta de L representado pela seqncia BL = f(ut ; yt+1 )g, para t = 0; 1; 2; ::: u ! L ! y O comportamento externo do objeto L descrito pela aplicao de estmulo/resposta f : ! 2 7! 2 onde a seqncia de entrada (estmulo) ! = fuo ; u1 ; u2 ; :::g; ! 2 ; ui 2 U; e a de sada (resposta) = fy1 ; y2 ; y3 ; :::g; 2 ; yi 2 Y:Estaremos assumindo que o modelo interno em termos dos estados cognitivos ser descrito por meio de um sistema invariante no tempo, linear, de dimenso nita, com tempo discreto denido por uma tripla fU; X; Y g de espaos vetoriais reais de dimenso nita e uma tripla de transformaes lineares (matrizes, em ltima anlise) A; B; C tais que xt+1 = Axt + But ; xt=0 = xo (1) yt = Cxt Com isto, o problema bsico de realizao em espaos cognitivos pode nalmente ser colocado de maneira mais precisa nos seguintes termos: Dado um padro de estmulo-resposta BL associado com uma descrio externa de L = (; ; f; U; Y ), achar um modelo interno = (X; A; B; C ) tal que BL = B , onde B o padro de estmulo-resposta de : No que segue, estaremos abordando este problema, num estudo calcado em Casti[1] e Fuhrmann[2]. 2. REALIZAO CANNICA DE SISTEMAS LINEARES Um nmero innito de modelos podem satisfazer o requisito acima. Por este motivo, precisamos estabelecer um critrio para selecionar dentre esta innidade de candidatos, aquele que satisfaz os requisitos de uma maneira melhor, em algum sentido. A tal modelo timo daremos o nome de modelo cannico. Portanto, a realizao cannica caracterizada por um modelo interno cujo espao de estados no contm elementos irrelevantes para um padro de estmulo-resposta B .

Vamos assumir que o espao de entradas constitudo de seqncias de vetores de Rm , enquanto o espao de sadas constitudo de seqncias de vetores de Rp . Mais precisamente, = f(u0 ; u1 ; u2 ; :::; uN ) ; ui 2 Rm ; N < 1 ; para algum N 2 Ng; = f(y1 ; y2 ; y3 ; :::) ; yi 2 Rp g:
t1 X yt = Pti ui ; t = 1; 2; 3; :::; i=0

(2) (3)

A funo f : ! , por sua vez, ser representada atravs da relao de entrada-sada: (I/O)

Assim, dada a aplicao f , tem-se determinada a seqncia BL = fP1 ; P2 ; P3 ; :::g e temos, portanto, o isomorsmo f = fP1 ; P2 ; P3 ; :::g. Feitas as consideraes de linearidade, temos que uma realizao de f consiste na construo de um espao vetorial n-dimensional X (que, sem perda de generalidade, tomaremos X = Rn ) e as matrizes reais A; B e C de ordens nxn, nxm e pxn, respectivamente. Este espao X representa o espao de estados do sistema, relacionado com os espaos de entrada e sada atravs das equaes dinmicas: xt+1 = Axt + But yt = Cxt ; xo = 0; ()

com Pj so matrizes pertencentes a Rpxm : Pode-se comprovar esta relao observando que a seqncia de entrada ! = (uo ; u1 ; u2 ; :::uN ) transformada na seqncia de sada = (y1 ; y2 ; y3 ; :::) atravs da matriz triangular inferior de Toeplitz: 2 3 P1 0 0 0 ::: 6 P2 P1 0 0 ::: 7 6 7 T = 6 P P P 0 ::: 7 ; Pi 2 Rpxm : 2 1 4 3 5 . . . . . . . . .

com xt 2 X; ut 2 Rm ; yt 2 Rp . Assim, dada uma seqncia de entradas ! 2 , vemos que gera uma sada 2 . Se, para todo instante t, o par de entrada e sada (ut ; yt+1 ) de estiver coerente com o par (ut ; yt+1 )I/O dado pela matriz T e as relaes de I/O citadas, ser caracterizado como um modelo interno para a descrio de I/O de f . Devese, ento, obter uma relao que ligue a descrio de entrada-sada dada pela seqncia fP1 ; P2 ; P3 ; :::g com a descrio de variveis de estado de dada pelas matrizes A; B e C . fcil ver que este ser o caso se e somente se Pt = CAt1 B; 8 t = 1; 2; 3:::, uma condio que indica a identidade de comportamentos de f e . Entretanto, h innitos sistemas satisfazendo esta relao, de forma que necessitamos de condies adicionais que nos d um critrio para escolhermos de maneira inequvoca um modelo, o qual chamaremos de modelo cannico, dentre esta innidade de candidatos: Denio (i) Dado qualquer modelo = (X; ; h; xo ) , dizemos que completamente alcanvel se para cada estado x 2 X , existe uma seqncia de entrada ! 2 e um tempo T tal que xT = x . Isto , ! transfere o estado do sistema de xo (t=0) para x (t=T). (ii) Dado qualquer modelo = (X; ; h; xo ) , dizemos que completamente observvel se cada estado inicial xo pode ser identicado somente a partir de seqncia de entrada do sistema e da observao da sada yt em um intervalo 0 < t T . (iii) cannico se ele , simultaneamente, completamente observvel e completamente alcanvel. Assim, temos os seguintes resultados, cujas provas podem ser encontradas nos livros usuais da Teoria de Controle ou lgebra Linear (ver, por exemplo, Fuhrmann[2]).

Teorema da alcanabilidade: Um estado x 2 Rn alcanvel a partir da origem para o sistema se e s se x uma combinao linear de colunas das matrizes B; AB; A2 B; : : : ; An1 B . Corolrio. n (i) Todo estado (i.e. , completamente alcanvel) se e s se a x 2 R 2 alcanveln matriz D = B j AB j A B j j A 1 B possui posto n. (ii) Se um estado x 2 Rn alcanvel, ento no alcanvel em mais do que n passos. (iii) Os estados alcanveis constituem um subespao vetorial de Rn , isto , se x; y 2 Rn so alcanveis, ento os estados x + y so todos alcanveis para todos os reais e . Teorema da observabilidade: Um estado inicial x0 2 Rn no observvel pelo sistema se e s se xo est contido no T ncleo da matriz = C CA CA2 CAn1 . Corolrio. (i) Os estados no-observveis formam um subespao de Rn . (ii) completamente observvel se e s se o posto de n, i.e., ker = f0g: Finalmente, a existncia do modelo cannico garantida pelo seguinte Teorema da Realizao. Dada uma funo de entrada-sada f : ! , sempre existe um modelo cannico = (A; B; C ) tal que BL = B . Alm disso, o modelo nico dentro de uma mudana de coordenadas no espao de estados de dimenso innita em questo. Este resultado pode ser expresso em termos cognitivos: Teorema da Cognio. Dado um padro de estmulo-resposta BL ; sempre existe um modelo cognitivo com um comportamento dado por B tal que BL = B . Alm disso, este modelo cognitivo nico. 3 A METFORA DINMICO-SISTMICA DO CREBRO Essencialmente, o que estabelecemos foi uma equivalncia abstrata entre as escolas behaviorista e cognitivista, usando como ferramenta a realizao cannica da teoria de sistemas lineares discretos e assumindo o postulado bsico de que as informaes dadas pelo padro de comportamentos B so exatas. Por um lado, isto traz algumas conseqncias interessantes: primeiro, que apenas o cognitivismo dentre estas escolas pode eventualmente conduzir a uma teoria causal do comportamento inteligente e, segundo, que este processo de interiorizao das relaes de estmulo e comportamento observvel resulta numa representao conexionista, em termos de redes neurais, para o crebro. Por outro lado, existem vrias limitaes relevantes: neste nvel de descrio, a dinmica do crebro deve ser melhor modelada por sistemas em tempo contnuo e no discreto; o modelo deixa totalmente em aberto a questo da mente, ou seja, de eventos mentais como sentimentos, pensamentos, percepo, dor, prazer, etc.; e a hiptese sobre a linearidade do modelo no corresponde ao carter extremamente no-linear da dinmica do crebro. Porm, levando em considerao que, no balano entre os resultados e as limitaes, pudemos encontrar uma representao matematicamente formalizada e precisa do cognitivismo que, embora trazendo profundas limitaes como metfora para o crebro humano, pelo menos permite vislumbrar alguma relevncia em aplicaes na rea de inteligncia articial. Vamos agora abordar alguns dos pontos acima. Primeiro, podemos adotar um postulado mais geral de unicidade expresso da seguinte forma, que chamamos de princpio da unicidade:

Se as informaes B so exatas e completas, h um nico sistema cannico que representa as informaes dadas. O termo completo signica simplesmente que os dados B surgiram de um sistema pertencente a uma classe de sistemas a partir dos quais buscamos um modelamento. Neste caso, est-se tratando dos sistemas lineares. Desta forma, conclumos que todos os modelamentos timos de B so isomrcos, independentemente de sua origem linear ou nolinear. Entretanto, a exigncia de exatido nos dados fundamental, conforme podemos ver na seguinte situao. Suponhamos que as informaes B consistem de pares (t; xt ) para t = 1; 2; 3; :::; N . Neste caso, a classe de sistemas a dos polinmios, ou seja, o objetivo encontrar um polinmio p tal que p(t) = xt ; t = 1; 2; 3; :::; N . Um modelo timo consiste, aqui, simplesmente no polinmio p de menor grau satisfazendo esta condio. De nosso estudo, segue que o teorema da realizao para este problema a chamada frmula de interpolao de Lagrange para as informaes B. Assim, tem-se a frmula: p (t) =
N X Y z xt xt xt xj t=1 t6=j

Embora no seja evidente que p representa a realizao tima, possvel provar esta assertiva utilizando algumas ferramentas bsicas. A condio de que B completo trivialmente satisfeita desde que para um determinado N assume-se em princpio que as informaes so geradas por um polinmio. A condio de isomorsmo igualmente satisfeita se observarmos que o fato de p estar de acordo com as informaes dadas determina o coeciente dominante do polinmio em questo. Portanto, existe um nico polinmio timo que est concordando com B. Entretanto, caso as informaes no sejam fornecidas de forma exata, o panorama muda. Suponhamos, por exemplo, que tomemos uma quantidade muito grande de pontos (por exemplo, um milho) que esto de acordo exatamente com uma curva do quarto grau, mas no com qualquer curva de grau superior. Utilizando a frmula de Lagrange para modelar estas informaes, obteremos um polinmio de grau 4. Introduzindo uma perturbao extremamente pequena nas informaes, a frmula de Lagrange nos conduzir a um polinmio de grau 106 em um novo modelo. Isso ocorre porque esta frmula utilizada muito sensvel a pequenos rudos nas informaes dadas. Assim, a complexidade do modelo p neste caso de informaes contendo rudo depende de N . Agora, vamos abordar a tese subjacente do trabalho. Se tentarmos dar uma caracterizao de alguma forma mais explcita dos elementos do espao de estados X , ir transparecer uma informao que podemos expressar como a seguinte tese implcita no que foi aqui desenvolvido: Uma teoria causal do comportamento inteligente implica no conexionismo (i.e., o crebro, ou a mquina inteligente, como um emaranhado de redes neurais). Vejamos. At aqui, os elementos do espao de estados X foram caracterizados simplesmente como pontos do espao Rn . Para uma melhor interpretao deste modelamento, devemos investigar de maneira mais profunda os estados. Um estado x 2 X representa uma codicao da entrada ! em sua forma mais compacta, sendo ainda consistente com a gerao de uma sada segundo a funo de entrada-sada f . Assim, pode-se armar que cada estado corresponde a uma classe equivalente de entradas. Neste caso, considera-se que duas entradas ! e ! 0 so equivalentes se geram a mesma sada regradas por f , ou seja, ! !0 se e s se f (! ) = f ( ! 0 ). Assim, a codicao ! 7! x = [! ]f pode ser vista como o caminho atravs do qual o sistema memoriza a entrada ! . Mas com o que se parece uma operao de codicao? A maneira mais simples de se visualizar esta

operao representar formalmente cada entrada ! como um polinmio de grau N . Desta forma, recordando que ! = (u0 ; u1 ; u2 ; :::; uN ); ui 2 Rm ; N < 1, vamos identicar o vetor ! com o polinmio: ! $ u0 + u1 :z + u2 :z 2 + ::: + uN :z N = ! (z ) Convm observar que, nesta representao, z apenas um smbolo indeterminado cujo papel o de funcionar como um marcador de tempo para a entrada ! . Desta forma, o smbolo z t corresponde ao tempo t em que a entrada ut aplicada no sistema. Consideremos, agora, a matriz A que representa a estrutura interna. Utilizando a identicao entre as seqncias de entrada e polinmios, temos o isomorsmo Rm [z ], ou seja, o isomorsmo entre e o conjunto dos polinmios com coecientes em Rm . Seja A (z ) o polinmio mnimo de A, ou seja, o polinmio no-nulo de menor grau possvel tal que A (A) = 0. Da teoria elementar de matrizes, temos que A (z ) um divisor do polinmio caracterstico de A, que ser de grau n se A 2 Rnxn . Da, segue que deg A (z ) n. Um resultado, cuja demonstrao foge do escopo deste trabalho mas pode ser encontrada na literatura, diz que x = [! ]f 2 mod A (z ). Em outras palavras, x o resto da diviso do polinmio vetorial ! pelo polinmio escalar A (z ). O ponto mais importante a ser notado deste desenvolvimento diz respeito ao fato da codicao ser determinada unicamente pela matriz A. Desta maneira, diferentes realizaes iro codicar diferentemente as entradas e, portanto, teremos diferentes espaos de estado X . Portanto, o espao de estados no uma parte intrnseca ao comportamento observado do sistema. Ele apenas uma construo matemtica para prover uma maneira de lembrar os estmulos numa forma conveniente para gerar as respostas correspondentes. A coisa ca mais interessante ainda se examinarmos pictorialmente a estrutura da realizao cannica desenvolvida em nosso estudo, mostrada na gura 1.

Figure 1: As inmeras conexes paralelas da realizao em estados internos. Nesta gura, os blocos representados por bij e cij representam, respectivamente, os elementos das matrizes B e C , e os blocos representados por (zI Ai )1 consistem em decomposies de A na forma cannica de Jordan, ou seja: A = diag (A1 ; A2 ; :::; Aq )

O que mais digno de nota nesta gura o elevado grau de interconectividade entre os diversos elementos constituintes do modelo, o que prova nossa tese. Para nalizar, vamos encarar a incmoda constatao de que o modelo construdo para fundamentar nossas consideraes no campo da cognio linear, quando, na verdade, uma caracterstica bsica do crebro que ele uma estrutura marcadamente complexa e no-linear. No nvel da realizao, a equivalncia entre o comportamento B e o modelo cannico f no depende da linearidade da aplicao de entrada-sada f . A hiptese da linearidade permite que o espao de estados cannico possa ser descrito por meio de um dispositivo matemtico bem simples, que so os polinmios, mas a equivalncia em si poderia ser estabelecida sob hipteses mais fracas em f . Portanto, pelo menos neste nvel, a questo da linearidade acaba no sendo to incmoda assim. No nvel dinmico, a constatao de que alguns fenmenos complexos podem ser descritos por sistemas determinsticos e relativamente simples como o caso dos autmatos celulares e sistemas caticos poderia ser animadora para, pelo menos em princpio, supor que padres complicados poderiam surgir de um emaranhado de blocos lineares ou quase lineares (em algum sentido). Apesar disso, nossa convico a este respeito que a dinmica cerebral precisaria realmente ser descrita atravs de unidades no lineares. Portanto, neste nvel no temos nenhuma desculpa. No nvel da aproximao, podemos considerar nossa construo como sendo uma aproximao linear para um fenmeno de natureza no-linear. Aqui, temos duas sadas. Por um lado, um fato conhecido da teoria de sistemas lineares que qualquer comportamento f razoavelmente suave pode ser aproximado por um processo bilinear com preciso arbitrria. Da, os mesmos problemas aqui endereados poderiam ser abordados para o caso de sistemas bilineares. Por outro lado, podemos complementar uma realizao cannica linear com um estudo de robustez da estabilidade do equilbrio, uma vez que temos razes para supor que a dinmica dos modelos representativos das redes neurais interessante perto de equilbrios. Por exemplo, podemos tentar explicar a correspondncia do reconhecimento de um determinado aspecto de uma gura ambgua com a dinmica perto de equilbrios atratores; ou obter resultados de memorizao de informaes em organizaes sinpticas em sistemas perto de bifurcao de Hopf, quando o equilbrio passa a ser repulsor e surge um ciclo limite atrator. REFERNCIAS [1] Casti,J.L.: Reality rules. Picturing the world in mathematics. Vol. II. John Wiley & Sons, 1992. [2] Fuhrmann,P.A.: A polynomial approach to linear algebra. Springer, 1996.

You might also like