You are on page 1of 21

ANLISE DE MODELOS DE REDES NEURAIS APLICADOS AO PROCESSO CHUVADEFLVIO NO SEMI-RIDO

Carlos Henrique Ribeiro Lima 1 & Walter Martins Ferreira Filho2

Resumo - No presente trabalho analisada a performance de diversos modelos de Redes Neurais Artificiais (RNA) aplicados ao processo chuva-deflvio. As diversas configuraes de RNA's so obtidas com a variao do nmero de ns na camada de entrada, na camada intermediria e pela variao do nmero de anos usado para o treinamento e para a validao da rede. Os testes dos modelos foram realizados com dados de precipitao e deflvio no posto da Fazenda Cajazeiras, no Estado do Cear. O deflvio mensal previsto a partir de dados de precipitao dos meses anteriores e corrente e em alguns modelos utilizando tambm o deflvio de meses anteriores. Os resultados mostram a grande influncia que tem a configurao da rede neural e o nmero de anos de treinamento e de validao nos resultados obtidos para previso do deflvio mensal na bacia hidrogrfica.

Abstract - In this work is analized the performance of several models of artificial neural networks (ANN's) applied to the process rainfall-runoff. The diverses configurations of ANN's are obtained with the diversous numbers of nodes in the input layer, in the hidden layer and by the variation of the number of years used for the training and the validation of the algorithm. The model's tests were realized with the measurements from precipitation and flow at the Fazenda Cajazeiras, in the State of Cear. The mensal runoff is predicted with the data from precipitation of the past and present months and in some models utilizing also the runoff from the past months. The results shown the large influence in the results of the forecast of the mean flow from the watershed by the configuration and the number of years of training and validation of the neural network.

Palavras-chave - Redes Neurais Artificiais, Modelos Chuva-Deflvio, Previso de Deflvio.

Universidade Federal do Cear - Departamento de Engenharia Hidrulica e Ambiental - Campus do PICI - Bloco 713, altos, Fortaleza-CE. Tel.: (0xx85) 288-9623 e (0xx85) 257-2194 - Residncia . E-mail : beberibe@mail.com 2 Universidade Federal do Cear - Departamento de Engenharia Hidrulica e Ambiental - Campus do PICI - Bloco 713, altos, Fortaleza-CE. Tel.: (0xx85) 288-9623 . E-mail : walter@ufc.br
XV Simpsio Brasileiro de Recursos Hdricos 1

INTRODUO Um modelo que relaciona a precipitao numa dada bacia hidrogrfica e a consequente vazo gerada no exutrio da bacia, doravante denominado modelo chuva-deflvio (ou chuva-vazo), de extrema importncia no processo de avaliao de projetos de recursos hdricos, pois, na maioria dos casos, o tamanho das sries histricas de vazo relativamente curto, enquanto as sries histricas de medio de precipitao so de tamanho razoavelmente bons. Verifica-se tambm a ausncia de medies de vazo (e em alguns casos de precipitao) em certos meses das sries histricas, tambm chamadas de falhas. Esses problemas so bastante verificados na regio Nordeste do Brasil. Alm de tudo isso, mesmo quando se dispes de dados razoveis de precipitao, o conjunto de pares de medio precipitao-vazo ainda relativamente curto para parametrizao de modelos clssicos chuva-deflvio. Assim, modelos chuva-deflvio que produzem resultados acurados para sries histricas curtas so de grande valia e utilidade em hidrologia. Acredita-se que o processo chuva-deflvio extremamente no-linear, varivel no tempo, espacialmente distribudo, e no facilmente descrito por modelos simples. Assim, duas aproximaes tem sido bastante exploradas na literatura de forma a modelar o processo: A modelagem "Conceitual" (Fsica) e a modelagem do tipo "Caixa-Preta" (Black Box). Modelos conceituais so designados para aproximar dentro das estruturas chuva-deflvio os sub-processos gerais internos e os mecanismos fsicos que governam o ciclo hidrolgico. Normalmente tais modelos incorporam formas simplificadas de leis fsicas, e so geralmente, nolineares, invariantes no tempo e determinsticos, com parmetros que so caractersticas representativas da bacia hidrogrfica. So referidos como sendo confiveis na previso dos pontos mais importantes do hidrograma, como o incio da curva de ascenso, o tempo e a altura da vazo de pico, e o volume do escoamento. Contudo, a implementao e a calibrao de tais modelos apresentam normalmente vrias dificuldades, requerendo sofisticadas ferramentas matemticas, quantidades significativas de dados de calibrao, alm de um certo grau de esperteza e experincia com o modelo. Em situaes onde as dificuldades dos modelos conceituais se agravam, e o interesse no est em entender o processo hidrolgico, mas numa aplicao prtica, como previso de vazes, em que o objetivo principal com predies acuradas em locais especficos de bacias hidrogrficas, os hidrologistas e demais profissionais da rea normalmente preferem utilizar modelos do tipo caixapreta. Em tais modelos, diferentes equaes ou modelos de equaes diferenciais so usados para identificar um mapeamento direto entre entrada e sada, sem consideraes detalhadas da estrutura interna do processo fsico. Nos modelos caixa-preta tradicionais, devido a uma enorme fragilidade na identificao da estrutura no-linear do processo e na estimao de parmetros, pouco se tem desenvolvido nos
XV Simpsio Brasileiro de Recursos Hdricos 2

ltimos anos. Por outro lado, a aproximao sistemtica, em geral, e a anlise funcional no-linear, em particular, so tidos como percusores de um novo tipo de renascena, em virtude das novas ferramentas de trabalho desenvolvidas. Como exemplo, tem-se as redes neurais artificiais (RNA) e os algoritmos genticos. Entretanto, esses modelos no substituem de forma alguma os modelos fsicos conceituais do processo chuva-deflvio, sendo alternativas viveis em aplicaes hidrolgicas onde a previso acurada de vazo necessria e se dispe apenas de dados de entrada e sada para as sries temporais e pouco conhecimento conceitual relativo da dinmica hidrolgica da bacia hidrogrfica sobre investigao. Uma RNA uma estrutura matemtica no-linear, capaz de representar processos complexos arbitrrios e no-lineares, que relacionam a entrada e a sada de qualquer sistema. O sucesso com que RNA's tem sido usadas para sistemas dinmicos em outros campos da Cincia e Engenharia, sugere que a aproximao por RNA um efetivo e eficiente caminho para modelar o processo chuva-deflvio em situaes onde o conhecimento explcito dos sub-processos hidrolgicos internos no necessrio. Aplicaes de RNA so vistas tambm em previses climticas, problemas de gua subterrnea e previso de temperaturas mdia do ar. Este artigo consiste numa aplicao prtica de redes neurais artificiais, onde so previstos os deflvios mensais no posto da Fazenda Cajazeiras, no Estado do Cear. O presente rio caracterizado como intermitente e apresenta um alto coeficiente de variao, sendo ideal para a aplicao e anlise de modelos. A srie histrica analisada contm dados da precipitao mensal na bacia e da vazo mensal no exutrio, compreendidos entre o perodo de Janeiro de 1963 e Dezembro de 2000. O parmetro de entrada dos modelos consiste em dados de precipitao e deflvio. Os dados de precipitao correspondem precipitao no ms analisado e em meses anteriores. O deflvio corresponde aos meses anteriores ao analisado. A influncia na performance dos modelos investigada pela variao de trs parmetros: o nmero de anos usado na calibrao do modelo ( ou fase de treinamento); o nmero e o tipo dos parmetros usados na entrada do modelo e a variao do nmero de ns na camada intermediria, que representa um parmetro interno do modelo.

REDES NEURAIS ARTIFICIAIS (RNA's) A noo de redes neurais, a partir de meados da dcada de 40, foi motivada pela velocidade e eficincia com que o crebro humano processa informaes. Matematicamente, redes neurais so sistemas de processamento de informaes para modelar o crebro como computao paralela, segundo Freitas (1999) e Minns e Hall (1996).

XV Simpsio Brasileiro de Recursos Hdricos

Uma rede neural artificial (RNA) composta por um grande nmero de unidades interconectadas de processamento (ns), arranjadas numa camada de entrada (Input Layer), numa camada de sada (Output Layer ou Grossberg Layer), e em uma ou mais camadas ocultas (Hidden Layer). Cada camada consiste de vrios ns. Dois tipos de redes neurais so comumente usados em problemas de mapeamento de padres: a Rede Perceptron Acclica (ou sem realimentao) de Multicamadas ( Feed-Foward Multilayer Perceptron Network - MPL ) e a Rede de Contra Propagao ( Counter Propagation Network - CPN ) . A Figura 1, baseada no esquema apresentado por Smith e Eli (1995), mostra a estrutura de uma rede neural acclica de 3 camadas, utilizada no presente trabalho. Neste tipo de rede a informao flui em uma direo, de modo que, ao ser processada por um elemento processador, no retorne a ele.

Figura 1: Configurao de uma Rede Neural de 3 camadas

Um sinal de entrada, consistindo de um vetor de nmeros, Xi , introduzido nos ns da camada de entrada, como mostrado na Figura 1. Os sinais so carregados ao longo das coneces para cada n da camada seguinte, e podem ser amplificados ou inibidos por meio de pesos Wij , associados a cada coneco. Os ns dessa camada adjacente (camada intermediria) agem como um somatrio dos sinais de chegada ponderados pelo peso. O sinal de chegada, Sj , em um dado n j , pode ser expresso pela equao:

S j = Wij X i ,
i =0

(1)

XV Simpsio Brasileiro de Recursos Hdricos

onde L o nmero de ns na camada de entrada, W0j o peso " bias ", e X0 = 1 o " bias ", que neste caso no pode ser considerado como sinal de entrada. A Figura 2 representa os sinais de entrada em um n j.

Figura 2: Entrada e sada em um dado n

O sinal Sj ento passado atravs de uma funo de transferncia para produzir o sinal de sada Oj do n j. A funo de transferncia utilizada neste trabalho a funo Sigmoid logstica, dada por:
Oj = 1 1+ e
( S j )

(2)

onde Sj pode apresentar qualquer valor, mas Oj limitado no intervalo [0,1]. A funo de transferncia Sigmoid escolhida por convenincia matemtica, pois possui limites inferiores e superiores, monoticamente crescente e contnua e diferencivel em todo ponto. O sinal de sada subsequentemente carregado ao longo das coneces ponderadas at a camada seguinte de ns, e o processo repetido at que o sinal atinga a camada de sada. O sinal de sada pode ser interpretado como a resposta da RNA um dado estmulo de entrada. No caso de se utilizar 3 camadas, o sinal de chegada Sk para um dado n k na camada de sada, dado por: S k = Wik Oi ,
i =0 M

(3)

onde M o nmero de ns na camada intermediria, W0k o peso " bias ", e O0 = 1 o " bias ".
XV Simpsio Brasileiro de Recursos Hdricos 5

O sinal de sada final ser ento:

Ok =

1 . 1 + e ( Sk )

(4)

Note que no presente estudo tem-se apenas um n na camada de sada, que representa o deflvio previsto para um dado ms t , portanto k = 1. Matemticos tem mostrado que uma RNA de multicamadas acclica tem a incrvel capacidade de serem "aproximadores universais de funes ". Hecht-Nielsen (1987), provou que uma RNA de trs camadas contm todos os requisitos para ser um mapeador de funes universais, e qualquer funo multivariada pode ser aproximada por uma RNA que tenha somente um nmero finito de ns na camada intermediria. Esse resultado chamado de teorema de Kolmogorov da existncia de redes neurais mapeadoras. Estudos recentes tambm mostraram que uma RNA de trs camadas acclica, que faz uso da funo de transferncia Sigmoid, pode implementar qualquer mapeamento de funes multivariadas contnuas e delimitadas. Esses resultados demonstram que uma RNA de 3 camadas pode ser usada para modelar relaes funcionais reais desconhecidas ou pouco definidas, e bastante complexas, como o caso do processo chuva-deflvio.

Fase de Treinamento

Assim como ocorre na modelagem conceitual de processos reais, a modelagem por meio de redes neurais tambm requer uma fase de calibrao (ou parametrizao). Este procedimento conhecido como "treinamento da rede neural" (Network Training), onde os parmetros do modelo so representados pelos pesos W. A RNA pode ser treinada para produzir respostas de sada conhecidas ou esperadas para um dado estmulo de entrada. Primeiramente so atribudos valores randmicos para os pesos Wij e Wjk interconectados. Em seguida introduzido um sinal padro p na entrada, e o valor de sada Opk calculado. Esse sinal de sada comparado com o valor de sada Tpk esperado. O erro total Ep , baseado na diferena quadrtica entre a sada prevista e a esperada para o padro p, calculado como: E p = (T pk O pk ) 2 ,
k =1 N

(5)

onde N=1 para o modelo aqui utilizado.

XV Simpsio Brasileiro de Recursos Hdricos

O objetivo do processo de treinamento apresentar um nmero P suficiente de pares padres nicos de entrada e sada, que quando acoplados com uma metodologia que corrige a cada iterao os pesos interconectados, produza um conjunto final de pesos que minimize o erro global, E , definido como:
E = Ep.
p =1 P

(6)

No presente artigo, P representa o nmero total de meses usados no treinamento.

Na prtica, qualquer um de vrios critrios pode ser adotado para finalizar o processo de treinamento. Uma tolerncia pode ser selecionada com base na magnitude do erro global, E , ou nos erros padres individuais, Ep , ou ainda o processo pode ser finalizado aps um certo nmero de iteraes. Independente do critrio de parada, precaues devem ser tomadas para no "supertreinar" a RNA, podendo resultar numa reduo de sua habilidade de generalizar. O "supertreinamento" pode ser comparado com memorizao rotativa, que resulta numa tima performance com pares padres usados no treinamento, mas numa performance significativamente baixa com padres que no so apresentados no treinamento. Neste trabalho o ajuste dos pesos interconectados durante a fase de treinamento emprega um mtodo bastante conhecido e utilizado, chamado de Erro Retro-propagado (Error Backpropagation), primeiramente formulado por Rumelhart et al. (1986). Aps a atribuio de valores aleatrios para os pesos, o padro apresentado na entrada propagado at a camada de sada (Foward-propagation) , onde calculado o erro entre a sada real e a sada desejada de cada elemento processador, dado pela Equao (5). Este erro ento propagado de volta (Backward Propagation) por meio dos respectivos pesos das coneces, at atingir a camada de entrada. Matematicamente, cada peso, Wyz , ajustado pela frmula:

W yz + pW yz ,

(7)

onde pWyz a mudana nos pesos interconectados entre as camadas arbitrrias y e z para o padro p, e pode ser expressado por: pW yz = pz O py , (8)

onde a razo de aprendizado, pz o termo do erro associado ao neurnio z para o padro p, e Opy a sada do neurnio conectado a camada anterior y para o padro p. O valor absoluto dos pesos

XV Simpsio Brasileiro de Recursos Hdricos

individuais no pode ser interpretado como tendo algum significado fsico profundo (Minns (1995)). O termo pz calculado diferentemente, dependendo se o mesmo est associado com um neurnio na camada de sada k, ou com um neurnio na camada intermediria j. O resultado na forma final para cada termo do erro para a rede neural de trs camadas mostrada na Figura 1, dado por:

pk = (1 O pk )O pk (T pk O pk )

(9)

para neurnios na camada de sada k, e

pj = (1 O pj )O pj pk W jk
k

(10)

para os neurnios na camada intermediria j.

O prximo par padro entrada-sada apresentado, e os pesos das coneces so reajustados para minimizar o novo erro. Nesse sentido, o algoritmo de retro-propagao pode ser visto como sendo da forma gradiente descendente (gradient descent), pois encontra o mnimo valor da funo erro multi-dimensional. Este procedimento repetido at que todos os dados de treinamento tenham sido aplicados. O processo global ento reiniciado, comeando mais uma vez pelo primeiro par entrada-sada, e continuado at que o erro para todos conjuntos de dados seja suficientemente pequeno e ajustes subsequentes nos pesos no influenciem mais neste erro. A razo de aprendizado deve ser ajustada, inicialmente, para pequenos valores, com o objetivo de evitar oscilaes na correo dos pesos durante o treinamento. No modelo aqui apresentado, usado uma razo varivel, conforme descrito em Math Works (2001). Inicia-se com uma razo baixa, e, a partir da segunda iterao, desde que o novo erro calculado seja menor que o erro da iterao anterior, a razo aumentada por um fator 1,05. Caso o erro seja superior ao anterior (normalmente por um fator de 1,04), os novos pesos e "bias" so descartados, e a razo diminuda de um fator 0,7. Para melhorar a velocidade e o desempenho do processo de treinamento, foi usado aqui o algoritmo de treinamento de Levenberg-Marquardt, apresentado em Math Works (2001). O algoritmo consiste numa tcnica numrica de otimizao em que a matriz Hessiana no computada no clculo da velocidade de treinamento de segunda ordem. Quando a funo objetivo tem a forma de soma de razes quadradas (como no treinamento de redes neurais acclicas), a matriz Hessiana pode ser aproximada por:
XV Simpsio Brasileiro de Recursos Hdricos 8

H = J T J,

(11)

e o gradiente pode ser calculado como: g = J T e, (12)

onde J a matriz Jacobiana que contm as primeiras derivadas do erro da rede neural com relao aos pesos e "bias", e e o vetor erro da rede. A matriz Jacobiana pode ser calculada por um tcnica padro de retro-propagao que bem menos complexa que o clculo da matriz Hessiana.

O nmero de pares padro entrada-sada requeridos na fase de treinamento altamente dependente do sistema a ser modelado. Widrow (1989), recomenda um conjunto de dados de tamanho igual a 10 x L (Dez vezes a dimenso do padro de entrada) como ponto inicial. Aqui foram testados seis diferentes nmeros para o conjunto padro entrada-sada, correspondendo a 5, 10, 15, 20, 25 e 30 anos de treinamento. Aps toda essa fase, a RNA dita como tendo "aprendido" a relao entre o conjunto dos dados de entrada-sada, estando pronta para ser validada, onde novos valores de entrada so utilizados, e os resultados da sada so comparados com os desejados, sem que haja modificaes nos pesos.

Consideraes sobre a normalizao da srie histrica

Pelas prprias caractersticas da funo de transferncia Sigmoid, os dados de entrada e sada devem ser normalizados entre o intervalo [0,1]. Entretanto, na maioria dos mtodos de normalizao, como a diviso dos valores pelo mximo observado no grupo, duas dificuldades principais so bastante encontradas: i) A convergncia lenta, e o processo de aprendizado ineficiente se os dados de sada conterem valores prximos de zero ou um, conforme reportaram Ooyen e Nichhuis (1992). ii) Quando no se conhece o processo sobre investigao, o melhor estimador do comportamento do mesmo a magnitude observada, o que restringe o mximo valor que possa ser previsto a ser o mximo valor presente no conjunto de treinamento, ou seja, extrapolaes no so permitidas. Entretanto, apesar de no ser formidvel, extrapolaes na vizinhana dos limites muitas vezes so essenciais. Dessa forma, adota-se aqui a normalizao sugerida por Sajikumar e Thandaveswara (1999), onde, alm dos valores na vizinhana [0,1] serem evitados, extrapolaes num certo limite so permitidas.

XV Simpsio Brasileiro de Recursos Hdricos

Os valores de entrada e esperados so normalizados num intervalo FMIN e FMAX , ao invs de zero e um (FMIN > 0 e FMAX < 1), tal que: X n = FMIN + ( X u fact _ min) ( FMAX FMIN ), ( fact _ max fact _ min) (13)

onde Xu e

Xn

representam a varivel a ser normalizada e o seu valor normalizado,

respectivamente, fact_max e fact_min so os valores mximo e mnimo presentes no vetor X.

Os valores adotados como FMIN e FMAX devem ser tomados de tal forma que no reduzam o intervalo a um valor pequeno que possa influenciar o treinamento, ou ainda permitam um grande intervalo de interpolao. No presente artigo foram selecionados os valores FMIN = 0,1 e FMAX = 0,9, como indicados por Hsu et al. (1995).

SRIE HISTRICA UTILIZADA

Os dados de vazo mensal utilizados foram coletados do posto Fazenda Cajazeiras, localizado na Bacia do Rio Acara, no Semi-rido Cearense. Os dados de precipitao mensal foram coletados de algumas estaes pluviomtricas da referida Bacia, e o mtodo de Thiessen foi usado para o clculo da precipitao mdia mensal na Bacia. No foram observadas falhas na sries histricas de precipitao e vazo. O perodo utilizado foi de janeiro de 1963 a dezembro de 2000, usando a nomenclatura ms 1 para janeiro de 1963 e assim sucessivamente, finalizando no ms 456, que equivale a dezembro de 2000. O clculo do deflvio mensal na Bacia foi efetuado a partir da rea da Bacia (A = 1489 km2 ) e do nmero de dias do ms calculado.

CRITRIOS DE PERFORMANCE

Um bom modelo deve conter trs caractersticas principais: acurcia, consistncia e versatilidade (Kachroo (1992)). O termo acurcia refere-se a capacidade do modelo em ter erros pequenos no perodo de calibrao. A consistncia de um modelo verificada quando o nvel de acurcia e de estimao dos valores dos parmetros persistem para diferentes amostras dos dados histricos. A versatilidade do modelo definida quando o mesmo acurado e consistente em aplicaes que no sejam diretamente baseadas na funo objetivo usada na calibrao do modelo.

XV Simpsio Brasileiro de Recursos Hdricos

10

Neste trabalho foram analisadas as caractersticas acurcia e consistncia na avaliao dos diversos modelos de redes neurais. Trs critrios foram utilizados: i) Volume acumulado no perodo. ii) Erro mdio quadrtico RMSE (Root Mean Square Error), definido como:

RMSE =

(Q
k =1

)2 Q k , (14)

onde K o tamanho da amostra, Qk e calculados para o k-simo intervalo. iii) Eficincia R2 , expressa por:
R2 = F0 F , F0

so, respectivamente, os deflvios observados e Q k

(15)

onde

F0 = (Qk Q) 2 ,
k =1

(16)

)2 , F0 = (Qk Q k
k =1

(17)

sendo Q o valor mdio do deflvio para o perodo analisado.

importante ressaltar que o RMSE indica a performance relativa de diferentes modelos para um mesmo perodo de calibrao e verificao, no podendo de fato ser utilizado como critrio de comparao para modelos com diferentes perodos de calibrao e verificao. Nesta situao, o critrio R2 de eficincia melhor indicado. Entretanto, so apresentados os valores RMSE pois os mesmos indicam erros dimensionais. O valor ideal para o erro RMSE zero, e para R2 deve ser um.

RESULTADOS E DISCUSSO

Foram realizadas mais de 600 simulaes, de modo a combinar e melhor avaliar os modelos de redes neurais para trs diferentes configuraes: i) nmero e parmetro dos ns na camada de entrada; ii) nmero de ns na camada intermediria;
XV Simpsio Brasileiro de Recursos Hdricos 11

iii) perodo de calibrao e verificao. Pode-se assumir que o deflvio D numa bacia hidrogrfica para um dado ms t, funo da precipitao P no ms t e de precipitaes de meses anteriores (t-1, t-2, ...), e tambm do deflvio de meses anteriores. Assim, a camada de entrada pode ser composta por diversas combinaes de modo a verificar a influncia de cada um desses termos na previso do deflvio. Neste trabalho, para um dado perodo de treinamento e verificao, e um dado parmetro na camada de entrada, o nmero de ns na camada intermediria recebeu os valores 3, 5, 8 e 10. Observou-se nitidamente que a influncia dos mesmos nos resultados era muito baixa, no chegando a ser significativa. Assim, os resultados mostrados na coluna 2 da Tabela 3 indicam o nmero de ns (3, 5, 8 ou 10) na camada intermediria em que foi observado o melhor resultado. No so mostrados os resultados para os outros trs valores de ns na camada intermediria, pois iria demandar bastante espao, sem acrscimo de informaes significativas. Claramente o nmero de ns na camada intermediria para o perodo de treinamento o mesmo para o perodo de validao. Foram testados seis perodos diferentes de treinamento, e, consequentemente, seis perodos diferentes de validao. Optou-se nesta primeira fase da pesquisa por escolher perodos sequenciais. A Tabela 1 mostra os seis perodos de treinamento e validao, assim como as estatsticas dos perodos (mdia Q e desvio padro S) e o deflvio acumulado (DA) em cada perodo. Observa-se nesta tabela o alto coeficiente de variao. Para todos os perodos, seu valor ficou acima de 2, que comum em rios intermitentes do Semi-rido Nordestino, onde so observados valores de vazo zero para um longo perodo sazonal, e no mesmo ano apresentam picos relativamente altos de vazo. Na validao equivalente ao perodo 01/68 a 12/00, por exemplo, o coeficiente de variao ficou em torno de 3,58, valor relativamente alto. Na Tabela 2 apresentado o nmero do modelo e a correspondente caracterstica de sua camada de entrada. Essa numerao ser utilizada na tabela 3. O intuito foi uma melhor visualizao dos resultados. Na indicao do modelo mostrada na coluna 1 da Tabela 2, tem-se antes da seta a indicao do nmero de ns na camada de entrada e a sua caracterstica, sendo P a letra representativa para precipitao e D a letra representativa para deflvio, e o sub-escrito refere-se ao perodo do ms t e perodos anteriores. Aps a seta, o smbolo mostrado referncia para a sada da rede neural, ou seja, o deflvio estimado para o perodo t.

XV Simpsio Brasileiro de Recursos Hdricos

12

Tabela 1: Dados referentes aos perodos de treinamento e verificao Calibrao


Perodo 01/63 a 12/67 01/63 a 12/72 01/63 a 12/77 01/63 a 12/82 01/63 a 12/87 01/63 a 12/92
a b

Verificao
Sa 51,6 38,6 47,4 42,1 45,6 42,8 DA b 1375 1698 2910 3144 4482 4966 Perodo 01/68 a 12/00 01/73 a 12/00 01/78 a 12/00 01/83 a 12/00 01/88 a 12/00 01/93 a 12/00 Meses 61-456 121 - 456 181 - 456 241 - 456 301 - 456 361 - 456

Meses 01-60 01-120 01-180 01-240 01-300 01-360

Q [mm]
22,9 14,1 16,2 13,1 14,9 13,8

Q [mm]
10,1 11,0 9,0 10,4 5,8 4,4

S 36,2 38,8 31,6 34,7 18,5 13,5

DA 4017 3695 2483 2249 911 427

Desvio Padro no dados observados [mm] Deflvio observado acumulado no perodo [mm]

Tabela 2: Nmero e significados dos modelos testados Modelo 1 2 3 4 5 6


a b

Caracterstica da entrada Sada

Pt-1a , Pt Dtb Pt-1 , Pt , Dt-1 Dt Pt-2 , Pt-1 , Pt Dt Pt-2 , Pt-1 , Pt , Dt-1 Dt Pt-1 , Pt , Dt-2 , Dt-1 Dt Pt-2 , Pt-1 , Pt , Dt-2, Dt-1 Dt

Precipitao Deflvio

Os resultados apresentados na Tabela 3 referem-se ao desempenho de cada modelo, sendo apresentado seu nmero na coluna 1, de acordo com a nomenclatura mostrada na Tabela 2. Na coluna 2 mostrado o nmero de ns (3, 5, 8 ou 10) na camada intermediria em que foram obtidos os melhores resultados. As colunas subsequentes referem-se ao perodo utilizado, ao erro RMSE [mm] e ao erro R2 , correspondendo as fases de treinamento e validao. Trs anlises distintas podem ser feitas a partir da Tabela 3: i) para um dado perodo de treinamento e validao, avalia-se o melhor modelo; ii) para um dado modelo, seu desempenho avaliado para os diferentes perodos de treinamento e validao, ou iii) faz-se uma avaliao geral do melhor resultado, encontrando-se o modelo e os perodos de treinamento e validao correspondentes.

XV Simpsio Brasileiro de Recursos Hdricos

13

Tabela 3: Resultados obtidos para os diversos modelos testados Modelo 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6


a

Nha Perodo

Treinamento RMSE R2 Perodo

Validao RMSE R2

5 5 10 8 3 5 3 8 5 8 5 3 5 8 8 3 5 5 8 3 8 10 3 3 8 10 10 8 5 5 8 5 10 5 5 3

01-60

01-120

01-180

01-240

01-300

01-360

186 176 157 162 185 180 185 185 185 163 178 179 189 172 180 171 159 185 186 175 163 167 181 184 186 153 175 181 179 179 183 162 168 148 179 185

0,90 0,91 0,93 0,93 0,91 0,91 0,83 0,84 0,83 0,87 0,85 0,85 0,88 0,90 0,90 0,90 0,92 0,89 0,86 0,88 0,89 0,89 0,87 0,86 0,88 0,92 0,89 0,89 0,81 0,89 0,87 0,90 0,89 0,91 0,88 0,87

61-456

121-465

181-456

241-456

301-456

361-456

337 179 334 198 173 259 321 191 247 192 208 232 195 131 157 136 128 143 200 133 175 164 144 139 193 116 162 141 142 145 214 180 189 163 167 187

0,39 0,82 0,40 0,79 0,84 0,64 0,52 0,83 0,71 0,83 0,80 0,75 0,73 0,88 0,83 0,87 0,88 0,86 0,77 0,89 0,82 0,84 0,88 0,88 0,24 0,72 0,46 0,59 0,59 0,57 -0,75 -0,24 -0,37 -0,02 -0,02 -0,34

Nmero de ns na camada intermediria

Pelo primeiro mtodo de anlise, para um dado perodo de treinamento e validao, que corresponde a cada intervalo de linhas numeradas de 1 a 6, analisamos o desempenho de cada modelo com base no valor RMSE e tambm pelo coeficiente R2 . Independente do modelo, podemos observar que nos perodos de treinamento 1-60, 1-300 e 1-360, correspondentes respectivamente aos perodos de validao 61-456, 301-456 e 361-456, o desempenho geral na fase de validao foi ruim, com valores baixos para R2 . Isso deve-se ao aprendizado da rede, que no
XV Simpsio Brasileiro de Recursos Hdricos 14

primeiro perodo, no consegue realmente "aprender" a relao entrada-sada, ou seja, assimilar os padres estabelecidos (underfitting), enquanto nos dois ltimos perodos a rede neural memoriza os padres de treinamento (overfitting), gravando todas as suas peculiaridades e rudos, o que leva a uma reduo na capacidade de generalizao, conforme afirma Furtado (1998). Nos outros trs perodos, observa-se bons resultados dos modelos 1 e 3 na fase de treinamento, mas resultados relativamente ruins na fase de validao. Esses dois modelos representam a camada de entrada somente com dados de precipitao. Os outros 4 modelos apresentaram resultados sem diferenas significativas para todos os perodos de treinamento e validao. Apenas uma discreta superioridade pode ser observada no modelo 2 para a fase de validao em todos trs perodos analisados. Com relao ao nmero de ns na camada intermediria, no foi observada nenhuma relao funcional entre esse nmero e as peculiaridades da camada de entrada. No segundo tipo de anlise, no so considerados os perodos problemticos, mencionados no pargrafo anterior. Observa-se que todos os modelos, para a fase de treinamento, tem seu melhores resultados no perodo 01-180 seguido do perodo 01-240, enquanto para a fase de validao alguns modelos tiveram os melhores resultados no perodo 181-456 e outros no perodo 241-456. O terceiro tipo de anlise feita a partir da Tabela 4, onde so mostrados os melhores resultados estatsticos obtidos por cada modelo, e o respectivo deflvio acumulado no perodo DA, e seu erro percentual EDA quando comparado ao observado, mostrado na Tabela 1.
Tabela 4: Melhores resultados obtidos com os modelos Modelo Nha 1 2 3 4 5 6
a b

5 8 8 3 5 3

Perodo 01-240 01-180 01-180 01-180 01-180 01-240

Treinamento DA b RMSE R2 186 0,86 3142 172 0,90 3687 180 0,90 2661 171 0,90 2767 159 0,92 3205 184 0,86 3246

EDA 0,1 26,7 8,6 4,9 10,1 3,2

Perodo 241-456 181-456 181-456 181-456 181-456 241-456

Validao RMSE R2 200 0,77 131 0,88 157 0,83 136 0,87 128 0,88 139 0,88

DA

2533 3490 2659 2693 3023 2612

EDA 12,6 40,6 7,1 8,5 21,7 16,1

Nmero de ns na camada intermediria Deflvio observado acumulado no perodo [mm] c Erro percentual com relao deflvio observado acumulado no perodo

Com relao fase de treinamento, o modelo que apresentou o melhor resultado para o coeficiente R2 foi o modelo 5. Em contrapartida, o volume acumulado melhor previsto pelo modelo 1. Na fase de validao, os melhores resultados do coeficiente R2 so obtidos com os modelos 2, 4,

5 e 6, sem nenhuma diferena significativa entre eles. Coincidentemente, so os modelos que apresentam pelo menos um termo de deflvio na camada de entrada. O deflvio acumulado melhor previsto pelo modelo 3, que contm somente 3 termos de precipitao na camada de entrada, com um

XV Simpsio Brasileiro de Recursos Hdricos

15

erro da ordem de 7 %. Os modelos 2, 5 e 6, que apresentam pelo menos um termo de deflvio na camada de entrada, apresentaram um erro relativo alto no volume acumulado no perodo. Com o objetivo de melhor visualizar os resultados obtidos, so apresentados nos grficos das figuras 3 a 6 o valor do deflvio observado e o deflvio previsto para os modelos 3 e 4 nas fases de treinamento e validao. Esses modelos foram considerados aqui, levando em conta o conjunto acurcia e consistncia, os que melhor estimam o deflvio mensal na bacia considerada. Na fase de treinamento, os valores de picos so previstos pelos dois modelos, com erros em relao ao valor observado muito baixos. O modelo 4 apresenta uma melhor previso. Para deflvios zero ou prximos de zero, todos os dois modelos estimam com tima acurcia. A fase de validao tambm marcada com boa previso para picos de deflvios, assim como para valores baixos. Novamente, o modelo 4 o que melhor prev o deflvio mensal.

CONCLUSES

Foram realizadas simulaes com o objetivo de testar diferentes modelos de redes neurais aplicados ao processo chuva-deflvio. Trs parmetros foram tomados como definidores dos modelos testados: nmero e caractersticas dos ns na camada de entrada, nmero de ns na camada intermediria e nmero de meses usado na fase de treinamento. Observou-se que o nmero de ns na camada intermediria tem pouca influncia nos resultados, sendo o nmero ideal a ser utilizado determinado somente pelos resultados das simulaes numricas, no existindo, a priori, um mtodo que determine esse nmero ideal. A caracterstica dos ns de entrada influncia significativamente nos resultados. As melhores estatsticas na previso do deflvio no ms t foram obtidas com dados na entrada de precipitao , correspondentes aos perodos t, t-1 e t-2, em conjunto com o deflvio no ms t-1. Entretanto, o volume acumulado no perodo foi melhor previsto com os mesmos dados de precipitao mas a ausncia do deflvio no ms t-1. Isso indica que o acrscimo de deflvio do perodo t-2 nos dados de entrada no altera os resultados estatsticos para a Bacia aqui estudada, e o volume acumulado melhor previsto quando se utiliza somente dados de precipitao no vetor de entrada. Finalmente, fica evidente que a maior influncia no desempenho dos modelos est relacionada ao perodo de treinamento e validao utilizado. Perodos muito curtos, tendem a prejudicar o aprendizado da rede, enquanto perodos longos de treinamento e curtos de validao podem supertreinar a rede. Em ambos os casos, a capacidade de generalizao da rede drasticamente reduzida. O perodo ideal de treinamento encontrado est basicamente na metade da sries histrica, sendo a outra parte destinada validao. Espera-se em trabalhos futuros aprofundar o estudo aqui realizado, desenvolvendo novos modelos de redes neurais com mais de 3 camadas, alm de testar modelos chuva-deflvio dirios.
XV Simpsio Brasileiro de Recursos Hdricos 16

XV Simpsio Brasileiro de Recursos Hdricos

Figura 3: Resultados para a fase de treinamento do modelo 3

17

XV Simpsio Brasileiro de Recursos Hdricos

Figura 4: Resultados para a fase de treinamento do modelo 4

18

XV Simpsio Brasileiro de Recursos Hdricos

Figura 5: Resultados para a fase de validao do modelo 3

19

XV Simpsio Brasileiro de Recursos Hdricos

Figura 6: Resultados para a fase de validao do modelo 4

20

REFERNCIAS BIBLIOGRFICAS

FREITAS, M.A.S. Neurocomputao Aplicada. Apostila de Estudos. Universidade de Fortaleza, 1999. FURTADO, A.N.D. Uma nova abordagem na Avaliao de Projetos de Transporte: O Uso das Redes Neurais Artificiais para Avaliar e Ordenar Alternativas. Tese EESC-USP, So Paulo, 1998. HECHT-NIELSEN, R. Counter-propagation networks. Journal of Applied Optics, v. 26 (3), p. 4979-4984, 1987. HSU, K-L., GUPTA, V.K., SOROOSHIANA, S. Artificial neural network modeling of the rainfallrunoff process. Water Resour. Res., v. 31 (10), p. 2517-2530, 1995. KACHROO, R.K. River flow forecasting. Part 1. A discussion of the principles. Journal of
Hidrology, v. 133, p. 1-15, 1992.

MATH WORKS, INC. Neural Network Tool Box. User's Guide, Version 4, Natick, Mass., 2001. MINNS, A.W., HALL, M.J.. Artificial neural network as rainfall-runoff models. Hydrological
Science-Journal , v. 41 (3), p. 399-419, 1996.

OOYEN, A.V., NICHHUIS, B. Improving the convergence of back propagation problem. Neural
Networks, v. 5, p. 465-471, 1992.

RUMELHART, D.E., HINTON, G.E., WILLIAMS, J. Learning internal representation by error propagation. Parallel Distributed Processing, v. 1, p. 318-362, MIT Press, Cambridge, Mass., 1986. SAJIKUMAR, N., THANDAVESWARA, B.S. A non-linear rainfall-runoff model using an artificial neural network . Journal of Hydrology, v.216, p. 32-35, 1999. SMITH, J., ELI, R.N.. Neural-Network models of rainfall-runoff process. Journal of Water Ress.
Plann. and Management, p. 499-508, 1995.

WIDROW, B. Current and past applications of neural networks to adaptative control problems.
Invited Lecture. West Virginia Univ., College of Engineering, 1989.

XV Simpsio Brasileiro de Recursos Hdricos

21

You might also like