You are on page 1of 7

Header: XI TELEKOMUNIKACIONI FORUM TELFOR 2003, Beograd, Sava Centar,

25.-27.11.2003.g.
Naslov: MODELOVANJE MIKROTALASNIH REZONANTNIH APLIKATORA
POMOU NEURONSKIH MREA
Naslov na Engleskom: MICROWAVE RESONANT APPLICATORS MODELING
USING NEURAL MODELS,
Autori: Bratislav Milovanovi1, Zoran Stankovi1
1Elektronski fakultet, Ni, Srbija i Crna Gora

Abstrakt: Abstract: In this paper, different approaches to modeling of microwave applicators using neural
networks as well as obtained results are presented. This approaches are developed at the Faculty of
Electrical Engineering-Nis in five past years. First, a model of loaded cilindrical metal microwave cavity
based on multylayer perceptron neural network (MLP) is introduced. Then, the methods for improving
efficiency (reducing of number of training samples required for training of neural models with sufficient
accuracy, reducing of training time) of proposed MLP models are developed. These methods are based on
indirect incorporating of existing knowledge that is defined by approximative-empirical cavity model.
Finally, high efficient neural models of cilindrical metal microwave cavity with directly incorporated
knowledge (hybrid empirical - neural model and KBN - knowledge based neural model) are presented.
Podnaslov: 1. UVOD
Intezivan razvoj mikrotalasne tehnike poslednjih decenija doveo je do iroke primene mikrotalasnih
aplikatora u nauci, medicini i industriji. Cilindrini metalni rezonatori ili talasovodni rezonatori su najee
koriene aplikatorske konfiguracije. Posebno vanu primenu takvi rezonatori imaju u procesima
zagrevanja i suenja dielektrinog materjala mikrotalasnom energijom. Da bi se napravio jedan takav
efikasan aplikator neophodno je poznavati koji se svi tipovi oscilovanja mogu pobuditi u rezonatoru i koje
su njihove rezonantne frekvencije. Zbog toga su ove mikrotalasne strukture bile predmet istraivanja veeg
broja autora [1-5]. Odreivanje rezonantnih frekvencija ovakvih rezonatora direktnim reavanjem
Maxwell-ovih jednaina uz postavljanje graninih uslova je previe sloeno ak i kad se radi o
optereenjima jednostavnog geometrijskog oblika. Zato je numeriki pristup do sada bio jedina alternativa
za odreivanje rezonantnih frekvencija. Numerika metoda koja se do sada najee primenjivala za
teorijsku analizu cilindrinih metalnih rezonatora je metoda transverzalne rezonanse [2]. Ova metoda daje
vrlo visoku tanost rezultata, pogotovo ako se za sluaj rezonatora sa gubicima uvede kompleksna
rezonantna frekvencija, ime se numerikim putem reava kompleksna karakteristina jednaina, a sama
metoda nije preterano teka za softversku implementaciju. Osnovni nedostatak ovog metoda je to da je
primenljiv samo kada je rezonator optereen planparalelnim homogenim dielektrinim slojevima koji
nemaju velike gubitke. Za modelovanje rezonatora ije optereenje ima proizvoljnu geometriju i sastav
nuno je korienje neke od monijih numerikih tehnika. Jedna takva tehnika bazirana na numerikim
izraunavanjima u vremenskom domenu i koja se moe koristiti za reavanje mnogih problema vezanih za
prostiranje elektromagnetskih talasa je Transmission Line Modeling (TLM) metod [3]. To je mona
numerika metoda koja se moe koristiti za reavanje mnogih problema vezanih za prostiranje
elektromagnetskih talasa. Osnovni zajedniki nedostatak svih numerikih metoda je da su vrlo zahtevni to
se tie hardverskih resursa neophodnih za njihovu softversku implementaciju, sama softverska
implementacija moe biti vrlo komplikovana i suoena sa razliitim tekoama, a vreme potrebno za
numerike proraune tokom korienja detaljnog EM modela moe biti neprihvatljivo dugo. Da bi se
donekle ublaili ovi osnovni nedostaci EM modelovanja u [1] je predloen jedan orginalni aproksimativni
pristup u modelovanju cilindrinih metalnih rezonatora koji je baziran na obimnim analitikim i
poluempirijskim istraivanjima. Ovaj pristup u modelovanju izbegava bilo kakva sloena numerika
izraunavanja, tako da odgovarajui aproksimativni model rezonatora daje veoma brz odziv u fazi
njegovog korienja. Glavni nedostatak ovog modela je to to je metoda splajn aproksimacije, koja daje
najbolje rezultate u ovom pristupu, za sada primenjena samo za sluaj kada je rezonator optereen
planparalelnim dilektrinim slojem koji je smeten na dno rezonatora. Takoe, ovakav pristup je primenljiv
samo ako se ne zahteva visoka tanost modela rezonatora. Dobra alternativa za prevazilaenje svih ovih
problema moe biti modelovanje rezonatora pomou vetakih neuronskih mrea. Neuronski model u
ovakvim sluajevima moe da ima brzinu aproksimativnog modela i tanost koja je bliska detaljnim EM
modelima.
Podnaslov: 2. NEURONSKI MODELI OPTEREENOG MIKROTALASNOG REZONATORA
BAZIRANI NA VIESLOJNOJ PERCEPRONSKOJ MREI
Vieslojna perceptronska mrea (MLP - multilayer perceptrons) je jedna visokoparalelizovana i
visokoadaptivna nerekurentna struktura koju ine slojevito spregnuti neuroni sa nelinearnim aktivacionim
funkcijama u skrivenim slojevima [6,7]. Zahvaljujui takvoj osobini, istraivanja koja su bila vezana za
njenu primenu u mikrotalasnoj tehnici, pokazala su da je ona u stanju da sa zadovoljavajuom tanou i
visokim stepenom generalizacije aproksimira visokonelinearne zavisnosti, ne zahtevajui poznavanje bilo
kakvih funkcionalnih zavisnosti izlaznih veliina od ulaznih promenljivih. U skladu sa tim i poetna
istraivanja koja su bila vezana za primenu neuronskih mrea u modelovanju mikrotalasnog rezonatora bila
su bazirana na MLP neuronskom modelu [4]. Za problem koji se modeluje MLP modelom uzeta je
zavisnost rezonantnih frekvencija eksperimentalnog cilindrinog metalnog rezonatora, konkretnih fizikih
dimenzija (visine h=14.4 cm i poluprenika a=7 cm), u funkciji promenljivih parametara dielektrinog
sloja. Razmatran je sluaj kada je rezonator optereen dielektrinim slojem koji se nalazi na dnu i koji ima
fiksne gubitke (Slika 1), tako da su promenljivi parametri dielektrinog sloja koeficijenat popunjenosti t/h,
gde t predstavlja debljinu dielektrinog sloja a h visinu rezonatora, i relativna dielektrina konstanta r.
Problem koji se modeluje je znai oblika

pa e za neuronski model y=y(x,w) gde je w vektor teina veza, vektor ulaznih veliina biti x=[t/h, r]T dok
e vektor izlaznih veliina biti y=[fr] pa e arhitektura odgovarajueg MLP neuronskog model izgledati kao
na slici 2. Opta oznaka za ovako definisan MLP neuronski model rezonatora je MLPn-l1-l2-...-lH gde n
predstavlja ukupan broj neuronskih slojeva modela, a li broj neurona u i-tom skrivenom sloju. Ovako
definisanim MLP modelom izvreno je modelovanje rezonantnih frekvencija eksperimentalnog rezonatora
za razliite modove oscilovanja u opsezima ulaznih parametara 0 t/h 0.1 i 2 r 82 i pri fiksnim
gubicima u dielektriku [4,5]. Vrednosti uzoraka za obuku (trening skup), uzoraka test skupa i referentnh
krivih u procesu simulacije generisane su metodom transverzalne rezonanse. Uzorci za obuku su na
klasian uniforman nain rasporeeni u ulaznom prostoru. Obuka neuronskih modela je vrena sa razliitim
brojem uzoraka u cilju ispitivanja uticaja tog broja na tanost modelovanja. Za proces simulacije funkcije
zavisnosti rezonantnih frekvencija od t/h i r uziman je model sa najboljim testnim karakteristikama. MLP
modeli koji su razvijeni na trening skupovima koji su imali vie od 1000 uzoraka, u procesu simulacije
pokazali su veoma dobro slaganje sa referentnim krivama to pokazuju i rezultati za TM 111 mod oscilovanja
prikazani na slici 3.
Podnaslov: 3. POSTUPCI ZA POVEANJE EFIKASNOSTI MLP MODELA REZONATORA
Poto MLP mrea sve funkcionalne zavisnosti izvodi iskljuivo na osnovu uzoraka za obuku treba
obezbediti relativno veliki broj takvih uzoraka. Pribavljanje tako velikog broja uzoraka moe da bude
zametan posao jer oni jedino mogu da se ili generiu vremenski zahtevnim numerikim metodama (Metod
transverzalne rezonanse) ili da se dobiju merenjima sloenog tipa. Sa druge strane obuka MLP neuronske
mree na tako velikom broju uzoraka moe biti veoma duga i sa neizvesnim ishodom. Jedan od naina da
se ovaj problem umanji je primena dva nova postupaka za smanjanje broja trening uzoraka koji je potreban
za obuku MLP modela eljene tanosti. Oni su bazirani na indirektnoj inkorporaciji postojeeg znanja o
ponaanju rezonantnih frekvencija rezonatora i odnose se na primenu neuniforme raspodele trening
uzoraka koja odslikava znanje o ponaanju rezonantnih frekvencija proisteklo iz aproksimativnog metoda
modelovanje razlike vrednosti dobijenih metodom transvezalne rezonanse i aproksimativnim modelom Prvi
postupak je zasnovan na injenici da dinamika promene krive rezonantne frekvencije nije ista u svim
oblastima dvodimezionalnog prostora ulaznih promenljivih i da je ona odreena karakteristinim takama
definisanim u aproksimativnom modelu [1,4]. Tamo gde je dinamika promene vea uzima se vei broj
uzoraka za obuku, a gde je ona manja, uzima se manji broj uzoraka. Drugi postupak je zasnovan na
injenici da se modelovanjem razlike rezultata dobijenih metodom transverzalne rezonanse i
aproksimativnim metodom smanjuje relativna greka modelovanja u odnosu na celi izlazni opseg koji se
modeluje [5].
Podnaslov: 4. NEURONSKI MODELI MIKROTALASNOG REZONATORA BAZIRANI NA
ZNANJU
Izloene tehnike za poveane efikasnosti modelovanja MLP mreom, omoguuju smanjenje broja trening
uzoraka koji je potreban za obuku neuronskog modela zadovoljavajue tanosti. Meutim, tu u osnovi i
dalje ostaje princip modelovanja tipa crne kutije, gde MLP model ui funkcionalne zavisnosti iskljuivo na
osnovu ulaznih podataka. Postojee empirijsko znanje o problemu se predstavlja MLP modelu iskljuivo na
indirektan nain, preko trening skupa, a ne njegovom direktnom inkorporacijom u neuronski model. Stoga
je glavni cilj sprovedenih istraivanja bio usmeren ka realizuji neuronskog modela baziranog na znanju,
modela koji e moi da postojee znanje o rezonatoru ukljui u sebe na mnogo neposredniji nain i time to
znanje efikasnije iskoristi, a sve u cilju daljeg poveanja tanosti neuronskog modela i smanjenja potrebnog
broja trening uzoraka za njegovu obuku. U realizaciji takvog modela primenjena su dva pristupa:

Slika 1. Cilindrini metalni rezonator krunog poprenog preseka sa dielektrikom smetenim na dnu
rezonatora

Slika.2. MLP neuronski model cilindrinog metalnog rezonatora fiksnih dimezija i sa dielektrinim slojem
na dnu

Slika 3. Poreenje rezulatata za TM111 mod oscilovanja dobijenih MLP4-12-12 modelom sa referentnim
vrednostima (metod transverzalne rezonase) za sluaj obuke na trening skupu od 1640 uzoraka
pristup koji koristi hibridni neuronsko-empirijski model i pristup koji koristi neuronsku mreu baziranu na
znanju Prvi pristup, koji predstavlja prelazno reenje ka isto neuronskom pristupu, koristi integraciju
postojeeg aproksimativnog modela kao nosioca empirijskog znanja i MLP mree u hibridni neuronsko-
empiriski (HEN) model [8]. Osnovna ideja u ovom pristupu je da uz odgovarajuu spregu sa neuronskom
mreom, empirijski model moe da toj mrei povea generalizacione i ekstrapolacione mogunosti, time
to e joj prezentovati dopunske informacije o funkcionalnim zavisnostima problema. U skladu sa tim
razvijen je HEN model optereenog mikrotalasnog rezonatora ija je arhitektura prikazana na slici 7. Opta
oznaka za ovakav HEN model je Hn-l1-l2-...-lH gde n predstavlja ukupan broj neuronskih slojeva koriene
MLP mree, a li broj neurona u njenom i-tom skrivenom sloju. Ovim modelom izvrena je determinacija
rezonantnih frekvencija eksperimentalnog rezonatora u irem opsegu ulaznih parametara nego kod MLP
modela (0 t/h 0.2 i 2 r 82). Uzorci za obuku su takoe generisani metodom transverzalne
rezonanse uz korienje ranije izloene neuniformne raspodele koja generie manji trening skup. Slika 9.c
predstavlja trodimenzionalni prikaz rezonantnih frekvencija TM112 moda ocsilovanja u zavisnosti od t/h i r
dobijen H4-12-10 modelom. Ovaj model je na osnovu svojih testnih karakteristika izabran iz skupa HEN
modela koji su obuavani na krajnje redukovanom trening skupu od 80 uzoraka. Na slici 9.b je prikazan isti
rezultat koji je dobijen MLP modelovanjem nad istim trening skupom. Na slici 9.a prikazana je referentna
povr dobijena metodom transverzalne rezonanse. Moe se jasno videti da je povr dobijena hibridnim
modelom blia referentnoj povri od one koja je dobijena MLP modelom. ta vie, povrina dobijena MLP
modelom je u pojedinim oblastima toliko nepravilna i toliko odstupa od referentne povrine, da se moe
zakljuiti da ovako mali trening skup nije dovoljan za obuku MLP modela neke prihvatljive tanosti. Za
generisanje ove povri u 10000 taaka metodom tranverzalne rezonanse potrebno je vreme negde izmeu
20 i 30 asova (Pentium III 450 MHz, 128 MB RAM), dok je korienjem HEN modela potrebno 2- 3
minuta (MLP modelom je potrebno samo 5 sekundi). Drugi pristup ima za cilj da se kroz realizaciju modela
isto neuronske arhitekture, naslede sve prednosti ugradnje postojeeg znanja dokazanih prvim pristupom,
ali isto tako da se i eliminie sprega sa empirijskim modelom kao nezavisnom celinom, koja unosi
ogranienja u pogledu oblasti definisanosti, brzine simulacije i softverske implementacije modela. Osnovna
ideja u ovom pristupu je da se realizuje specijalizovana arhitektura neuronske mree ija e struktura biti
prilagoena problemu modelovanja rezonatora u tom smislu da u odreenoj meri ve odslikava postojee
relacije i funkcionalne zavisnosti istraene prilikom definisanja aproksimativnog modela. U skladu sa tim
razvijen je novi KBN (Knowledge Based Neural) model rezonatora koji ija je arhitektura prikazana na
slici 8 [9] . On ima sposobnost da preko aktivacionih funkcija neurona znanja, u optoj adaptibilnoj formi
ugradi funkcijske zavisnosti rezonantnih odnosno antirezonantnih frekvencija u vazdunom i dielektrinom
delu rezonatora [1,9]. Opta oznaka ovog neuronskog modela rezonatora baziranog na znanju je KBNn-z-
l1-l2--ln gde n predstavlja broj skrivenih slojeva, z predstavlja ukupan broj neurona znanja a l1-l2--ln su
brojevi neurona u svakom skrivenom sloju. Na slici 9.d prikazane su rezonantne frekvencije TM 112 moda
ocsilovanja u zavisnosti od t/h i r dobijene KBN3-4-16-16-16 modelom ija je obuka izvrena pod istim
uslovima kao i kod HEN modela. Ova povr je slino povri dobijenoj HEN modelom uoljivo blia
referentnoj povri nego ona dobijena MLP modelom. Eliminacijom empirijskog modela kao nosioca znanja
i prelaskom na kompletnu neuronsku arhitekturu dobija se i na simulacionoj brzini: KBN model rezonatora
na pomenutoj Pentium III platformi proraunava vrednosti rezonantnih frekvencija u 10000 taaka za
manje od 7 sekundi, to je znatno bre od HEN modela. Dalje, KBN model omoguava lake poveanje
broja ulaznih parametra u model od HEN modela iji su ulazi odreeni empirijskim modelom, te je on
pogodniji za izgradnju optijeg modela rezonatora.

Slika 7. HEN model optereenog mikrotalasnog rezonatora


Slika 8. KBN model optereenog mikrotalasnog rezonatora

Podnaslov: ZAKLJUAK
Kao dobra alternativa EM modelovanju mikrotalasnih rezonatora koje se suoava sa ogranienjima razliite
prirode, moe da bude modelovanje takvih rezonatora pomou neuronskih mrea. MLP model rezonatora
se lako razvija, ima veliku brzinu simulacije ali da bi postigao zadovoljavajuu tanost potreban je
relativno veliki broj uzoraka za obuku. Smanjivanje broja tih uzoraka moe se postii ako se oni uzorkuju
na pogodan neuniforman nain koji odslikava postojee znanje o ponaanju rezonantnih frekvencija
proisteklo iz aproksimativnog modelovanja, i (ili) ako se modeluje razlika vrednosti finog EM i
aproksimativnog modela. Dalje smanjivanje potrebnog broja uzoraka za obuku i poveanje efikasnosti
modelovanja postie se direktnom inkorporacijom postojeeg znanja HEN ili KBN modelom rezonatora.
Oba modela mogu da pokae dobru tanost u odreivanju rezonantnih frekvencija ak i kad se raspolae sa
veoma malim brojem uzoraka za obuku koji ne sadre dovoljno informacija za korektnu obuku MLP

a.)
b.)

c.)

d.)

Slika 8. Rezonantne frekvencije TM112 moda oscilovanja eksperimentalnog mikrotalasnog rezonatora u zavisnosti
od t/h i r dobijene a.) Metodom transverzalne rezonanse, b.) MLP4-12-12 modelom, c.) H4-12-10 modelom, i
d.) KBN3-4-16-16-16
modelom modela rezonatora (ispod 100 za konkretni eksperimentalni rezonator). KBN model ima prednost
u odnosu na HEN model jer eliminie upotrebu eksternog empirijskog modela koji usporava neuronski
model i koji namee razliita ogranienja, posebno u pogledu uvoenja novih ulaznih parametara.
LITERATURA
[1] B.Milovanovic, S.Ivkovic, A.Atanaskovic, "An Approximate Procedure for Resonant Frequency Determination of
the Loaded Cylindrical Cavities", Journal of Microwave Power and Electromagnetic Energy, Vol. 34, No. 3, pp. 185-
191, 1999.
[2] B. Milovanovic, S. Ivkovic, D. Djordjevic and N. Donov, The Loading Effect Analysis of the Cylindrical Metallic
Cavities with Various Cross-Sections, Jour. of Microw. Power and Electromagnetic Energy, Vol. 33, No. 1, April 1998,
pp. 49-55.
[3] N. Doncov, B. Milovanovic and S. Ivkovic, Modeling of Circular Cylindrical Metallic Cavity loaded by a Lossy
Dielectric Sample of Various Geometries Using 3-D TLM Method, Yugoslav MTT Microwave Review, Vol. 5, No. 1,
pp. 6-9, June 1998.
[4] B. Milovanovi, Z. Stankovi and V. Stankovi, Loaded Cylindrical Metallic Cavities Modeling using Neural
Networks, TELSIKS'99, Conference Proceedings, Nis, Yugoslavia 1999, pp.214-217.
[5] B. Milovanovic, Z. Stankovic, S. Ivkovic, Modelling of the Cylindrical Metallic Cavity with Circular Cross-section
using Neural Networks, MELECON 2000, Conf. Proceedings, Vol.II, Cyprus 2000, pp.449-452.
[6] S. Haykin, Neural Networks, New York, IEEE, 1994.
[7] J. Hertz, A. Krogh and R. Palmer, Introduction to the Theory of Neural Computation, Addison-Wesley, 1991.
[8] B. Milovanovi, Z. Stankovi, "Microwave Cylindrical Cavity Modeling Using Neural Model Incorporating
Empirical Knowledge", CD verzija zbornika radova YUINFO 2002 konferencije, Kopaonik 2002.
[9] Z. Stankovi, B. Milovanovi and S. Ivkovi, Microwave Cylindrical Cavity Applicators Modeling Using
Knowledge Based Neural Networks, IEEE TELSIKS 2001 Conference Proceedings, Nis, Yugoslavia, pp. 687-690,
2001.

You might also like