You are on page 1of 218

Visoka kola elektrotehnike i raunarstva

Dr Zoran Bojkovi
Dr Dragoljub Martinovi

OSNOVE
MULTIMEDIJALNIH
TEHNOLOGIJA
-udbenik-

Beograd
2011.

Autori:

dr Zoran Bojkovi i dr Dragoljub Martinovi

Recenzenti:

dr Bratislav Milovanovi, dr Duan Starevi

Lektor:

Slavica Baji, dipl. filolog

Tehniki urednik:

mr Milica Mii, dipl. in. elektr.

Izdava:

Visoka kola elektrotehnike i raunarstva strukovnih studija

Za izdavaa:

dr Dragoljub Martinovi

tampa:

MST Gaji, Beograd

Tira:

20

Nastavno vee Visoke kole elektrotehnike i raunarstva strukovnih studija na sednici


odranoj 22.09.2011. godine odobrilo je izdavanje i korienje ovog udbenika u nastavi.

CIP Katalogizacija u publikaciji


Narodna biblioteka Srbije, Beograd
004.4'27(075.8)(0.034.2)
BOJKOVI, Zoran,
Osnove multimedijalnih tehnologija
[Elektronski izvor] / Zoran Bojkovi,
Dragoljub Martinovi. - Beograd : Visoka
kola elektrotehnike i raunarstva strukovnih
studija, 2011 (Beograd : MST Gaji). - 1
elektronski optiki disk (CD-ROM) ; 12 cm
Sistemski zahtevi: Nisu navedeni. - Nasl. sa
etikete na disku. - Tira 20. - Bibliografija
uz svako poglavlje.
ISBN 978-86-7982-105-8
1. Martinovi, Dragoljub, [koautor]
a) Multimediji
COBISS.SR-ID 186944524

PREDGOVOR
Rukopis Osnove multimedijalnih tehnologija, posle pozitivne recenzije, Nastavno vee
Visoke kole elektrotehnike i raunarstva u Beogradu odobrilo je za korienje kao udbenik za
predmete Digitalne multimedije 1 i Digitalne multimedije 2. Pisan je s namerom da bude
koristan svim studentima koji izuavaju multimedije na visokim kolama i fakultetima.
U prvih sedam poglavlja autor dr Zoran Bojkovi izloio je fundamente ove oblasti koja
se neprekidno razvija. Koautor dr Dragoljub Martinovi izloio je, u osmom i devetom
poglavlju, aplikativni aspekt multimedijalnih tehnologija.
Autori su zahvalni recenzentima dr Bratislavu Milovanoviu i dr Duanu Stareviu na
korisnim primedbama, mr Milici Mii na pomoi, redakciji i tehnikoj obradi, i Slavici Baji,
profesoru, na lekturi.
Beograd, septembar, 2011. godine

Autori

iii

iv

SADRAJ
1. Uvod .... 1
1.1 Klasifikacija medija...
1.2 Osobine multimedijalnih sistema...
1.3 Konvergencija telekomunikacija i raunara..
1.4 Multimedijalni komunikacioni model...
1.5 Korisniki zahtevi..
1.6 Mreni zahtevi...
1.7 Multimedijalni terminali
1.8 Paketski transfer.
1.9 Rezime...
Pitanja
Literatura...

2
3
4
5
6
7
7
8
10
11
11

2. Osnovi audia. 13
2.1 Karakteristike zvuka..
2.2 Neke karakteristike oveijeg slunog sistema..
2.3 Registrovanje audia
2.4 Predstavljanje audio signala.......
2.5 Rezime...
Pitanja
Literatura...

13
15
16
16
18
18
19

3. Vizuelni efekti.. 20
3.1
3.2
3.3
3.4

Neke karakteristike ula vida.


Vidljivost uma..
oveiji vizuelni sistem.
Vizuelni modeli..
3.4.1 Monohromatski vizuelni model...
3.4.2 Vizuelni model u boji...
3.4.3 Opti model vizuelnog komunikacionog sistema.
3.5 Rezime...
Pitanja
Literatura...

21
23
24
26
26
28
29
31
31
32

4. Audio-vizuelne integracije... 33
4.1 Interakcija medija.. 33
4.2 Bimodalnost ljudskog govora 34
4.3 Oitavanje sa usana 35
v

4.4 Praenje usana


4.5 Audio-vizuelno preslikavanje
4.5.1 Konverzija na bazi klasifikacije...
4.5.2 Audio i vizuelna integracija kod primena za oitavanje sa usana
4.6 Zdrueno audio-video kodovanje..
4.7 Bimodalna personalna verifikacija
4.8 Rezime...
Pitanja
Literatura...

37
37
37
38
38
39
40
40
41

5. Multimedijalna akvizicija podataka.... 43


5.1 Diskretizacija kontinualnog signala...
5.2 Odmeravanje..
5.2.1 Odmeravanje audio signala..
5.2.2 Odmeravanje dvodimenzionalnih (2-D) slika..
5.2.3 Niskopropusni anti-aliasing filtri.
5.3 Digitalizacija audio signala...
5.3.1 Analogno-digitalna konverzija.....
5.3.2 Kriterijumi vernosti audio signala
5.4 Digitalizacija slika.
5.4.1 Vizuelna vernost...
5.5 Rezime...
Pitanja
Literatura...

43
44
46
51
52
53
54
55
57
57
58
59
61

6. Kompresija teksta.. 62
6.1 Predstavljanje teksta u digitalnoj formi.
6.2 Principi kompresije teksta, statistika suvinost
6.3 Shannon-ova teorema kodovanja za beumni izvor..
6.4 Huffman-ovo kodovanje....
6.5 Aritmetiko kodovanje..
6.6 Rezime...
Pitanja
Literatura...

62
64
67
69
71
74
75
76

7. Standardi u multimedijalnim komunikacijama.. 77


7.1 Znaaj standardizacije 78
7.2 MPEG prilaz multimedijalnoj standardizaciji... 79
7.3 MPEG-1 standard.. 80

vi

7.4 MPEG-2 standard..


7.5 MPEG-4 standard..
7.5.1 Delovi MPEG-4 standarda...
7.5.2 MPEG-4 standard: vizuelni deo...
7.5.3 MPEG-4 standard: audio......
7.5.4 H.264/AVC MPEG-4 (Part 10) standard.
Kodovanje i dekodovanje kod H.264/AVC standarda.................
Entropijsko kodovanje kod H.264/AVC standarda..............
7.6 Kratak pregled standarda za kodovanje mirnih slika.
7.7 Standard JPEG 2000..
7.8 MPEG-7 standard......
7.9 MPEG-21 standard
7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema
7.10.1 Standardi za video kodovanje......
7.10.2 Standardi za kodovanje govora
7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju
7.11 Rezime...
Pitanja
Literatura...

82
84
86
89
90
91
93
95
96
97
98
101
104
108
112
113
116
117
119

8. Aplikativni aspekt multimedija. 124


8.1 Aplikativni aspekt osnovnih informaciono-komunikacionih pojmova.
8.2 Osnove multimedijalne delatnosti.
8.2.1 Multimedijalna preprodukcija..
Prethodna analiza u preprodukciji
Pria na tabli Storyboard...
Procena trokova..
Radni tim za multimedijalnu produkciju..............
8.2.2 Multimedijalna produkcija...
8.2.3 Multimedijalna postprodukcija
8.3 Slika u multimediji.
8.3.1 Memorisanje, prenos i prikazivanje slike.
8.3.2 Senzori slike.
8.3.3 Osnovne obrade slike...
8.3.4 Bitmapirana slika..
8.3.5 Vektorski generisane slike...
8.3.6 Promenljive slike u multimediji...
8.4 Tekst u multimediji
8.4.1 Standardi za digitalnu prezentaciju karaktera..
vii

126
129
130
130
132
133
133
134
136
137
137
138
139
141
143
146
148
149

8.4.2 Font...
8.4.3 Prikazivanje teksta na monitoru...
8.4.4 Veliina, razmera i tip fontova.
8.5 Animacija...
8.5.1 Tradicionalna animacija...
8.5.2 Kompjuterska animacija...
8.5.3 Animacija u multimedijalnim sistemima.
Trodimenzionalni objekti u animaciji 3D animacija.
Virtualna realnost u animaciji..
8.6 Zvuk u multimediji
8.7 Dodir u multimediji...
8.8 Miris u multimediji
8.9 Interakcija u multimediji
8.10 Rezime...
Pitanja
Literatura...

150
151
152
154
155
157
160
160
160
161
163
165
167
168
170
171

9. Aplikativni softver za multimedije... 172


9.1 Softverski alati za izradu multimedijalnih prezentacija.
9.2 Softverski alati za obradu slika..
9.2.1 Softverski alati za obradu bitmapiranih slika...
9.2.2 Softverski alati za obradu vektorskih slika..
9.2.3 Softverski alati za editovanje pokretnih slika..
Program Adobe Premiere.....
Program Final Cut Pro..
9.2.4 Softverski alati za kreiranje animacija.
Program Adobe Flash..............
Program Autodesk Maya..
9.3 Programi za snimanje, obradu i editovanje zvuka.
9.3.1 Obrada zvuka pomou Sound Forge-a.
Spektralna analiza u Sound Forge...
Uklanjanje uma u Sound Forge-u..............
Dinamika kompresija u Sound Forge-u.
Promena uestanosti u Sound Forge-u.
9.4 Rezime...
Pitanja
Literatura...

Spisak skraenica..
viii

173
174
174
175
176
178
179
181
181
182
186
187
188
188
191
193
194
195
196
197

1. UVOD
Prema standardu ISO/IEC JTC1 SC29/WG12, multimedija predstavlja sposobnost
postupanja sa razliitim vidovima prezentacionih medija koji ine tip podataka sa zadatkom da
definiu prirodu informacije u njenom kodiranom formatu.
Komunikacione tehnologije imaju veliki uticaj na razvoj savremenog drutve. Pre pojave
raunara, novine, radio, bioskop i televizija bile su primerena sredstva za masovne komunikacije.
Kada su ranih osamdesetih godina uvedeni personalni raunari, malo ljudi bilo je u stanju da
pretpostavi njihov ogroman uticaj na nau svakodnevnicu. Da bi se to efikasnije koristili
raunarski potencijali, prezentacija informacija treba da bude efikasno strukturirana kroz
memorisanje, prenos i pretraivanje.
Medijum je sredina (vazduh, voda) kroz koju se neto prenosi. Poto skraenica multi
predstavlja multipl, multimedija se odnosi na sredstva komunikacije sa vie od jednog medijuma
[1.1]. Multimedijalne tehnologije su glavna pokretaka snaga za uvoenje itavog niza
pogodnosti i primena sa take gledita korisnika. Radi se o interaktivnom predstavljanju govora,
audija, videa, grafike, teksta, uz injenicu da informacione tehnologije povezuju komunikacije,
raunarsku tehniku, i procesiranje signala u jednu interdisciplinarnu celinu. Pri razmatranju
problematike multimedijalnih tehnologija, pored ostalog, treba uzeti u obzir [1.2]:
Kontinualni trend u digitalizaciji,
Brzo irenje digitalnih mrea i naroito interneta,
Konvergenciju razliitih tehnologija, ukljuujui komunikacije, distribuciju digitalnih
medija, informacione tehnologije,
Pojavu novih komunikacijskih servisa i primene koje potiu od interneta i beinih
tehnologija,
Zahtev za multimedijalnim komunikacijama u realnom vremenu kao proirenje
monomedijalnih sistema.
Sa take gledita multimedijalnih komunikacija, cilj je da se najpre obezbede one
primene kojima se integriu tekst, zvuk i video informacija, a da se pri tome omogui u svakom
trenutku, interakcija. Pre svega, aplikacije Meunarodne unije za telekomunikacije (eng.
International Telecomunications Union ITU) i Grupe eksperata za obradu pokretne slike (eng.
Motion Picture Expert Group MPEG) treba da budu uzete u obzir. One podrazumevaju
integracije, interaktivnosti, memorisanja, striminga, pretraivanja i distribucije digitalnih medija,
kao i odgovarajuu infrastrukturu. S take gledita aplikacionog sloja znaajni su i mobilni
servisi, korisniki intrerfejsi i mobilni pristupi bazama podataka. Sa druge strane, na mrenom
1

sloju, naglasak je na kontroli pristupa, alokaciji resursa i irine propusnog opsega, kontroli
zaguenja saobraaja, i modeliranju saobraaja. Jednako je znaajan i kvalitet servisa (eng.
quality of service QoS) u mrenim multimedijalnim sistemima. Zahtev za kvalitet servisa i
odgovarajui parametri moraju biti u skladu sa garancijama QoS [1.3].
Nagli razvoj multimedijalnih tehnologija, i mogunosti razmene multimedijalnih sadraja
preko interneta, doprineli su znaaju poveanja koliine multimedijalnih podataka i to kako broja
dokumenata, tako i veliine pojedinih fajlova. Uz to, pojavila se i potreba za efikasnim
tehnikama kompresije, pretraivanja i pronalaenja eljenih multimedijalnih dokumenata. Treba
istai da se u srcu irokopojasnih mrea nalaze tehnologije koje omoguavaju brzi prenos
podataka prenosnim putevima velikog kapaciteta izmeu razliitih taaka u mrei.

1.1 Klasifikacija medija


Naglaeno je da multimedija predstavlja raznolikost medija. Mediji se mogu klasifikovati
prema kriterijumima: percepciji, predstavljanju, prikazivanju, memorisanju, prenosu, sadraju,
itd.
U tipinom multimedijalnom okruenju, informacija se prenosi zainteresovanim
korisnicima putem naih ula sluha, vida, mirisa, dodira i ukusa. Meutim, najee se u
multimedijalnim sistemima koriste audio i vizuelne informacije. Tehnologije za ukljuenje
ostalih ula: mirisa, dodira i ukusa zahtevaju dodatna istraivanja [1.4]. U okviru tekuih
multimedijalnih tehnologija tekst, mirne slike image i pokretne slike video, pripadaju
vizuelnom mediju, dok se muzika i govor tretiraju kao auditorni medijum.
to se tie predstavljanja (eng. representation), medijum je okarakterisan internim
raunarskim predstavljanjem. Na primer, slova iz nekog teksta mogu se predstaviti korienjem
Amerikog standardnog koda za razmenu informacija (eng. American standard code for
information interchange ASCII), audio signali putem impulsno kodno modulisanih (eng. pulse
code modulation PCM) odbiraka, podaci o mirnoj slici memorisanjem PCM ili Grupe
eksperata za fotografiju (eng. Joint Photographic Experts Group - JPEG) formata, dok se video
podaci mogu predstaviti, na primer u obliku PCM ili MPEG formata.
Prikazivanje (eng. presentation) se odnosi na alate i ureaje koji prikazuju ulaznu i
izlaznu informaciju. Tako na primer, novine, ekrani, i zvunici su izlazni mediji, dok tastatura,
mi, mikrofon i kamera ine ulazne medije.
Memorisanje se tie prenosioca podataka koji objedinjuje memorisanje informacije.
Novine, mikrofilmovi, magnetni i optiki diskovi slue za memorisanje informacija.
Kontinualni prenos podataka omoguavaju mediji kao to su optiki kablovi, koaksijalni
kablovi, slobodan vazduni prostor (za beini prenos).
Najzad, poznata je klasifikacija medija na diskretne i kontinualne. Diskretni mediji su
vremenski nezavisni, dok su kontinualni vremenski zavisni. Za diskretne medije (na primer tekst,
grafika) obrada podataka nije vremenski kritina, dok su kod kontinualnih medija predstavljanje
i obrada podataka vremenski zavisni. Na Slici 1.1.1 prikazano je nekoliko primera podataka za
diskretne i kontinualne medije kao i karakteristine primene.
I neki drugi signali mogu takoe da se tretiraju kao multimedijalni podaci. To su, na
primer, izlazi iz razliitih senzora kao to su detektori dima, vazdunog pritiska, temperature
(kontinualni mediji).

MULTIMEDIJALNI PODACI

DISKRETNI

KONTINUALNI

PODACI:

TEKST

MIRNA SLIKA

AUDIO

VIDEO

INTERAKTIVNOST:

NEINTERAKTIVNI

INTERAKTIVNI

NEINTERAKTIVNI

INTERAKTIVNI

PRIMENE,
PRIMERI:

KNJIGE
SLAJDOVI

RAZGOVORI
U MREI

DVD FILMOVI
TV/AUDIO
DISTRIBUCIJA

VIDEO KONFER.
INTERAKTIVNA
TELEVIZIJA

Slika 1.1.1Primeri podataka za diskretne i kontinualne medije i karakteristine primere

1.2 Osobine multimedijalnih sistema


Formalno gledano, svaki sistem koji podrava dva ili vie medija mogao bi se nazvati
multimedijalni. Dnevne novine, na primer, predstavljaju multimedijalnu prezentaciju, jer
obuhvataju tekst i mirnu sliku kao ilustraciju. Bez obzira na sve, multimedijalni sistem treba da
obuhvati i kombinaciju medija, nezavisnost, raunarski podranu integraciju i mogunost
komuniciranja.
Kombinacija medija podrazumeva dva ili vie medija pri emu se ide na specifikaciju
tipova medija. Neki istraivai predlau da postoji najmanje jedan kontinualan (vremenski
zavisan) i jedan diskretan (vremenski nezavisan) medij [1.5]. U tim uslovima, sistem za obradu
teksta, koji moe da inkorporira mirne slike, ne bi predstavljao multimedijalni sistem (oba
medija su diskretna). Pojedini istraivai prihvataju optije definicije multimedija.
Razliiti mediji u multimedijalnom sistemu treba da poseduju visok stepen nezavisnosti.
Ovaj kriterijum obezbeuje nezavisno procesiranje razliitih tipova medija i fleksibilnost
prilikom kombinacije ovakvih medija.
Da bi se postigla nezavisnost medija potrebno je nezavisno procesiranje. to se tie
multimedijalnih sistema, kompjuteri obezbeuju jo jednu vanu osobinu mogunost
integracije. Razliiti mediji u multimedijalnom sistemu trebalo bi da budu integrisani. Visok
stepen integracije obezbeuje da promene sadraja jednog medija dovode do odgovarajuih
promena u drugom mediju. U dananjem visokoumreenom svetu, multimedijalni sistemi mogu

komunicirati meusobno tako to se kroz mreu prenose multimedijalni podaci u diskretnom ili
kontinualnom obliku.

1.3 Konvergencija telekomunikacija i raunara


Konvergencija telekomunikacija i raunara, iji smo svedoci ve due vreme, ima veliki
uticaj na tehnologiju, industriju i ire slojeve drutva [1.6]. Da bi se ovo bolje shvatilo,
usvojiemo model sa tri nivoa za mreu koja slui za prenos informacija, uz mogunost pruanja
odgovarajuih servisa. Pogodan model prikazan je na Slici 1.3.1. pri emu emo za sada samo
navesti middleware i transportni sloj.
APLIKACIJE
MIDDLEWARE
TRANSPORTNI SLOJ
Slika 1.3.1Model sa tri nivoa mree

Middleware sloj slui za stvaranje multimedijalnih aplikacija na brz i robusan nain.


Transportni sloj obezbeuje pouzdan transparentan prenos multimedijalnih podataka izmeu
krajnjih taaka u mrei.
Aplikacije tretiramo kao skup funkcija koje obezbeuju zahteve korisnika. Primeri
mrenih aplikacija su elektronska pota, telefonija, pristup bazi podataka, transfer fajla, video
konferencija. Primeri servisa odnose se na audio ili video transport, upravljanje sistemom fajla,
tampanje, mehanizme elektronskog plaanja, kao i na enkripciju uz pouzdan prenos podataka.
Svaki korisnik u sluaju umreene aplikacije nalazi se u interakciji sa lokalnim
terminalom koji komunicira sa udaljenim raunarima ili drugim korisnicima u mrei. Mrene
aplikacije podrazumevaju interakciju korisnika sa serverom ili sa drugim korisnikom. Na Slici
1.3.2 dati su primeri arhitektura za multimedijalne mrene aplikacije i to: korisnik korisnik na
Slici 1.3.2-a, korisnik dva korisnika na Slici 1.3.2-b, vie korisnika server na Slici 1.3.2-c, i
korisnik server korisnik na Slici 1.3.2-d.
a)

KORISNIK

b)

KORISNIK

KORISNIK
KORISNIK
KORISNIK

c)

KORISNIK
KORISNIK
KORISNIK

S
E
R
V
E
R

d)

KORISNIK
SERVER
KORISNIK

Slika 1.3.2Primeri arhitekture za mrene multimedijalne aplikacije

1.4 Multimedijalni komunikacioni model


Na multimedijalni komunikacioni model strogo utiu reenja proizvoaa opreme za
personalne raunare i radne stanice, ukljuujui odgovarajui aplikacioni softver sa jedne, i
koncept intiligentne mree sa druge strane [1.7]. Slojeviti model za dananje i budue
multimedijalne komunikacije obuhvata pet komponenata:
Deobu kompletnih informacionih objekata prema razliitim vrstama informacija (podaci,
audio, video) radi lakeg komuniciranja, memorisanja i obrade, pri emu se vodi rauna o
mogunosti integracije razliitih tipova multimedija,
Standardizaciju servisnih komponenata zavisno od vrste informacije, po mogunosti sa
nekoliko nivoa kvaliteta,
Stvaranje platforme za dva nivoa: platforme za mreni servis i multimedijalne
komunikacione platforme,
Definisanje optih aplikacija za viestruku namenu u razliitim multimedijalnim
okruenjima,
Specifine primene: elektronske kupovine, uenje na daljinu, pri emu se koristi
platforma za mreni servis i multimedijalna komunikaciona platfoma.
S obzirom na mogunost dostupnosti resursa u svakom pojedinanom sluaju,
multimedijalne komunikacione aplikacije moraju biti skalabilne.
Generalno, multimedijalni komunikacioni model koristi dve vrste komunikacija, kao to
je prikazano na Slici 1.4.1.
KORISNIKI
INTERFEJS

TRANSPORT

KORISNIKI
INTERFEJS

TIP A

PROCESIRANJE,
MEMORISANJE,
PRETRAIVANJE

TRANSPORT

KORISNIKI
INTERFEJS

TIP B

Slika 1.4.1 Dva tipa multimedijalnih komunikacijskih modela

Kod tipa A postoji korisniki interfejs koji obezbeuje da svi korisnici budu meusobno
povezani dok transportni sloj prenosi multimedijalni signal od jednog do drugog korisnika, ili ka
svim korisnicima u komunikaciji. Korisniki interfejs kreira multimedijalni signal i omoguava
korisnicima interakciju na najlaki nain. Transportni sloj uva kvalitet multimedijalnog signala
kako bi ga svaki od korisnika primio na to kvalitetniji nain. Neki od primera za tip A su
telekonferencija, radiodifuzija, videofoni, uenje na daljinu, kao i scenarija koji se odnose na
deobu radnog prostora.
Kod tipa B, postoji korisniki interfejs za interakciju, i transportni sloj za prenos
multimedijalnog signala od memorije do korisnika. Takoe, postoji i mehanizam za memorisanje
i pretraivanje multimedijalnih signala koje kreira, ili zahteva korisnik. Pored memorisanja i
pretraivanja postojeih multimedijalnih podataka, od najveeg znaaja su memorisanje i

auriranje ovih podataka. Neki primeri za tip B ukljuuju difuziju, video, arhive dokumenata iz
digitalne biblioteke, pristup poslovnim sastancima, itd.

1.5 Korisniki zahtevi


Korisniku je potreban multimedijalni informacioni sistem koji priprema i predstavlja
informaciju od interesa, dozvoljava dinamiku kontrolu aplikacija i obezbeuje prirodan
interfejs. Sa take gledita korisnika najvaniji zahtevi multimedijalnih komunikacija su sledei:
Brze pripreme i prezentacije razliitih tipova informacija od interesa, vodei rauna o
sposobnosti i dostupnosti terminala i servisa,
Dinamika kontrola multimedijalnih primena, s obzirom na interakcije konekcije i
kvalitet na zahtev kombinovan sa interfejsima ovek maina,
Podravanje korisnika imajui u vidu njihove individualne mogunosti,
Standardizacija.
Sa take gledita korisnika, njihovi zahtevi u pogledu servisa su definisani putem medija,
sadraja koji se prenose, tipa komunikacija, kao i mogunosti da se kombinuju ova tri faktora. S
druge strane multimedijalni korisniki servisi mogu se podeliti na tri kategorije: lokalni
(neinteraktivni i interaktivni), udaljeni neinteraktivni i udaljeni interaktivni. Takoe se mogu
podeliti na servise za rezidencijalnu, mobilnu i biznis upotrebu. U Tabeli 1.5.1 prikazan je
kontekst u kome se mogu koristiti multimedijalni servisi [1.8].
Uslovi korienja servisa definiu se zavisno od njihove hitnosti, mesta, nezavisnosti.
Terminali i servisi obino se koriste u kancelarijama, kod kue, u prevoznim sredstvima, ili na
javnim mestima. Nezavisnost se moe definisati kao mogunost prenoenja terminala i njegove
nezavisnosti od date infrastrukture, sa take gledita korisnika. Stepen nezavisnosti varira od
jednog do drugog terminala. S druge strane, stepen hitnosti odreuje da li e servis biti
obezbeen u realnom vremenu, ili je dovoljno oflajn servis.
Tabela 1.5.1Kontekst u kome se mogu koristiti multimedijalni servisi
Lokalni
Rezidencijalni: zabava (TV),
umetnost, poduavanje, igre

Udaljeni neinteraktivni
Difuzija

Mobilni: prezentacije,
demonstracije
Biznis: multimedijalna prezentacija,
vebanje, konsultacija baze podataka

Difuzija, bezbednost na daljinu,


monitoring
Telekonferencija,
vebanje na daljinu,
nadgledanje na daljinu

Udaljeni interaktivni
Telefonija, videofoni, kupovina od
kue, igre, konsultacije na daljinu,
video na zahtev
Upravljanje, ugovaranje
Video sastanak, videokonferencije,
uenje na daljinu, upravljanje,
bezbednost na daljinu, monitoring,
daljinska dijagnostika

Postoje mnogobrojni kljuni zahtevi zajedniki za sve multimedijalne servise: trenutna


dostupnost, prenos informacija u realnom vremenu, servis onlajn, pristup terminala bilo kom
servisu, itd.

1.6 Mreni zahtevi


Sa take gledita mree, najvaniji zahtevi multimedijalnih tehnologija ogledaju se u
sledeem:

Velike brzine i promene bitskih protoka,


Nekoliko konekcija koje koriste isti pristup,
Sinhronizacija razliitih tipova konekcija,
Pogodni standardizovani servisi i dodatni servisi koji podravaju multimedijalne
aplikacije.

Zahtevi za primenama u komunikacijskim servisima mogu se podeliti na saobraajne i


finkcionalne zahteve. Saobraajni zahtevi ukljuuju irinu propusnog opsega, kanjenja i
pouzdanost. Mogu se zadovoljiti korienjem upravljanja resursom. Uspostavljaju relaciju
izmeu prenoenja podataka i resursa, i obezbeuju prenos audio-vizuelnih podataka.
Informacija o potrebnim resursima zato mora biti dostupna u svim vorovima koji uestvuju u
distribuiranim aplikacijama, krajnjim i centralnim sistemima, tokom prenosa podataka. Stoga,
resursi treba da budu nezavisni, a u vorovima se uspostavlja takvo stanje koje oznaava da je
veza uspostavljena. Funkcionalni zahtevi podrazumevaju viedifuzni prenos, i sposobnost
definisanja koordiniranih nizova podataka.
Postojee fiksne i mobilne mree karakterisane su takvom arhitekturom koja obezbeuje
upravljanje saobraajem, razliitim konfiguracionim mogunostima, servisnim platformama i
dobro definisanim takama interkonekcije izmeu mree razliitih operatora. Kljuni zahtev
svodi se na to da bi isti visokokvalitetni mreni servisi trebalo da postoje kada se grade
integrisane mrene platforme za govor, podatke i multimedijalne servise [1.9].
Budua multimedijalna mrea mora da bude tako organizovana da podri intenzivan
saobraaj, iroku lepezu servisa i razliite oblike saobraaja, kada je re o efikasnom rutiranju
saobraaja i preoptereenju u mrei. Mrea se mora, takoe, brzo adaptirati na stalne promene
saobraajnih uslova.

1.7 Multimedijalni terminali


Multimedijalni terminali slue za pretraivanje, memorisanje i difuziju pisanog sadraja
(podaci), zvuka i vizuelnog sadraja. Arhitektura ovih sistema moe se definisati na osnovu
razliitih prilaza na bazi obrade telekomunikacionih podataka i audio-vizuelnih tehnologija.
Ukljuivanjem glasa i podataka, kao i mirne i pokretne slike u komunikacije, raste sofisticiranost
u pogledu pristupa distribuiranim resursima, uz znaajnu utedu vremena u procesu odluivanja.
Dijalog na daljinu, diskusija, proizvodnja informacija, odravanje i nadzor, omogueni su
uvoenjem multimedijalnih sistema po ceni koja stalno opada. Postojea reenja nude, na primer,
multimedijalnu kancelariju, ili kompjutersku radnu stanicu sa strogo namenskom opremom, kao
to su telefonski terminali, videofoni, ili telekonferencijski sistemi. Multimedijalna radna stanica
u kunom i kancelarijskom okruenju prikazana je na Slici 1.7.1 na nivou blok-eme. Set top
box je ureaj koji se primenjuje na standardni TV prijemnik i omoguava prijem digitalnih TV
signala, pristup internetu, itd. Sabirna magistrala predstavlja jednu ili vie provodnika koji slue
kao zajednika veza za prenos signala izmeu odreene grupe ureaja. Eternet mrea koristi tzv.
7

postupak viestrukog pristupa uz detekciju (eng. carrier sence multiple access with collision
detection CSMA/CD).
BRZA EKSTERNA MREA
LAN, KABLOVSKA, SATELITSKA

LAN/ETERNET MREA

TF LINIJA
Set Top Box

MODEM

KAMERA

SABIRNA MAGISTRALA

VIDEO
RIKORDER

RAUNAR

INTERAKTIVNA
TV

KANCELARIJSKO/
KUNO OKRUENJE

KUNO OKRUENJE

Slika 1.7.1Blok-ema multimedijalne radne stanice u kunom i kancelarijskom okruenju

Dananji terminali osposobljeni su za irokopojasne multimedijalne aplikacije. Radi se o


personalnim raunarima uz dodatne telekomunikacione i video audio mogunosti, kao i o
inteligentnim TV prijemnicima uz dodatne mogunosti interaktivnosti. Istovremeno, televizija
visoke rezolucije (eng. high-definition television HDTV) utrla je put digitalnoj televiziji.
Obezbedila je memorisanje, procesore za mirnu sliku i video, kao i ravne ekrane [1.10].
Oprema za multimedijalni terminal sadri, takoe, odgovarajue kamere, skenere,
tampae i memoriju. Pored toga, potrebna je i specijalna oprema za editovanje multimedijalnih
informacija to podrazumeva kreiranje, naizmenino ponavljanje i ponitavanje struktura
sadraja. Ureaji za trodimenzionalni (eng. three-dimesional 3D) displej i sistem za
prepoznavanje govora olakae bru i laku interakciju oveka sa multimedijalnim promenama.
Radi se o tome da se postigne to laka integracija svih oblika informacija, uz obezbeenje
odgovarajuih bitskih brzina.

1.8 Paketski transfer


U poreenju sa komutacijom kanala, paketska komutacija prua dinamiku alokaciju
(raspored) irina propusnog opsega i komutacionih resursa. Paketske mree omoguavaju
transport integracionog servisa. One prenose glas, video i podatke koristei iste hardverske
protokole. Uz to, paketska komutacija ne zahteva od korisnika da alocira kanal ili irinu
propusnog opsega prenosa podataka. Poto vie korisnika moe da alje pakete po zajednikom
kanalu, resursi u paketskim mreama koriste se efikasnije nego u mreama sa komutacijom
8

kanala. Video signali su naroito pogodni za paketsku komutaciju. Slike obino sadre oblasti sa
vie ili manje detalja, kao i periode brih i sporih pokreta. Otuda, video kanali treba da budu u
stanju da daju nizove podataka sa promenljivim bitskim protokom [1.11], [1.12]. Paketske mree
prenose direktno signale promenljivih bitskih brzina (eng. variable bit rate VBR). Na strani
predajnika nije potrebna bafer memorija niti kontrola bitskog protoka u povratnoj sprezi. Pod
bafer memorijom podrazumeva se mesto za skladitenje podataka koji se koriste u toku obrade i
prenosa. U principu, bafer se koristi i pri povezivanju mrea za kompenzaciju razlike u brzini
obrade signala izmeu mrenih ureaja. Treba naglasiti i to da paketske mree koje obezbeuju
prioritet paketima istovremeno omoguavaju video koderima da zatite kritinu informaciju.
Takoe, paketski video-transfer kroz mreu za asinhrono multipleksiranje sa vremenskom
raspodelom kanala (eng. asynchronous time division multiplexing ATDM) vremenski
multipleks ili internet, podrazumeva kodovanje i prenos digitalnog video signala pri emu se
vodi rauna o kvalitetu prijemnog signala. U principu, ATDM podrazumeva tehniku
multipleksiranja kod koje se prenos ostvaruje u obliku nezavisnih vremenskih intervala koji se
popunjavaju oznaenim paketima saglasno realnim trenutnim potrebama svake aplikacije. U tom
sluaju, terminalna oprema (tj. korisnika aplikacija) definie trenutni bitski protok, bez obzira
na to koliko on iznosi, a koji se moe menjati u toku trajanja same komunikacije. Na Slici 1.8.1
dat je jedan primer za transfer digitalnog video signala.
VIDEO SIGNAL
KODER
- TRANSFORMACIJA
- KVANTIZACIJA
- ENTROPIJSKO KODOVANJE
- KONTROLA BINARNOG PROTOKA
APLIKACIJA
- STRUKTURIRANJE PODATAKA
MRENO MULTIPLEKSIRANJE/RUTIRANJE
- KOREKCIJA
GREAKA UNAPRED

- DETEKCIJA GREAKA
- DETEKCIJA GUBITAKA
- KOREKCIJA GREKE

APLIKACIJA
- RESINHRONIZACIJA
DEKODER
- ENTROPIJSKO DEKODOVANJE
- INVERZNA TRANSFORMACIJA
- PRIKRIVANJE GUBITAKA
- POSTPROCESIRANJE
- DEKVANTIZACIJA
KORISNIK
Slika 1.8.1Operacije prilikom paketskog transfera digitalnog video signala

U mreama sa internet protokolom, paketi su promenljive duine i ne postoji prethodno


uspostavljanje putanje ruta. Kanjenje i paketski gubici neizbeni su [1.13], [1.14]. Internet
protokol (eng. internet protocol IP) slui za meumreni rad koji obezbeuje nekonektivni

servis kroz vie mrea sa komutacijom paketa. IP obezbeuje funkcije adresiranja, specifikacije
tipa servisa, rastavljanje i ponovno sastavljanje i zatite. IP je specificiran u dokumentu Zahtev
za komentar REC791 (eng. request for comment REC). REC-ovi predstavljaju standarde i
preporuke na osnovu kojih funkcionie internet. Ove preporuke objavljuje Grupa za IP standarde
(eng. Internet Engineering Task Force IETF). Ova meunarodna organizacija za standarde
sastoji se od preko 80 radnih grupa i bavi se oblastima vezanim za razvoj protokola kontrole
prenosa/internet protokola (eng. transmission control protocol/internet protocol TCP/IP).
Protokol je razvijen u SAD od strane Ministarstva odbrane, za potrebe meunarodnog rada na
sloju 3(IP) i pouzdanog prenosa na sloju 4 za dvoslojno bezbedno rutiranje (eng. two-level
secure re-routing TSR) zasnovan na klizeem prozoru i retransmisijama. Danas se ova
skraenica koristi za referenciranje na itavu grupu protokola na internetu.
Najbolji izbor za video-transfer je statistiko multipleksiranje uz garanciju kvaliteta. Novi
spojni putevi u mrei su obezbeeni ukoliko se moe unapred garantovati traeni kvalitet,
imajui u vidu optereenje mree na bazi utvrenog saobraajnog toka.

1.9 Rezime
Trend u multimedijalnim komunikacijama ogleda se u obezbeenju servisa koji integriu
tekst, zvuk, mirnu i pokretnu sliku, uz jednostavnost upotrebe i odgovarajuu interaktivnost. S
druge strane, termin multimedijalne komunikacije odnosi se na predstavljanje, memorisanje,
pretraivanje i irenje vremenski obraene informacije u obliku teksta, mirne i pokretne slike,
grafike, govora, zvuka, animacije, rukom pisanog teksta, fajlova podataka, kao to je to
prikazano na Slici 1.9.1.
AUDIO KOMUNIKACIJA
(TELEFONIJA, PRENOS ZVUKA)
PRENOS TEKSTA I
MIRNE SLIKE

MULTIMEDIJALNA
KOMUNIKACIJA

PRENOS
PROMENLJIVIH
SLIKA

Slika 1.9.1Multimedijalna komunikacija

Osnovni elementi komunikacionih modela su: obrada, memorisanje, pretraivanje,


transport i korisniki interfejs. to se tie korisnika, njemu je potreban sistem koji priprema i
predstavlja informaciju, omoguuje dinamiko upravljanje odgovarajuim informacijama i
obezbeuje interfejs. S take gledita mree, najvaniji zahtevi odnose se na velike bitske
protoke, sinhronizaciju razliitih tipova informacija i na odgovarajue standardizovane servise.
Opte funkcije mree kod paketskog transfera od izvora do korisnika su rutiranje i
multipleksiranje. Rutiranjem se obezbeuje povezanost vorova u mree nezavisno od tipa
informacije koja se prenosi. Multipleksiranjem se obezbeuje kvalitet prenosa. Pri tome treba
uzeti u obzir saobraajne karakteristike i kvalitet aplikacija koje zahteva korisnik.

10

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.

ta je to multimedija?
Koje faktore treba uzeti u obzir pri razmatranju problematike multimedijalnih
tehnologija?
Kakva je funkcija aplikacionog i mrenog sloja u multimedijalnim komunikacijama?
Navesti i analizirati kriterijume prema kojima se sprovodi klasifikacija medija.
Koje elemente treba da obuhvati jedan multimedijalni sistem?
ta su to kontinualni mediji i kako se ukljuuju u multimedijalni sistem?
U emu se ogleda znaaj nezavisnosti medija u okviru multimedijalnog sistema i kako
se ona postie?
Nacrtati etiri blok-eme arhitekture za mrene multimedijalne aplikacije.
Koje komponente sadri slojeviti model za multimedijalne komunikacije?
Oblici multimedijalnih komunikacionih modela: uloga i znaaj pojedinih elemenata.
Navesti odgovarajue blok-eme.
Koji su najavaniji zahtevi multimedijalnih komunikacija sa take gledita korisnika?
Koje su sve kategorije multimedijalnih komunikacionih servisa?
Koji su uslovi korienja multimedijalnih servisa?
ta su osnovni zajedniki zahtevi kod uvoenja multimedijalnih servisa?
Koji su najvaniji mreni zahtevi multimedijalnih komunikacija?
Koja je razlika izmeu saobraajnih i funkcionalnih zahteva u multimedijalnoj mrei?
Koje uslove u pogledu organizovanosti treba da ispuni jedna multimedijalna mrea?
Koje su funkcije multimedijalnih terminala?
Navesti neophodnu opremu za multimedijalne terminale.
Koje su karakteristike paketskog transfera multimedijalnih podataka?
ime se karakterie paketski video transfer kroz mreu za asinhrono multipleksiranje
sa vremenskom raspodelom kanala?

Literatura
[1.1]
[1.2]
[1.3]
[1.4]
[1.5]
[1.6]

M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
N. Chapman and J. Chapman, Digital Multimedia. Wiley, 2000.
T. N. Ryman, Computers learn to smell and taste, Expert Syst., vol. 12, no. 2, pp.
156161, May 1995.
R. Steinmetz and K. Nahrstedt, Multimedia: Computing, Communications and
Applications. Prentice Hall, 1996.
D. G. Messerschmitt, The convergence of telecommunications and computing: what

11

[1.7]
[1.8]
[1.9]
[1.10]
[1.11]

[1.12]

[1.13]
[1.14]

are the implications today? Proc. IEEE, vol. 84, pp. 11671186, 1996.
K. Watabe et al., Distributed desktop conferencing system with multiuser multimedia
interface, IEEE J. Sel. Areas Commun., vol. 9, pp. 531539, May 1991.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems; Techniques, Strandardes, and Netwoks. Prentice Hall, 2002.
E. Fouques, Switching and routing: providing value with multimedia services, Alcatel
Telecommun. Rev., no. 3, pp. 198204, 1999.
Z. S. Bojkovi, Digital HDTV system compression, J. Commun., vol. 45, pp. 210,
MayJun. 1994.
L. Chiariglione and L. Corgnier, System consideration for picture communications, in
Proc. IEEE Int. Conf. on Communications, ICC '84, Amsterdam, Netherlands, pp. 245
249.
Z. S. Bojkovi, Some issues in packet video: Modeling, coding and compression, in
2nd Int. Workshop Image and Signal Processing: Theory, Methodology, Systems and
Applications, Budapest, Hungary, Nov. 1995, pp. 223.
G. Karlsson, Asynchronous transfer of video, Swedish Institute of Computer Science,
Kist, Sweden, Res. Rep. R95:14, 1997.
P. White and J. Groweroft, The integrated services in the Internet: State of the Art,
Proc. IEEE, vol. 85, pp. 19341946, Dec. 1997.

12

2. OSNOVI AUDIA
2.1 Karakteristike zvuka
Kada proizvedeni zvuni talas doe do uha i obradi ga mozak, ujemo zvuk. Zvuk, kao i
svaki talas, ima osobine koje ukljuuju refleksiju, refrakciju i difrakciju. Zvuni talas ima svoju
frekvenciju, amplitudu (glasnost) i anvelopu (talasni oblik). Audio sistemi su uneli mnogo
specifinih karakterisitka koje su rezultat izuzetnih zahteva ula sluha kao krajnjeg korisnika
zvunih informacija. Izvesne specifinosti proizilaze kao posledica velikog informacionog polja
koje je odreeno rasponom dinamikog opsega reda veliine 100 dB i vie, uz frekvencijski
opseg irine od 20 Hz do 20 kHz. Treba dodati i injenicu da ulo sluha ima veliku osetljivost i
detekciju razliitih vrsta izoblienja signala. Frekvencijski opseg zvuka moe se podeliti u etiri
kategorije:

Infra zvuk: od 0 Hz do 20 Hz,


Zvuk koji se uje: od 20 Hz do 20 kHz (audio opseg),
Ultrazvuk: od 20 kHz do 1 GHz,
Hiperzvuk: od 1 GHz do 10 GHz.

Audio opseg se razlikuje od osobe do osobe, a reakcija uha na zvuk visoke frekvencije
pogorava se starenjem. Srednjoveni ljudi, sa dobro ouvanim slunim sistemom, uju zvuke
frekvencije iznad 15 kHz. Zvuni talasi prostiru se brzinom od 340 m/s pri sobnoj temperaturi
(20 C). Stoga, talasna duina varira od 17 m (odgovara frekvenciji od 20 Hz) do 1.7 cm
(odgovara frekvenciji od 20 kHz). Spektar audio signala sadri frekvencije, njihove harmonike,
mogue je i modulacione produkte. Najvei broj osnovnih frekvencija zvunih talasa je ispod
5 kHz. Zvuni talasi u opsegu 5 kHz do 15 kHz uglavnom se sastoje od harmonika. Harmonici i
njihove amplitude odreuju kvalitet zvuka. To omoguuje da se razlikuju zvuci koji dolaze iz
razliitih izvora (glas, muziki instrument, npr. klavir ili gitara). Intezitet ili amplituda zvuka
odgovara glasnosti kojom ga uho registruje. Za zvuk ili audio-registrovanje i reprodukciju,
intezitet zvuka se izraunava na dva naina. Najpre se moe izraziti na akustinom nivou, to
predstavlja intezitet koji uho registruje. Drugo, moe se izraziti na elektrinom nivou, jer je zvuk
konvertovan u elektrini signal. U oba sluaja, intezitet se izraunava u dB. Akustiki, intezitet
zvuka meri se preko nivoa zvunog utiska, tj.,

13

P
Intenzitet zvuka ( dB ) = 20 log10

Pref

gde je
P
Pref

(2.1.1)

akustina snaga zvuka,


intenzitet zvuka na pragu ujnosti.

Utvreno je da je karakteristina vrednost za Pref = 0.0002 dyn/cm2 [2.1] ili Pref = 2 105 Pa.
Ova vrednost se koristi u (2.1.1) za obraivanje intenziteta zvuka. Treba istai da je uho
neosetljivo na nivoe zvunog pritiska manje od Pref . Intezitet audio signala izraava se preko
nivoa elektrine snage, tj.,
P
Intenzitet zvuka ( dBm ) = 10 log10
P0

gde je
P
P0

(2.1.2)

snaga audio signala,


1 mW.

Sufiks m u dB stavljen je zato to se intezitet zvuka menja u odnosu na snagu od 1 mW. Na


Slici 2.1.1 prikazane su granice ujnosti i podruja govora i muzike.

Slika 2.1.1Granice ujnosti i podruja govora i muzike

Vana karakterisitka zvuka je njegova anvelopa. Tipina anvelopa sastoji se iz etiri


sekcije: porast, opadanje, podrka i vraanje na poetnu vrednost amplitude. Jedan primer za
muziku notu dat je na Slici 2.1.2.
U toku porasta anvelope, intezitet zvuka raste do najvieg nivoa, zatim opada do nekog
srednjeg nivoa na kome je podeen u odreenom vremenskom periodu. Posle odreenog
vremena, intezitet zvuka opada na poetnu vrednost.

14

Slika 2.1.2Anvelopa za muziku notu

Za efikasnu analizu govora kao jedne od najvanijih multimedijalnih kategorija, treba


poznavati principe ljudskog vokalnog sistema. Meutim to izlazi iz okvira ove knjige, pa emo
se vie baviti efikasnim predstavljanjem govora i s tim u vezi najpre emo razmotriti osobine
oveijeg slunog sistema.

2.2 Neke karakteristike oveijeg slunog sistema


Uho i njemu pridruni nervni sistem kompleksan je interaktivni sistem. S jedne strane,
uho je osetljivo na mala izoblienja u signalu. S druge strane, zanemaruju se izoblienja za koje
se pretpostavlja da su irelevantna. Ove osobine omoguuju da se postigne dobra kompresija radi
efikasnog memorisanja audio signala. Treba naglasiti i to da kod slunog sistema postoji
izbalansiranost izmeu frekvencijske i vremenske razlike.
Utveno je da zvuk treba da postoji najmanje 1 ms pre nego to bi se mogao uti.
Osetljivost zvuka smanjuje se u prisustvu drugog zvuka sa slinim frekvencijskim sadrajem.
Ovaj efekat je poznat kao maskiranje i prikazan je na Slici 2.2.1.

Slika 2.2.1Efekat maskiranja

15

Jak ton pri zadatoj frekvenciji moe da maskira slabije signale koji odgovaraju susednim
frekvencijama, to je prikazano na Slici 2.2.1. Dakle, ovde jak ton maskira druge blisko
rasprostranjene slabije tonove.
Frekvencijska rezolucija uha nije uniformna u celom audio-spektru od 20 Hz do 20 kHz.
Osetljivost je najvia na niskim frekvencijama i opada na viim frekvencijama.
Na niskim frekvencijama uho moe da razlikuje izdvojene tonove od nekoliko Hz.
Meutim, na viim frekvencijama, tonovi se moraju razlikovati za stotine Hz da bi se mogli
registrovati.
Kombinovanjem frekvencijske osetljivosti i uma maskiranja dobija se prag ujnosti.
Svaki audio signal ija je amplituda ispod praga maskiranja ne uje se.

2.3 Registrovanje audia


Zvuk se generie i procesira na razliite naine. U toku govora, zvuni talas generie
osoba, a uje je slualac. U tom sluaju, nije potrebna automatska obrada zvuka. Meutim,
obrada i memorisanje zvuka potrebni su kod mnogobrojnih primena, na primer, radiodifuzija i
muzika industrija. U ovim primenama proizvedeni audio signali su memorisani za pretraivanja
u budunosti i tzv. playback. Registrovanje zvuka podrazumeva izvor, sluaoca i okruenje.
Zvuk se reflektuje od okolnih objekata. Slualac uje zvuk direktno iz izvora kao i reflektovani
zvuk. Ostale komponente zvuka doprinose tzv. zvunom ambijentu. Ambijent se stvara
refleksijama u zatvorenim prostorima kao to su to, na primer, koncertne dvorane. U manjim
prostorijama moe biti vie refleksija, a nijedna od njih ne kasni toliko da bi proizvodila eho koji
predstavlja diskretno ponavljanje dela zvuka, koji i dalje postoji u prostoriji, sve dok se
postepeno ne izgubi, usled parcijalne apsorpcije koja nastaje prilikom svake refleksije. Na
primer, kada se u praznoj dvorani vikne zdravo, najverovatnije e se uti zdravo-o-o-o-o.
Ovaj fenomen naziva se reverberacija i doprinosi oseaju prostora. Znaajan je kod reprodukcije
zvuka. Na primer, ako zvuk dolazi direktno sa muzikog instrumenta bez reverberacije inie se
kao da zvuk ne postoji.
Kada uho primi zvuk, mozak dekoduje dva rezultujua signala i odreuje direktivnost
zvuka. Registrovanje i reprodukcija zapoeti su preko jednog audio-kanala (mono-audio). Ubrzo
se pokazalo da se direktivnost zvuka moe znaajno poboljati korienjem dva audio-kanala
(stereo zvuk). Vie audio-kanala dalje poboljava prostorni oseaj zvuka.
Utveno je da se realnija reprodukcija zvuka dobija sa jednim ili vie kanala reprodukcije
koji emituju (proizvode) zvuk iza sluaoca. To je princip tzv. okruujueg zvuka (eng.
surround sound) koji se iroko primenjuje kod bioskopskih i pozorinih predstava.

2.4 Predstavljanje audio signala


Postoje dva naina za prikazivanje audio signala: pomou talasnog oblika i parametarski.
U prvom sluaju vano je tano predstaviti proizvedeni audio signal, dok se pri parametarskom
predstavljanju vri modulisanje procesa generisanja signala. Tu postoje dve metode:
Sinteza govora modulisanjem ljudskog vokalnog sistema i
Muzika sinteza.
16

Prva metoda primenjuje se u najveem broju sluajeva kako bi se postigao to manji bitski
protok. Druga metoda se koristi u okviru standarda za digitalni interfejs za muziki instrument
(eng. musical instrument digital interface MIDI).
Audio izvor

Uho

REGISTROVANJE
AUDIA
(MIKROFON)

PLAYBACK
GOVORNIK

ODMERAVANJE I
KVANTOVANJE
(DIGITALIZACIJA)

MEMORISANJE
ILI
PRENOS

PRIJEMNIK

DIGITALNO
ANALOGNA
KONVERZIJA

Slika 2.4.1Generisanje audia i playback-a

Karakteristina blok-ema za generisanje audio signala i playback data je na Slici 2.4.1.


Jedan ili vie mikrofona koristi se za konverziju akustine energije (nivoa zvunog pritiska) u
elastinu energiju (u vatima). Napon proizveden na izlazu iz mikrofona odmeravan je i
kvantovan. Digitalni audio signal proizveden na taj nain memorisan je kao audio fajl ili je
prenesen do prijemnika za playback postupak.
Digitalni audio je konvertovan u vremenski promenljivi analogni napon koji se dovodi ka
jednom ili vie govornika. Da bi se postigao eljeni kvalitet reprodukovanog audio signala,
elementi blok-eme za generisanje audia i playback moraju biti paljivo odabrani, u skladu sa
odgovarajuim standardima. O samom postupku digitalizacije, kasnije e biti vie rei.
Muziki zvuci razlikuju se od ostalih po nainu na koji se mogu generisati. Na primer,
muzike zvuke moe kreirati vie muziara. To je doprinelo uvoenju MIDI standarda [2.3],
[2.4]. U ovom standardu je deo muzike predstavljen nizom brojeva. MIDI sistem sastoji se iz
etiri podsistema: kontroler, sintisajzer, sekvencer i zvuni modul. Muziki ureaj generie MIDI
signal. Sintisajzer kreira zvuke elektronskim putem. Sekvencer je ureaj ili kompjuterski
program koji registruje MIDI signal koji odgovara muzikom performansu. Zvuni modul
proizvodi prethodno registrovane odzive koje stvara MIDI kontroler. Na Slici 2.4.2 prikazan je
MIDI sistem. Muziar svira na tastaturi MIDI kontrolera [2.5].
Kada se aktivira tastatura kontrolera, on alje odgovarajui kod za kreiranje muzike. Ovaj
kod prihvata zvuni modul koji ima nekoliko ton-generatora. Ovi ton-generatori stvaraju zvuke
koji odgovaraju razliitim instrumentima (na primer klavir, gitara, bubnjevi). Zvuni modul je
povezan sa sekvencerom koji registruje MIDI signal koji moe biti sauvan na flopi disku, CD-u,
ili hard disku.
Muzika se efikasno predstavlja koristei MIDI standard. Meutim, MIDI fajl moe da
prui razliite kvalitete zvuka zavisno od playback hardvera. Na primer, deo MIDI sekvence
moe da odgovara odreenoj noti na klaviru. Ukoliko je kvalitet klavira lo, ili ako klavir nije
natimovan, zvuk sa klavira moe da ne bude visokog kvaliteta.

17

MIDI SIGNAL

SEKVENCER

ZVUNI MODUL
MIDI
SIGNAL

KONTROLER
Slika 2.4.2Uproena blok ema MIDI sistema

Jo jedan problem sa MIDI standardom je u tome to se izgovoreni dijalozi ili pesme


teko mogu predstaviti u parametarskom obliku. Otuda, ljudski glas treba predstaviti
odmerovanim podacima u MIDI fajlu. To poveava veliinu MIDI fajla.

2.5 Rezime
Zvuk ima osobine koje ukljuuju refleksiju, refrakciju i difrakciju. Audio sistemi imaju
mnogo specifinih karakteristika koje proizilaze iz zahteva ula sluha kao krajnjeg korisnika
zvunih informacija. Na primer, uho ima veliku osetljivost na percepciju razliitih vrsta
izoblienja signala. Audio opseg kree se od 20 Hz do 20 kHz. Zvuni talasi u opsegu 5 kHz do
15 kHz sastoje se iz harmonika. Harmonici i njihove amplitude odreuju kvalitet zvuka. Uho i
njemu pridruni nervni sistem predstavljaju kompleksan interaktivni sistem. Uho je osetljivo na
mala izoblienja u signalu, a zanemaruje one za koje se predpostavlja da su izoblieni. Ove
osobine omoguuju da se postigne dobra kompresija radi kvalitetnijeg memorisanja audio
signala. Osetljivost na zvuk se smanjuje u prisustvu drugog zvuka sa slinim frekvencijskim
sadrajem. Ovaj efekat je poznat kao maskiranje. Frekvencijska rezolucija uha nije uniformna u
celom audio spektru. Osetljivost je najvia na niskim frekvencijama i opada na viim
frekvencijama. Obrada i memorisanje zvuka potrebni su u mnogim primenama (radiodifuzija,
muzika industrija, itd.). Za registrovanje zvuka potrebni su izvor, sluaoci i okruenje. Zvuk se
reflektuje od okolnih objekata. Slualac uje zvuk direktno iz izvora, kao i reflektovani zvuk.
Ostale komponente zvuka doprinose tzv. zvunom ambijentu. Eho predstavlja diskretno
ponavljanje dela zvuka u odreenoj prostoriji koji se postepeno gubi usled parcijalne apsorpcije
nastale prilikom svake refleksije zvuka. Fenomen reverberacije zvuka doprinosi oseaju prostora
i znaajan je kod reprodukcije zvuka. Audio signal se moe prikazati pomou talasnog oblika
parametarski (sintezom govora i muzikom sintezom). Muzika se predstavlja koristei MIDI
standard. to se tie MIDI sistema on se sastoji iz kontrolera, sintisajzera, sekvencera i zvunog
modela.

Pitanja
1.
2.
3.

Koje su osobine zvuka?


ime se karakterie zvuni talas?
Kako se deli frekvencijski opseg zvuka?

18

4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

U kojim granicama varira talasna duina zvuka i kako se ona odreuje?


ta utie na kvalitet zvuka?
Kako se izraunava intezitet zvuka?
Skicirati dijagram granice ujnosti i podruja govora i muzike.
Navesti sekcije iz kojih se sastoji anvelopa zvuka. Skicirati mogui grafik.
Objasniti efekat maskiranja zvuka.
Kako se postie efikasno memorisanje audio signala?
Kako se ponaa uho u pogledu registrovanja tonova na niskim i visokim
frekvencijama?
ta je to reverberacija zvuka i kako se manifestuje?
Na koji nain se poboljava prostorni oseaj zvuka?
Kako se moe prikazati audio signal?
ta je to MIDI?
Kako izgleda blok-ema za generisanje audio signala i playback?
Nacrtati uproenu blok-emu MIDI sistema i opisati najvanije funkcionalne delove.
Koji su nedostaci MIDI standarda?

Literatura
[2.1]
[2.2]
[2.3]
[2.4]
[2.5]

M. T. Smith, Audio Engineer's Reference Book. 2nd ed. Oxford, Focal Press, 1999.
D. R. Begault, 3-D Sound for Virtual Reality and Multimedia. Cambridge, MA:
Academic Press, 1994.
B. Bartlett and J. Bartlett, Practical Recording Techniques. 2nd ed. Focal Press, 1998.
J. Rothstein, MIDI: A Comprehensive Introduction. 2nd ed. Madison, WI, A-R Editions,
1995.
M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.

19

3. VIZUELNI EFEKTI
Kada udaljeni objekat vibrira, stvara kontrakciju i ekspanziju medijima u okruenju. Pri
tome nastaje zvuni talas koji detektuje ljudsko uho da bi se osetilo prisustvo objekta. Meutim,
kada objekat ne vibrira, ili ne postoji medijum kroz koji se prenose vibracije, uho nee biti u
stanju da oseti prisustvo objekta. Sreom, priroda nas je podarila jo jednim senzorom okom
koje moe da detektuje elektromagnetne (eng. elektromagnetic EM) talase koji dolaze sa
objekta. Od svih naih ula, oko je najefikasniji prijemnik informacija. Savremeni industrijski
svet veoma je orijentisan prema vizuelnoj komunikaciji. iroko je rasprostranjeno miljenje da se
70 % informacija koje dobijamo, prenosi posredstvom ula vida. Otuda je oko najvaniji senzor
u poreenju sa ostalim senzorima, kao to su ulo sluha, mirisa, dodira ili ukusa.
Uzimajui u obzir da se kao krajnji korisnik video informacije pojavljuje ulo vida,
naveemo najpre neke njegove karakteristike. Kako u procesu digitalne obrade slike izvesnu
panju treba posvetiti vidljivosti uma, pojasniemo i ovaj problem.
Poznato je da multimedijalne aplikacije sadre ili generiu slike koje e posmatrati ovek
[3.1], [3.15]. Meutim, ljudsko ulo vida nije dovoljno ispitano. Takoe, ne postoji objektivna
mera kvaliteta koja odgovara ljudskoj proceni o kvalitetu slike. Sreom, istraivanja u oblasti
perceptualne psihologije obezbeuju neka vana saznanja o vizuelnom sistemu.
Na Slici 3.1 prikazana je graa ljudskog oka.

Slika 3.1Graa ljudskog oka

Mrenjaa (retina) je prekrivena fotoreceptorskim elijama. One apsorbuju svetlost od slike koju
na mrenjai fokusiraju lea i ronjaa. Fotoreceptorske elije generiu elektrine impulse koji

20

putuju ka mozgu kroz optike nerve, od kojih se svaki sastoji od oko milion vlakana. Ove elije
su najgue u podruju ute mrlje (fovea). Kad je svetlost slaba, otvor zenice je vei, pa je
svetlost rasuta po veem delu mrenjae i slika je loije fokusirana. Postoje dve vrste
fotoreceptorskih elija, tapii (eng. rods) i unii (eng. cones). Nazive su dobile po njihovom
izgledu. tapii su mnogo osetljiviji i omoguavaju monohromatski vid nou. S druge strane,
unii omoguavaju gledanje u boji, ali samo pri jakom nivou osvetljaja. Postoje tri vrste unia.
Oni dele vidljivi spektar u tri opsega: crveni, zeleni i plavi. Zbog toga su ove tri boje oznaene
kao osnovne boje ljudskog vida. Oko opisuje boju uporeujui odzive svih tipova unia. Zbog
razliite gustine unia osetljivih na crvenu, plavu i zelenu boju, ukupna osetljivost oka je
najvea na zelenu, a najslabija na plavu svetlost. Meutim, ova osetljivost dolazi po cenu
slabijeg raspoznavanja u opsegu zelene boje. Na primer, u mikroskopiji se koriste filteri da bi se
izdvojila samo zelena boja, jer je oko najosetljivije na zelenu boju. Grubo govorei, oko moe da
vidi boje u opsegu od 400 nm do 700 nm. Pitanje koje se esto postavlja je: koja proporcija
crvene, plave i zelene boje odgovara svetlosti jedinstvene talasne duine. Na to pitanje nema
odgovora zbog nekoliko razloga. Pre svega, oseaj boje zavisi od percepcije oveka i opsega
promena od osobe do osobe, a takoe zavisi od ambijenta posmatranja. Od uticaja su i irina i
preklapanja opsega osetljivosti tri navedena tipa unia to znai da se isti oseaj boje moe
dobiti sa mnogo razliitih kombinacija talasnih duina.

3.1 Neke karakteristike ula vida


oveije ulo vida moe se smatrati diskretnim sistemom koji karakteriu odreeni
pragovi razlikovanja, gradacije sjaja kritine duine trajanja nadraaja. Zbog strukture mrenjae
koja se sastoji od oko 800 000 receptivnih polja obrazovanih od grupe foto-receptora u okviru
kojih oko ne moe da razlikuje prostornu konfiguraciju svetlosnog nadraaja, kao i zbog prenosa
informacije od oka do modanih centara, kontinualna povrina slike se razlae u oku na diskretne
elemente. Neprekidnost povrine slike je samo iluzija ula vida. Gledalac nee biti u stanju da
primeti razliku ako se slike realnih predmeta zamene diskretnim slikama sastavljenim od
elemenata razliitih gradacija slike.
Vizuelna percepcija oka nije podjednaka za komponente visokih i niskih uestanosti. Oko
je veoma osetljivo na komponente niskih uestanosti i ta osetljivost opada sa porastom
uesanosti. Pored toga, oko nije podjednako osetljivo na sve komponente vidnog spektra [3.1].
Krive a) i b) na Slici 3.1.1 predstavljaju relativnu osetljivost oka pri normalnoj i pri vrlo slaboj
svetlosti u funkciji od talasne duine . Pri dnevnoj svetlosti, kao to se vidi, oko je najosetljivije
za radijacije talasne duine od 555 nm. Prelaenje sa jedne krive osetljivosti na drugu vri se
automatski i naziva se prilagoenje oka. Da bi gledalac imao utisak da gleda prirodnu sliku,
dovoljno je da odnos maksimalnog i minimalnog sjaja na ekranu bude isti kao i u originalu.
Najmanja promena sjajnosti Bp koju oko mee da zapazi, zavisi od apsolutne sjajnosti
B. Pri poveanju B, poveava se i Bp, Pa stoga odnos Bp/B ostaje konstantan. Odnos B/Bp
predstavlja meru osetljivosti oka za zapaanje kontrasta. Prag kontrasta Bp/B menja svoju
vrednost sa promenom povrine i vremena trajanja nadraaja. Ukoliko promena sjaja jednog ili
vie elemenata mozaika slike na ekranu ne premauje prag kontrasta ula vida, gledalac ne
primeuje izoblienje.
Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks koji pada na
mrenjau naglo povea, potrebno je da proe izvesno vreme pa da se u mozgu stvori utisak

21

odgovarajue sjajnosti. Produenje oseaja po prestanku pobude ili persistencija predstavlja


znaajnu karakteristiku oka. Pri odreenoj adaptaciji, persistencija je kraa ako je intenzitet
pobude vei.

Slika 3.1.1Relativna osetljivost oka u funkciji talasne duine, a) svetlost normalne jaine,
b) vrlo slaba svetlost

Sledea znaajna karakteristika vida je mo razlaganja oka tj. sposobnost raspoznavanja


sitnih detalja. Na raspoznavanje detalja, osim kontrasta i otrine, utie i adaptacija oka kao i
dinamika slike. Broj detalja nekog objekta mnogo je vei kada je objekat stacionaran, nego kada
se brzo kree. Kada postoji mala razlika u nivou sjaja izmeu podeenih elemenata slike, mogu
se uoiti veoma male razlike u sjaju. S druge strane kada su razlike u nivou sjaja velike,
osetljivost se znatno smanjuje [3.2] . Na Slici 3.1.2-a prikazan je test, dok je na Slici 3.1.2-b data
osetljivost kontrasta.

Slika 3.1.2 Test i osetljivost kontrasta

Neka je B1 sjaj pozadine, a B2 i B2 + B sjaj leve i desne polovine malog kruga, respektivno.
Razlika u sjaju B, koja je potrebna da bi se razlikovala promena od B2 do B2+ B varira zavisno
od razlike u sjaju |B2 B1|.

22

Naime, kada je ova razlika mala, neznatna veliina B je dovoljna da bi se promena


razlikovala. Sa poveavanjem |B2 B1|, B raste, kao to je to prikazano na Slici 3.1.2-b.
Meutim treba naglasiti da je stvarna osetljivost kompleksnija, jer ona zavisi od funkcije
|B2 B1|, od vrednosti B1 ili B2, a takoe i od veliine kruga i trajanja izloenih slika.
to se tie osetljivosti oka, ona se moe posmatrati sa tri aspekta. Prvo, kada su varijacije
osetljivosti nezavisne od slike i kada prag detekcije uma raste sa porastom frekvencije uma, to
je tzv. frekvencijska zavisnost. Drugo, kada su varijacije osetljivosti zavisne od slika i kada prag
detekcije uma raste sa porastom broja detalja na slici, to je tzv. zavisnost od detalja. I najzad,
tree, kada su varijacije osetljivosti zavisne od slike i kada prag detekcije uma raste sa porastom
osvetljaja, to je tzv. zavisnost od osvetljaja [3.3].
Na kraju, treba istai da oko ima sposobnost usrednjavanja na one delove slike koji
sadre bitnu informaciju. Poto je prenosni sistem sloeniji ukoliko je broj optikih informacija
koje treba prenositi vei, ne treba ni prenositi one optike informacije koje oko pod normalnim
uslovima ne moe da primi.

3.2 Vidljivost uma


Ukoliko je um pridodat slici on je vidljiviji ako je korelisan sa slikom, nego ako je
sluajan. Prisustvo uma znatno smanjuje kontrast i otrinu slike. Na prijemnoj strani, prisustvo
uma u signalu slike pogorava direktno kvalitet prijema. Na primer, TV um na ekranu izaziva
kod gledalaca zamor, jer posmatra stalno ide za tim da otkrije fine detalje slike koji su
maskirani umom.
Da bi um bio uoljiv, mora biti vei od odreene vrednosti koja zavisi od praga
vidljivosti. Ovaj prag je znatno vei u blizini ivica, i u oblastima sa malim detaljima, nego u
delovima slike bez detalja, jer se um maskira sadrajem slike. Osetljivost oka na izoblienje na
slici zavisi od sadraja elemenata slike koji neposredno okruuju onaj deo gde se izoblienje
pojavilo.
Vidljivost nekorelisanih smetnji na slici moe se predstaviti izrazom:
W

Vn = V ( ) S n ( ) d

(3.2.1)

gde je
Sn ()
V()

spektralna gustina signala smetnji unutar propusnog opsega W prenosnog sistema,


teinska funkcija koja predstavlja relativnu osetljivost oka na pojedine frekventne
komponente.

Teinska funkcija V() ukljuuje uticaj prenosne funkcije sistema za prenos slike, kao i
vizuelnog sistema posmatraa.
Eksperimentalno je dokazano da oko slabije uoava um pridodat video signalu u
trenutku znatnih promena, nego u oblastima slike gde se video signal relativno malo menja.
Odnos vidljivosti uma i brzine promene video signala zavisi od ukupnog sadraja slike.

23

U vezi sa problemom vidljivosti uma, stoji pitanje kvaliteta pogorane slike. On je


definisan subjektivnim nalazima i moe se uporeivati na osnovu subjektivnih odgovora
posmatraa. U literaturi se esto koristi kriterijum srednje kvadratne greke [3.4].
Ako se sjajnost ulazne slike predstavi funkcijom f(x, y) a sjajnost izlazne slike funkcijom
g(x, y), gde su (x, y) prostorne koordinate, greka je data izrazom
(x, y) = f(x, y) g(x, y).

(3.2.2)

Kada je sa F(u, v) oznaena Fourier-ova transformacija greke, pri emu su u i v prostorne


frekvencije, tada je srednja kvadratna greka data relacijom:
D( f , g)=

+ +

+ +

( x, y ) dx dy =
2

F ( u , v ) du dv .
2

(3.2.3)

Vidi se da kvalitet pogorane izlazne slike g(x, y) ne zavisi samo od greke (x, y) ve i
od originalne slike f(x, y).

3.3 oveiji vizuelni sistem


Poto je izlaz iz multimedijalnog sistema, u optem sluaju, najee ba vizuelni sistem,
vano je poznavati karakteristike oveijeg vizuelnog sistema (eng. human visual system HVS)
radi to efikasnijeg korienja multimedijalnih tehnologija [3.5]. Elektromagnetni talasi imaju
razliite talasne duine u irokom dijapazonu, od dugih do ekstremno kratkih talasa (gama zraci).
Meutim, oko moe da detektuje talase uskog spektra od priblino 400 nm do 700 nm. Suneva
svetlost ima spektar u ovom talasnom opsegu i ona predstavlja glavni izvor zemaljskih EM
talasa.
Na Slici 3.3.1 prikazan je karakteristian proces detekcije objekta.

Slika 3.3.1Dolazna svetlosna struja u procesu detekcije objekta

24

Ako je L () ulazna raspodela energije koja dolazi iz svetlosnog izvora, svetlost koju
prima posmatra nekog objekta moe se izmeriti u obliku:
I() = () L()
gde je
()

(3.3.1)

refleksija od objekta.

Ukoliko su svetlosni izvor, objekat i posmatra stacionarni, spektar od I() imae isti
frekvencijski opseg kao i L(), ali e im spektri biti razliiti, to odreuje ().
Kada posmatra primi svetlosnu energiju raspodele I() poinje kompleksan proces u
vizuelnom sistemu koji se odnosi na formiranje slike. Radi efikasnijeg projektovanja prenosnog
sistema, vano je prouiti karakteristike HVS. To je znaajno i zbog displeja informacija o slici.
Da bi se smanjila cena prenosa i displej ureaja, vai princip da ne treba prenositi niti prikazivati
informaciju koju oko ne moe da vidi.
oveiji vizuelni sistem tretira se kao optiki sistem. Naime, kada svetlost objekta padne
na oko, zenica oka deluje kao jedan prorez, slika se stvara na mrenjai, a gledalac vidi objekat.
Uoena veliina objekta zavisi od ugla pod kojim se ovaj stvara na mrenjai. Mrenjaa moe
bolje da razlui detalje kada je slika na mrenjai vea i kada se iri na vie foto receptora.
Zenica kontrolie koliinu svetlosti koja pada na oko. Ona je prenika 2 mm. Pri slabijem
osvetlenju, veliina raste kako bi se omoguilo da dolazi vie svetlosti, dok pri jaem osvetljenju
njena veliina opada da bi se ograniila koliina svetlosti.
U cilju uproenja HVS modela nainjeno je nekoliko predpostavki. Pre svega,
predpostavljeno je da je HVS linearni sistem to je u optem sluaju tano za slike sa malom
kontrau. Zatim, moe se predpostaviti da je HVS izotropan u prostornom domenu, tj. da oi
nemaju ni jedan preferencijalni pravac (prema horizontalnom, vertikalnom ili dijagonalnom).
Takoe, utvreno je da je osetljivost oiju u dijagonalnom pravcu manja nego u horizontalnom
ili vertikalnom, pa se ta injenica koristi kod mnogih modela.
Najzad, HVS se moe tretirati kao sistem koji se sastoji iz nekoliko podsistema. Istakli
smo da kada svetlost pada na oko, zenica se ponaa kao jedan prorez. To je ekvivalentno
niskopropusnom filtru. Zatim, spektralni odgovor oka (a to je funkcija efikasnosti osvetljaja
V()) se primenjuje na dolaznu svetlost, pa se dobija osvetljaj slike.
Osetljivost oveijeg vizuelnog sistema je mala na visokim prostornim frekvencijama.
Ova osobina koristi se u mnogim primerima obrade slike. U sluaju videa, kamera cilja slike (ili
video kadrove) koje brzo slede jedna za drugom. Displej ureaj (TV, kompijuterski monitor)
prikazuje individualne kadrove istom brzinom. Ukoliko je brzina prikazivanja individualnih
kadrova iznad izvesnog praga, HVS ne moe da opaa individualne kadrove, pa zato izgleda kao
da se pokretna slika menja kontinualno. Kritina brzina promene kadra zavisi od faktora kao to
su uslovi gledanja i video sadraj.
Danas postoji veliki broj istraivanja koja se bave odreivanjem kritine brzine kadra i
njene zavisnosti od eksperimentalnih rezultata. Naveemo jedan primer. Takasti izvor svetlosti
menja osvetljaj prema zakonu:
L + Lcos(2ft)
gde je
L

amplituda promene,

25

frekvencija u Hz.

Ukoliko L ima dovoljno veliku vrednost, a frekvencija nije suvie visoka, opaa se tzv. fliker
efekat. Za bilo koju datu vrednost frekvencije, vrednost L koja prizvodi prag oseaja flikera
odreena je eksperimentalno. Oznaimo tu vrednost sa LT.. Odnos L/LT poznat je kao
osetljivost na kontrast oveijeg vizuelnog sistema. Oko je osetljivije na fliker efekat pri
visokom osvetljaju. Osetljivost na fliker je zanemarljiva iznad (50 do 60) Hz. Ova osobina slui
kao polazna osnova za projektovanje TV sistema i kompjuterskih displej ureaja.

3.4 Vizuelni modeli


Razliiti vizuelni modeli prikazani su, do danas, u literaturi. Najpre, u tom smislu bilo je
mnogo pokuaja da se koncepcija linearnih sistema primeni na oveiji vizuelni sistem. S druge
strane, neka istraivanja su pokazala da je oveiji vizuelni sistem nelinearan [3.6]. Na ovom
mestu bie govora o monohromatskom vizuelnom modelu kao i o vizuelnom modelu u boji. Na
kraju, u okviru vizuelnih modela, bie dat prikaz nekih optih modela vizuelnog komunikacionog
sistema.

3.4.1 Monohromatski vizuelni model


U principu jedan optiki sistem moe se tretirati kao dvodimenzionalni linearni sistem
koji se karakterie 2D transfer funkcijom [3.7]. Posmatrajmo optiki sistem prikazan na Slici
3.4.1.1.
Iu(x, y)

Ii(x, y)

OPTIKI SISTEM
H(x, y)
Slika 3.4.1.1Uproena blok ema optikog sistema

Oznaimo sa Iu(x, y) polje objekta na ulazu u sistem, sa H(x, y) transfer funkciju


posmatranog sistema, dok Ii(x, y) predstavlja polje slike na izlazu iz sistema. Ovde su x i y
prostorne frekvencije. Frekvencijski spektri signala na ulazu u sistem u (x, y) i na izlazu iz
sistema i (x, y), definisani su, respektivno, na sledeci nain:
u ( x ,y ) =

+ +

I ( x, y ) exp i ( x + y ) dx dy
u

(3.4.1.1)

i ( x ,y ) =

+ +

I ( x, y ) exp i ( x + y ) dx dy .
i

Ovi spektri povezani su relacijom:

26

(3.4.1.2)

i (x, y) = H(x, y) u (x, y).

(3.4.1.3)

Polje slike na izlazu iz posmatranog sistema dobija se iz izraza (3.4.1.2) kada se primeni
inverzna Fourier-ova transformacija, tj.,
I i ( x, y ) =

1
4 2

+ +

( , ) exp i ( x + y ) d
i

dy .

(3.4.1.4)

to se tie transfer funkcije, to je u optem sluaju kompleksna veliina koja se moe predstaviti
preko modula |H(x, y)| i faze (x, y), tj.,
H(x, y) = |H(x, y)| exp[i (x, y)].

(3.4.1.5)

Moduo |H(x, y)| naziva se modulaciona transfer funkcija, dok se (x, y) po neki put sree u
literaturi pod nazivom fazna transfer funkcija [3.8].
Na Slici 3.4.1.2 prikazana je blok-ema monohromatskog vizuelnog modela
logaritamskog tipa. Ako je odziv ula na ulazni signal logaritamskog tipa, tada ukoliko signal
ima oblik jednog eksponencijalnog sinusnog talasa, tj. exp[sin Iu(x, y)], oveiji vizuelni sistem
moe biti linearizovan [3.6].
LINEARNI SISTEM
H(x, y)

LOG

SIGNAL

RECEPTOR
Slika 3.4.1.2Monohromatski vizuelni model logoritamskog tipa

Osnovni logaritamski monohromatski vizuelni model predpostavlja da je polje slike na


izlazu iz sistema oblika

I i ( x , y ) = k1 log [k 2 + k 3 I u ( x , y )]

(3.4.1.6)

gde
ki , i = 1, 2, 3
Iu (x, y)

predstavljaju konstante,
predstavlja polje objekta na ulazu u sistem.

Jedan drugi monohromatski vizuelni model predloio je Cornsweet [3.9]. Kod ovog
modela, odziv je oblika

( x, y ) =

K1 I u ( x, y )
K 2 + I u ( x, y )

gde
27

(3.4.1.7)

K1 i K2

predstavljaju konstante.

Mannos i Sakrison [3.10] su prouavali uticaje nelinearnosti razliitog tipa koje su


primenjivane u proceni mere vrednosti na prijemu slike. Oni su pokazali da je nelinearnost
oblika

I
gde je
S

( x, y ) = Iu ( x, y )

(3.4.1.8)

konstanta koja prua solidno slaganje mere vizuelne vernosti sa subjektivnom


procenom.

3.4.2 Vizuelni model u boji


U svetu su vreni mnogi eksperimenti radi utvrivanja vizuelnog modela u boji. Prvu
grupu eksperimenata izvrio je Thomas Young sa saradnicima, a zatim Newton i Maxvell. Na
ovom mestu bie prikazan vizuelni model koji je predloio Frei [3.11]. Njegova uproena blokema prikazana je na Slici 3.4.2.1.
Kod ovog modela, tri receptora sa spektralnim osetljivostima S1 (), S2 (), i S3 () daju
signale:

gde je
c()

e1 = c ( ) S1 ( ) d

(3.4.2.1)

e2 = c ( ) S2 ( ) d

(3.4.2.2)

e3 = c ( ) S3 ( ) d

(3.4.2.3)

raspodela spektralne energije svetlosnog izvora.

Kada se na tri napred navedena signala primeni logaritamska transfer funkcija, dobijaju
se originali:
d1 = log ( e1 )

(3.4.2.4)

e
d 2 = log ( e2 ) log ( e1 ) = log 2
e1

(3.4.2.5)

e
d3 = log ( e3 ) log ( e1 ) = log 3 .
e1

(3.4.2.6)

28

Na kraju, signali d1, d2 i d3 prolaze kroz linearne sisteme ije su transfer funkcije
H1(x, y), H2(x, y) i H3(x, y) respektivno. Signali g1, g2 i g3 na izlazu iz odgovarajuih
linearnih sistema pruaju osnovu za percepciju boje u mozgu.
e2
Log

d2

H2 (x, y)

g2

H1 (x, y)

g1

H3 (x, y)

g3

APSORPCIJA
ZELENE BOJE
e1

d1
Log

APSORPCIJA UTO-ZELENE BOJE


e3
Log

d3

APSORPCIJA
PLAVE BOJE
Slika 3.4.2.1Blok-ema Frei-ovog vizuelnog modela u boji

Navedeni model karakterie se time to zadovoljava osnovne zakone kalorimetrije. Na


primer, ukoliko se spektralna energija obojene svetlosti menja za konstantan multiplikativni
faktor, boja i zasienje svetlosti ostaju invarijantni u irem dinamikom opsegu.

3.4.3 Opti model vizuelnog komunikacionog sistema


Kao to je poznato, opti model komunikacionog sistema dao je Shannon. Posle toga,
neki drugi istraivai modifikovali su ovaj opti model. Na predajnoj strani uvode se izvorni i
kanalni koder, a na prijemnoj strani uvode se odgovarajui dekoderi. Kod vizuelnih
komunikacionih sistema, karakteristike izvora odreene su metodom razlaganja, brojem
elemenata u slici, prisustvom ili odsustvom slike u boji. Izvorni koder prepoznaje srodne
predmete. Oni se koduju standardnim simbolima. Nesrodni objekti odreuju se element po
element. Dekoder slui za prevoenje kodovane poruke u oblik koji koristi korisnik [3.12].
Na Slici 3.4.3.1 prikazan je Fano-ov opti model vizuelnog komunikacionog sistema
[3.13]. Vizuelni svet je onakav kakav je vien pomou kamere. Funkcija izvornog kodera je da
predstavi vizuelni svet, odnosno ulazni signal kao sluajan signal binarnog oblika.
Izvorni koder je obina TV kamera. Ona grupie vizuelne scene sa malim percepcionim
razlikama i svaku grupu predstavlja jednom kodnom rei.
Kanalni koder uzima povorku izvornih binita i koduje je u druge nizove kanalnih binita,
tako da prenos do prijemnika bude obavljen na najefikasniji nain bez pogoranja zbog uma.
Ureaji na prijemu slue za obavljanje operacija inverznih onima na predaji. To su
obnavljanje izlaza iz izvornog kodera pomou kanalnog dekodera i obnavljanje predstave
vizuelnog sveta pomou izvornog dekodera. Pri svemu ovome ne moe se zanemariti uticaj uma
29

u kanalu, a time i izoblienje slike. U principu, kod kodovanja video signala cilj moe da bude da
se pobolja kvalitet slike, a da se kapacitet kanala odrava konstantnim, zatim da se smanji
kapacitet kanala da bi se odravao dati kvalitet slike, najzad da se pogorava kvalitet slike da bi
kapacitet kanala bio optimalan.
U
VIZUELNI
SVET

IZVORNI
KODER

X
KANALNI
KODER

Y
KANALNI
DEKODER

KANAL

KRITERIJUM
VERNOSTI

IZVORNI
DEKODER

PRIJEMNIK

UM

Slika 3.4.3.1FANO-ov model vizuelnog komunikacionog sistema

Da bi uveo kriterijum vernosti, Pearson je proirio Fano-ov model vizuelnog


komunikacionog sistema. Pearson-ov model vizuelnog komunikacionog sistema, prikazan na
Slici 3.4.3.2, sastoji se iz kola sa povratnom spregom od prijemnika posmatraa do izvornog i
kanalnog kodera.
U
VIZUELNI
SVET

IZVORNI
KODER

X
KANALNI
KODER

Y
KANAL

V
KANALNI
DEKODER

IZVORNI
DEKODER

PRIJEMNIK

UM

Slika 3.4.3.2Pearson-ov model vizuelnog komunikacionog sistema

Optimizacija parametara izvedena je na jedan od sledeca dva naina. Prvo, kriterijum


vernosti na prijemu je fiksiran prema nameni komunikacionog sistema, a to znai da je izvestan
minimum kvaliteta na prijemu unapred odreen. Poeljno je pronai metode izvornog i kanalnog
kodovanja koje e smanjiti traeni kapacitet kanala na najmanju moguu vrednost, a da se u isto
vreme zadovolje kriterijumi vernosti. Ona kombinacija izvornog i kanalnog kodovanja koja
zadovoljava kriterijum vernosti pri najmanjem iznosu koliine informacija u kanalu predstavlja
optimalnu metodu kodovanja. Drugo, kada se za kapacitet kanala smatra da je unapred fiksiran,
cilj je da se maksimizira vernost na prijemu, tj. da se pronae takva kombinacija izvornog i
kanalnog kodovanja koja e omoguiti prenos datim kanalom, a da se u isto vreme kao rezultat
dobije najbolji mogui kvalitet slike na prijemu.
Problemi koji se pojavljuju kada je u pitanju Pearson-ov model vizuelnog
komunikacionog sistema odnose se na funkciju izvornog kodera i na odreivanje kriterijuma
vernosti [3.14]. Izvorni koder treba da izdvoji iz vizuelne okoline one oblike koje je i sam ovek
gledalac u stanju da izdvaja. Nae sadanje znanje o tome kako gledalac reaguje na razliite
vrste slika i na izoblienja u tim slikama je veoma oskudno. Prilikom izvornog kodovanja moe
30

u principu da bude kapacitet kanala C minimiziran pri emu je izoblienje D manje ili jednako
odreenom maksimumu Dmax, tj. D Dmax, ili da izoblienje D bude minimizirano pri emu je
kapacitet kanala C < Cmax, gde je Cmax maksimalni kapacitet kanala.

3.5 Rezime
Od svih naih ula, oko je najefikasniji prijemnik informacija. Oko 70 % informacija koje
dobijamo, prenosi se posredstvom ula vida. oveije ulo vida moe se smatrati diskretnim
sistemom koji karakteriu odreeni pragovi razlikovanja, gradacije sjaja i kritine duine trajanja
nadraaja. Oko je veoma osetljivo na komponente niskih uestanosti i ta osetljivost opada sa
porastom uestanosti. Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks
koji pada na mrenjau naglo povea, potrebno je izvesno vreme da se u mozgu stvori utisak
odgovarajue sjajnosti. Na raspoznavanje detalja, osim kontrasta i otrine, utie i adaptacija oka
kao i dinamika slike. Osetljivost oka moe se posmatrati sa tri aspekta: frekvencijska zavisnost,
zavisnost od detalja i zavisnost od osvetljaja. Prisustvo uma znatno smanjuje kontrast i otrinu
slike. um je vidljiviji ako je korelisan sa slikom nego ako je sluajan. Osetljivost oka na
izoblienje u slici zavisi od sadraja elemenata slike koji neposredno okruuju onaj deo gde se
izoblienje pojavilo. Kvalitet slike je definisan subjektivnim nalazima i moe se uporeivati na
osnovu subjektivnih odgovora posmatraa. Radi to efikasnijeg korienja multimedijalnih
tehnologija vano je poznavati karakteristike oveijeg vizuelnog sistema. On se tretira kao
optiki sistem. U literaturi su do danas prikazani razliiti vizuelni modeli: monohromatski
vizuelni modeli, vizuelni modeli u boji, kao i opti modeli vizuelnog komunikacionog sistema.
Prvi opti model dao je Shannon. Neki drugi istraivai (Fano, Pearson) modifikovali su ovaj
model. Na prednjoj strani uvode se izvorni i kanalni koder, dok se na prijemnoj strani uvode
odgovarajui dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora odreene su
metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

U emu se ogleda uloga ula vida kao senzora?


ime se karakterie ulo vida?
Skicirati dijagram relativne osetljivosti oka u funkciji talasne duine i to pri svetlosti
normalne jaine i pri vrlo slaboj svetlosti.
Kako se definie mera osetljivosti oka?
ta je to persistencija oka?
ta utie na raspoznavanje detalja od strane ula vida?
Sa kojih se aspekata moe posmatrati osetljivost oka?
Kako se moe predstaviti vidljivost nekorelisanih smetnji na slici?
Kako se definie svetlost koju prima posmatra od nekog objekta?
Opisati nain rada oveijeg vizuelnog sistema?
Od ega zavisi osetljivost oveijeg vizuelnog sistema?
ta je to fliker efekat i kako on utie na osetljivost oka?

31

13.
14.
15.
16.
17.
18.
19.
20.
21.

Nacrtati uproenu blok-emu optikog sistema i naznaiti sve potrebne elemente za


njegovu analizu?
Iz kojih se elemenata sastoji monohromatski vizuelni model logaritamskog tipa?
Nacrtati odgovarajuu blok-emu.
Kako se odreuje odziv kod Cornsweet-ovog vizuelnog modela?
ime se karakterie Mannos-Sakrison-ov model vizuelnog sistema?
Nacrtati i opisati blok-emu Frei-ovog vizuelnog modela u boji.
Kako izgleda opti model Fano-ovog vizuelnog komunikacionog sistema?
Koje su osobine Pearson-ovog modela vizuelnog komunikacionog sistema?
Od ega zavisi osetljivost oka na izoblienje u slici?
Koja proporcija crvene, zelene i plave boje odgovara svetlosti jedinstvene talasne
duine?

Literatura
[3.1]
[3.2]
[3.3]
[3.4]
[3.5]
[3.6]
[3.7]
[3.8]
[3.9]
[3.10]
[3.11]

[3.12]
[3.13]
[3.14]
[3.15]

B. Nasti, Osnovi Televizijske Tehnike. Beograd, Nauna knjiga, 1986.


T. Fukinuki, Optimization of D-PCM for TV signals with consideration of visual
property, IEEE Trans. Commun., vol. COM-22, pp. 821826, Jun. 1974.
D. J. Connor, R. C. Brainard, and J. O. Limb, Intraframe coding for picture
transmission, Proc. IEEE, vol. 60, no.7, pp. 779791, Sep. 1972.
T. S. Huang, W. F. Schreiber, and O. J. Tretiak, Image processing, Proc. IEEE, vol.
59, no. 11, pp. 15861609, Nov. 1971.
M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
W. K. Pratt, Digital Image Procesing. New York: John Wiley and Sons, 1978.
J. W. Goodman, Introduction to Fourier Optics. New York: McGraw-Hill, 1968.
K. D. Baker, Basic image concepts in Digital Signal Processing, N. B. Jones, Ed.,
1982.
T. N. Cornsweet, Visual Perception. New York, NY: Academic Press, 1970.
J. L. Mannos and D. J. Sakrison, The effect of a visual fidelity criterion of the
encoding of images, IEEE Trans. Inf. Theory, vol. IT-20, pp. 525536, Jul. 1974.
W. Frei, A new model of color vision and some practical limitations, University of
Southern California, Image Processing Institute, Los Angeles, USCEE Rep. 530, Mar.
1974, pp. 128143.
Z. Bojkovi, Digitalna Obrada Slike. Beograd, Nauna knjiga, 1989.
D. E. Pearson, A realistic model for visual communication systems, Proc. IEEE, vol.
55, no. 3, Mar. 1967.
T. Berger, Rate-Distortion Theory: A Mathematical Basis for Data Compression.
Englewood Cliffs, NJ: Prentice-Hall, 1971.
J. C. Russ, The Image Processing Hand Book. 5th ed. Boca Raton, FL: CRC Press,
2007.

32

4. AUDIO-VIZUELNE INTEGRACIJE
U multimedijalnim komunikacijama gde je ukljuen oveiji govor, audio-vizuelna
integracija je posebno znaajna. Ne samo da je vano zanemariti verbalnu i univerzalnu
informaciju, ve je interesantno pitanje interakcije izmeu razliitih medija. U ovom poglavlju
pozabaviemo se pitanjem zato su multimedijalne komunikacije vie nego prosto objedinjivanje
teksta, audia, slike i videa. Daemo pregled trendova u multimedijalnom istraivanju radi
korienja audio-vizuelne informacije, pre svega radi uspostavljanja veze izmeu obrade audio i
video signala. Koristei tehnologiju poznavanja govora, analiziraju se govorni talasni oblici kako
bi se otkrio izgovoreni tekst. Na osnovu reenice u tekstu, integrie se glava govornika (eng.
talking head) na osnovu audio-vizuelnog niza i to korienjem kompleksne grafike za analizu
facijalnog modela kao i sintezu teksta i govora kako bi se proizveo sintetiko akustini govor
[4.1], [4.2]. Isto tako, za komunikaciju osobaosoba koja je ukljuena u multimedijalne
aplikacije (videotelefonija, videokonferencija) od interesa je audio i vizuelna interakcija. S druge
strane, audio-vizuelna integracija takoe obuhvata automatsko oitavanje sa usne, primenu kod
prepoznavanja govora animacijom lica govornika, sinhronizaciju usana, praenje crta lica, audiovizuelno preslikavanje, zdrueno audio-vizuelno kodovanje, itd.

4.1 Interakcija medija


Integracija i interakcija razliitih vrsta medija predstavljaju interesantnu oblast
istraivanja [4.3]. Interakcija medija prikazana je na Slici 4.1.1. Kao to se vidi, medijumi su
kategorisani u tri klase. Prva se odnosi na tekstualne informacije, druga je audio ukljuujui
govor i muziku, dok trea predstavlja mirnu sliku i video.
Cilj prepoznavanja govora je da obezbedi mainu da bude u stanju da prislukuje govorne
ulaze i individualne rei. Istraivanje razumevanja govornog jezika podrazumeva izdvajanje
znaenja iz svega onoga to je nepoznato [4.4].
Jedan dobar primer za audio-video (a/v) interakciju pri govornoj komunikaciji je
oitavanje sa usana koje se naziva jo i govorno oitavanje. Oitavanje sa usana se iroko koristi
u videotelefoniji i video konferenciji. Karakteristina situacija nastaje kod video-konferencijske
opreme kada brzina promene kadra nije adekvatna za percepciju sinhronizacije usana. Jedno
reenje je da se izdvoji informacija iz akustinog signala koji odreuje odgovarajue pokrete
usta, pa da se onda obradi slika usta govornika kako bi se postigla sinhronizacija usana. Takoe
je mogue izvriti jedno takvo prilagoenje da akustini signal daje zvuk sinhronizovan sa
pokretom usana. Ovakav prilaz je koristan kod primene u nerealnom vremenu.
33

KOMPRESIJA
SINTEZA
3D ZVUK

AUDIO
PREPOZNAVANJE
GOVORA:
TEKST-GOVOR

TEKST
PREVOD
PRIRODAN JEZIK

SINHRONIZACIJA USANA
ANIMACIJA LICA
ZDRUENO A/V
KODOVANJE

MULTIMEDIJA

JEZIK OITAVANJE
SA USANA

MIRNA SLIKA/VIDEO
KOMPRESIJA, GRAFICI
INDEKSIRANJE/PRETRAIVANJE
BAZE PODATAKA

Slika 4.1.1Interakcija medija

Proizvoenje vizuelnog govora iz auditornog, podrazumeva generisanje glave govornika


[4.4], [4.5]. Glavne primene ove tehnike ukljuuju interfejse ovekraunar, instrukcije koje
podrava raunar, video igre, multimedijalnu telefoniju za osobe sa oteenim sluhom, itd.

4.2 Bimodalnost ljudskog govora


Zbog bimodalnosti u percepciji govora, audiovizuelna interakcija postaje vaan faktor
kod projektovanja multimedijalnih komunikacionih sistema, kao to su, na primer,
videotelefonija i video konferencija. Bimodalnosna priroda percepcije oveijeg govora
prikazana je u [4.6]. U sluaju konfliktnih audio i vizuelnih stimulansa, registrovani zvuk ne
postoji ni u jednom modalitetu.
Primer 4.2.1
Kada ujemo zvuk (ba) i vidimo govornika kako kae (ga), on ne opaa ni
(ga) ni (ba). Umesto toga, ono to je generisano je neto to je blisko sa (da).
Neki drugi primeri audio-vizulenih kombinacija su prikazani u Tabeli 4.2.1.
Tabela 4.2.1Primeri za McGurk-ov efekat
AUDIO +

VIZUELNO

PERCEPIRANO

BA

GA

DA

PA

GA

TA

MA

GA

NA

34

Do izraaja dolazi tzv. McGurk-ov efekat, to znai da govor koji registruje


ovek zavisi ne samo od akustinih znakova, ve i od vizuelnih, kao to su, na
primer, pokreti usana. Ukoliko rezultati vizuelne percepcije govora utiu na
audio govor, radi se o tzv. inverznom McGurk-ovom efektu [4.6].
Produkcija i percepcija govora su po svojoj prirodi bimodalni. U akustinom sistemu,
osnovna jedinica je fonem. Slino, u vizuelnom domenu, osnovna jedinica za meru pokretanja
usne je vizem. To je najmanja uoljiva jedinica za govor.
Primer 4.2.2
Fonemi (p), (b) i (m) su proizvedeni sa zatvorenim ustima i vizuelno nisu
uoljivi. Stoga, oni formiraju jednu grupu vizema. Slino, (f) i (v) pripadaju
istoj grupi vizema koji nastaju tako to gornji zubi dodiruju donju usnu.

4.3 Oitavanje sa usana


Osoba vina oitavanju sa usana (eng. lip reading) u stanju je da razume znaenje
izgovorenih reenica posmatrajui konfiguraciju i pokret vidljivih artikulatora govornika kao to
su jezik, usne, zubi, itd. Poznavajui poloaje ovih artikulatora obezbeujemo informaciju o
sadraju koji sobom nosi govorni signal. Poto ovi artikulatori nisu vidljivi, informacija moe po
neki put da bude nekompletna. Kombinovanjem vizuelnog sadraja sa leksikim, sintaktikim,
semantikim i programskim informacijama, ljudi se mogu obuiti da razumeju govorni jezik
posmatranjem pokreta govornikovog lica.
Predstavljanje oitavanja sa usana zavisi od vie faktora. Uslovi gledanja mogu da utiu
na kvalitet vizuelne informacije. Na primer, slabo osvetljenje moe da otea utvrivanje poloaja
i pomeranje usana, kao i detekciju zuba i jezika. Faktori kao to je ugao gledanja mogu takoe da
budu od uticaja na prikazivanje. Direktno gledanje govornika doprinosi brem prepoznavanju
nego pod uglom. Poboljanje oitavanja sa usne postie se treningom [4.8], [4.9].
Poznavanje procesa prema kome ljudi izdvajaju i ugrauju vizuelnu informaciju u
govornu percepciju moe biti od koristi. Isto tako, vano je znati informaciju koja je dostupna
vizuelnom kanalu, koje ljudi koriste za prepoznavanje i koja se sredstva koriste za integrisanje
akustine i vizuelne informacije. Akustine i vizuelne komponente nisu samo redundantne. One
su isto tako i komplementarne.
Primer 4.3.1
Fonemi (p) i (k) imaju sline akustike karakterisitke, ali se mogu lako
razlikovati na osnovu zatvaranja usta. Za uzvrat (p) i (b) fonemi imaju sline
vizuelne karakterisitke ali se akustiki razlikju na osnovu glasnosti.
Jedno od najvanijih pitanja u videotelefoniji i videokonferenciji je sinronizacija usne
obzirom na to da je percepcija oveijeg govora bimodalna. Tipina situacija u
35

videokonferencijskoj opremi sa ogranienjima u irini propusnog opsega nastaje kada je brzina


kadra takva da nije u sukobu sa percepcijom sinhronizacije usana. Reenje bi mogli biti da se
izdvoji informacija iz akustinog signala koja se odnosi na odgovarajue pomeranje usana, pa da
se zatim obradi slika koja prikazuje usta govornika kako bi se postigla odgovarajua
sinhronizacija usana. Mogue je i izobliiti akustini signal tako da njegov zvuk bude
sinhronizovan sa pokretom oveijih usana. Ovaj prilaz je koristan za promene u nerealnom
vremenu. Da bi se obezbedila sinhronizacija usana, analizator spektra ispituje audio iz studija
kao i originalni zapis. Rezultati se dovode na ulaz u procesor kako bi se modifikovala vremenska
skala za redosled originalnog ubeleavanja. Video kodek esto preskae neke kodove kako bi se
udovoljilo zahtevu za irinom propusnog opsega, to daje kao rezulatat manju brzinu kadra na
dekoderskoj strani. Izostavljanje kadra dovodi do pojave pruga, podrhtavanja i gubitka
sinhronizacije usne. Da bi se reio ovaj problem moemo izdvojiti informaciju iz govornog
signala i obraditi sliku usta tako da se postigne sinhronizacija usne [4.10].
Blok-ema jednog ovakvog prilaza data je na Slici 4.3.1. Modul za praenje kadra
analizira ulazne kadrove kako bi pronaao lokaciju i oblik usta [4.11]. Audio-vizuelni model
preslikavanja analizira audio signal i proizvodi niz odgovarajuih oblika usta koji su izostavljeni
u video kadru. Izostavljanje slike se zatim koristi kod ulaznih kadrova kako bi se modifikovao
oblik usta radi proizvoenja novih kadrova koje treba uneti u originalni video. Uoava se
interakcija izmeu analize slike i analize govora. Rezultat analize slike moe se iskoristiti za
poboljanje tanosti sa kojom se prepozanje govor, kao to je to uinjeno iz automatskog
oitavanja sa usne. S druge strane, govorna informacija se moe iskoristiti za poboljanje
rezultata analize slike.
ULAZNA SLIKA (MALA BRZINA KADRA)
IZOBLIENJE
SLIKE
PRAENJE
KADRA

AUDIO

AUDIO-VIZUELNO
PRESLIKAVANJE

OBLICI I POLOAJ USTA

OBLICI USTA

IZLAZNI
VIDEO
(VELIKA
BRZINA
KADRA)

VREMENSKO
IZGLAIVANJE

Slika 4.3.1Blok-ema sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi
postizanja sinhronizacije usne

Pored male brzine kadra, i prenos prouzrokuje gubitak sinhronizacije usne kod videokonferencije. Kanjenje kod prenosa u sluaju videa je due nego kod audio kanjenja. Tehnika
obrade videa uz pomo govora reava problem izoblienjem slike usta govornika koja je sada u
sinhronizaciji sa audio signalom. Otuda je mogue smanjiti ukupno kanjenje.

36

4.4 Praenje usana


Do danas su razvijeni mnogi postupci za parametarsko predstavljanje govora. Primera
radi, linerani prediktivni koeficijent koristi se u postupku kodovanja, dok se izlazi iz filtera
koriste u postupku prepoznavanja govora. U skladu sa tim, esto se postavlja pitanje kako
analizirati vizuelni signal, tj. u ovom sluaju pomeranje usana. Za razliku od govornog signala
koji je u sutini jednodimenzionalni (eng. one-dimensional 1D), vizuelni izlaz je predstavljen
3D video signalom sa dve prostorne dimenzije i jednom vremenskom domenzijom. Sistem za
vizuelnu analizu treba da konvertuje ovaj niz slika u znaajan parametar. Sistemi za vizuelnu
analizu mogu se podeliti u dve glavne klase. Prva klasa razvrstava sliku usta u jednu od sedam
kategorija, na primer u vizeme. Druga klasa meri parametre ili dimenzije na osnovu ulazne slike,
na primer, visinu i irinu usana. to se tie prve klase, vektorska kvantizacija i neuralne mree su
standardne metode za klasifikaciju ulaznih slika u nekoliko kategorija. Kod druge klase, trae se
parametri ili dimenzije koji imaju neko fiziko znaenje. Tako, na primer, moe se meriti visina
izmeu usana, kao i razmak izmeu uglova usana kao i da se odrede parametri tog modela koji
blisko povezuju model i slike.
Na bazi kompjuterskog vienja (engl. computer-vision) za praenje pokreta usana
govornika, raunar moe da bude tako podeen da je u stanju da razume vizuelni govor [4.12]. U
bimodulnoj analizi i sintezi govora, kljuno je pitanje uspostavljanja preslikavanja akustinih
parametara i onih koji se odnose na oblik usta. To znai da za zadate akustine parametre, kao
to su, na primer, banke filtara, treba proceniti odgovarajui oblik usta. Otuda, u nastavku panju
treba posvetiti audio-vizuelnom preslikavanju, kao i konvertovanju akustinih govornih
parametara u parametre koji karakteriu oblik usta.

4.5 Audio-vizuelno preslikavanje


Problem konverzije govora u parametre koji koriste oblik usta moe se reiti na taj nain
to se uzima u obzir injenica da je govor lingvistiki entitet. Naime, govor je najpre segmentiran
u niz fonema. Zatim je svaki fonem preslikan u odgovarajui vizem. Prisustvo ovakvog prilaza
ogleda se u tome to je akustini signal istraen u potpunosti tako da su sve informacije uzete u
obzir. Otuda, ovakav prikaz prua najtaniju analizu govora. Pri tome ne postoji potreba za
prepoznavanjem izgovorenih rei ili reenice da bi se sprovelo audio-vizuelno preslikavanje.
Poto postoji fizika relacija izmeu oblika vokalnog trakta i proizvedenog zvuka, moe da
postoji funkcionalna relacija izmeu govornih i vizuelnih parametara. Problem konverzije sastoji
se u pronalaenju najbolje funkcionalne aproksimacije za zadati niz podataka. Danas se mnogi
algoritmi mogu modifikovati da bi se obavio taj zadatak (vektorska kvantizacija, neuralne mree,
kao i skriveni Markovi modeli (eng. hidden Markov model HMM) [4.13]).

4.5.1 Konverzija na bazi klasifikacije


Konverzija na bazi klasifikacije data je blok-emom prikazanom na Slici 4.5.1.1. Tu
postoje dva dela. U prvom, akustini signal se klasifikuje na jednom od mnogobrojnih ulaza. U
drugom delu, preslikava se svaka akustina klasa u odgovarajui vizuelni izlaz. U prvom delu,
koristi se vektorska kvantizacija (eng. vector quantization VQ) da se podele akustini podaci u
37

jedan broj izlaza. Za svaku akustinu klasu ugraene su odgovarajue vizuelne kodne rei kako
bi se proizveo vizuelni efekat.
AUDIO
ULAZ

KLASIFIKACIJA

PRESLIKAVANJE

VIZUELNI
IZLAZ

Slika 4.5.1.1Konverzija na bazi klasifikacije

Jedan drugi problem uneen primenom metode na bazi klasifikacije je u tome to se ne


proizvodi kontinualno preslikavanje ve se dobija razliiti broj izlaznih nivoa. Postoji nekoliko
primena gde se koriste tzv. neuralni moduli za konverziju ili sinhronizaciju ukljuujui HMM
model za audio-vizuelno preslikavanje. Moguno je koristiti i tzv. neuralne mree sa
vremenskim kanjenjem (eng. time-delayed neural network TDNN ).

4.5.2 Audio i vizuelna integracija kod primena za oitavanje sa usana


Zbog naglog razvoja digitalne video tehnologije, danas je mogue ukljuiti i vizuelnu
informaciju u proces razumevanja govora preko oitavanja sa usne. Ovo nudi efektivnu
integraciju vizuelne informacije u dananje sisteme za prepoznavanje govora, kao i to da se
dobije poboljano potiskivanje uma bez pogoranja govora. Kompletan audio-vizuelni sistem za
oitavanje sa usne moe se razloiti u tri glavne komponente [4.14]:
Prethodna obrada audio-vizuelne informacije (ekstrakcija karakterisitka iz audio i video
podataka).
Strategija prepoznavanja oblika (skriveno Markovsko modeliranje, podeavanje oblika sa
dinamikim ili linearnim izoblienjem u vremenu i razliiti oblici neuralnih mrea).
Integracija strategije (odluivanje na osnovu prepoznavanja audio i video signala).
Svaka od navedenih komponenti ima odogovarajuu strategiju koja izlazi iz okvira ovog
poglavlja.

4.6 Zdrueno audio-video kodovanje


Audio-vizuelna informacija moe se iskoristiti na vie naina. Na primer, relacija izmeu
audia i videa moe se primeniti da se postigne efikasnije kodovanje kako audia tako i videa.
Jedan nain da se iskoristi ta relacija je prediktivno kodovanje. Ovaj tip kodovanja videa koristi
informaciju iz prethodnog video kadra da bi se nainila procena tekueg kadra. Radi
omoguavanja da se na prijemnoj strani obnovi originalni video kadar, prenosi se razlika izmeu
originalnog i procenjenog signala. Ovim postupkom otklanja se vremenska suvinost u video
signalu. Takoe, potrebno je sprovesti predikciju na unakrsni modalni nain kako bi se
istraivala unakrsna modalna suvinost. Tu se radi o predikciji u akustinom signalu koji se
moe iskoristiti da se prediktuje kako e izgledati video signal. Poto se takoe prenose akustini
38

podaci, prijemnik je u stanju da obnovi video uz vrlo malu informaciju sa strane. Postupak
unakrsno-modalne predikcije prikazan je na Slici 4.6.1. Jedan ovakav sistem je skalabilan u
irokom opsegu bitskih brzina.
VIDEO
SIGNAL

AUDIO
SIGNAL

VIZUELNA
ANALIZA

PARAMETAR
X

MODEL
ODLUIVANJA
(R-D)

(X X)
X

AUDIO-VIDEO
PRESLIKAVANJE

Slika 4.6.1Blok-ema unakrsno modalnog prediktivnog kodovanja

Izmereni parametri uporeuju se sa akustinim parametrima, a model odluuje o


informaciji koja moe biti poslata. Odluka se zasniva na kriterijumu funkcije stepena oteenja
(eng. rate distortion function RDF) informacije.

4.7 Bimodalna personalna verifikacija


Audio-vizuelna interakcija moe se takoe primeniti i kod personalne verifikacije.
Postojee metode za personalnu verifikaciju zasnivaju se na slici lica ili glasu. Koristei svaki
modelitet uvode se ogranienja, kako u bezbednosti, tako i u robustnosti. Na primer, personalna
verifikacija samo na bazi mirne slike dovodi do pojave pruga pri kodovanju i varijacija u
uslovima razliitog osvetljaja. S druge strane, upotreba glasa samo za personalnu verifikaciju
nije pouzdana jer je mogue preurediti foneme na osnovu prethodno registrovanog govora osobe
za sintetizovanje razliitih reenica. Uz to, govorni sistemi mogu da otkau ukoliko je akustino
okruenje u umovima ili postoji eho kao u sluaju kancelarijskog okruenja. Ove probleme
moe da rei zdruena primena govora i videa. Kombinovanjem ova dva modaliteta mogue je
dobiti bezbednije i robustnije sisteme za personalnu verifikaciju. Brojne tehnike koriste
pokretanje usne zajedno sa akustinim govorom da bi se identifikovala ili verifikovala osoba.
Mogunosti multimedijalnih personalnih raunara sa kamerama i mikrofonom ine ove tehnike
atraktivnim. U toku faze registracije korisnik izgovara odreenu reenicu, dok se glas i
pomeranje usne ubeleava u bazu podataka. U toku faze verifikacije, od korisnika se zahteva da
proita i prikae reenicu na displeju. Korisnikov glas i video podaci se zatim uporeuju sa
onima iz baze podataka kako bi se verifikovao odreeni korisnik [4.15]. Pri tome se pomeranje
usana koristi uglavnom za prepoznavanje govora, a ne za verifikaciju govornika. U [4.16] je
pokazano da pomeranje usne takoe sadri informaciju o identitetu osobe.

39

4.8 Rezime
U multimedijalnim komunikacijama gde je ukljuen ljudski govor, audio-vizuelna
integracija je od posebnog znaaja. Ovaj znaaj ogleda se ne samo zbog razmatranja verbalne i
univerzalne informacije u multimedijalnim komunikacijama, nego i zbog razlike informacija i
integracija izmeu razliitih medija. U ovom poglavlju utvreno je da multimedijalna
komunikacija predstavlja esto vie od prostog objedinjavanja teksta, audia, slike i videa. Kroz
audio-vizuelnu interakciju data je veza izmeu obrade audio i video signala. Naglasak je stavljen
na oitavanje sa usne, sinhronizaciju, audio-video preslikavanje, kao i bimodalnu personalnu
verifikaciju osobe.
Zdruena obrada audio i video signala prua dodatne mogunosti koje nisu prihvatljive
ukoliko se audio i video prouavaju posebno. U dananjim komunikacijama, uglavnom se ne
integriu mediji u komunikaciji meu ljudima. Multimedijalni sistemi dolaze do izraaja kada je
integracija sprovedena na tri kljuna naina: integracija sadraja, integracija korisnika i
integracija sa drugim medijima [4.17]. Primer audio-vizuelne integracije zbog bimodalnosti
percepcije govora je oitavanje sa usana. Ono se naroito koristi u okruenju uma. Na bazi
tehnika kompjuterskog vienja za praenje pomeranja usne u toku govora, kompjuter moe da
razume vizuelni govor. Uz to, automatsko oitavanje sa usana se takoe koristi za akustino
prepoznavanje govora.
Ukoliko brzina promene kadra nije adekvatna za percepciju sinhronizacije usana, jedno
reenje je da se izdvoji informacija iz akustinog signala koji objedinjuje odgovarajue pokrete
usta. Potom se obrauje slika govornikovih usta, kako bi se postigla sinhronizacija usana.
Kljuna stvar u analizi i sintezi govora je preslikavanje izmeu akustinih parametara i
parametara koji odgovaraju obliku usta. Drugim reima, to znai da za date akustine parametre
treba proceniti odgovarajui oblik usta i obratno. Za ovaj postupak postoje mnoge procedure kao
to su korienje vektorske kvantizacije, neuralne mree i skriveni Markovski modeli. Audiovizuelna informacija moe se koristiti i za verifikaciju osobe. Postojee relacije izmeu audio i
video signala koriste se za efikasnije kodovanje kako audia tako i videa. Neke druge aplikacije
ukljuuju segmentaciju slike, interfejs ovek-raunar, itd. Takoe, zajednika primena audia i
videa moe posluiti za klasifikaciju multimedijalnih sadraja.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.

U emu se ogleda znaaj audio-vizuelnih integracija u multimedijlanim


komunikacijama?
Gde se danas koristi tehnologija prepoznavanja govora?
ta sve obuhvata audio-vizuelni interfejs?
Nacrtati blok-emu koja prikazuje interakciju medija i naznaiti sve potrebne elemente.
Navesti primer audio-vizuelne interakcije pri govornoj komunikaciji.
Opisati pojavu audio-vizuelne interakcije kod videokonferencije.
ta je to McGurk-ov efekat?
ta je fonem, a ta vizem?
Od ega zavisi oitavanje sa usana govornika?

40

10.
11.
12.
13.
14.
15.
16.

Nacrtati blok-emu sistema za izdvajanje informacije iz govornog signala i obradu


slike usta radi postizanja sinhronizacije usana.
Kako se vri vizuelna analiza vezana za pokretanje usne?
Opisati nain na koji se vri audio-vizuelno preslikavanje.
Iz kojih se elmenata sastoji audio-video konverzija na bazi klasifikacije? Nacrtati
odgovarajuu blok-emu.
Navesti glavne komponente koje sadri audio-video sistem za oitavanje sa usana.
Kako izgleda blok ema unakrsno modalnog prediktivnog kodovanja?
ta je bimodalna personalna verifikacija?

Literatura
[4.1]
[4.2]

[4.3]
[4.4]
[4.5]
[4.6]
[4.7]

[4.8]
[4.9]
[4.10]
[4.11]

[4.12]
[4.13]

K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication


Systems: Techniques, Standards and Networks. Prentice-Hall, 2002.
Z. S. Bojkovi and D. A. Milovanovi, Audiovisual integration in multimedia
communications based on MPEG-4 facial animation, Circuits Systems Signal
Processing, vol. 20, no. 3, pp. 311339, 2001.
T. Chen and R. R. Rao, Audio-visual integration in multimodal communication, Proc.
IEEE, vol. 86, no. 5, pp. 837852, May 1998.
L. R. Rabiner and B. H. Juang, Fundamentals of Speech Recognition. Englewood Cliffs,
NJ: Prentice Hall, 1993.
F. Lavagetto, Converting speech into lip movements: A multimedia telephone for hard
of hearing people, IEEE Trans. Rehabil. Eng., vol. 3, no.1, pp. 90102, Mar. 1995.
H. McGurk and J. MacDonald, Hearing lips and seeing voices, Nature, vol. 264, pp.
746748, Dec. 1976.
D. Burnham and B. Dodd, Auditory-visual speech perception as a direct process: The
McGurk effect in infants and across languages, in Speechreading by Humans and
Machines. Stork D. G. and Hennecke M. E., Eds. Berlin: Springer-Verlag, 1996, pp.
103114.
K. Neely, Effect of visual factors on the intelligibility of speech, J. Acoust. Soc. Am.,
vol. 28, pp. 12751277, Nov. 1956.
B. Walden, Effects of training on the visual recognition of consonants, J. Speech
Hear. Res., vol. 20, pp. 130145, Mar. 1977.
T. Chen, H. P. Graf, and K. Wang, Lip synchronization using speech-assisted video
processing, IEEE Signal Process. Lett., vol. 2, no. 4, pp. 5759, Apr. 1995.
R. Rao and R. Mersereau, On merging Hidden Markov models with deformable
templates, in IEEE Proc. 1995 Int. Conf. Image Processing, vol. 3.Washington, DC,
pp. 556559.
R. Chellappa, T. Chen, and A. K. Katsaggelos, Audio-visual interaction in multimodal
communication, IEEE Signal Processing Mag., vol. 14, pp. 3738, Jul. 1997
S. Voran and S. Wolf, Proposed framework for subjective audiovisual testing, ANSI

41

[4.14]

[4.15]
[4.16]
[4.17]

Working group T1A1.5, vol. T1.A1.5, pp. 93151, Nov. 1993.


P. L. Silsbee and A. C. Bovik, Computer lipreading for improved accuracy in
automatic speech recognition, IEEE Trans. Speech Audio Process., vol. 4, pp. 337
351, Sept. 1996.
M. R. Civanlar and T. Chen, Password-free network security through joint use of audio
and video, Proc. SPIE Photonic, pp. 120125, Nov. 1996.
J. Luettin, N. A. Thacker, and S. W. Beet, Speaker identification by lipreading, Proc.
Int. Conf. Spoken Language Processing, Philadelphia, Oct. 1996, pp. 6265.
C. L. Nikias, Riding the new integrated media systems wave, IEEE Signal Processing
Mag., vol.14, pp. 3233, Jul. 1999.

42

5. MULTIMEDIJALNA AKVIZICIJA PODATAKA


Da bi se sprovela analiza i obrada multimedijalnih podataka, potrebno je digitalizovane
audio ili video podatke smestiti u raunar. Posle obrade digitalni signal se rekonstruie, odnosno
konvertuje u analogni oblik. Audio izvori (mikrofoni) ili izvori slike (kamere) u optem sluaju
proizvode analogne signale kontinualne u vremenu. Da bi prikupili audio ili video podatke,
moramo ih odmeravati i digitalizovati. U ovom poglavlju zadraemo se pre svega na primerima
odmeravanja i digitalizacije multimedijalnih podataka.

5.1 Diskretizacija kontinulanih signala


Pri diskretizaciji kontinualnog signala, za ceo postupak koriste se dve operacije:
diskretizacija signala po vremenu (odmeravanje) i diskretizacija signala po trenutnim
vrednostima (kvantovanje) [5.1]. Kada treba izvriti jo i digitalizaciju kontinualnog signala,
obavlja se jo i trea operacija kodovanje, odnosno predstavljanje digitalnih vrednosti signala
grupom cifara ili impulsa. Digitalizovani signal se obino predstavlja pomou dijagrama ili
pomou tabele. Na Slici 5.1.1 predstavljen je jedan digitalizovani signal pomou dijagrama i
tabelarno.

Slika 5.1.1Predstavljanje digitalizovanog signala pomou dijagrama a) i b)


i tabelarno c)

Oigledno je da je prikaz pomou dijagrama na Slici 5.1.1-b pregledniji od prikaza na


Slici 5.1.1-a.

43

5.2 Odmeravanje
Signali koji odgovaraju realnim porukama su konanog trajanja i imaju beskonano irok
spektar. Meutim, glavni deo spektra koncentrisan je u nekom konanom opsegu uestanosti.
Izvan datog opsega, spektralna gustina amplituda signala poruka postaje toliko mala da e pri
realnim radnim uslovima praktino uvek biti prekrivena umom. Zavisnost frekvencijskog
opsega signala od nivoa uma data je na Slici 5.2.1. Smatra se da signali poruka imaju
ogranieno trajanje i ogranienu irinu spektra. Vidi se da nema razloga da se pri prenosu signala
prenosi i deo spektra iznad uestanosti oznaene sa g. Zbog toga, kontinualnim razlikama
dovodimo u korespodenciju kontinualne vremenske funkcije koje imaju strogo ogranien
spektar.

Slika 5.2.1Zavisnost frekvencijskog opsega signala od nivoa uma

Na primer, za rad telefonskog signala dovoljno je preneti sve komponente koje se nalaze
u opsegu uestanosti od 300 Hz do 3400 Hz, a da se pri tome sauva razumljivost i snaga
signala. injenica da realni informacioni signali ne sadre spektralne komponente iznad neke
granine uestanosti fg, omoguava diskretizaciju signala po vremenu.
Postupak odmeravanja kontinualnog signala prikazan je na Slici 5.2.2. Ova slika se
sastoji iz: a) kontinualnog signala, b) povorke impulsa s0(t) dobijene odmeravanjem signala s(t) u
intervalima t i c) kola za odmeravanje kontinulanog signala.
Ako u jednakim vremenskim intervalima t uzmemo trenutne vrednosti signala, to je
prikazano na Slici 5.2.2-b, odnosno ako u tim takama generiemo impulse ija je visina jednaka
amplitudi kontinualnog signala, dobiemo povorku pravougaonih impulsa ije amplitude
pripadaju jednom kontinuitetu moguih trenutnih vrednosti signala. Postupak uzimanja trenutnih
vrednosti kontinulanog signala u odreenim vremenskim intervalima naziva se odmeravanje.
Kolo za odmeravanje sastoji se iz dvopolnog prekidaa na koji se prikljuuje signal koji se
odmerava. Prekida ravnomernom brzinom f0 = 1/t naizmenino spaja jedan od dva kontakta.
Neuzemljeni kontakt ostaje ukljuen sekundi, a uzemljeni kontakt je aktivan preostali period
vremena od t sekundi. Na izlazu kola pojavljuje se povorka impulsa irine , periode T = t
i promenljive amplitude. Diskretne vrednosti dobijene odmeravanjem nazivaju se odmerci.
Teorijski, odmerci treba da budu beskonano uski.
44

Slika 5.2.2Odmeravanje kontinualnog signala: a) kontinualni signal, b) povorka impulsa s0(t) dobijena
odmeravanjem signala s(t) u intervalima t, c) kolo za odmeravanje

Na ovom mestu pomenuemo tzv. teoremu o odmeravanju. Ona kae da se svaki


kontinualni vremenski signal iji je frekvencijski opseg ogranien i nalazi se u intervalu od 0 Hz
do fg moe jednoznano definisati konanim brojem svojih diskretnih vrednosti u konanom
vremenskom intervalu pod uslovom da se odmeravanje vri u vremenskim intervalima
T0 = t

1
2 fg

(5.2.1)

Reciprona vrednost periode odmeravanja T0 naziva se uestanost odmeravanja:

f0 =

1
= 2 fg
T0

(5.2.2)

Kolinik trajanja odmerka i intervala odmeravanja naziva se faktor teine odmeravanja:

0 =

0
T0

= 0 f 0 = 2 f g 0

45

(5.2.3)

Postupak odmeravanja moe se shvatiti kao mnoenje signala s(t) i funkcije odmeravanja h0(t) u
vremenskom domenu, tj.,
s0(t) = s(t)h0(t).

(5.2.2)

Objanjenje procedure odmeravanja kao mnoenje dve vremenske funkcije prikazano je na


Slici 5.2.3.
s(t)

MNOENJE

s0(t)

h0(t)
Slika 5.2.3Procedura odmeravanja

5.2.1 Odmeravanje audio signala


Posmatrajmo talasni oblik jednog audio signala prikazanog na Slici 5.2.1.1, gde je
predstavljena normalizovana amplituda signala u funkciji vremena. Signal se brzo menja.

Slika 5.2.1.1Talasni oblik jednog audio signala

Da bi se signal memorisao fiziki je nemogue odrediti vrednost signala u svakom


trenutku i tu vrednost memorisati. Stoga je potrebno odmeravati signal u regularnim vremenskim
intervalima. Kada je odmeravanje sprovedeno, vrednosti signala u vremenima koja se ne
poklapaju sa trenucima odmeravanja se oigledno za uvek izgubljena. Koliina informacije koja
se izgubi zbog odmeravanja poveava se sa intervalom odmeravanja. Na Slici 5.2.1.2 prikazan
je amplitudni spektar jednog audio signala.

46

Uoava se da je spektar zanemarljiv iznad 12 kHz. Poto su visoko frekvencijske


komponente vrlo male, moe se rei da se signal ne menja velikom brzinom. U tom sluaju,
mogue je odmeravati signal i obnoviti ga kompletno primenom interpolacije ukoliko je
frekvencija odmeravanja dovoljno visoka. Traena frekvencija odmeravanja odreuje se
primenom Nyquist-ovog kriterijuma.

Slika 5.2.1.2Amplitudni spektar audio signala

Primer 5.2.1.1
Ako je periodini signal dekomponovan u pet sinusnih talasa sa frekvencijama
100 Hz, 300 Hz, 500 Hz, 700 Hz i 900 Hz treba odrediti irinu propusnog
opsega i nacrtati spektar signala uz predpostavku da su sve komponente
maksimalne amplitude od 10 V.
U odgovoru na ovaj primer, oznaiemo sa fh najviu a sa fl najniu
frekvenciju, dok je B irina propusnog opsega. Tada je
B = fh fl = 900 Hz 100 Hz = 800 Hz.
Odgovarajui spektar signala dat je na Slici 5.2.1.3.

Slika 5.2.1.3 Spektar signala uz primer 5.2.1.1

47

Primer 5.2.1.2
Signal ima irinu propusnog opsega od 20 Hz. Najvia frekvencija je 60 Hz.
Koja je najnia frekvencija? Nacrtati spektar signala koji sadre sve frekvencije
iste amplitude.
Ako je sa fh oznaena najvia, a sa fl najnia frekvencija, tada je irina
propusnog opsega:
B = fh fl

tj.

fl = fh B = 60 Hz 20 Hz = 40 Hz.
Spektar koji sadri sve integralne frekvencije prikazan je na Slici 5.2.1.4

Slika 5.2.1.4Spektar signala

Primer 5.2.1.3
Posmatrajmo neki audio signal predstavljen funkcijom g(t). Fourier-ova
transformacija signala je oblika:
G () =

g (t ) e

jt

dt

(5.2.1.1)

Ukoliko je G() = 0 za || > 2B, za g(t) se moe rei da je opsega


ogranienog na {B}Hz, signal g(t) se moe predstaviti u obliku:
gs (t ) = g (t ) s (t ) =

g ( kT ) s ( t kT )

k =

gde je s(t) funkcija odmeravanja definisana na sledei nain:

48

(5.2.1.2)

s (t ) =

(t kT )

t =

(5.2.1.3)

Fourier-ova transformacija od gs(t) je [5.2]


Gs ( ) =

1 +
G ( 2 kf s )
T t=

(5.2.1.4)

Primer 5.2.1.4
Na Slici 5.2.1.5 prikazan je vremenski i frekvencijski domen signala koji
ilustruju proces odmeravanja u ogranienom opsegu. Ovde g(t) predstavlja
ulazni signal, fs je frekvencija odmeravanja, s(t) predstavlja talasni oblik
prilikom odmeravanja, dok je gs(t) odmeravani signal.

Slika 5.2.1.5Proces odmeravanja u ograninom opsegu

49

S druge strane, G(), S() i Gs() su Fourier-ove transformacije od g(t),


s(t) i gs(t) respektivno. Uoimo da je Gs() periodiko proirenje za G(). Dva
uzastopna perioda od Gs() nee se preklapati ako je:
fs > 2B

(5.2.1.5)

Ovaj uslov je poznat kao Nyquist-ov kriterijum [5.3]


Na osnovu Nyquist-ovog kriterijuma, signal g(t) irine propusnog
opsega {B}Hz moe se tano obnoviti iz g(kT) ukoliko je frekvencija
odmeravanja fs = 1/T > 2B.
Minimalna frekvencija odmeravanja za perfektnu rekonstruciju signala (u
naem sluaju to je 2B odmeraka/s) naziva se Nyquist-ova frekvencija.
Da bi rekonstruisali originalni signal, odmeravani signal mora da se
dovede idealnom niskopropusnom filtru sa graninom frekvencijom fs/2. To e
usloviti visokofrekventne komponente iz Gs(), pa se dobija originalni signal sa
Fourier-ovim spektrom. Kao alternativa, audio signal se moe rekonstruisati
direktno iz odmeraka koristei sledeu formulu iz vremenskog domena:
g (t ) =

sin ( f s t k )

g ( kt ) ( f t k )

k=

(5.2.1.6)

Ova relacija ukazuje na to da vrednosti signala izmeu neodmeravanih


trenutaka moraju da se tano odrede koristei teinsku sumu svih odmeravanih
vrednosti. Treba uoiti da oba prilaza i u frekvencijskom i u vremenskom
domenu, mada prividno razliiti, u sutini su ekvivalenti jer sin funkcija na
desnoj strani predstavlja impulsni odgovor idealnog niskopropusnog filtra.
Kada je audio signal odmeravan sa fs odmeraka/s frekvencijski opseg
koji moe biti tano rekonstruisan je:
0 f fs/2

(5.2.1.7)

Frekvencije vee od fs/2 se preklapaju, frekvencija odmeravanja audio


signala zavisi od primene. Poto je irina audio-opsega 20 kHz, frekvencija
odmeravanja od 40 kHz je dovoljna kod visokokvalitetnih audio aplikacija. Za
audio CD aplikacije, frekvencija odmeravanja je 44.1 kHz. U tom sluaju
margina od 4.1 kHz ini da je projektovanje ulaznog filtra (eng. antialising
filter) olakano. Tako, na primer, za telefonske sisteme koristi se frekvencija
odmeravanja od 8 kHz.

50

5.2.2 Odmeravanje dvodimenzionalnih (2D) slika


Nyquist-ova teorija odmeravanja moe se proiriti na diskretizaciju slika. Neka je slika
predstavljena funkcijom i(x, y) gde su x i y dve prostorne dimenzije. Dvodimenzionalna (eng.
two-dimensional 2D) formirana transformacija slike moe se predstaviti u obliku:
I ( h , v ) =

+ +

i (x , y )e

j ( h x + v y )

dx dy

(5.2.2.1)

gde je
h
v

horizontalne prostorna frekvencija,


vertikalna prostorna frekvencija.

Treba naglasiti da je h = 2fh i v = 2fv, gde su fh i fv horizontalne i vertikalne frekvencije. Uz


predpostavku pravougaone reetke odmeravanja i ako je slika odmeravana u prostornom
intervalu (x, y), odmeravana slika moe se izraziti kao:

is ( x, y ) = i ( x, y ) s ( x, y ) =

i(mx, ny) ( x mx, y ny )

m = n =

(5.2.2.2)

gde je s(x, y) 2D funkcija odmeravanja definisana relacijom


s (x , y ) =

(x m x , y n y ) .

m = n =

(5.2.2.3)

2D funkcija odmeravanja prikazana je na Slici 5.2.2.1. Frekvencije odmeravanja u horizontalnim


i vertikalnim pravcima su 1/x i 1/y, respektivno.

Slika 5.2.2.1Dvodimenzionalna funkcija odmeravanja

51

Proirujui Nyquist-ovu teoriju na dve dimenzije, moe se pokazati da se slika i(x, y)


moe dobiti ako su ispunjeni sledei uslovi:
1/x 2fm i 1/y 2fv.

(5.2.2.4)

Jedan znaajan parametar u stvaranju digitalne slike je rezolucija slike. Tako na primer,
kada je slika skenirana, treba navesti rezoluciju skenirane slike. Pogodna rezolucija se odreuje
na osnovu (5.2.2.4) i osobina oveijeg vizuelnog sistema. S druge strane, detalji slike koje
vidimo oima zavise od ugla koji slika formira na retini.

5.2.3 Niskopropusni anti-aliasing filtri


U praksi, signal nije tano ogranienog opsega mada su viefrekvencijske komponenete u
optem sluaju veoma male. Ove komponente unose preklapanja (alias) i mogu se smatrati kao
izoblienja u odmeravanom signalu. Da bi se obezbedilo da audio signal ili signal slike bude
dovoljno ogranienog opsega, signal se proputa kroz niskipropusni anti-aliasing filtar kako bi se
znatno smanjile visokofrekvencijske komponente tako da tzv. alias komponente imaju vrlo malu
energiju. Tipina karakteristika 1D niskopropusnog/anti-aliasing filtra prikazana je na Slici
5.2.3.1. gde je sa fs oznaena frekvencija odmeravanja.

Slika 5.2.3.1Karakteristike niskopropusnog/anti-aliasing filtra: a) idealni uskopropusni filter sa ravnim


pojaanjem u propusnom opsegu, b) realizabilni niskopropusni filter sa postepenim prelaskom od propusnog
ka nepropusnom opsegu

Jedan idealni nisko-propusni filtar ima optu graninu (eng. cut-off) frekvenciju od fs/2
to je prikazano na Slici 5.2.3.1-a. U praksi je meutim nemogue realizovati jedan takav filtar.
Na Slici 5.2.3.1-b prikazan je frekvencijski odziv tipinog filtra koji se moe realizovati. Ovde je
pojaanje u propusnom opsegu blisko jedinici, dok je pojaanje u nepropusnom opsegu blisko
nuli. Prelazni opseg omoguuje postupno opadanje pojaanja i to od 1 ka 0. Projektovanje 1D
niskopropusnog/anti-aliasing filtra moe se proiriti na projektovanje 2D niskopropusnog/anti-

52

aliasing filtra za Slike. U tom sluaju filtar e imati dve granine (cut-off) frekvencije i to po
jednu u horizontalnom i vertikalnom pravcu.

5.3 Digitalizacija audio signala


Uproena blok-ema digitalizacije audio signala data je na Slici 5.3.1. Naveemo
glavne funkcije svakog bloka.
Na Slici 5.3.1-a prikazan je proces odmeravanja i digitalizacije audio signala. Analogni
audio signal iz mikrofona ima mali dinamiki opseg. Otuda se on pojaava pre bilo kakve
obrade. Naime, audio signal e biti pojaan pre unoenja bilo kakvog uma (um zbog ditera ili
uma kvantovanja). Diter generator unosi malu koliinu sluajnog uma koji se pridodaje audio
signalu na izlazu iz pojaavaa. Anti-aliasing filter je niskopropusni filtar koji obezbeuje da
audio signal bude ogranienog opsega. Pored toga, on eliminie komponentu preklapanja posle
odmeravanja [5.4].
GENERATOR
DITERA

ANALOGNI
AUDIO SIGNAL
IZ MIKROFONA

POJAAVA

DISKRETNI
DIGITALNI
AUDIO

ANTI-ALIASING
FILTER

SH

A/D
KONVERTOR

a)
ANALOGNI
AUDIO (C N)

ODMERAVANJE
I
DIGITALIZACIJA

DIGITALNI
AUDIO

KOMPRESIJA
I KOREKCIJA
GREKE

MULTIPLEKSER
DIGITALNI
AUDIO

ANALOGNI
AUDIO (N 1)

SKLADITENJE
PODATAKA

ODMERAVANJE
I
DIGITALIZACIJA

b)
Slika 5.3.1Digitalizacija audio signala: a) odmeravanje i digitalizacija, b) N-kanalno registrovanje i
skladitenje audio podataka

Uzorak i zadravanje (eng. sample and hold SH) blok slui za dranje amplitudne
vrednosti odmeraka od trenutka odmeravanja audio signala do trenutka nailaska sledeeg
odmerka. Zatim se vri odmeravanje audio signala u svakom trenutku odmeravanja. Analogno
digitalni (eng. analog to digital A/D) konvertor slui za ekvivalentno digitalno predstavljanje

53

analognog signala. Multipleksiranje niza bita koji dolaze iz razliitih kanala vri se pomou
multipleksera. Komprimovanjem se smanjuje suvinost i komprimuje veliina audio fajla pri
emu se odrava prihvatljiv nivo kvaliteta audio signala.
Kada je audio signal kvantovan koristei mali broj bita po odmerku, kvalitet audio
signala je lo. Utvreno je da ako se pre kvantizacije pridoda mala koliina diter uma
subjektivni kvalitet se poboljava.
Ukoliko audio sistem ima vie kanala (na primer 7 8 kanala), gornja procedura se
primenjuje posebno na svaki kanal. To znai da se odmerci iz razliitih audio kanala
multipleksiraju, komprimuju i skladite za budui tzv. playback, to je prikazano na Slici
5.3.1-b.

5.3.1 Analogno-digitalna konverzija


Ulaz u A/D konvertor je diskretni vremenski signal ija je amplituda realni broj koji
moe da zahteva jedan beskonaan broj bita/digita radi vernog predstavljanja. Za obradu na
digitalnom raunaru, signal u svakom trenutku treba da bude konvertovan u 8, 16 ili 32 bita. To
realizuje kvantizer koji ustvari preslikava kontinualnu promenljivu u diskretnu promenljivu.
Ulazno izlazna relacija za tipian kvantizer je stepenasta funkcija kao to je prikazano na Slici
5.3.1.1.

Slika 5.3.1.1Proces kvantizacije, (a) uniformni kvantizer, (b) neuniformni kvantizer

Predpostavimo sada da nam je potreban kvantizer sa N izlaznih nivoa. Nivoi odluivanja i


izlazni (rekonstruisani) nivoi oznaeni su sa (dk, 0 k N) i (rk, 0 k N 1), respektivno, gde
je dk rk < dk+1. Izlaz iz kvantizera za zadati ulaz u kvantizer oznaen sa g(nT) moe se
izraunati primenom relacije:

Q [g(nT)] = rk, ako je dk g(nT) < dk+1.

54

(5.3.1.1)

Ukoliko su nivoi odluivanja ekvidistantni, tj. ako je (dk-1 dk) konstantno za svako k,
radi se o uniformnom kvantizeru, to je prikazano na Slici 5.3.1.1-a.
Ulaznoizlazna funkcija i greka kvantovanja za neuniformni kvantizer su dati na
Slici 5.3.1.1-b.
Kvantovane vrednosti signala mogu se predstaviti korienjem razliitih metoda. Najvie
rasprostranjena metoda je tzv. metoda PCM. Tu se svaki odmerak predstavlja korienjem
fiksnog broja bita i kodovan je nezavisno od drugih. Ukupan broj moguih amplitudnih nivoa u
PCM je povezan sa brojem bita koji se koriste za predstavljanje svakog odmerka. Ako je N broj
nivoa izlaza iz kvantizera a B broj bita po odmerku, tada je:

N = 2B.

(5.3.1.2)

Vidi se da ukoliko je upotrebljen vei broj bita B za predstavljanje odmerka, broj izlaznih
nivoa N e se poveavati. To e smanjivati greku kvantovanja pa e se dobiti bolji kvalitet audio
signala. Bitski protok kvantnog audio signala dobija se iz izraza:
BITSKI PROTOK = fsB (bita/kanal/sekundi)

(5.3.1.3)

gde je sa fs oznaena frekvencija odmeravanja, dok je B, kao i pre, broj bita po odmerku. Za
stereo audio, kanali se mogu posmatrati kao nezavisni [5.5]. Otuda, bitski protok za stereo audio
bie dva puta od onoga za mono audio, tj. 2fsB bita u sekundi.

5.3.2 Kriterijum vernosti audio signala


Kvalitet audio signala postie se ako se veliki broj bita koristi za reprezentovanje svakog
odmerka. S druge strane, to e poveati bitski protok audio signala. Dakle, kae se da postoji
veza bitskog protoka i kvaliteta digitalizovanog audio signala. Izbor bitskog protoka i kvaliteta
audio signala zavisi od odgovarajue primene audio signala. U cilju postizanja objektivnosti
ocene, vano je da se definiu kriterijumi vernosti audio signala. Koriste se dva kriterijuma za
procenu kvaliteta analize signala: subjektivni (kvalitativni) i objektivni (kvantitativni).
Kod subjektivne procene, vernost audio signala predstavlja se pomou tzv. skale
pogoranja koja ima pet nivoa od 1 do 5 to je prikazano u TabelI 5.3.2.1 [5.6].
Tabela 5.3.2.1Skala pogoranja za procenu vernosti audio signala
Vrlo neugodna smetnja

Neugodna smetnja

Neznatno neugodna smetnja

Smetnja se osea ali nije neugodna

Smetnja se ne osea

55

Na skali pogoranja meri se kvalitet ujnosti obzirom na izoblienje u signalu. Za zadati


audio signal grupe ispitanika (nazvani subjekti) su ispitivani da procene kvalitet audio signala
dajui odgovarajue ocene na skali od pet opcija. Miljenja su subjektivna, a rezultati variraju od
subjekta do subjekta. Prosean rezultat (srednja vrednost) se naziva srednja vrednost miljenja
(eng. mean opinion score MOS). MOS zahtev zavisi od oblasti primene. Tako, na primer ocena
tri moe biti zadovoljavajua u telefoniji. S druge strane, za kvalitetan audio, vrednost ocene za
MOS treba da bude bliska pet (vea od 4.5). Subjektivni kvalitet audio signala na osnovu
ljudskog auditornog sistema je sloena procedura koja ukljuuje eksperimente uz prisustvo
eksperata i/ili neekspertnih subjekata. Uz to, na subjektivne procene utie izbor subjekata i
pravilno obavljanje eksperimenta. Iz tog razloga razvijeno je nekoliko kvantitativnih mera da bi
se procenio objektivni kvalitet audio signala.
Izbor objektivne (kvantitativne) mere izoblienja zavisi od vie faktora. Pre svega,
ovakva mera se moe prikazati u prirodnom analitikom obliku, a onda biti prilagoena za lako
izraunavanje. Odnos signalum (eng. signal-to-noise ratio SNR) i srednja kvadratna greka
(eng. mean square error MSE) su dva parametra za utvivanje izoblienja audio signala. Oni
su dati sledeim izrazima:
N 1

SNR =

f ( n )

n =0

N 1

f ( n ) f ( n )

(5.3.2.1)

n =0

SNR ( dB ) = 10 log10 SNR

1
MSE =
N
gde su
f (n)
f ( n )
N

N 1

f ( n ) f ( n )

(5.3.2.2)
2

(5.3.2.3)

n =0

odmerci originalnog audio signala,


odmerci kvantitativnog audio signala i
predstavlja broj audio odmeraka.

Tradicionalno, SNR je najpoznatija mera za greku. Pored toga to prua korisne informacije,
ovaj odnos je matematiki prilagodljiv, pa je iz tog razloga naiao na najiru primenu. Naalost,
vrednosti SNR nisu u dobroj koleraciji sa subjektivnim ocenama, naroito pri velikim odnosima
kompresije.
Kvalitet digitalnog audio odmerka je odreen brojem bita po odmerku. U procesu
kvatizacije, ulazna vrednost odmerka je predstavljena najblie moguim izlaznim nivoom. U tom
procesu, unosi se um u kvantovani signal. Greka (um) kvantovanja je razlika izmeu stvarne
vrednosti analognog signala i njegove kvantovane vrednosti. Drugim reima

e ( nT ) = f ( nT ) g ( nT ) = g ( nT ) Q g ( nT )

56

(5.3.2.4)

gde je
g ( nT )

ulazni signal,

g ( nT )

izlaz iz kvantizera,

e ( nT )

signal greke u trenutku odmeravanja nT.

Ukoliko se za greku e(nT) predpostavi da je statistiki nezavisna i sa uniformnim redosledom u


intervalu [-Q/2, Q/2], srednja kvadratna vrednost uma kvantovanja za signal sa dinamikim
opsegom od 1 (tj. Q = 2 B) moe se izraziti u obliku
Q/2

1
Q 2 22B
2
E=
e de =
=
Q Q/ 2
12
12

gde je
B

(5.3.2.5)

broj bita upotrebljen za predstavljanje svakog odmerka.

Izraeno u dB, srednja kvadratna vrednost uma moe se predstaviti u obliku:


E = 10log10

2 2B
Q2
= 10log10
= 6B 10.8 .
12
12

(5.3.2.6)

Jednakost (5.3.2.6) pokazuje da svaki dodatni bit u postupku A/D konverzije smanjuje
um za oko 6 dB i na taj nain poveava SNR za isti iznos. Tako, na primer, SNR za 16 bitni
kvantovani audio signal e biti reda veliine 96 dB. Za jedan audio signal koji ima SNR vei od
90 dB se smatra da je odlinog kvaliteta za najvei broj primena.

5.4 Digitalizacija slika


Osetljivost ljudskog vizuelnog sistema je skromnija nego kod auditivnog sistema. Dok
auditivni sistem moe da razlikuje na hiljade nivoa zvunog pritiska, HVS moe da razlikuje
samo oko 200 nivoa sjaja [5.7]. Slika sivog nivoa moe se opistai kao slika odlinog kvaliteta sa
8-bitnom rezolucijom koja odgovara vrednosti od 256 nivoa sivog [5.8]. to se tie slike u boji,
njene tri osnovne komponente R, G i B zajedno se koriste. Svaka od tri komponente posebno se
kvantuje [5.9]. Na primer, senzori visoke rezolucije u optem sluaju koriste 8 bita/kanal/piksel.
Stoga je ukupno 24 bita potrebno za predstavljanje piksela u boji. Uoimo da 24 bita po pikselu
odgovara broju od 224 boja, to je mnogo vie od nego to ljudske oi mogu da razlikuju. Otuda,
mnogi elementarni ureaji koriste displej sa niom rezolucijom (tj. 8 bita ili 16 bita).

5.4.1 Vizuelna vernost


U procesu kvantizacije piksela pogorava se kvalitet vizuelnih podataka. Uz to, moe se
pojaviti izoblienje usled kompresije slike. Kao i u sluaju audio signala, postoje dva tipa mere

57

vernosti: subjektivni i objektivni. U sluaju subjektivnih mera, koristi se slina skala kao i kod
audio signala za procenu kvaliteta slike. Meutim vizuelno testiranje sa realnim subjektima
predstavlja glomaznu proceduru. Otuda, kada je u pitanju vizuelna vernost, u praksi se najee
koriste objektivne mere vernosti. Ove najee koriene mere su SNR i MSE. Ovim merama
treba pridodati vrni odnos signalum (eng. peak-signal-to-noise ratio PSNR), kao i srednju
apsolutnu greku (eng. mean absolute error MAE). Ako su f ( m, n ) i f ( m, n ) originalna i
izobliena slika, respektivno, dimenzija M N, vizuelna vernost moe se oceniti primenom
sledeih parametara [5.10], [5.11]:
M 1 N 1

SNR ( dB ) = 10 log10

f ( m, n )

m=0 n =0
M 1 N 1

f ( m, n ) f ( m, n )

m =0 n =0

M 1 N 1

PSNR ( dB ) = 10 log10

(5.4.1.1)

[ vrna vrednost signala ]

m =0 n =0
M 1 N 1

f ( m, n ) f ( m, n )

(5.4.1.2)

m =0 n =0

1
MSE =
MN
MAE =

M 1 N 1

f ( m, n ) f ( m, n )

m =0 n =0

1
MN

(5.4.1.3)

M 1 N 1

f ( m, n ) f ( m, n )

(5.4.1.4)

m=0 n =0

Mada ove objektivne mere omoguuju da se brzo proceni izoblienje, one nisu dobro
korelisane sa subjektivnim procenama, naroito kada se radi o velikom izoblienju.

5.5 Rezime
U dananjim telekomunikacionim sistemima, analiza i obrada multimedijalnih podataka
predstavlja vrlo aktuelan problem. Kod analognih sistema javljaju se problemi uma,
nestabilnost, velike potronje energije. Da bi se audio ili video podaci smestili u raunar moraju
se digitalizovati. Digitalni sistemi omoguavaju jednostavan prenos i skladitenje podataka.
Pored toga, iroke mogunosti programiranja ine digitalne sisteme superiornim u odnosu na
analogne. Digitalizacija multimedijalnih signala je opta tema koja se pojavljuje u vie naunih
disciplina. injenica je da su audio i video sistemi uneli mnogo specifinih zahteva koji se
postavljaju prema digitalizovanom signalu, a koji su posledica izuzetnih zahteva ula sluha u
ula vida kao krajnjih korisnika informacija.
Da bi se analogni audio adekvatno digitalizovao njegov spektar mora biti ogranien u
skladu sa teoremom odabiranja. Spektar audio signala moemo ograniiti na dva naina. Prvi
nain je da ga ograniimo samo sa ulaznim filtrom. Drugi nain je da koristimo ulazni filtar u
58

kombinaciji sa tzv. oversampling-om. Pojam oversampling podrazumeva odmeravanje koje


se obavlja na mnogo vioj frekvenciji od Nyquist-ove granice. Poto je frekvencija odmeravanja
dovoljno velika, nee doi do preklapanja u spektru.
Kvantovanje je proces koji trajno unosi greku kako u audio tako i u video signal.
Veliina greke zavisi od broja nivoa kvantovanja. Zbog nelinearnosti karakteristike kvantizera
dolazi do izoblienja koja prouzrokuju harmonike (granulacioni um). Efikasna metoda za
uklanjanje granulacionog uma je diterovanje. To je nezaobilazni proces kod A/D konvertora
audio signala.
Greka kvantovanja moe se smanjiti na dva naina: da se povea broj nivoa
kvantovanja, odnosno broj bita po odmerku ili da se koristi oversampling. Kako je danas
isplativije da se poveava brzina odmeravanja nego broj bita, treba se opredeliti na primenu
oversampling-a.
Ukoliko audio signal dolazi iz vie kanala odmerci iz razliitih audio kanala se
multipleksiraju, komprimuju i skladite za budui playback.
Da bi se digitalizovala slika treba poznavati osobine ljudskog vizuelnog sistema.
Odmeravanje slike vri se pomou vie reetki. Heksagonalno odmeravanje bolje formira
frekvencijsku ravan to rezultuje manjom frekvencijom odmeravanja. Nedostatak ovih tipova
odmeravanja je u tome to nisu skalabilna. Za kvantovanje slike koriste se dve vrste kvantizacije:
skalarna i vektorska. Skalarno kvantovanje koristi uglavnom osam bita, jer vie bita nee
generalno poboljati kvalitet slike, osim ako se ne vre neka dodatna ispitivanja. Prednost
skalarne kvantizacije u odnosu na vektorsku je u tome to je skalarna kvantizacija bra.
Radi postizanja ocene kvaliteta audio signala definiu se dva kriterijuma i to subjektivni
(kvalitativni) i objektivni (kvantitativni). Subjektivni ukljuuje procene na osnovu eksperimenata
sa ispitanicima. Objektivni kriterijum, s druge strane, uzima u obzir odnos signalum i srednju
kvadratnu greku nastalu u procesu kvantizacije signala.
U procesu kvantizacije piksela pogorava se kvalitet vizuelnih podataka. Kada je re o
vizuelnoj vernosti, dva najee koriena parametra za procenu kvaliteta su opet odnos signal
um i srednja kvadratna greka. Meutim, u ovom sluaju kao parametri se jo pridodaju vrni
odnos signalum i srednja apsolutna greka.
U skoroj budunosti od ureaja za akviziciju audia oekuje se: poveanje frekvencije
odmeravanja, zamena analognih komponenti i na taj nain poboljanje performansi sistema za
akviziciju. Korienjem vektorske kvantizacije treba poveati kvalitet i kompresiju digitalnog
audio signala. Treba imati u vidu i to da je zbog porasta kompleksnosti integracije i trenda
smanjenja napona napajanja sve tee realizovati konverziju visoke rezolucije sa klasinim A/D
konvertorima. to se tie akvizicije slike, potrebno je poveanje gustine odmeravanja i na taj
nain poboljanje performansi sistema za akviziciju, korienje vektorske kvantizacije, kao i rad
na usavravanju poluprovodnikih senzora i otklanjanju njihovih nedostataka.
Napretkom tehnologije sve vie se prelazi na digitalne sisteme za akvizaciju slike. Na
primer, razvoj silicijumskih senzora i odgovarajuih ipova osnovni su razlog za iroku
eksploataciju digitalnih kamera.

Pitanja
1.
2.

Koji se postupci koriste pri diskretizaciji, a koji pri digitalizaciji kontinualnog signala?
ta je to odmeravanje kontinulanog signala i kako se ono vri?
59

3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.

ta je to kontinualno odmeravanje?
Nacrtati blok-emu kola za odmeravanje signala i objasniti kako radi ovo kolo.
Kako glasi teroema o odmeravanju?
ta je to faktor reima odmeravanja?
Nacrtati blok-emu koja ilustruje proceduru odmeravanja u vremenskom domenu.
ta predstavlja Nyquist-ov kriterijum?
Kako se Nyquist-ova teorija odmeravanja moe proiritu na diskretizaciju slike?
U emu se ogleda uloga tzv. anti-aliasing filtra kod multimedijalne akvizicije
podataka?
Nacrtati karakteristiku anti-aliasing filtra koji se moe realizovati u praksi i naznaiti
odgovarajue parametre.
Nacrtati blok-emu za digitalizaciju audio signala, naznaiti i objasniti funkciju svakog
elementa.
Na koji se nain vri N-kanalno registrovanje audio podataka?
ta je to uniformni, a ta neuniformni kvantizer?
Na koji nain se moe poboljati kvalitet audio signala kada se primeni impulsno
kodovana modulacija?
Kako se odreuje bitski protok kvantovanog audio signala za monoaudio i za
stereoaudio?
Koji se kriterijumi koriste za procenu kvaliteta audio signala?
Kada se koristi subjektivni, a kada objektivni kriterijum za procenu kvaliteta audio
signala?
Predstaviti tabelarno skalu pogoranja za procenu vernosti audio signala.
ta utie na subjektivne procene kvaliteta audio signala?
Kako glase izrazi za utvrivanje odnosa signal-um u dB i srednju kvadratnu greku
nastalu u toku obrade audio signala?
Predpostavljajui da je um kvantovanja statistiki nezavisan i sa uniformnom
raspodelom u intervalu [-Q/2, Q/2] odrediti srednju kvadratnu vednost uma u dB.
U emu se ogleda uloga dodatnog bita u postupku analogno-digitalne konverzije?
Kada se smatra da je za najvei broj primena audio signal odlinog kvaliteta?
Uporediti osetljivost ljudskog auditivnog i vizuelnog sistema.
ta je potrebno za opisivanje digitalne slike sivog nivoa, a ta za opisivanje kada je ista
u boji?
Koji se parametri koriste za utvrivanje vizuelne vernosti digitalizovane slike?
Kako se definie vrni odnos signal-um za odreivanje vizuelne vernosti
digitalizovane slike?
Napisati analitiki izraz za srednju kvadratnu greku nastalu u procesu digitalizacije
slike.
U emu se razlikuju subjektivne i objektivne mere za procenu vernosti digitalizovane
slike?

60

Literatura
[5.1]
[5.2]
[5.3]
[5.4]
[5.5]
[5.6]
[5.7]
[5.8]
[5.9]
[5.10]
[5.11]

Z. Uroevi i M. Savi, Telekomunikacije: Elementi Teorije, Analize i Obrade Signala.


Beograd, Nauka, 1995.
M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
B. P. Lahti, Signal Processing and Linear Systems. Carmichael, CA: BerkeleyCambridge Press, 1998.
N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to
Speech and Video. Englewood Cliffs, N. J: Prentice Hall, 1984.
K. C. Pohlmann, Principles of Digital Audio. New York, McGraw-Hill, 2000.
Methods for the Subjective Assessment of Small Impairments in Audio Systems,
Including Multichannel Sound Systems, ITU-R REC. BS.1116, 1994.
Z. S. Bojkovi, C. I. Toma, V. Gui, and R. Vasiu, Advanced Topics in Digital Image
Compression. Timisoara, Romania: Politechnica, 1997.
M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham,
Washington, USA, SPIE-The International Society for Optical Engineering, 1991.
R. W. G. Hunt, The Reproduction of Colour. England, Fountain Press, 1987.
A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey,
Prentice Hall, 1989.
K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio
Coding. Upper Saddle River, NJ: Prentice Hall, 1996.

61

6. KOMPRESIJA TEKSTA
Tekst je jo jedan znaajan medium za predstavljanje multimedijalnih informacija.
Ustvari, to je najstariji medijum za skladitenje i prenos informacija. Najvei broj dananjih
informacija jos uvek se uva u tekstualnom obliku. U ovom poglavlju daemo najpre kratak
uvod u predstavljanje teksta u digitalnoj formi, a zatim e biti rei o nekim tehnikama kompresije
teksta.

6.1 Predstavljanje teksta u digitalnoj formi


Za razliku od audio i video podataka, kod teksta nema odmeravanja u vremenskom
domenu niti kvantizacije. Za podatke o tekstu moe se pretpostaviti da su stvoreni iz diskretnog
informacionog izvora koji emituje simbole, a ovi predstavljaju slova koja odgovaraju nekoj
azbuci (alfabetu). Poto se tekstualni podatak iroko koristi za predstavljanje mnogih dokumenta
(knjige, novine, periodike), vano je sprovesti efikasno predstavljanje kako bi se smanjio zahtev
za skladitenim prostorom (memorijom).
Poto izvor ima svoju azbuku, to znai da on moe da emituje bilo koji simbol (poruku) koji
pripada datoj azbuci. Da bi opisali izvor, moemo uzeti u obzir sve mogue simbole koje izvor
moe da emituje. To znai da e izvor biti mnogo bolje opisan nekom srednjom koliinom
informacije koju on emituje. Ova srednja koliina informcije naziva se entropija izvora.
Entropija predstavlja prosenu koliinu informacija po simbolu kojom izvor snabdeva
posmatraa, odnosno proseni izvor neizvesnosti koju posmatra poseduje pre nego sto izvri
ispitivaje izlaza iz izvora.
Neka diskretni izvor informacija emituje simbole iz azbuke tj. skupa simbola S
S = {s1, , si, , sj , sq}

pri emu se svaki simbol pojavljuje sa izvesnom verovatnoom


P(s1), ,P(si), ,P(sj),P(sq).

Ukoliko pojava datog simbola ne zavisi od prethodnih simbola, entropija ovakvog izvora
informacije data je izrazom

62

H ( s ) = P ( si ) log 2
S

1
, si S .
P ( si )

(6.1.1)

Maksimalnu entropiju imae izvor kod koga su verovatnoe emitovanja svih simbola date
azbuke jednako verovatne. Tada je neizvesnost najvea poto nijedan simbol nema prioritet. Ako
azbuka ima q simbola ija je verovatnoa pojavljivanja p = 1/q onda je maksimalna
entropija

H max = P ( si ) log 2
i=1

jer je oigledno

i =1

q
1
1
= log 2 ( q ) = log 2 ( q )
P ( si ) i=1 q

(6.1.2)

1
=1.
q

Kao to se vidi, maksimalna entropija brojno je jednaka kolini informacija.


Minimalna entropija nastaje kada izvor ne emituje nikakvu informaciju. To je sluaj kada
izvor emituje samo jedan simbol, tj. kada je verovatnoa pojavljivanja jednog simbola jednaka
jedan, a svih ostalih je nula. Na Slici 6.1.1 prikazana je entropija binarnog izvora informacija u
funkciji verovatnoce pojave 0 ili 1.

Slika 6.1.1Entropija binarnog izvora informacija

Funkcija H(p) naziva se entropijska funkcija. Izvori koji emituju simbole koji su
meusobno statistiki nezavisni nazivaju se izvori bez memorije. Najzad na osnovu svega do
sada naloenog moe se izvui zakljuak da je izvor informacija definisan: azbukom (listom
simbola) koju emituje, verovatnoom pojavljivanja simbola, brzinom emitovanja simbola i
prosenom brzinom emitovaja informacije.

63

Primer 6.1.1
Odrediti entropiju diskretnog izvora bez memorije sa etiri izvorna simbola
S = { A, B, C, D} ije su verovatnoe pojavljivanja: P(A) = 0.60, P(B) = 0.30, i
P(C) = P(D) = 0.05.
Traena entropija dobija se iz izraza:

1
H ( s ) = P ( si ) log 2
P ( si )
i=1
q

= P ( si ) log 2 P ( si )
i=1

= 0.60log 2 0.60 0.30log 2 0.30 0.05log 2 0.05 0.05log 2 0.05


= 3.33 0.60log10 0.60 + 0.30log10 0.30 + 2 ( 0.05log10 0.05 )
= 1.40 bita/simbol

6.2 Principi kompresije teksta, statistika suvinost


Tipini podaci o tekstu nose suvinu informaciju. Tehnike kompresije teksta smanjuju ili
eliminiu tu suvinost ime se postie kompresija. Neka je izvor informacija pisani jezik. On se
kao i govorni moe posmatrati kao stohastiki proces u kome su nizovi slovnih znakova
determinisani zakonima verovatnoe. Meutim opisivanje jezika kao stohastikog procesa je
oteano zbog toga sto su razliiti elementi jezika (slova, grupe slova i rei u jeziku ) meusobno
zavisni. To znai da upravo emitovanje simbola zavisi od niza prethodno emitovanih simbola.
Ukoliko verovatnoa pojavljivanja datog slova zavisi od m prethodnih simbola, tj ako je
uslovna verovatnoa da e posle sj1, sj2, , sjm biti emitovan simbol si data izrazom
P (si |sj1, sj2, , sjm)
gde je
i = 1, 2, , q,
jp = 1, 2, , q,
kaemo da se radi o Markovljenim izvorima m-tog reda koji generiu simbole sa liste
s = (s1, s2, sq), pri emu su pored ve opisanih uslovnih verovatnoa poznate i verovatnoe
P(si), dok se entropija ovog izvora odreuje pomou izraza
H (S )=

q m+1

P(s
i=1

j1

, ,s jm ,s i ) log 2

1
.
P ( si | s j1 ,s j2 , ,s jm )

(6.2.1)

Niz od prethodno emitovanih m simbola predstavlja stanje izvora. Ukupan broj stanja
iznosi qm, pa je broj uslovnih verovatnoa qm+1. Postojanje statistike zavisnosti ismeu simbola

64

smanjuje neizvesnost pa, prema tome, i koliinu informacije. To znai da e entropija izvora koji
emituje statistiki zavisne impulse uvek biti manja od entropije istog takvog izvora, ali koji
emituje statistiki nezavisne impulse.
Oznaimo sa Hp vrednost entropije neke azbuke pod pretpostavkom da je verovatnoa
pojavljivanja svih slova (simbola) date azbuke jednaka i da ne postoji nikakva statistika
zavisnost pri pojavi slova (H0 = Hmax). Neka je H stvarna vrednost entropije u sluaju da su
uzete u obzir sve statistike zavisnosti jezika koje se izrazavaju pomou date azbuke. Tada odnos
H/H0 predstavlja stepen iskoriscenja simbola (slova) ili relativnu entropiju.
Statistika suvinost odnosno redundantnost predstavlja meru za ogranienja koju tekstu
namee statistika struktura jezika. Definie se preko stepena iskorienja slova, tj.,
R = 1

H
H0

(6.2.2)

ili u procentima
R (%) = 100 (H0 H)/H0.

(6.2.3)

Primer 6.2.1
Koliki je stepen iskorisenja slova ruske azbuke (32 slova) i kolika je
redundantnost ruskog jezika ako se zna da stvarna entropija ove azbuke (H)
iznosi 1.4 bita po slovu?
Najpre treba odrediti entropiju nultog reda koja iznosi:
H 0 = H ( s ) = P ( si ) log 2
s

1
1
1
= log 2 32 = 32 5 log 2 2 =
32
P ( si ) 32 32
.

= 5 bita po slovu

Sada je stepen iskorisenja slova ove azbuke:


H

1 .4
= 0 . 28 .
5

Primer 6.2.2
Koliku koliinu informacije nosi televisijska slika koja se sastoji od 625 linija a
svaka linija od 500 elementarnih taaka pri emu svaka taka moe da ima
16 nivoa osvetljenosti u rasponu od belog do crnog?
Posmatrana TV slika sastoji se od
65

625 linija 500 taaka = 312 500 taaka.


Svaka taka moe da ima 16 nivoa osvetljenosti. To znai da ukupan broj
625500 )
slika. Poto je pojava
razlilitih slika koje se mogu pojaviti iznosi 16(
svake slike jednako verovatna, bie
P(E)=

1
16

( 625500 )

Koliina informacije koji nosi TV slika iznosi


I = log 2

1
= log 2 16( 625500) = 312 500 log 2 ( 24 ) = 312 500 4 =
P(E)
.

= 1 250 000 = 1.25 Mb

Teorija izvornog kodovanja bavi se kompresijom podataka generisanih iz informacionih


izvora koji emituje niz simbola odabranih iz konanog alfabeta.
U teoriji izvornog kodovanja, entropija i funkcija stepena oteenja informacije (eng.
grade distortion function GDF) su dva osnovna koncepta. Kao sto smo videli, entropija prua
meru za informaciju sadranu u izvoru podataka i otuda odreuje minimum prosenog bitskog
protoka potrebnog za perfektnu reprodukciju izvornih simbola. Teorija oteenja informacije
daje niu granicu za prosean broj bita za dato izoblienje u obnovljenim simbolima [6.1].
Primer 6.2.3
Posmatrajmo povorku slova X = aaabbbbbbbccaaabbcbbbb.
Alfabet zadatog izvora sadri tri slova {a, b, c}.
U povorci slova postoji 6a, 13b i 3c.
Histogram e biti: h(a) = 6 , h(b) = 13 i h(c) = 3.
Poto ima ukupno 22 slova bie:
p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14.
Zbir svih verovatnoa je 1.
Mada izvor informacije moe imati K simbola, informacija koju nosi svaki simbol nije
podjednako verovatna. Prosena informacija koju nosi simbol povezana je sa recipronom
vrednosu njegove verovatnoe i data je u obliku
I ( si ) = log

1
.
p [k ]

(6.2.4)

Iako svaki simbol moe biti analiziran posebno, korisno je razmotriti velike blokove simbola pre
nego pojedinane simbole. Izlaz iz izvora se grupie u blokove od N simbola, a za simbole se
moe predpostaviti da su generisani iz izvora SN sa alfabetom dimenzije KN. U tom sluaju izvor
SN predstavlja N-to proirenje izvora S.
66

Entropija izvora definisana je kao prosena koliina informacija po izvornom simbolu,


tj.,
K

k =1

k =1

H ( S ) = p [ k ] I ( s k ) = p [ k ]log 2 p [ k ]

(6.2.5)

i izraava se u bitima po simbolu.


Ovo je esto korisena tzv. entropija prvog reda (eng. first order entropy FOE). Sa p[k]
oznaena je verovatnoa nastajanja k-tog simbola. FOE se esto zove entropija bez memorije jer
daje minimalni bitski protok za reprodukciju diskretnog niza podataka bez gubitaka.
Primer 6.2.4
Neka je data povorka slova iz izvora aaabbbbbbbccaaabbcbbbb. Treba
odrediti entropiju prvog i drugog reda.
Prema datim podacima u povorci postoji ukupno 22 slova. Od toga postoji: 6a,
13b, i 3c. Stoga je: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14.
Sa ovim, entropija prvog reda iznosi
H1 = (0.27 log20.27 + 0.59 log20.59 + 0.14 log20.14) = 1.36 bita/simbol.
Da bi smo izraunali verovatnou drugog reda, treba uzeti u razmatranje dva
slova. U tom sluaju alfabet e se sastojati iz devet simbola:
{aa, bb, cc, ab, ba, ac, ca, bc, cb}. Poto imamo 22 simbola u startu, moe se
smatrati da povorka (niz) sadri 11 parova od dva simbola {aa, ab, bb, bb, bb,
cc, aa, ab, bc, bb, bb}.
Verovatnoe razliitih simbola su: p(aa) = 2/11 = 0.18, p(ab) = 2/22 = 0.18,
p(bb) = 5/11 = 0.45, p(cc) = 1/11 = 0.09 i p(bc) = 1/11 = 0.09. Entropija drugog
reda izraunava se na sledei nain:
H2 = (2 0.18 log2 0.18 + 0.45 log2 0.45 + 2 0.09 log2 0.09)
= 2.03 bita/simbol, (1 simbol = 2 slova).

6.3 Shannon-ova teorema kodovanja za beumni izvor


Funkcija gustine verovatnoe i entropija izvora informacija mogu se primeniti kod
komprimovanja teksta. U tom cilju pomoi e nam Shannon-ova teorema kodovanja za beumni
izvor [6.2].
Neka je S izvorni tekst sa alfabetom veliine K i entropijom H(S). Posmatrajmo blokove
kodovanja od N izvornih simbola u binarne kodne rei. Shannon-ova teorema kodovanja za
beumni izvor kae da je za bilo koje S > 0, mogue za N dovoljno veliko konstruisati kod tako
da prosean broj bita po originalnom izvornom simbolu R zadovoljava sledeu relaciju:

67

H (S ) R H (S ) + S

(6.2.6)

Drugim reima izvor moe biti kodovan bez gubitaka sa prosenim brojem bita bliskim
njihovoj entropiji ali ne manjoj od entropije. Entropija izvora ograniena je sa 0 i log2K. To
znai, drugim reima da je
0 H(S) log2 K.

(6.2.7)

U ovoj relaciji leva strana vai ako je p[k] nula za sve izvorne simbole sk izuzev jedinice.
U tom sluaju je izvor apsolutno prediktabilan. Desna strana vai kada svaki izvorni simbol sk
ima istu verovatnou pojavljivanja. Redundansa izvora je definisano kao
REDUNDANSA = log2K H(S).

(6.2.8)

Ova relacija pokazuje da ukoliko izvor ima alfabet velicine K, maksimalna entropija
izvora je log2K. Ako je entropija iznosi log2K za izvor se moe kazati da je nulte suvinosti. U
najveem broju sluajeva informacija sadri suvinost.
Primer 6.3.1
Posmatrajmo izvor informacija sa alfabetom {a, b, c, d}. Simboli imaju
podjednaku verovatnou nastajanja. Treba odrediti entropiju i redundansu
izvora. Takoe treba pronai broj bita potreban za prenos simbola iz izvora a
zatim i koder pogodan za kodovanje simbola.
Poto je p(a) = p(b) = p(c) = p(d) = 0.25, entropija izvora iznosi:
4 0.25 log2 0.25 ili 2 bita/simbol.
Imajui u vidu da je veliina alfabeta K = 4, redundansa je nula, poto je
entropija jednaka log2 K = 2.
Prosean broj bita potreban za prenos simbola je 2 bita/simbol. U tom sluaju,
projektovanje kodera je trivijalno. Naime bie a: 00, b: 01, c: 10 i d:11.
Primer 6.3.2
Koliki je prosean broj bita potreban za izvor od tri simbola? Koliki je
minimalan broj bita potreban za kodovanje izvora od tri simbola koji je inae
oblika {aaabbbbbbbccaaabbcbbbb}. Takoe treba odrediti redundansu izvora.
Kada je redundansa izvora jednaka nuli?
Broj bita potreban za jedan izvor informacije od tri simbola je
log2 3 = 1.59 bit/simbol.
U primeru 6.2.4 pokazali smo da je entropija za zadati izvor informacija 1.36
bit/simbol. Suvinost u datom izvoru informacije sa 3 simbola je:
log2K H(S) = 1.59 1.36 = 0.23 bit/simbol.
Suvinost izvora je nula kada je entropija H(S) jednaka log2K. To e se dogoditi

68

samo u sluaju da svi simboli imaju podjednaku verovatnou tj. 1/K.


Treba uoiti da Shannon-ova teorema prua donju granicu zahteva za brojem bita. U
praksi je vrlo teko postii broj bita jednak entropiji. Ukoliko se eli da projektujemo koder sa tri
simbola, lako moemo dobiti koder prenoenjem dva bit/simbol. Pri tome se pojavljuje bitski
iznos od 0.64 (2 1.36) bit/simbol vei od nivoa entropije S = 0.64. Ukoliko se S smanjuje,
znatno se poveava kompleksnost kodera.

6.4 Huffman-ovo kodovanje


Prema Shannon-ovoj teoremi o beumnom kodovanju, prosean broj bita R za
kodovanje izvorne informacije je ogranien sa donje strane entropijom izvora. Meutim
Shannon-ova teorema ne utvruje nain projektovanja kodera koji e korigovati izvornu
informaciju sa prosenim brojem bita R . Huffman je dao praktinu metodu za projektovanje
kodera koji daje broj bita blizak entropiji. Ovaj metod daje kod promenljive duine (eng.
variable length code VLC) za svaki izvorni simbol i to tako da je broj bita u kodu priblino
obrnuto proporcionalan verovatnoi nastajanja simbola [6.3].
Tabela 6.4.1 prikazuje alfabet izvora zajedno sa verovatnoama individualnih simbola.
Izvor informacija sa 6 simbola zahteva najvie log2 6 = 2.58 bita. Entropija izvora je u ovom
sluaju H = (0.3log2 0.3 + 20.2 log2 0.2 + 30.1 log2 0.1) = 2.44 bit/simbol. To drugim reima
znai da je mogue projektovati koder koji e obavljati svoju funkciju sa 2.44 bit/simbol u
proseku.
Tabela 6.4.1Primena modela za alfabet {a, b, c, d, e, !}
Simboli
a
b
c
d
e
!

Verovatnoa
0.2
0.1
0.2
0.2
0.3
0.1

Huffman-ov kod
10
011
11
0100
00
0101

Huffman-ov kod za izvor informacije je generisan u dva koraka: redukcija izvora i


naznaka koda. Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1.
objasniemo korienjem Slike 6.4.1. Postoji nekoliko koraka. U prvom koraku simboli su
poreani po opadajuoj verovatnoi nestajanja. Na primer ovde je p(b) = p(d) = p(!) = 0.1.
Izabrali smo redosled b, d, !, ali je moguan bilo koji redosled.
Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1 objasniemo
korisenjem Slike 6.4.1. Tu postoji nekoliko koraka. U prvom koraku simboli se poreaju po
opadajuem verovatnoci i nastajanja. Na primer, ovde je p(b) = p(d) = p(!) = 0.1. Odabran je
redosled b, d, ! ali moguan bilo koji redosled.
Kada se simboli razvrstavaju, u sledeem koraku novi simbol je kreiran kombinacijom
dva najmanja verovatna simbola. U naem primeru stavili smo d i !. Stoga, novi simbol ima
69

verovatnou nastajenja 0.2 (0.1 i 0.1). Sada vidimo da se broj simbola smanjio za jedan. U koloni
dva, izvor ima etiri simbola umesto pet. Verovatnoe ta etiri simbola su rasporeene po
opadanju, kao to je to prikazano u koloni tri. U sledeem koraku dva najmanje verovatna
simbola su ponovo spojena, pa su zatim nove verovatnoe ponovo rasporeene po opadanju.
Proces se ponavlja dok se izvor ne svede na dva simbola. U naem primeru dve poslednje
verovatnoe su 0.6 i 0.4.
ORIGINALNI IZVOR

DODELJIVANJE KODA

Simbol

Verovatnoa

0.3

0.3

0.3

0.4

0.6

0.2

0.2

0.3

0.3

0.4

0.2

0.2

0.2

0.3

0.1

0.2

0.2

0.1

0.1

0.1
Slika 6.4.1Huffman-ov proces redukcije izvora

Poto je zavren proces redukcije izvora, zapoinje proces dodeljivanja Haffman-ovog


koda koji je prikazan na Slici 6.4.2.
ORIGINALNI IZVOR

DODELJIVANJE KODA

Simbol

Verovatnoa

KOD

0.3

00

0.3

00

0.3

00

0.4

0.6

0.2

10

0.2

10

0.3

01

0.3

00

0.4

0.2

11

0.2

11

0.2

10

0.3

01

0.1

001

0.2

010

0.2

11

0.1

0100

0.1

011

0.1

0101
Slika 6.4.2Proces dodeljivanja Huffman-ovog koda

Za prva dva simbola dodeljene su kodne rei 0 i 1. U tom sluaju dodeljujemo 0


simbola sa verovatnoom pojavljivanja 0.6 i 1 simbolu sa verovatnoom pojavljivanja 0.4.
Verovatnoa pojavljivanja 0.6 dobijena je spajanjem dve verovatnoe 0.3 i 0.3. Kodovi dodeljeni
ovim verovatnoama su 0 praena 0 i 0 praena 1. Posle tog dodeljivanja postoje tri simbola
sa verovatnoama 0.4, 0.3 i 0.3 i kodovima 1, 00 i 01 respektivno. Verovatnoa 0.4 dobijena je
spajanjem dve verovatnoe 0.2 i 0.2. Na tom koraku kodovi dodeljeni ovim verovatnoama (0.2
i 0.2) su 1 praen 0 i 1 praen sa 1.
70

Posle tog dodeljivanja postoje 4 simbola sa verovatnoama 0.3, 0.3, 0.2 i 0.2 i kodovima
00, 01, 10 i 11 respektivno. U sledeem koraku, druga verovatnoa 0.3 dobijena je spajanjem dve
verovatnoe 0.2 i 0.1. Kodovi dodeljeni ovim verovatnoama (0.2 i 0.1) su 01 praen 0 i 01
praen sa 1. Posle tog dedeljivanja postoji pet simbola sa verovatnoama pojavljivanja 0.3, 0.2,
0.2, 0.2 i 0.1 sa kodovima 00, 10, 11, 010 i 011 respektivno. etvrta verovatnoa 0.2 dobijena je
spajanjem dve verovatnoe 0.1 i 0.1. U ovom koraku kod dodeljen ovim verovatnoama (0.1 i
0.1) je 010 praen sa 0 i 010 praen sa 1. Posle tog dodeljivanja postoji est simbola sa
verovatnoama 0.3, 0.2, 0.2, 0.1, 0.1 i 0.1 i odgovarajuim kodovima 00, 10, 11, 011, 0100 i
0101 respektivno. Na taj nain dobili smo Huffman-ove kodove za sve originalne izvorne
simbole.
Iako dosta korieno jo od otkria 1952 godine, Huffman-ovo kodovanje ima
nedostatke. Pre svega, ono zahteva najmanje jedan bit za predstavljanje pojavljivanja svakog
simbola. Stoga, ako je entropija izvora manje od jednog bita po simbolu, Huffman-ovo
kodovanje nije efikasno. Dalje, ovo kodovanje se ne moe efikasno prilagoditi ukoliko se
menjaju statistike izvora. Najzad, ni ureaji koji koriste Huffman-ov koder nisu jednostavni za
implementaciju.

6.5 Aritmetiko kodovanje


Da bi se postigla razumna efikasnost primenom Huffman-ovog kodovanja, niz koji
generie izvor deli se na blokove, a svakom bloku se dodeljuje kodna re promenljive duine. Na
strani dekodera, primenjeni niz je ralanjen na blokove razliite duine koji odgovaraju
individualnim kodnim reima. Pri tome, postoji korespondencija jedan prema jedan izmeu
blokova kodne reci i blokova koji se odnose na izvorni niz. Kod aritmetikog kodovanja,
neznatno razliiti izvorni nizovi daju znaajno razliite kodne nizove [6.4], [6.5].
Kao entropijska kodna tehnika, aritmetiko kodovanje postie veu kompresiju nego
Haffman-ovo kodovaje. Za razliku od Huffman-ovog kodovanja, kod aritmetickog kodovanja
prosean broj bita se pribliava teorijskoj granici, entropiji, za bilo koji proizvoljan izvor. Kod
Huffman-ovog kodovanje svakom simbolu se pripisuje kodna re promenljive duine. U procesu
kodovanja, simboli su nezavisno kodovani. Kod aritmetikog kodovanja, kodnoj rei je pripisana
cela ulazna poruka [6.6][6.11] .
Primer 6.5.1
Posmatrajmo englesku azbuku sa 26 slova. Treba odrediti maksimalan broj
razliitih tekstualnih povorki duine 1, 2 i 100.
Tekstualnu povorku duine 1 ine a, b, c, i z.
Stoga je maksimalan broj moguih povorki 26.
Tekstualnu povorku duine 2 ine aa, ab, az, ba, bb, bc,,
bz, zz.
Maksimalan broj razliitih povorki je 262 ili 676.
Na slian nain postoji 26100 razliitih povorki sa 100 znakova.

71

Primer 6.5.1 pokazuje da ako izvor ima azbuku dimenzije K postoji Km razliitih moguih
poruka duine m. Ukoliko je poznata funkcija gustine verovatnoe individualnih simbola, moe
se izraunati verovatnoa nastajanja date poruke sm duine m. Poto postoji Km razliitih
moguih poruka, moe se izraunati verovatnoa p(sm) nastajanja tih individualnih poruka, pri
emu je
K

p (s ) = 1 .
m =0

(6.5.1)

Ukoliko se eli da se koduje celokupna poruka odjednom, poveava se efikasnost kodera.


Huffman-ov kod obezbedie prosean broj bita blizak entropiji ak i kada je to manje od jednog
bita po simbolu. Meutim, generisanje Huffman-ove tabele od Km simbola bilo bi vrlo teko, ak
i gotovo nemogue. Sreom aritmetiko kodovanje obezbeuje pogodan nain da se ostvari taj
cilj pod optimalnim uslovima.
Predspostavimo sad da su poznate verovatnoe p(sm) razliito moguih poruka. Njihova
ukupna suma je 1. Podeliemo interval [0, 1] na realnoj osi na Km podintervala, tako da irina
svakog podinternala odgovara verovatnoi nastajanja poruka. Neka su podintervali [Ll, Rl],
(l = 1, 2, , Km). Kada su jednom podintervali utvreni, bilo koji realan broj u tom podintervalu
odgovarae jednoj poruci, pa se stoga moe dekodovati cela ulazna poruka. Poto se podintervali
ne preklapaju kodna re za Sm moe se konstruisati pomeranjem bilo koje take u intervalu u
binarnom obliku i zadravajui samo ni = [ log2p(sm)] bita posle decimalne take.
Poto bi gornja procedura mogla biti komplikovana moe se primeniti jednostavna
rekurzivna tehnika. Sada emo tehniku kodovanja objasniti na konkretnom primeru.
Posmatraemo informacioni izvor dat u Tabeli 6.5.1. Primeniemo vie koraka.
Tabela 6.5.1Simboli, njihove verovatnoe pojavljivanja i opseg za aritmetiki koder
Simboli
a
b
c
d
e
!

Verovatnoa
0.2
0.1
0.2
0.1
0.3
0.1

Opseg za aritmetiki koder


[ 0, 0.2 ]
[ 0.2, 0.3 ]
[ 0.3, 0.5 ]
[ 0.5, 0.6 ]
[ 0.6, 0.9 ]
[ 0.9, 1.0 ]

Korak 1: Simboli i njihove verovatnoe pojavljivanja poreaju se kao to je to pokazano u Tabeli


6.5.1.
Korak 2: Podeliti inteval [0, 1] na 6 ( = K) podintervala poto postoji 6 simbola. irina svakog
podintervala jednaka je verovatnoi nastajanja individualnog simbola.
Korak 3: Predpostavimo da elimo da prenesemo simbol baad! Poto je prvi simbol b biramo
interval [0.2, 0.3].
To je prikazano u Tabeli 6.5.2 (trei red), kao i na Slici 6.5.1.

72

Tabela 6.5.2Generisanje niza bita pri aritmetikom kodovanju


Podinterval

Binarni interval

Generisani
niz bita

[ 0, 1.0]

START
b

[ 0.2, 0.3 ]

[ 0.0, 0.5 ]

[ 0.2, 0.22 ]

[ 0.0, 0.25 ]

[ 0.2, 0.204 ]

[ 0.125, 0.25 ]

[ 0.1875, 0.25 ]

[ 0.1875, 0.21875 ]

[ 0.2020, 0.2024 ]

[ 0.20236, 0.2024 ]

Slika 6.5.1Proces aritmetikog kodovanja

Kada je podinterval odabran, on je podeljen na 6 podintervala drugog nivoa, kao to je to


prikazano na Slici 6.5.1.
Korak 4: Drugi simbol je a. Otuda biramo podinterval koji odgovara a u intervalu [0.2
do 0.3]. To je [0.2, 0.22], kao to je to dato na Slici 6.5.1. Podinterval je [0.2 do 0.22] je
podeljen na 6 podintervala treeg nivoa.
Korak 5: Trei simbol je opet a. Otuda je odabran podinterval [0.2, 0.204]. Podinterval je
opet izdeljen na 6 podintervala etvrtog nivoa.
Korak 6: etvrti simbol je d. Stoga, odabran je podinterval [0.2020, 0.2024]. Podinterval
je podeljen na 6 podintervala petog nivoa.
Korak 7: Poslednji, peti simbol je !. Zbog toga je uzet podinterval [0.20236, 0.2024].
Poto vie nema drugih simbola, proces kodovanja je sada kompletiran. Predajnik moe
da alje proizvoljan broj u intervalu [0.20236 do 0.2024], a dekoder e biti u stanju da
rekonstruie ulazni niz. Razume se, dekoder treba da zna informaciju koja postoji u Tabeli 6.5.1.

73

Dosadanja opisana procedura proizvodi realne brojeve koji se mogu poslati dekoderu.
Realni brojevi su predstavljeni nizom bita koji se generiu kada jednom znamo konaan realan
broj. Niz bita se generise posle nailaska ulaznih simbola i poto su podintervali segmentirani kao
to je prikazano u Tabeli 6.5.2. Za simbol b koder zadrava opseg na [0.2, 0.3]. Poto je
odreeno da je interval [0.0, 0.5], dekoder zna da je prvi simbol 0. Stoga, on sada moe da
otpone sa slanjem ulaznih bita. Posle drugog simbola, koder dalje suava opseg na [0.2, 0.22].
Tada koder zna da je drugi simbol 0, jer je interval u opsegu [0, 0.25]. Na slian nain, trei
simbol e biti ''1'', jer se interval nalazi u opsegu [0.125, 0.25]. etvrti simbol je 1, itd.
ema dekodovanja je vrlo jednostavna. Predpostavimo da je poslat broj 0.20238.
Dekoder prepoznaje da je prvi simbol b poto lei u opsegu [0.2, 0.3] kao to je prikazano u
Tabeli 6.5.2. Drugi simbol je a jer lei u opsegu [0.2, 0.22]. Zatim se proces nastavlja.
U navedenom primeru korien je fiksni model koji nije pogodan za kodovanje
nestacionarnih izvora kod kojih se statistike izvora menjaju se vremenom. U tim sluajevima
trebalo bi primeniti adaptivni model. Tako, na primer, u [6.12] je predloen efikasan model za
primenu adaptivnog aritmetikog kodovanja koji daje broj bita vrlo blizak entropiji izvora.

6.6 Rezime
Najvei broj informacija jo uvek se danas uva u tekstualnom obliku. Podaci o tekstu
stvoreni su iz diskretnog informacionog izvora koji emituje simbole a ovi predstavljaju slova
koja odgovaraju nekoj azbuci. Poto se tekstualni podaci jo uvek koriste kao razliiti
dokumenti, vano ih je predstaviti u najprihvatljivijoj formi kako bi se smanjili zahtevi za
skladitenim prostorom. Prosena koliina informacija po simbolu kojom izvor snabdeva
posmatraa predstavlja entropiju. Maksimalnu entropiju imae izvorni kod kod koga su
verovatnoe emitovanja svih simbola date azbuke podjednako verovatne. Ujedno tada je i
neizvesnot najvea, poto nijedan simbol nema prioritet. Minimalna entropija nastaje kada izvor
ne emituje nikakvu informaciji. To je sluaj kada izvor emituje samo jedan simbol ije je
verovatnoa pojavljivanja jednaka jedan, a svih ostalih je nula.
Izvori koji emituju simbole koji su medjusobno statistiki nezavisni nazivaju se izvori
bez memorije. S druge strane, izvor informacije je definisan: azbukom (listom simbola) koji
emituje, verovatnoom pojavljivanja simbola i prosenom brzinom emitovanja informacija
(simbola).
Podaci o tekstu nose suvinu informaciju. Tehnika kompresije teksta smanjuje ili
eliminie tu suvinost ime se postie kompresija. Entropija izvora koji emituje statistiki
zavisne impulse uvek e biti manja od entropije istog takvog izvora koji emituje statistiki
nezavisne impulse. Statistika suvinost odnosno redundantnost predstavlja meru ogranienja
koju tekstu namee statistika struktura jezika.
Dva ogromna koncepta u teoriji izvornog kodovanja su entropija i funkcija stepena
osteenja informacije. Entropija prua meru za informaciju izvornih simbola sadranu u izvoru
podataka i odreuje minimum prosenog bitskog protoka potrebnog za perfektnu reprodukciju
izvornih simbola. S druge strane, teorija osteenja informacije prua niu granicu za prosean
broj bita za dato izoblienje u obnovljenim simbolima.
Ukoliko izvor ima alfabet veliine K, maksimalna entropija izvora je log2 K. Ako
entropija iznosi log2 K, za izvor se kae da je nulte suvinosti. U najveim broj sluajeva
informacija sadri suvitnost.

74

Prema Shannon-ovoj teoremi o beumnom kodovanju, prosean broj bita R za


kodovanje izvorne informacije ogranien je sa donje strane entropijom izvora. Meutim
Shannon-ova teorema ne utvruje nain projektovanja kodera koji e korigovati izvornu
informaciju sa prosenim brojem bita R Huffman-ova metoda prua mogunost projektovanja
kodera koji daje broj bita blizak entropiji. Ova metoda daje kod promenljive duine za svaki
izvorni simbol i to tako da je broj bita u kodu priblino obrnuto proporcionalan verovatnoi
nastajanja simbola. Meutim, Huffman-ovo kodovanje zahteva najmanje jedan bit za
predstavljanje svakog simbola. Stoga, ako je entropija izvora manja od jednog bita po simbolu,
Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne moe efikasno prilagoditi
ukoliko se menjaju statistike izvora. Najzad, ni ureaji koji koriste Huffman-ov koder nisu
jednostavni za implementaciju.
Dok se kod Huffman-ovog kodovanja svakom simbolu pripisuje kodna re promenljive
duine, kod aritmetikog kodovanja kodnoj rei je pripisana cela ulazna poruka. Primenom
aritmetikog kodovanja postie se vea kompresija nego kod Huffman-ovog kodovanja.
Metode entropijsnog kodovanja koriste statistiki model za kodovanje simbola sadranih
u ulaznim podacima. Kompresija je postignuta uklanjanjem statitistike suvinosti prisutne u
podacima. U tu srvrhu koristi se kodovanje simbola kodovima koji sadre manje bita za ove
simbole koji se ee pojavljaju. Mada su za kodovanje podataka o tekstu prikazane neke kodne
tehnike koje ne unose gubitke, ove tehnike se takoe koriste za kodovanje audio signala i slike.
Druga grupa tehnika koje su predloili Lempel i Ziv zasniva se na kompresiji na bazi renika
[6.13], [6.14]. Meutim ta materija izlazi iz okvira ove knjige.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

ime se karakterie predstavljanje teksta u digitalnoj formi?


ta je to entropija izvora informacija?
Po emu se tekstualni podaci razlikuju od audio i video podataka?
Kada izvor informacija ima maksimalnu, a kada minimalnu entropiju?
ta su to izvori informacija bez memorije?
ta je to relativna entropija?
Kako se definie statistika suvinost nekog jezika?
Jedna azbuka sastoji se iz 32 slova. Stvarna entropija ove azbuke iznosi 1.4 bita po slovu.
Odrediti entropiji nultog reda, kao i stepen iskorienja slova ove azbuke.
ime se bavi teorija izvornog kodovanja?
ta prouava teorija oteenja informacije?
Kako glasi Shannon-ova teorema kodovanja za beumni izvor?
Kada se za izvor informacija kae da je nulte suvinosti?
ime se karakterise Huffman-ova metoda za projektovanje kodera?
Kako se generie Huffman-ov kod za izvor informacija?
U emu se ogledaju nedostaci nastali u procesu Huffman-ovog kodovanja?
Koja je glavna karakteriska aritmetikog kodovanja?

75

17.
18.
19.

U emu se razlikuje aritmetiko od Huffman-ovog kodovanja?


Koji parametri definiu izvor informacija koji emituje simbole?
ime se karakteriu metode entropijskog kodovanja?

Literatura
[6.1]
[6.2]
[6.3]
[6.4]
[6.5]
[6.6]
[6.7]
[6.8]
[6.9]
[6.10]
[6.11]
[6.12]
[6.13]
[6.14]

D. Draji, Teorija Informacija i Prenos Podataka. Elektrotehniki fakultet, Beograd,


1982.
C. E. Shannon and W. Weaver, The Mathematical Theory of Communication. Urbana,
IL: University of Illinois Press, 1949.
D. A. Huffman, A Method for the construction of minimum-redundancy codes, Proc.
Inst. Radio Eng., vol. 40, pp. 10981101, Sept. 1952.
A. N. Netravali and B. Prasada, Adaptive quantization of picture signals using spatial
masking, Proc. IEEE, vol. 65, no. 4, pp. 536548, Apr. 1947.
S. P. Lloyd, Least squares quantization in PCM, IEEE Trans. Inf. Theory, vol. IT-28,
pp. 129137, 1982.
N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to
Speech and Video. Englewood Cliffs, NJ: Prentice Hall, 1984.
K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages,
Applications. New York, NY: Academic Press, 1990.
K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio
Coding. Upper Saddle River, NJ: Prentice Hall, 1996.
G. G. Langdon and J. Rissanen, Compression of black-white images with arithmetic
coding, IEEE Trans. Commun., vol. COM-29, pp. 858867, 1981.
A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey,
Prentice Hall, 1989.
M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham,
Washington, USA, SPIE-The International Society for Optical Engineering, 1991.
I. H. Witten, R. M. Neal, and J. G. Cleary, Arithmetic coding for data compression,
Commun. of ACM, vol. 30, pp. 520540, Jun. 1987.
J. Ziv and A. Lempel, A universal algorithm for sequential data compression, IEEE
Trans. Inf. Theory, vol. IT-23, pp. 337342, 1977.
J. Ziv and A. Lempel, Compression of individual sequences via variable-rate coding,
IEEE Trans. Inf. Theory, vol. IT-24, pp. 530536, 1978.

76

7. STANDARDI U MULTIMEDIJALNIM KOMUNIKACIJAMA


Za razmatranje standarda u oblasti multimedijalnih komunikacija postoje dva pristupa.
Jedan od pristupa se fokusira na bit-niz sintaksu u nameri da se razume ta predstavlja svaki sloj
sintakse i na ta ukazuje svaki bit u jednom odreenom nizu bita. Ovakav pristup je vaan za
proizvoae opreme u skladu sa standardima. Drugi pristup je usredsreen na algoritme za
kodiranje koji se koriste za generisanje nizova bita, u skladu sa odgovarajuim multimedijalnim
kodnim standardom. Isto tako, ovaj pristup zasniva se na istraivanju, razvoju, modernizaciji i
implementaciji razliitih tipova algoritama za kodovanje multimedijalnog sadraja kako bi se
podrao veliki broj razliitih i sve zahtevnijih multimedijalnih aplikacija i servisa.
Predstavljanje neobraenih video signala zahteva veliki kapacitet pa se, u vezi sa tim,
moraju definisati manje kompleksni video kodni algoritmi radi efikasnije kompresije video
sekvenci kako bi se iste memorisale i prenosile. Pravilni izbor algoritma za video kodovanje
multimedijalnih aplikacija je znaajan faktor koji zavisi od raspoloivog kapaciteta i
multimedijalnih zahteva za kvalitetom. Bitski prenos i brzina frejmova su faktori sa kojima se
selektovani video koder moe adaptivno birati, a sve to u skladu sa raspoloivim propusnim
opsegom medijuma za komunikaciju. Sa druge strane, stalni napredak u tehnologiji daje kao
rezultat poveanje svoga procesora digitalnih signala i znaajno smanjuje cene opreme. U oblasti
audio-vizuelnih komunikacija takvi video kodni algoritmi se koriste za kompresiju video signala
sa visokom efikasnou kodovanja i maksimalnim perceptualnim kvalitetom.
Kod video komunikacija zahtevi korisnika obino su konfliktni te se mora ii na
kompromis kako bi se obezbedio kvalitet servisa koji je korisnik zahtevao. Korisniki zahtevi za
digitalne video servise definiu se preko kvaliteta i irine opsega video signala, kompleksnosti,
sinhronizacije i kanjenja. Sa jedne strane, kompleksnost video-kodnih algoritama odnosi se na
logaritamska izraunavanja koja se izvre tokom kodovanja i dekodovanja. Sa druge strane,
sinhronizacija izmeu razliitih nizova bita mora se odravati da bi se obezbedile
zadovoljavajue performanse. to se tie kanjenja, kod aplikacija koje se odvijaju u realnom
vremenu, vano je da je vreme kanjenja izmeu frejma koji se koduje i posle toga dekoduje,
minimalno.
Sve ukazuje na to da je veoma znaajno razmotriti aspekte multimedijalnih kodnih
standarda i odgovarajuih algoritama. Od ne manjeg znaaja je svakako smanjenje
implementirane kompleksnosti multimedijalnih algoritama, a da se pri tome ne narue njihove
performanse.

77

7.1 Znaaj standardizacije


Sa neprekidnim poveanjem brzine prenosa, oigledno je da su kapacitet memorisanja
hard diskova, fle memorija i optikih medija vei nego ranije. Savremene tehnike kompresije
multimedijalnih podataka pruaju mogunost memorisanja ili prenosa velike koliine
informacija neophodnih za prezentaciju digitalnog sadraja na efikasan nain. Sa neprekidnim
poveanjem kapaciteta prenosa i memorisanja, kompresija postaje jedna od osnovnih
komponenata za multimedijalne servise [7.1]. to se tie videa, kompresija ima vane prednosti.
Pre svega, ona omoguava da se digitalni video koristi u okruenju za prenos ili memorisanje
koji ne podrava nekompresovani video. Zatim, video kompresor omoguava da se efikasnije
koriste resursi za prenos i memorisanje. Na primer, ako je raspoloiv kanal sa velikim bitskim
protokom, tada je opteprihvatljivo da se poalje komprimovani video signal velike rezolucije ili
vei broj komprimovanih video signala, nego da se poalje jedan nekomprimovani tok ili niz
nie rezolucije.
Signal koji nosi informaciju moe se komprimovati da bi se odstranila redundansa. Kod
sistema za kompresiju bez gubitka statistika redundansa je odstranjena na taj nain da se
komprimovani signal moe perfektno rekonstruisati na prijemniku. Meutim, veina praktinih
tehnika za video kompresiju, na primer, zasniva se na kompresiji sa gubicima, tako da signal koji
je dekodovan nije identian originalnom.
Cilj algoritma za kompresiju je da se postigne to efikasnija kompresija uz minimiziranje
izoblienja koje nastaje u tom procesu. Na primer, algoritmi za video kompresiju rade tako to
odstranjuju redundansu u prostornom, vremenskom, statistikom i psihovizuelnom domenu.
Odstranjivanjem redundanse u razliitim oblicima, mogue je znaajnije komprimovati podatke.
Na primer, ljudski vizuelni sistem (oko i mozak) vie je osetljiv na nie, nego na vie frekvencije
pa ako se odstrani iz slike sadrzaj sa niim frekvencijama, slika e i dalje biti prepoznatljiva
uprkos injenici da je deo informacija odstranjen. Videli smo, takoe, da se kompresija moe
postii tako to se podaci koji se prenose koduju primenom entropijskog kodovanja (Huffmanovo kodovanje, aritmetiko kodovanje).
Kompresija slike i videa je alternativno polje za istraivanje i razvoj oblasti
multimedijalnih komunikacija. Predloeni su mnogi razliiti algoritmi za kompresiju i
dekompresiju. U cilju podsticaja medijumskog rada, konkurencije i poveanja mogunosti
izbora, neophodno je bilo da se definiu neophodne metode za kompresiju, kako bi se obezbedilo
da ureaji razliitih proizvoaa budu kompatabilni. Ovo je dovelo do razvoja drugih kljunih
multimedijalnih standarda. to se tie tehnike kompresije slike i videa, one se razvijaju
intenzivno od pre dvadesetak i vie godina uz razvoj pratee tehnologije. Poetni algoritmi su
bili bazirani na pikselima, a neto kasniji algoritmi su koristili grupe piksela ili osobine vida, kao
i redundantna svojstva slike u prostornom, vremenskom i frekvencijskom domenu.
U postupku standardizacije kompresije slike i video signala pojavljuju se dve organizacije i to:
Meunarodna unija za telekomunikacijetelekomunikacioni sektor (eng. International
Telecomunication UnionTelecomunication sector ITUT) za standardizaciju sa
svojom Ekspertskom grupom za video kodovanje (eng. Video Coding Expert Group
VCEG)
Meunarodna organizacija za standardizaciju Meunarodni elektrotehniki komitet (eng.
International Standard Organization/International Electrotechnical Committee
ISO/IEC) sa grupom MPEG.
78

Mada deluju odvojeno, u mnogim sluajevima dolazi do konkurencije nekih njihovih rezultata,
kao to je to prikazano na Slici 7.1.1.

Slika 7.1.1Razvoj standarda za kompresiju video signala

ISO/IEC MPEG standardi video kodovanja su namenjeni za arhiviranje i distribuciju


kvalitetnog video materijala u komercijalne svrhe. Ciljnu grupu ine proizvoai, provajderi, i
korisnici zabavnog video materijala. Sa druge strane, ITU standardi su preteno koncentrisani na
telekomunikacionu industriju. Standardi video kodovanja koje razvija ova organizacija preteno
su namenjeni komunikaciji u realnom vremenu i to od jednog ka drugom korisniku, ili od jednog
ka ostalim korisnicima. Ovi standardi su poznati kao H.26x standardi. Sa x je obeleena
odgovarajua taka generacije standarda.

7.2 MPEG prilaz multumedijalnoj standardizaciji


Grupa eksperata za obradu pokretne slike MPEG formirana je 1988 godine sa zadatkom
da razvije standarde za kodovanje pokretne slike, audia, i njihove kombinacije. Ova grupa radi u
okviru zdruenog ISO/IEC tehnikog komiteta (eng. technical committee TC) TC 1 na
informacionim tehnologijama, kao radna grupa (eng. working group WG) WG11 pri
podkomitetu (eng. sub-committee SC ) SC 29. U zavisnosti od prirode standarda, donose se
razliiti dokumenti. Za audio i kodne standarde, prvi dokument je nazvan Verifikacioni model
(eng. Verification model VM). U standardma MPEG-1 i MPEG-2, on nosi naziv Simulacioni i
Test model, respektivno. VM opisuje rad kodera i dekodera. Kada MPEG stekne poverenje u
pogledu stabilnosti standarda, izdaje se tzv. radni draft (eng. working draft WD). On je izraen
ve u formi standarda, ali zbog postojanja revizije, ostaje interni akt u MPEG-u. U planirano
vreme, kada postane dovoljno stabilan WD postaje dodeljeni draft (eng. committee draft CD).
Pre prelaska u CD stadijum, WD je podvrgnut na jo nekoliko revizija. Razliite tehnike opcije
prouavaju najmanje dva razliita partnera. Pri tome je, pri svakoj reviziji, angaovan veliki broj
eksperata iji je zadatak da ukau na eventualno mogue greke sadrane u dokumentu. Lista
radnih pojedinosti u procesu multimedijalne standardizacije je sledea:

79

ISO/IEC, 11172 Kodovanje pokretnih slika sa pridruenim audiom do oko 1.5 Mbit/s
(MPEG-1)
ISO/IEC, 13818 Kodovanje pokretne slike i pridruenje audia (MPEG-2)
ISO/IEC, 14496 Kodovanje audio-vizuelnih objekata (MPEG-4)
ISO/IEC, 15938 Intefejs za opis multimedijalnog sadraja (MPEG-7)
ISO/IEC, 21000 Multimedijalni okvir (MPEG-21)
Iako je MPEG-3 bio predvien da se bavi velikim binarnim protocima (binarni protok se
uobiajeno izraava kao broj bita u sekundi (eng. bits per second) bit/s, b/s, bps), nikada nije
razvijen, jer su se ovi zahtevi mogli sresti kod MPEG-2. to se tie MPEG-5 i MPEG-6, oni nisu
nikada ni definisani. Najzad, treba istai da je MPEG-21 prvi standard uspostavljen u 21. veku.
MPEG sledi princip da standard treba da obezbedi interoperabilnost. To produava
ivotni vek standarda i obezbeuje istovremeno uvoenje novih tehnologija. Na primer, MPEG
standardi kodovanja specificiraju samo sintaksu i semantiku tokova bita (eng. bit stream) i
proces dekodovanja. Nita se ne govori o tome kako kodovi kreiraju tokove bita. To ostavlja
istraivaima vie slobode oko optimizacije izbora kodera (estimacija pokreta, upravljanje
protokom bita kod psihoakustinih modela), a sve se to radi zbog minimiziranja performansi za
ciljane aplikacije i sadraje. Istraivai koriste primene novih tehnologija u MPEG standardima
radi to boljeg korienja sredstava primenjenih u procesu kodovanja. Time se postie
konkurencija u kvalitetu i ceni uz stalno obezbeene uzajamne interoperebilnosti.

7.3 MPEG-1 standard


MPEG-1 standard predstavlja prvu generaciju iz grupe MPEG standarda koja je uvedena
u periodu od 1988 do 1991 godine [7.3]. MPEG-1 je u stvari originalni MPEG standard za
kodovanje (kompresiju) audija i videa, protokom do 1.5 Mbit/s. Standard ne specificira
parametre za prenos signala.
MPEG obino razvija audio i video kodne standarde paralelno, zajedno sa
specifikacijama za multipleksiranje i sinhronizaciju. Mada pripremljene da se koriste zajedno,
mogue su i individualne specifikacije koje se mogu koristiti nezavisno. Na primer, jedan
razliiti video format moe se koristiti zajedno sa MPEG-1 reenjima za sisteme i audio. To je
razlog zbog ega su MPEG standardi organizovani po delovima, od kojih svaki definie neki deo
tehnologije. MPEG-1 se sastoji iz pet Delova.
a) Deo 1: Sistemi
Odnosi se na kombinaciju jednog ili vie strimova podataka (MPEG-1 Video, Audio) sa
vremenskom informacijom koja formira jedinstveni strim, optimiziran za digitalno
memorisanje ili prenos.
b) Deo 2: Video
Specificira kodni format (video strim i odgovarajui proces dekodovanja) za video
sekvence pri binarnim protocima od oko 1.5 Mbit/s. Ciljano radno okruenje je memorija
pri kontinualnoj brzini prenosa, ali je modni format uopten i moe se koristiti u irem
smislu. Omoguena je interaktivnost. Kao reenje za koder ustanovljeno je hibridno
kodovanje na bazi diskretne kosinusne transformacije (eng. discrete cosine transform
80

DCT) u bloku primenjeno na jednoj slici ili na greku predikcije dobijenu posle
predikcije po vremenu (na bazi jedne ili dve slike) sa kompenzacijom pokreta. DCT je
praena kvantizacijom, cikcak smenjivanjem i kodovanjem primenom promenljive
duine kodne rei, kao to je prikazano na Slici 7.3.1. MPEG-1 video podrava samo
progresivne formate, a broj linija je fleksibilan.
ORIGINALI

DCT

KVANTIZER

KREACIJA
SIMBOLA

ENTROPIJSKO
KODOVANJE

INVERZNA
KVANTIZACIJA
BINARNI NIZ

INVERZNA
DCT

IZLAZNI
BAFER

Kompenzacija
pokreta

Prethodni
kadar

ENTROPIJSKO
KODOVANJE

Slika 7.3.1Arhitektura uproenog MPEG-1 video kodera

c) Deo 3: Audio
Specificira kodne formate (audio strim i odgovarajui proces dekodovanja) za
monofonski od 32 kbit/s do 192 kbit/s i stereofonski od 128 kbit/s do 134 kbit/s zvuk.
Ovaj standard specificira tri hijerarhijska sloja kodovanja: I, II i III koji su pridrueni
zbog kompleksnosti, kanjenja i efikasnosti. Sloj III je poznatiji pod oznakom MP3. Ova
kodna reenja su namenjena za opti audio i koriste perceptualna ogranienja oveijeg
auditornog sistema sa krajnjim ciljem koji je vezan za uklanjanje parcijalnih nevanih
delova signala.
d) Deo 4: Prilagoeno ispitivanje
Odreuje testove za proveru da li su strimovi bita (sadraj) i dekoderi korektni u odnosu
na specifikacije u delovima 1, 2 i 3.
e) Deo 5: Softverska simulacija
Sastoji se iz softvera koji primenjuje alate specifine u Delovima 1, 2 i 3. To je tehniki
izvetaj koji ima samo informativnu vrednost. U kasnijim MPEG standardima tzv.
Referentni softver postaje deo standarda. MPEG-1 je jo uvek popularan kod internet
video striminga i downloading-a. Isto tako, poznato je da je u oblasti distribucije digitalne
muzike znaajan standard Grupe eksperata za obradu pokretne slike-1 audio sloj 3 (eng.
Motion Picture Experts Group-1 Audio Layer 3 MP3), odnosno MPEG-1 audio sloj 3.
81

7.4 MPEG-2 standard


MPEG-2 je ISO/IEC 13818 standard koji specificira kompresiju audia i videa. Po pravilu
MPEG-2 komprimovani signal vieg je kvaliteta nego u sluaju MPEG-1 kompresije. Ovaj
standard specificira parametre prenosa i ini centralni deo digitalne video difuzije (eng. digital
video broadcasting DVB).
Glavni cilj MPEG-2 video standarda je definisanje formata koji e se koristiti za opis
kodovanog video signala. MPEG-2 standard definie rezultujui strim bita. Kada je MPEG-2
razvijen, jedini zahtev je bio da se formira tako da bude dovoljno fleksibilan za upotrebu kod
ireg spektra video aplikacija, koje zahtevaju binarne protoke do Mbit/s, kao to su HDTV,
DVD, interaktivna memorija (eng. interactive storage media ISM), irokodifuzni (eng.
broadcast) servisi, kablovska TV distribucija i interaktivni TV servisi pogodni za fleskibilne
mogunosti mree, ogranienja u irini mrenog opsega i kvalitetu slike [7.4].
U odnosu na MPEG-1 standard, MPEG-2 je uveo sledee razlike:

Pretraivanje u poljima, a ne samo u kadrovima,


Generisanje makroblokova tipa 4:2:2 i 4:4:4,
Veliina kadra moe biti do 16 383 16 383 piksela,
Moe se koristiti nelinearna kvantizacija trakta makrobloka.

Kodni algoritmi i metode predikcije u MPEG-2 skoro su isti kao kod MPEG-1. Meutim,
MPEG-2 sadri vie mogunosti, na primer, analiza sa proredom i skalabilnost [7.5].
MPEG-2 sistemi, audio i video specifikacije su bazirani na odgovarajuim MPEG-1
specifikacijama [7.6]. Kasnije je pridodat jo jedan Audio Deo, sa novim audio kodekom koji
pripada naprednom audio kodovanju (eng. advanced audio coding AAC). Danas standard
MPEG-2 sainjavaju razliiti Delovi [7.7][7.11].
a) Deo 1:Sistemi
Ovde vae iste karakteristike kao i za MPEG-1 sisteme s tim to se jo podravaju:
1)
2)
3)
4)

Okruenje kao to je difuzija,


Hardverski orijentisano procesiranje pored softverski orijentisanog procesiranja,
Prenos vie programa simultano bez zajednike vremenske baze,
Prenos u asinhronom transfer modu (eng. asynchronous transfer mode ATM)
[7.12].

Ovi zahtevi daju kao rezultat specifikaciju dva tipa sistema strimova: Programski strim
slian i kompatibilan sa MPEG-1 sistemima strimova i novi Transportni strim za prenos
vie nezavisnih programa.
b) Deo 2: Video
Odreuje opti domet kodovanja (video strim i odgovarajui proces dekodovanja) za
video sekvence sve do HDTV rezolucije. Osnovna kodna arhitektura je ista kao i za
MPEG-1 Video, uz podrku za isprepletane video formate i skalabilne/ hijerarhijske
kodne formate (vremenski, prostorni, SNR). MPEG-2 Video podrazumeva vie alata. U
nekim primenama neki, od ovih alata suvie su komplikovani za primenu. MPEG-2
82

Video definie, tzv. profile koji su u stanju da obezbede kodna reenja uz odgovarajuu
kompleksnost. Profili su podnizovi alata koji se odnose na potrebe specifinih klasa
aplikacija. Takoe, izvestan broj nivoa je definisan za svaki profil kako bi se ograniila
memorija i raunarski zahtevi za primenu dekodera. Nivoi obezbeuju donju granicu
kompleksnosti strimova bita i minimum mogunosti za dekoder. MPEG-2 Video dekoder
je u stanju da dekoduje MPEG-1 video strimove. Kompatibilnost, koja se ogleda u tome
da je MPEG-2 Video mogue kodovati pomou MPEG-1 Video dekodera, je obezbeena
preko specifinih profila kroz skalabilnost [7.13], [7.14].
c) Deo 3: Audio
Odreuje kodni fomat (audio strim i odgovarajui proces dekodovanja) za viekanalni
audio. Deo 3 obezbeuje kompatibilnost sa MPEG-1 Audio strimovima. Na primer,
MPEG-1 Stereo dekoder bio bi u stanju da reprodukuje znaajnu verziju originalnog
vuekanalnog MPEG-2 Audio strima. MPEG-2 Audio je u tehnikom pogledu slian sa
MPEG-1 Audio sa ista tri sloja.
d) Deo 4: Prilagoeno ispitivanje
Obuhvata specifine testove koji omoguavaju da se proveri da li su strimovi bita
(sadraj) i dekoderi takvi da odgovaraju specifikacijama i tehnikim delovima MPEG-2.
Za video strimove prilagoavanje je definisano za strimove odreenog nivoa i odreenog
profila.
e) Deo 5: Softverska simulacija
Sastoji se iz softvera i koristi alate specificirane u delovima 1, 2, i 3. Opis je dat u obliku
informativnog Tehnikog Izvetaja.
f) Deo 6: Digitalna memorija-komanda i kontrola (eng. digital storage media- command
and control DSM-CC)
Obuhvata specifine opte komande i kontrole nezavisno od vrste DSM, kako bi se
predstavile funkcije specifine za MPEG strimove bez potrebe da se znaju detalji o DSM.
Ove komande se primenjuju na MPEG-1 Sisteme, kao i na MPEG-2 Programske i
Transportne strimove.
g) Deo 7: AAC
Poto je MPEG-2 Audio (Deo3) specifian sa ogranienjem u pogledu kompatibilnosti,
odreuje multikanalni kodni format, bez zahteva u pogledu kompatibilnosti. Na taj nain
postie se slian kvalitet na znatno niim bitskim brzinama nego kod MPEG-2 audio
dela 3.
h) Deo 8:
Povuen (u poetnom stadijumu odnosi se na 10-bitno video kodovanje).
i) Deo 9: Interfejs u realnom vremenu
Odreuje dodatne alatke za korienje MPEG-2 sistema za razmenu podataka u realnom
vremenu, to je praktian zahtev u telekomunikacionim primenama.

83

j) Deo 10: DSM-CC prilagoeno proirenje


Specificira testove za proveru da li strimovi bita (sadraj) i dekoderi odgovaraju
specifikaciji u Delu 6.
k) Deo 11: Upravljanje intelektualnom svojinom i zatita (eng. intellectual property
management and protection IPMP) u MPEG-2 sistemima
To je dodatak uveden radi daljeg specificiranja alata u sistemu koji obezbeuje da IPMP
mogunosti i karakteristike budu razvijene i sklopu standarda MPEG-4 koji bi se koristio
sa strimovima MPEG-2 Sistema [7.14].
Zavravajui ovaj kratak prikaz MPEG-2 standarda, moe se rei da se on bavi
tehnologijama kompresije i sintakse bit strimova, u cilju obezbeivanja prenosa audia i videa u
irokopojasnim mreama. U mnogim sluajevima MPEG-2 se pripisuje samo video kompresiji.
Meutim, MPEG-2 standardi ne ukljuuju samo video. Razliiti delovi ovog standarda prikazuju
vie aspekata predstavljanja, prenosa i predaje kako digitalnog videa tako i digitalnog audia.

7.5 MPEG-4 standard


MPEG-4 je standard koji specificira postupke simultanog kodovanja (kompresije)
sintetikih i prirodnih objekata i zvuka [7.15], [7.16]. Radi se, dakle, o standardu za audiovizuelno kodovanje radi zadovoljenja razliitih potreba komunikacionih, interaktivnih i difuznih
modela servisa, kao i potreba meovitih modela servisa. To daje kao rezultat tehnoloku
konvergenciju [7.17].
MPEG-4 standard obezbeuje skup tehnologija da bi zadovoljio potrebe autora,
provajdera servisa i krajnjih korisnika. Autorima MPEG-4 obezbeuje produkciju sadraja koji
ima veu mogunost da se ponovo koristi i veu fleksibilnost nego to je to mogue primenom
pojedinanih tehnologija kao to su to digitalna televizija, animirana grafika, web strane itd.
Provajderima servisa MPEG-4 nudi transparentne informacije koje mogu biti interpretirane i
prevedene u odgovarajue signalne poruke za svaku mreu, kao i pomoi od strane relevantnih
tela za standardizaciju. Krajnjim korisnicima MPEG-4 obezbeuje visoki nivo interaktivnosti sa
sadrajem unutar ogranienih skupova od strane autora. Generalno, MPEG-4 omoguava:

Prikazivanje audio, vizuelnog i audio-vizuelnog sadraja koji se nazivaju medija objekti.


Ovi objekti mogu biti prirodnog ili sintetikog porekla, to znai da mogu biti snimljeni
kamerom ili mikrofonom ili biti generisani pomou raunara;
Opisivanje kompozicije objekata da bi se kreirao sloeni medija objekat koji formira
audio-vizuelne scene;
Multipleksiranje i sinhronizaciju podataka koji su povezani sa medija objektima, tako da
se mogu prenositi kanalom u mrei obezbeujui pri tome QoS koji odgovara prirodi
specifinih objekata;
Interakcije sa audio-vizuelnim scenama generisanim na prijemnom sloju. Audio-vizuelna
scena je prikazana na Slici 7.5.1. Slika sadri sloene medija objekte koji grupiu zajedno
osnovne medija objekte. Glavna razlika, na bazi novih funkcionalnosti u odnosu na
prethodne standarde, je na objektu baziran audio-vizuelni model prikazivanja koji je
osnova MPEG-4.
84

Slika 7.5.1Jedan primer za audio-vizuelnu scenu

Na Slici 7.5.2 prikazana je MPEG-4 arhitektura koja se zasniva na objektima [7.18].

Slika 7.5.2MPEG-4 arhitektura zasnovana na objektima

85

MPEG-4 audio-vizuelne scene sastoje se od nekoliko medija objekata koji su organizovani na


hijerarhijski nain. U odsustvu hijerarhije mogu se pronai osnovni medija objekti (slike, video
objekti, audio objekti itd.).
MPEG-4 standardizuje brojne osnovne medija objekte i u mogunosti je da prikae i
prirodne i sintetike tipove sadraja koji mogu biti 2D ili 3D. Takoe, MPEG-4 definie i
prikazivanje podataka o objektu. Medija objekti u svojoj kodovanoj formi sastoje se od
deskriptivnih elemenata koji omoguavaju rukovanja objektima u audio-vizuelnim scenama
[7.19]. Svaki medija objekat se moe prikazati u sopstvenoj kodovanoj formi, nezavisno od
sopstvenog okruenja i pozadine.
MPEG-4 je tako koncipiran da obezbedi uspenu podrku na polju digitalne televizije
[7.20], na polju interaktivnih grafikih aplikacija (sintetizovan sadraj), kao i na polju
interaktivne multimedije (World Wide Web, distribucija i pristup sadraju). MPEG-4 obezbeuje
standardizovane tehnoloke elemente omoguavajui integraciju proizvodnje, distribucije i
pristup sadrajima u okviru navedena tri polja.

7.5.1 Delovi MPEG-4 standarda


MPEG-4 standard se sastoji iz sledeih delova [7.21]:
a) Deo 1: Sistemi
Odreuju arhitekturu sistema i alate koje treba pridruiti kako za binarne oblike scena
(eng. binary format for scenes BIFS), tako i za proirene MPEG-4 tekstualne (eng.
eXtensible MPEG-4 textual XMT) formate. Od ne manjeg znaaja su, takoe, i
multipleksiranje, sinhronizacija, upravljanje baferom, kao i IPMP. Takoe ovaj deo
specificira fajl format Grupe eksperata za obradu pokretne slike-4 (eng. Motion Picture
Experts Group-4 File Format MPEG-4, MP4) koji je tako sainjen da je nezavisan od
bilo kog posebnog protokola za predaju informacija, pri emu je omoguena efikasna
podrka za predaju, razmenu, upravljanje, emitovanje i prezentaciju ureaja. Isto tako,
tzv. MPEG-J (MPEG-Java) definie kako aplikacije mogu biti realizovane na
korisnikom terminalu.
b) Deo 2: Vizuelni
Odreuje kodne alate pridruene vizuelnim objektima prirodnog i sintetikog porekla. Na
primer, to podrazumeva specifikaciju reenja za video kodovanje i to od vrlo malih
bitskih brzina do vrlo zahtevnih uslova ukljuujui dinamike 3D objekte. O vizuelnom
MPEG-4 Delu bie kasnije vie govora.
c) Deo 3: Audio
Specifira sve kodne alate koji se pridruuju objektima kako prirodnog tako i sintetikog
porekla (na primer kodna reenja za muzike i govorne podatke za vrlo irok opseg
bitskih brzina i sintetikog audia ukljuujui tu i 3D audio prostore). O MPEG-4 audiokomunikaciji bie jo rei.
d) Deo 4: Prilagoeno ispitivanje

86

Definie testove koji omoguavaju da se proveri da li strimovi (sadraj) i dekoderi


odgovaraju tehnikim specifikacijama propisanim prema Delovima MPEG-4 standarda.
Pri tome je za video i audio strimove profil definisan kao niz objekata.
e) Deo 5: Referentni softver
Ukljuuje softver koji odgovara najveem broju Delova MPEG-4, naime video i audio
koderima i dekoderima. Za razliku od MPEG-1 i MPEG-2, MPEG-4 referentni softver za
dekodere pomae da se razumeju tekstualni delovi poruka.
f) Deo 6: Okvir za isporuku multimedijalnih integracija (eng. delivery multimedia
integration framework DMIF)
Specificira isporuku formata nezavisno od medija i omoguava da se transparentno
prevaziu granice razliitih predajnih okruenja.
g) Deo 7: Optimizirani softverski alati za MPEG-4
Ukljuuje optimizirane kodne softvere za vizuelne kodne alate kao to su estimacija
pokreta i brza globalna estimacija pokreta.
h) Deo 8: Prenos MPEG-4 sadraja po IP mreama
Specificira preslikavanje MPEG-4 sadraja u nekoliko IP protokola.
i) Deo 9: Referentno opisivanje hardvera
Ukljuuje hardverski opisni jezik za vrlo brzo integrisano kolo (eng. very high speed
integrated circuit hardware description language VHDL). Ovi MPEG-4 alati su
prenosivi.
j) Deo 10: Napredno video kodovanje (eng. advanced video coding - AVC)
Specificira napredne video-kodne alate na bazi kodera koji obezbeuju do 50 % veu
kodnu efikasnost nego najbolji profil video kodovanja u MPEG-4 Deo 2 za iroki opseg
bitskih brzina i video rezolucija. Meutim, u poreenju sa prethodnim standardima,
kompleksnost dekodera je oko etiri puta vea nego kod MPEG-2 Videa i dva puta vea u
poreenju sa jednostavnim MPEG-4 Vizuelnim profilom. Ovaj deo razvio je Zdrueni
video tim (eng. Joint Video Team - JVT) koji je osnovan u cilju formalizovanja saradnje
izmeu ISO/IEC MPEG i ITU-T VCEG za razvoj ovog kodeka. Standard MPEG-4
zdrueno video kodovanje (eng. joint video coding JVC) je ve poznat u ITU-T kao
Preporuka H.264.
k) Deo 11: Ureaj za opis scene i primenu
Ukljuuje alate koji su ve specificirani u Delu 1 u vezi sa kompozicijom scene i to kako
u binarnom BIFS, tako i u tekstualnim formatima XMT, MPEG-J i multi-korisnikom
svetu.
l) Deo 12: Medija fajl format
Ovaj format je opti format koji ini osnovu za druge brojne specifine fajl formate.
Sadri vreme, strukturu, i informacije o medijima za vremenske serije podataka o

87

medijumu kao to su to, na primer, audio-vizuelne prezentacije. Ovaj deo je primenjiv na


MPEG-4, a takoe i na JPEG-2000 (zdruena specifikacija) [7.22].
m) Deo 13: IPMP procesiranje
Odreuje alate za upravljanje i zatitu intelektualne svojine u audio-vizuelnom sadraju i
algoritmima tako da samo autorizovani korisnici imaju pristup do njih.
n) Deo 14: Fajl format
Definie MP4 fajl format kao poseban sluaj medija fajl formata (Deo 12). Ovaj deo je
ranije bio ukljuen u Deo 1, ali je sada izdvojen.
o) Deo 15: AVC fajl format
Definie oblik memorije za video strimove komprimovane primenom AVC. Ovaj format
se zasniva i kompatibilan je sa ISO medija fajl formatom (Deo 12).
p) Deo 16: Proirenje okvira animacije (eng. animation framework eXtension AFX)
Odreuje alate za interaktivni 3D sadraj koji radi na geometrijskim modelirajuim i
biometrikim nivoima i obuhvata alate prethodno definisane u MPEG-4 i to u kontekstu
sintetikog prirodnog hibridnog kodovanja (eng. sinthetic natural hybrid coding
SNHC). AFX nudi jedinstveni standardizovani 3D okvir obezbeujui znaajne osobine
kao to su kompresija, striming, i integracija sa drugim audio-vizuelnim medijima i
omoguavajui uvoenje visoko kvalitetnih kreativnih unakrsnih aplikacija preko
medijuma.
q) Deo 17: Striming tekstualni format
Odreuje strimove teksta, vezu izmeu pristupnih jedinica teksta, format strimova teksta
pristupne jedinice za tekst, signalizaciju i dekodovanje strimova teksta. to se tie
pristupnih formata, ovaj Deo upotpunjuje alate ve specificirane u Delu 1.
r) Deo 18: Kompresija fonta i striming
Odreuje alate koji obezbeuju komunikaciju podataka o fontu kao deo MPEG-4
kodovane audio-vizuelne prezentacije.
s) Deo 19: Strim sintetizovane teksture
Specificira sintetike teksture koje proizilaze iz animacije foto-realistikih tekstura
opisivanjem informacija u boji. Pri tome se koriste vektori koji proizvode pokrete vrlo
malih bitskih brzina i koji se nazivaju sintetike teksture.
t) Deo 20: Svetlosne primene kod scenskog predstavljanja (laser)
Obezbeuje scensko predstavljanje sa ciljem da se uspostavi veza izmeu brzine,
efikasnosti kompresije, dekodovanja.
u) Deo 21: Proirenja okvira grafike (eng. graphics framework eXtensions - GFX)
Obezbeuje potpuni programski okvir ukljuujui tu i operacije prirodnog i sintetikog
kodovanja. GFX koristi interfejs za programske aplikacije (eng. application

88

programming interface API), omoguavajui iroki opseg aplikacija na prijemniku od


mobilnih ureaja do stacionarnih raunara.
Zavravajui kratak prikaz delova MPEG-4 standarda koji se jo uvek proiruje, treba
rei da tehnika specifikacija ne predstavlja poslednji kodek na iroko rasprostranjenom
usvajanju i primeni. U nastavku emo se, najpre, malo opirnije pozabaviti Vizuelnim delom
MPEG-4 standarda.

7.5.2 MPEG-4 standard: vizuelni deo


ISO/IEC standard 14 496 Deo 2 tj., MPEG-4 vizuelni deo, unapreuje MPEG-2 standard
kako po pitanju efikasnosti kompresije (bolja kompresija za isti vizuelni kvalitet) i po pitanju
fleksibilnosti (mnogo iri opseg primena). To je omogueno na dva naina : korienjem
naprednih algoritama za kompresiju i obezbeenjem seta alata za kodovanje i manipulaciju sa
digitalnim medijumom. Vizuelni deo se sastoji iz video-koder/dekoder modela kao i iz brojnih
dodatnih alata za kodovanje [7.23]. Model se zasniva na dobro poznatom hibridnom modelu
kodovanja diferencijalna impulsno kodovana modulacija/diskretna kosinusna transformacija
(eng.differential pulse code modulation /discrete cosine transform DPCM/DCT) [7.24], ija je
osnovna funkcija poboljanje efikasnosti kodovanja, pouzdan prenos, kodovanje specijalnih
oblika i objekata, kao i poboljanje kompresije. Znaajne karakteristike po kojima se MPEG-4
vizuelni kodni standarad razlikuje od prethodnih su:

Efikasno kodovanje progresivnih i isprepletanih (eng. interlaced) prirodnih video


sekvenci (kompresija frekvenci sa pravougaonim video frejmovima);

Kodovanje video objekata (video scene sa neregularnim regionima). Ovo predstavlja


novu koncepciju za video kodovanje i omoguava nezavisno kodovanje objekata i video
scena;

Podrka za prenos preko postojeih mrea. Alati za otpornost uz greke pomau dekoderu
da se oporavi od greaka u prenosu i odri uspenu video konekciju u mrenom
okruenju. Treba imati u vidu da i skalabilni alati za kodovanje mogu pomoi u podrci
za fleksibilniji prenos kodiranih bitskih protoka;

Kodovanje animiranih vizuelnih objekata kao to su 2D i 3D poligonalne mree


animiranih lica i animiranih ljudskih tela;

Kodovanje specijalnih aplikacija koje su video-studijskog kvaliteta. Kod ovog tipa


aplikacije vizuelni kvalitet je vaniji nego velika kompresija.

Vizuelni deo MPEG-4 standarda obezbeuje kodne funkcije kroz kombinaciju alata,
objekata i profila. Alat predstavlja podskup kodnih funkcija za podrku specifine funkcije (na
primer, video kodovanje oblika objekta). Objekat je video element (na primer sekvenca sa
pravougaonim frejmovima, mirna slika itd) koji je kodovan korienjem jednog ili vie alata.
Profil je skup tipova objekata za koji se oekuje da koder-dekoder (eng. coder-decoder
89

CODEC) ima mogunosti da ih obrauje. Ovaj vizuelni deo MPEG-4 standarda obuhvata profile
za kodovanje prirodnih video scena. Pored podskupa alata za kodovanje, profili definiu i nivoe.
Nivoi definiu ogranienja u parametarskom bitstrimu. Svaki nivo postavlja ogranienja u
maksimalnim performansama za dekodovanje MPEG-4 kodovane sekvence. Definicije nivoa
postavljaju ogranienja na veliinu memorije bafer, veliinu dekodovanog frejma i brzinu
procesiranja.
U okviru ovog dela MPEG-4 standarda, video sekvenca se posmatra kao kolekcija jednog
ili vie objekata. Objekti se definiu kao frekvencijske celine koje korisniku omoguavaju
pristup, prezentovanje i manipulaciju. Video objekat (eng. video object - VO) je oblast video
scene koja moe zauzimati region proizvoljnog oblika i moe postojati proizvoljno vreme.
Trenutni video objekat u odreenemo trenutku vremena predstavlja video objektnu ravan (eng.
video object plane - VOP). Na Slici 7.5.2.1 prikazan je video objekat koji se sastoji od tri
pravougaone video objektne ravni. Video scena moe biti kreirana od objekata u drugom planu
(eng. background object) i posebnih objekata u prvom planu (eng. foreground object).

Slika 7.5.2.1Video objektne ravni i video objekat (pravougaonik)

Ovaj pristup je fleksibilniji nego fiksna pravougaona struktura frejma kod prethodnih
standarda. Posebni objekti se mogu kodovati sa razliitim vizuelnim kvalitetom i vremenskom
rezolucijom da bi prikazali svoju vanost u konanoj sceni. Objekti sa vie izvora (ukljuujui i
sintetike i prirodne objekte) mogu se kombinovati u jednu scenu. Preko visoke interaktivne
aplikacije krajnji korisnik moe da regulie kompoziciju i ponaanje scene. Svaki objekat koduje
se posebno.

7.5.3 MPEG-4 standard: audio


Kao to smo videli, MPEG-4 standardizacija razvila se sa ciljem da definie fleksibilan
okvir za audio/video multimediju uz prilagoenje specifinim aplikacijama, kao to su: efikasno
kodovanje, pristup i prenos prirodnog i raunarski generisanog audio/video signala za mobilne i
internet komunikacije [7.25]. Zahvaljujui aktivnosti ISO MPEG organizacije, perceptualna
kompresija audio signala je postala de-facto standard za distribuciju muzike [7.26]. Primenom
MPEG-4 naprednog kodera AAC ostvaruje se kompresija u odnosu 16:1 sa kvalitetom veoma
bliskim kompakt disku (eng. compact disc CD) i transparentni kvalitet prema normama koje
propisuje Meunarodna unija za telekomunikacijeRadio sektor za standardizaciju (eng.
International Telecommunication UnionRadio Standardization Sector ITU-R) sa
kompresijom 11:1.
90

Meutim, sa poveanjem kvaliteta kodera, poveava se kompleksnost kao i kanjenje


signala. Poveanje kanjenja ne predstavlja problem u aplikacijama difuzije i striminga zato to
pojedini servisi dozvoljavaju kanjenje reda veliine desetak sekundi. Sa druge strane, tipine
implementacije audio kodera na procesorima za digitalnu obradu signala (eng. digital signal
procesing DSP) imaju kanjenje sa kraja na kraj od 290 ms: kanjenja ovog reda veliine su
neprihvatljiva za aplikacije sa dvosmernom komunikacijom kao to su telekomunikacije i
telefonija visokog kvaliteta. Za sve aplikacije razvijeni su kodovi od strane ITU (6.711, 6.722,
6.728, 6.729) i GSM6.10 sa algoritamskim kanjenjem od 20 ms [7.27]. Ovi koderi su
projektovani za kompresiju ljudskog govora, tako da se pri kodovanju audio signala u optem
sluaju ostvaruje nedovoljan kvalitet. Idealno reenje je algoritam koji je sposoban da ostvari
AAC i MP3 kvalitet sa algoritamskim kanjenjem tipinim za ITU-T kodere govora.
Postoje dve grupe alata za kodovanje audia kod MPEG-4 i to: Prirodni alati koji
omoguavaju da digitalni audio bude komprimovan i preneen i sintetiki alati koji koji
omoguavaju parametarsko opisivanje zvuka koji se prenosi i koristi za sintezu na prijemnoj
strani [7.28][7.31]. Prirodni audio alati omoguavaju prenos komprimovanog govora i
irokopojasni audio u opsezima od 6 kbit/s za kodovanje govora za male bitske brzine do
64 kbit/s po kanalu za niskokvalitetni viekanalni zvuk. MPEG-4 ima tri glavne alatke za audio
kodovanje. Generalni audio (eng. general audio GA) koder obezbeuje prenos visokokvalitetnih irokopojasnih multikanalnih signala kao to je muzika pri bitskim brzinama od
16 kbit/s do 64 kbit/s u kanalu. Ovaj koder predstavlja skalabilnu verziju dobro poznatih
perceptuelno kompresovanih tehnika [7.32]. Zasniva se na MPEG-2 naprednom audio kodnom
standardu sa dodatnim poboljanjima u kvalitetu i fleksibilnosti [7.33].
MPEG-4 ima dva sintetika audio kodera. Jedan obezbeuje interfejs sa sistemima tekstgovor. Tzv. interfejs tekst-govor (eng. text-to-speech interface TTSI) prihvata strim bita koji
sadri potrebne podatke o fenomenima kao i podatke o duini slojeva i kontrolie eksterni
govorni sintisajzer. U standardu nije specificifiran poseban metod za sintezu govora.
Standardizovani su samo format interfejsa i bit strima u delu MPEG-4 TTSI.
Drugi je opti alat za sintezu muzikih i zvunih efekata nazvan strukturni audio (eng.
structured audio SA). SA koder omoguava prenos algoritma za sintezu zvuka na novom tzv.
Muzikom V jeziku nazvanom strukturni jezik audio orkestra (eng. structured audio orchestra
language SAOL) [7.34]. MPEG-4 je prvi standard za prenos zvuka preko algoritama za sintezu
[7.35]. Muziki jezik SAOL je takoe vaan za audio alate. Konvergencija izmeu kodnih
tehnika za strukturni audio i efekte procesiranja u MPEG-4 je jedan od vanih aspekata ovog
standarda.

7.5.4 H.264/AVC MPEG-4 (Part 10) standard


H.264/AVC je video kodni standard koji su zajedniki razvili eksperti iz JVT, odnosno
ITU-T VCEG i ISO/IEC MPEG komiteta za standardizaciju [7.36][7.38]. U poreenju sa
prethodnim standardima H.264/AVC obezbeuje veu kompresiju, efikasnije kodovanje video
sadraja, kao i nie bitske protoke uz mnogo prihvatljiviji perceptualni kvalitet. Takoe, standard
podrava fleksibilnost u kodovanju, kao i organizaciju kodovanih podataka tako da je poveana
otpornost na greke i gubitke. Poboljanje kodnih performansi produkt je uglavnom dela za
predikciju. Osnovni funkcionalni elementi H.264/AVC standarda su: transformacija za redukciju
prostorne korelacije i kvantizacije za kontrolu bitskog protoka. Od ne manje vanosti su

91

predikcija kompenzacije pokreta za redukciju vremenske korelacije, kao i entropijsko kodovanje


za redukciju statistike korelacije. Sa poveanjem kodne efikasnosti i fleksibilnosti dolazi i do
poveanja kompleksnosti samog kodera.
Za odreene aplikacije, H.264/AVC definie sedam Profila. Profili definiu skup kodnih
alata i algoritama koji se mogu koristiti pri generisanju odgovarajueg toka bita. Takoe, za
svaki profil H.264/AVC definie i skup nivoa i podnivoa.
Arhitektura H.264/AVC standarda se bazira na dva sloja: mrenom apstraktnom sloju
(eng. network apstraction layer NAL) i video kodnom sloju (eng. video coding layer VCL)
[7.39], kao to je to prikazano na Slici 7.5.4.1.

Slika 7.5.4.1Veza izmeu mrenog apstraktnog sloja i video kodnog sloja


u strukturi standarda H.264/AVC

Mreni apstraktni sloj omoguava efikasno prilagoenje VCL za korienje u irokom


spektru sistema. NAL obezbeuje mapiranje H.264/AVC podataka u transportne nivoe kao to su
to ini i beini internet servisi, razliiti formati fajlova (ISO MP4 za arhiviranje, na primer),
H.32 x standardi za ine i beine konverzacijske servise, MPEG-2 sisteme za irokodifuzne
(eng. broadcasting) servise itd. NAL sloj definie interfejs izmeu video kodera i spoljanjeg
mrenog okruenja. NAL jedinice su logine celine uvedene da olakaju prenos video sadraja
ka nivou koji odgovara pojedinim mreama. Jedinice ine paket sa celobrojnim bitovima u kome
prvi (zaglavlje) opisuje da li je re o prenosu paketskog tipa ili o strimingu. Preostali bajtovi
sadre podatke o korisnom sadraju (eng. payload). Struktura NAL jedinice definie specifian
opti format koji se moe koristiti kako u paketski orijentisanim tako i u bitskim sistemima. NAL
apstrahuje VCL podatke u nameri da ih pripremi za isporuku po razliitim komunikacionim
kanalima i medijumima za arhiviranje.
VCL sloj specificira efikasnu prezentaciju komprimivanog video signala [7.40]. Video
kodni nivo je dizajniran na blok beinom hibridnom video koderu na kome je svaka kodovana
slika predstavljena makroblokovima piksela. VCL jedinica sadri sledee video kodovane
podatke: video sekvencu, sliku, iseak (eng. slice), makroblok i blok. Elementi VCL prikazani su
na Slici 7.5.4.2.

92

Slika 7.5.4.2Elementi VCL

Video sekvence se sastoje od okvira (eng. frame) ili polja (eng. field). H.264/AVC
standard podrava progresivnu ili analizu sa proredom koje mogu biti u istoj sekvenci. Slike su
izdeljene u iseke. Iseak je sekvenca makroblokova i ima fiksnu veliinu. Postoje tri osnovna
tipa iseka: I unutar (eng. intra - I), P prediktivni (eng. predictive - P) i B dvosmerno prediktivni,
biprediktivni (eng. bidirectionally-predictive - B) iseci. Kod H.264/AVC standarda, I-iseci
makroblokova su komprimovani bez korienja neke predikcije pokreta od iseka u drugim
slikama. P-iseci sadre makroblokove koji se mogu komprimovati sa korienjem predikcije
pokreta. P-iseci mogu sadrati i intra makroblokove. B-iseci sadre makroblokove koji se
mogu komprimovati korienjem predikcije pokreta i slino kao kod P-iseaka mogu imati intra
makroblokove.
KODOVANJE I DEKODOVANJE KOD H.264/AVC STANDARDA

Na Slici 7.5.4.3 prikazan je koder sa dva dela za prenos podataka unapred (sa leva u
desno) i deo za rekonstrukciju (sa desna u levo). Kod kodera (deo unapred) ulazni frejm ili
polje je procesirano u makroblok jedinice. Svaki makroblok je kodovan u Inter ili Intra modu i za
svaki blok u okviru makrobloka predikcija PRED (oznaeno sa P) se formira na osnovu
rekonstruisanih odbiraka slike. Kod Intra moda, PRED je formirana od odbiraka aktuelnog
iseka koji je perthodno kodovan, dekodovan i rekonstruisan to je oznaeno sa uF'n. Kod
Inter moda PRED je formirana pomou predikcije kompenzacije pokreta od jedne ili dve
referentne slike koje su selektovane iz skupa liste 0 i/ili liste 1 referentnih slika. Referentna slika
je prikazana kao prethodno kodovana slika F'n-1. Predikcija referentne slike za svaki deo
makrobloka (kod Intra moda) mora se izabrati izmeu selektovanih prolih ili buduih slika koje
su ve kodovane, rekonstruisane i filtrirane. Predikcija PRED se oduzima od aktuelnog bloka da
bi se dobio rezidualni (razlika) Dn blok koji se transformie (koriste se blok transformacija T) i
kvantuje Q da bi se dobio skup kvantovanih koeficijenata tranformacije X koji su ponovo
ureeni i entropijski kodovani. Koeficijenti entropijski kodovani, zajedno sa ostalim
informacijama zahtevaju da se dekoduje svaki blok unutar makrobloka (modovi predikcije,
parametri kvantizacije, informacije o vektoru pokreta itd.) komprimovanog toka koji je posle

93

prosleen mrenom apstraktnom sloju NAL radi prenosa ili memorisanja. Dekoder (deo za
rekonstrukciju) dekoduje (rekonstruie) svaki blok u makrobloku da bi obezbedio referencu za
dalje predikcije. Koeficijenti X se skaliraju (Q^-1) i inverzno transformiu (T^-1) da bi se dobio
blok razlike D'n. Predikcije bloka PRED se dodaje da bi se dobio rekonstruisani blok nF'n
(dekodovane verzije originalnog bloka). Oznaka n ukazuje na to da rekonstruisani blok nije
filtriran. Filter se primenjuje da se redukuju efekti debloking izoblienja. Rekonstruisana
referentna slika je kreirana iz serije F'n blokova.
+

Fn
trenutni

Dn

Estimacija
pokreta

Preraspodela

Entropijsko
kodovanje
NAL

F'n1
referenca
1 ili 2 prethodno
kodovana frejma

F'n
rekonstruisani

Inter

Kompenzacija
pokreta

P
Intra
predikcija

Izbor Intra
predikcije

Intra
uF'n +

Filter

D'n

T^ 1

Q^ 1

+
Slika 7.5.4.3Blok-ema kodera za prenos podataka i rekonstrukciju

Blok ema dekodera prikazana je Slici 7.5.4.4


X

Preraspodela

Entropijsko
kodovanje
NAL

F'n1
referenca

Kompenzacija
pokreta

1 ili 2 prethodno
kodovana frejma

F'n
rekonstruisani

Inter

Intra
predikcija

Filter

Intra
uF'n

D'n

+
Slika 7.5.4.4Blok-ema dekodera

94

T^ 1

Q^ 1

Dekoder prima komprimovani tok bita od NAL i entropijski dekoduje elemente sa


podacima da bi se dobio skup koeficijenata kvantizacije X [7.41]. On ima mogunost skaliranja i
inverzne transformacije za dobijanje D'n. Koristei informacije iz dekodovanog zaglavlja toka
bita, dekoder kreira blok za predikciju PRED koji je identian originalnom PRED kod kodera.
PRED je pridodat D'n da bi se dobio uF'n koji se filtrira kako bi se dobio svaki dekodovani
blok F'n.
to se tie metoda entropijskog kodovanja, postoje alternativne metode o kojima e biti
rei u nastavku.
ENTROPIJSKO KODOVANJE KOD H.264/AVC STANDARDA

H.264/AVC standard specificira dve alternativne metode entropijskog kodovanja:


adaptivno kodovanje sa promenljivom kodnom rei (eng. context adaptive variable length
coding CAVLC) i raunarski zahtevniji algoritam binarnog aritmetikog adaptivnog kodovanja
konteksta (eng. context adaptive binary arithmetic coding CABAC). Obe metode predstavljaju
bitno poboljanje efikasnosti kodovanja u poreenju sa tehnikama statistikog kodovanja koje su
koriene kod prethodnih standarda. Dodavanjem modelovanja konteksta u njihov entropijski
kodni okvir, obe metode kod H.264/AVC nude visoki stepen adaptacije osnovnog okvira.
Korienjem CAVLC mogue je redukovati bitski protok.
Za poboljanje efikasnosti kodovanja kod H.264/AVC, CABAC je odobren kao
alternativni entropijski nain kodovanja. Blok-dijagram za CABAC prikazan je na Slici 7.5.4.5
CABAC postie dobre performanse kompresije preko:

Selekcije metode verovatnoa za svaki element sintakse prema sadraju elemenata,


Adaptacije procenjenih verovatnoa zasnovanoj na statistici,
Korienja aritmetikog kodovanja [7.42].

Slika 7.5.4.5Blok-dijagram za CABAC

Kodovanje simbola obuhvata sledea stanja: binarizaciju, selekciju modela konteksta,


aritmetiko kodovanje i auriranje verovatnoa. Binarizacija podrazumeva da CABAC koristi
binarno aritmetiko kodovanje koje dozvoljava da se samo binarna odluka (0 ili 1) koduje.
Simbol koji nema binarne vrednosti je binarizovan ili konvertovan u binarni kod pre
aritmetikog kodovanja. Model konteksta je model verovatnoe za jedan ili vie bita
binarizovanog simbola i izabran je selekcijom raspoloivih modela zavisnih od statistika
kodovanih simbola. Model konteksta memorie verovatnoe za svaki bit 1 ili 0. Aritmetiki

95

koder koduje svaki bit prema selektovanom modelu verovatnoe. Selektovani model konteksta je
baziran na auriranju aktuelne kodovane vrednosti.
Zavravajui ovo izlaganje, treba istai da je zahvaljujui svojim unapreenim
performansama H.264/AVC privukao panju industrije. Pored klasinih aplikacionih domena
kao to su videokonferencije i broadcasting TV sadraji (satelitski, kablovski i zemaljski), sa
poboljanjem sposobnosti kompresije, H.264/AVC je obuhvatio i nove servise i tako otvorio
nove trine mogunosti u industriji. Druga oblast koja je privikla dosta interesovanja
proizvoaa opreme je prenos i memorisanje sadraja visoke definicije (eng. high definition
HD) [7.43]. H.264/AVC standard se moe primeniti i kod korisne opreme (na primer digitalne
kamere, celularni telefoni itd.), videa preko IP mrea [7.44], [7.45], digitalnog broadcasting-a
visoke definicije (preko zemaljskih ili satelitskih kanala) i digitalnih sistema za memorisanje
(digitalni video disk (eng. digital video disk DVD ) visoke rezolucije). Danas H.264/AVC
omoguava i prenos preko IPTV preko digitalnih pertplatnikih linija i pasivnih optikih mrea.
H.264/AVC standard naao je primenu i kod mrea sa asinhronim nainom prenosa ATM.

7.6 Kratak pregled standarda za kodovanje mirnih slika


Na ovom mestu treba pomenuti MPEG-4 standard za kodovanje vizuelne teksture (eng.
visual texture coding VTC), JPEG standard sa primenom od interneta do digitalne fotografije,
JPEG standard za kodovanje mirnih slika bez gubitaka (eng. JPEG standard for image lossless
coding JPEG-LS) standard za kodovanje mirnih slika bez gubitaka, kao i preporuku za
kodovanje mirnih slika koja se odnosi na pokretne mrene grafike (eng. portable network
graphics PNG). O standardu JPEG 2000 bie posebno govora.
MPEG-4 VTC je algoritam korien u MPEG-4 standardu kako bi se komprimovala
informacija o teksturi u foto-realistinim 3D modelima. Poto je tekstura u 3D modelima slina
kao i kod mirne slike, ovaj algoritam moe se takoe primeniti za kompresiju mirnih slika.
Zasniva se na diskretnoj wavelet transformaciji (eng. discrete wavelet transform DWT),
skalarnoj kvantizaciji i aritmetikom kodovanju. MPEG-4 VTC podrava SNR skalabilnosti kroz
primenu razliitih strategija kvantizacije: jednostruka kvantizacija (eng. single quantization
SQ), multipl kvantizacija (eng. multiple quantization MQ) i dvostruka kvantizacija (eng. bilevel quantization BQ). SQ ne obezbeuje SNR skalabilnost. MQ obezbeuje ogranienu SNR
skalabilnost dok BQ prua optu SNR skalabilnost. Rezoluciona skalabilnost je podrana
primenom skeniranja opseg po opseg (eng. band by band BB). MPEG-4 VTC takoe podrava
kodovanje objekata proizvoljnog oblika pomou DWT adaptivnog oblika i nekoliko objekata
moe se kodovati posebno, sa mogunou postizanja razliitog kvaliteta. Zatim je na strani
dekodera izvreno spajanje kao bi se dobila konana dekodovana slika.
JPEG je dobro poznati ISO/ITU-T standard stvoren osamdesetih godina prolog veka.
Postoji nekoliko oblika modela JPEG standarda: osnovni (eng. base-line), bez gubitaka,
progresivni i hijerarhijski. Base-line je najpopularniji i podrava samo kodovanje sa gubicima.
Zasniva se na diskretnoj kosinusnoj transformaciji DCT [7.46], pri emu se koristi blok tipa
8 8, cik-cak skeniranje, HVS teinska uniformna skalarna kvantizacija i Huffman-ovo
kodovanje [7.47]. Progresivni i hijerarhijski modovi se sa gubicima. Oni se razlikuju samo po
nainu na koji su DCT koeficijenti kodovani ili izraunavani, respektivno, kada se uporede sa
base-line modom. Oni omoguavaju rekonstrukciju nieg kvaliteta ili verziju sa niom
rezolucijom i to parcijalnim dekodovanjem komprimovanog bitskog toka.

96

JPEG-LS je ISO/ITU-T standard za kodovanje mirnih slika bez gubitaka. Zasniva se na


adaptivnoj predikciji i modelovanju teksta. Uz to, ovaj standard ocrtava ravne oblasti da bi ih
zatim kodovao. Fiksiranjem maksimalne greke odbiraka postie se kompresija skoro bez
gubitaka. Algoritam je namenjen za sluaj da se radi o maloj kompleksnosti uz veliki odnos
kompresije. Meutim, nije obezbeena podrka za skalabilnost i otpornost na greke.
Pokretna mrena grafika PNG je preporuka WWW Konzorcijuma (eng. World Wide Web
Consortium W3C) za kodovanje mirnih slika. Zasnovana je na predikciji i entropijskom
kodovanju. PNG prua kompresiju bez gubitaka i podrava sivu skalu, osnovnu boju, opcionu
alfa ravan, preplitanje na slici.

7.7 Standard JPEG 2000


Standard JPEG 2000 prua niz karakteristika koje su od vitalne vanosti za mnoge
primene koje omoguavaju nove tehnologije. Jedna od najvanijih karakteristika je da se definiu
regioni od interesa (eng. region of interest ROI) na jednoj slici. Od ne manje vanosti su
svakako jo i prostorna i SNR skalabilnost, otpornost na greke i mogunost zatite
intelektualnih prava [7.48].
to se tie kodovanja ROI, to podrazumeva da se neki regioni od interesa na slici koduju
tako to se postie bolji kvalitet u poreenju sa ostatkom slike (pozadina). ROI metod na bazi
skaliranja deli koeficijente tako da su biti koji pripadaju ROI oblasti postavljeni u vie bitske
ravni. U procesu kodovanja, ovi biti su smeteni u bitski tok pre delova slike koji ne pripadaju
ROI. Otuda e ROI biti dekodovan ili otkriven pre ostatka slike. Bez obzira na skaliranje,
dekodovanje toka bita daje kao rezultat rekonstrukciju celokupne slike sa to je mogue veom
dostupnom vernou. Ako je tok bita prekinut, ili je pak proces kodovanja zavren pre nego to
je celokupna slika u potpunosti kodovana, ROI e imati veu vernost nego ostatak slike [7.49].
ROI prikaz definisan u standardu JPEG 2000, Deo I, omoguava ROI kodovanje u regionima
proizvoljnog oblika bez potrebe za dodatnom informacijom o obliku i dekodovanju oblika.
Skalabilno kodovanje mirnih slika prua mogunost da se sprovede kodovanje i to
simultano kada se radi o vie od jedne rezolucije i/ili je u pitanju razliit kvalitet slike. Znai,
radi se o generisanju takvog kodovanog bitskog toka da se dobije slika sa vie od jedne
rezolucije i/ili mogunosti uz razliitu skalu kvaliteta. Arhitektura JPEG 2000 podrava
skalabilnost jer se u mnogim primenama trai da slike budu simultano dostupne za dekodovanje
uprkos razliitim rezolucijama i/ili da su razliitog kvaliteta. Ako je tok bita skalabilan,
koegzistiraju dekoderi razliite sloenosti i to od najmanje kompleksnih do najkompleksnijih.
Najvaniji tipovi skalabilnosti su SNR skalabilnost i prostorna skalabilnost. SNR
skalabilnost se primenjuje kod onih sistema gde je potrebno najmanje dva nivoa kvaliteta slike za
istu prostornu rezoluciju kod odreenog nivoa slike. Nii nivo prua osnovni kvalitet, dok vii
nivo generie vii kvalitet reprodukcije ulazne slike. Prostorna skalabilnost obuhvata generisanje
najmanje dva nivoa prostorne rezolucije i to iz jedinstvenog izvora s tim da je nii nivo kodovan
tako da obezbedi osnovnu prostornu rezoluciju. Vii nivo koristi prostorno interpolirani nii nivo
i na taj nain prenosi se ulazna slika sa punom prostornom rezolucijom. Oba tipa skalabilnosti su
vrlo vana za primene koje se odnose na internet i pristup bazi podataka, kao i za skaliranje
irine propusnog opsega. SNR i prostorne skalabilnosti ogledaju se u njihovoj sposobnosti da
omogue otpornost na pojam greaka nastalih u toku prenosa. Naime, najvaniji podaci iz nieg

97

sloja mogu biti poslati kanalom sa boljom performansom greke. Manje kritian vii sloj alje
podatke kanalom sa smanjenom performanskom greke.
Da bi se poboljao prenos komprimovanih slika, u ovaj standard su ukljueni sinteza bita
otpornog na greke i odgovarajui alati. Kada se radi o otpornosti na greke, odgovarajui alati
koriste deobu podataka kao i resinhronizaciju, detekciju i snimanje greke uz QoS na bazi
prioriteta. Mnoge primene zahtevaju isporuku podataka o slici kroz razliite tipove
komunikacionih kanala. Tipini beini komunikacioni kanali orijentisani su ka sluajnim i
sporadinim bitskim grekama. I internet komunikacije su sline nastojanju gubitka usled
nagomilavanja saobraaja/saobraajnog preoptereenja.
to se tie mogunosti zatite intelektualne svojine, standardom je definisan opcioni fajl
format za JPEG 2000 (eng. optional file format for JPEG 2000 JP2) kod komprimovanja
podataka o slici. Format slui za mirnu sliku i meta podatke, a ima i mehanizam za naznaku
tonske skale i boja na slici. To je mehanizam pomou koga itaoci mogu da prepoznaju u fajlu
postojanje informacije o zatiti prava intelektualne svojine (eng. intelectual property rights
IPRS). Takoe, to je mehanizam pomou koga metapodaci mogu biti ukljueni u fajl. Blok-ema
kodera i dekodera za JPEG 2000 data je na Slici 7.7.1.
Najpre je primenjena diskretna tranformacija na izvorne podatke o slici. Transformacioni
koeficijenti su potom kvantovani i entropijski kodovani pre formiranja izlaznog toka bita.
Zavisno od wavelet transformacije i primenjene kvantizacije, JPEG 2000 moe biti sa gubicima i
bez gubitaka. Na strani dekodera obavljaju se procesi entropijskog dekodovanja, dekvantizacije i
inverzne transformacije kako bi se dobili rekonstruisani podaci o slici.

Slika 7.7.1Blok-ema za JPEG 2000 arhitekturu kodera i dekodera

7.8 MPEG-7 standard


Sa dostupnou standarda MPEG-1, MPEG-2, MPEG-4 i drugih digitalnih kodnih
standarda bilo je lako pribaviti i raspodeliti audio-vizuelni sadraj. Meutim, mnotvo digitalnog
sadraja predstavljalo je ogroman izazov za upravljanje tim sadrajem. to je vie sadraja,
postaje tee da se njime upravlja, da se on pretrauje i filtrira kako bi se pronalo ono to nam
stvarno treba. Sa druge strane, sadraj ima vrednost ukoliko moe biti otkriven brzo i efikasno.
Poto su nainjeni vani koraci na putu daljeg razvoja digitalnog audio-vizuelnog sadraja,
MPEG je prepoznao da je potrebno usmeriti problem ka upravljanju audio-vizuelnim sadrajem.

98

1996 godine MPEG je pokrenuo MPEG-7 projekat pod nazivom Opis interfejsa za
multimedijalni sadraj [7.50] sa ciljem da se specifira standard za opis razliitih tipova audiovizuelnih informacija kao to su osnovni delovi, skladitenje informacija, bez obzira na njihov
format, nain predstavljanja ili medijum. Poput drugih MPEG standarda, MPEG-7 se susree sa
nizom zahteva od prethodnih MPEG standarda, audio-vizuelna predstava ovde nema za cilj da
komprimuje i reprodukuje podatke, ve se bavi tzv. metapodacima (podaci o podacima).
MPEG-7 deskriptori obezbeuju reenje za metapodatke kod velikog broja primena. Oni
su nezavisni od medijuma i formata na bazi objekata i sa mogunou proirenja. Rade na
razliitim nivoima i to poev od opisa na niskom nivou automatskih i esto statistikih
karakteristika pa sve do predstavljanja istih na visokim nivoima gde se prenose semantika
znaenja.
Sledei princip da MPEG standardi moraju specificirati samo potreban minimum,
MPEG-7 specificira format za deskripciju i njegovo dekodovanje. Na taj nain ostavljeno je
mnogo slobode za istraivae u oblasti aplikacija. MPEG-7 specificira dva osnovna tipa alata:
deskriptori (eng. descriptor D) i eme za deskripciju (eng. descriptor scheme DS). Deskriptor
je predstavljanje karakteristika koje definiu sintaksu i semantiku. Kao primer moe posluiti
vremenski kod za predstavljanje trajanja procesa ili momenti boja i histogrami za predstavljanje
boje. Sa druge strane ema za deskripciju odreuje strukturu i semantike relacija izmeu
komponenti. To mogu biti odreeni deskriptori i eme za deskripciju. Jednostavan primer je opis
filma, struktuiranog kao scene i pucnjevi ukljuujui tekstualne deskriptore na scenskom nivou
kao i aspekte pomeranja uz deskriptor audio amplitude na nivou pucnja.
Deskripcije MPEG-7 mogu se predstaviti na dva naina: tekstualni tipovi koji koriste opis
definicije jezika (eng. desciption definition language DDL) i binarne tokove koji koriste
binarni format za metapodatke (eng. binary format for metadata BiM) MPEG-7. To je u osnovi
DDL alat za kompresiju.
MPEG-7 specifcira primenjenu tehnologiju kroz 11 Delova:
a) Deo 1: Sistemi
Specificira alate za:
1) Transportovanje i memorisanje MPEG-7 deskripcije na efikasan nain koristei
BiM format za binarno predstavljanje;
2) Deo 2: Opis jezika po definiciji DDL
Specificira jezik kod kreiranja novih ema za deskripciju kao i za proirenje i
modifikaciju postojeih. DDL je baziran na oznaenom jeziku za proirenje (eng.
eXtensible markup language XML) koji je deo W3C. Neka proirenja za XML
su razvijena da bi se ispunili DDL zahtevi.
b) Deo 3: Vizuelni
Odreuje alate za deskripciju osnovne strukture i deskriptore ili deskripcione eme za
opis vizuelnih karakteristika i za lokalizaciju opisanih objekata na slici ili video sekvenci.
MPEG-7 vizuelni deskriptor pokriva pet osnovnih vizuelnih karakteristika koji ukljuuju
boju, teksturu, oblik, pokret i lokalizaciju (deskriptor prepoznavanja lica je takoe
definisan).
c) Deo 4: Audio

99

Specificira alate za audio deskripciju koji su organizovani kao melodija, tiina, govorni
sadraj i zvuni efekti.
d) Deo 5: eme za multimedijalnu deskripciju (eng. multimedia description schemes
MDS)
Specificira deskripcione alate koji se bave optim i multimedijalnim entitetima. Opti
entiteti su oni koji se mogu primeniti kod audio, vizuelnih i tekstualnih deskripcija pa se
mogu tretirati kao opti u svim medijima. Alati za multimedijalnu deskripciju mogu se
grupisati u est razliitih klasa prema svojoj funkcionalnosti kao to je to prikazano na
Slici 7.8.1. Prva klasa sadri deskripciju sadraja: strukturne i semantike aspekte. Druga
klasa sadri upravljanjem sadrajem: medije, korienje, kreaciju i produkciju. Treu ini
organizacija sadraja: kolekcija i modeli. etvrta klasa bavi se navigacijom i pristupom:
rezimea, varijacije i gledita. Sledi klasa koja se odnosi na korisnike: davanje prvenstva
korisnicima i poreklo primene. Najzad esta klasa bavi se bazinim elementima: tipovima
podataka i strukturama, emama razliitih alata, linkovima i lokalizacijom medija kao i
osnovnim deskripcionim emama DS.

Slika 7.8.1Pregled deskriptivnih alata kod multimedijalnih deskriptivnih ema

e) Deo 6: Referentni softver


Sadri softver za implementaciju alata specificiranih u Delovima 15. Kao i kod MPEG-4
standarda, ovaj softver koristi se za primene koje su prilagoene sa MPEG-7 standardom.
f) Deo 7: Prilagoeno testiranje
Specificira procedure koje obezbeuju da se proveri da li deskripcioni tokovi odgovaraju
specifikacijama u Delovima 15.

100

g) Deo 8: Ekstrakcija i primena MPEG-7 deskripcije


Obezbeuje korisne informacije o ekstrakciji i upotrebi deskripcije.
h) Deo 9: Profili i nivoi
Specificira deskripciju profila i nivoa. Deskripcioni nivo u optem sluaju opisuje podniz
svih deskripcija i alata opisanih u MPEG-7. Deskripcija alata u deskripcionom profilu
podrava niz funkcionalnosti za izvesnu klasu primena; nivo dispersije profila definie
dalja ogranienja u pogledu usklaenosti deskripcija sa ogranienjem koje postavlja
maksimalna dozvoljena kompleksnost.
i) Deo 10: Definicija eme
Specificira definiciju eme kroz Delove MPEG-7. Prikuplja deskripciju alata
specificiranih u MPEG-7 i specificira opis sintakse u emi primenom opisa jezika po
definiciji DDL.
j) Deo 11: Profil ema
Obuhvata eme za razliite profile.
MPEG-7 je obiman, moan i u sutini kompletan standard. On se odnosi na razliite
ciljeve u poreenju sa prethodnim MPEG standardima gde je potreba za interoperabilnou
manja.

7.9 MPEG-21 Standard


Poetak rada na MPEG-21 standardu 1999 godine obeleen je pojavom da je, uprkos
postojanju MPEG-1, MPEG-2, MPEG-4 i MPEG-7 standarda potpuna interoperabilnost u
multimedijalnoj raspodeli i potronji, iako dobrodola, bila jo uvek daleko od krajnjeg cilja. Sa
jedne strane u pitanju je bilo nepostojanje izgraene infrastrukture za dostavljanje i potronju
multimedijalnog sadraja, a sa druge strane nije se moglo jasno sagledati kako opisati elemente
ve spremne za eksploataciju i one u razvoju i kako ih povezati radi dobijanja multimedijalne
infrastrukture [7.51], [7.52].
Na osnovu diskusije koje su pratile MPEG Forum, ciljevi u ranom stadijumu razvoja MPEG21 Standarda bili su [7.53]:

Da se shvati kako razliite dostupne komponente mogu biti uzajamno fitovane,


Da se diskutuje o tome koji su to potrebni standardi ukoliko za to postoji prostor u
odgovarajuoj infrastrukturi,
Kada se zadovolje prethodne dve take da se sprovede integracija razliitih standarda.

Da bi se ostvarila ideja o jednom interoperabilnom okruenju, MPEG sarauje sa drugim


telima koji takoe donose standarde. Kao rezultat te saradnje pojavila se lista od sedam delova
elemenata kao i prvo izdanje jednog finalnog dokumenta nazvanog Tehnicki izvestaj (eng.
Tehnical report TR) [7.54]. Ovih sedam delova formiraju osnovni koncept MPEG-21
standarda. U centru panje ovde se nalaze korisnik i Digitalni deo (eng. Digital item DI).
Korisnik je bilo koji entitet koji koristi Digitalni deo. Prema Tehnikom izvetaju, DI predstavlja
101

struktuirani digitalni obejkat sa standardnom prezentacijom, identifikacijom i meta podacima u


okviru MPEG-21 standarda. Ovaj entitet je, takoe, osnovna jedinica za raspodelu i transakciju.
Sedam delova u TR predstavljaju grupisane elemente arhitekture standarda MPEG-21.
Granice izmeu elemenata nisu striktne, a kasniji tok standardizacije je pokazao da primenjene
tehnologije mogu obuhvatiti vie elemenata. Ovi elementi su identifikovani sledeim redom:

Deklaracija o digitalnim delovima (eng. digital item declaration DID): obezbeuje


uniformno i fleksibilno uoptavanje i interoperabilnu emu za naznaku digitalnih delova;
Identifikacija i opis digitalnih delova predstavlja sposobnost da opie bilo koji entitet bez
obzira na njegovu prirodu ili tip;
Upravljanje sadrajem i primena podrazumeva interfejse i protokole koji omoguavaju
kreiranje, rukovoenje, istraivanje i pristup, memorisanje, predaju i korienje sadraja
kroz distribuciju i potronju vrednosnog lanca;
Upravljanje intelektualnom svojinom i zatita odnose se na omoguavanje prava na
intelektualnu svojinu sadraja kojom se upravlja postojano i pouzdano, dok se zatita
sprovodi kroz iroki opseg u mrei i na ureajima;
Terminali i mree obuhvataju sposobnost da se obezbedi interoperabilnost i transportni
pristup sadraju kroz mree i terminale;
Predstavljanje sadraja bavi se predstavljanjem resursa ureaja;
Izvetavanje o dogaaju bavi se metrikama i interfejsima koji omoguavaju korisnicima
da upravljaju dogaajima u okruenju.

Sedam delova elemenata vezanih za arhitekturu koji olakavaju transakcije izmeu


korisnika kod standarda MPEG-21 dato je na Slici 7.9.1. U daljem delu izlaganja rezimiraemo
funkciju svakog navedenog alata.
a) Deklaracija o digitalnom delu
To je osnovni element u MPEG-21 standardu. Koncept digitalnog dela ini kompletan
skup tehnologija koje omoguavaju zatitu standarda, adaptaciju i grupisanje formiranih
digitalnih delova.
b) Identifikacija i opis digitalnog dela
Kljuni aspekt MPEG-21 standarda je potreba da se svi sadraji mogu identifikovati i
locirati. Cilj je da svi digitalni sadraji i resursi medija u okviru MPEG-21 standarda
prenose jedinstvene identifikatore. Broj zahteva za takvim identifikatorima i lokatorima
je jasno izraen pa su uvedene mnoge scene za identifikaciju specifinih medija [7.55]
[7.57]. Takoe su prepoznate neke inicijative za identifikaciju u unakrsnim domenima
kao i u industrijskim sektorima. Stoga je zadatak MPEG-21 standarda bio da kreira
zajedniki prostor u kome korisnici mogu da objedine identifikatore na jedan
interoperabilan nain.
c) Upravljanjem sadrajem i primena
U ranoj fazi razvoja MPEG-21 standarda, utvreno je da bi ga obavezno trebalo uvesti u
oblasti mree, servera i upravljanja multimedijalnim sadrajem od strane klijenta. Takoe
je uoena neophodnost ovog standarda kod personalizacije sadraja kao i kod mogunosti

102

agenata da konzumiraju i filtriraju sadraj za korisnike. Zato je ovaj deo standarda


uvren u oblast koja se odnosi na personalizaciju korisnika.

Slika 7.9.1Sedam delovaelemenata kod standarda MPEG-21

d) Upravljanje intelektualnom svojinom i zatita


Upravljanje digitalnim pravima (eng. digital rights managament DRM) je oblast
velikog interesovanja jo od sredine devedesetih godina prolog veka. MPEG je utvrdio
da ukljuivanje DRM mehanizma u multimedijalni okvir moe biti od vitalne vanosti,
kao i da bi se prilaz sastojao u interoperabilnosti i prilagodljivosti. Ova oblast je poznata
u MPEG standardizaciji kao IPMP. U standardu MPEG-21 ovaj element ukljuuje
koncepcije jezikih prava kao i zatitne mehanizme za sadraj. Neto kasnije MPEG-21
standard usvaja novi prikaz koji omoguava viestruko upravljanje digitalnim pravima
kroz tzv. utikake zatitne mehanizme u standardu. Dalje, MPEG je razvio zatienu
verziju digitalnog dela koja moe da koristi prikaz upravljanja digitalnim pravima na
bazi utikake jedinice [7.58].
e) Terminali i mree
Cilj okvira ovog standarda bio je da kreira transparentni pristup za napredni
multimedijalni sadraj (onakav kakav je opisan u objektima sa digitalnim delovima).
Zbog toga je shvatanje efektivne zatite izmeu korisnika i terminala sa jedne i mree sa

103

druge strane bilo od vitalne vanosti. Povezanost elemenata, irina propusnog opsega i
kvalitet servisa predstavljaju vane komponente za adaptaciju okvira standarda [7.59].
f) Predstavljanje sadraja
TR za standard MPEG-21 pokazao je da sadraj moe biti:
1) Predstavljen MPEG standardima,
2) Upotrebljen od strane MPEG ali da nije pokriven MPEG standardima, na primer
puni tekst, hipertekst sa oznaenim jezikom (eng. hyper text markup language
HTML) i standardni generalizovani jezik za markiranje (eng. standard
generalized markup language SGML),
3) Prikazan pomou prethodna dva stava,
4) Predstavljen preko standarda za sezonske medije.
U TR-u se takoe kae da okvir standarda treba da podri predstavljanje sadraja. Tako je
potrebno da MPEG-21 standard podri sinhronizovani i multipleksirani medijum.
g) Izvetavanje o dogaaju
U toku rane faze izrade ovog standarda ukazala se potreba za interakcijama sa digitalnim
delovima. Naime, radilo se o tome da se standardizuju metrike i interfejsi za interakcije
koje se oekuju kod digitalnih delova. Dalje transport podataka pridruen raznim
dogaajima-saoptenjima treba standardizovati.
Ovih sedam delova - elemenata mogu se preklapati. U svakom elementu identifikovane su
oblasti standardizacije, generisani su zahtevi, a odgovarajue tehnologije odabrane su na osnovu
tih zahteva.

7.10 ITU-T proces standardizacije kod audio-vizuelnih


komunikacionih sistema
Kod pripreme standarda za globalnu informacionu infrastrukturu (eng. global information
infrastructure GII) ukljuen je ITU. Sprovedena je konvergencija tehnologija i industrije i
obezbeene su razliite multimedijalne aplikacije. Globalna povezanost i interoperabilnost su
neki od kljunih zahteva od strane GII to je zahtevalo uvoenje novih standarda. Prihvaeno je
da najvaniji globalni standardi moraju odgovarati trinim zahtevima, da ne smeju pogoravati
ili ograniavati kreativnost proizvoaa opreme, provajdera informacija kao i servisnih
provajdera. Od ne manje vanosti bilo je svakako da se obezbedi realna i stabilna baza za
informacionu infrastrukturu. Uvoenjem ovakvih standarda postignuta je interoperabilnost
sistema uz mogunost voenja rauna o trinim zahtevima, trokovima i kvalitetu servisa. To,
pored ostalog, prua mogunost povezivanja industrijski manje razvijenih sa visoko razvijenim
industrijskim zemljama [7.60].
to se tie multimedijalnih komunikacija, postoje dve glavne organizacije u oblasti
standardizacije: ITU i ISO. Tako na primer, neki standardi za video kodovanje definisani od
strane tih organizacija dati su u Tabeli 7.10.1.

104

Navedeni standardi se razlikuju u pogledu bitskog protoka. Svi ovi standardi se mogu
primeniti u irokom opsegu bitskih tokova. U zavisnosti od algoritama kodovanja, oni prate
sline standardizacione okvire.
Tabela 7.10.1Neki standardi za video kodovanje
Organizacije
standarda
ITU-T

Video kodni
standard
H.261

ISO

ISO/IEC 11172-2
MPEG-1 VIDEO
ISO/IEC 13818-2
MPEG-2 VIDEO
H.263
CD 14496-2
MPEG-4 VIDEO
H.263 Verzija 2
H.26L

ISO
ITU-T
ISO
ITU-T
ITU-T

Tipian opseg
bitskog protoka
p 64 kbit/s;
p = 1, 2, 30
1.2 Mbit/s

Tipine primene

od 4 Mbit/s do 80 Mbit/s

SDTV, HDTV

64 kbit/s ili nie


od 24 kbit/s do 1024 kbit/s

PSTN VIDEOFON
Interaktivni
Audio-Video
PSTN VIDEOFON
Mrea na bazi paketskog videa

Manje od 64 kbit/s
Manje od 64 kbit/s

ISDN VIDEOFON
CD ROM

Standard H.320

Za sve ITU standarde obavezna je interoperabilnost sa standardom H.320. Meutim, ova


interoperabilnost je postignuta kroz mreni prolaz koji u nekim sluajevima mora da predstavlja
prolaze izmeu razliitih protokola, razliitih standarda za kompresiju i razliitih ema za
multipleksiranje. Varijacije u signalizaciji i multipleksiranju za razliite standarde nastaju usled
razliitih karakteristika mrea na koji se svaki odgovarajui standard primenjuje. Jedan aspekt
standarda H.320 je centralizovan prikaz odravanja konferencije izmeu vie mesta.
Standard H.320 definie centralni konferencijski server nazvan kontrolna jedinica za vie
taaka (eng. multipoint control unit MCU). MCU obezbeuje poziv za vie take [7.61]. Svaki
uesnik uspostavlja poziv direktno sa MCU. Ova kontrolna jedinica tada kontrolie tok
konferencije. Dakle, postoji veza od take do take kao kod digitalne mree integrisanih servisa
(eng. integrated services digital network ISDN). Radi se o mrei integrisanih servisa koja
obezbeuje digitalnu vezu na relaciji korisnik mrea. To je svetski telekomunikacioni servis
koji koristi tehnologiju digitalnog prenosa i komutacije za podrku komunikacija glasom i
digitalnim podacima, protocima koji su umnoak 64 kbit/s. Pri tome se koristi i komutacija
kanala (kola) i komutacija paketa. ISDN je iroko rasprostranjena mrea za interaktivne
multimedijalne komunikacije. Za brojne poslovne korisnike H.320 familija ITU-T preporuka
primenjuje se kod video-telefonskih i video-konferencijskih sistema.
Preporuke H.310 i H.321

ITU-T Studijska grupa (eng. Study Group SG) SG 15 razvila je sledee dve preporuke
za audio-vizuelne komunikacione sisteme u ATM okruenjima:
H.321Prilagoenje standarda H.320 za vizuelne telefonske terminale na irokopojasno

105

ISDN (eng. broadband ISDN BISDN) okruenje [7.62],


H.310irokopojasni audio-vizuelni komunikacioni sistem i terminali [7.63].
Preporuka H.321 specificira prilagoenje H.320 za vizuelne terminale na BISDN
okruenje. Na taj nain zadovoljen je zahtev da ATM terminali mogu meusobno da rade sa
onim terminalima koji su prikljueni na uskopojasnu digitalnu mreu integrisanih servisa (eng.
Narrow-band ISDN NISDN).
Preporuka H.310 obuhvata uzajamni rad H.320/H.321 pri emu se uzima u obzir
preimustvo koje obezbeuje ATM postupak u smislu postizanja veeg kvaliteta kod audiovizuelnih komunikacionih sistema. Iako NISDN omoguava samo mali broj transfer protoka,
kvantizacja multiplima od 64 kbit/s, 394 kbit/s, 1536 kbit/s i 1920 kbit/s omoguava za BISDN
iroki opseg transfer protoka. To prua izvesno preimustvo koje se ogleda u fleksibilnosti, ali
isto tako stvara potencijalni problem u pogledu interoperebilnosti. Naime, moe se dogoditi da
jedan terminal podrava jednu grupu transfer protoka, a da drugi terminal podrava drugu
razliitu grupu transfer protoka, pri emu nemaju zajednikih vrednosti. Preporukom H.310
reava se ovaj problem na taj nain to se najpre transfer protoci tako definiu da protoci budu
multipl od 64 kbit/s, a zatim se koriste dva protoka 96 64 kbit/s = 6114 kbit/s i 144 64 kbit/s
= 9216 kbit/s. Drugi mogui transfer protoci mogu se ugovoriti kroz primenu H.245 procedure
[7.64].
ITU-T H.323 standard

Primarna razmatranja u razvoju H.323 bila su sledea:

Interopereabilnost, naroito sa NISDN i H.320,


Kontrola pristupa LAN mreama da bi se izbeglo nagomilavanje poziva,
Modeli poziva za vie taaka,
Skalabilnost poev od mrea malih do srednjih veliina.

H.323 terminali mogu se primeniti za konfiguracije sa vie taaka i mogu da meusobno


rade sa H.310 terminalima iz mree tipa BISDN, sa H.320 terminalima iz mree tipa NISDN, sa
H.321 terminalima iz BISDN mrea, kao i sa H.322 terminalima koji garantuju kvalitet servisa u
lokalnim raunarskim mreama (LAN local area network). Podsetimo se da LAN obezbeuje
povezivanje itavog niza razliitih ureaja za komuniciranje (radne stanice, periferijski ureaji,
terminali, drugi ureaji ) unutar male teritorije. Ovde se radi o velikom protoku i maloj
verovatnoi greke u prenosu podataka. Takoe H.323 terminali rade sa H.324 terminalima iz
opte komutacione telefonske mree (eng. general switched telephone network GSTN), kao i
sa beinim mreama i V.70 terminalima u mrei tipa GSTN [7.65].
Zona H.323 sistema data je na Slici 7.10.1. H.323 ne ukljuuje mreu tipa LAN. U zoni
je obezbeen nadzor prolaza radi pristupa kontroli H.323 terminala u okviru zone. Kriterijumi
koji koriste nadzor prolaza da bi se omoguio jedan takav pristup nisu standardizovani. Uz to,
nadzor prolaza ograniava irinu propusnog opsega koji koristi terminal i moe da kontrolie
upotrebljeni model poziva koji takoe utie na korienje irine propusnog opsega. Samo
elementi potrebni za interakciju sa mreom za komutaciju kanala (eng. switched circuit network

106

SCN) su vezani za H.323. Kombinacija mrenog prolaza kod H.323, H.323 terminala i mree
tipa LAN pojavljuje se u SCN mrei kao H.320, H.310, ili H.324 terminal.

Slika 7.10.1Zona H.323 sistema

H.323 opisuje ukupan sistem i komponente, ukljuujui terminale, mrene prolaze (eng.
gate way GW), nadzore prolaza (eng. gate keeper GK), kontrolore procesa za vie taaka i
kontrolne jedinice za vie taaka MCUs.
Zonom koju ini kolekcija svih terminala, mrenih prolaza, i kontrolnih jedinica za vie
taaka upravlja jedinstveni nadzor prolaza. Zona obuhvata najmanje jedan terminal i moe a i ne
mora, da obuhvati mrene prolaze ili kontrolnu jedinicu za vie taaka. LAN segmenti koji su
povezani primenom rutera ili drugih ureaja mogu biti u istoj zoni.
H.324 standard

Ukoliko se telefonske mree koriste za multimedijalne konferencije, najvei broj


komercijalnih proizvoda bazira se na H.324 protokolu da bi se obezbedila interoperabilnost.
ITU-T preporuka H.324 pod nazivom Terminali za multimedijalne komunikacije niskog
bitskog protoka [7.66] daje pregled multimedijalnih terminala u mrei tipa PSTN i referencira
sve druge ITU-T preporuke potrebne da se izradi jedan takav terminal na standardan nain.
Sistemi na bazi H.324 ugovoraju vrednosti parametara kod protokola kao to su
dimenzije paketa i omoguavaju kanjenje prilikom prenosa u oba smera. Takve vrednosti i
naroito potrebne vrednosti kanjenja u oba smera, znaajno utiu na naine za predstavljanje
otpornosti na greku. Da bi se minimiziralo kanjenje paketa, obino se ugovaraju paketi malih
veliina. Karakteristian koristan sadraj za video pakete u sistemu H.324 je 128 bajta. Ta
vrednost se esto koristi kod razliitih interoperabilnih testova za komercijalne H.324 sisteme
[7.67].
Na alost, mnogi H.324 sistemi imaju znaajno kanjenje sa kraja na kraj najvie zbog
integracije H.324 mehanizma protokola sa okruenjem operativnog sistema personalnog
raunara (eng. personal computer PC) koje nije optimizirano za primene u realnom vremenu.
Tipino kanjenje sa kraja na kraj u takvom sistemu je iznad 0.5 s. Odgovarajui modemi
omoguavaju da se optimizira veza izmeu vrednosti greaka i bitskog protoka.

107

7.10.1 Standardi za video kodovanje


Postoje dva prilaza za razumevanje standarda za video kodovanje. Jedan prilaz je da se
fokusiramo na sintaksu niza bita i da se pokua shvatiti ta predstavlja svaki sloj sintakse i ta
svaki bit u nizu bita oznaava. Ovaj prilaz je veoma znaajan za proizvoaa opreme koji treba
da sagleda opremu koja je prilagoena standardima. Drugi prilaz je da se koncentriemo na
algoritme kodovanja koji se mogu upotrebiti za generisanje niza bita prilagoenih standardu, a
zatim da se shvati da svaka komponenta ne specifira bilo koji od kodnih algoritama. Ovaj prilaz
obezbeuje bolje razumevanje video kodnih tehnika u celini, a ne samo standardnu sintaksu niza
bita.
H.261 standard

Ovaj standard bavi se sluajevima u kojima postoji mali bitski protok i malo kodno
kanjenje. Ovde se radi o bitskim protocima od oko p 64 kbit/s, gde p varira od 1 do 30. Kodni
algoritam korien u H.261 je u osnovi hibrid kompenzacije pokreta, da bi se uklonila vremenska
suvinost, i transformacionog kodovanja DCT kako bi se redukovala prostorna suvinost. Takva
koncepcija formirala je bazu za sve standarde koji se odnose na video kodovanje. H.261 standard
je imao znaajan uticaj na mnoge postojee i ostale standarde za video kodovanje u fazi razvoja.
Digitalni video sastoji se od niza slika ili kadrova koji se odigravaju izvesnom brzinom.
Svaka slika sadri tzv. elemente slike piksele. Za standard kod video kodovanja vano je znati
dimenzije slike na koju se standard primenjuje i poloaj piksela-tela. H.261 bavi se sa dva
formata slike: zajedniki srednji format (eng. common intermediate format CIF) i etvrtni
zajedniki srednji format (eng. quarter CIF QCIF). Kod mirnih slika prema standardu H.261
koristi se etiri puta vei format. Na primer ukoliko je video format CIF, odgovarajui video
format je 4CIF.
Standard H.261 se primenjuje za video telefoniju i video konferenciju. Ovde je izvorni
materijal sastavljen od scena osoba koje govore, tzv. nizova glave i ramena osobe, pre nego
optih TV programa koji sadre dosta promena u pokretu i na sceni. Kod H.261, svaki odmerak
sadri luminentnu komponentu Y i dve hrominentne komponente oznaene sa Cb i Cr. Posebno
crna boja je predstavljena sa Y = 16, bela sa Y = 235, dok su Cb i Cr varirali izmeu 16 i 240, pri
emu 128 predstavlja sivo.
Kod standarda H.261 blok je definisan kao grupa od 8 8 pela. Jedan blok koji ine Cb
peli i jedan blok sa Cr pelima odgovara vrednosti od etiri bloka Y pela. Kolekcija ovih est
blokova predstavlja makroblok (eng. macroblock MB). Jedan makroblok sa redosledom
blokova oznaenih od 1 do 6 dat je na Slici 7.10.2. MB se tretira kao jedna jedinica u procesu
kodovanja.

Slika 7.10.2Prikaz jednog makrobloka

108

Brojni makroblokovi grupisani zajedno predstavljaju grupu blokova (eng. group of blocks
GOB). Za H.261 GOB sadri 33 makrobloka. Rezultujue strukture za sliku u sluaju CIF
formata, kao i u sluaju formata tipa QCIF prikazane su na Slici 7.10.3 [7.68].

Slika 7.10.3GOB strukture u sluaju CIF i QCIF za standard H.261

Algoritam za kodovanje u standardu H.261 moe se prikazati sa dve blok-eme prikazane na


Slici 7.10.4 i na Slici 7.10.5 [7.69]. Na strani kodera, ulazna slika je uporeena sa prethodno
dekodovanim kadrom sa kompenzacijom pokreta. Diferencijalni signal je transformisan
primenom DCT postupka, kvantovan, entropijski kodovan i prenesen.
video
ulaz

DCT

IDCT

+
Filter

Kompenzacija
pokreta

Slika 7.10.4Blok-ema video kodera u standardu H.261


IDCT

+
+

Filter

Kompenzacija
pokreta

Slika 7.10.5Blok-ema video dekodera u standardu H.261

Na strani dekodera, dekodovani DCT koeficijenti su inverzno DCT (eng. inverse DCT
IDCT) transformisani i zatim pridodati perthodno dekodovanoj slici sa kompenzacijom pokreta.
109

Poto je predikcija tekueg kadra sastavljena od blokova na razliitim lokacijama u referentnom


kadru, predikcija sama po sebi moe da sadri um kodovanja i izoblienja zbog postojanja
blokova, koja mogu da dovedu do poveanih greaka usled predikcije. Da bi se smanjile te
greke, prediktovani koder se proputa kroz niskopropusni filter pre nego to se upotrebi kao
predikcija za tekui kadar.
H.263 standard

H.263 standard kombinuje osobine standarda H.261 zajedno sa MPEG i optimiziran je za


vrlo niske bitske protoke. to se tie odnosa signal-um SNR, H.263 moe da obezbedi 3 dB do
4 dB poboljanja u odnosu na H.261 pri bitskim protocima ispod 64 kbit/s. U stvari, H.263 daje
veu kodnu efikasnost u poreenju sa H.261 pri svim bitskim protocima. Tako na primer, u
poreenju sa MPEG-1, H.263 daje utedu od 30 % u pogledu bitskog protoka. Osnovna struktura
H.263 standarda je u sutini ista kao i kod H.261. Meutim, glavne razlike izmeu ova dva
standarda ogledaju se u sledeem:
H.263 podrava vie formata slika i koristi razliitu strukturu za grupu blokova GOB,
H.263 koristi polu-pikselsku kompenzaciju pokreta, ali ne koristi filtriranje ili polu
pokretne sprege kao kod H.261,
H.263 koristi 3D VLC za kodovanje DCT koeficijenata,
Uz osnovni kodni algoritam, opcije u H.263 koje se mogu ugovoriti izmeu kodera i
dekodera mogu da prue bolje performanse,
H.263 standard obezbeuje da se veliina koraka kvantizacije menja u svakom
makrobloku MB.
Razlike izmeu H.261 i H.263 ogleda se i u polupikselskoj predikciji u kompenzaciji
pokreta. Ova koncepcija se isto tako koristi i kod MPEG standarda. Vektori pokreta u H.261
mogu imati samo celobrojne vrednosti, dok H.263 omoguava da vektori pokreta budu sa
polovinom od vrednosti piksela. Tako, na primer, mogue je imati vektore pokreta sa
vrednostima izmeu 4.52.5. Kada vektor pokreta ima necelobrojne vrednosti, koristi se
bilinearna interpolacija da bi se pronale odgovarajue vrednosti tela za predikciju.
Kao i kod H.261, H.263 standard moe se primeniti kod terminala u razliitom mrenom
okruenju. Jedan primer za ovo je H.324 standard koji definie audio-vizuelne terminale za
tradicionalne javne komutirane telefonske mree (eng. public switched telephone network
PSTN). U ovom sluaju se kod H.324 standarda koristi kao video kodek terminal na bazi H.263
standarda.
ITU-T H.261/H.263 standardi za video kompresiju namenjeni su za kodovanje i
dekodovanje u realnom vremenu u sluaju video-konferencijskog sistema preko konekcije sa
konstatnim bitskim protokom.
H.263+ (H.263 version 2) standard

H.263+ (esto nazvan H.263 verzija 2) sadri oko 12 novih karakteristika koje ne postoje
u standardu H.263. One ukljuuju nove naine kodovanja za poboljanje efikasnosti kompresije,

110

podravanje skalabilnog bitskog protoka, nekoliko novih karakteristika koje podravaju paketske
mree, pridodatu funkcionalnost i podrku razliitim video formatima. Meu novim
karakteristikama H.263+, jedna od nekoliko koja tano istie neefikasnost opriginalne H.263
preporuke je modifikovani nain kvantizacije. Ovaj nain ima etiri kljuna elementa [7.70]:
Oznaavanje veih promena od makrobloka do makrobloka kod kvantizera kako bi se
bolje sprovodila kontrola protoka;
Sposobnost korienja finijeg hrominentnog kvantizera kako bi se bolje ouvala
hrominentna vernost;
Sposobnost da se podri celokupni opseg kvantovanih vrednosti koeficijenata pre nego da
se klipuju vrednosti vee od 128;
Eksplicitno ogranienje prilikom predstavljanja kvantovanih transformacionih
koeficijenata na one koji mogu sigurno nastati.
Najzad, H.263+ podrava iri opseg varijacija ulaznih video formata u poreenju sa
H.263. Jedna vana osobina H.263+ je korienje dodatnih informacija koje se mogu ukljuiti u
tok bita da bi se istaklo kanjenje ili da bi se pridruila informacija za spoljanu primenu.
Dodatna informacija prisutna je u bitskom protoku i kada dekoder nije u stanju da je prihvati ili
da je jasno interpretira. Drugim reima, ukoliko zahtev za obezbeivanjem traene sposobnosti
nije dogovoren unapred, dekoder moe jednostavno da odbaci bilo ta u dodatoj informaciji.
Druga uloga korienja dodatne informacije sastoji se u tome da se specificira hroma klju za
predstavljanje transparentnih i semi transparentnih piksela [7.71].
Sledea runda korienja H.263 standada dala je treu generaciju H.263 sintakse, koja se
neformalno naziva H.263++. Identifikovane su etiri kljune tehnike oblasti za dalja
istraiavanja: tip promenljive transformacije, adaptivno aritmetiko kodovanje, tabele za kodove
promenljive duine otporne na greku, kao i filtriranje za oslobaanje od pravljenja prstenova
oko slike.
H.263++ standard

Razvojni napor za H.263++ usmeren je ka standardizaciji tree verzije H.263 video


kodeka za komunikacije u realnom vremenu i sa tim u vezi ka nekonvencionalnim servisima
[7.72]. Kljune tehnike oblasti koje pokazuju poboljanje u pogledu dobitka kod performanse su
sledee [7.73], [7.74]:
Deoba podatka otpornih na greke,
Kompenzacija pokreta kod bloka dimenzije 4 4.
Deoba podatka otpornih na greke podrazumeva kreaciju podataka koji su podeljeni,
zatim i slojevitu zatitu strukture kodovanih podataka. Tu je i dua resinhronizacija kodne rei
radi poboljanja detekcije i smanjenja verovatnoe pogrene detekcije.
U drugom sluaju koji se odnosi na konpenzaciju pokreta kod bloka dimenzija 4 4
obuhvaeni su: memorije slike, alternacije kod optimizacije stepena oteenja, alternacije za
optimizaciju pokreta, novi tip filtera za deblokiranje, novi tip predikcije unutar oblasti slike,

111

izvesne alternacije kod kodova promenljive duine VLC kada se radi o transformacionim
koeficijentima, vektori pokreta i oblik kodovanog bloka.
H.26L standard

U pozivu za predloge, standard H.26L trebalo je da poslui za vrlo male bitske brzine, za
rad u realnom vremenu, malo kanjenje pri kodovanju od kraja do kraja veze za razliite izvore
[7.75]. Omoguena je softverska implementacija, naglaena je robustnost na greke (naroito kod
mobilnih mrea), a zastupljeni su i mehanizmi za kontrolu brzine rada. U odgovoru na poziv za
predloge za standard H.26L procenjeni su kao korisni i uzeti u obzir sledei tehniki predlozi
[7.76]:
Modifikovana metoda na bazi predikcije/transformacije,
Vektorska kvantizacija sa blok aproksimacijom koristei kodnu knjigu ili kompenzaciju
pokreta iz prethodnog kadra,
Filtriranje u kolu povratne sprege radi smanjenja bloking efekta, ugaonih ocrtavanja i
prstenastog uma,
Adaptivna skalarna kvantizacija koja koristi kodne knjige na nivou razliitom od nule,
Video koder na bazi DCT uz korienje preureivanja DCT koeficijenata,
Gruba segmentacija slina emi koja koristi kompenzaciju pokreta, vektorsku
kvantizaciju i DCT,
Deoba podataka primenom algoritma s preureivanjem podataka,
Video kodovanje koje koristi memoriju za vie referentnih kadrova slino predikciji sa
kompenzacijom pokreta.
Iz napred izloenog, proizalo je da je primarni cilj za standard H.26L to jednostavnije
video kodovanje uz postojanje to efikasnije kompresije. Uz to, u govornom domenu uveden je u
mreu paketski video (video-telefonija), kao i negovorne aplikacije (memorisanje, difuzija).
H.26L ima video kodni sloj VCL koji omoguava video prezentaciju sa velikom kompresijom,
kao i umreen sloj NAL za isporuku video sadraja preko specijalne mree. Sa H.26L VCL,
postignuto je znaajno poboljanje u pogledu efikasnosti stepena oteenja u poreenju sa
drugim standardima. H.26L NAL je razvijen sa ciljem da se transportuje video kroz razliite
mree kao to su to, na primer IP mree i beini sistemi tree generacije (eng. third generation
3G).

7.10.2 Standardi za kodovanje govora


ITU je standardizovao kodere za govor koji se primenjuju u multimedijalnim
komunikacijama. ITU preporuke G.729 8 kbit/s konjugovana struktura-algebarski kod pobuene
linerane predikcije (eng. conjugate structure - algebraic code excited linear prediction CSACELP) ima kanjenje od 15 ms za kodek i prua kvalitetan govor u mrei [7.77]. Namenjen je
za primene u beinim komunikacijama, ali i u multimedijalnim komunikacijam. ITU preporuka
G.723.1 za govorni koder od 6.3 kbit/s i 5.3 kbit/s za multimedijalne komunikacije bio je
namenjen za videofone sa malim bitskim protokom. U primenama gde je malo kanjenje vano,
112

kanjenje za G.723.1 moe biti suvie veliko. Meutim, ukoliko je kanjenje prihvatljivo,
G.723.1 prua alternativu za G.729 sa manjom kompleksnou po cenu neznatnog pogoranja
kvaliteta.
Veliki broj govornih kodera je standardizovan. Na primer, davno u periodu 19951996
pojavila su se tri meunarodna standarda (ITU G.729, G.729 A, i G.723.1) i tri regionalna
standarda (koderi za evropske i severnoamerike mobilne sisteme). Kvalitet govora koji
proizvodi govorni koder zavisi od bitskog protoka, kompleksnosti, kanjenja i irine propusnog
opsega. Otuda, prilikom analize govornih kodera vano je uzeti u obzir sve te parametre. Bitno je
naglasiti da postoji stroga uzajamna povezanost izmeu njih. Dodatni faktori koji utiu na izbor
govornog kodera su uslovi dostupnosti i specificiranja radi specificiranja standarda. Najvei broj
govornih kodera radi sa fiksnim bitskim protokom bez obzira na ulazne karakteristike signala. S
obzirom da multimedijalni govorni koderi dele kanal sa drugim oblicima podataka, bolje je
odabrati koder sa promenljivim protokom.
Kod prikaza standarda za govorne kodere, vodi se rauna o tome da se specificiraju izrazi
za reference (eng. terms of reference ToR) pri emu se tu imaju u vidu: bitski protok,
kanjenje, kompleksnost i kvalitet.
Za G.729 standard jedan od ToR zahteva bio je da bi govorni koder trebalo da radi sa
8 kbit/s. Ovaj protok bio je izabran delimino i zbog toga to je opseg prve generacije digitalnih
celularnih standarda varirao od 6.7 kbit/s u Japanu, do 7.95 kbit/s u SAD, pa sve do 13 kbit/s u
Evropi. Za G.723.1, ToR zahtevi bili su da bi govorni koder trebalo da radi sa protokom niim
od 9.6 bit/s. Za koder za digitalni simultani glas i podatke (eng. digital simultaneous voice and
data DSVD), ToR zahtevi za bitski protok izvedeni su na osnovu koliine govornih podataka
koje treba preneti modemom od 14.4 kbit/s.
Kanjenje predstavlja glavnu razliku izmeu G.729 i G.723.1. ToR zahtev za kanjenje
za G.729, najpre za kodek u jednom pravcu bilo je 10 ms. Zatim je taj zahtev za kanjenje
sistema u jednom pravcu kod G.729 sveden na 35 ms.
Glavna primena za G.723.1 je videofonija sa malim bitskim protokom koja se obavlja sa
5 kadrova/s ili meto manje. Ovaj protok odgovara periodu video kodera od 200 ms. Kod
konane verzije G.723.1, kanjenje sistema u jednom pravcu iznosi 97.5 ms.
G.723.1 je manje kompleksan od G.729. On se karakterie sa 14.6 miliona instrukcija u
sekundi (eng. millions of instructions per second MIPS) pri bitskom protoku od 5.3 kbit/s i sa
16 MIPS-a pri bitskom protoku 6.3 kbit/s. Pri tome se koristi 2200 rei iz memorije sa sluajnim
pristupom (eng. radnom access memory RAM). Zahtevi za upotrebom DSVD kodera bili su 10
MIPS-a, 2000 rei iz RAM memorije i 10 000 rei iz memorije sa oitavanjem (eng. read-only
memory ROM).
Koderi govora predstavljeni na ovom mestu su slini. ini se da su G.723.1 i G.729A
(DVD verzija od G.729) malo manje robusni na greke nastale usled uma u pozadini i na uslove
rada u tandemu. Njihova karakteristika za ist govor i opta robusnost je dovoljna da ih ITU
preporui za primenu kod simultanog glasa i podataka kao to je to sluaj kod multimedijalnih
komunikacija sa malim bitskim protokom.

7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju


Osnovni strimovi (eng. elementary streem ES) kao to su video podaci, signali za
kontrolu sinhronizacije video kadra i indikacije od kojih svaki moe biti standardizovan,

113

multipleksirani su u paketski strim prema preporuci H.222.0. H.222.1/H.222.0 funkcije


obuhvataju multipleksiranje obnavljanja vremenske baze, sinhronizaciju medija, otklanjanje
ditera, upravljanje baferom, kontrolu bezbednosti i pristupa, podkanalnu signalizaciju.
Preporuka H.222.1 odreuje elemente i procedure za H.222.0 radi njihove primene u ATM
okruenju a takoe specificira kodne take i procedure za ITU-T definisane osnovne strimove
[7.78]. Podkanalna signalizacija je proces na osnovu koje podkanal za audio, video i druge
osnovne strimove ESs je uspostavljen izmeu predaje i prijema H.222.1 entiteta.
ITU-T preporuka H.221

Ova preporuka nosi naziv Struktura kadra za 64 kbit/s do 1920 kbit/s kanal kod audiovizuelnih teleservisa [7.79]. H.221 je namenski protokol koji se odnosi na multipleksiranje za
H.320 terminale. Do 30 ISDN B kanala mogu biti zdrueni da bi se formirao superkanal sa
bitskim protokom od n 64 kbit/s. Kanali media za audio, video, i informacije o podacima su
multipleksirani u superkanalu. Za audio i video informacije, H.221 ne daje bilo kakvu kontrolu
greke, ali se zato kompletno oslanja na otpornost na greke pri kodovanju medija, to je
omogueno zbog prirode mree tipa ISDN i malih vrednosti greaka. Protokol nudi samo bitski
orijentisan, nezatieni transport servis od take do take.
ITU-T preporuka H.223

Ova preporuka se zove Multipleksiranje protokola za multimedijalne komunikacije sa


malim bitskim protokom [7.80]. Tri razliita tipa adaptacionih slojeva (eng. adaption layers
ALs) iz modela za povezivanje otvorenih sistema (eng. open system interconnection OSI) su
dostupni. Oni imaju razliite karakteristike u pogledu verovatnoe greke i kanjenja.
Adaptacioni slojevi su deo OSI referentnog modela. Podsetimo se da je OSI standard ISO koji
slui za definisanje okvira primene protokola, hijerarhijski podeljenih na sedam slojeva (nivoa),
radi ostvarivanja komunikacija izmeu meusobno kooperativnih ureaja. Referentni OSI model
za protokole sastoji se od skupa protokola hijerarhijski poreanih u sedam slojeva (nivoa). Ovaj
model je definisan za komuniciranje dva ureaja pri zajednikom radu.
Kanali sa malim kanjenjem dozvoljavaju vee greke. AL 1 i AL 2 obavljaju razliite
zadatke. AL 3 slui za kodovani video. Video podaci smeteni su u male pakete promenljive
duine (oko 100 bajta (eng. byte), mada se mogu ugovoriti i vee dimenzije paketa). 16-bitna
ciklina provera suvinosti (eng. cyclic redundancy check CRC) za svaki paket omoguava
detekciju greke. Zaglavlje za svaki paket iznosi jedan do tri bajta plus informacije o kontroli
greke za AL 3. to se tie AL 3, tu je ukljuen optimalni retransmisioni protokol koji po neki
put omoguava retransmisiju izgubljenog ili oteenog paketa. Retransmisija AL 3 vezana je za
brzo pristizanje potvrda poruke to je znak da su paketi korektno preneeni.
ITU-T preporuka H.225

Preporuka H.225.0 opisuje naine na koje audio, video podaci, i kontrola mogu biti
zdrueni, kodovani, i paketizovani za transport izmeu H.323 terminala u sluaju

114

negarantovanog QoS ili izmeu H.323 terminala i H.323 mrenog prolaza koji moe biti
povezan sa H.320, H.324, ili H.310/321 terminalima u mreama tipa NISDN, GSTN, ili BISDN
respektivno. Ovaj mreni prolaz kao i konfiguracija terminala i procedura opisani su u H.323 i
H.225.0 protokolima i formatima u obliku poruke. Cilj H.225.0 komunikacije je izmeu H.323
terminala i H.323 mrenog prolaza po istoj mrei tipa LAN, pri emu se koristi isti transportni
protokol. H.225 koristi transportni protokol u realnom vremenu kontrolni protokol u realnom
vremenu (eng. real time transport protocol real time control protocol RTP/RTCP) za
paketizaciju strimova medija i sinhronizaciju mrea tipa LAN. Generalno govorei, H.225.0
treba da obezbedi nain za sinhronizaciju paketa kako bi se olakale transportne procedure u
LAN mreama. H.225.0 ne trai da svi mediji i kontrola budu zajedno u jednom strimu koji se
onda paketizuje.
H.225 terminali alju audio i video koristei RTP protokol kroz nepouzdane kanale kako
bi se minimiziralo kanjenje. Ponitavanje greaka moe se primeniti kako bi se prevaziao
problem izgubljenih paketa; u optem sluaju audio/video nisu preneeni jer bi to dalo kao
rezultat preterano veliko kanjenje. H.225.0 terminali alju i primaju audio i video po posebnim
transportnim adresama koristei posebne primere, kad RTP protokol dozvoljava za svaki
medijum posebno QoS i kadar. Poseban sluaj za analizu je kada su audio i video paketi
pomeani tako da ine jedinstveni kadar i kada su poslati na jednu adresu.
Protokoli za zajedniku kontrolu H.245

H.245 je tako struktiran da se definiu tri glavna odeljka: sintaksa, semantika, i


procedure. Notacija ASN.1 se koristila za generisanje sintakse za poruke. Sekcija semantike
definie znaenje elemenata sintakse i obezbeuje sintetika ogranienja. Interakcija izmeu
razliitih entiteta protokola je samo kroz komunikaciju sa H.245 korisnikom. H.245 obezbeuje
brojne razliite servise korisnicima. Servisi se mogu koristiti na osnovu razliite preporuke za
terminale. Neki od ovih servisa su sledei:
Mogunost razmene,
Procedura logike signalizacije u kanalima,
Signali kontrole i indikacije,
Mogunost razmene znai da, pre nego to multimedijalna komunikacija otpone,
terminal mora biti obaveten o sposobnosti drugog terminala da primi i dekoduje multimedijalne
signale. Audio mogunosti odreene su na osnovu jedne od ITU-T G serija preporuka kao to su
G.711, G.722, ili MPEG-1 ili MPEG-2 Audio. to se tie podataka koristi se serija preporuka
T.120. Postoji i audio-vizuelno multipleksiranje. U tom sluaju primenjuje se preporuka H.221.
to se tie procedure logike signalizacije u kanalima, terminalni resursi za kodovanje i
dekodovanje koriste logiku signalizaciju u kanalu. Logiki broj kanala predstavlja odreeni
kanal u sistemu multipleksa. Logiki brojevi kanala su jedinstveni u svakom pravcu prenosa za
specijalni poziv.
Signali kontrole i indikacije povezuju da su poruke tako definisane da se prenose signali
kontrole i indikacije definisani u H.221 i H.320. Poruke nose razliite informacije ukljuujui
odravanje u kolu povratne sprege, video/audio signale za brzi odgovor, zatim informaciju o
komutaciji izvora za primene u vie taaka itd. Od poetka razvoja H.245 oekivalo se da e to

115

biti znaajan dokument sa dodatnim osobinama koje se pridodaju povremeno, da bi se omoguile


nove preporuke za terminal ili da se obezbedi moderna funkcionalnost za ve postojee
preporuke za terminal. Otuda je sintaksa kod H.245 iroka. To se postie korienjem markera za
proirenje u sintaksi kao i polja za identifikaciju protokola koje oznaava upotrebljenu verziju
H.245. Markeri za proirenje omoguavaju da se pridoda sintaksa na ranije dekoderske
implementacije kod H.245, mogu da preskoe dodatnu sintaksu, a da je i ne razumeju i da
nastave normalno postupak dekodovanja [7.81]. Koristie se polje identifikatora protokola da bi
se naznaile izmene u preporuci kao to su definicije novih procedura ili dodavanje nove sintakse
koju mora da prepozna udaljeni terminal.

7.11 Rezime
Standardi imaju veliku ulogu u multimedijalnim komunikacijama jer omoguavaju, pre
svega, interoperabilnost izmeu hardvera i softvera. Radi se o kompromisu izmeu onoga to je
teorijski omogueno, sa jedne, i u tehnolokom smislu ostvarljivo, sa druge strane. Standardi
mogu biti uspeni samo ukoliko su dobro izbalansirani kako u tehnikom tako i ekonomskom
smislu. To je naroito znaajno u oblasti audio-video kodovanja gde postoji raznolikost u
pogledu kodnih algoritama koji mogu biti vrlo kompleksni za implementiranje. Uspeh razliitih
MPEG i ITU-T standarda zavisi od brojnih eleemenata.
MPEG je vodee telo za standardizaciju u audio-vizuelnoj tehnologiji. MPEG-1 je
namenjen za CD-ROM sa primenama pri bitskom protoku od oko 1.5 Mbit/s. Standard se
pokazao korisnim kod kompjuterski generisanih multimedijalnih podata kada su irina
propusnog opsega i kapacitet memorije ogranieni ili skupi. Standard MPEG-2 nemenjen je za
visokokvalitetno kodovanje za sve digitalne multimedijalne prenose pri protocima od 2 Mbit/s do
50 Mbit/s. Prema ovom standardu moe se proizvesti potreban kvalitet video signala sve do kue
i to za vrlo zahtevne potrebe naunih primena i biznisa. Cilj i potencijal MPEG-4 standarda
analiziran je u kontekstu audio-vizuelnih multimedijalnih komunikacionih okruenja. Pokazano
je da ovaj standard prua alatke i algoritme za kodovanje kako prirodnog tako i sintetikog audia
i videa. Od ne manjeg znaaja je svakako predstavljanje audio/vizuelnih podataka na korisnikim
terminalima i to na jedan krajnje fleksibilan nain. Standard JPEG-2000 govori o stepenu
oteenja poruka, dok subjektivni kvalitet mirne slike treba da bude bolji od onog koji su u stanju
da proizvedu do tada postojei standardi. Cilj MPEG-7 procesa standardizacije je da olaka
pretraivanje multimedijalnih podataka. Standard MPEG-21 prua audio-vizuelnu prezentaciju u
okviru multimedijalnih poruka.
ITU-T proces standardizacije u multimedijalnim komunikacijama obuhvata pre svega
video i govorno kodovanje, multipleksiranje i sinhronizaciju (H.32x, H.26x, H.22x). ITU-T
preporuka H.261 optimizirana je u smislu primene za opremu koja se odnosi na interektivnu
audio-vizuelnu komunikaciju tj. Videofon. U skladu sa H.320 serijom preporuka koristi se za
protokole, multipleksiranje i kontrolu kod mrea tipa ISDN. to se tie H.263, to je prvi
meunarodni standard za video kompresiju koji omoguava video komunikaciju sa protokom
ispod 64 Kb/s. Kada je 1996 godine standard kompletiran, postalo je oigledno da ga treba
dograivati i poboljati: ITU-T preporuka H.263 Verzija 2 (H.263+) je prvi meunarodni
standard u oblasti video kodovanja koji je tako projektovan da podri celokupan opseg mree za
komutaciju kanala i komutaciju paketa. H.263+ sadri vie novih karakteristika u oblasti video
kodovanja u odnosu na H.263. To su poboljane efikasnosti kompresije, podrka skalabilnim

116

strimovima bita kao i razliitim video formatima, poboljan kvalitet video prenosa, itd.
Aktivnosti oko standarda H.26L sastojale su se u istraivanju naprednih kodnih tehnika koje se
razlikuju od onih iz preporuke H.263.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.

Zato se koriste algoritmi za video kodovanje?


Od ega zavisi pravilan izbor algoritama za video kodovanje?
Koja se ogranienja pojavljuju u postupku standardizacije mirnih slika i video
signala?
Kako se organizuju MPEG standardi?
Iz kojih se delova sastoji MPEG-1 standard?
ime se karakterie audio deo standarda MPEG-1?
ta karakterie audio deo standarda MPEG-1?
Nacrtati blok-emu arhitekture uproenog MPEG-1 video kodera.
Koji je cilj MPEG-2 video standarda?
Koje razlike uvodi MPEG-2 standard u odnosu na MPEG-1 standard?
Navesti tipove sistema strimova u standardu MPEG-2.
Iz kojih se delova sastoji MPEG-2 standard?
Kako izgleda i ime se karakterie video deo MPEG-2 standarda?
emu slui audio deo kod MPEG-2 standarda?
ime se karakterie MPEG-4 standard?
ta standard MPEG-4 nudi provajderima servisa, a ta korisnicima?
Iz kojih se delova sastoji MPEG-4 standard?
Po kojim karakteristikama se razlikuje MPEG-4 vizuelni kodni standard od prethodnog
standarda?
Na koji nain vizuelni deo MPEG-4 standarda obezbeuje funkcije kodovanja?
ta je to alat, a ta profil kod MPEG-4 standarda?
ta je to profil, a ta nivo na osnovu vizuelnog dela MPEG-4 standarda?
Koje vrste alata se koriste za kodovanje audija kod MPEG-4 standarda?
ime se karakteriu prirodni a ime sintetiki alati kod kodovanja audija za MPEG-4?
Gde se primenjuje standard H.264/AVC?
Koji su osnovni funkcionalni elementi standarda H.264/AVC?
Koja je uloga profila kod standarda H.264/AVC?
Na koliko slojeva se bazira mrena arhitektura kod H.264/AVC standarda? Koji su to
slojevi?
Koja je uloga mrenog apstraktnog sloja kod standarda H.264/AVC?
emu slui video kodni sloj kod standarda H.264/AVC?
Objasniti ulogu svih tipova iseaka kod H.264/AVC standarda.

117

31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.

Kako izgleda blok-ema kodera za prenos i rekonstrukciju podataka kod standarda


H.264/AVC?
Nacrtati blok-emu i objasniti princip rada dekodera kod standarada H.264/AVC.
Koja je uloga CABAC i CAVLC metoda kod H.264/AVC standarda?
U emu i gde se ogleda primena H.264/AVC standarda u industriji?
Koje su osnovne karakteristike i primene MPEG-4 VTC standarda?
ime se karakterie JPEG-LS standard?
ta je to pokretna mrena grafika PNE i emu slui?
Koje su osnovne karakteristike standarda JPEG-2000?
U emu se ogleda znaaj skalabilnog kodovanja mirnih slika?
Koji su najznaajniji tipovi skalabilnosti i koje su njihove karakteristike?
Kako se kod JPEG standarda moe poboljati prenos komprimovanih slika?
Kakve su mogunosti zatite intelektualne svojine kod JPEG-2000 standarda?
Nacrtati blok emu arhitekture kodera i dekodera za JPEG-2000 standard.
Koje su okolnosti uticale na pojavu MPEG-7 standarda?
Koji su osnovni tipovi alata kod standarda MPEG-7?
Iz kojih se delova sastoji MPEG-7 standard?
Navesti klase alata za multimedijalnu deskripciju kod standarda MPEG-7.
Koji su bili ciljevi u ranoj fazi razvoja MPEG-21 standarda?
U emu se ogleda osnovni koncept razvoja MPEG-21 standarda?
Koji su to elementi vezani za arhitekturu koji olakavaju transakcije izmeu korisnika
kod standarda MPEG-21?
ime se karakterie proces ITU-T standardizacije i zato su ove standardizacije
uvedene?
Koje su osnovne karakteristike standarda H.320?
ta je reilo uvoenje preporuka H.310 u multimedijalne komunikacije?
Zato je uvedena preporuka H. 321 u multimedijalne komunikacije?
ta je uticalo na pojavu standarda H.323?
Iz kojih se elemenata sastoji zona H.323 standarda?
Koje su prednosti i nedostaci sistema koji koriste H.324 standard?
Koje su osnovne karakteristike standarda H.261?
Gde se primenjuje standard H.261?
Kako se definiu blok, makroblok, i grupa blokova kod standarda H.261?
Iz kojih se elemenata sastoje blok-eme video kodera i video dekodera u standardu
H.261? Nacrtati odgovarajue blok-eme.
U emu se razlikuje standard H.263 od standarda H.261?
Koje novine unosi standard H.263+ (H.263 verzija 2) u odnosu na H.263?
ta se postie uvoenjem verzije standarda H.263++?
Koji su osnovni ciljevi standarda H.26L?

118

66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.

Od ega zavisi kvalitet govora koji proizvodi govorni koder?


ta su to referentni zahtevi kod standarda za govorne kodere?
Kako su formirani referentni zahtevi za bitski protok kod digitalnog simultanog
kodera za glas i podatke?
U emu se razlikuju standardi G.729 i G.723.1?
emu slui preporuka H.222.0?
ta predstavlja preporuka H.221?
ime se karakterie preporuka H.223?
Koji je zadatak preporuke H.225.0?
Koja je funkcija H.225.0, a koja H.225 terminala?
Iz kojih se odeljaka sastoji protokol za zajedniku kontrolu H.245?
Koje najvanije servise obezbeuje protokol H.245?
Zato se koristi polje identifikatora protokola kod H.245?

Literatura
[7.1]
[7.2]
[7.3]
[7.4]
[7.5]
[7.6]
[7.7]

[7.8]
[7.9]

[7.10]
[7.11]

I. E. G. Richardson, H.264 and MPEG-4 Video Compression. Video Coding for Nextgeneration Multimedia. Chichester, England, UK: John Wiley and Sons, 2003.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems: Techniques, Standards and Networks. Prentice Hall, 2002.
Coding of Moving Pictures and Associated Audio at up to About 1,5 Mbit/s, ISO/IEC
11172:1991.
Information Tehnology-Generic Coding of Moving Pictures and Associated Audio
Information: Systems, ISO/IEC 13818-1:1996.
A. Puri, Video coding using the MPEG-2 compression standard, Proc. SPIE Visual
Commun. Image Processing, pp. 1701-1713, Nov. 1993.
B. Heskell, A. Puri, and A. Netraveli, Digital Video: An Introduction to MPEG-2.
Chapman and Hall, 1997.
B. L. Tseng and D. Anastassiou, Multiviewpoint video coding with MPEG-2
compatibility, IEEE Trans. Circuits Syst. Video Technol., vol. 6, pp. 414419, Aug.
1996.
T. Homma, MPEG Contribution 95/N0861: Report of the Ad Hoc Group on MPEG-2
Applications for Multi-Viewpoint Pictures, Mar. 1995.
J. Ni, T. Yang, and D. H. K. Tsang, CBR transportation of VBR MPEG-2 video traffic
for video-on-demand in ATM Networks, in IEEE Int. Conf. Communications, Dallas,
TX, Jun. 1996, pp. 13911395.
M. Orzessek and P. Sommer, ATM and MPEG-2 Integration of Digital Video Into
Broadband Networks. Upper Saddle River, NJ: Prentice Hall, PTR, 1998.
D. Milovanovi, V. Jovanovi, and Z. Bojkovi, MPEG-2 sensitivity to date loss and
effects of different packet loss patterns, WSEAS Trans. on Commun., vol. 3, pp.777

119

[7.12]
[7.13]

[7.14]

[7.15]
[7.16]
[7.17]
[7.18]
[7.19]

[7.20]
[7.21]

[7.22]

[7.23]
[7.24]
[7.25]
[7.26]

[7.27]

[7.28]
[7.29]

782, Apr. 2004.


K. R. Rao and Z. S. Bojkovi, Packet Video Communications Over ATM Networks.
Prentice Hall, 2000.
Z. Bojkovi, Multimedia communication systems: Modeling, standardization,
requirements, in Proc. ICOMPT96 Int. Conf. Multimedia Technology and Digital
Telecommunication Services, Budapest, Hungary, Oct. 1996, pp. 513.
Z. Kruevac and Z. Bojkovi, SNR in MPEG video compression standard for optimum
bit allocation, in 7th IEEE Singapore Int. Conf. Communication Systems ICCS 2000,
Singapore, Nov. 2000.
Coding of Audio-Visual Objects, ISO/IEC 14496:1999.
F. Pereira, T. Ebrahimi, The MPEG-4 Book. Prentice Hall, 2002.
MPEG-4 Overview - (V.18-Singapore Version), ISO/IEC JTC1/SC29/WG11 N4030,
Mar. 2001.
F. Pereira, MPEG-4: why, what, how and when? Signal Process.: Image Commun.,
vol.15, pp.271279, Jan. 2000.
Z. S. Bojkovi and D. A. Milovanovi, Audiovisual integration in multimedia
communications based on MPEG-4 facial animation, Circuits Systems Signal
Processing, vol. 20, no. 3, pp. 311339, 2001.
Z. Bojkovi and B. Bakmaz, A Survey on MPEG-4 standard and digital television
deployment, WSEAS Transactions on Communications, vol. 9, pr. 3342, Jan. 2010.
Z. Bojkovi, MPEG-4 video standardization process, in Proc. ICOMPT 97, 2nd Int.
Conf. Multimedia Technology and Digital Telecommunication Services, Invited paper,
Budapest, Hungary, Oct. 1997, pp. 110.
S. G. Chao, Z. Bojkovi, D. Milovanovi, J. Lee, and J. J. Hwang, Image quality
evaluation: JPEG 2000 versus intra only H.264/AVC high profile, Facta Universitatis,
Nis, Series: Electronics and Energetics, vol.20, no.1, pp. 7181, Apr. 2007.
Information Technology-Coding of Audio-Visual Objects-Part2: Visual, ISO/IEC
14496-2, Amd 1: 2001.
Z. Bojkovi, Analysis of output signal-to-noise ratio in hybrid DCT/DPCM image
coding system, in Proc. EUSIPCO88, Grenoble, France, pp. 16611664.
Information technology-Coding of audio-visual objects-Part 2: Visual, ISO/IEC 144962:2001, Part 3: Audio, ISO/IEC 14496-3:2001.
J. Dimkovi, D. Milovanovi, and Z. Bojkovi, Fast software implementation of
MPEG advanced audio coder, in Proc. IEEE/EURASIP Int. Conf. DSP, Santorini,
Greece, 2002.
D. Milovanovi, J. Dimkovi, and Z. Bojkovi, MPEG-4 audio/video komunikacija:
Optimizacija implementacije i modeli licenciranja, X Telekomunikacioni Forum
TELFOR 2002, Zbornik radova, Beograd, str. 669-672.
P. K. Doenges at al., MPEG-4 audio/video and synthetic graphics/audio for mixed
media, Signal Process.: Image Commun., vol. 9, pp. 433463, May 1997.
S. R. Quackenbush, Coding of natural audio in MPEG-4, in Proc. IEEE Int. Conf.
Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 37973800.

120

[7.30]
[7.31]

[7.32]
[7.33]
[7.34]
[7.35]

[7.36]

[7.37]

[7.38]
[7.39]

[7.40]

[7.41]

[7.42]

[7.43]

[7.44]
[7.45]
[7.46]

E. D. Sheirer, The MPEG-4 structured audio standard, in Proc. IEEE Int. Conf.
Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 38013804.
E. D. Sheirer, Y. Lee, and J. W. Yang, Synthetic audio and SNHC audio in MPEG-4,
in Advances in Multimedia: Systems, Standards and Networks, A. Puri and T. Chen,
Eds. New York, NY: Marcel Dekker, 1999.
N. Jayant, J. Johnston, and R. Safranek, Signal compression based on models of human
perception, Proc. IEEE, vol. 81, pp. 13851422, Oct. 1993.
M. Bosi et al., ISO/IEC MPEG-2 advanced audio coding, J. Audio Eng. Soc., vol. 45,
pp. 789814, Oct. 1997.
E. D. Scheirer and B. L. Vercoe, SAOL: The MPEG-4 structured audio orchestra
language, Comput. Music J., vol. 23, pp. 3551, Feb. 1999.
B. L. Vercoe, W. G. Gardner, and E. D. Scheirer, Structured audio: The creation,
transmission, and rendering of parametric sound representations, Proc. IEEE, vol. 85,
pp. 922940, May 1998.
A. Puri, H. Chen, and A. Luthra, Video coding using H.264/MPEG-4 AVC
compression standard, Signal Process.: Image Commun., vol.19, no. 9, pp. 793846,
Oct. 2004.
Z. Bojkovi and Z. Milievi, Wireless multimedia networking standards: WLAN,
WPAN, WMAN, Seminar in Signal Procesing/Communications, Electrical
Engineering Faculty, University of Texas at Arlington, UTA, Texas, USA, Apr. 2006.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
T. Weigand, G. J. Sullivan, G. Bjontegaard, and A. Luhtra, Overview of the
H.264/AVC video coding standard, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 560576, Jul. 2003.
S. Kwon, A. Tamhankar, and K. R. Rao, Overview of H.264/MPEG-4 Part 10,
Journal of Visual Communication and Image Representation, vol. 17, no. 2, pp. 186
216, Apr. 2006.
J. Ribas-Corbera, P. A. Chou, and S. L. Regunathan, A generalized hypothetical
reference decoder for H.264/AVC, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 674687, Jul. 2003.
D. Marpe, H. Schwarz, and T. Wiegand, Contest-based adaptive binary arithmetic
coding in the H.264/AVC video compression standard, IEEE Trans. Circuits Syst.
Video Technol., vol. 13, pp. 620636, Jul. 2003.
D. Marpe, T. Wiegand, and G. J. Sullivan, The H.264/MPEG-4 advanced video coding
standard and its applications, IEEE Commun. Mag., vol. 44, no. 8, pp. 134144, Aug.
2006.
Z. Milievi and Z. Bojkovi, Kvalittet servisa u IP mreama, parametri i protokoli,
XLVII konferencija ETPAN, Zbornik radova, Sveska II, Herceg Novi, 813 juni 2003.
S. Wenger, H.264/AVC over IP, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 645656, Jul. 2003.
K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages,
Applications. New York, NY: Academic Press, 1990.

121

[7.47]
[7.48]

[7.49]
[7.50]
[7.51]
[7.52]

[7.53]

[7.54]
[7.55]
[7.56]
[7.57]
[7.58]
[7.59]
[7.60]

[7.61]
[7.62]
[7.63]
[7.64]
[7.65]

W. B. Pennebaker and J. L. Mitchell, JPEG:Still Image Data Compression Standard.


New York, NY: Van Nostrand Reinhold, 1993.
D. Santa Cruz and T. Ebrahimi, An analytical study of JPEG 2000 functionalities, in
Proc. IEEE Int. Conf. Image Processing ICIP, vol. 2, Vancouver, Canada, Sept. 2000,
pp. 4952.
D. Nister and C. Christopoulos, Lossless region of interest with embedded wavelet
image coding, Signal Process., vol. 78, pp. 117, Jan. 1999.
Multimedia Content Description Interface, ISO/IEC 15938:2002.
F. Pereira and R. Koenen, MPEG: Context, goals and working methodologies,in The
MPEG-21 Book, I. S. Burnett et al., Eds. John Wiley and Sons, 2006, pp. 130.
Z. Bojkovi and B. Bakmaz, MPEG-21 standardization process: Organization and rate
distortion modeling for network adaptation, in Latest Trends on Communications, N.
Mastorakis, V. Mladenov, and Z. Bojkovi, Eds. 14th WSEAS Int. Conf.
Communications, Corfu, Greece, Jul. 2010, pp. 103108.
L. Chiariglione, K. Hill, and R. Koenen, Introduction to MPEG-21, in Open
workshop on MPEG-21-Multimedia Framework, in Doc. ISO/MPEG M5707, MPEG
Noordwijkerhout Meeting, The Netherlands, Mar. 2000.
Information Technology-Multimedia Framework (MPEG-21)-Part1: Vision,
Technologies and Strategy, ISO/IEC TR 21000-1:2004.
Information and documentation-International Standard Book Number (ISBN), ISO
2108: 2005.
Information and Documentation-International Standard Recording Code (ISRC), ISO
3901:2005.
Information and Documentation-International Standard Musical Work Code (ISWC),
ISO 15707:2001.
MPEG Multimedia Description Schemes (MDS). FCD MPEG-21 IPMP Components,
ISO/MPEG N7196, 72nd MPEG Meeting, Busan, Korea, Apr. 2005.
Information Technology-Multimedia Framework (MPEG-21)-Part 7: Digital Item
Adaptation, ISO/IEC TR 21000-7:2004.
K. Asatani and S. Nogami, Trends in the standardization of telecommunications on
GII, multimedia and other network technologies and services, IEEE Commun. Mag.,
vol. 34, pp. 3244, Jun. 1996.
M. H. Willebeek-LeMair and Z. Y. Shae, Videoconferencing over packet-based
networks, IEEE J. Sel. Areas Commun., vol.15, pp. 11011114, Aug. 1997.
Adaptation of H.320 Visual Telephone Terminals to B-ISDN Environments, ITU-T
Recommendation H.321 (03/1996).
Broadband Audiovisual Communication Systems and Terminals, ITU-T
Recommendation H.310 (11/1995).
Control Protocol for Multimedia Communication, ITU-T Recommendation H.245
(03/1996).
Procedures for the Simultaneous Transmission of Data and Digitally Encoded Voice
Signals Over the General Switched Telephone Network (GSTN), or Over 2-Wire Leased
Point-to-Point Telephone Type Circuits, ITU-T Recommendation V.70 (08/1996).
122

[7.66]
[7.67]
[7.68]
[7.69]
[7.70]
[7.71]

[7.72]
[7.73]
[7.74]

[7.75]
[7.76]
[7.77]
[7.78]
[7.79]
[7.80]
[7.81]

Terminal for Low Bitrate Multimedia Communication, ITU-T Recommendation H.324


(03/1996).
S. Wenger et al., Error resilience support in H.263+, IEEE Trans. Circuits Syst. Video
Technol., vol. 8, pp. 867877, Nov. 1998.
Video Codec for Audiovisual Services at p x 64 kbit/s, ITU-T Recommendation H.261
(03/93).
A. N. Netravali and J. D. Robbins, Motion-compensated television coding: Part I, Bell
Syst. Tech. J., vol. 58, pp. 629668, Mar. 1979.
H.263+ Video Coding for Low Bitrate Communication, Draft ITU-T Recommendation
H.263 Version 2, Sept. 1997.
T. Chen, C. T. Swain, and B. G. Haskell, Coding of subregions for content-based
scalable video, IEEE Trans. Circuits Syst. Video Technol., vol. 7, pp. 256260, Feb.
1997.
ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F09,
Report of the Ad Hoc Committee H.263++ Development, Seoul, Korea, Nov. 1998.
ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D62,
Recommended Simulation Conditions for H.263 v3, Tampere, Finland, Apr. 1998.
ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D65,
Video Codec Test Model, Near-Term, Version 10 (TMN10), Draft 1, Tampere, Finland,
Apr. 1998.
ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F10,
Report of the Ad Hoc Committee H.26L development, Seoul, Korea, Nov. 1998.
ITU-T, Study Group 16, Video Coding Experts Group (Question 15), Doc. Q15D62,
call for proposals for H.26L Video coding, Geneva, Switzerland, Jan. 1998.
R. V. Cox and P. Kroon, Low bit-rate speech coders for multimedia communications,
IEEE Commun. Mag., vol. 34, pp. 3441, Dec. 1996.
Mulimedia Multiplex and Synchronization for Audiovisual Communication in ATM
Environment, ITU-T Recommendation H.222.1 (03/96).
Frame Structure for a 64 to1920 kbit/s Channel in Audiovisual Teleservices, ITU-T
Recommendation H.221 (07/97).
Multiplexing Protocol for Low Bit Rate Multimedia Communication, ITU-T
Recommendation H.223 (03/1996).
Information Technology-Abstract Syntax Notation One (ASN.1)-Specification of Basic
Notation, ITU-T Recommendation X.680 (07/1994).

123

8. APLIKATIVNI ASPEKT MULTIMEDIJA


Aplikativni aspekt multimedija obuhvata praktina znanja, postupke i resurse koji se
koriste u procesu multimedijalnog stvaralatva.
Multimedijalnim stvaralatvom, u najirem smislu, mogu se oznaiti sve kreacije
stvorene za vieulnu percepciju oveka. Koreni multimedija mogu se traiti ve u ranoj fazi
razvoja ljudskih zajednica sa pojavom prvih oblika ulnih komunikacija. Prvobitne meuljudske
komunikacije, kao i komunikacije izmeu ivotinja, audio-vizuelne su, to znai da su se
zasnivale na percepciji zvuka i slike.
Slika koja deluje na ulo vida predstavlja ulazni signal za video percepciju.
Zvuk koji deluje na ulo sluha predstavlja ulazni signal za ujnu percepciju.
U razvoju komunikacija izmeu ljudi, kao i izmeu ljudi i ivotinja, zvuk je imao
znaajniju ulogu od slike. Komunikacija pomou zvuka moe se ostvariti u odsustvu svetlosti,
kada nema slike, to je za evolucioni opstanak vrsta izuzetno znaajno. Za oveka, zvuk je
znaajan, jer je modulisanjem i kodovanjem zvunih signala formiran govorni jezik za
sporazumevanje. Govor oveka uzdie na vii oblik komunikacija u odnosu na ivotinjski.
Logika i proces miljenja zasnovani su na reima i jeziku. Razvojem govornog jezika razvija se
proces ljudskog miljenja. Govor i govorna komunikacija opstaju kao dominantan oblik
komunikacije. Tokom razvoja civilizacije razvijali su se, pored govornih, i drugi oblici
komunikacije meu ljudima. Govor i u najrazvijenim dravama, kao i u nerazvijenim drutvenim
zajednicama i nepismenom delu stanovnitva, ostaje najznaajniji nain komunikacije.
Pojava pisma doprinela je ubrzanom razvoju ljudske civilizacije. Pismom se memorie
govorni jezik. Razvoj pisanog jezika omoguio je da se steeno znanje generacijski uva,
dopunjuje i integrie. Pismo predstavlja simbolian prikaz govornog jezika. Elementi govornog
jezika glasovi fonemi, rei i reenice, koduju se pomou vidljivih simbola zapisanih na vrstoj
podlozi. Predstavljanje govornog jezika pomou pisma, ostvareno pre vie milenijuma,
ekonomian je nain izraavanja veoma pogodan za memorisanje, obradu i prenos pomou
savremenih informaciono-komunikacionih ureaja i sistema.
Due od jednog veka govorni jezik memorie se i reprodukuje u prirodnom obliku, to
predstavlja izvanrednu pogodnost za nepismene i konfor za pismene. Iako je za generacijski
prenos znanja pisani jezik teorijski prestao da bude jedina mogunost, ne sagledava se kraj
korienja pisma. Savremeno pismo ima viestruku informacionu i dizajnersku funkciju.
Poslednje ubrzavanje civilizacijskog razvoja ostvaruje se razvojem programiranja i
primenom programabilnih sistema. Programiranjem se reguliu procesi, upravlja dogaajima u
sadanjem i buduem trenutku. U sofisticirane ureaje ugrauje se sve vie znanja i na taj nain

124

im se preputa voenje sloenih procesa koji su ranije zavisili od oveka. Razvojem


programiranja ostvarena je mogunost interakcije oveka i maina.
Razvoj sofisticiranih informaciono-komunikacionih uraaja i sistema omoguio je da se
integriu slika, zvuk i tekst to je oznaeno kao multimedija. Multimedija, o kojoj su posveena
prethodna poglavlja ove knjige, ukljuuje sva pomenuta saznajna dostignua koja se odnose na
zapisivanje, obradu, i prikazivanje audio-vizuelnih sadraja.
Sa multimedijom se uvodi pojam virtuelnog sveta i virtuelne stvarnosti. Formiran je,
takoe, pojam fizika realnost i virtuelna realnost.
Virtuelnost je pojam kojim se oznaava neto to nije a prikazuje se kao da jeste. Primer
za virtuelnost su ceremonijali koji prikazuje englesku kraljicu kao da ima apsolutnu vlast, iako
ona nema stvarnu vlast. U demokratskim monarhijama, za vlast kraljeva kae se da je
protokolarna, odnosno virtuelna. Protokoli posebne vrste koriste se i u multimedijalnim
sistemima na kojima se prikazuje virtuelna stvarnost.
Pomou multimedijalnih tehnologija umetnici kreiraju nove imaginarne svetove,
pokuavajui da to vie budu originalni, razliiti od poznatog realnog sveta. Da bi se imaginarni
svetovi predstavili oveku, dizajniraju se prema mogunostima ulne percepcije. To znai da se
u prezentaciju imaginarnog sveta ugrauju zakonitosti fizikog sveta, jer su ula na njih
adaptirana. Imaginarni svetovi na taj nain postaju virtuelni. Virtuelni svet kreira se pomou
signala slike i zvuka, a u novije vreme ukljuuju se i ureaji za generisanje signala mirisa.
Najvei stepen virtualizacije ostvaruje se u multimedijalnim prezentacijama u koje je
uprogramirana mogunost interakcije sa korisnikom.
Virtuelna, kao i realna stvarnost prezentira se oveijim ulima u prostorno-vremenskim
koordinatama. U prostoru i vremenu ispoljava se sve ono to sadri fiziki svet. Virtuelni svet i
virtuelna realnost, koji se kreira pomou multimedijalnih tehnologija, kao i fiziki svet i fizika
realnost, takoe se neizbeno prikazuju u prostoru i vremenu.
Prostor i vreme su fizike veliine koje imaju presudnu ulogu u svim fazama realizacije
multimedijalnog projekta.
Angaovani multimedijalni resursi definiu se na osnovu prostornih i vremenskih
parametara informacionih sadraja multimedijalnog proizvoda.
Prostorni domen informacionih sadraja odreuje potrebnu veliinu, odnosno kapacitet
memorijskih resursa.
Vremenski domen informacionih sadraja odreuje zahtevanu propusnu mo, odnosno
kapacitet prenosnih resursa komunikacionog sistema.
Alati za multimedijalnu produkciju kojima se obrauju informacioni sadraji u
prostornom i vremenskom domenu isprogramirani su na osnovama analitike geometrije i
Fourier-ovih transformacija. Prostorne i vremenske koordinate signala meusobno se povezuju i
transformiu u cilju obrade i prenosa vizuelnih sadraja. Tako se prenos 2D slike kroz 1D kanal
ostvaruje zahvaljujui prostorno-vremenskoj transformaciji. Slika, kao 2D raspodela svetlosti,
tretira se kao skup piksela koji se mogu sukcesivno preneti kroz 1D kanal i na odreditu
rasporediti u 2D prostor na osnovu vremenskog redosleda pristizanja.

125

8.1 Aplikativni aspekt osnovnih


informaciono-komunikacionih pojmova
U ovom poglavlju multimedija se razmatra sa aplikativnog aspekta. itaoce koje
multimedija interesuje samo sa aplikativnog aspekta korisno je podsetiti na pojednostavljene
definicije osnovnih pojmova u oblasti multimedija.
Medij, re starogrkog porekla koristi se da oznai sredinu, prostor, ili sredstvo za
prenos, memorisanje i prezentaciju informacija.
Multimedija, to bukvalno znai mnogo sredina, sadri pojmovnu suvinost jer je medija
mnoina od medij, a poinje da se koristi sedamdesetih godina prolog veka u razliitim
kontekstima da bi se devedesetih godina preciznije definisala.
Multimedija, prema standardu ISO/IEC JTC1 SC29/WG12, kako je ve navedeno na
poetku ove knjige, predstavlja sposobnost postupanja sa razliitim vidovima prezentacionih
medija koji ine tip podataka sa zadatkom da definiu prirodu informacije u njenom kodiranom
formatu.
Navedena definicija najkompetentnijih asocijacija za multimediju je uoptena i strogo
egzaktna. Iako se sa naunog aspekta ne moe dati primedba, data definicija je, zbog
apstraktnosti, suvie neprikladna za iru upotrebu.
Za praktiare zadovoljavajue je koristiti jednostavniju definiciju.
Multimedija, sa aplikativnog aspekta, predstavlja informaciono-komunikacioni proizvod
raunarskih tehnologija koji pomou integrisanih hardverskih i softverskih ureaja prikazuju
pojave za ulo vida, sluha, i dodira, u novije vreme i za ulo mirisa. Multimedijalni proizvod
predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa, u novije vreme i mirisa.
Multimedija pojmovno obuhvata razliite medije, informacione sadraje, i interaktivnost.
Interaktivna multimedija podrazumeva postojanje interakcije sa korisnikom. Savremeni
multimedijalni proizvodi su, po pravilu, interaktivni, pa se pod pojmom multimedija
interaktivnost ve podrazumeva, i pridev interaktivna izostavlja.
Hipermedija je interaktivna multimedija sa linkovima za navoenje korisnika.
U savremenom drutvu miltimedija postaje nova pismenost i opti nain izraavanja.
Multimedija se koristi u marketingu, obrazovanju, zabavi, medicini i poslovanju. Skoro
da nema delatnosti gde multimedija ne nalazi primenu.
Proces realizacije multimedijalnih proizvoda definiu: namena, sadraj, raspoloive
tehnologije i korieni mediji.
Namena multimedijalnog proizvoda definisana je funkcijom koju proizvod treba da
ostvari da bi se ulaganja u njegovu realizaciju isplatila.
Sadraj se odreuje prema nameni, i prema raspoloivim tehnologijama i korienim
medijima. Koje e se raspoloive tehnologije i mediji koristiti zavisi od namene proizvoda i
izdvojenog budeta.
Prema funkciji, mediji se klasifikuju na: memorijske, prenosne i prezentacione.
Memorijski medij je fiziko sredstvo za skladitenje informacija, kao to su:
poluprovodnike, magnetne i optike memorije.
Osnovni parametri koji karakteriu memorijske medije su: kapacitet memorije, vreme
pristupa i fiziki gabariti.
Prenosni medij je sredina ili sredstvo za prenos signala kao to su: bakarni provodnici,
staklena vlakna i slobodan prostor.

126

Osnovni parametri kojim se karakteriu prenosni mediji su: poduno slabljenje i prenosni
kapacitet.
Prezentacioni medij je fiziko sredstvo ili ureaj pomou koga se informacije
predstavljaju korisniku, kao to su ureaji sa ekranima za prikazivanje slike i ureaji sa
zvunicima za generisanje zvuka.
Medij za prikazivanje slike karakteriu parametri za rezoluciju, kontrast i osvetljaj slike.
Medij za generisanje zvuka karakterie dinamiki i frekvencijski opseg audio pojaavaa
i zvunika.
Kroz medij cirkulie energija, materija i informacija. Komunikacije se zasnivaju na
razmeni informacija. U informaciono-komunikacionim tehnologijama, od interesa je
informacioni aspekt korienja medija.
Osnovni informaciono-komunikacioni pojmovi su: informacija, poruka, podatak,
komunikacija, signal i kodovanje.
Informacija predstavlja skup poruka.
Poruka predstvalja skup podataka.
Podatak predstavlja karakteristiku elementa, sistema, ili procesa.
Komunikacija predstavlja proces prenoenja informacija.
Prenoenje informacija se ostvaruje pomou signala.
Signal je materijalizovani nosilac informacija.
Po obliku razlikuju se analogni i digitalni signali.
Analogni signali nastaju kao neposredan odraz procesa koji generiu fiziki fenomeni i
na prijemu donose informacije u istom obliku kako ih fiziki fenomeni, iji su odraz, generiu.
Primeri analognih signala su zvuni i svetlosni talasi, odnosno zvuci koje sluamo i slike koje
gledamo. oveija ula predstavljaju prijemnike za analogne signale slike, zvuka, dodira, mirisa
i ukusa.
Digitalni signali nastaju u procesu kodovanja i prenose informacije pomou simbola
odreenog kodnog sistema.
Kodovanje je postupak simbolinog ifrovanog predstavljanja informacija pomou
elemenata odreenog brojnog sistema ili azbuke odreenog jezika.
Za memorisanje, obradu, prenos i korienje digitalnih signala koriste se sofisticirani
ureaji i sistemi.
Signali se karakteriu dinamikim, frekvencijskim i vremenskim domenom.
Dinamiki domen signala koristi se za predstavljanje snage, odnosno intenziteta signala.
Za obradu i prenos signala znaajan je raspon ili odnos maksimalnog i minimalnog intenziteta
signala to se oznaava kao dinamika signala. Od dinamike signala zavisi sa koliko bita,
osnovnih informacionih jedinica, analogni signal se koduje i prevodi u digitalni oblik.
Frekvencijski domen koristi se za predstavljanje brzine promena signala. Za obradu,
memorisanje i prenos signala znaajna je maksimalna brzina promene, odnosno maksimalna
uestanost frekvencija signala. Poveanjem maksimalne uestanosti rastu i zahtevi u pogledu
potrebnih resursa za obradu, memorisanje, i prenos signala.
Vremenski domen koristi se za predstavljanje brzine promena, trajanja pojedinih
intervala, i ukupno trajanje signala. Brzine promena povezane su sa spektrom signala, odnosno
frekvencijskim domenom. Trajanja pojedinih intervala i ukupno trajanje signala odreuje
zauzetost procesorskih, memorijskih i prenosnih resursa.

127

Pomou multimedijalnih tehnologija obrauju se pojedinano i/ili objedinjuju podaci koji


se odnose na tekst, zvuk i sliku. Od podataka se formiraju signali za potrebe memorisanja,
prenoenja ili prikazivanja multimedijalnih informacija.
Signali sa tekstualnim, zvunim i slikovnim sadrajima razlikuju se po koliini
informacija, odnosno brzini prenoenja.
Najmanje memorije zauzimaju i najbre se prenose signali sa tekstualnim sadrajem.
Najvie memorije zauzimaju i najsporije se prenose video signali, odnosno signali koji
nose informacije o pokretnim slikama.
Signali zvuka predstavljaju talasni prenos oscilacija kroz materijalnu sredinu i imaju u
osnovnom opsegu spektar irine 20 kHz i dinamiki opseg od preko 100 dB. Kod prevoenja
zvunog signala u elektronski analogni ekvivalent koji se zovu audio signali potrebni su veliki
kapaciteti memorija i prenosnih kanala. Za prevoenje analognih u digitalne signale potrebno je
jo vie kapaciteta.
Signali pokretnih slika, odnosno njihovi elektrini ekvivalenti koji se najee nazivaju
video signali, imaju u osnovnom opsegu spektar irine od 5 MHz i dinamiki opseg od 50 dB,
zbog ega je i za njih, kod prevoenja u digitalni oblik, potrebna velika memorija i velike brzine
prenosa.
Za ekonomino memorisanje i prenos audio i video signala razvijeni su postupci
kompresije pomou kojih se smanjuje koliina podataka koja reprezentuje signale. Prenos i
memorisanje digitalnih audio i video signala bez kompresije bili bi izuzetno zahtevni i mnoge
komunikacije praktino neostvarljive. Procesom kompresije omoguava se memorisanje i prenos
digitalnih audio i video signala sa viestruko manjim memorijskim i prenosnim resursima.
Postupci kompresije su dugo godina razvijani i usavravani da bi se na kraju optimalne varijante
kompresije usvojile u formi standarda. Usvojeni su standardi za kompresiju mirne slike,
kompresiju audio signala i za kompresiju video signala.
Kompresioni postupci mogu biti reverzibilni bez gubitaka, i nereverzibilni sa
gubicima.
Za prezentaciju kod krajnjeg korisnika neophodno je postupcima dekompresije vratiti
signal u prirodni oblik. Dekompresovani signal, zavisno od toga da li je kompresija reverzibilna
ili nereverzibilna, moe biti potpuno veran originalu, ili unekoliko degradiran zbog gubitka
odreenog procenta informacionog sadraja.
Multimedijalni sistem predstavlja skup ureaja i programa za integrisanu obradu i
upravljanje nezavisnim diskretnim i kontinualnim medijima u cilju prilagoavanja realnih
pobudastimulusa oveijem ulnom sistemu za zadovoljenje odgovarajue percepcije.
Multimedijalni sistemi obrauju nezavisne medije i kada su oni funkcionalno povezani, na
primer snimak lica govornika i njegovog govora. Ako je zbog sinhronizacije i prepoznavanja
govora potrebno da se povee izgovor sa pokretima usana, onda se koriste multimodalni sistemi.
Multimodalnost predstavlja povezanost meusobno zavisnih kanala modalities za
ulnu percepciju, kao to je zavisnost govora od pokretanja usana i izraza lica.
Multimodalni sistem predstavlja skup ureaja i programa za integrisanu obradu i
upravljanje meusobno zavisnih medija odnosno meusobno zavisnih komunikacionih kanala.
Govor je povezan sa pokretanjem usana i izrazima lica, pa se preko ula vida dopunjava doivljaj
koji dolazi od ula sluha.

128

8.2 Osnovne multimedijalne delatnosti


Multimedijalna delatnost je multidisciplinarna i obuhvata razne tehniko-tehnoloke,
ekonomske, socioloke i umetnike specijalnosti.
Stvaranje multimedijalnog dela, zavisno od njegove kompleksnosti, zahteva angaovanje
razliitog broja i profila strunjaka. Kreiranje multimedijalnog proizvoda moe da bude
nemetodino ili proceduralno strukturirano. Primer nemetodinog stvaranja su pojedinani
proizvodi koji nisu dobro definisani.
Za realizaciju kompleksnih projekata ukljuuju se timovi strunjaka, dok odreeni
jednostavni proizvod moe da kreira samo jedan izvrilac. Projekti zatevaju procedure i
metodoloku strukturalizaciju.
Za poetak rada treba da postoje odreeni zahtevi kojima se specificiraju zahtevi
investitora. Ti zahtevi predstavljaju projektni zadatak za realizaciju multimedijalnog proizvoda.
Projektni zadatak predstavlja dokument kojim se izraavaju:

Potrebe,
Sadraj,
Propisi,
Specifikacija naruioca klijenata,
Proizvodnja ili izbor multimedijalnih komponenti teksta, slike/ grafike, audio i
video/animacije koji e najbolje preneti poruku,
Navigacija koja odreuje eljeni nain prezentacije multimedijalnog proizvoda,
Tehnoloka ogranienja: potrebe zahtevi za materijal, softver, hardver, trokovi i vreme
stvaranja, su ograniavajui inioci stvaranja multimedijalne aplikacije koje je potrebno
uzeti u obzir u procesu stvaranja,
Kontrola ispravnog funkcionisanja multimedijalnog proizvoda,
Trite,
Medij za isporuku, nain distribuiranja,
Transport, reklamiranje i odravanje podrka multimedijalnog proizvoda,

Karakteristine su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija,


produkcija i postprodukcija.
Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta koju karakteriu
sledee aktivnosti:

Razrauju se zahtevi naruioca, definiu ciljevi, analizira interesna grupa, postavljaju


zadaci;
Definie se anr: dokumentarni, obrazovni ili instruktivni, narativni, animacija,
interaktivni, umetniki ili ekspresivni;
Definie se vrsta medija: letak, bilbord, novine, televizija, internet;
Definie se sadrina proizvoda;
Analiziraju se iskustva drugih i postojea reenja;
Sastavlja se detaljan pregledan plan, najee u vidu ilustrovane prie koja je, zbog
veanja na tablu, nazvana storibord.

129

Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se


neposredno formira sadraj koji e se ugraivati u proizvod. Zavisno od kompleksnosti
proizvoda koristi se raunar, kamera, glumci, kostimi, studija i scenografija.
Multimedijalna postprodukcija predstavlja zavrnu fazu realizacije projekta u kojoj se
formira konana verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija
se svodi na urednitvo, editovanje (eng. editing). Kad se radi sa zvukom i pokretnim slikama, to
je montaa.

8.2.1 Multimedijalna preprodukcija


Multimedijalna preprodukcija predstavlja prvu fazu multimedijalnog projekta u kojoj se
prikupljaju i razrauju zahtevi naruioca/klijenta, definiu ciljevi, analiziraju korisnike
specifikacije i pravi se projektni plan.
Redosled aktivnosti i metod planiranja zavise od vrste proizvoda. Razliite tehnologije i
vidovi multimedijalne proizvodnje: video, grafika i/ili animacija opredeljuju postupke koji e se
primenjivati u fazi preprodukcije.
PRETHODNA ANALIZA U PREPRODUKCIJI
Prethodna analiza predstavlja prvu aktivnost u realizaciji svakog projekta i sastoji se od
razrade ideje i sagledavanja postojeih reenja iz predmetne oblasti.
U razvoju multimedijalnog projekta cilj je da se ideja o planiranom projektu identifikuje i
vizualizuje.
Identifikacija ideje podrazumeva istraivanje, inkubaciju spori razvoj bez uticaja
spoljanjih, opaljivih znakova i generisanje ideje.
Jedna od tehnika generisanja ideje je brejnstorming (eng. brainstorming modana oluja,
stvaralaki ar) spontano grupno razmatranje da bi se proizvele ideje i reenja za problem.
Brejnstorming predstavlja intenzivnu mentalnu aktivnost razrade i vizualizacije ideja. Na
poetku je dobro da se razmotri to vie ideja, brojnost ide ispred kvaliteta, loe ideje nekada
navedu na dobre ideje.
Da bi se uspeno kompletirala veina produkcija sa ostvarenom svrhom multimedijalnog
proizvoda za koju je namenjen, definiu se zadaci Brejnsorming koraci. Razlikuje se est
Brejnsorming koraka [8.1]:

a) Analiza projektnog zadatka


Analiza projektnog zadatka predstavlja temeljno istraivanje zadate teme koja najee
nije zadata u strogo definisanom obliku. Razmatraju se mogui problemi i potencijalna
reenja: video, audio, tekst.
b) Analiza ciljne publike
Analiza ciljne publike moe biti demografska i psihografska.

130

Demografska analiza strukture ljudske populacije koristi statistiku koja se odnosi na


godinu roenja, smrti, ekonomski nivo, bolesti, geografske koncentracije ili znanja
proizvoda.
Psihografskom analizom se vri klasifikacija populacije prema njihovim osobinama, kao
to su nain ivota, primarni interesi, verovanja.
Na dizajn poruke utiu faktori kao to su: publika kojoj je namenjena, medijum, svrha i
priroda poruke. Kada se planira za multimedijalnu produkciju, vano je definisati gde e
se distribuirati zaveni projekat, definisati krajnjeg korisnika ciljnu publiku, to
odreuje kako e sadraj biti prezentovan.

c) Definisanje cilja
Definisanje cilja koji se eli postii multimedijalnim projektom slui kao odrednica
multimedijalnoj produkciji. Kada se postavljaju ciljevi projekta, treba da budu jasno
definisani, hijerarhijski ureeni i kvantitativno formulisani. Brojne vrednosti za
prikazivanje poruke omoguavaju da se kasnijim prikupljanjem podataka moe ustanoviti
da li je konaan proizvod uspean. Ciljevi treba da budu realno dostini, to znai da se
uzimaju u obzir realne mogunosti, isplativost i trokovi proizvodnje.
d) Osnovno istraivanje
Osnovno istraivanje obuhvata prouavanje teme i tehnologije na kojoj se radi. Kreator
multimedijalnog proizvoda istraivanjem izgrauje subjektivno znanje o predmetnoj
materiji. Istraivanje moe ukljuiti susret sa ekspertima, itanje publikacije, istraivanje
na internetu, ili pogledati kako su drugi profesionalci reili sline probleme.
Proces generisanja ideje Brainstorming za stvaranje multimedijalnog proizvoda
ukljuuje i razmiljanje:
1) O emocijama kakva oseanja su povezana sa projektom na kom se radi, kojim
se vizuelnim sredstvima i sumbolima mogu izraziti;
2) O analogijama kakvim oblicima i bojama se mogu izraziti odreene emocije, ili
toplota na primer; analogije pomau da se ode dalje od originalnih rei i osmisle
konkretni vizuelni elementi za projekat;
3) O suprotnostima; ideje treba svesti na jednu, onu koja najbolje moe izraziti
ciljeve.
e) Razmatranje sadraja
Posle definisanja ideje razmatra se prototip/skica sadraja. U multimedijalnom dizajnu
prototip se moe izraditi kao: serija skica, storyboard, Powerpoint slide show, Flash
prezentacija, video koji simulira korienje sistema, kartonska simulacija, serija veb
stranica.
Skica sadraja je narativni opis sadraja multimedijalnog proizvoda, konfiguracija
istorije/prie ili poruke koja treba da se prenese korisnicima, koristei odgovarajuu
usmenu ili pismenu tehniku. Istraivane informacije se prikazuju odreenim redosledom.
Dizajnirane su da obezbede usredsreivanje na ideju ili subjekat videa.
Razvijanje teme multimedijalnog projekta ukljuuje:
1) Identifikaciju stila multimedijalnog proizvoda,

131

2) Razmatranja dizajna screen layout ukljuujui: ravnoteu (eng. balance),


jedinstvo (eng. unity), boju (eng. color).
3) Skiciranje na papiru screen layout, raspored osnovnih elemenata.
4) Definisanje interfejs dizajna.
Korisniki interfejs je medijum preko koga korisnik vri interakciju sa multimedijalnim
proizvodom, koji ukljuuje navigaciju od strane korisnika u jednoj aplikaciji i
reakciju/odziv aplikacije na aktivnost, kao to je klik na button ili hiperlink.
U toku formiranja konture sadraja utvruje se koja e informacija biti ukljuena u
multimedijalni proizvod. Informacija treba da bude saeta i organizovana kolekcija
istraivanja koja podrava izabrani cilj. Veina produkcijskih tekstova u audio/video
proizvodnji pisana je na stranici koja je podeljena na dve kolone. U levoj koloni je opis
video scene, a u desnoj odgovarajui audio. Selekcija rei, zvuka i slike utie na
postizanje zahtevanog cilja.
f) Okvirni nacrt scope dokument
Skoup dokument treba da specifikuje sledee:
1)
2)
3)
4)

Metode na osnovu kojih e korisnik ostvariti multimedijalnu interakciju,


Izvoake kriterijume projekta, kao to su vreme obrade i raspoloivo vreme,
Osobine projekta kao to su modularnost (norma, standard) i bezbednost,
Ogranienja u mogunostima za kreiranje multimedijalnog proizvoda, kao to su
korienje specifinog softvera ili metodologije.

Svrha skoup dokumenta je da produkcioni tim precizno shvati postavljene produkcione


zahteve i da ga koristi za proizvodnju i kontrolu realizacije multimedijalnog projekta.
PRIA NA TABLI - STORYBOARD
Storibord predstavlja oigledan, saet i strukturiran prednacrt sadraja multimedijalnog
proizvoda.
Za video produkciju, storibord je vizuelna, grafika, reprezentacija svake specifine
sekvence u videu. Storibording (eng. storyboarding) je proces stvaranja niza skica oblika strip
knjige kojima su prikazani kljuni spotovi, eljeni okviri frejming (eng. framing) u videu i
glavni objekti kao i akcije za svaki snimak, sa detaljnim opisom raznih poruka, razgovora, slika.
Storibord se koristi kao vodi za snimanje ili animaciju. Njime se odreuje broj i tip
snimka za svaki video ili audio proces, kao i specijalni efekti i tranzicije cue. On pomae
razvojnom timu da proceni logiki tok sekvence koja se koristi u videu, obezbedi miran, blag
(eng. smooth) pokret i odredi digitalni audio i video sadraj koji je potrebno da se snimi i edituje.
U multimedijalnim aplikacijama storibord reprezentuje izgled i linkove svakog ekrana
multimedijalnog projekta. Osnovna funkcija storiborda je povezivanje sadraja i poruke, tako da
bude olakan razvoj multimedijalnog proizvoda sa softverskim alatima. Jedna stranica storiborda
opisuje sliku multimedijalnog proizvoda u jednom odreenom vremenskom trenutku.
Storibord sadri glavnu poruku koja se eli preneti korisniku i precizan sadraj
multimedijalnog proizvoda sa jasnim uputstvom za oblikovanje sadraja, to znai sledee:

132

Identifikaciju sadraja koji treba da ima specijalnu dozvolu ili copyright izdanje,
Ukupan broj stranica layout-a,
Neophodne detalje za navigaciju,
Definisanje odreenih oblika interaktivnosti,
Informacije u vezi sa projektantima (dizajniranje) multimedijalnog proizvoda,
Komentare i druge korisne informacije za programere koji e da preuzmu kreiranje
multimedijalnog proizvoda.

Za snimanje videa definie se lokacija, postavljanje svetla i poloaja kamera. Posebno se


analiziraju potencijalni problemi kako za snimanje slike tako i za snimanje zvuka. Odreuje se
mesto gde e biti postavljene kamere, veliina frejma i kretanje glumca u kadru.
PROCENA TROKOVA

Procena trokova je jedan od kljunih elemenata za uspenu realizaciju multimedijalnog


projekta. Radi se na osnovu procene trokova za rad i materijalnih trokova. Trokovi za rad
odreuju se na osnovu cene uea angaovane ekipe, a materijalni trokova na osnovu cene
koriene opreme za produkciju, postprodukciju i distribuciju multimedijalnog proizvoda. Cena
za rad rauna se na osnovu cene norma asa svakog angaovanog pojedinca u projektnom timu i
vremena angaovanja svakog izvrioca.
Za organizovanje resursa za multimedijalnu produkciju, distribuciju i prezentaciju
potrebno je identifikovati:
Projektni tim: izvrioce sa znanjem dizajna i tehnologija za proizvodnju, distribuciju i
prezentaciju multimedijalnih sadraja: glumce, producente i direktore, tehniko osoblje,
kamermane, audio/video inenjere, direktora svetla;
Hardverske resurse: ureaje i sisteme za prijem i obradu, montau i distribuciju
multimedijalnih sadraja: skeneri, audio rekorderi, video rekorderi, fotoaparati, video
kamere, raunari za audio i video obradu i montau, irokopojasne raunarske mree,
ureaji za audio reprodukciju, ureaji za video reprodukciju.
Softverske alate za obradu teksta, zvuka i slike kao to su:
Painter ili Photoshop za obradu bitmapirane grafike, ImageReady za veb grafiku,
Freehand i Illustrator za vektorsku grafiku, Dreamweaver za razvoj veb prezentacija,
Sound Forge i SoundMaker za obradu zvuka, Flash za animaciju i interaktivnost,
Premiere, After Effects i QuickTime Pro za video i audio montau, 3D MAX i MAYA
za animaciju, kao i softver koji omoguava dizajneru da povee razliite multimedijske
elemente u vremenu i prostoru i doda celini interaktivno ponaanje.
Pogodan medijum za dostavljanje.
RADNI TIM ZA MULTIMEDIJALNU PRODUKCIJU

Radni timovi za multimedijalnu produkciju sastavljaju se na osnovu planiranog budeta i


kompleksnosti projekata. Za velike projekte angauju se specijalisti, dok jednostavnije projekte

133

mogu raditi izvrioci koji objedinjuju vie razliitih funkcija. Sledee specijalnosti se mogu
izdvojiti kao posebne:
Menader projekta oblikuje projekt u svim fazama rada, poev od trenutka programske
i urednike odluke za odreeni projekat pa do njegove potpune realizacije. Predlae i
usvaja tehnoloko-produkciona reenja realizacije projekta. Vri rediteljsku razradu
emisije i izrauje detaljnu knjigu snimanja.
Urednik osmiljava projekte i akcije, obavlja predistraivanje, istrauje, prikuplja,
stilski i anrovski klasifikuje i ureuje sadraj, uestvuje u realizaciji, koordinira rad
ekipe.
Direktor produkcije upravlja, organizuje, koordinira i kontrolie tehnoloki proces
proizvodnje.
Producent izrauje/odobrava plan proizvodnje, organizuje i finansijski vodi
proizvodnju i finalizaciju projekata, odgovoran je za budet projekta, sprovoenje
tehnikih standarda i rokove proizvodnje.
Reditelj uestvuje u oblikovanju projekta u svim fazama rada, poev od trenutka
programske i urednike odluke za odreeni projekat pa do njegove potpune realizacije,
predlae i usvaja tehnoloko-produkciona reenja realizacije projekta, uestvuje na
dramaturkoj obradi scenarija, vri rediteljsku razradu emisije i izrauje detaljnu knjigu
snimanja, vri izbor glumaca, izvoaa i drugih uesnika u projektu, rukovodi kreativnim
procesom snimanja slike i zvuka, kreativno rukovodi postprodukcijskim procesom.
Snimatelj slike u pripremnoj fazi uestvuje u utvrivanju tehniko-produkcionih uslova,
utvruje tehnike standarde snimanja slike, potrebnu tehniku i opremu za snimanje slike,
u fazi snimanja postavlja svetlosnu postavku, pozicionira kameru, snima sliku u skladu sa
produkcijskim zahtevima, utvruje sve pokrete kamere, nain i opremu za njihovo
izvoenje.
Pored navedenih za vee projekte i televizijsku produkciju postoje sledee specijalnoasti:
dizajner svetla, montaer, video-mikser, majstor zvuka, mikser zvuka, majstor slike, dizajner
video grafike i snimatelj tona.

8.2.2 Multimedijalna produkcija


Produkcija je druga faza realizacije projekta, realizacije multimedijalnog proizvoda u
kojoj se vri neposredno formiranje sadraja koji e se ugraivati u proizvod. U fazi produkcije,
zavisno od kompleksnosti proizvoda, koristi se raunar, kamera, glumci, kostimi, studio i
scenografija.
U zavisnosti od projekta zavise i aktivnosti u toku produkcije. U video produkciji to moe
biti poseta lokacija, organizacija opreme, kostima, rekvizita i snimanje.
Procesi u fazi produkcije su:

Pisanje scripta,
Istraivanje i pisanje sadraja,
Izbor i priprema odgovarajue opreme za video snimanje: kamera, tripod, mikrofoni,
134

svetlo,
Snimanje audio i video sadraja koristei storyboard,
Montaa audio i video sadraja,
Stvaranje multimedijalnih komponenti,
Razvoj kompjuterske animacije,
Interfejs dizajn,
Grafiko oblikovanje,
Integrisanje multimedijalnih komponenti u multimedijalni proizvod (eng. authoring),
Testiranje proizvoda.
U video produkciji postoje sledee faze:

Video plan capture,


Uvoenje videa u multimedijalni projekat,
Identifikacija softvera koji je na raspolaganju za video produkciju /nelinearnu montau,
Nelinearna montaa videa, titlovanje, specijalni efekti, prelazitranzicije.
Osnovne strategije organizacije sadraja
Osnovne strategije organizacije sadraja su:

a)
b)
c)
d)
e)

Izvetaj, reportaa, raport, saoptenje,


Hronoloka,
Geografska,
Sistemska,
Strukturalna.

U svim ovim strategijama, sadraj je organizovan u hijerarhijskim nivoima. Da bi


korisnik lokalizovao odreenu informaciju, potrebno je da pree hijerarhiju (eng. drill down).
Hijerarhijska organizacija daje korisniku informacije u pogledu organizacione konstrukcije i
istovremeno ne doputa da ga pretrpaju nepotrebne informacije, to bi bilo neizbeno u
linijskoj konstrukciji organizacije.
a) Izvetaj reportaa i soptenje predstavlja najoptiji oblik organizacije sadraja za
enciklopedijske oblike rada. Sadraji se grupiu u konstitucione i logike grupe.
b) Hronoloka organizacija predstavlja vremensku organizaciju sadraja i prikazivanje
multimedijalne aplikacije kao to je proizvodnja videa na vremenskoj osi. Dizajner treba
da izvri korelaciju dogaaja i odgovarajuih datuma. Da bi se problem umanjio
upotrebljavaju se razne tehnike zasnovane na prepoznavanju, a ne na seanju, kao to je
korienje pop-up displeja za prikazivanje dogaaja dok dizajner prelazi vremensku osu
(eng. timeline) i pokazivanje slika koje reprezentuju glavne istorijske momente, na
vremenskoj osi.
c) Geografska organizacija predstavlja prikazivanje geografskih sistema i upotrebu 2D
karti ili 3D predstavljanja. Hijerarhijska konstrukcija i navigacija je podrana opercijom
135

zum (eng. zoom). Kombinacija geografskog i vremenskog prikazivanja je veoma esta,


jer pokriva veliki broj multimedijalnih proizvoda, kao to je prikazivanje istorijskih
dogaaja za oblast neke drave, ili prikazivanje prostorno-vremenskih manifestacija.
d) Sistemska organizacija sadraja je klasina metodologija prikazivanja naina
funkcionisanja sistema sa tehnolokog aspekta. Ima iroku upotrebu u obrazovne svrhe,
tutorijali i simulacije. Sistemska organizacija je posebno pogodna za interaktivne
multimedijske proizvode. Sistem se deli na podsisteme, podsistemi na druge podsisteme,
sve dok se ne stigne do osnovnih sastavnih komponenti.
Glavni problem sa sistemskom organizacijom je tekoa prilagoavanja prikazivanja
velikom broju kategorija korisnika koji nisu upoznati sa tehnologijom koja se objanjava.
Iz tog razloga dobro je da se koriste neki poetni primeri iz svakodnevnog ivota
korisnika za poetno razumevanje sistema.
e) Strukturalna organizacija sadraja ima za cilj prikazivanje strukture organizama i
preduzea to se tie njihovih aktivnosti, slubenika, proizvoda i usluga koje daju.
Prikazivanje je hijerarhijsko, poto se organizacija preduzea zasniva na hijerarhiji
osoblja, kao i odseka.

8.2.3 Multimedijalna postprodukcija


Multimedijalna postprodukcija predstavlja zavrnu fazu u kojoj se formira konana
verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na
urednitvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to audio i video montaa.
Postprodukcija ima zadatake da izradi:

Originalni, glavni (eng. master) uzorak i proizvede duplikate.


Uputstvo za korisnike (eng. user manual) i napravi arhivu proizvoda pakovanje
ambalau proizvoda.
Video postprodukcija je obrada snimljenog videa, materijala ili filma u zavrni proizvod
za emitovanje ili distribuciju. Osnovni procesi u video postprodukciji su rendering i snimanje
zavrne verzije na prenosni medij.
Rendering (eng. rendering) predstavlja proces kompjuterske sinteze slike od sirovih
podataka, modela, odnosno elemenata scene ije objekte i osobine materijala uobliavaju
svetlosni izvori, poloaji i pravac posmatranja gledaoca. Osvetljenje ima presudan uticaj na
scenski doivljaj pa se renderovanje esto oznaava kao poslednja faza u procesu dizajniranja
slika.
Poslednja faza pred distribuciju multimedijalnog proizvoda je snimanje kreiranog
proizvoda na spoljanji prenosni medij: tejp, DVD, CD, fle memoriju.
Distribucija multimedijalnog proizvoda moe da se obavlja preko interneta on-line, ili
pomou memorijskih medija CD-ROM, DVD, fle memorija off-line.

136

8.3 Slika u multimediji


Slika, sa fizikog aspekta, predstavlja raspodelu svetlosti na povrini, u ravni ili prostoru.
Svetlost je elektromagnetni talas sa irokim opsegom talasnih duina od 390 nm do
760 nm, koje se pojedinano vide kao boje svetlosti.
Boja predstavlja jedan ui deo svetlosnog spektra koji sistem za vid razlikuje od susednih
delova spektra. Boje se klasifikuju na primarne, sekundarne i tercijarne.
Primarne ili osnovne boje su crvena, plava i uta.
Sekundarne boje ili boje drugog reda su narandasta (uta + crvena), zelena (plava +
uta) i ljubiasta (crvena + plava).
Tercijarne boje boje vieg reda su kombinacije primarnih i sekundarnih boja. Ljudsko
oko razlikuje oko 10 miliona razliitih boja. Ogromna paleta tercijarnih boja dobija se meanjem
primarnih i sekundarnih boja.
Postoje dva naina meanja boja, aditivno i subtraktivno meanje boja.
Aditivno meanje boja odvija se na osnovu superpozicije, sabiranja svetlosnih talasa
pojedinih boja. Svaka boja se moe sintetizovati od odgovarajue koliine tri osnovne boje.
Primer aditivnog meanja boja su slike na ekranima.
Subtraktivno meanje boja odvija se na osnovu meusobne apsorpcije obojenih estica,
to je sluaj u slikarstvu.
Monohromatska slika je crno-bela slika, a hromatska slika je slika u boji.
Slika u multimediji predstavlja 2D tabelu diskretnih elemenata slike piksela.
Piksel (eng. picture element) je elemenat slike odreen svojom sjajnou i poloajem u
slici.
Sjajnost piksela se izraava brojnom vrednosti intenziteta.
Poloaj piksela predstavlja se koordinatama (x, y).

8.3.1 Memorisanje, prenos i prikazivanje slike


Memorisanje, prenos i prikazivanje slike vri se pomou elektronskih ureaja posle
procesa konverzije piksela iz svetlosnog u elektrini domen i formiranja video signala.
Video ureaji za snimanje slike elektronske kamere, razvijeni su po ugledu na ulo vida
ivih organizama. Oko je predstavljalo uzor za konstrukciju elektronske kamere.
Pikseli optike slike pretvaraju se u mrenjai oka u bioelektrine impulse, takozvane
talase akcionog potencijala. Od mrenjae, snop nervnih vlakana prenosi talase akcionih
potencijala do centra za vid u temenom delu korteksa. U centru za vid odvija se proces
percepcije, prepoznavanje sadraja, tumaenja slike. ulo vida ima visoku rezoluciju
zahvaljujui ogromnom broju fotoreceptora u mrenjai i nervnih vlakana u ivanom snopu
kojih ima oko 120 000 000. Pikseli se u sistemu ula vida paralelno konvertuju, prenose i
obrauju.
Tehniki video sistemi, za razliku od ula vida sa paralelnim sistemom prenosa, koriste
serijski sistem prenosa. Serijski prenos se zasniva na transformaciji prostornih koordinata u
vremenske. Tokom snimanja slike linearnom sekvencijalnom analizom, prostorne koordinate
transformiu se u vremeski niz. Tokom reprodukcije linearnom sintezom, formiraju se prostorne
koordinate.

137

Kod sofisticiranih tennikih video sistema, razvijaju se, po ugledu na modani centar za
vid, vii nivoi obrade slike. Istrauje se sadraj, semantika slike, i razvijaju sistemi za
prepoznavanje oblika. Ureaji koji transformiu optiku u elektrinu sliku pogodnu za obradu i
prenos su elektronske kamere i skeneri. To su ureaji za snimanje capture ureaji.
Optika slika kao 2D raspodela svetlosti transformie se u 2D sliku raspodele
elektronskih naelektrisanja.
Dvodimenzionalna slika raspodele elektronskih naelektrisanja transformie se u analogni
video signal.
Memorisanje slike vri se posredstvom video signala u kome su sadrane informacije o
svim elementima slike pikselima.
Kod savremenih ureaja analogni video signal transformie se u digitalni video signal
koji obrauju mikroprocesori. Slika se u digitalnom obliku memorie kao matrica u kojoj su
redovi pikseli na koordinati X, a kolone pikseli na koordinati Y.

8.3.2 Senzori slike


Senzori slike su komponente video sistema koje transformiu optiku sliku u video
signal. Razlikuju se senzori slike sa elektronskim mlazom i senzori slike sa poluprovodnicima.
Senzori slike sa elektronskim mlazom: vidikoni, ortikoni, super ortikoni, plumbikoni,
satikoni. Fotoelektrini senzori u vidu mozaika na poluprovodnoj ploici smeteni su u
vakuumsku cev od stakla. Svetlosna slika koja se projektuje na fotoosetljivu senzorsku ploicu
transformie se u sliku naelektrisanja. Slika naelektrisanja skenira se pomou elektronskog mlaza
koji zatvara strujno kolo preko radnog otpornika formirajui na taj nain video signal. Senzore
slike sa elektronskim mlazom potisnuli su mnogo manji poluprovodniki senzori.
Senzori slike sa poluprovodnicima predstavljaju fotoosetljive ploice sa mozaikom
elemenata koji pod dejstvom svetlosti formiraju elektrinu sliku. Za oitavanje je mogu pristup
svakom nizu fotoosetljivih elemenata koji reprezentuju piksele. Naelektrisanja elemenata
mozaika proporcionalna su intenzitetu osvetljaja pojedinih piksela. Sukcesivnom analizom 2D
slike naelektrisanja formira se video signal. Senzori slike sa poluprovodnicima imaju adresibilnu
vezu do svakog piksela 2D slike elektronskog naelektrisanja, to daje fleksibilnost u oitavanju.
Postoje vie izvedbi ovih senzora pod nazivom:

Ureaji sa spregnutim naelektrisanjem (eng. charge-coupled device CCD),


Ureaj za detektovanje punjenja (eng. charge injection device CID),
Komplementarne logike tranzistorski metal-oksid-poluprovodnik (eng. Complemantary
metal-oxide-semiconductor CMOS),
Fotodiode (eng. photodiode).
CCD, CID i CMOS senzori slike sastavljeni su od miliona fotoosetljivih elektronskih
senzora. Zavisno od intenziteta svetlosti, u elektronskim senzorima se stvara odreeno
naelektrisanje. Proces pranjenja se vri primanjem odreene kontrolne naredbe. Izlaz senzora
proporcionalan je integralu svetlosne energije. Elektronski senzori su rasporeeni u matrinom
obliku obliku mree. Svaki senzor odgovara jednom pikselu. Za dobijanje boje upotrebljavaju
se R, G, B filteri kojima se oblau senzori. CCD, CID i CMOS elementi se integriu u 2D
matrice, formirajui senzore slike koji se koriste u kamerama.

138

Fotodiode se integriu u 1D nizove koji se koriste kao senzori u skenerima. Napon na


izlazu fotodiode je proporcionalan intenzitetu svetlosti.

8.3.3 Osnovne obrade slike


Osnovu za obradu slike ine elementi 2D prostora pikseli, elementi 3D prostora
vokseli i elementi vremenske koordinate vremenski intervali.
Osnovne obrade slike su: analiza slike, digitalizacija signala slike, poboljanje,
restauracija, kompresija i rekonstrukcija.
Analiza slike predstavlja pretraivanje i odmeravanje elemenata slike, pojedinih
segmenata slike i slike u celini. Slika se moe analizirati po povrini, nivoima i sadraju.
Analiza po prostoru vri se sistematskim pretraivanjem skeniranjem, liniju po liniju,
elemenata slike po povrini fotoosetljivog senzora slike. U senzoru optike slike proizvodi se
analogna elektrina 2D slika. Linijskom analizom se analogna slika sa senzora prevodi u
analogni video signal pri emu se 2D koordinate piksela transformiu u vremenske intervale
video signala. Linijska analiza slike sa proredom primenjuje se u televizijskim sistemima:

PAL sistem 625/50 Hz (Evropski standard linijske promene faze (eng. phase alternating
line PAL)),
NTSC sistem 525/60 Hz (Ameriki standard nacionalnog komiteta za televizijski sistem
(eng. National Television System Committee NTSC))
HDTV . Televizija visokokog kvaliteta definicije (eng. high-definition television
HDTV) postoji vie varijanti. Osnovne su dve: 1125 /60 Hz i 1250/50 Hz, ali obzirom na
digitalnost fleksibilan je i razvijaju se nove verzije sa znatno veim brojem linija.

Analiza slike po nivoima koristi se za izdvajanje ivica, segmentaciju i identifikaciju


objekata.
Analiza slike po sadraju semantika analiza koristi se za analizu sadraja slike i
prepoznavanje oblika.
Analizi slike po nivoima i semantikoj analizi prethodi digitalizacija analognog video
signala.
Digitalizacija predstavlja analogno-digitalnu konverziju koja se odvija u tri koraka:
odabiranje, kvantizacija i kodovanje.
Odabiranje ili uzorkovanje sampling predstavlja proces tokom kojeg se iz
kontinualnog video signala, u odreenim vremenskim intervalima, periodima odabiranja,
izdvajaju trenutne vrednosti signala, odbirci uzorci u cilju diskretizacije video signala i
konverzije iz analognog u digitalni oblik. Diskretizacijom se oslobaaju vremenski intervali
izmeu uzimanja odbiraka za formiranje viestrukog prenosa signala vremenskog multipleksa.
Prevoenje signala iz analognog u digitalni oblik A/D konverzija omoguava sloene obrade
signala slike.
Kvantizacija je proces odmeravanja to znai procenu brojne vrednosti svakog odbirka.
Odbircima se dodeljuju vrednosti iz konaanog skupa vrednosti koje su odreene kvantizacionim
nivoima. Vrednosti svih odbiraka koji pripadaju jednoj kvantnoj zoni uzimaju vrednost kvantnog
simbola koji reprezentuje datu zonu.

139

Kodovanje je proces izraavanja kvantovane vrednosti odbiraka pomou odreenog koda,


odnosno brojnog sistema. Po pravilu koristi se binarni brojni sistem gde je ukupan broj simbola
N odreen eljenim brojem bita B prema formuli N = 2B.
Poboljanje slike predstavlja postupak obrade kojim se vri poboljanje kontrasta,
potiskivanje uma, pojaanje otrine i bojenje.
Postupci za poboljanje slike relativno su jednostavni i mogu se obavljati u realnom
vremenu.
Restauracija slike je postupak obrade kojim se poboljava kvalitet slike kada je
degradacija slike poznata i kada se moe formirati model degradacije. Tu spada korekcija
geometrijskih izoblienja optikog sistema kamere, potiskivanje uma iji je statistiki model
poznat i korekcija smanjene otrine slike usled pokreta ili defokusacije kamere.
Metode restauracije su kompleksni i najee se ne mogu izvravati u realnom vremenu.
Kompresija slike je postupak smanjenja broja informacionih bita pomou kojih se slika
memorie i prenosi.
Standardna filmska slika dimenzija 24 mm 36 mm, ima oko 107 piksela ako je
rezolucija filma 0.01 mm.
Standardna digitalna slika rezolucije 512 512 piksela ima oko 256 000 elemenata
kodovanih sa 8 bita/odbirku smeta se u 256 KB memorije.
Za memorisanje TV slika u toku jedne sekunde potrebno je 10 MB.
Efikasnost kompresije zavisi od sadraja slike.
Sve metode kompresije sadre programski deo i deo za podatke koji se poveava sa
poveanjem stepena kompresije to ograniava krajnju utedu u potrebnom memorijskom i
prenosnom kapacitetu.
Kompresija bez gubitaka (eng. lossless compression) omoguava dekompresiju
originalne slike. Dekomprimovana slika je identina originalnoj slici. Kodovanje duine niza
(eng. run-length encoding RLE) je kompresija sadraja slike bez gubitaka pomou beleenja
duine niza istih vrednosti piksela. Algoritmi RLE kompresije su:

Promenljiva duina kodova VLC, Huffman-ov codes


Kodiranje na bazi renika (eng. dictionary-based coding DBC)
Kompresija sa gubicima (eng. lossy compression) omoguava dekompresiju koja daje
aproksimativnu sliku originala.
Kompresija JPEG je kombinacija smanjenja koliine podataka i kompresije podataka.
Niz piksela predstavljenih koordinatama x i y i vrednou z koja odgovara sjajnosti ili boji,
mogue je transformisati u frekvencijski domen koristei Fourier-ovu transformaciju.
Komponente ove transformacije koje se nalaze u spektru viih frekvencija odgovaraju naglim
promenama intenziteta ije efekte ljudsko oko manje primeuje, naroito ako se radi o slikama u
boji. Primenjuje se diskretna kosinusna transformacija DCT, kojom se dobija 2D matrica
koeficijenata istih dimenzija kao i poetna 2D matrica vrednosti piksela. Pomou DCT izvrena
je promena podataka u formu pogodniju za procenu i komprimovanje, dobija se 2D slika u
prostornom frekvencijskom domenu u kojem se lake odreuju i odstranjuju beznaajne suvine
komponente. Da bi se smanjilo vreme obrade proporcionalno sa kvadratom broja piksela, DCT
se vri nad slikom i to sa blokovima od 8 8 piksela.
Komponente na razliitim frekvencijama kvantuju se razliitim brojem nivoa
kvantizacije. Broj kvantizacinih nivoa moe se definisati posebno za svaki koeficijent

140

kvantizacionom matricom. Mnoge komponente, naroito na viim frekvencijama, aproksimiraju


se sa vrednou nula, dok je kod ostalih komponenti smanjen broj bitova potrebnih za
memorisanje vrednosti komponenata koje nemaju vrednost nula. Naknadno se na njih primenjuje
RLE kodovanje.
Selekcija se vri specijalizovanim alatima za izdvajanje pravougaonih i eliptinih oblika,
nepravilnih povrina sa tkz. maginim tapom (eng. magic wand) i magnetskim lasom (eng.
magnetic lasso). Selekcija definie masku koja stoji preko dela slike koji nije selektovan i koji je
zatien od obrade.
Maska moe biti: providna, neprovidna, i poluprovidna. Nijansirane maske nazivaju se
alfa kanali (eng. alpha channel), mogu imati 256 nivoa providnosti. Bojenje, filtracija i druge
modifikacije piksela pomou digitalnih maski proporcionalno je vrednosti zapisanoj u alfa
kanalu. Dve ili vie slika mogu se utopiti u jednu pomou raznih veliina prozirnosti maski kao i
ublaiti otre ivice objekata na slici.
Obrada pojedinanih piksela omoguava proporcionalne promene bitmapirane slike u
celini kao to su dobijanje negativa, korekcija sjajnosti i kontrasta, kao i korekcija boja. Za
vrednost piksela p nova vrednost p' se dobija kada se primeni funkcija f, tj.,
p' = f(p).
Funkcija f se naziv funkcija mapiranja.
Primer konstrukcije negativa crno bele slike:
f(p) = W p
gde je
W

vrednost piksela koja reprezentuje belu boju.

Obrada grupe piksela omoguava geometrijske promene u slici i prilagoavanje bitmapa


razliitim ekranima. Ova se obrada zasniva na procesu konvolucije koji pri transformaciji
vrednosti piksela u obzir uzima vrednost piksela u neposrednom okruenju tog piksela. Filteri
iji je efekat zamuenje ili pak izotravanje slike su dve tipine primene obrade grupe piksela.
Rekonstrukcija slike je postupak pomou kojeg se 2D ili 3D objekti sastavljaju iz vie
1D ili 2D projekcija.

8.3.4 Bitmapirana slika


Bitmapirana slika predstavlja 2D niz vrednosti elemenata slike piksela u digitalnoj
video memoriji ili prikazanih na ekranu u vidu optike slike. Pikseli bitmapirane slike formiraju
se u procesu snimanja ili skeniranja optike slike.
Raster slike ili bitmapa predstavlja pravougaonu mreu piksela kojom se formira slika na
ekranima ili papiru.
Monohromatska slika predstavlja se 2D matricom, gde su reprezentovane vrednosti
odbiraka na koordinatama X i Y koje odgovaraju vrednostima intenziteta svetlosti na odreenom

141

mestu slike. Opseg moguih vrednosti intenziteta svetlosti je odreen brojem kvantizacionih
nivoa brojem nivoa sivog, zavisno od broja bita po pikselu.
Hromatska slika predstavlja se sa tri 2D matrice (crvena, zelena i plava) gde su
reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima
intenziteta boje na odreenom mestu slike.
Rezolucija slike, kao osnovni parametar bitmapirane slike, predstavlja meru sa kolikom
finoom digitalna slika, sa konanim brojem piksela, aproksimira kontinualnu sliku. Kvalitet
slike zavisi od broja piksela prostorne rezolucije i broja kvantizacionih nivoa nijansi.
Geometrijske promene u bitmapiranoj slici vre se transformacijama za rekonstrukciju
slike iz jednog oblika u drugi. To je ekvivalentno transformaciji u analogni video signal i
ponovno odabiranje pri emu se koriste metode interpolacije.
Rezolucija za tampae i skenere izraava se brojem taaka po jedinici duine (eng. dots
per inch dpi).
Rezolucija tampaa se definie brojem linija po inu. Rezolucija tampai je 600 dpi do
1200 dpi, a najbolji do 2700 dpi. tampai u boji mogu imati rezoluciju ak i 1200 taaka po
inu, to ne znai da se tako velika rezolucija koristi za tampanje svih fotografija. asopisi u
boji koriste rezoluciju od 137 linija po inu, dok se u knjigama najvie upotrebljavaju rezolucije
od 150 taaka po inu. tampai u boji koriste etiri do est osnovnih boja. Rasterska elija
tampaa u boji sadri osnovne boje i definie veliinu piksela kolor slike.
Rezolucija skenera odreuje sa kolikom finoom e raster slike biti iskorien da
reprezentuje datu sliku. Bitmapirana slika e imati vie detalja ako je vei dpi skenera. Tipian
opseg vrednosti rezolucije skenera je oko 300 dpi do 3600 dpi i vie. Veliina rezolucije za
skeniranje bitmapirane slike zavisi od toga za koju je namenu planirana slika: da li e se slika
tampati, da li je slika planirana za prikazivanje na monitoru, ili za veb prezentaciju. Fotografije
u asopisima reprodukovane su sa oko 200 dpi do 300 dpi. Ako se planira skeniranje slike iz
asopisa i slanje na veb, skeniranje se moe izvriti sa rezolucijom od 72 dpi.
Dubina boje (eng. bit depth) je broj bita koji se dodeljuje svakoj taki i koristi se za opis
boje. Sa veom vrednosti bit depth skener je u mogunosti da odabira vie boja, to omoguava
vei raspon u promeni kontrasta (eng. contrast) i sjajnosti (eng. brightness) bitmapirane slike. Da
bi se formirala true colour skeneru je potrebno 24 bit depth, znai da se dodeljuje po 8 bita za
crevenu, plavu i zelenu boju za svaku taku piksel. U tom sluaju ukupan broj moguih boja je
28 28 28 = 256 256 256 = 16 777 216 16.7 miliona boja.
Rezolucija bitmapiranih slika na televizijskim ekranima i raunarskih monitora izraava
se brojem piksela u slici. Primeri slika sa visokom i niskom rezolucijom dati su na Slici 8.3.4.1.
Nezavisno od veliine ekrana, televizijska slika se prikazuje pomou istog broja piksela i
to:
PAL standard: 720 576 piksela,
NTSC standard: 640 480 piksela,
HDTV standard: 1280 720 piksela.
Rezolucija slike raunarskih monitora moe biti:
VGA standard (video grafika kartica niz (eng. video graphics array VGA)):
640 480 pixela,
SVGA standard (super video grafika kartica niz (eng. super video graphics array

142

SVGA)): 800 600 pixela,


XGA standard (proirena grafika kartica niz (eng. eXtended graphics array XGA):
1024 768 pixela,
14 inni monitor sa 72 dpi = 640 480 piksela,
17 inni monitor sa 72 dpi = 832 624 piksela.

Slika 8.3.4.1Primeri slika sa visokom i niskom rezolucijom

Dimenzije bitmapirane slike izraavaju se ukupnim brojem piksela koje sadri i ne


poklapaju se uvek sa dimenzijama ekrana. Slika sa stranicom duine 128 piksela na ekranu sa
rezolucijom: od 72 dpi, bie 45 mm, od 115 dpi od 28 mm, a na tampau sa 600 dpi bie iroka
samo 5 mm irine. To se moe izraziti relacijom:
fizike dimenzije slike (inch) = dimenzije ekrana u pikselima (pix) / rezolucija ureaja (pix/inch).
Softver za prikazivanje originalnih dimenzija slike skalira bitmap pomou formule:
faktor skaliranja = rezolucija ureaja / rezolucija slike.
Reprodukcija bitmapa na ekranu sa veom rezolucijom vri se interpolacijom
prekoodabiranje (eng. oversampling), a na ekrane sa manjom rezolucijom izbacivanjem
meupiksela pododabiranje (eng. downsampling).

8.3.5 Vektorski generisane slike


Vektorski generisana slike su vetake slike uraene pomou vektorske grafike.
Vektorska grafika ili geometijsko oblikovanje predstavlja proizvodnju slika pomou
geometrijskih oblika kao to su: take, linije, krive i poligoni. Zasniva se na matematikom opisu

143

pravih i krivih linija i oblika. Vektorska aritmetika ili analitika geometrija glavni je matematiki
aparat koji se koristi pri proraunu vrednosti piksela. Sa operativnog aspekta, vektorska grafika
predstavlja niz komandi kojima se ostvaruje generisanje i transformacije raznih geometrijskih
oblika. Prilikom prikazivanja vektorske grafike na ekranu, odvija se proces renderovanja.
Prikazivanje vektorskih slika renderovanje zahteva prethodni proraun za generisanje vrednosti
piksela.
Osnovni elementi za formiranje vektorskih slika su:

Koordinate brojani podaci o poloaju taaka u ravni prostora,


Koordinatni sistem ravan ili prostor u kome su definisane ose i koordinatni poetak,
Vektori orijentisane dui za predstavljanje fizikih veliina koje karakterie jaina,
pravac i smer delovanja,
Linije neprekidno geometijsko mesto taaka koje povezuje odreeno svojstvo,
Poravnanje priblino predstavljanje provlaenjem glatke linije izmeu taaka koje od
te linije odstupaju sa odreenom tolerancijom,
Bezijerove krive linije koje spajaju zadate take na optimalan nain kao to je prikazano
na Slici 8.3.5.1-a,
Putanje linije kojima se oznaavaju kretanja odreenih objekata, to se takoe vidi na
Slici 8.3.5.1-a,
Potezi i popunjavanje standardizovano povezivanje taaka i bojenje odreenih povrina
to je prikazano na Slici 8.3.5.1-b.

Slika 8.3.5.1Primeri: Bezijerova kriva, putanja, potezi i popunjavanje

Transformacije koje se jednostavno izvode u vektorskoj grafici su skaliranje, rotacija, translacija


i refleksija kao to je prikazano na Slici 8.3.5.2.
Vektorske slike (Slika 8.3.5.3-a) u poreenju sa bitmapiranim slikama rasterskom
grafikom (Slika 8.3.5.3-b):
Zauzimaju manje memorijskog prostora, manja je koliina podataka, to je prikazano u
Tabeli 8.3.5.1,
144

Slika 8.3.5.2Ilustracija vektorskih transformacija: skaliranje, rotacija, translacija i refleksija

Jednostavnije su za editovanje,
Lake se pamte jer se percepcija mozga zasniva na pamenju osnovnih karakteristika
slike, kontura, engrama,
Pogodnije su za internet,
Reprezentacija vektorskih slika je kompaktna, skalabilna, nezavisna od rezolucije ekrana
to nije sluaj sa bitmapiranom slikom,
Uveanje objekta i pribliavanje ne izaziva smanjenje rezolucije detalja i gubitka na
kvalitetu,
Informacije o transformacijama i procedurama se pamte to omoguava da se mogu
kasnije menjati; to znai da pomeranje, skaliranje, rotiranje, popunjavanje, ili neka druga
geometrijska transformacija ne smanjuju kvalitet crtea kao kod bitmapirane slike.

Zbog istih i otrih prelaza izmeu boja, vektorskom grafikom se ne mogu prikazati
fotorealistine slike, fotografije.

Slika 8.3.5.3Primer vektorske i bitmapirane slike

145

Tabela 8.3.5.1Poreenje veliine datoteke bitmapirane i vektorske slike


Dimenzije u
pikselima
250 78
800 248
1500 466

Bitmapa
57 KB
581 KB
2000 MB

Vektorski
zapis
36KB
36KB
36KB

8.3.6 Promenljive slike u multimediji


Promenljive, pokretne (eng. move) slike na prezentacionim medijima, bioskopskim i
monitorskim ekranima, predstavljaju niz razliitih slika koje se prikazuju jedna za drugom
takvom brzinom da ih ulo vida ne moe pojedinano pratiti i sistem za percepciju povezuje
njihov sadraj u kontinuitet koji doivljavamo kao jedinstvenu promenljivu odnosno pokretnu,
ivu sliku.
Dinamika slika nastaje usled promena ili pomeranja objekata ili usled promene jaine
i/ili boje svetlosti koja osvetljava scenu. Doivljaj dinamike u reprodukovanoj slici ostvaruje se
zahvaljujui inerciji ula vida.
Doivljaj pokretnih slika sa bioskopskih i monitorskih ekrana stvara se u modanom
centru za vid. Slika objekta projektovana pomou soiva na fotoosetljivu mrenjau oka prenosi
se do centara za vid pomou talasa akcionih potencijala, koji kroz nervna vlakna onog ivca
formiraju diskretne bioelektrine video signale.
Delovanje svetlosnog nadraaja svakog pojedinanog piksela proizvodi niz impulsa
talasa akcionog potencijala ogranienog trajanja. Vrednosti pojedinih piksela i itave slike koju
formiraju prenose se do centra za vid u sukcesivnim intervalima. U centru za vid odvija se, na
osnovu prispelih impulsa, proces viih nivoa obrade, memorisanje, i prepoznavanje objekata to
se oznaava kao proces percepcije. Mrenjaa oka, nervna vlakna onog ivca, i centar za vid
imaju ogranienu sposobnost razlikovanja brzih promena svetlosti koje se smenjuju u
intervalima kraim od 100 ms. Bre diskretne promene povezuju se u neprekidan doivljaj zbog
inercije koju karakterie perzistencija vida.
Perzistencija vida (eng. persistence of vision) predstavlja vreme zadravanja percepcije
prethodne slike, granini interval za razlikovanje susednih slika, odnosno povezivanje
sukcesivnih slika i percepcija kontinuiteta niza pojedinanih slika. Povezivanje susednih slika u
kontinuum karakterie uestanost sjedinjavanja slika.
Uestanost sjedinjavanja slika fuziona frekvencija (eng. fusion frequency) predstavlja
graninu brzinu smenjivanja slika u nizu pri kojoj naa percepcija gubi sposobnost da razlikuje
pojedinane slike tako to vidimo kontinualne promene ili pokrete u slici. Minimalna fuziona
frekvencija je (12 do 15) slika u sekundi. Fuziona frekvencija od 40 slika u sekundi eliminie
treptanje koje postoji pri malim brzinama smenjivanja slika.
Proizvodnja pokretnih slika obavlja se pomou:

Filmske tehnike
Video tehnike
Tehnike animacije

146

Filmska tehnika predstavlja proizvodnju pokretnih slika pomou celuloidne trake, tako
to se u procesu snimanja slike pokretnih i promenljivih objekata projektuju na filmsku traku, a u
procesu reprodukcije slike sa filmske trake projektuju se na ekran. Prenos slike na filmsku traku,
u toku snimanja, kao i prenos slike sa filmske trake, u toku prikazivanja, ostvaruje se
projekcijom pomou svetlosnih zraka.
U toku postprodukcije, sa filmom je mogua takozvana linearna montaa, koja se svodi
na nadovezivanje i lepljenje filmske trake.
Dimenzije filma su standardizovane. Filmski formati za irinu trake su: 8 mm, 16 mm, 32
mm.
Fuziona frekvenca kod filma iznosi 24 slike u sekundi sa po dva prosvetljavanja, to za
smanjenje treptanja daje efekat kao da je 48 slika.
Prednost filmske tehnike je visoka rezolucija slike.
Nedostatak filmske tehnike je nemogunost kontrole snimka u realnom vremenu.
Video tehnika, odnosno video, predstavlja elektronsko snimanje, obradu i reprodukciju
niza slika koje se sukcesivno smenjuju. Kod reprodukcije niza slika sa razliitim sadrajem, koje
se smenjuju dovoljno brzo da vizuelna percepcija ne uspeva da prati sadraje svake slike
pojedinano, ve da ih povezuje u kontinuitet, stvara se doivljaj promena odnosno pokreta u
sadraju posmatrane video slike.
Video tehnika omoguava da se optike slike pomou fotoelektrinog efekta transformiu
u elektrine slike, a zatim linijskom analizom se pikseli elektrine slike sukcesivno transformiu
u video signal. Iz video signala sukcesivnom linijskom sintezom reprodukuju se slike na ekranu
monitora ili na bioskopskom ekranu pomou video projektora.
Jedna video slika se naziva frejm (eng. frame). U televizijskom sistemu jedan frejm
sastavlja se ispisivanjem linija dve poluslike koje se zovu fild (eng. field) sistemom ueljavanja
sa proredom (eng. interlaced), sa parnim i neparnim linijama. Kod raunarskih video monitora,
za razliku od ispisivanja sa proredom, ispisivanje slike moe da bude progresivno (eng.
progressive) ispisivanje, odnosno skeniranje (eng. scan), to znai linija za linijom. Prikazivanje
pomou poluslika, slino dvostrukom prosvetljavanju svake pojedinane slike kod filma, vri se
zbog smanjenja efekta treptanja video slike.
U televizijskom PAL sistemu uestanost sukcesivnog smenjivanja slika je 25 frejma u
sekundi (eng. frames per second). Veliina jedne slike je 576 linija 720 kolona.
U televizijskom sistemu NTSC uestanost je 30 frejma u sekundi. Veliina jedne slike je
480 linija 720 kolona.
U HDTV veliina jedne slike je u granicama od 720 linija 1280 kolona do 1080 linija
1920 kolona.
Obrada slike u video tehnici moe biti prostorna, vremenska i prostorno vremenska.
Prostorna obrada video slike vri se pojedinano unutar slike i sastoji se od otklanjanja
uma u slici, izdvajanja ivica i poboljanja kvaliteta slike.
Vremenska obrada video slike podrazumeva obradu piksela u slici u vie uzastopnih
vremenskih trenutaka i vri se u cilju detekcije i estimacije pokreta i vremenskog filtriranja.
Prostorno vremenska obrada video slike omoguava transformaciju formata slike kao
to je video skaliranje 4:3 slike u 16:9 sliku.
U procesu snimanja vri se opto elektrina, a u procesu reprodukcije elektro optika
transformacija slike. Konverzija povrinske slike u video signal obavlja se postupkom prostorno

147

vremenske transformacije. Iz video signala se vremensko prostornom koverzijom


reprodukuje slika na TV ekranima i monitorima.
Osnovne prednosti video tehnike koje joj obezbeuju primat nad filmskom tehnikom, su
mogunosti kontrole kvaliteta slike tokom snimanja i elektronska obrada video slike sa velikim
mogunostima za razliite transformacije, promenu sadraja, kompresiju, dekompresiju i
nelinearnu montau u procesu editovanja.
Klasinom video tehnikeom ostvarivana je manja rezolucija slike u odnosu na film, a
finansijska ulaganja su velika zbog potreba za velikim memorijskim kapacitetom raunara,
irokim opseom kanala za prenos video signala i veoma brzim video procesorima. Tokom
razvoja, navedeni problemi praktino su prevazieni.
Standardi u video tehnici usklaeni su sa televizijskim standardima:

NTSC 525 vidljivih linija, 30 slika/s, 60 poluslika/s;


PAL i SECAM (Francuski televizijski standard (fran. sequentiel couleur a memoire, eng.
sequential color with memory SECAM)) vidljivih 575 linija, 25 slika/s, 50 poluslika/s;
HDTV 1125linija, 50 slika/s, ili 1250 linija 50 slika/s.

Raunarski video sistemi nisu zavisni od TV standarda, broj kadrova se moe podeavati.
Za internet broj kadrova za prenos smanjuje se na (12 do 15) kadrova u sekundi, jer se na
prijemu mogu interpolirati meukadrovi i poveati brzina osveavanja ekrana.
Potrebni kapaciteti memorije i prenosnih kanala za tekst, sliku, zvuk i video znatno se
razlikuju.
Tekst jedna stranica sa 80 slova po liniji i 64 linije po stranici zahteva:
80 slova po liniji 64 linije 1 stranica 8 bita po slovu = 40 960 bita = 41 kbit/stranici.
Slika 24 bita po pikselu, 512 512 piksela, zahteva: 512 512 piksela 24 bita po
pikselu = 6 Mbit/slici.
Zvuk CD kvalitet odabiranja 44.1 kHz i 16 bita po odmerku zahteva za mono:
44 100 odmeraka/s 16 bita/odmerku = 706 kbit/s, i za stereo 1412 kbit/s.
Videokadar 360 240 piksela, kodovanih sa 24 bita po pikselu, 30 kadrova u sekundi
zahteva: 360 240 piksela 24 bita po pikselu 30 kadrova u sekundi = 60 Mbit/s.
Zvuk i slika u originalnom obliku teko bi se memorisali i prenosili.
Za memorisanje i prenos audio i video signala neminovna je potreba za kompresijom
signala zvuka i slike.
Kompresija signala zvuka i slike detaljno je obraena u okviru sedmog poglavlja ove
knjige Standardi u multimedijalnim komunikacijama.

8.4 Tekst u multimediji


Tekst predstavlja zapis govornog jezika. O znaaju zapisivanja govornog jezika, odnosno
pisma, bilo je rei na poetku ovog poglavlja, a o predstavljanju teksta u digitalnoj formi,
kompresiji, i standardima u estom poglavlju ove knjige Kompresija teksta.
Sledea razmatranja posveena su problematici prikazivanja teksta u multimedijalnim
proizvodima i servisima.

148

Tekst u multimediji predstavlja vidljivu reprezentaciju govornog jezika i istovremeno


predstavlja grafiki, dizajnerski i estetski element. O dualistikoj prirodi teksta u multimediji
dizajneri posveuju posebnu panju.
Kao reprezent govornog jezika tekst nosi semantiki smisao zapisan slovima
odgovarajue azbuke korienog pisma.
Vizuelni izgled teksta u multimediji posebno je znaajan, a odnosi se na oblik slova
karaktera, prostor koji oni zauzimaju, kao i raspored po redovima, pasusima i veim delovima
teksta na ekranu ili stranici, to je problematika kojom se bavi umetnost tipografije.
Tekst se sastoji od reenica, reenice su sastavljene od rei, a rei predstavljaju
kombinaciju slova. Pored slova, tekst sadri interpunkcijske znake, brojeve i matematike
simbole. Tekst u dalekoistonim zemljama, koje koriste slikovno pismo, sastoji se od ideograma.
Uopteno, moe se rei da su osnovni elementi teksta karakteri.
Karakter, kao tekstualni elemenat, naziv je za slova, brojeve, interpunkcijske ili
matematike znake, ili pisane simbole. U informaciono-komunikacionim tehnologijama, karakter
se predstavlja, memorie i prenosi u binarnoj formi.
Razvoj digitalizacije i uvoenje teksta u raunar poeo je sa digitalnim kodovanjem
engleskog jezika, da bi se irio preko jezika razvijenih zemalja i danas obuhvatio idiograme i
praktino sva postojea pisma.

8.4.1 Standardi za digitalnu prezentaciju karaktera


Razvojem informaciono-komunikacionih tehnologija, uvodila se i vremenom proirivala
standardizacija za digitalno memorisanje i reprezentaciju karaktera. Dominantni standardi su:
ASCII, ISO 646, Unicode, i ISO 10646.
Ameriki standardni kd za razmenu informacija ASCII je dominantan skup karaktera,
od 1970 godine. Za svaki karakter rezervie po jedan bajt memorije, od ega koristi sedam bita,
to znai da moe da kombinuje 128 kodnih vrednosti. Repertoar karaktera ASCII sastoji se od
samo 95 karaktera. Vrednosti od 0 do 31 i 127 koriste se za kontrolne karaktere kao to je
formiranje pomaka, nosioca, i brisanje koji se tradicionalno koriste za kontrolu operacija izlaznih
ureaja.
Meunardona organizacija za standardizaciji ISO donela je standard ISO 646 koji koristi
jedan bajt za korienje ASCII izvan Amerike.
Dalji razvoj, pojava, ekspanzija interneta i ukljuivanje kineskog pisma, uslovljen je
rezervisanjem vie memorije.
Unicode je standard koji se koristi od 1991 godine i zasniva se na esnaestobitnom
skupu karaktera koji ima 65 536 kodnih mogunosti i moe obuhvatiti 256 osmobitnih varijanti
istovremeno. Sa Unicode-om obezbeene su kodne vrednosti za pisanje svih savremenih
velikih jezika, kao i klasine forme nekih jezika. Dostupni alfabeti ukljuuju latinski, grki,
irilicu, jermenski, hibru, arapski, devanagari, bengalski, gurmukhi, gudarati, oraja, tamil,
teluga, kanara, malajam, tai, lao, gruzijski i tibetanski, kao i kineske, japanske i koreanske
ideograme i japansko i koreansko fonetsko i silabiko pismo. Ukljuuje, takoe, znake
interpunkcije, tehnike i matematike karaktere, strelice i mnoge raznovrsne karaktere kao to su
aka, zvezda, itd. Karakteri kao to su akcentovana slova koriena u mnogim jezicima, znaci
raspoznavanja, kao to su akcenat i tilda (talasi), obuhvaeni su, a obezbeen je i mehanizam
kombinovanja karaktera kombinovanjem tih oznaka sa drugim simbolima. Ovo ne obezbeuje

149

samo alternativno kreiranje akcentovanih slova, ve odgovara matematiarima koji po navici


prave nove karaktere dekoriui postojee. Obezbeene su kodne vrednosti za gotovo 39 000
karaktera, ostavljajui neke od kodnih poena neiskorienim.
Markap jezici kakvi su HTML i XML i programski jezik Java, koriste Unicode kao svoj
skup karaktera. Kada jednom bude usvojen kao skup karaktera veih operativnih sistema,
zadatak prenosa teksta koji koristi karaktere van SAD engleskog ASCII repertoara trebalo bi da
bude viestruko olakan.
Unicode je kompatibilan sa ISO 10646 standardom koji predstavlja dalje proirenje za
zapise koji nisu obuhvaeni sa prethodnim standardima, kao to su, na primer, notni zapisi.
ISO 10646 je 32-bitni kd karaktera, od kojih je 8 bita za 256 grupa, 8 bita za 256 ravni
za svaku od grupa i 16 bita za 65 536 karaktera u svakoj od ravni. Sa ovim standardom
ostavljene su najire mogunosti za sva budua proirenja.

8.4.2 Font
Font je izraz koji se u tipografiji koristio za skup slova jedne veliine i jednog tipa, a u
multimedijalnim tehnologijama font oznaava fajl sa glifovima i slovnim ornamentima. Font
predstavlja jednu odreenu familiju glifova.
Glif je izraz za aru, grafiki oblik i sliicu, a u multimedijalnim tehnologijama glif
oznaava spoljanji lik sa kojim se prezentira karakter.
Tekst se sastoji od nizova karaktera koji se u raunaru memoriu kao binarni kodovi
odreenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali, kodovi karaktera
se povezuju sa glifovima smetenim u glifovskim datotekama fontovima. Datoteke glifova,
odnosno fontovi, razlikuju se po stilu, dizajnu i nainu memorisanja glifova.
Glifovi predstavljaju sliice i formiraju se, kao i slike, pomou bitmapirane ili vektorske
grafike. Nain formiranja glifova uzima se kao osnova za klasifikaciju fontova koji predstavljaju
zbirku glifova.
Fontovi se, na osnovu naina formiranja glifova, dele na bitmapirane i vektorske.
Bitmapirani Bitmap ili rasterski fontovi sastavljeni su od niza taaka, piksela, pomou
kojih se prikazuje slika karaktera. Prednost ovih fontova je to se brzo oitavaju, a nedostatak to
nisu skalabilni, jer je za svaku veliinu potrebno imati poseban skup fontova.
Bitmapirani fontovi pokazuju iste karakteristike kao i bitmapirane slike klasinih formata:
.bmp bitska mapa (eng. bitmap), .png pokretna mrena grafika (eng. portable network
graphics), i .tif format oznaene slike (eng. tagged image format) ili .tiff format dat. oznaene
slike (eng. tagged image file format). Svaka platforma poseduje sopstveni format bitmapiranih
fontova, najee poboljan na neki nain, da bi efikasno radio sa rutinama sistemskog softvera
koje obrauju prikazivanje teksta.
Konturni (eng. outline) ili vektorski fontovi sadre skup instrukcija, pomou kojih se
iscrtava glif kao vizuelna predstava karaktera. Velika im je prednost to su skalabilni, odnosno,
mogu menjati veliinu. Promena veliine glifa ne utie na njegovu rezoluciju, tako da se moe
koristiti samo jedan tip datog fonta.
Konturni fontovi grade se po pravilima vektorske grafike od krivih i pravih linija, i
obino su smeteni u formate za vie platformi. Dva najee koriena formata su Adobe Type
1, koji se esto jednostavno naziva PostScript font, iako postoji jo drugih PostScript fontova, i
TrueType.

150

TrueType font originalno je uveden od strane Apple-a, ali ga vie koristi Windows nego
Macintosh operativni sistem (eng. operating system OS)) Mac OS, kod koga se zbog
popularnosti Adobe vie koristi Type 1.
Konturni fontovi mogu biti proizvoljno skalirani i isti font moe biti korien za
prikazivanje na niskoj rezoluciji ili tampanje na jako visokoj. Program za prikazivanje moe da
prevodi konturne fontove bilo koje veliine. Program Adobe Type Manager (ATM) obavlja ovu
funkciju na sistemskom nivou za Type 1 fontove.
Konturni fontovi u bilo kom od popularnih formata mogu sadrati do 256 glifova. Glifovi
u Type 1 fontu jednostavno su mali programi, napisani u ogranienom podskupu PostScripta.
Ogranienja su namenjena da uine moguim da glifovi budu efikasno prikazani na ekranu,
programima kao to je ATM, u dovoljnom kvalitetu kada se prikau na rezoluciji ekrana.
TrueType je alternativni format. Konturni karakter u TrueType fontu uva se kao serija
taaka koje definiu linije i krive inei njihov oblik.
Novorazvijeni format OpenType ujedinjuje Type 1 i TrueType fontove, obezbeujui
format fajla koji omoguava da bilo koja vrsta konturnih fontova bude sauvana. OpenType su
razvili Adobe i Microsoft zajedno 19978 godine, a pojavio se 1998 i Type 3 format.
Postoji i format Type 0 u kome elementi fonta nisu glifovi karaktera, ve drugi fontovi.
Type 0 font namenjen je za uvanje kombinovanih fontova, od kojih je svaki sastavljen od
nekoliko Type 1 fontova. Njegova glavna namena je da obezbedi veliki repertoar karaktera, koji
bi bili potrebni za korienje u saradnji sa Unicode-om.
Type 1 i TrueType sadre, pored opisa glifova, i informacije koje mogu biti iskoriene
od strane programa za prikazivanje, da bi se poboljao izgled teksta na niskim rezolucijama. Ove
informacije odnose se na izuzetno fine osobine, koje mogu izgubiti svoju finou kada se manje
piksela koristi za svaku liniju. U Type 1 fontovima nalaze se u obliku saveta (eng. hints), koji
obezbeuju vrednosti i parametre koji mogu biti iskorieni da upravljaju prikazivanjem glifova
na niskim rezolucijama. Na primer, saveti su namenjeni da izazovu smanjenje prelaza. Kao to
smo pomenuli, prelaz normalno pomae da se pobolja propisani izgled fonta. Kako bilo, na
niskim rezolucijama, kada se veliina prelaza zaokrui na najblii piksel, efekat moe biti
preteran i tekst e izgledati nepravilnije nego to bi izgledao da mala slova budu tano visine h.
Taka na kojoj e se ukljuiti smanjenje prelaza direktno zavisi od dizajna fonta, pa ne moe biti
ukljuena bez informacija koje prua sam dizajner fonta. Saveti Type 1 fontova omoguavaju
distribuciju ovih informacija. Ostali saveti srazmerno smanjuju varijacije u osnovi fonta, koje e
iako estetski ugodne na velikim rezolucijama, izgledati u najmanju ruku nejednako na niskim
rezolucijama.

8.4.3 Prikazivanje teksta na monitoru


Tekst se na monitorima raunara prikazuje pomou glifova odreenog fonta koji se
povezuje sa kodovima karaktera. Kodovi karaktera oitavaju se, iz memorije raunara, i
zamenjuju glifovima koji se prikazuju na ekranu monitora. Proces je jednosmeran jer iz teksta,
kao grafikog dizajna karaktera na ekranu monitora, ne sledi mogunost direktne povratne veze u
memoriju kodovanih karaktera prikazivanog teksta. U procesu prikazivanja na ekranu tekst
postaje grafika ija se prvobitna osnova u formi kodovanih karaktera ne moe iz grafikog oblika
lako pretraivati i menjati.

151

Problem povratka iz pisanog teksta u memoriju kodova karaktera javlja se zato to je kod
karaktera jedinstven i zauzima manje bita, dok je njegova grafika predstava glif sloenija i
zauzima vie memorije. Niz kodova karaktera kompaktniji je od niza glifova koji predstavljaju
isti tekst, pa zamena karakter kodova glifovima uveava veliinu fajla koji sadri tekst.
Grafiki prikaz teksta neefikasan je za pretraivanje i zbog toga to ne koristi ponavljajuu
prirodu teksta. Isti karakter, odnosno glif, viestruko e se ponavljati, pa ako je izvren prelaz u
glifove, mnogo kopija istog glifa e biti korieno, a svaki e biti mnogo vei nego odgovarajui
kd karaktera.
Vraanje u kod karaktere iz prikazivanog teksta moe da se ostvari na posredan nain,
pomou specijalizovanog raunarskog programa. Ako je stranica odtampana pa tekst skeniran,
rezultat je bitmapirana slika teksta. Do karaktera skeniranog teksta moe se doi pomou
specijalizovanog programa za optiko prepoznavanje znakova (eng. optical character
recognition OCR) koji analizira oblike na bitmapiranoj slici i prepoznaje koje karaktere ti
oblici predstavljaju. Ne postoji potpuna uspenost prepoznavanja ali je primena ovog programa
veoma zahvalna naroito kod digitalizacije papirnih izdanja.
Za sigurnu reprodukciju karaktera kod razmene tekstualnih dokumenata, naroito u
sluaju ree korienih fontova, postoji mogunost da se korieni font ugnezdi i alje zajedno sa
dokumentom. To poveava veliinu fajla ali obezbeuje sigurnost repliciranja.

8.4.4 Veliina, razmera i tip fontova


Veliina, razmera i tip fonta definie izgled glifova koji tom fontu pripadajaju.
Veliina i razmera fonta oznaavaju fizike dimenzije glifova: slova, brojeva i znakova
odnosno svih grafena koji pripadaju datom fontu, a izraavaju se u poenima (eng. points pt).
U digitalnoj tipografiji jedan poen je 1/72 ina, priblino 0.3528 mm. To je veoma mala
jedinica, pogodna za merenje dimenzija malih objekata kakvi su karakteri. Za malo vee
vrednosti, kakav je razmak meu linijama teksta, obino se koristi cicero (pica pc), koji je 12
poena ili 1/6 ina, 4.2333 mm. Za razliku od ostalih mernih jedinica kakvi su metar ili stopa,
poeni nemaju internacionalno priznatu standardnu veliinu. Vrednost od tano 1/72 ina je
uvedena od strane PostScript-a.
Na Slici 8.4.4.1-a prikazane su karakteristine veliine fonta. Razmera izmeu visine x i
veliine tela fonta jedna je od najvanijih karakteristika svakog fonta. Visina x nekog fonta
koristi se kao jedinica mere i obino se pie kao ex. Ima korisnu osobinu da nije apsolutna
jedinica, kao to je poen, ve je relativna, menja se kako se menja veliina fonta, i razlikuje se za
razliite fontove, ali uvek ostaje u istoj relaciji u odnosu na visinu malih slova. Tako obezbeuje
zgodan nain izraavanja vertikalne veliine koja se menja proporcionalno ovoj veliini. Srodna
jedinica je horizontalni razmak i naziva se em. Tradicionalno 1em je irok kao veliko slovo M.
Kod mnogih fontova, irina slova M jednaka je irini tela fonta pa se znaenje jednog em-a
promenilo tokom godina, i danas se najee uzima kao jedinica duine jednaka veliini fonta.
Veliina em je definisana slino kao jezik formatiranja kaskadni stil listova (eng. cascading style
sheets CSS). Dugake crte koriene za umetnute fraze dugake su 1 em i samim tim se
nazivaju em crte. Ponekad se sree jo jedna relativna jedinica en koja predstavlja osnovnu irinu
velikog slova N, i koristi se da se definie 0.5 em. Jedna en-crtica je crtica irine 1 en, i koristi se
za odvajanje stranica ili datuma, kao to je 199899 godina.

152

Svako slovo ima svoj prihvatni prostor (eng. bounding box) koji je u stvari najmanji
prostor koji moe da obuhvati to slovo. Najee se ostavlja mali razmak meu prihvatnim
prostorima susednih karaktera. Drugim reima kada crtamo glif neposredno pored drugog,
prazan prostor se umee blizu glifa, i nalazi se van prihvatnog prostora, najee levo, na
razmaku koji je poznat kao nosa leve strane (eng. left side bearing), to je prikazano na Slici
8.4.4.1-b. Ponekad, kada se dva odreena slova smeste jedno pored drugog, prostor meu njima
izgleda premali ili preveliki. Postoji mogunost podeavanja letter spacing.

Slika 8.4.4.1Veliine koje karakteriu font

Veliine koje opisuju veliinu pojedinog karaktera i razmak meu karakterima, zajedno
su poznate kao metrika fonta. Programi koji obavljaju slovoslaganje, zahtevaju pristup metrici
fonta da bi odredili gde tano da smeste glif dok prave linije, pasuse i stranice. Organizacija ovih
informacija zavisi od formata fonta, raunarskog sistema i slovoslagakog softvera koji se
koristi.
Tip fonta predstavlja dizajn sa kojim su uraeni glifovi koji pripadaju odreenom fontu.
Razvijen je veliki broj razliitih tipova fontova. Ne postoji jedinstvena klasifikacija tipova
fontova.
Najosnovnija podela fontova po tipu je na fontove fiksne veliine jednomesne i
proporcionalne fontove.
Fontovi fiksne veliine sadre glifove koji za svaki karakter horizontalno zauzima
jednaku veliinu prostora, nezavisno od svoje veliine. Neka slova imaju, oko sebe, vie praznog
mesta od drugih. Na primer, uski oblik malog slova j ima oko sebe onoliko praznog prostora
koliko je potrebno da se popuni irina malog slova .
Proporcionalni fontovi sadre glifove koji za svaki karakter zauzimaju onoliko mesta
kolika je irina slova. Na primer, slovo zauzima vie mesta od slova j. Pokazalo se da tekst sa
proporcionalnim fontovima izgleda skladnije i laki je za itanje, u veini sluajeva. Osim toga,
vie rei staje u redovima.

153

Sledea klasifikacija odnosi se na serif i sans serif (ponekad sanserif) fontove.


Serifi su crtice dodate na krajeve fontova kao na Slici 8.4.4.2. Crtice se nalaze na serif
fontovima, ali su izostavljene na sans serif glifovima, to im daje uobiajeni izgled. Serifi potiu
od tragova dleta na rimskim kamenim ploama, pa se serif fontovi nekad nazivaju i rimski.

Slika 8.4.4.2Serifi

Opta je mogunost ispisivanja slova sa vertikalnim linijama, ili koso sa italik fontom.
Italik fontovi imitiraju glifove sa slovima nagnutim na desnu stranu, ime se imitira
odreeni stil pisanja. Veina italik fontova su ili parnjaci, ili razliite varijante uspravnih fontova.
Na primer, Times italik je italik verzija fonta Times Roman. Postoje, ipak, neki italik fontovi koji
imaj svoj sopstveni dizajn, koji su obino dizajnirani da imaju izgled rukopisa, i koriste se kada
je potreban lepi, humaniji izgled od obinog kucanog teksta.
Postoje konturni fontovi koji imaju uplja slova i fontovi koji bacaju senku.
Razvijeni su fontovi koji izgledaju malo horizontalno spljoteni, kada se uporede sa
proporcijama veine fontova. Nazivaju se skraeni fontovi, i namenjeni su prilozima, kao to
su poruke na marginama ili uske novinske rubrike, gde se zahteva da tekst bude upakovan na to
manje prostora. Za razliku od ovih, fontovi koji se nazivaju proireni izgledaju horizontalno
razvueni, to ih ini pogodnijim za naslove i druge izolovane tekstualne elemente.
Fontovi se mogu klasifikovati prema teini, to jest, prema debljini crta koje ine slova.
Deblje crte ine da tekst izgleda tamnije i vre. Po konvenciji, ovi fontovi se nazivaju tekim
(debljih crta), boldfejs ili jednostavno bold. Kao i italik, bold fontovi su obino verzije fontova sa
manjom teinom. Rezultat toga je da teina nije apsolutna osobina, bold teina nekog jako lakog
fonta moe biti laka od obine teine nekog jako tekog fonta, ija bi bold verzija bila jo tea.
Neki od fontova mogu postojati u vie varijanti, predstavljajui razliite stepene teine. Pod
ovim okolnostima, pojedini stilovi se opisuju terminima kao to su: ultra-bold, semi-bold, laki i
ultra-laki.
Tekst procesori esto tretiraju podvlaenje kao stilsku opciju slinu italik ili boldu, pa se
moe pretpostaviti da su i to, takoe, podvuene verzije fontova. Podvueni fontovi veoma su
retki, jer se u tipografskim krugovima smatra da su loa zamena italizacije, pogodna samo za
slovoslagae koji nemaju italik-opciju. Kao i veina tipografske rutine, i nepoeljnost
podvlaenja je dovedena u pitanje. Poto se raznovrsniji efekti mogu postii kombinovanjem
obinih fontova sa linijama razliitih debljina, ovo preispitivanje nije dovelo do ekspanzije u
korienju podvuenih fontova.

8.5 Animacija
Animirati znai oiveti, pokrenuti, udahnuti duu (eng. to animate to get thing alive, to
make them change).

154

Animacija je postupak stvaranja iluzije o kretanju 2D i 3D objekata, slika, crtea i


modela.
Prikazivanje pokreta moe se videti na crteima iz paleolitskog doba. Nizovi slika, slino
savremenim stripovima, postoje u staroegipatskim, persijskim, indijskim i kineskim hramovima.
Ideja o animaciji je veoma stara, ali je tehniki realizovana tek krajem 19. veka, pojavom filma.
U razvoju animacije karakteristina su dva perioda. Prvi period je do poetka primene raunara
za obradu i montau slike krajem 20. veka, to se oznaava kao tradicionalna animacija. U 21.
veku, tradicionalnu animaciju potiskuje kompjuterska animacija.
Pojedinane slike od kojih se pravi niz za animaciju mogu biti snimci crtea ili modeli
objekata koji se namenski kreiraju. Animacioni niz se moe praviti i kombinovanjem
pojedinanih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za
animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije,
strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izmeu dve
susedne slike mogu biti jedva primetne, ili opaljivo primetne. Prikazivanjem niza slika dobija se
iluzija kretanja zbog perzistencije ula vida. Minimalni broj slika za doivljaj kontinuiteta,
odnosno iluzije kretanja, je niz od 12 slika u sekundi.
Proces animacije oznaava formiranje niza razliitih crtea i/ili fotografija koji se u toku
prikazivanja smenjuju dovoljno velikom brzinom, da se stvara doivljaj pokretnih slika. Svaka
pojedinana slika predstavlja jedan okvir frejm. Animacija se proizvodi frejm po frejm (eng.
a frame at a time). Princip je isti kao i kod filma i televizije, jer se slike frejmovi sukcesivno
smenjuju slino prikazivanju pomou kono-projektora. Brzina smenjivanja je 24 slike u sekundi,
25 slika u sekundi u PAL TV mrei i 30 slika u sekundi u NTSC TV mrei. U raunarskim
mreama, brzina promene frejmova moe se proizvoljno menjati. Savremena digitalna animacija
obino se projektuje, zbog ekonominosti i mogunosti interpolacije, sa manjima brojem slika u
sekundi, u odnosu na TV standarde i film.

8.5.1 Tradicionalna animacija


Tradicionalna ili klasina animacija, takoe poznata kao celuloidna cel animacija,
predstavlja formiranje pokreta pomou niza crtea, modela i objekata snimljenih na celuloidnu
traku.
Za stvaranje iluzije pokreta, potreban je veliki broj crtea koji se meusobno malo
razlikuju. Crtanje je zahtevan posao pa su se, u cilju utede vremena i materijala, traili naini da
se smanji broj crtea i izbegne ponovno crtanje istog sadraja slike. U procesu crtanja koristi se
providna folija (eng. sheets) za odvajanje statine pozadine i pokretnih objekata koji su sastavni
delovi slike. Postupak kreiranja animacije korienjem folija prikazan je na Slici 8.5.1.1. Statini
elementi crtaju se na pozadini samo jednom. Preko pozadine postavlja se transparentna, providna
folija sloj (eng. layer), na koji se crtaju oni elementi slike koji treba da se kreu ili menjaju
oblik. Pozadina je stacionarna, a providna celuloidna folija, na kojoj se crtaju slike sa kojima se
formira pokret, postavlja se, tokom crtanja i snimanja, preko pozadine. Tehnika predstavljanja
efekta putovanja kroz scenu zasniva se na kreiranju pozadine na povrini veoj od frejma slike
i pomeranjem pozadine ispod providnog lista lejera.
Kompletirani crtei snimaju se pojedinano, jedan po jedan u nizu, kako e se
reprodukovati i proizvesti iliziju kretanja. Taj je postupak nazivan animacija stani kreni.

155

Slika 8.5.1.1Ilustracija postupka kreiranja animacija koriem folija

Animacija stani kreni (eng. stop motion) zasniva se na fizikom manipulisanju


objekata koji se snimaju kadar po kadar da bi se kod prikazivanja dobila iluzija o kretanju. Sa
tehnikom stani kreni razvijeno je vie naina animacije, kao to su:

Lutkarska animacija (eng. uppet animation)


Glinena ili platina animacija (eng. clayanimation)
Animacija od iseaka (eng. cutout animation)
Animacija sa modelima (eng. model animation)
Animacija sa grafikim materijalom (eng. graphic animation)
Animacija sa glumcima pixilation

U tradicionaloj animaciji postoji 12 principa i postupaka koji se koriste i u kompjuterskoj


animaciji:

Gnjeenje i rastezanje (eng. squash and stretch) je postupak kojim se naglaava


fleksibilnost, pokret i brzina pokreta objekta ime se stvara predstava o promeni oblika i
teini crtanih objekata, a ekstremnim efektima postie se kominost.
Anticipacija (eng. anticipation) je postupak koji se koristi za pripremu publike za
predstojeu akciju animiranog objekta da bi utisak bio uverljiviji. Skaka iz mesta
priprema se savijanjem kolena, a igra golfa pravi zamah unazad.
Postavljanje scene (eng. staging) predstavlja prezentovanje ideje sredstvima usmeravanja
panje gledalaca na glavni objekt scene da bi prezentacija svake akcije, linosti i izraza
raspoloenja bila nedvosmislena.
Podeavanje vremena tajming (eng. timing) predstavlja jasno definisanje i
proraunavanje etapa planirane akcije: priprema, akcija i reakcija. Tajming se realizuje
brojem crtea ili slika za datu akciju, odnosno brzinu akcije. Dobar tajming ini da
objekti izgledaju kao da potuju zakone fizike, na primer, padanje, klizanje, sudari.
Vreme je od kljune vanosti za uspostavljanje raspoloenje lika, emocije i reakcije.

156

Planiranje i odreivanje pogodnog zavretaka akcije (eng. follow through and


overlapping action). U jednoj akciji moe biti vie planiranih kretanja ili promena koje se
ne odvijaju simultano i koji mogu da se preklapaju u vremenu.
Izbor jednog od dva postupka u procesu stvaranja animacije. Prvim postupkom se vri
kreiranje svih slika u sekvenci, od prve do poslednje (eng. straight ahead action).
Drugim postupkom se naglaava akcija i njene faze: prvo se vri kreiranje glavnih slika
scena, dok se ostale slike stvaraju kasnije (eng. pose-to-pose action).
Usporavanje kretanja u krajnjim ekstremnim takama (eng. slow in and out), lagan
ulazak i izlazak.
Luk (eng. arcs) predstalja prikazivanje putanje kretanja objekta koja moe biti prava
linija ili, to je ee i prirodnije, u obliku luka.
Preuveliavanja (eng. exaggeration) objekata ili kretanja ima za cilj da se bolje definie
neko emocionalno stanje.
Sekundarna akcija (eng. secondary action) predstavlja sporednu radnju koja se odvija
istovremeno sa glavnom akcijom sa kojom ima veze, a koristi se da naglasi realnost
glavne akcije.
Princip vrstog crtea (eng. solid drawing) uzima u obzir oblike u 3D prostoru, dajui im
jainu i teinu. Animator treba da bude vet crta i razume osnove 3D oblika, anatomije,
teine, svetlosti i senke.
Privlanost (eng. appeal) crtanih likova odgovara harizmi glumca koji ne mora da bude
simpatian i pozitivan. Vano je da gledalac osea da je lik realan i interesantan.

8.5.2 Kompjuterska animacija


Kompjuterska animacija predstavlja proces generisanja animacije pomou kompjuterske
grafike. Na slinom logikom i proceduralanom konceptu, kao tradicionalna cel animacija,
kompjuterska animacija omoguava da se niz slika generisanih u raunaru sukcesivnim
oitavanjem i elektrooptikom transformacijom prikae na ekranu, stvarajui percepciju
pokretnih i promenljivih objekata.
Kompjuterska animacija, u sutini, digitalni je naslednik tehnike stani kreni
tradicionalne animacije sa 3D modelima, i slika po slika animacije sa 2D ilustracijama.
Kompjuterski generisane animacije mogu se kontrolisati vie nego fiziki procesi. To
omoguava kreiranje pokretnih slika to ne bi bilo izvodljivo korienjem bilo koje druge
tehnologije. Takoe je omogueno da grafiki umetnik radi bez glumaca, skupe scene i rekvizita.
Za kreiranje komjuterske animacije potrebna su dizajnerska znanja, i moan raunarski
hardver i softver. Postoje 2D i 3D kompjuterske animacije. Preteno se kreiraju 2D animacije, jer
ih je lake i jeftinije realizovati. Postoje vie razliitih softverskih alata kako visoko
profesionalnih i skupih tako i besplatnih otvoreni kod otvoreni izvor (eng. open source) za
izradu animacija. Pregled ovih alata dat je u poslednjoj glavi ove knjige.
Digitalno predstavljanje slike je, u sutini, numeriko, to daje mogunost interpolacije
koja je izuzetno koristan postupak u kompjuterskoj animaciji. Raunar sa algoritmima za
interpolaciju formira meuslike i tako pomae animatoru, smanjujui mu broj kadrova koje je u
tradicionalnoj animaciji morao da crta.

157

Animacija se moe generisati uvoenjem, importovanjem svakog pojedinanog kadra


frejma u vremensku osu, odnosno animacioni niz i kreiranjem sadraja svakog pojedinanog
kadra u nizu. Takav postupak animacije poznat je kao niz fajlova sa slikama.
Niz fajlova sa slikama (eng. sequence of image files) predstavlja reprezentaciju
animacije koja je veoma fleksibilna, jer daje mogunost obrade pojedinih fajlova u izabranom
grafikom programu, pojedinaan fajl moe biti uklonjen iz sekvence, zamenjen ili dodat.
Sequence of image files moe se importovati u video-editing aplikaciju i konvertovati u format za
video isprepletani zvuk i slika (eng. audio video interleave, audio video interleaved AVI) ili
QuickTime standard za video format.
Drugi nain generisanja animacije je pomou kljunih kadrova frejmova.
Kljuni kadrovi su prvi i poslednji kadar jedne akcije. Mogu se koristiti u svakoj taki
ili momentu, u kojem postoji ili nastaje znaajna promena. Kljuni kadrovi se obino uzimaju za
karakteristine poloaje pokretanih objekata, takozvane ekstreme.
Animacija pomou kljunih kadrova (eng. key frame animation) je postupak
formiranja frejmova izmeu dva kljuna frejma in-betweeners automatski, primenom
interpolacije.
Interpolacija je matematiki postupak za proraunavanje vrednosti funkcije izmeu
poznatih taaka. Kreiranje frejmova koji posreduju izmeu kljunih frejmova oznaen kao
proces raanja bliznaka tvining (eng. tweening). U tvining-procesu, kreiraju se prvo dva
kljuna kadra koji reprezentuju odreenu promenu, zatim se crta niz progresivno razliitih
frejmova meukadrova. Kreiranje meukadrova moe da odradi raunar pomou
interpolacionih algoritama, to je prikazano na Slici 8.5.2.1.

Slika 8.5.2.1Interpolacija izmeu kljunih kadrova

Kod kreiranja kompjuterske animacije bitan parametar je putanja kretanja objekata. Na


osnovu definisane putanje kreiraju se promene izmeu kljunih kadrova.
Putanja (eng. path) odreuje promenu na objektu: veliine, boje, detalja, i promene
brzine kretanja. Putanja na osnovu koje se vri interpolacija meukadrova moe biti ili prava
linija ili neki drugi oblik, to se definie linearnim jednainama prvog reda ili Bazirijevim
krivama.
U linearnoj interpolaciji veliina pokreta, to znai promene izmeu dva susedna kadra,
konstantne su i odreene priratajem izmeu krajnjeg i poetnog kljunog kadra, podeljeno sa
brojem meukadrova.
Bazirijeva interpolacija koristi se kada polazak iz poetnog kljunog kadra i zavretak u
krajnji kljuni kadar ne treba da budu nagli, to bi se dobilo linearnom interpolacijom, ve sa
postepenim prelazima.
Kompjuterska animacija se moe kreirati vektorskim i bitmapiranim slikama.
Animacija vektorskim slikama izvodi se zahvaljujui mogunostima geometrijske
transformacije slike kao to su translacija, rotacija i skaliranje ijom se kombinacijom mogu

158

prikazati razni oblici promena i realizovati niz slika sa kojima se stvara iluzija kretanja. Za
animaciju vektorskim slikama razvijeni su specijalizovani softverski alati kao to je iroko
primenjivani Macromedia Flash.
Animacija bitmapiranim slikama izvodi se zahvaljujui mogunostima da se
bitmapirana, kao i vektorska slika, moe pomerati, rotirati i skalirati i na taj nain uticati na
karakteristike slike, kao to je srazmera, ugao i veliina ime se moe formirati niz za animaciju.
Algoritmi za navedene operacije drugaiji su, i vreme izvrenja je due nego u sluaju vektorskih
slika. Program After Efect je softverski alat za kreiranje animacije sa bitmapitanim slikama.
Za jednostavnije animacije popularna su dva postupka pod nazivom grafiki fajl format
za razmenu (eng. graphics interchange format GIF) i Sprajt animacija.
GIF fajl format jedan je od dva najee koriena raunarska grafika formata za
razmenu slika koji se moe koristiti za kreiranje malih animacija sa niom rezolucijom i paletom
od 256 boja.
GIF fajl format se koristi da bi se sauvala sekvenca slika. GIF89 fajl format moe da
kontrolie ponaanje animacije, npr. ponavljanje odreeni broj puta ili neogranieno, minimalno
kanjenje izmeu frejmova. Nedostaci su to se ne moe dodati zvuk i ogranienje na paletu od
256 boja. Ovo ogranienje se moe prevazii korienjem QuickTime video formata koji moe
da se menja, kombinuje sa drugim klipovima, pa ak i da mu se dodaju efekti.
Sprajt - sprite animacija je animacija na raunarima koja se zasniva na objektima koji se
pomeraju. Sloen pokret moe se dobiti dodeljivanjem vie slika jednom sprajtu. Sprajt
animacija se najee koristi za simulaciju hodanja kod ljudskih slika, to je prikazano na Slici
8.5.2.2, za kreiranje 2D video igrica, za razliite tipove simulacija, kao i za same prezentacije na
internetu.Vrednosti koje se menjaju pri pomeranju objekta proraunava kompjuter.

Slika 8.5.2.2Kreiranje sprajt animacije

159

8.5.3 Animacija u multimedijalnim sistemima


Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za
kreiranje najupeatljivije virtualne realnosti koja se ostvaruje trodimenzionalnim objektima,
virtualnom realnou i interakcijom to je najvie dolo do izraaja u raunarskim igrama.
Predvia se da i razvoj budue filmske industrije ide u pravcu sve vee primene multimedijalnih
animacija, aktivnim ukljuivanjem gledaoca kroz interaktivne mogunosti buduih kreacija, to
film usmerava, u odreenom smislu, na igru. Sledei odeljci su abstrakti za trodimenzionalnu
animaciju i virtualnu realnost dok se interakcija kao opta mogunost ukratko razmatra u
posebnom poglavlju.
TRODIMENZIONALNI OBJEKTI U ANIMACIJI 3D ANIMACIJA
Trodimenzionalni objekti su materijalni objekti koji zauzimaju stvarni 3D prostor kao i
nematerijalni modeli u virtualnom 3D prostoru koji se pomou svetlosti i senki doaravaju na 2D
ekranu.
Animacija trodimenzionalnih objekata 3D animacija predstavlja postupak
prikazivanja 3D objekata na 2D ekranima pomou kompjuterske grafike i specijalizovanih
softverskih alata. Konstrukcija i prikazivanje 3D objekata najee ukljuuje i proces animacije,
jer iluzija trodimenzionalnosti nije potpuna ako se objekat ne prikazuje sa raznih strana.
3D animacija nalazi primenu u raznim oblastima nauke, tehnike, umetnosti, posebno u
proizvodnji raunarskih igara.
Za kreiranje 3D animacije potrebna je sposobnost zamiljanja objekata u tri prostorne i
jednoj vremenskoj dimenziji i njihovo predstavljanje u 2D ekranu. Za renderovanje potrebni su
snani procesori i vreme. Za realizaciju ozbiljnijih 3D projekata potrebno je mnogo novca i
vremena.
Kod zahtevnijih 3D animacija, koriste se fiziki zakoni za kreiranje pokreta. Dizajner treba
da poznaje zakone kinematike. Kako se objekti kreu i ta ih pokree treba za percepciju da bude
to uverljivije. Dobar primer problematike kretanja u 3D animaciji je veza kod spojenih delova,
kao to su ruke ili noge kod ljudskih figura ili ivotinja. Ruka se moe kretati, zbog naina na
koji su delovi spojeni, samo u odreenim pravcima. Pokret gornjeg dela ruke odreuje pokret
donjeg dela ruke. Zato je zgodnije prvo pozicionirati aku na kraju ruke, zatim uskladiti pokret
njenog preostalog dela. Slino je kod animacije hoda, stopalo mora biti iznad podloge, oslonjeno
na nju pri svakom koraku. Animator podeava poloaj stopala, zatim program sam proraunava
poloaj butine i potkolenice. Ovaj oblik modelovanja se naziva inverzna kinematika.
VIRTUALNA REALNOST U ANIMACIJI
Virtuelna stvarnost (eng. virtual reality) predstavlja kompjuterski kreiranu okolinu koja
moe da simulira fiziko prisustvo objekata u realnom svetu kao i u zamiljenom svetu.
Prvobitno, izraz virtuelna stvarnost se koristio da opie doivljaj sintetikog sveta.
Ekrani koji su osetljivi na pomeranje glave korieni su da projektuju slike na korisnikove oi,
modifikujui ih dok se glava pomera, tako da korisnik ima utisak da se nalazi u 3D svetu. Postoje

160

i rukavice, koje su osetljive na pomeranje ruke. Visoka cena opreme ograniila je njeno
korienje na simulacije letenja i industrijske simulacije.
Za programiranje distribucije multimedijalnih proizvoda sa virtuelnom realnou preko
interneta koristi se jezik modelovanja virtualne realnosti (eng. virtual reality modeling language
VRML). VRML je bio jezik zasnovan na tekstu, koji je omoguavao da 3D objekti i scene
budu opisani u programskom jeziku. Poboljane verzije su VRML 1.0 i VRML 2.0.
VRML omoguava specifikaciju objekata, odnosno njihove geometrije i materijala od
koga su sastavljeni. Razliite teksture mogu biti primenjene na povrine objekta, koji e se
postaviti u 3D prostor. Scene mogu biti napravljene u uobiajenim tekstualnim editorima, ili u
programima za 3D modelovanje i osvetljene na razliite naine.
Objekti u VRML fajlu nazivaju se vorovi nodovi. Kada su ureeni hijerarhijski,
nodovi predstavljaju graf scene. Svaki VRML svet, bez obzira koliko jednostavan, predstavlja
graf scene. Graf scene sadri nodove koji opisuju objekte i njihove osobine. On sadri
hijerarhijski grupisanu geometriju da bi obezbedio audio-vizuelnu reprezentaciju objekata, kao i
uee nodova u generisanju dogaaja i mehanizmu rutiranja. Zajedniki efekat nodova u grafu
scene naziva se stanje (eng. state). Oblik noda pridruuje geometriju noda nodovima koji
definiu dati geometrijski izgled. Oblik noda bie deo transformisane hijerarhije koja ima vidljiv
rezultat, a sadraj transformisane hijerarhije bie oblik noda za neku vidljivu geometriju.
Grupisanje nodova ima polja koja sadre listu dece nodova. Svako grupisanje noda definie
koordinatan prostor za njegovu decu. Ovaj koordinatni prostor relativan je u odnosu na
koordinatan prostor noda ije je dete grupisani nod. Takav nod zove se roditelj nod. Ovo znai da
transformacija akumulira nii graf scene u hijerarhiji.

8.6 Zvuk u multimediji


Zvuk u multimediji koristi se u razliite svrhe zavisno od vrste multimedijalnog
proizvoda i informacionog sadraja koje zvuk nosi. U multimediji se koriste tri osnovna
informaciona sadraja koje zvuk moe da nosi: govor, muzika i zvuni efekti raznih zvunih
izvora. Drugo poglavlje ove knjige Osnovi audija posveeno je zvuku.
Govor u multimediji, kao osnov za jeziku komunikaciju, uenje i miljenje moe da ima
primarnu funkciju i bude vaniji od slike i teksta. Ve i bebe vie zadravaju panju na likovima
koji govore, nego na likovima koje ne prati zvuk. Percepcija praena govorom otpornija je na
smetnje i bolje se pamti. Govor u mozgu izaziva i vizuelne asocijacije.
etvrto poglavlje ove knjige posveeno je audio-vizuelnim integracijama i bimodalnosti
ljudskog govora.
Muzika u multimediji moe da bude primarna kada je slika pratea, kao u sluaju
muzikih koncerata i spotova ili da prati sliku kada ima funkciju da poboljava raspoloenje i
oseanja koja pobuuje multimedijalna prezentacija.
Zvuni efekti u multimediji koriste se da pojaavaju odreene funkcije, virtualnost i
interaktivnost multimedijalne prezentacije.
Sa aplikativnog aspekta osnovne operacije vezane za zvuk u multimediji vezane su za
procese preprodukcije, postprodukcije i reprodukcije.
U procesu preprodukcije obavljaju se snimanja zvuka i tonska reija.
U procesu postprodukcije obavlja se obrada i montaa audio signala.
U procesu reprodukcije obavlja se elektroakustika konverzija i ekvalizacija.

161

Pojednostavljena ilustracija sistema za ulnu percepciju zvuka i principa procesa


snimanja data je na Slici 8.6.1.

Slika 8.6.1Pojednostavljen prikaz ulne percepcije zvuka i principa procesa snimanja

Mikrofon je pretvara zvunih u elektrine signale to ekvivalentno radi unutranje uho


ula sluha. Interesantno je i to da kroz sluni ivac od unutranjeg uha do modanog centra za
sluh, prenos audio signala se odvija pomou elektrinih binarnih impulsa. Broj impulsa u jedinici
vremena srazmeran je intenzitetu audio signala, to odgovara impulsnoj frekvencijskoj
modulaciji, to je najpouzdaniji nain prenosa.
Raunar ima najznaajniju ulogu za sliku i zvuk. Za raunar se razvijaju programi sa sve
veim logikim mogunostima, tako da se raunar sve vie osposobljava za funkcije koje je imao
iskljuivo ljudski mozak. Na taj nain raunar je osposobljen da u multimedijalnim primenama
pretvara audio signale u tekst, odnosno da bude pisar, kao i da iz teksta sintetie govor, odnosno
da ita.
U procesu postprodukcije, analiziraju se, obrauju, i montiraju snimljeni signali zvuka.
Postoji znatan broj programa za postprodukciju zvuka kojima je posveeno sledee, deveto
poglavlje ove knjige Aplikativni softver za multimedije. Ekrani sa Slike 8.6.2 ilustruju jedan
softverski alat za multimedijalnu postprodukciju zvuka koji je razvijen u Kembridu.

Slika 8.6.2Ekrani jednog softverskog alata za analizu zvuka

162

8.7 Dodir u multimediji


Dodir hapts predstavlja stimulaciju, pobudu somatosenzora u koi za percepciju
prostornih i kinetikih karakteristika objekata.
Dorir u multimediji primenom heptik tehnologija (eng. haptic technology) omoguava
dobijanje informacije o veliini, obliku, teksturi, teini ili vibracijama objekata i uspostavljanje
interakcije u multimedijalnom sistemu.
U informaciono-komunikacionim tehnologijama, dodir se koristi od poetka razvoja
prvih ureaja ne gubei znaaj do najsavremenijih sistema. Prstima se i danas kuca tekst i
upravlja raunarom preko tastature i mia. Osim neposrednog upravljanja dodirom, razvijeni su
raznovrsni taktilni senzori koji doprinose vernijoj virtualizaciji realnih sistema.
Percepcija dodira je proces prepoznavanja objekata dodirom.
Oseaj dodira se sastoji od tri glavna oseaja koja je esto teko razdvojiti. To su:

Opipljiva, dodirna percepcija (eng. tactile perception) prima informacije preko kone
senzitivnosti kada se ovek ne kree. Dodir je senzorska stimulacija koju osoba osea
kada neto dolazi u dodir sa koom. Izaziva nekoliko tipova oseaja: temperature,
vibracija, teksture.

Percepcija pokreta (eng. kinaesthetic sense) je svest pokreta, pozicije i orijentacije delova
ljudskog tela.

Haptic percepcija koristi informacije oseaja dodira i pokreta.

Oseaj pokreta moe biti rezultat akcije oveka aktivni dodir, koji ukljuuje signale
koje mozak alje u miie, ili moe biti od sila izvan tela pasivni dodir.
Aktivna haptic percepcija, kada se uzimaju informacije o objektu izvan tela, glavna je
informacija oseaja koja se pridruuje interfejsu dodira.
Interfejsi dodira su ureaji koji mere kretanje i obezbeuju pobudu senzora od
korisnikih ruku i prstiju. Interfejs dodira daje informacije kompjuteru zasnovane na poziciji
ureaja i stimuliu korisnikov oseaj dodira snabdevanjem izlaza u formi sile povratne sprege i
dodira. Interfejsi dodira omoguavaju korisniku da dodirne, oseti, manipulie, stvara ili menja, sa
njegovim rukama ili prstima, objekte prisutne na displeju raunara, kao da su oni realni fiziki
objekti. To je ostvareno paljivim merenjem sile koju bi neko oseao kada dodirne realan
objekat. Prezentovanjem tih sila korisniku, korienjem sile povratne sprege i dodirne
sposobnosti displeja heptik ureaja, stvara se iluzija dodirivanja objekta.
Nain ostvarivanja komunikacije preko taktilnog ekrana prikazan je na Slici 8.7.1.
Primena heptik tehnologije kod mobilnih telefona prikazana je na Slici 8.7.2.
Interfejsi dodira, na osnovu interakcije izmeu korisnika i maine, mogu se klasifikivati
kao:

Zasnovani na prstima: dodaju se prstima i odgovaraju na kretanje prstiju.


Zasnovani na rukama: korisnik ostvaruje interakciju sa ureajem stezanjem krute sprave.
Maina daje ljudskoj ruci oseaj sile koja je dodeljena raznim sluajnim manevrima.

163

Slika 8.7.1Komunikacija preko taktilnog ekrana

Slika 8.7.2Komercijalna primena heptik tehnologije kod mobilnih telefona

Spoljanji skelet (eng. exoskeletal): prati kretanje ramena, ili ak celog tela,
dozvoljavajui visoku interaktivnost, ali i ekstremno visoke cene. Te maine se koriste u
medicini, za ljude sa nekim nemogunostima, u vojsci.
Sutinski pasivni ureaji (eng. inherently passive devices) ili inteligentni pomoni ureaji
(eng. intelligent assist devices): pasivni roboti za direktnu fiziku interakciju sa ovekom
operatorom.

164

8.8 Miris u multimediji


Miris (lat. olfactus, nem. geruch, eng. odor ili odour) predstavlja oseaj (eng. sense)
prisustva odreene supstance u vazduhu to detektuju hemoreceptori nosa povezani olfaktornim
ivcem (eng. olfactory nerve) sa modanim centrom za miris. ulo mirisa nalazi se u nosu i
detektuje koncentraciju supstanci koje su u gasovitom stanju rastvorene u vazduhu. Pomou
hemoreceptora, na slinom principu kao ulo mirisa, funkcionie ulo ukusa koje detektuje
koncentraciju supstance u tenom stanju.
Receptorski neuroni za miris su specijalizovane elije koje mogu da transformiu prisutne
molekule mirisa u povorku akcionih potencijala koje alju u mozak snadbevajui, na taj nain,
centar za miris informacijama o prisustvu odreene supstance u vazduhu. Na Slici 8.8.1-a
prikazan je princip percepcije mirisa bioloki nos. Intenzitet mirisa je u direktnoj srazmeri sa
elektrinim odzivom elija za miris (eng. olfactory cell). elije organa za miris koriste jedan
mali deo od ukupno 1000 receptora. elije prepoznaju odreeni miris selektovanjem koji e
receptori imati odziv. U nosu postoje oko 10 miliona olfactory cells. Postoji najmanje 1000
razliitih vrsta receptora mirisa (eng. olfactory receptors), ali svaki prepoznaje i odgovara samo
jednoj vrsti mirisa (eng. fragrance). Svaka elija mirisa moe upotrebiti samo nekoliko njenih
receptora odjednom. Svaki molekul se kombinuje sa jednim brojem receptora u promenljivom
stepenu i proizvodi se karakteristian odziv. Karakteristino je da miris nije aditivan, sabiranjem
dva razliita mirisa dobija se u potpunosti nov, razliiti miris. Miris je najkompleksniji ljudski
oseaj.
Istraivanja mirisa, za koja je najvie zainteresovana farmaceutska industrija, kao i vojska
zbog hemijskih i biolokih detektora, prenose se i u oblast informatike. Najnovija istraivanja
idu ka modelovanju ponaanja elije za miris.
Miris u multimediji predstavlja novi medij za koji se razvijaju senzori mirisa i generatori
mirisa. Uvoenjem mirisa menja se dosadanje iskustvo u interaktivnom domenu. Miris se uvodi
u filmove, igre, animaciju, ili neki drugi oblik digitalnog medija.
Senzori mirisa predstavljaju sonde koje detektuju prisustvo koncentracije odreene
supstance u vazduhu i generiu signale mirisa.
Generatori mirisa su ureaji koji kontroliu isparavanje odreene mirisne supstance.
U multimedijalnom sistemu koji ukljuuje i medij mirisa, interfejsi za miris detektuju ili
reprodukuju miris. Postoje dva tipa interfejsa za miris: ulazni interfejs za miris i izlazni sistem za
miris.
Ulazni interfejs za miris ine senzori mirisa koji detektuju prisustvo supstance u gasnom
okruenju. Ulazni interfejs za miris zove se i elektronski nos (eng. electronic nose, e-nose).
Elektronski nos je ureaj koji oponaa nain delovanja olfaktornog sistema oveka
korienjem niza senzora koji mogu simulirati odziv na miris, sa ciljem prepoznavanja sloenih
mirisa. Koristi se za sakupljanje i interpretaciju mirisa. Na Slici 8.8.1-b prikazan je osnovni
koncept projekta e-nosa. Elektronski nos je instrument kojim se analizira miris i isparljiva
organska jedinjenja (eng. volatile organic compounds VOCs).
Isparljiva organska jedinjenja su organska, hemijska jedinjenja koja imaju znaajne
pritiske pare (eng. vapor pressures) i koja mogu uticati na okolinu i ljudsko zdravlje.
Na nain slian ljudskom nosu, elektronski nos doputa globalnu analizu isparljivih
organskih jedinjenja generisanih tenim, gasovitim ili vrstim uzorcima.

165

Elektronski nos za analizu mirisa se sastoji od tri dela: sistema uzoraka (eng. sampling
system), detekcionog sistema (eng. detection system), sistema prikupljanja podataka (eng. data
acquisition) i sistema za obradu (eng. processing system).
Molekuli gasa interaguju sa senzorima vrstog stanja, sa tanjim ili debljim filmom od
senzorskog materijala, absorbcijom, adsorbcijom ili hemijskim reakcijama. Senzorski ureaj
detektuje fizike i/ili hemijske promene nastale tim procesima i te promene se mere kao jedan
elektrini signal.

Slika 8.8.1Osnovni koncept projekta elektronskog nosa: a) bioloki nos, b) e-nos

Molekuli mirisa se transliraju u e-nos korienjem tehnike odabiranja. Jedan odmerak


prolazi kroz niz senzora i prouzrokuje reverzibilnu fiziku i/ili hemijsku promenu u senzorskom
materijalu, koja dalje prouzrokuje odgovarajuu promenu elektrinih pojava, kao to je
provodljivost. Svaka elija u nizu se ponaa kao receptor dajui razliiti stepen odziva za
razliite mirise. Te promene se pretvaraju u elektrine signale koji se dalje analiziraju. Sistem enosa je tako napravljen da je ukupan odziv niza senzora jedinstven za dati miris iz skupa mirisa
koji se razmatraju sistemom.
Detekcione tehnologije koje se koriste su: senzori gasa (eng. metal oxide sensors
MOS), ekstremno brza hromatografija gasa (eng. ultra fast gas chromatography), fingerprint
spektrometrija mase (eng. mass spectrometry), blago jonizovana spektrometrija mase (eng. soft
ionized mass spectrometry).
Postoje tri razliita pristupa za ovu vrstu ulaznih ureaja:

166

Hromatografija gasa: odvajanje, identifikacija i odreivanje hemijskih komponenti u


kompleksnoj smei koristei razlike u migration rates du komponenata;
Spektrometrija mase: detekcija modela molekula koristei razliku mere masa-naboj (eng.
mass-to-charge ratio) jonizovanih atoma;
Hemijski senzorski niz (eng. chemical sensor arrays): odziv niza hemijskih senzora se
koristi za identifikaciju komponenti gasa.

Najvei broj postojeih hemijskih senzora je dizajnirano za detekciju specifinih


molekula. Senzori gasova se esto kombinuju u jedan elektronski nos.
Izlazni interfejs za miris sainjavaju moduli koji integriu odreeni hardver i softver za
generisanje mirisa. Hardverski deo proizvodi miris, softverski deo razvija matematike modele
za miris i generie specifine signale za specifine mirise koji e biti proizvedeni sa hardverskim
ureajem. Hardverski ureaj je prikljuen na kompjuterski sistem. Za njega postoji drajver
program koji razvija digitalne jednaine za generisanje specifinog gasa.
Displeji mirisa Mirisni displeji su elektronski ureaji koji mogu da proizvedu i
ostvare pobudu mirisa na osnovu digitalnih podataka otisaka. Proces je nazvan i virtualni miris
a sistem virtualni mirisni displej.
Signali mirisa, u poreenju sa signalima slike i zvuka, relativno veoma sporo se menjaju
zbog ega je njihov spektar viestruko ui od spektra audio i video signala. Pridruivanje ovih
signala tonu i slici prvenstveno zavisi od ideja i opredeljenja dizajnera, jer njihovo memorisanje,
obrada i prenos ne predstavlja problem zbog toga to praktino neznatno optereuju
multimedijalni sistem.

8.9 Interakcija u multimediji


Interakcija u multimediji predstavlja meusobno delovanje izmeu korisnika i
multimedijalnog sistema, a ostvaruje se tako to korisnik upravlja sofisticiranim sistemom na
osnovu njegovog odziva. Upravljanje (eng. control) se vri na osnovu povratne sprege (eng.
feedback). Sistem obrauje ulazne informacije, proizvodi odziv i prikazuje rezultat korisniku.
Interakcija se ostvaruje preko interfejsa.
Interfejs je deo sistema u kome se sa jedne strane obavlja digitalizacija signala koji su
fiziki nosioci informacija i uvodi ih u procesor, a sa druge strane vri prevoenje memorisanih
informacija u fizike nosioce za reprodukciju signala u prirodnom obliku.
Interfejs se sastoji od senzora i pokretaa.
Senzori (eng. sensors) su komponente koje pretvaraju signale iz spoljanjeg sveta u
elektrine signale za ulaze multimedijalnog sistema koji proizvodi virtuelni domen. Ulazi
senzora mogu biti: pokret koji predstavlja kinetiki signal, zatim svetlosni, zvuni i/ili
elektromagnetni signal.
Pokretai (eng. actuators) su ureaji na izlazu multimedijalnog sistema koji na osnovu
elektrinih signala proizvode odgovarajua dejstva perceptibilna od strane oveka.
Odziv sistema (eng. system feedback) moe biti aktivan i pasivan.
Pasivni odziv je onaj koji nije generisan od sistema.
Aktivni odziv je onaj koji generie sistem i kontrolisan je od strane korisnika.

167

Kompjuter, kao jedan elektronski sistem, generie odzive preko izlaznih ureaja u
interfejsu, koju su perceptibilni za oveka. To su virtuelni odzivi jer oni nisu stvarno tu, ali mogu
biti perceptovani.
Multimodalni interfejsi omoguavaju korisniku da uje, vidi i osea virtuelni svet.
Audio-vizuelni multimedijalni tipovi podataka mogu biti: diskretni ili statini podaci i
kontinualni ili dinamiki podaci.
Diskretni podaci su oni koji ne zavise od vremenske ose: tekst, grafika i slike.
Kontinualni podaci audio i video zavise od vremenske ose, kompleksniji su od diskretnih
podataka, upotrebljavaju mnogo bolje kompresione i dekompresione algoritme i sofisticirane
operacije za njihovu interpretaciju i manipulaciju.
Generisani mediji su razliite vrste kompjuterski generisanih prezentacija, kao to su
animacija i muzika. Kada su memorisani u audio i video fajlove, nema razlike u odnosu na audio
i video podatke. Ako su generisani u realnom vremenu koristei specifine ureaje i instrumente,
tretiraju se kao posebni mediji. Generisani mediji zasnovani su na interakciji ovek kompjuter
zbog ega se oznaavaju kao interaktivni mediji.

8.10 Rezime
Sa aplikativnog aspekta, multimedija je informaciono-komunikacioni proizvod
raunarskih tehnologija koji pomou integrisanih hardversih i softverskih ureaja prikazuju
pojave za ulo vida, sluha i dodira, a u novije vreme i za ulo mirisa.
Multimedijalna delatnost predstavlja multidisciplinarnu oblast koja obuhvata razne
tehniko-tehnoloke, ekonomske, socioloke i umetnike postupke.
Proces stvaranja multimedijalnog dela zapoinje definisanjem projektnog zadatka
kojim se izraavaju potrebe, postavljaju ciljevi i definiu ogranienja.
Karakteristine su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija,
produkcija i postprodukcija.
Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta u kojoj se
razrauju zahtevi naruioca, definiu ciljevi, analizira interesna grupa, postavljaju zadaci,
odreuje anr, vrsta medija, sadrina proizvoda, sastavlja detaljan pregledan plan, najee u
vidu ilustrovane prie koja je, zbog veanja na tablu, nazvana storibord.
Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se
neposredno formira sadraj koji e se ugraivati u proizvod. Zavisno od kompleksnosti
proizvoda koristi se raunar, kamera, glumci, kostimi, studio i scenografija.
Multimedijalna postprodukcija predstavlja zavrnu fazu realizacije projekta u kojoj se
formira konana verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija
se svodi na urednitvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to montaa.
Prostor i vreme su fizike veliine koje imaju presudnu ulogu u svim fazama realizacije
multimedijalnog projekta.
Angaovani multimedijalni resursi definiu se na osnovu prostornih i vremenskih
parametara informacionih sadraja multimedijalnog proizvoda.
Prostorni domen informacionih sadraja odreuje potrebnu veliinu, odnosno kapacitet
memorijskih resursa.
Vremenski domen informacionih sadraja odreuje zahtevanu propusnu mo, odnosno
kapacitet prenosnih resursa komunikacionog sistema.

168

Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih


elementa i u novije vreme mirisa.
Slika u multimediji predstavlja najzahtevniji sadraj koji se obrauje na nivou
pojedinanih piksela, na nivou pojedinanih slika, frejmova kao i skupovima slika pokretnih
slika, videa i animacija. Za obradu slika potrebni su moni hardverski resursi, a za prenos veliki
kapaciteti prenosnog kanala. Da bi se ublaili zahtevi za korienje multimedijalnih resursa
nuna je kompresija video signala.
Multimedijalni proizvodi mogu sadrati bitmapirane i/ili vektorske slike.
Pokretne slike se formiraju od niza pojedinanih slika koje se smenjuju dovoljnom
brzinom da se u procesu percepcije, zbog inercije ula vida, ostvari doivljaj kontinuiteta.
Tekst u multimediji tretira se kao skup karaktera koji se u raunaru memoriu kao binarni
kodovi odreenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali kodovi
karaktera povezuju se sa glifovima smetenim u glifovskim datotekama fontovima. Datoteke
glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i nainu memorisanja glifova. Font je
izraz koji se u tipografiji koristio za skup slova jedne veliine i jednog tipa, a u multimedijalnim
tehnologijama font oznaava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu
odreenu familiju glifova. Glif je izraz za aru, grafiki oblik i sliicu, a u multimedijalnim
tehnologijama glif oznaava spoljanji lik kojim se prezentira karakter.
Animacija u multimediji predstavlja kreiranje virtuelnog sveta od velikog broja
pojedinanih slika koje se sukcesivno snimaju i prikazuju kao niz koji stvara doivljaj pokretnih
slika.
Pojedinane slike od kojih se pravi niz za animaciju mogu biti fotografije crtea ili
objekata koji se namenski kreiraju. Animacioni niz se moe praviti i kombinovanjem
pojedinanih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za
animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije,
strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izmau dve
susedne slike mogu biti jedva primetne ili opaljivo primetne. Prikazivanjem niza slika dobija se
utisak kretanja zbog perzistencije ula vida.
Za kreiranje animacije nephodna su dizajnerska znanja kao i moan raunarski hardver i
softver. Postoje 2D i 3D kompjuterske animacije. Preteno se kreiraju 2D animacije, jer ih je
lake i jeftinije realizovati. Postoje vie razliitih, kako visoko profesionalnih i skupih, tako i
jeftinih i besplatnih open sors softverskih alata za izradu animacija.
Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za
kreiranje najupeatljivije virtualne realnosti koja se ostvaruje 3D objektima, virtualnom
realnou i interakcijom, to je najvie dolo do izraaja u raunarskim igrama.
Zvuk u multimediji koristi se u razliite svrhe, zavisno od vrste multimedijalnog
proizvoda i informacionog sadraja koje zvuk nosi. U multimediji se koriste tri osnovna
informaciona sadraja koje zvuk moe da nosi: govor, muzika i zvuni efekti raznih zvunih
izvora. Drugo poglavlje ove knjige Osnovi audija posveeno je zvuku.
Govor u multimediji koji nosi informacioni sadraj, moe da ima primarnu funkciju i
bude vaniji od slike i teksta. etvrto poglavlje ove knjige posveeno je audio vizuelnim
integracijama i bimodalnosti ljudskog govora.
Muzika u multimediji moe da bude primarna kada je slika pratea, kao u sluaju
muzikih koncerata i spotova, ili da prati sliku kada ima funkciju da poboljava raspoloenje i
oseanja koja pobuuje multimedijalna prezentacija.

169

Zvuni efekti u multimediji koriste se da pojaavaju odreene funkcije, virtualnost i


interaktivnost multimedijalne prezentacije.
Dodir u informaciono-komunikacionim tehnologijama uopte, kao i u multimedijalnim
sistemima posebno, postoji od poetka razvoja prvih ureaja, ne gubei znaaj do
najsavremenijih sistema. Prstima korisnika i danas se kuca tekst i upravlja raunarom preko
tastature i mia. Danas se ve iroko primenjuje heptik tehnologija neposrednog upravljanja
dodirom, kao to je to sluaj u kod mobilnih telefona. Razvijeni su raznovrsni specijalizovani
heptik sistemi koji doprinose vernijoj virtualizaciji realnih sistema.
Miris u savremenoj multimediji ne predstavlja nedostini novi medij, jer su ve razvijeni
senzori i generatori mirisa.
Senzori mirisa predstavljaju visoku tehnologiju i skupe su komponente koje se ugrauju u
sistem oznaen kao elektronski nos.
Generatori mirisa su ureaji koji kontroliu oslobaanje mirisa iz odreenih rezervoara.
Elektronski signali od senzora koji detektuju dodir i miris su, u poreenju sa signalima
slike i zvuka, sporo promenljivi signali. Spektar signala dodira i mirisa viestruko je ui od
spektra audio i video signala. Pridruivanje ovih signala tonu i slici prvenstveno zavisi od ideja i
opredeljenja dizajnera jer njihovo memorisanje, obrada, i prenos ne predstavlja problem imajui
u vidu da praktino neznatno optereuju multimedijalni sistem.
Interakcija u multimediji predstavlja meusobno delovanje izmeu korisnika i
multimedijalnog sistema, a ostvaruje se tako to korisnik upravlja sofisticiranim sistemom na
osnovu njegovog odziva. Upravljanje (eng. control) se ostvaruje na osnovu povratne sprege
(eng. feedback). Sistem obrauje ulazne informacije, proizvodi odziv, i prikazuje rezultat
korisniku. Interakcija se ostvaruje preko interfejsa.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

ta je projektni zadatak?
ta je multimedijalna preprodukcija?
ta je multimedijalna produkcija?
ta je multimedijalna postprodukcija?
ta je prethodna analiza u preprodukciji?
ta je storibord?
ta predstavlja slika u multimediji?
ta su primarne boje?
ta su sekundarne boje?
ta su tercijarne boje?
ta predstavlja aditivno meanje boja?
ta predstavlja subtraktivno meanje boja?
Iz ega se sastoji elektronska kamera?
ta predstavlja bitmapirana slika?
ta predstavlja rezolucija slike?
ta je vektorski generisana slika?
170

17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.

Koji su osnovni elementi za formiranje vektorske slike?


Kakve su vektorske slike u poreenju sa bitmapiranim slikama?
ta predstavljaju pokretne slike na prezentacionim medijima?
Pomou ega se obavlja proizvodnja pokretnih slika?
ta predstavlja filmska tehnika?
ta predstavlja video tehnika?
ta predstavlja tekst u multimediji?
ta predstavlja karakter?
ta predstavlja font?
ta predstavlja glif?
Koji su standardi za digitalnu reprezentaciju karaktera?
Kako se fontovi mogu klasifiovati?
ta predstavlja animacija?
ta predstavljaju tradicionalne animacije?
ta predstavlja kompjuterska animacija?
Kako se koristi zvuk u multimediji?
Kako se koristi dodir u multimediji?
Kako se koristi miris u multimediji?
ta predstavlja i kako se ostvaruje interakcija u multimediji?

Literatura
[8.1]

[8.2]
[8.3]
[8.4]
[8.5]
[8.6]
[8.7]
[8.8]
[8.9]
[8.10]
[8.11]

H. Harrison, T. Loveland, V. Deaton, and K. Squibb, Film technology, in The TECHKnow Project: High School Student Edition 2., R. Peterson, Ed. Cincinnati, OH: Centre
Pointe Learning, 2005, pp. 1823.
Ireland Department of Education and Science. Storyboards: www.fis.ie/default.
asp?PageName =Lesson7.
E. L. Counts, Multimedia Design and Production for Student and Teachers.
Pearson/Allyn and Bacon, 2004.
V. Ray, Multimedia for Designers. New York, Delamar Cengage Learning, 2008.
N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
T. Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.
D. E. Knuth, Metafont. Addison-Wesley, 1986.
B. Kerr, Effective use of audio media in multimedia presentations, Middle Tennessee
State University, 1999.
B. L. Mann, The evolution of multimedia sound, Computers and Education, 2007.
http://de.wikipedia.org/wiki/Haptische_Wahrnehmung

171

9. APLIKATIVNI SOFTVER ZA MULTIMEDIJE


Aplikativni softver za multimedije su raunarski programi koji se koriste kao sredstvo,
odnosno alat za izradu multimedijalnih proizvoda.
Proizvodnja softvera, te specifine meke robe, veoma je zahtevan posao u koji treba
uloiti puno pameti i jo vie vremena, to iziskuje velika finansijska ulaganja u rad. Cena
softvera, slino kao i kod opipljivih roba, zavisi od uloenog rada i broja korisnika, odnosno
veliine serije. Kompleksni i skupi proizvodi ne mogu imati velike serije i obrnuto, jednostavniji
proizvodi su jeftiniji zbog manjih poetnih ulaganja i mogunosti da budu pristupani veem
broju korisnika.
Postoje vie klasifikacija aplikativnog softvera od kojih je dobro znati onu koja se odnosi
na njegovu dostupnost. Osnovna podela se odnosi na vlasnika prava.
Vlasniki softver (eng. Proprietary software) su raunarski programi koji su licencirani
sa ekskluzivnim legalnim autorskim pravima copyright. Licenca daje pravo korienja softvera
pod odreenim uslovima. Nije dozvoljena modifikacija i distribuiranje.
Softver u javnom vlasnitvu (eng. Public domain software) nekomercijalan je softver,
nema autorskih prava i moe se slobodno preuzimati i koristiti.
GNUs je dizajn slian Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadri
Unix kod (eng. Gnus Not Unix GNU). GNU opta javna licenca (eng. General Public
License GPL), GNU GPL ili GPL, je slobodna softverska licenca copyleft license koja
omoguava da se izvedeni posao moe distribuirati pod uslovima koje definie licenca.
Slobodan softver (eng. Free software) su programi licencirani od vlasnika sa tolerantnim
uslovima. Generalno je dostupan i besplatno, ili sa mnogo niom cenom u odnosu na Vlasniki
softver. Dozvoljena je modifikacija softvera. Ovakvi softveri nemaju garanciju i ne dodeljuju
zakonsku odgovornost.
Slobodan softver i Softver otvorenog koda (eng. Free and Open source software) je
softver koji je slobodno licenciran da odobri pravo korisnicima da koriste, ili menjaju dizajn, sa
dostupnim izvornim kodom softvera. Re slobodan (eng. free) odnosi se na slobodu da se softver
kopira i ponovo koristi, sloboda u filozofskom smislu rei koju softver daje korisniku. Re
Softver otvorenog koda fokusira na percepciju jaine razvoja modela. Softver otvorenog koda
moe se instalirati na vie raunara istovremeno, dozvoljen je pristup izvornom kodu za
prepravke.
Slobodnorobni softver (eng. Freeware software) su programi dostupni za upotrebu
besplatno, ali obino sa jednim ili vie ogranienjem korisnikog prava.
Komercijalni softver (eng. Commercial software, payware software) proizveden je za
prodaju, ili slui u komercijalne svrhe. Komercijalni softver je najee Vlasniki Proprietary

172

softver ali moe biti i free software i free and open source software. Prilikom kupovine programa
kupac dobija binarnu verziju programa. Licencirani program iskljuuje pristup kodu, prepravke,
promene tehnike prirode i umnoavanje.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Za razvoj multimedijalnih proizvoda postoji mnotvo programskih alata za realizaciju
projekata za razliite namene i nivoe sloenosti. Osnovna podela po nameni su alati za izradu
multimedijalnih prezentacija, obradu slike i alati za obradu zvuka.
Ovladavanje vetinom pravljenja multimedijalnih proizvoda dobro je zapoeti izradom
najjednostavnijh prezentacija sa ureivanjem i kreiranjem mirnih slika, nastaviti sa digitalnim
video editovanjem, raditi zatim sa multimedijalnim prezentacijama da bi se ovladalo izradom
ozbiljnih prezentacija sa multimedijalnim interaktivnim sadrajem. Izrada animacija i filmova,
kao najvii multimedijalni nivo, zahteva i najvii profesionalizam, znaajan utroak vremena i
budeta.
Profesionalno uraeni multimedijalni proizvodi odlikuju se visokim kvalitetom dizajna i
ugraenim mogunostima za interakciju sa korisnikom. Rade se pomou monih softverskih
alata, ili programskih jezika, zbog ega je potrebno da dizajner ima neophodna struna i
programerska znanja. Za multimedijalnu produkciju postoji vie softverskih alata i programskih
jezika razliitih mogunosti, namena i cena. Izbor zavisi kako od vrste multimedijalnog
proizvoda tako i od znanja i afiniteta dizajnera.

9.1 Softverski alati za izradu multimedijalnih prezentacija


Multimedijalne prezentacije predstavljaju zdrueno prikazivanje tekstualnih, slikovnih i
zvunih informacija. Za izradu multimedijalnih prezentacija postoji vie programskih paketa
koji omoguavaju izradu raznovrsnih multimedijalnih prezentacija. Ovde je dat pregled
najpoznatijih.
PowerPoint je program za izradu prezentacija koji je jo krajem osamdesetih godina
prolog veka lansirao Microsoft i stalno ga usavravao tako da najnovije verzije omoguavaju
jednostavnu izradu multimedijalnih prezentacija programiranom promenom sadraja.
HiperStudio, kreiran u Microsoft-u, slian je PowerPoint-u, ali sa neto veim
mogunostima za ostvarivanje interaktivnosti.
Velike mogunosti za izradu multimedijalnih proizvoda, uz pristupanu cenu, nudi
komercijalni programski paket Macromedia Flash.
Flash je moan softverski alat, ije je prve verzije lansirala Macromedia, zatim preuzela
Adobe, predvien je za izradu razliitih prezentacija, od interaktivnih veb stranica do animiranih
filmova. Poseduje odlina uputstva, lak je za uenje i veoma je efikasan. Tehnike su mu
prednosti to podrava vektorsku grafiku sa visokom rezolucijom, brzim operacijama i visok
stepen interakcije sa veoma malim datotekama. Macromedia Director i Macromedia Authorware
su bili prvi alati za multimediju. Director prua velike mogunosti za dizajniranje pokreta.
Authorware je sofisticirani paket za dizajniranje interaktivnih instrukcija. U savremene verzije
Flash-a ugraene su mogunosti oba ova programska paketa.

173

Dreamweaver je predvien za konstrukciju interaktivnih veb sajtova, a koristi se kao


odlina platforma za isporuku i prikazivanje multimedijalne produkcije uraene u Flash-u.
Slian je sa Adobe GoLive i Microsoft Front Page.
After Effects je za kreiranje pomeranja i animacija ono to je Photoshop za mirne slike.
Ovaj programski paket omoguava dizajniranje u dve i tri dimenzije, i kreiranje efekata za
korienje u drugim softverima za multimedije.
Ulide GIF Animator veoma je popularan i jeftin programski paket za pravljenje
pokretanja grafikih slika i jednostavnih animacija na vebu, oznaenih kao Graphics Interchange
Format GIF.
QuickTime i Real Media su programski paketi sa velikim mogunostima za ureivanje,
beleenje zvuka, konverziju, i eksportovanje razliitih datoteka, od jednostavno animiranh gifova
do digitalnog video striminga.
Dizajniranje veb stranica mogue je ostvariti linijskim kodovanjem. Popularni jezici za
kreiranje veb stranica su Hiper Text Markup Language - HTML, Java i Javascript.
Linijsko kodovanje moe se u izvesnoj meri ostvariti i pomou Flash-a. Actionscript je
programski paket koji ima jo vee mogunosti za linijsko kodovnje.
Dizajneri pomou linijkog kodovanja mogu da ostvare najrazliitije efekte i
visokoprofesionalne kreacije. Da bi to ostvarili potrebno je, pre svega, da se familijarizuju sa
softverima za linijsko kodovanje, to zahteva vreme i strpljenje.
Za multimedijalnu, kao i za svaku, kreaciju, pored znanja, koje se podrazumeva, dizajner
treba da ima sklonost i ljubav prema poslu na koji se troi puno vremena.

9.2 Softverski alati za obradu slika


Softverski alati za obradu slika su programi pomou kojih se mogu menjati
karakteristike pojedinanih slika i sekvence slika do konano prihvatljive verzije za njihovo
prikazivanje.
Izbor alata zavisi od vrste i kompleksnosti multimedijalnog proizvoda, odnosno od toga
ta je potrebno da se sa slikama radi. U najjednostavnije operacije spada odabir i ureenje niza
slika, to se oznaava kao editing. Pomou raunara radi se editovanje digitalnih slika, odnosno
slika koje su u raunaru memorisane kao matrica digitalnih cifara.
Editovanje digitalnih slika predstavlja obradu ureivanja mirnih slika kao to su
manipulacije, obrezivanje, promena veliine i filtriranje i kreiranje slika, poetna je osnova za
bavljenje multimedijom.

9.2.1 Softverski alati za obradu bitmapiranih slika


Softverski alati za obradu bitmapiranih slika omoguavaju poboljanje kvaliteta slika i
njihovo prilagoavanje krajnjoj nameni. Razvijeno je vie softverskih alata od kojih su ovde
pobrojani samo najpoznatiji.
Adobe Photoshop ili samo Photoshop softverski je alat namenjen za generisanje i obradu
bitmapiranih slika, koji ima mogunost za interpolaciju na osnovu vrednosti najblieg susednog
piksela, bi-linearnu interpolaciju i bi-kubnu interpolaciju.

174

Corel Painter je softverski alat koji se moe kvalifikovati kao elektronska slikarska
etkica, to omoguava umetnii rad sa slikama. Program usko specijalizovan prvenstveno za
crtanje i slikanje. Koriste ga slikari i crtai, manje dizajneri i oni koji se bave obradom slike.
Dobro simulira alate za crtanje, kao to su olovka, pero, temper.
Corel PHOTO-PAINT, obino je u sastavu CorelDRAW paketa programa namenjenih
generisanju i obradi grafike. Moe se koristiti kao alternativa Photoshop-u.
Macromedia Fireworks, obino je u sastavu paketa sa programima kao to su Flash i
Dreamweaver, prvenstveno se koristi za generisanje i obradu bitmapiranih slika namenjenih veb
stranicama.

9.2.2 Softverski alati za obradu vektorskih slika


Za obradu vektorskih slika postoji vie softverskih alata od kojih su najpoznatiji Adobe
Illustrator, CorelDRAW i Macromedia FreeHand.
Adobe Illustrator jedan je od najkorienijih programa za izradu i obradu vektorske
grafike koji prua mogunost umetnikog stvaranja. Radni ekran ovog programa prikazan je na
Slici 9.2.2.1-b.
Macromedia FreeHand je program za generisanje i obradu vektorskih slika koji
poseduje dobru interaktivnost sa softverskim proizvodima Macromedia. esto se koristi za
stvaranje i obradu slika za Flash aplikaciju. Radni ekran ovog programa prikazan je na Slici
9.2.2.1-a.

Slika 9.2.2.1Radno okruenje programa Adobe: a) FreeHand i b) Illustrator

Corel DRAW je program koji se koristi za generisanje i obradu vektorskih slika i teksta, a
sadri neke jednostavnije alate za obradu bitmapiranih slika. Na Slici 9.2.2.2-a prikazan je radni
ekran programa CorelDRAW a na Slici 9.2.2.2-b prikazano je radno okruenje programa Flash.

175

Slika 9.2.2.2Radno okruenje programa Adobe : a) CorelDRAW i b) Flash

9.2.3 Softverski alati za editovanje pokretnih slika


Editovanje pokretnih slika (eng. video editing) predstavlja osnovnu aktivnost u procesu
postprodukcije, kada se od video materijala snimljenog i pripremljenog u procesu produkcije
kreira konana verzija video proizvoda. Kod video editovanja osnovna manipulacija je video
montaa, to znai ureivanje niza slika u cilju dobijanja konane verzije pokretnih slika.
Prethodnica video editing-a je montaa filma.
Montaa filma (eng. film editing) je proces kreiranja konane verzije filma u zavrnoj
fazi filmske postprodukcije to predstavlja umetniki in koji se svodi na seenje i lepljenje
filmskih traka snimljenih u procesu produkcije. Konana verzija filma od lepljenih traka
presnimavala se na kompaktne filmske trake koje su se distribuirale bioskopima. Proizvodnja
filma razvila se u jaku i profitabilnu industriju zbog ega su uloge ne samo glumaca ve i
reisera, montaera i producenta postale izuzetno znaajne. U razvoju filmske umetnosti i
filmske industrije preplitali su se interesi i uticaji reisera, montaera i producenata, zbog ega su
se formirale razliite filmske kole i filozofije kako za proces produkcije, tako i postprodukcije.
Okosnice filmskog stvaralatva su rediteljski rez (eng. director's cut) i zavrni rez (eng. final
cut), to oigledno ukazuje na znaaj montae. Znaaj procesa montae, odnosno rediteljskog i
zavrnog reza, prenosi se i kroz smenu tehnologija, to se vidi kroz nazive savremenih
softverskih alata za kreiranje videa.
Sa pojavom magnetoskopa za zapisivanje televizijske slike, poinje elektronska linearna
video montaa.
Linearna video montaa (eng. linear video editing) je proces selekcije, ureivanja i
modifikacije slika i zvuka zabeleenih na video trakama, u cilju kreiranja konane verzije video
zapisa pomou sistema koji sadri dva ili vie ureaja sa magnetnim trakama, video monitorima i
elektronskim video meaem mikserom. Princip montae sa magnetoskopskim trakama ima
odreene slinosti sa filmskom montaom, ali prua daleko vee mogunosti. Zapisi se sa traka
prevode u video signale koji se prikazuju na kontrolnim monitorima i vode na video mikser, iji
je izlaz prikljuen na glavni monitor. Video mikser ima mogunost izbora kadrova sa vie
razliitih ulaza, kao i njihovo meanje i pretapanje.

176

Digitalizacijom video i audio signala stvorena je mogunost montae pomou raunara


koja je oznaena kao nelinearna montaa ili digitalni video editing.
Nelinearna montaa (eng. non-linear editing) predstavlja ureivanje i obradu slika
pomou raunara u cilju kreiranja digitalnog videa. Nelinearna montaa prua daleko vee
mogunosti za kreiranje raznovrsnih multimedijalnih proizvoda od filmske i linearne video
montae.
Za nelinearnu montau, odnosno digitalno video editovanje, razvijeno je vie softverskih
alata za razliite operativne sisteme. Najznaajnije programe za video editovanje razvile su
firme Avid Technology, Adobe i Apple Macintosh.
Detaljniji opis i pregled softverskih alata za video montau bio bi obiman i zato su
nabrojani samo najznaajniji programi, a u sledeim odeljcima dat je kratak opis samo
softverskih alata Premiere i Final Cut.
Media Composer, najee se po firmi koja ga je 1989 godine razvila, zove Avid, prvi je
hardversko softverski sistem na Macintosh II za nelinearnu montau koji je dominirao u
filmskoj i televizijskoj produkciji u proloj deceniji i dalje ostao znaajan sa novim verzijama za
visoke rezolucije slike i niskobudetne primene.
Premiere jedan je od prvih programa za digitalnu video montau razvijen pre dve
decenije i danas u najnovijim CS verzijama jedan je od najpopularinijih programa za video
editing. Instalira se na operativne sisteme Apple Macintosh kao i za Microsoft Windows.
Final Cut Studio je softverski komplet (eng. software suite) za profesionalnu video i
audio produkciju koji je u filmskoj i televizijskoj produkciji postao konkurencija Avidovom
Media Composer-u. To je moan i ire dostupan komplet koji sadri est osnovnih i vie manjih
aplikacija za video editing. To su: Final Cut Pro 7 za video editing, Motion 4 za grafike
animacije, Soundtrack Pro 3 za napredno editovanje i dizajniranje zvuka, DVD Studio Pro 4 za
kodiranje, autorizaciju i disk izdavatvo, Color 1.5 za nijansiranje boja i Compressor 3.5 za
kodovanje finalnog video proizvoda u razliite formate.
iMovie veoma je popularan sistem za montau ulaznog nivoa i sadri filtriranje slike,
konverziju ka sepia tonalitetu ili belom i crnom, mogunost titlovanja i montau zvuka. Nije
skup i dobija se ve instaliran na mnogim Macintosh raunarima.
Video Wave i Studio Deluxe, slino iMovie-u, jednostavni su i jeftini, namenjeni
studentima i nastavnicima koji mogu raditi DVD, VHS, CD-ROM formate i veb filmove.
EDIUS NEO je softver namenjen za nelinearnu video montau za operativni sistem
Microsoft Windows. Poseduje dobre karakteristike nelinearne montae kao to su realno vreme,
miksovani format HD/SD editovanja, titlovanje, i stvaranje DVD.
EDIUS Neo 2 je program koji prua mogunost editovanja raznih formata ukljuujui
AVCHD, HDV, DV, Windows Media i QuickTime, podrava rad u realnom vremenu, ima
mogunost miksovanja razliitih formata unutar iste vremenske ose. EDIUS Neo 2 je namenjen
za nastavnu okolinu, ima veoma dobre karakteristike nelinearne montae. Ima mogunost
stvaranja Blu-ray Disc i DVD (DVD authoring).
EDIUS 5 je softverski alat dizajniran za profesionalni nivo montae, za postprodukciju.
Avid Liquid Pro7 je SD i HD video editor koji ima mogunost obrade okruavajueg
zvuka sa preko 1000 efekata u realnom vremenu. Edituje DV, MPEG I, MPEG IBP (eng. Iframe, B-frame, P-frame IBP), nekompresovani, Windows Media, ekspres digitalni video (eng.
digital video express DIVX) i MPEG-4 u SD kao i HDV. Ima mogunost stvaranja DVD
(DVD authoring): definisanjem interaktivnosti, kreiranjem menija, audio izlaza Dolby Digital
5.1 surround mix.

177

Sony Vegas Movie Studio 9 Platinum je program za video editovanje i kreiranje DVD.
Namenjen je za kune raunare. Softver ima mogunost prihvatanja i organizacije DV videa,
editovanje klipova u vremenskoj osi i eksportovanje videa u DVD ili video CD (eng. video CD
VCD). Takoe omoguava eksporovanje videa za korienje sa pokretnom konzolom za igranje
(eng. PlayStation Portable PSP), iPod i YouTube. Prua mogunost HDV i AVCHD
editovanja. Podrava snimanje, editovanje i kodovanje videa. Ima podrku za 5.1 surround sound
miksovanje i kodovanje.
SONY Vegas Pro 9 je profesionalni softver za video i audio postprodukciju za difuziju
broadcast i digitalne video diskove (eng. digital video disc DVD) i plave blu-rej diskove
optike diskove za memorisanje podataka (eng. blu-ray disc BD).
Adobe Encore DVD je softverski alat namenjen profesionalnoj izradi DVD-a. Format
videa uvedenog u programsko okruenje se automatski prebacuje u MPEG-2 format. Izlazni
oblik audio formata je Dolby Digital sistem. Kompatibilan je sa Photoshop-om. Interaktivan
meni se moe kreirati u Photoshop-u i koristiti u programu Adobe Encore DVD.
Pinnacle Studio HD je program za video editovanje u mnogim Windows raunarima.
Podrava HD video i prua mogunosti tranzicija, animacije i efekata.
CINEFORM NeoScene je program za nelinearnu montau u filmskom stvaralatvu,
daje izuzetno visok kvalitet CineForm fajlova.
PROGRAM ADOBE PREMIERE
Adobe Premiere, najee oznaen samo Premiere, jedan je od prvih programa za
digitalno editovanje, raspoloiv za operativne sisteme Apple Macintosh kao i za Microsof
Windows. Ima mnogostruku primenu, od kratkih filmova za veb sajtove do visokoprofesionalnih
produkcija. Poseduje velik izbor postprodukcijskih efekata od prelaza do dizajna i montae
zvuka.
Prva verzija Adobe Premiere 1.0 razvijena je 1993 da bi potom sledile nove serije do
2002 godine sa oznakom Adobe Premiere 6.5. Zatim sledi razvoj sa oznakama Adobe Premiere
Pro i to 2003 godine Adobe Premiere Pro 1.0, to bi odgovaralo Adobe Premiere 7.0, a zatim
2004 godine Adobe Premiere Pro 1.5 i 2005 godine Adobe Premiere Pro 1.5.1. Naredne 2006
godine razvijen je Adobe Premiere Pro 2.0 a sledee 2007 godine puten je pod novim nazivom
Adobe Premiere Pro CS3. Naredne 2008 i 2009 godine su Adobe Premiere Pro CS4 a 2010
godine Adobe Premiere Pro CS5 da bi najnovija verzija u 2011 godine bila oznaena sa Adobe
Premiere Pro CS5.5.
Adobe Premiere koristi tri glavna radna ekrana prozora: projekat, vremenska osa i
monitor kao to je prikazano na Slici 9.2.3.1.
Radni ekran projekat (eng. project) koristi SE za prikupljanje sirovog ili osnovnog
materijala (eng. raw materijal) za projekat: video i audio klipove, nepokretne slike. Video
klipovi mogu biti uneti (eng. captured) u Premiere direktno sa kamere ili sa trake, ili mogu biti
importovani sa diska. Unutar prozora projekat svaki klip se prikazuje sa njegovom slikom,
imenom, duinom trajanja i drugim informacijama.
Radni ekran vremenske ose (eng. timeline) vizuelno prikazuje linearni opseg
kompletiranog filma (eng. movie), prikazujui redosled komponentnih klipova. Vreme se
poveava sa leva na desno. Vremenski prozori mogu imati nekoliko video i audio tragova. Vei
broj tragova se koristi za tranzicije i preklapanje (eng. transitions and overlays).

178

Monitor je radni ekran u kome se prikazuje stvarna slika. Obino je podeljen na dva
okvira, od kojih svaki ima posebnu kontrolu playback, jog, shuttle. Leva polovina prikazuje
izvorni klip. Moe se izabrati odreeni frejm u klipu u prozoru i mogu se postaviti ulazne in i
izlazne out take. Desna polovina prozora monitora koristi se za prikazivanje filma (eng.
movie) u procesu sastavljanja (eng. asemblovanja) na vremenskoj osi.

Slika 9.2.3.1Radni ekrani Adobe Premiere

Vredost vremenskog koda (eng. timecode) prikazuje se sa etiri para brojeva


01:04:32:15, koji predstavljaju sate, minute, sekunde i frejmove. Za PAL sistem zadnja dva broja
koja identifikuju broj frejma su u rasponu od 0 do 24, dok je za NTSC sistem raspon od 0 do 29.
PROGRAM FINAL CUT PRO
Final Cut Pro FCP je razvijen 1999 godine kao modul Final Cut Studio koji
omoguava korisniku da prikljuuje video sa spoljnih ureaja ili iz raunarskih memorija i na
hard disku ga edituje, obrauje i isporuuje u raznim verzijama formata. Prve verzije razvila je
firma Macromedia Inc. a kasnije Apple Inc.
Final Cut Pro 7 je verzija za Mac raunare sa Mac OS X verzijom operativnog sistema,
ili kasnijom, koristei Intel procesore. Sadri jednostavne kao i napredne editing alate za
neprimetne tranzicije i precizne video manipulacije. Ima izuzetne profesionalne mogunosti za
kreiranje tokom procesa nelinearne montae kao to su: editovanje sa formatima HDV, XDCAM
HD , DVCPRO HD, preko 150 filtera u realnom vremenu, veliki broj efekta, prikazivanje u

179

realnom vremenu za vreme editovanja, 2D/3D prostor, audio postprodukcija, 5.1 surround sound
mixing, finalizacija profesionalnog DVD sa interaktivnim karakteristikama, autorizaciju SD i
dvoslojnog HD DVD-9.
Radni ekran Final Cut Pro 7 sadri etiri osnovna dela: okvir pretraiva (eng. Browser),
ulazni prozor za pregled programskog matrijala (eng. Viewer window), izlazni prozor (eng.
Canvas) i vremensku liniju (eng. Timeline) kao to je prikazano na Slici 9.2.3.2.

Slika 9.2.3.2Radni ekran Final Cut Pro

Browser je prozor u kome se organizuje i pristupa svim izvorima materijala za dati


projekt, sve sekvence, klipovi, audio zapisi, efekti i ostale datoteke medija smetenih u Project
Final Cut Pro file.
Viewer je prozor u kome se mogu medija fajlovi pregledati i skraivati, pregledati i
ureivati pojedinani klipovi, postavljati ulazne i izlazne take, locirati i markirati specifini
kadrovi, praviti izmene kao to je primena filtara i podeavanje parametara kretanja, menjati
zvuk. U osnovu mogue su izmene u klipu koristeu Viewer i zatim postaviti klip u sekvencu na
Timeline.
Viewer ima svoj interfejs shuttle interface za skeniranje sa promenljivom brzinom,
napred i nazad kroz klip kao i jog interface za napredovanje kadar po kadar. Na vrhu sadri
tabulatore za kontrolu klipova: Video Tab, Audio Tab, Filters Tab, Tabs pomou kojih se
pregledaju, markiraju i podeavaju frejmovi, tonski kanali i podeavaju kljuni kadrovi.
Canvas prozor je radni prostor za editovanje klipova u sekvenci i posmatranje rezultata.
To je replika programskog monitora gde se posmatra editovani materijal. Canvas ima kao i
Viewer svoj shuttle interface.
Timeline je traka koja objedinjuje medije i na kojoj se prikazuju slojevi (eng. layers)
video i audio traka u nizu (eng. sequence) du vremenske ose. Koristi se za pregledanje podloga
(eng. layout) i komponenti u vremenskom nizu, navigaciju izmeu klipova, selekciju specifinih
taaka u sekvenci. Timeline se ogleda na Canvas koji prikazuje kretanje glave za reprodukciju na

180

vremenskoj osi. Na njoj se video i audio klipovi mogu pomerati, menjati, rasporeivati i brisati u
cilju kreiranja sekvence kakva bi na kraju trebala da se pojavi u eljenom filmu. Na vremenskoj
osi se postavljaju i sadraji sekvence kao to su natpisi (eng. titles) i prelazi (eng. transitions).

9.2.4 Softverski alati za kreiranje animacija


Za kreiranje animacija razliitog nivoa sloenosti razvijeno je vie softverskih alata i
platformi. Najjednostavnije animacije kreiraju se pomou GIF formata, dok se za kreiranje
sloenijih animacija koriste softvrske kolekcije Fle (eng. Flash) i Maja (eng. Maya).
GIF format jedan je od dva najee koriena raunarska grafika formata za razmenu
slika koji se moe koristiti za kreiranje malih animacija sa niom rezolucijom i paletom od 256
boja.
Fle softverski komplet predstavlja platformu za kreiranje animacija.
Maya softverski komplet predstavlja platformu za kreiranje 3D digitalnih sadraja za
igrani film (eng. feature film), digitalnu video radiodifuziju i video produkciju, razvoj
interaktivnih video igara, animaciju, arhitekturu, obrazovanje, nauna istraivanja.
PROGRAM ADOBE FLASH
Adobe Flash, skraeno Flash se deklarie kao multimedijalna platforma za kreiranje
animacija, video sadraja i interaktivnosti a pomou njega mogu se praviti i raunarske igre. Fle
je izvanredan alat za veb aplikacije.
Razvoj Flea poinje 1996 godine sa prvom verzijom Macromedia Flash 1, zatim se
svake sledee godine reaju nove savrenije verzije sve do 2005 kada se pojavljuje Macromedia
Flash 8, da bi 2007 preao u Adobe kada se lansira Adobe Flash CS3(9) Professional.
CS3 podrava ActionScript 3.0, omoguava da sve aplikacije mogu da se prevedu u
ActionScript, bolje se integrie u druge Adobe programe.
Sledee 2008 godine pojavljuje se Adobe Flash CS4(10) Professional koji sadri
inverznu kinematiku, osnovne manipulacije sa 3D objektima, tekstualno ureivanje (eng. text
engine) i dalja ekspanzija ka ActionScript 3.0. CS4 omoguava kreiranje animacija sa vie
mogunosti od prethodnih verzija.
Poslednja verzija od 2010 Adobe Flash Professional CS5(10.1) pojaala je tekstualno
ureivanje i poboljala rad sa kinematikom.
Fle omoguava upotrebu vektorske i rasterske grafike za sastavljanje teksta, crtea i
slika a podrava obostrani audio i video striming i prihvatanje signala sa tastature, mikrofona i
kamere.
Fle sadri jedan objektno orijentisani jezik ActionScript sa otvorenim kodom, koji
omoguava kreiranje programabilnih multimedijalnih proizvoda sa animacijom i visokim
stepenom interaktivnosti.
Sadraji Flea mogu se prikazati na raznim kompjuterskim sistemima i ureajima
pomou Adobe Flash Player-a, mrenih pretraivaa i savrenijih mobilnih telefona.
ActionScript je programski jezik za algoritamsko kreiranje animacija i programiranje
interakcija na osnovu definisanih poloaja, trajektorija i simbola. Pogodan je za kreiranje vebaplikacija i njihovo povezivanje sa korisnikim interfejsom.

181

SWF (eng. shockwave flash ili small web file SWF) je format vektorske grafike koji se
moe generisati sa fleom. Pogodan je za veb animacije. Grafiki objekti su predstavljeni u
vektorskom obliku. SWF fajl je slian programu, ukljuuje definicije objekata i instrukcije kako
sa njima manipulisati. SWF podaci su kodovani u binarnoj formi i komprimovani, rezultujui u
vrlo malu veliinu fajla.
Fle dozvoljava da se importuje bitmapirana slika u animaciju, ali time se poveava
veliina fajla.
U fleu s koriste tri razliite vrste simbola:

Grafiki simboli su vektorski objekti kreirani za motion tweening.


Simoli dugmadi (eng. button symbols) su specijalna vrsta simbola koja se koristi za
dodavanje interaktivnosti.
Simboli pokretanja (eng. movie clip symbols) su animacije sa sopstvenim vremenskom
linijom koje se ugrauju unutar glavnog movie.

Vremenska linija (eng. timeline) predstavlja grafiki prikaz niza slika, odnosno sekvence
kadrova koja se koristi za kreiranje animacije u fleu. Animacija se moe graditi jedan frejm u
jednom trenutku, insertujui kljune frejmove u timeline sekvencijalno. Drugi nain je
ubacivanje glavnih frejmova u vremensku liniju.
Flash pozornica (eng. stage) je pozornica, prozor u kojoj se kreira frejm crtanjem
objekata. Objekti se mogu kreirati koristei drawing tools, ili mogu biti importovani.
Bitmapirane slike, ukljuujui formate JPEG i PNG, mogu se importovati i transformisati u autotraced vektorski objekat. Bitmapirane slike se mogu koristiti unutar Flash frame, ali se kasnije
ne moe vriti skaliranje ili rotacija bez potencijalnog degradiranja slike.
Koriste se lejeri da bi se organizovali elementi u frejmu, interpolirano kretanje (eng.
interpolating motion).
Grafiki objekti mogu biti sauvani u biblioteci u specijalnom obliku zvanom simbol
(eng. symbol), koji omoguava da objekat bude ponovo korien. Potreban broj instances mogu
se postaviti na stage. Instances ostaju linkovani za simbol. Ako se simbol menja, automatski se
menjaju i instances. Instances su identini, i na njih se primenjuju transformacije, da bi se
promenila veliina ili orijentacija od svake instances.
PROGRAM AUTODESK MAYA
Autodesk Maya, skraeno Maya, je moan komercijalni softver za 3D animaciju koji
omoguava previzualizaciju, vizuelne efekte, modelovanje, animaciju karaktera i rendering za
razvoj projekata filmske i video produkcije, raunarskih igara, arhitekture, obrazovanja i naunih
istraivanja.
Program Maya razvila je 1998 godine firma Alias Systems Corporation koju je 2005
godine otkupila firma Autodesk.
Verzija Maya 2012 moe se instalirati na raunarima sa operativnim sistemima Linux,
Mac OS X i Microsoft Windows.
Previzualizacija (eng. previsualization) predstavlja proces, razvijen u filmskoj industriji,
za kreiranje prototipa kroz vizuelno istraivanje i scensko planiranje to omoguava bolje
razumevanje projekta i generisanje preliminarne verzije video proizvoda. Kod kreiranja 3D

182

animacija u softveru Maya, uz niu rezoluciju slike, prikazuju se karakteristike, funkcionalnost i


tok procesa eljene aplikacije to omoguava brz i lak nain ostvarivanja promena do postizanja
eljenog rezultata.
Vizuelni efekati iz realnog sveta kao to su dim, vatra, eksplozija, tok fluida, efekat kose
u filmskoj i televizijskoj produkciji mogu se simulirati u softveru Maya. Na primer simulator za
realistiki izgled ljudske kose je ostvaren korienjem krivih i efekata crtanja. Simulacija
ivotinjskog krzna dlake slina je sa efektom kose. Moe se koristiti i za simulaciju drugih
slinih objekata kao to je trava, fizika sudarenih objekata, simulacija tkanine i materijala,
simulacija spreja, prskalica, simulacija praine, praha.
Modelovanje u raunarskim tehnologijama je proces predstavljanja realnih objekata
pomou tehnika kompjuterske grafike. Maja je mono sredstvo za kreiranje raunarski
generisanih slika (eng. computer-generated imagery CGI).
Raunarski generisane slike predstavljaju oblast primene kompjuterske 3D grafike za
specijalne efekte u filmovima, televizijekim programima i raunarskim igrama.
Modelovanje pomou programa Maja zavisi od tipa objekta. Definisana su tri tipa
objekata: poligoni, NURBS i izdeljene manje povrine.
Poligoni su geometrijski oblici sa tri ili vie pravih stranica. Poligoni omoguavaju
modelovanje povrina graenjem i promenom oblika manjih delova povrine.
Neuniformne racionalne osnovne krive (eng. non-uniform rational B-splines NURBS)
geometrijski su tipovi koji se mogu koristiti za stvaranje 3D krivih i povrina. NURBS
omoguavaju, sa visokim nivoom kontrole, kreiranje blagih, krivih povrina.
Izdeljenim manjim povrinama (eng. subdivision surfaces) se omoguava editovanje
povrina. Oblik nekog objekta se prikazuje geometrijom, materijal objekta opisuje izgled
povrine nakon renderovanja. Materijali i teksture se postavljaju tako da simuliraju realnu
reakciju povrina na svetlost.
3D animacija predstavlja vaan deo televizijskih, filmskih i multimedijalnih projekata za
animaciju karaktera.
Animacija karaktera predstavlja proces oivljavanja virtualnih objekata koji mogu biti
osobe, ivotinje, roboti ili neki predmeti koji se animiraju izrazima lica, u cilju komunikacije sa
publikom kroz akciju. Karakteri kao to su ljudi i ivotinje mogu se proizvesti sa visokim
stepenom realizma. Pre animacije karaktera u sceni, crta se skelet karaktera, a zatim se skelet
oblae koom. Aplikacija Maja omoguava definisanje unutranjeg skeleta za karaktere i
dodeljivljnje koe za stvaranje realistikih pokreta sa deformacijama. Proces pripreme kontrole
karaktera je nazvan rigging i omoguava fokusiranje na proces animacije. U procesu dizajna i
animacije karaktera kombinuju se transformacije digitalnog skeleta sa deformacijama povrine
koe spoljanjeg omotaa skeleta. Specifini zahtevi za kretanje karaktera odreuju
kompleksnost kontrole karaktera. Mehanika karaktera treba da bude ubedljiva publici, koa i
odea treba, takoe, da se kreu i na odgovarajui nain savijaju. Maja omoguava da se upravlja
delovima koji konstituiu tipian karakter.
Rendering je raunarski proces koji omoguava da se komponente kao to su povrine,
materijali, teksture, efekti, osvetljenja, modeli, kamere i kretanja postavljaju u sekvencu
bitmapiranih slika.
Maja softver sadri ugraen programski skript jezik (eng. Maya embedded language
MEL).
Maja programski jezik MEL omoguava prilagoavanje korisnikog interfejsa i pisanje
skripta i makroa za kreiranje objekta, osvetljenja, kamere i tekstura. Na taj nain se pomou

183

Maja softvera mogu po zamisli autora kreirati raznovrsni efekti i animacije. MEL omoguava da
se promenom vrednosti parametara u vremenu animiraju objekati, svetlo ili samo bilo koji
entitet.
Maja korisniki interfejs (eng. Maya user interface) predstavlja, sa funkcionalnog
aspekta, skup alata dostupnih korisniku na radnom ekranu monitora, koji osim funkcija
zajednikih za sve razliite aspekte 3D grafike softverskih aplikacija, sadri skup alata
namenjenih specifinim zadacima kao to su modeliranje, teksturisanje, animacija, renderovanje
i sl.
Podrazumevani (eng. default) Maja korisniki interfejs, prikazan na Slici 9.2.4.1 i na Slici
9.2.4.2, sadri sledee osnovne sekcije:

Glavni meni Main Menu Bar


Statusna linija Status Line
koljka Shelf
Alatna kutija Tool Box
Radni prostor Workspace
Meni za radni prostor Panel Menus
Vremenska traka Time Slider
Traka opsega Range Slider
Upravljaka linija Command Line
Pomona linija Help Line
Kanalska kutija Channel Box
Editor lejera Layer editor

Slika 9.2.4.1Radni ekran sa Maja interfejsom (eng. Maya Interface) i radnim prostorom

184

Korisnik na radnom ekranu monitora definie virtuelni radni prostor, scenu, za realizaciju
projekta. Scena moe da bude sauvana u raznim formatima. Standardni format je .mb Maya
binary.
U aplikaciji Maya 2010 dodat je MatchMover kojim se omoguava kombinovanje
elemenata raunarskog grafikog interfejsa (eng. computer graphics interface CGI).
Kamera sekventor (eng. camera sequencer) jedna je od najoriginalnijih karakteristika u
softveru Maya 2011. Dodat je u aplikaciji Maya 2010. Koristi se za raspodelu planova vie
kamera i njihovo rukovanje u sekvenci animacije. Omoguava korienje razliitih kamera
analogno realizaciji u filmskim i televizijskim studijima. Kamera sekventor povezuje planove iz
vie kamera smetenih u 3D sceni, aranirajui planove i sviujui izmeu uglova i planova
kamera, korienjem vie kamera, uglova i pogleda, za stvaranje kompletne sekvence animacije.
i
Aplikacija Maya je organizovana u tri sloja, lejera: GUI, MEL Engine
Dependency Graph.
GUI lejer predstavlja grafiki korisniki interfejs dostupan animatorima, dizajnerima i
programerima.
MEL Engine je Maya lejer u kome se izvravaju komande korisnika sa GUI lejera.
Dependency Graph je lejer gde su smeteni svi podaci o sceni i gde se izvrava
neophodna modifikacija podataka na osnovu skripta MEL komandi.

Slika 9.2.4.2Radni prostor za modelovanje ili kreiranje animacije u programu Maja

Arhitektura aplikacije Maja je razliita od arhitekture drugih programa. U mnogim


postojeim aplikacijama su modelovanje, animacija, rasveta i rendering date kao odvojene

185

procedure. Aplikacija Maja ima arhitekturu dijagrama grafa vora (eng. node graph
architecture). Svaki elemenat scene, na primer, svaka kriva, link, slika, tekstura, kljuni frejm se
definie kao vor. Svaki vor ima svoje osobine (eng. attributes) i prilagoenost. Svaki vor
moe primiti, modifikovati i transmitovati podatke sledeem voru. Da bi se ostvarila eljena
funkcionalnost formira se mrea vorova ili preko grafikog korisnikog interfejsa ili
programiranjem (MEL ili C++). Svaki 3D zadatak se realizuje protokom i modifikacijom
podataka kroz mreu meusobno povezanih vorova. Informacija koja se koristi za konstrukciju
scene je u obliku osobina i prenosi se meusobno zavisnim vorovima. Jedan vor moe imati
veliki broj osobina koje moe proslediti dalje ili zahtevati kao ulaz. Primeri vorova su vor
transformacije koji sadri informacije o lokaciji, vor oblika sadri geometrijske informacije i
vor materijala koji sadri informacije o boji. vor predstavlja jedan blok building block scene.
Blokovi se linkuju da bi kreirali kompleksnije blokove.
Blokovi formiraju model protoka podataka koji se zove Maya's pipeline.
Maya's pipeline omoguava digitalni produkcioni pipeline:

Pria Story
Preslikavanje prie u vizuelni domen Visual Development
Kreiranje karaktera - Character Design
Storibord Storyboards
Postavka scene Scene Layout
Modelovanje Modeling
Animacija Animation
Senenje i tekstura Shading and Texturing
Osvetljenje Lighting
Rendering

Maja softver je predvien i za proces postprodukcije (eng. post production) u kome se


vri titlovanje, dodavanje raznih efekata, prelaza i slino.

9.3 Programi za snimanje, obradu i editovanje zvuka


Programi za snimanje, obradu i editovanje zvuka omoguavaju vremensku i
frekvencijsku analizu, obradu spektra, uklanjanje uma, dinamiku kompresiju i promenu
uestanosti kod editovanog audio signala.
Elektronski ureaji sa programima za snimanje, editovanje i reprodukciju zvuka u obliku
digitalnog audio signala i/ili MIDI podataka zovu se sekvenseri i realizuju se kao digitalne audio
radne stanice.
Digitalne audio radne stanice (eng. digital audio workstation DAW) predstavljaju
specijalni elektronski sistem namenjen za snimanje, obradu, editovanje i reprodukciju (eng.
playing back) digitalnog audio signala i mogu biti integrisani ili kompjuterski. Integrisani sistem
se sastoji iz audio konzole, konvertora i ureaja za memorisanje podataka. Kompjuterski
zasnovan sistem za snimanje digitalnog audio signala DAW sastoji se od: kompjutera, analognodigitalnog i digitalno-analognog konvertora, audio softvera i najmanje jednog ulaznog ureaja za
dodatni audio signal. Softverom se obezbeuje korisniki interfejs i kontroliu komponente
hardvera da bi se omoguilo snimanje, editovanje i prikazivanje audio signala. Softver moe biti

186

realizovan za snimanje jednog traga, gde se u jednom trenutku prikazuje samo jedan audio signal
mono ili stereo, ili vie tragova, koji omoguava da se signal snima sa nekoliko mikrofona ili
razliitih ulaza na disk u istom trenutku na posebne tragove. Za svaki trag posebno moe se
podeavati jaina ili stereo balans audio signala. Svaki trag se snima u posebnom fajlu u
memoriji kompjutera i moe se posebno editovati. U finalizaciji se vri miksovanje tragova u dva
stereo traga ili vie saraund tragova.
Razvoj softvera za digitalni audio poinje poetkom devedesetih godina prolog veka.
Kompanije koje su razvile najmonije softvere koji i danas dominiraju u profesionalnim
primenama su AVID, Adobe, Apple, Steinberg i Sony. Na tritu se nude softverski alati i
kolekcije razliitog nivoa sloenosti i cene kotanja.
Najpoznatije digitalne radne stanice i softverski kompleti su:

Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije


AVID
Audition i Logic Studio kompanije Adobe
LogicStudio kompanije Apple
Nuendo, Cubase kompanije Steinberg
Sound Forge, ACID Pro i Vegas Pro kompanije Sony

Kao primer i ilustracija za mogunosti koje imaju softverski alati za editovanje zvuka
dataljnije e biti opisan softverski alat Sound Forge.

9.3.1 Obrada zvuka pomou Sound Forge-a


Sound Forge je Sony-jev softverski komplet za editovanje zvuka za profesionalne i
poluprofesionalne namene. Na Slici 9.3.1.1 prikazan je radni ekran Sound Forge-a.

Slika 9.3.1.1Radni ekran Sound Forge-a

187

Funkcije i instrukcije editovanja Sound Forge-a:

Spektralna analiza Spectrum Analysis: nadzor u realnom vremenu (eng. real time).
Monitoring i prikaz trenutnih vrednosti zvunog signala Sonogram;
Uklanjanje uma: Noise Gate, Noise Reduction, EQ, Click and Crackle Removal, Audio
Restoration;
Dinamika kompresija Compressor: Threshold, Ration, Attack and Release time;
Promena uestanosti Time Stretch, Pitch, Vibrato.

SPEKTRALNA ANALIZA U SOUND FORGE

Na Slici 9.3.1.2-a je prikazano predstavljanje zvuka u vremenskom domenu, odnosno


prikazivanje amplitude signala u zavisnosti od vremena.
Spektralna analiza omoguava predstavljanje zvuka u frekvencijskom domenu, odnosno
prikazivanje amplituda signala u zavisnosti od uestanosti to je prikazano na Slici 9.3.1.2-b.
Spektar zvunog signala se posmatra aktiviranjem Real Time Monitoring-a.

Slika 9.3.1.2Analiza zvunog signala uSoundForge-u: a) Vremenska analiza Waveform display,


b) Spektralna analiza Spectrum graph

Sonogramom se na x osi predstavlja vreme, na y osi frekvencija, a boja predstavlja nivo


signala to je prikazano na Slici 9.3.1.3.
UKLANJANJE UMA U SOUND FORGE-U

Instrukcije menija za uklanjanje uma pomou Sound Forge-a su:

Noise Gate selekcija uma,


Noise Reduction smanjenje uma,
EQ izjednaavanje,
Click and Crackle Removal uklanjanje pucketanja,
Audio Restoration restauracija audio snimaka.

188

Slika 9.3.1.3Prikaz sonograma u Sound Forge-u

Noise Gate slui za uklanjanje uma ispod izabranog nivoa praga (eng.treshold) kao to
je prikazano na Slici 9.3.1.4.

Slika 9.3.1.4Ilustracija za instrukciju Noise Gate selekcija uma

Instrukcija smanjenje uma - Noise Reduction obavlja se u dva koraka. Izabere se i


oznai deo snimka koji sadri samo um noiseprint, to je prikazano na Slici 9.3.1.5. Uklanja
se um iz celog snimka na osnovu ovog uzorka.
Za izabrani noiseprint gleda se frekvencijski spektar, zajedno sa takama anvelope koje
ograniavaju model uma. Signal ispod anvelope se smatra umom i bie smanjen, dok e signal
iznad anvelope ostati nepromenjen. Podizanjem taaka anvelope bie uklonjeno vie signala i
obrnuto, sputanjem anvelope manje originalnog signala bie smanjeno.
Menjanjem vrednosti podiemo ili sputamo anvelopu noiseprint-a. Uobiajene
vrednosti su izmeu 6 dB i +6 dB. Poeljno je isprobavanje vrednosti u ovom intervalu sa
ciljem pronalaenja najboljeg reenja za dati sluaj. Vrednosti iznad 0 dB uklanjaju vie uma,

189

ali poveavaju mogunost da se ukloni i koristan signal niskog nivoa. Vrednosti ispod 0 dB
uklanjaju manje korisnog signala, ali ako je vrednost preniska bie uklonjeno veoma malo uma.

Slika 9.3.1.5Radna povrina za instrukciju Noise Reduction

Izjednaavanje (izjednaava (eng. equalizer EQ)): Podeavanjem centralne


frekvencije, irine i pojaanja filtara ekvalizatora pojaavaju se frekvencije korisnog signala
koje su mogle biti oslabljene, na primer zbog korienja opcija za redukciju uma. Postoji
ekvilajzer sa tri opsega frekvencija 3Band EQ: niske, srednje i visoke, i Graphic EQ sa vie
od 3 filtra, to je prikazano na Slici 9.3.1.6.
Uklanjanje pucketanja Click and Crackle Removal obavlja se podeavanjem
amplitude, trajanja i uestanosti glieva koji se uklanjaju.
Audio Restoration je instrukcija koja omoguava uklanjanje glieva, kao i smanjenje
uma iz starih snimaka. Sadri vremenske parametre koji odreuju ukljuivanje i iskljuivanje
algoritma. Vremenski parametri pomau u spreavanju uklanjanja korisnog signala.

190

Slika 9.3.1.6Radna povrina za Izjednaavanje EQ

DINAMIKA KOMPRESIJA U SOUND FORGE-U


Dinamiki kompresija predstavlja obradu audio signala kojom se smanjuje dinamiki
opseg jaine zvuka, odnosno smanjuje se razlika izmeu najvieg i najnieg nivoa zvuka tokom
snimanja ili reprodukcije. Parametri dinamike kompresije (Slika 9.3.1.7) su:

THRESHOLD prag predstavlja nivo signala pri kome se kompresor ukljuuje;


RATIO odnos, pokazatelj stepena kompresije posle dostizanja praga;
ATTACK TIME vreme koje je potrebno da se dostigne odnos kompresije definisan sa
RATIO. Due vreme znai da e se kompresija primeniti sporije;
RELEASE TIME vreme koje je potrebno da se kompresija zaustavi, poto je signal
prethodno pao ispod nivoa praga. Due vreme znai da e se zvuk vratiti u
nekomprimovano stanje sporije.

Radna povrina za dinamiku kompresiju u Sound Forge-u predstavljena je na Slici 9.3.1.8.

191

Slika 9.3.1.7Parametri dinamike kompresije: prag - THRESHOLD, prelazne faze: vreme uspostave
ATTACK TIME i vreme oslobaanja RELEASE TIME, stepen kompresije RATIO

Slika 9.3.1.8Radna povrina za dinamiku kompresiju

192

PROMENA UESTANOSTI U SOUND FORGE-U

Instrukcije menija Sound Forge-a za promenu uestanosti su:

Time Stretch promena trajanja snimka,


Pitch promena visine tona,
Vibrato promena visine tona pomou frekvencijske modulacije.

Time Stretch menja duinu snimka, bez promene osnovne frekvencije.Pri ubrzanoj
reprodukciji i skraivanju trajanja snimka komprimovanja u vremenu, iri se spektar, javljaju
se vie frekvencije. Ako se usporava originalni snimak, dolazi do komprimovanja spektra.
Najbolji rezultati postiu se za Time Stretch izmeu 75% i 115%, kao to je prikazano na
Slici 9.3.1.9. Van ovog opsega, mogua je pojava izoblienja. Obradom snimka vie puta sa
malim priratajem, na primer 10 %, dobija se bolji rezultat nego jednom jednokratnom obradom
sa veom promenom duine snimka.

Slika 9.3.1.9Radna povrina za promenu duine snimka

Pitch funkcija omoguava da se promeni osnovna frekvencija snimka.


Vibrato efekat vibriranja koristi frekvencijsku modulaciju za promenu osnovne
frekvencije signala u toku vremena.
Reverb omoguava rekonstruisanje uticaja prostora u kome je sniman zvuk na sam
snimak, to znai da omoguava kreiranje efekta koji smeta zvuk u prostoriju u kojoj nije
sniman. To se radi kada nije snimano u adekvatnoj prostoriji ili kada je uticaj snimane prostorije
izgubljen usled neadekvatne tehnike snimanja.
Na Slici 9.3.1.10 prikazana je radna povrina Sound Forge-a za reverberaciju.

193

Slika 9.3.1.10Radna povrina za reverberaciju

Parametri koji se podeavaju za efekat reverberacije su:

Nivo procesuiranog signala koji e se miksovati sa originalnim signalom.


Nivo prvih refleksija koje e biti miksovane i dovedene na izlaz. Prve refleksije su one
refleksije koje su se najee odbile samo jednom pre nego to su stigle do sluaoca. Na
osnovu ovih refleksija slualac moe da oceni veliinu prostora.
Trajanje reverberacije: Tipino, sve preko tri sekunde je veoma dugo vreme
reverberacije. Veina manjih prostorija ima vreme opadanja signala manje od jedne
sekunde.
Vreme izmeu startnog zvuka i poetka reverberacije: Ovo je parametar koji daje
informaciju o veliini prostora u kome zvuk nastaje. Vee vreme je karakteristika veih
prostorija.

Prostorije sa jednolinim zvukom poinju slabljenje sugnala ve na 4000 Hz, dok za


svetlije prostorije slabljenje poinje za vie frekvencije.

9.4 Rezime
Aplikativni softver za multimedije su raunarski programi koji se koriste kao sredstvo,
odnosno alat za izradu multimedijalnih proizvoda.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Postoji znaajan broj programa razvijenih za obradu slike i zvuka, pojedinano, ili
objedinjenih u video.

194

Softverski alati za obradu bitmapiranih slika omoguavaju poboljanje kvaliteta slika i


njihovo prilagoavanje krajnjoj nameni. Razvijeno je vie softverskih alata od kojih su
najpoznatiji Photoshop, Corel Painter i CorelDRAW.
Za obradu vektorske slike postoji vie softverskih alata od kojih su najpoznatiji Adobe
Illustrator, CorelDRAW i Macromedia Freehand.
Za nelinearnu video montau Media Composer, Premiere i Final Cut Studio.
Za snimanje, obradu, editing i reprodukciju zvuka koriste se digitalne radne stanice sa
odgovarajuim softverskim kompletima. Najpoznatije kolekcije programa za audio su:

Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije


AVID,
Audition i Logic Studio kompanije Adobe,
LogicStudio kompanije Apple,
Nuendo, Cubasekompanije Steinberg,
Sound Forge, ACID Pro i Vegas Pro kompanije Sony.

Tehnoloki razvoj i masovna popularizacija i prodaja audio i video ureaja doprinela je


da i sistemi za razvoj postanu finansijski dostupni veem broju dizajnera i kreatora
multimedijalnih sadraja. Raznovrsni programi za obradu zvuka i slike mogu se instalirati na
personalnim i prenosnim raunarima to daje tehniko-tehnoloke mogunosti irokom krugu
korisnika da se posvete multimedijalnom stvaralatvu koje prua zadovoljstvo ulnoj percepciji.

Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

ta je aplikativni softver za multimedije?


ta je vlasniki softver Proprietary software?
ta je softver u javnom vlasnitvu Public domain software?
ta je slobodan softver i softver otvorenog koda free and open source
software?
ta je Power Point?
ta je Flash?
ta je Dreamweaver?
ta je AfterEffects?
ta je Ulide GIF Animator?
ta je Photoshop?
ta je CorelDRAW?
ta je Adobe Illustrator?
ta je Adobe Premier?
ta je EDIUS?
ta je Final Cut?
ta je Maya?

195

17.
18.
19.
20.
21.
22.
23.
24.
25.

ta je Sound Forge?
Koja editovanja podrava Sound Forge?
ta je spektralna analiza?
Koje su instrukcije za spektralnu analizu u Sound Forge-u?
ta je um?
Koje su instrukcije za uklanjanje uma u Sound Forge-u?
ta je to dinamika kompresija?
Koje su instrukcije za dinamiku kompresiju u Sound Forge-u?
Koje su instrukcije za promenu uestanosti u Sound Forge-u?

Literatura
[9.1]
[9.2]
[9.3]
[9.4]
[9.5]
[9.6]
[9.7]
[9.8]

http://en.wikipedia.org/wiki/Video_editing
http://en.wikipedia.org/wiki/Linear_video_editing
http://en.wikipedia.org/wiki/Non-linear_editing_system
http://en.wikipedia.org/wiki/List_of_video_editing_software
http://www.expertrating.com/courseware/MayaCourse/MAYA-Animation-Basics 1.asp
N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.

196

SPISAK SKRAENICA
AAC
ACELP
A/D
AFX
AL
API
ASCII
ATDM
ATM
AVC
AVCHD
AVI
BB
b
B
B
B-frame
BD
BIFS
BiM

advanced audio coding


napredno audio kodovanje
algebraic code excited linear prediction
algebarski kod pobuene linerane predikcije
analog to digital
analogno digitalni
animation framework eXtension
proirenje okvira animacije
adaption layer
adaptacioni sloj
application programming interface
interfejs za programske aplikacije
American standard code for information interchange
Ameriki standardni kod za razmenu informacija
asynchronous time-division multiplexing
asinhrono multipleksiranje sa vremenskom raspodelom kanala
asynchronous transfer mode
asinhroni transfer mod
advanced video coding
napredno video kodovanje
advanced video coding high definition
napredno video kodovanje visoke definicije
audio video interleave, audio video interleaved
isprepletani zvuk i slika
band by band
opseg po opseg
bit
bit
byte
bajt
bidirectionally-predictive
dvosmerno prediktivni, biprediktivni
bidirectional-frame, backwards-predicted frame, B-picture, inter-frame
dvosmerni-frejm, unazad-predvidiv frejm, B-slika, meu-frejm
blu-ray disc
optiki disk za memorisanje podataka
binary format for scenes
binarni oblik scena
binary format for metadata
binarni format za metapodatke

197

BISDN
BMP
BQ
CABAC
CAVLC
CCD
CD
CD
CGI
CGI
CID
CIF
CMOS
CODEC
CRC
CS
CS-ACELP
CSMA/CD
CSS
1D
2D

broadband ISDN
irokopojasni ISDN
bitmap
bitska mapa
bi-level quantization
dvostruka kvantizacija
context adaptive binary arithmetic coding
binarno aritmetiko adaptivno kodovanje konteksta
context arithmetic variable-length coding
adaptivno kodovanje sa promenljivom kodnom rei
charge-coupled device
ureaji sa spregnutim naelektrisanjem
compact disc
kompakt disk
committee draft
dodeljeni draft
computer-generated imagery
raunarski generisane slike
computer graphics interface
raunarski grafiki interfejs, raunarska grafika
charge injection device
ureaj za detektovanje punjenja
common intermediate format
zajedniki srednji format
complemantary metal-oxide-semiconductor
komplementarne logike tranzistorski metal-oksid-poluprovodnik
coder-decoder
koder-dekoder
cyclic redundancy check
ciklina provera suvinosti
conjugate structure
konjugovana struktura
conjugate structure ACELP
konjugovana struktura ACELP
carrier sense multiple access with collision detection
postupak viestrukog pristupa uz detekciju kolizije
cascading style sheets
kaskadni stil listova
one-dimensional
jednodimenzionalni
two-dimensional
dvodimenzionalni

198

three-dimesional
trodimenzionalni
descriptor
D
deskriptor
digital audio workstation
DAW
digitalna audio radna stanica
decibel
dB
decibel
dictionary-based coding
DBC
kodiranje na bazi renika
discrete cosine transform
DCT
diskretna kosinusna transformacija
description definition language
DDL
opis definicije jezika
digital item
DI
digitalni deo
digital item declaration
DID
deklaracija o digitalnim delovima
digital video express
DIVX
ekspres digitalni video
delivery multimedia integration framework
DMIF
okvir za isporuku multimedijalnih komunikacija
DPCM/DCT differential pulse code modulation /discrete cosine transform
diferencijalna impulsno kodovana modulacija/diskretna kosinusna
transformacija
dots per inch
dpi
broj taaka po jedinici duine
digital rights managment
DRM
upravljanje digitalnim pravima
descriptor scheme
DS
ema za deskripciju
dgital storage media-command and control
DSM-CC
digitalna memorija-komanda i kontrola
digital signal processing
DSP
digitalna obrada signala
digital simultaneous voice and data
DSVD
digitalni simultani glas i podaci
digital video
DV
digitalni video
digital video broadcasting
DVB
digitalna video difuzija
3D

199

DWT
EM
EQ
ES
FEC
FOE
3G
GA
GDF
GFX
GIF
GII
GK
GNU

GOB
GPL
GSTN
GW
HD
HDV

discrete wavelet transform


diskretna wavelet transformacija
electromagnetic
elektromagnetni
equalizer
izjednaava
elementary stream
osnovni strim
forward error correction
korekcija greaka unapred
first order entropy
entropija prvog reda
third generation
trea generacija
general audio
generalni audio
grade distortion function
funkcija stepena oteenja informacije
graphics framework eXtensions
proirenja okvira grafike
graphics interchange format
grafiki format za razmenu
global information infrastructure
globalna informaciona infrastruktura
gate keeper
nadzor prolaza
Gnus Not Unix
GNUs dizajn slian Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i
ne sadri Unix kod
group of blocks
grupa blokova
General Public License
opta javna licenca
general switched telephone network
opta komutaciona telefonska mrea
gate way
mreni prolaz
high-definition
visoka definicija
high-definition video
video visoke definicije, video visoke rezolucije

200

HDTV
HMM
HTML
HVS
I
I-frame
IBP
IDCT
IEC
IETF
IP
IPMP
IPRS
ISDN
ISM
ISO
ITU
ITU-R
ITUT
JPEG
JPEG-LS

high-definition television
televizija visoke definicije, televizija visoke rezolucije
hidden Markov model
skriveni model Markova
hyper text markup language
hipertekst sa oznaenim jezikom
human visual system
oveiji vizuelni system
intra
unutar
intra-frame
unutranji-frejm
I-frame, B-frame, P-frame
I-frejm, B-frejm, P-frejm
inverse DCT
inverzna DCT
International Electrotechnical Committee
Meunarodni elektrotehniki komitet
Internet Engineering Task Force
Grupa za IP standarde
internet protocol
internet protocol
intellectual property management and protection
upravljanje intelektualnoim svojinom i zatita
intelectual property rights
prava intelektualne svojine
integrated services digital network
digitalna mrea integrisanih servisa
interactive storage media
interaktivna memorija
Internatonal Standard Organization
Meunarodna organizacija za standardizaciju
International Telecommunication Union
Meunarodna unija za telekomunikacije
International Telecommunication UnionRadio Standardization Sector
Meunarodna unija za telekomunikacijeRadio sektor za standardizaciju
International Telecommunication UnionTelecommunication Sector
Meunarodna unija za telekomunikacijeTelekomunikacioni sektor
Joint Photographic Experts Group
Grupa eksperata za fotografiju
JPEG standard for image lossless coding
JPEG standard za kodovanje mirnih slika bez gubitaka

201

JP2
JTC
JVC
JVT
LAN
MAE
MB
MCU
MDS
MEL
MIDI
MIPS
MOS
MOS
MPEG
MPEG-J
MP3
MP4
MQ
MSE
NAL

optional file format for JPEG 2000


opcioni fajl format za JPEG 2000
Joint Technical Committee
Pridruni tehniki komitet
joint video coding
zdrueno video kodovanje
Joint Video Team
Zdrueni video tim
local area network
lokalna raunarska mrea
mean absolute error
srednja apsolutna greka
macroblock
makroblok
multipoint control unit
kontrolna jedinica za vie taaka
multimedia description schemes
multimedijalne eme za deskripciju
Maya embedded language
ugraen programski skript jezik u Maya softver
musical instrumment digital interface
digitalni interfejs za muziki instrument
millions of instructions per second
milioni instrukcija u sekundi
mean opinion score
srednja vrednost miljenja
metal oxide sensors
senzori gasa
Motion Picture Experts Group
Grupa eksperata za obradu pokretne slike, Ekspertna grupa za pokretne slike
Motion Picture Experts Group-Java
Grupa eksperata za obradu pokretne slike-Java
Motion Picture Experts Group-1 Audio Layer 3
Grupa eksperata za obradu pokretne slike-1 audio sloj 3
Motion Picture Experts Group-4 File Format
Grupa eksperata za obradu pokretne slike-4 fajl format
multiple quantization
multipl kvantizacija
mean square error
srednja kvadratna greka
network apstraction layer
mreni apstrakcioni sloj

202

NISDN
NTSC
NURBS
OCR
OS
OSI
P
P-frame
PAL
PC
PCM
PDF
PNG
PSNR
PSP
PSTN
QCIF
QoS
RAM
RDF
REC

narrow-band ISDN
uskopojasni ISDN
National Television System Committee
Nacionalni komitet za televizijski sistem
non-uniform rational B-spline
neuniformna racionalna osnovna kriva
optical character recognition
optiko prepoznavanje znakova
operating system
operativni sistem
open system interconnection
povezivanje otvorenih sistema
predictive
prediktivni
predicted-frame, forward-predicted frame, inter-frame
predvidiv-frejm, unapred-predvidiv frejm, meu-frejm
phase alternating line
linijska promena faze
personal computer
personalni raunar
pulse code modulation
impulsna kodna modulacija
probability density function
funkcija gustine verovatnoe
portable network graphic
pokretna mrena grafika
peak-signal-to-noise ratio
vrni odnos signalum
PlayStation portable
pokretna konzola za igranje
public switched telephone network
javna telefonska mrea sa komutacijom, javna komutirana telefonska mrea
quarter common intermediate format
etvrtni zajedniki srednji format
quality of service
kvalitet servisa
random access memory
memorija sa sluajnim pristupom
rate distortion function
funkcije stepena oteenja
request for comment
zahtev za komentar

203

RLE
ROI
ROM
RTCP
RTP
SA
SAOL
SC
SCN
SDTV
SECAM
SG
SGML
SH
SNHC
SNR
SQ
SWF
SVGA
TC
TCP/IP

run-length encoding
kodovanje duine niza
region of interest
region od interesa
read-only memory
memorija sa oitavanjem
real time control protocol
kontrolni protokol u realnom vremenu
real time transport protocol
transportni protokol u realnom vremenu
structured audio
strukturni audio
structured audio orchestra language
strukturni jezik audio orkestra
sub-committee
podkomitet
switched circuit network
mrea za komutaciju kanala
standard definision television
televizija standardne rezolucije
fran. sequentiel couleur a memoire, eng. sequential color with memory
Francuski televizijski standard
Study Group
Studijska grupa
standard generalized markup language
standardni generalizovani jezik za markiranje
sample and hold
uzorak i zadravanje
synthetic natural hybrid coding
sintetiko prirodno hibridno kodovanje
signal-to-noise ratio
odnos signalum
single quantization
jednostruka kvantizacija
shockwave Flash ili small web file
format vektorske grafike koji se moe generisati sa fleom
super video graphics array
super video grafika kartica niz
technical committee
tehniki komitet
transmission control protocol/internet protocol
protokol kontrole prenosa/internet protocol

204

TDNN
TIF
TIFF
ToR
TR
TSR
TTSI
VBR
VCD
VCEG
VCL
VGA
VHDL
VLC
VM
VO
VOC
VOP
VQ
VRML
VTC

time-delayed neural network


neuralne mree sa vremenskim kanjenjem
tagged image format
format oznaene slike
tagged image file format
format dat. oznaene slike
terms of reference
izrazi za reference
Technical report
Tehniki izvetaj
two-level secure re-routing
dvoslojno bezbedno rutiranje
text-to-speech interface
interfejs tekst-govor
variable bit rate
promenljiva bitska brzina
video CD, view CD, compact disc digital video
video CD
Video Coding Expert Group
Ekspertska grupa za video kodovanje
video coding layer
video kodni sloj
video graphics array
video grafika kartica niz
very high speed integrated circuit hardware description language
hardverski opisni jezik za vrlo brzo integrisano kolo
variable-length code
kod promenljive duine
verification model
verifikaconi model
video object
video objekat
volatile organic compound
isparljivo organsko jedinjenje
video object plane
ravan video objekta
vector quantization
vektorska kvantizacija
virtual reality modeling language
jezik modelovanja virtualne realnosti
visual texture coding
kodovanje vizuelne teksture

205

W3C
WD
WG
XGA
XML
XMT

World Wide Web Consortium


WWW Konzorcijum
working draft
radni draft
Working Group
Radna grupa
eXtended graphics array
proirena grafika kartica
eXtensible markup language
oznaeni jezik za proirenje
eXtensible MPEG-4 textual
proireni MPEG-4 tekstualni
wavelength
talasna duina

206

You might also like