A Szófelismerés Információs Értelmezése

A szófelismerés információs
értelmezése
Információs pszicholingvisztika 2. óra
Pléh Csaba 2014. ősz
pleh.csaba@gmail.com
Áttekintés
• Gyakoriság és a szótár.
• Ziff törvények.
• Predikció a vizuális szófelismerésben.
• Bejóslás és felismerési idő.
• Kohorsz elmélet és a szókezdet értéke.
• ‘Az egyéni szótár információs elemzése.
Gyakorisági viszonyok a nyelv egészében
• A Zipf törvények Estoupf gyorsíró is észrevette már
• A szó gyakorisága fordított arányban áll rangszámával. Vagyis nagyon
gyakori szó kevés van, ritka szó sok. Zipf első törvénye
• Ri ~ 1/iα
• Ahol α ~ 1
• Hozzá hasonló Lotka törvény, Pareto eloszlás:
• Kevés sokat publikáló, s kevés nagyin gazdag ember van

• Mandelbrot általánosítja, optimális információként értelmezi
Ziff törvény
Németh Géza és Zainkó Csaba (BME) adatai
A leggyakoribb szavak : Mit tudunk meg ebből?
Mi a népszerű a nyelvben ?
Milyen gyakorlati következményei vannak?
• Írásban, rövidítésben. Sok rövidítés kell-e?
• Szókincs elsajátításában gyermekeknél
• Szókincs növekedésében második nyelven. A hapax szerepe
• Tárolásban, keresési optimalizációban
Zipf „második törvénye”
• A gyakori szó rövidebb. A legkisebb erőfeszítés törvénye
• Egy példa az Anna Karenyina 1. fejezetére
•
Ennek finomítása. ‚információs tartalom’ jobban
mutatja a gyakoriságot
Minél bejósolhatóbb valami,

annál kevesebb erőfeszítés
a bejóslásához
Menjünk át pszicholingvisztikára
Szavak felismerése és a mentális szótár
• Alaptények: gyakoriság, kontextus

felülről-lefelé kutya – kuvasz
• Hozzáférési utak: akusztikus, grafémikus, közös.
• Általánosítás 1: a jelentés egy közös szótárban
Általánosítás 2: a hó és a hav a Hóhoz kapcsol
Általánosítás 3: a szófaj is tárolva van, s sok mindent elárul
pl. kabát *ik hisz a kabát főnév
A szavak gyakorisága gyakran felmerül
• Olvasás és szókincs tudás mérés megalapozásához
• Asszociatív adatok értelmezéséhez
• Betegek bizarr beszédének interpretáláshoz
• Még stílus statisztikák is megjelennek
Információelméleti észlelés kutatás
• G. A. Miller
• Zaj és észlelés
• Expoziciós idő és felismerés
Gyakoriság és felismerési idő Howes és Solomon
1952
• Korrelációk
A gyakoriságnak vannak szubjektív mutatói is
Ezek jól összefüggenek az objektívakkal
Nyelv Kutató Korr N
Francia Bonin és mtsai. (2003) 0,87 277

Kanadai Desrochers és 0,73 360
francia Bergeron (2000)
Francia Flieller és Tournois 0,86 111
(1994)
Amerikai Balota és mtsai. 0,78 681
angol (2001)
Brit angol Stathagen-Honzalez 0,7 243
és Davis (2006)
Elsajátítási kor
18
16
14
Szókincs%
12
10
8
6
4
2
0
2 3 4 5 6 7 8 9 10 11 12 13
Type Token arány és szókincs
Változó TTR 100 TTR CTTR Peabody Képi szók BeszSzó ÍrottSzó
TTR 100
TTR 0.54 *
CTTR 0. 51 * -.26
Peabody 0.29 * -0.16 0.04
KépiSzókincs 0. 22 -0.01 0.16 0.74 *
Szókincs 0.45 * -0.11 0.34 0.64 * 0.58*
Írott szókincs 0.24 -0.25 -0.27 0.63 * 0.51* 0.36
Összszó .06 -0.78 * 0.26 0.23 0.18 0.38* -0.05
Kor Szubjektív
gyakoriság
Elsajátítási -0,57
kor
Gyakoriság -0,75 0,73
log
Betűk ,20 -0,28
Szomszédok -0,22 0,23
Elképzelhető -0,32 -0,28
A gyakoriság értelmetlen szavakkal is
szimulálható Solomon és Postman
Az ingerek A gyakorisági hatás
Goldiamond és Hawkins ez akkor is megvan,
ha nincs is ott az inger
• Nagy viták
• Valódi észlelési hatás
• Vagy
• Válaszhajlam
• Könnyebben mondom ki, hogy
program mint azt, hogy
proliferáció
Főbb modellek a szófelismerésre
• Küszöb és alapszint változások: logogén, kohorsz, és

konnekcionista modellek
• Adatok: előfeszítés
kutya - macska
kutya - kapu
kiolvasás kereszt
szódöntés kertesz
Logogén modell Morton
Kohorsz modell Marslen-Wilson: hallott szavak felismerése: már az első szótag
alapján
• Aktiválódás minden kompatibilis szóra, majd

kiválasztás
• A bálon rajta volt a …
malom,majom, maszk
maszat,maszek, maszk
maszk
Tévedés: A bálon rajta volt a maszat.
Visszamenés a bemenethez.
Igazodás akkor erős, ha összefüggő a szöveg.
Izolált szavaknál s értelmetlen szövegnél
kevesebb elvárási hatás van.
A konnekcionista felfogás lényegi mozzanatai
• PDP, a Parallel Distributed Processing. (Rumelhart és

McClelland, 1986), McClelland (1988)
• A modell egységekből és azok kapcsolataiból áll. Az egységek
(az elméleti neuronok) környezetüktől összegzett aktivációt
kapnak bemenetként. A kapcsolatok pozitív vagy negatív
előjelű súlyozott, módosítható "drótok" az egységek között.
• A különböző feladatokat eltérő hálózatok (hálózatrészek)
valósítják meg.
• Mindegyikre jellemző azonban a párhuzamos működés.
• A modellben nincsen elvszerű különbség alulról-felfelé s
felülről-lefelé való hatások között, a hálózatokra teljes
összekötöttség jellemző.
Hogyan működik a szavaknál?
• Klasszikus lineáris, szekvenciális modellek: balról-jobbra felismerés,
korlátozott kapcsolat a szintek között
• Hierarchikus szótári viszonyok
• Konnekcionizmus: totális interakció
• Szavak hálója a szótárban
A szófelismerés konnekcionista modellje
A szintek működése egy konkrét szó (TÉR)
felismerésénél
A szófelismerés ‚érzelmibb’ befolyásolói
? Szubcepció vagy gyakoriság ?
• A sajátos kísérleti hatások: szubcepció, előfeszítés, maszkolás,
kétértelműség
• A tudatosítás ablaka
• Mit mondanak ezek a tudatról?
• Nyelv és tudat egyéb eltérései
• Szemantikai hatás  tudat
• A forma tudata
A pszichoanalitikus kép
és a kísérleti felfogás
Elő beszámoló
feldolgozás
Ingerek
Egyéb ingerek
Szubcepció ’50-es évek
• ‘küszöbalatti’ hatás
• Gyakoriság, kiejthetőség s hasonlók is befolyásolnak
• Érték is küszöbcsökkentő
• Tabu szavak: magasabb küszöb.
• Talán információs érték kevesebb jó-rossz 1 bit,
• Míg a szó kb. 20 bit
Bruner et al, 1947: a saját értékrendemnek
megfelelő szavakat gyorsabban ismerem fel
McGuninees galvános bőrreakció és felismerési
idő az érzékeny szavakra
Eriksen 1960 kritikus felfogása
Eriksen: a C modell az érvényes

A kettős fedolgozás és a szubcepció modellje ma
Amygdala
Colliculus
superior
Recehártya
Corpus
geniculatum
laterale
Elsődleges
látókéreg
Beépített elektródák epilepsziásoknál
• Piros – fenyegető – zöld neutrális
• Kék az eltérés
• Maszkolt-nem maszkolt
• Érzelem: még küszöb alatt is
megjelenik a hatása
• ? Milyen neurális körökből?
Előfeszítés
• Ajtó kerék
• Ablak ablak
Maszkolás
• Kutya Legerősebb érzelmi esetben:
Pl. dög
genny
Hasonlított-e a szó érzelmileg?

Macska
Volt-e ehhez hasonló szó?

Nem tudatos előfeszítés jellemzői
gyors s nem hagy nyomot Greenwald et al 1996
Küszöballati priming
Küszöbfeletti priming
0,3
0,25 1
0,2 0,8
0,15 0,6
0,1 0,4
0,05 D'
0,2 Küszfel
0 0
-0,05 Küsz alatt
67 10 133 167 -0,2
-0,4
Késletetés 100 200 300 400
Késletetés
Nyelv és tudat szisztémás eltérülései
• (1) Az irreleváns jelentések automatikus aktiválása.
• (2) A hangrestauráció jelensége 40 % nem tudja, hol volt
• (a) Mindenki csendben volt, csak nekünk jár a *ánk.
• (b) Megettük a főzeléket, nekünk már jár a *-ánk.
• (3) Társalgásainkat számos rejtett nem tudatos szabályszerűség irányítja. Tudjuk
ezt?
• (a) Megkérhetlek, hogy csukd be az ajtót?
• (b) Be tudnád csukni az ajtót?
• (c) Nem akarod becsukni az ajtót?
• (d) Nem kellene becsukni az ajtót?
Kétértelműség
• Általános felismerés: kettős aktiváció
• Nyúl
• Elvi mechanizmus Főnév

•300 ms
•Nyúl
Kétértelmű szavak – egyértelmű mondatok
• Főnév A zenekarból hiányzik a dob. HEGEDŰ HAJÍT
• Ige Feri mindig ballal dob.
• HAJÍT HEGEDŰ
• Kontroll Mari a labdához fél kézzel nyúl. HAJÍT HEGEDŰ
A nem releváns értelem is megjelenik Gergely és Pléh
Mit jelent ez? Dekomponálás
• Kiolvasási idők
460
455
450
Relev
445
Irrel
440
435 Kontroll
430
425
Tő DOB Kétért Egyért
DOBOK DOBSZ
Bonyolultabb hatás: mindig a főnév az elsődleges
Thuma mégpedig ez a gyakoribb
Mondatkontextus Releváns olvasat Irreleváns olvasat
Igei előfeszítés nincs hatás facilitáció

A labdát ballal
dobom
Főnévi előfeszítés facilitáció gátlás
A zenekarban ott
van a dobom.
Vagyis a szófaj döntő: Főnév mindig előnyben (Thuma és
Pléh)
30
20
10
Főnév Relev
0 Ige Irrev
Ige Rel
-10 Főnév Irrel
-20
-30
Tő Kétér Egyértelm
Szóalak
„Tudatos”:
Kettős aktiváció relevancia
szelekció
Visszatudatosítás pl. szóvicc
Megetted már a halad? .
Nem én konzervatív vagyok
Mindez mit is jelent ?
• 300 mscig mindkét jelentés aktív

• Utána már csak a releváns
• Inger tudatosulás
• Dennett 400-800 millisecundumos integrációs ablak

• Ezen az idői ablakon belül áthelyezés, kapcsolatképzés
Tudatosak-e intuitív ítéleteink?
• (a) Ott ült a kávéházban.
• (b) Belement a feladatba.
• (c) Bement a kávéházban.
• (d) Csalódott a feladatba.
A stigmatizáció megjelenése reprezentatív
mintában Pléh, 1995
90 85,2
80 71,2
70
Elfogadási %
60 51,1
47,3
50
40
30
20 11,6
10
0
He Sti Hi Hi He
lyt gm pe pe lye
ele ati rko rko s
n zá rre rre
lt kt, kc
ros ió
sz érz
ék
en
y
A tudatosság növekedésével csökken a hiperkorrekció
Bodor és Pléh tükörben megítélés
90 84
78
80 73
69
70 helytelen (stigmatizált)
60 52
48
százalék
50 helyes
40
30 hiperkorrekciót
18 indukáló
20 12 13
10
0
tükör foncsor csoport
kísérleti helyzet
Jackendoff 2007
1. Az élménytudatosság a hangalakra vonatkozik.
2. A nyelvi tudatosság mindig érzéki képzetekhez, beszédhangokhoz
vagy jelekhez kapcsolódik.
3. A gondolat formája s ezzel a jelentés sosem tudatos.
4. A gondolkodás evidencia élménye javarészt a nyelvi képzetekből
származik.
Jean Piaget: Pszichológia és ismeretelmélet, 1970
• Nem vagyunk azonnali tudatában pszichés műveleteinknek, s ezek

önműködően zajlanak le, míg csak akadályba nem ütköznek. A
tudatosítás tehát centripetális s nem centrifugális, vagyis a műveletek
külső eredményeiből indul ki, mielőtt azok belső mechanizmusaira
áttérne.
Lehetséges feladatok
• Entrópiaértékek a magyar szótárban a szóalakok alapján eltérő
gyakoriságoknál.
• KABÁT kabátok kabáthoz
• ÜRGE ürgét, ürgének stb.
• http://mokk.bme.hu/resources/webcorpus/
• Egyéni szógyakoriságok, pl. email szövegek alapján, s viszonyuk a
corpus gyakorisághoz
• Szubjektív és objektív gyakoriság összevetése.
• Hol tér el?

A Szófelismerés Információs Értelmezése

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

A Szófelismerés Információs Értelmezése

Uploaded by

Copyright:

Available Formats

A szófelismerés információs

• Kevés sokat publikáló, s kevés nagyin gazdag ember van

Minél bejósolhatóbb valami,

• Alaptények: gyakoriság, kontextus

Francia Bonin és mtsai. (2003) 0,87 277

• Küszöb és alapszint változások: logogén, kohorsz, és

• Aktiválódás minden kompatibilis szóra, majd

• PDP, a Parallel Distributed Processing. (Rumelhart és

Eriksen: a C modell az érvényes

Hasonlított-e a szó érzelmileg?

Volt-e ehhez hasonló szó?

• Elvi mechanizmus Főnév

Igei előfeszítés nincs hatás facilitáció

• 300 mscig mindkét jelentés aktív

• Dennett 400-800 millisecundumos integrációs ablak

• Nem vagyunk azonnali tudatában pszichés műveleteinknek, s ezek

You might also like