Professional Documents
Culture Documents
e-magyar elemzőlánc
mély tanulás -> megfelelő algoritmus kitalálása a feladat, a feladatot már a gép fogalmazza
meg
autoML -> a gép már a megfelelő algoritmust is megtalálja
gépi tanulás
o felügyelt
kérdés-válasz párok
címkézett tanító adatok
szekvenciális címkézés
osztályozás
o nem felügyelt gépi tanulás
sok, címkézetlen adat
nyelvmodellek
o távolról/félig felügyelt
o szekvenciális címkézés
szófaji
tulajdonnév felismerés
o osztályozási feladat
ismeretlen példához címkét szeretnénk adni
natural language inference
o címkézett példák gyűjtése -> ebből alkot modellt
diszkriminatív <-> generatív
diszkriminatív: mi az információ, ami alapján a kettő elkülöníthető
generatív: olyan modell, amivel rekonstruálni is tudja
amit csak lehet, számszerűsítünk
lineáris regresszió
o logisztikus regresszió (maximum entrópia)
bináris osztályozás: 2 osztály/ címke van
szigmoid görbe széthúzza az értékeket 1 és 0 felé
valószínűség predikáció ->küszöbérték
súly és eltolás érték
mesterséges neuronhálók alapegysége
o osztályozók kiértékelése
teszthalmaz: címkézett példák amiket tanuláskor nem láthatott a modell
pontosság: hány példán volt helyes a modell
fedés:
F1-mérték
rejtett Markov-modell
o szófaji címkézés
szekvenciális
kontextus alapján a legvalószínűbb szófaji-morfológiai címke
o Markov-lánc
eseménysorozat jóslására
Markov-feltételezés: csak a jelen számít, a múlt nem
Python
pytorch
TensorFlow