Professional Documents
Culture Documents
DA TRN
THC TH C TN
C
Patterns
Feature
Selection/
Extraction
Pattern
Representations
Interpattern
Similarity
Grouping
Clusters
feedback loop
Hnh 1: Cc giai on trong bi ton gom cm[4]
42
S 11 - 2010
(Eqs. 2)
k
H (C ) = (
i =1
| Ci |
|C |
log i )
N
N
d iK
r r
r r
r r
S 11 - 2010
wNC.cosine(
+ (1 a).cosine(
r r
) + wI.cosine( d I , qI )]
,
(Eqs. 3)
Tuy nhin, hai c im t kha v thc th c
tn ca ti liu l khng c lp nhau. Ngha l mt t hay
cm t xut hin trong vn bn c th c xem l mt t
kha cng c th c xem l mt thc th c tn. Do
pht sinh vn l chng lp hay khng chng lp trong
qu trnh xc nh hai vect d iK v vect d iNE cho mi ti
liu di. Ngha l khi m mt thut ng no l mt trong
cc c trng ca thc th c tn th sau c m n nh
mt t kha hay khng. Vi l do trn, chng ti xut
hai m hnh khng gian vect tng ng vi quan im c
chng lp v khng chng lp cho bi ton gom cm ti
liu t ra. M hnh ng vi quan im c chng lp c
t tn l VSM_OVL v VSM_NOVL l tn ca m hnh ng
vi quan im khng chng lp.
43
Ti liu th
nh ch mc
ti liu
Nhn din NE v
ch thch ng ngha
ti liu
ti liu. u vo ca h thng l tp ti
liu th. Ti liu th l cc vn bn, trang
Web, Tp ti liu ny c a vo
module Nhn din NE v ch thch ng
ngha ti liu nhn din cc NE xut
hin trong ti liu. Qu trnh ch thch
ng ngha ti liu c s tham gia ca
Ontology v C s tri thc. Kt qu ca
qu trnh ny l tp ti liu vi cc NE
c nhn din v ch thch ng ngha,
gi l Kho ti liu c ch thch NE.
Tp ti liu th c a vo module
nh ch mc ti liu. Nu ngi s
dng chn m hnh gom cm ti liu
VSM_NOVL th Kho ti liu c ch
thch NE cng c a vo module
ny nh phn tch trn. Sau khi qua
module ny, ta c tp ti liu c nh
ch mc theo m hnh gom cm ti liu
tng ng. Trung tm ca h thng
gom cm ti liu l module Gom cm
ti liu theo cc m hnh VSM_OVL,
VSM_NOVL. Sau khi qua module ny,
tp ti liu c gom thnh cc cm v
tr v cho ngi s dng.
Kho ti liu c
nh ch mc theo
VSM_OVL
Kho ti liu c
nh ch mc theo
VSM_NOVL
Kho ti liu c
ch thch NE
Gom cm ti liu theo cc m
hnh VSM_OVL, VSM_NOVL
Ontology v C s
tri thc
Cc cm ti
liu
44
THC NGHIM V NH GI
Trong bi bo ny, chng ti tp trung
vo c trng lp (type) ca thc th c tn v c trng ny
b b qua trong cc h thng gom cm da trn t kha.
Do , chng ti thc nghim trn cc vect
r r
.cosine( d T , qT ) + (1 ).cosine(
,
). Trong , c
gi
tr
thay i t 0 n 1, cho bit ng ngha ca
NE v KW ng gp cho cht lng gom cm. Khi = 0
S 11 - 2010
Bng 1: Cc gi tr OE v VI vi k = 4 v thay i
S 11 - 2010
45