You are on page 1of 3

Semi Pengawasan Pembelajaran Berbasis Penyakit-Gejala Dan

Gejala-Terapi Zat Hubungan Ekstraksi Dari


Sastra Biomedis

Penulis Jurnal

Qinlin Feng, Yingyi Gui, Zhihao Yang, LeiWang dan Yuxia li.

Metode Penelitian

Dalam metode ini, set fitur untuk model gejala penyakit dibagi menjadi tiga pandangan: fitur
kernel, Kernel Konvolusi, Grafik Kernel, Co-Pelatihan Algoritma dan Algoritma Tri-
Training.

1. Fitur Kernel
Pekerjaan utama metode fitur kernel adalah pilihan fitur yang memiliki dampak yang
signifikan terhadap kinerja. Fitur berikut digunakan dalam kernel berbasis fitur.
2. Kernel Konvolusi
sebuah kernel konvolusi khusus, digunakan untuk memperoleh informasi struktural
yang berguna dari substruktur.
3. Grafik Kernel
Kesamaan dua grafik dihitung dengan membandingkan hubungan antara dua node
publik (simpul). Metode kami menggunakan kernel semua-jalur graph, kernel terdiri
dari dua subgraphs diarahkan, yaitu, grafik parse dan grafik yang mewakili urutan
linear dari kata-kata.
4. Co-Pelatihan Algoritma
Algoritma Co-Training kami dijelaskan dalam Algoritma 1: Algoritma 1 (algoritma
Co-Training). (1) Input adalah sebagai berikut: Data label dan data berlabel
Inisialisasi training set () yang cukup dan berlebihan views.
5. Algoritma Tri-Training
Algoritma Co-Training membutuhkan dua pandangan yang cukup dan berlebihan.
Namun, kendala ini tidak ada di sebagian besar skenario dunia nyata.

Hasil Penelitian
Hasil penelitian menunjukkan bahwa pemanfaatan data berlabel dengan baik Co-Pelatihan
dan algoritma Tri-Training bisa meningkatkan kinerja secara efektif. Alasannya adalah
bahwa, sebagai hasil proses Co-Training, semakin banyak berlabel data dinamai dengan satu
classifier untuk yang lain, yang meningkatkan kinerja baik pengklasifikasi. Namun, setelah
sejumlah iterasi, kinerja pengklasifikasi tidak bisa ditingkatkan lagi karena terlalu banyak
suara (positif palsu dan negatif palsu) dapat dimasukkan dari data berlabel.

Analisa Jurnal
Penelitian ini menyajikan metode membangun dua model untuk mengekstraksi hubungan
antara penyakit dan gejala dan gejala dan substansi terapi dari biomedisteks, masing-masing.
Dalam metode ini, pertama dua set pelatihan untuk mengekstraksi hubungan antara substansi
gejala penyakit-terapi penyakit-symptomand secara manual dijelaskan dan kemudian dua
semisupervised algoritma pembelajaran, yaitu, Co-Pelatihan dan Tri-Pelatihan, diterapkan
untuk memanfaatkan data tanpa label untuk meningkatkan ekstraksi relasi kinerja. Yang
pertama adalah hubungan antara penyakit dan fenomena fisiologis yang terkait dalam sebuah
kalimat. Misalnya, kalimat "banyak karakteristik-kapal terkait darah-darah dan khas untuk
pasien Raynaud: viskositas darah dan aggregability platelet yang tinggi" menunjukkan bahwa
viskositas darah dan aggregability platelet adalah fenomena fisiologis penyakit Raynaud.
Yang terakhir adalah hubungan antara fenomena fisiologis dan zat terapi yang dapat
meringankannya dalam sebuah kalimat. Misalnya, kalimat "minyak ikan dan nya bahan aktif
asam eicosapentaenoic (EPA) menurunkan kekentalan darah" menunjukkan bahwa minyak
ikan dan EPA dapat meringankan fenomena fisiologis (kekentalan darah). Kedua jenis
hubungan dapat lebih dimanfaatkan untuk mengekstrak hubungan antara penyakit dan zat
terapeutik.

Sejumlah besar penelitian tentang Co-Pelatihan membuktikan bahwa jika dua pandangan
memiliki keragaman besar, Co-Training mampu meningkatkan kinerja belajar dengan
memanfaatkan data berlabel bahkan dengan pemandangan cukup. Sampai saat ini, Tri-
Pelatihan dan Co-Pelatihan telah banyak digunakan dalam pengolahan bahasa alami. Pierce
dan Cardie diterapkan Co-Pelatihan untuk nomina pengakuan frase.

Dibandingkan dengan kinerja pengklasifikasi pada awal set tes penyakit-gejala, yang dicapai
melalui Tri-Pelatihan secara signifikan ditingkatkan. Hal ini menunjukkan bahwa Tri-
Pelatihan dapat memanfaatkan data berlabel dan meningkatkan kinerja yang lebih efektif.
Alasannya adalah bahwa, algoritma Tri-Pelatihan dapat mencapai hasil yang memuaskan
sementara tidak membutuhkan ruang misalnya untuk digambarkan dengan pemandangan
yang cukup dan berlebihan juga tidak menempatkan kendala apapun pada metode
pembelajaran diawasi. Hasil penelitian dapat dilihat bahwa pemanfaatan data berlabel dengan
baik Co-Pelatihan dan algoritma Tri-Training bisa meningkatkan kinerja secara efektif.

Kesimpulan

Pertumbuhan yang cepat dari literatur biomedis, teknologi ekstraksi informasi telah luas
diterapkan untuk ekstraksi relasi dalam literatur biomedis ini, Misalnya, penggalian hubungan
semantik antara penyakit,obat, gen, protein, dan sebagainya. Untuk itu perlu digunakan
metode algoritma pembelajaran semisupervised, yang, Co-Pelatihan dan Tri-Pelatihan, yang
diterapkan untuk mengeksplorasi data tanpa label untuk meningkatkan kinerja. Selain itu,
bahkan jika data yang diberi label terbatas yang tersedia, masih sulit untuk mencapai
kemampuan generalisasi. Pertama secara manual dijelaskan dua set pelatihan untuk
mengekstraksi hubungan antara gejala-penyakit dan substansi gejala-terapi dan kemudian
memperkenalkan metode pembelajaran semisupervised, untuk memanfaatkan data berlabel.
Untuk melatih metode pembelajaran Semisupervised mencoba untuk mengeksploitasi data
tanpa label untuk membantu meningkatkan kemampuan generalisasi dari classifier dengan
data berlabel terbatas. Hasil penelitian menunjukkan bahwa pemanfaatan data berlabel
dengan baik Co-Pelatihan dan algoritma Tri-Pelatihan dapat meningkatkan kinerja. Di sisi
lain, kita akan menerapkan gejala-penyakit dan model substansi gejala-terapi untuk
mengekstrak hubungan antara penyakit dan zat terapeutik dari literatur biomedis dan
memprediksi zat terapi yang potensial untuk penyakit tertentu.

Sumber Jurnal

https://www.ncbi.nlm.nih.gov/pubmed/27822473 (diakses pada tanggal13 Desember 2016 :


pukul 21:00 WIB)

You might also like