Perbandingan Metode Naive Bayes Dan Decision Tree Pada Weka PDF

Nama : Juliano Christian Bae Buro
NIM : 2011.01878.11.0220
Matakul : Data Warehouse & Data Mining
Nama Dosen : Sulidar Fitri, M.sc

Semester 7 Pagi - S1 Teknik Informatika
Jawaban Soal UTS DWDM
Soal Ujian :
1. Gunakan Dataset penentuan kualitas buah berikut ini:
a. Tentukan Kelas dari data baru di bawah menggunakan algoritma Naive Bayesian
Classifier! Sertakan perhitungannya
No
1
Kelas
?????
Kulit Buah
Kasar
Warna
Hijau
Jawab :
P(kelas : Aman) = 10/16 = 0,625
P(kelas : Berbahaya) = 6/16 = 0,375
P(kulit buah : kasar | kelas : aman) = 6/10 = 0,6
P(kulit buah : kasar | kelas : berbahaya) = 2/6 = 0,3
P(warna : hijau | kelas : aman) = 2/10 = 0,2
P(warna : hijau | kelas : berbahaya) = 4/6 = 0,7
P(ukuran : kecil | kelas : aman) = 5/10 = 0,5
P(ukuran : kecil | kelas : berbahaya) = 4/6 = 0,7
P(bau : keras | kelas : aman) = 7/10 = 0,7
P(bau : keras | kelas : berbahaya) = 4/6 = 0,7
Ukuran
Kecil
Bau
Keras
P(x | kelas = aman)

(kulit buah : kasar | kelas : aman) = 0,6
(warna : hijau | kelas : aman) = 0,2
(ukuran : kecil | kelas : aman) = 0,5
(bau : keras | kelas : aman) = 0,7
- 0,6 x 0,2 x 0,5 x 0,7 = 0,042
P(x | kelas = berbahaya)
(kulit buah : kasar | kelas : berbahaya) = 0,3
(warna : hijau | kelas : berbahaya) = 0,7
(ukuran : kecil | kelas : berbahaya) = 0,7
(bau : keras | kelas : berbahaya) = 0,7
- 0,3 x 0,7 x 0,7 x 0,7 = 0,103
P(x | kelas : aman)P(kelas : aman) =
- 0,042 x 0,625 = 0,026
P(x | kelas : berbahaya)P(kelas : berbahaya) =
- 0,103 x 0,375 = 0,039 Nilai paling besar
Jadi, kesimpulannya : Hasil dari prediksi data baru menggunakan algoritma naive bayesian
classifier yaitu : kelas Berbahaya = 0,039.
b. Buatlah Pohon keputusan berdasarkan data tersebut. Sertakan perhitungan dan
gambar pohonnya!
Jawab :
Class P : kelas = aman (10)
Class N : kelas = berbahaya (6)
-
Info (D) = I (10,6) = - 10/16 log2 (10/16) 6/16 log2 (6/16) = 0,954
Warna
Coklat
Hijau
Merah
P1
3
2
5
N1
0
4
2
(P1,N1)
0
0,918
0,863
Info warna (D) = 3/16 I (3,0) + 6/16 I (2,4) + 7/16 I (5,2) = 0,722
Gain ( Warna) = Info (D) Info warna (D)
= 0,954 0,722
= 0,232
Kulit Buah
Kasar
Halus
P1
6
4
N1
2
4
(P1,N1)
0,811
1
Info buah (D) = 8/16 I (6,2) + 8/16 I (4,4) = 0,906

Gain buah (D) = Info (D) Info buah (D)
= 0,954 0,906
= 0,048
Ukuran
Besar
Kecil
-
P1
5
5
N1
2
4
(P1,N1)
0,863
0,991
Info ukuran (D) = 7/16 I (5,2) + 9/16 I (5,4) = 0,935

Gain ukuran
= Info (D) Info ukuran (D)
= 0,954 0,935
= 0,019
Bau
Keras
Lunak
P1
7
3
N1
4
2
Info bau (D) = 11/16 I (7,4) + 5/16 I (3,2) = 0,954

Gain bau (D) = Info (D) Info bau (D)
= 0,954 0,954
=0
Gain (Warna)
Gain (Kulit buah)
Gain (Ukuran)
Gain (Bau)
(P1,N1)
0,946
0,971
= 0,232 Warna yang paling besar

= 0,048
= 0,019
=0
Hasil pohon keputusannya :

Warna
Coklat
Hijau
(3,0)
Aman ( yes )
Merah
a. Proses data warna Hijau

Kelas
Aman
Aman
Berbahaya
Berbahaya
Berbahaya
Berbahaya
-
Kulit buah
Kasar
Kasar
Kasar
Halus
Halus
Kasar
Ukuran
Besar
Besar
Kecil
Kecil
Kecil
Kecil
Bau
Keras
Lunak
Lunak
Keras
Keras
Keras
Info (D)
= I (2,4) = - 2/6 log2 (2/6) 4/6 log2 (4/6) = 0,918
Informasi : Gain warna tidak perlu dihitung lagi, yang dihitung adalah gain
kulit buah, ukuran dan bau.
Kulit Buah
Kasar
Halus
Warna
Hijau
Hijau
Hijau
Hijau
Hijau
Hijau
P1
2
0
N1
2
2
(P1,N1)
1
0
Info kulit buah (D) = 4/6 I (2,2) + 2/6 I (0,2) = 0,667

Gain (kulit buah) = Info (D) Info kulit buah (D)
= 0,918 0,667
= 0,251
Ukuran
Besar
Kecil
- Info ukuran (D)
- Gain (ukuran)
Bau
Keras
Lunak
- Info bau (D)
- Gain (bau)
P1
2
0
N1
0
4
(P1,N1)
0
0
= 2/6 I (2,0) + 4/6 I (0,4) = 0

= 0,918 0
= 0,918
P1
1
1
N1
3
1
= 4/6 I (1,3) + 2/6 I (1,1) = 0,874

= Info (D) Info bau (D)
= 0,918 0,874
= 0,044
(P1,N1)
0,811
1
Gain (kulit buah)

Gain (ukuran)
Gain (bau)
= 0,251
= 0,918 Ukuran yang paling besar
= 0,044
Kesimpulannya : Dari hasil perhitungan data warna hijau ditemukan bahwa Gain ukuran
= 0,918 nilanya lebih besar.
b. Proses data warna Merah
Kelas
Berbahaya
Aman
Aman
Aman
Aman
Berbahaya
Aman
-
Kulit buah
Halus
Kasar
Halus
Kasar
Kasar
Halus
Halus
Ukuran
Besar
Kecil
Kecil
Besar
Kecil
Besar
Kecil
Bau
Lunak
Keras
Keras
Keras
Lunak
Keras
Keras
Info (D)
= I (5,2) = - 5/7 log2 (5/7) 2/7 log2 (2/7) = 0,863
Informasinya : Gain warna coklat tidak perlu dihitung lagi, yang harus
dihitung adalah kulit buah, ukuran dan bau dari warna merah.
Kulit Buah
Kasar
Halus
Warna
Merah
Merah
Merah
Merah
Merah
Merah
Merah
P1
3
2
N1
0
2
(P1,N1)
0
1
Info kulit buah (D) = 3/7 I (3,0) + 4/7 I (2,2) = 0,571

Gain (Kulit buah) = Info (D) Info kulit buah (D)
= 0,863 0,571
= 0,292
Ukuran
Besar
Kecil
- Info ukuran (D)
- Gain (ukuran)
Bau
Keras
Lunak
P1
1
4
N1
2
0
(P1,N1)
0,918
0
= 3/7 I (1,2) + 4/7 I (4,0) = 0,393

= 0,863 0,393
= 0,470
P1
4
1
5
N1
1
1
(P1,N1)
0,722
1
- Info bau (D)

- Gain (bau)
= 5/7 I (4,1) + 2/7 I (1,1) = 0,801

= Info (D) Info bau (D)
= 0,863 0,801
= 0,062
Gain (kulit buah)

Gain (ukuran)
Gain (bau)
= 0,292
= 0,470 Ukuran yang paling besar
= 0,062
Hasil pohon keputusannya :

Warna
Coklat
Hijau
Merah
Ukuran
Ukuran
(3,0)
Aman ( yes )
Besar
Kecil
(2,0)
Aman( yes )
(0,4)
Berbahaya( no )
Besar
(1,2)
Berbahaya( no )
Kecil
(4,0)
Aman( yes )
2. Gunakan software weka dan lakukanlah pengolahan data untuk beberapa dataset yang
sudah disediakan berdasarkan ketentuan : (sesuaikan dataset dengan data mahasiswa
pada presensi.xlsx)
a. Laporkan langkah / teknik yang kalian lakukan pada proses pengolahan data dalam
weka. Sertakan juga langkar pembuatan file *.arff
Jawab :
Langkah pertama : Menyiapkan file dataset mahasiswa (file monks),

sebelum melakukan proses pengolahan data pada weka, hal pertama yang
harus dilakukan yaitu merubah file dataset tersebut ke dalam bentuk *.arff
sehingga proses pengolahan dataset presensi mahasiswa dapat berjalan
sebagaimana mestinya (file monks).
File Dataset
Gambar 1. file dataset yang harus disediakan
Langkah kedua : sebelum mengubah file *.arff, terlebih dahulu dilakukan

yaitu melakukan konversi data monk-2.train. Cara yang dilakukan sebagai
berikut : membuka file dataset tersebut menggunakan excel, yang kemudian
mengubah tipe file ke dalam tipe file *.csv.
Gambar 2. Hasil data yang dibuka menggunakan excel

7
Kemudian lakukan save as file tersebut di atas, lalu simpan dengan tipe *.csv.
1. Ganti format
menjadi csv.
2. Klik Save.
Gambar 3. Mengganti format file nya ke dalam bentuk *.csv

Setelah di simpan, berarti file dataset nya sudah menjadi file baru dengan tipe
*.csv yang nanti nya akan dipakai dan dimasukan ke dalam weka untuk di
jadikan file *.arff. Tapi perlu diketahui bahwa weka menggunakan standar
pemisahan pada itu menggunakan tanda , sedangkan file csv yang baru dibuat
menggunakan dua standar pemisahan yaitu ; dan ,. Sebelum dimasukan ke
dalam weka, terlebih dahulu mengubah nya secara manual tanda pemisahan
tersebuh menggunakan notepad. Karna weka hanya akan menerima data
pemisahannya menggunakan ,. Gunakan teknik replace all untuk mengubah
semua data.
1. Klik edit Gunakan teknik

replace all.
2. Setelah diubah lakukan save
as dgn tipe *.csv
3. Data di samping adalah hasil
dari edit data pada langkah
pertama.
Gambar 4. Edit dataset
data di atas sudah diubah tanda pemisahnya, yang sebelumnya menggunakan

tanda ; sekarang telah menjadi ,. Kemudian lakukan save as simpan
dengan tipe yang sama yaitu *.csv.
Langkah ketiga : semua data yang telah siap, kemudian dimasukkan ke dalam
weka untuk melihat data tersebut berhasil di terima atau tidak oleh weka.
- Buka Software weka, kemudian klik pada menu kotak dialog
explorer untuk membuka dataset.
Hasil dari pemanggilan menu explorer pada software weka.
1. Klik open file

untk memanggil
dataset nya
4. Klik menu save untuk

menyimpan data yg akan
menjadi file *.arff
2. Table dataset yang
berhasil di panggil weka
menggunakan file *csv.
3. Data Visualize - >
File yang dimasukkan pada langkah diatas masih file *.csv yang telah
terbaca oleh weka. Dengan mengklik menu save dataset akan
diubah ke dalam format .arff yang menjadi tujuan awal.
Hasil data yang

disimpan menjadi file
baru *.arff
Gambar 5. Dataset monks-train telah menjadi file *.arff

-
Tampilan File dataset *.arff monks yang berhasil diubah. Dari

tampilan dibawah dapat di lihat bahwa ada pemisahan bagian-bagian
data. Struktur file *.arff pada weka terdapat 3 bagian utama yaitu
header yang berisi @relation, bagian tengah @attribute dari data,
kemudian yang terakhir yaitu @data, berisi sejumlah data.
Bagian @relation
Bagian @attribute
Bagian @data
Gambar 6. File *.arff

Kesimpulan : Langkah langkah di atas merupakan langkah sebelum pengolahan data yaitu
melakukan konversi 2 file dataset presensi monks-2.train (data training/model) dan monks2.test untuk prediksi data baru ke dalam file *.arff
b. Gunakan Algoritma Naive Bayes classifier untuk membuat model dan memprediksi
data baru. Lampirkan informasi output ke dalam laporan.
Jawab :
Langkah-langkah untuk membuat model menggunakan algoritma naive

bayes sebagai berikut :
10
Langkah pertama : Membuka aplikasi weka kemudian memasukkan

dataset presensi yang bertipe *.arff. Dataset yang dimasukkan yaitu
dataset monks-train yang merupakan dataset yang akan dipakai untuk
membuat model atau training data.
Menu classify
Data training model yang

dipakai utk membuat
model
Kemudian setelah memasukkan data monks-train, masukklah pada

menu classify untuk memodelkan data dan ikutlah langkah-langkah
yang tercetak merah di dalam gambar tersebut.
1. Pilihlah menu choose utk

mengganti algoritma naive bayes
2. Pakailah use training set utk
memodelkan data.
3. Klik tombol start utk melihat
hasil
Gambar 7. Tampilan Classify
11
Langkah selanjutnya lakukan pembuatan model pada dataset

monks-train dengan menggunakan algoritma naive bayesian
classfier yaitu dengan cara sebagi berikut :
1. Plih menu choose naive bayes.

2. Pilih use training set.
3. Klik kanan pd data yg di run prtama
kali, kemudian save model tersebut.
Setelah di save, kemudian load kembali model yang di simpan

tersebut dengan mengikuti langkah ketiga di atas dengan mengklik
load model. Kemudian klik star maka akan diperoleh ouput model
information dari algoritma naive bayes yang digunakan. Hasilnya
seperti berikut.
12
Model Information dari

Algoritma naive bayes
Output Model
Load model
Langkah langkah prediksi data baru menggunakan algoritma naive bayes.

- Langkah awal yaitu dengan membuka file dataset monks-test.*arff
yang akan dipakai untuk memprediksi data baru menggunakan
algoritma naive bayes. Langkah di atas sama hal dengan cara
memprediksi data baru yang akan dilakukan, tetapi ada beberapa
perubahan yaitu sbb :
1. Pilih algoritma naive bayes

2. Klik set pada suplied test set maka akan
muncul kotak dialog test instances di atas
utk mengambil data prediksi test
3. Klik star untuk melihat outputnya.
Sebelum melakukan prediksi data baru, data test yang akan

dipakai untuk memprediksi data baru sebelumnya harus di
kosongkan class nya terlebih dahulu, menggantikan dengan tanda
?.
13
Contoh Class yang

di kosongkan
Hasil perbandingan klasifikasi menggunakan naive bayesian dapat di

lihat berikut ini berdasarkan tingkat corectly dan incorectrly :
Merupakan Perbandingan
dgn algoritma naive bayes,
dgn melihat tingkat
corectly & Incorectly
Dari langkat di atas hasil prediksi dari yang kita lakukan belum
ditemukan, selanjutnya kita akan melihat visualize classifer error
dari penggunakan algoritma naive bayes terhadap dataset prediksi.
14
Selanjutnya klik kanan pada datasetx

kemudian akan muncul kotak dialog di
samping. Klik Vizualize classifier errors.
Merupakan
class prediksi
baru dari
dataset
Klik Save dan kemudian

akan menyimpan file
prediksi naive bayes
Menunjukkan matriks
error dari kodinat x,y
penggunaan algoritma
naive bayes
Setelah melalui langkah di atas, berarti file prediksi yang baru di

prediksi sudah jadi dan berbentuk file *.arff. Sekarang yang harus
dilakukan yaitu membuka kembali file prediksi tersebut untuk
melihat hasil prediksi dari naive bayes. Buka aplikasi weka kemudian
klik menu dan muncul kotak dialog klik ArffViewer maka akan
muncul tampilan ArffViewer. Buka file prediksi yang tadi telah di
simpan kemudian klik open, maka akan muncul tabel hasil prediksi
dari naive bayes classifier
15
Merupakan Data
Prediksi Naive Bayes
16
c. Gunakan algoritma J48 untuk decision tree untuk membuat model dan memprediksi
data baru. Lampirkan informasi output ke dalam laporan dan gambar visualisasi
pohon keputusannya.
Jawab :
Membuat model menggunakan algoritma J48 decision tree.
- Langkah-langkah membuat model pada weka menggunakan file
dataset presensi monks-train menggunakan algoritma decision tree
sama dengan langkah-langkah di atas yang di pakai dalam
memodelkan data pada algoritma naive bayes. Proses memilih
algoritma, memakai use training set, kemudian mengklik tombol star
sampai save dan load model dll. Sehingga akan diperoleh sebuah
ouput dari model yang telah dibuat yaitu sbb :
Menu classify
Data training model yang

dipakai utk membuat
model
Kemudian setelah
langkah berikut :
masuk pada menu classify, ikutlah langkah-
17
1.
2.
3.
Klik menu choose, pilih algoritma

J48 utk
Melakukan training data.
Klik Use Training Set
Kemudia Klik Start
Setelah langkah di atas dilakukan, lalu kita akan membuat model

baru menggunakan algoritma decision tree atau J48 pada weka
sebagai berikut :
Klik save
model untuk
membuat model
baru.
Sebelum klik save, kita akan melihat perbandingan menggunakan

algoritma J48 dengan tingkat corectly dan incorectly classifier
instance.
18
Merupakan perbandingan
menggunakan J48 corectly &
Incorectly.
Selanjutnya save model dan kemudian load kembali model yang baru
saja di save untuk melihat hasil model nya.
Model Information
dari Algoritma J48
Hasil model dataset setelah di

load model
Load model
Selanjutnya melihat tampilan visualize tree model :
19
Langkah prediksi file dataset test menggunakan algoritma decision tree

sebagai berikut :
- Langkah awal memprediksi file dataset test sama dengan langkah
awal prediksi yang dilakukan pada algoritma naive bayes. Namun
ada beberapa langkah berbeda dalam implementasi nya.
1. Pilih choose
2. Supplied test setklik open
memanggil file test.
3. Klik star untuk melihat
outputx.
Hasil Perbandingan
menggunakan algoritma J48
dengan corectly &
incorectly
20
Klik kanan pada dataset

test, kemudian Klik
visualize classifier error,
maka akan muncul
Tampilan berikut.
Klik save data

prediksi class
Class prediksi baru

dari algoritma
decision tree
Menunjukkan matriks
error dari kodinat x,y
penggunaan algoritma
Decision tree
Gambar di atas menunjukkan tampilan visualize classifier error dari

dataset test yang akan menghasilkan data prediksi baru menggunakan
algoritma decision tree J48. Tampilan langkah-langkah nya sesuai
dengan prediksi yang dilakukan oleh naive bayes, maka selanjutnya
adalah klik save kemudian simpan file prediksi nya, yang nanti akan
di buka kembali menggunakan weka.
21
Hasil Prediksi dari

Algoritma Decision
Tree
Setelah semua langkah di atas sudah berhasil di jalankan, langkah

terakhir yaitu melihat tampilan visualize tree dari dataset test. Hasil
nya sebagai berikut.
22
Gambar. Visualize tree file dataset monks-test secara keseluruhan.
Sekian & Terima kasih
23

Perbandingan Metode Naive Bayes Dan Decision Tree Pada Weka PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Perbandingan Metode Naive Bayes Dan Decision Tree Pada Weka PDF

Uploaded by

Copyright:

Available Formats

Nama : Juliano Christian Bae Buro

Nama Dosen : Sulidar Fitri, M.sc

P(x | kelas = aman)

Info buah (D) = 8/16 I (6,2) + 8/16 I (4,4) = 0,906

Info ukuran (D) = 7/16 I (5,2) + 9/16 I (5,4) = 0,935

Info bau (D) = 11/16 I (7,4) + 5/16 I (3,2) = 0,954

= 0,232 Warna yang paling besar

Hasil pohon keputusannya :

a. Proses data warna Hijau

Info kulit buah (D) = 4/6 I (2,2) + 2/6 I (0,2) = 0,667

= 2/6 I (2,0) + 4/6 I (0,4) = 0

= 4/6 I (1,3) + 2/6 I (1,1) = 0,874

Gain (kulit buah)

Info kulit buah (D) = 3/7 I (3,0) + 4/7 I (2,2) = 0,571

= 3/7 I (1,2) + 4/7 I (4,0) = 0,393

- Info bau (D)

= 5/7 I (4,1) + 2/7 I (1,1) = 0,801

Gain (kulit buah)

Hasil pohon keputusannya :

Langkah pertama : Menyiapkan file dataset mahasiswa (file monks),

Gambar 1. file dataset yang harus disediakan

Langkah kedua : sebelum mengubah file *.arff, terlebih dahulu dilakukan

Gambar 2. Hasil data yang dibuka menggunakan excel

Gambar 3. Mengganti format file nya ke dalam bentuk *.csv

1. Klik edit Gunakan teknik

Gambar 4. Edit dataset

data di atas sudah diubah tanda pemisahnya, yang sebelumnya menggunakan

Hasil dari pemanggilan menu explorer pada software weka.

1. Klik open file

4. Klik menu save untuk

Hasil data yang

Gambar 5. Dataset monks-train telah menjadi file *.arff

Tampilan File dataset *.arff monks yang berhasil diubah. Dari

Gambar 6. File *.arff

Langkah-langkah untuk membuat model menggunakan algoritma naive

Langkah pertama : Membuka aplikasi weka kemudian memasukkan

Data training model yang

Kemudian setelah memasukkan data monks-train, masukklah pada

1. Pilihlah menu choose utk

Gambar 7. Tampilan Classify

Langkah selanjutnya lakukan pembuatan model pada dataset

1. Plih menu choose naive bayes.

Setelah di save, kemudian load kembali model yang di simpan

Model Information dari

Langkah langkah prediksi data baru menggunakan algoritma naive bayes.

1. Pilih algoritma naive bayes

Sebelum melakukan prediksi data baru, data test yang akan

Contoh Class yang

Hasil perbandingan klasifikasi menggunakan naive bayesian dapat di

Selanjutnya klik kanan pada datasetx

Klik Save dan kemudian

Setelah melalui langkah di atas, berarti file prediksi yang baru di

Data training model yang

masuk pada menu classify, ikutlah langkah-

Klik menu choose, pilih algoritma

Setelah langkah di atas dilakukan, lalu kita akan membuat model

Sebelum klik save, kita akan melihat perbandingan menggunakan

Hasil model dataset setelah di

Selanjutnya melihat tampilan visualize tree model :

Langkah prediksi file dataset test menggunakan algoritma decision tree

Klik kanan pada dataset

Klik save data

Class prediksi baru