Professional Documents
Culture Documents
NIM : 2011.01878.11.0220
Matakul : Data Warehouse & Data Mining
Soal Ujian :
1. Gunakan Dataset penentuan kualitas buah berikut ini:
a. Tentukan Kelas dari data baru di bawah menggunakan algoritma Naive Bayesian
Classifier! Sertakan perhitungannya
No
1
Kelas
?????
Kulit Buah
Kasar
Warna
Hijau
Jawab :
P(kelas : Aman) = 10/16 = 0,625
P(kelas : Berbahaya) = 6/16 = 0,375
P(kulit buah : kasar | kelas : aman) = 6/10 = 0,6
P(kulit buah : kasar | kelas : berbahaya) = 2/6 = 0,3
P(warna : hijau | kelas : aman) = 2/10 = 0,2
P(warna : hijau | kelas : berbahaya) = 4/6 = 0,7
P(ukuran : kecil | kelas : aman) = 5/10 = 0,5
P(ukuran : kecil | kelas : berbahaya) = 4/6 = 0,7
P(bau : keras | kelas : aman) = 7/10 = 0,7
P(bau : keras | kelas : berbahaya) = 4/6 = 0,7
Ukuran
Kecil
Bau
Keras
Jadi, kesimpulannya : Hasil dari prediksi data baru menggunakan algoritma naive bayesian
classifier yaitu : kelas Berbahaya = 0,039.
b. Buatlah Pohon keputusan berdasarkan data tersebut. Sertakan perhitungan dan
gambar pohonnya!
Jawab :
Class P : kelas = aman (10)
Class N : kelas = berbahaya (6)
-
Info (D) = I (10,6) = - 10/16 log2 (10/16) 6/16 log2 (6/16) = 0,954
Warna
Coklat
Hijau
Merah
P1
3
2
5
N1
0
4
2
(P1,N1)
0
0,918
0,863
Info warna (D) = 3/16 I (3,0) + 6/16 I (2,4) + 7/16 I (5,2) = 0,722
Gain ( Warna) = Info (D) Info warna (D)
= 0,954 0,722
= 0,232
Kulit Buah
Kasar
Halus
P1
6
4
N1
2
4
(P1,N1)
0,811
1
Ukuran
Besar
Kecil
-
P1
5
5
N1
2
4
(P1,N1)
0,863
0,991
P1
7
3
N1
4
2
Gain (Warna)
Gain (Kulit buah)
Gain (Ukuran)
Gain (Bau)
(P1,N1)
0,946
0,971
Coklat
Hijau
(3,0)
Aman ( yes )
Merah
Kulit buah
Kasar
Kasar
Kasar
Halus
Halus
Kasar
Ukuran
Besar
Besar
Kecil
Kecil
Kecil
Kecil
Bau
Keras
Lunak
Lunak
Keras
Keras
Keras
Info (D)
= I (2,4) = - 2/6 log2 (2/6) 4/6 log2 (4/6) = 0,918
Informasi : Gain warna tidak perlu dihitung lagi, yang dihitung adalah gain
kulit buah, ukuran dan bau.
Kulit Buah
Kasar
Halus
Warna
Hijau
Hijau
Hijau
Hijau
Hijau
Hijau
P1
2
0
N1
2
2
(P1,N1)
1
0
Ukuran
Besar
Kecil
- Info ukuran (D)
- Gain (ukuran)
Bau
Keras
Lunak
- Info bau (D)
- Gain (bau)
P1
2
0
N1
0
4
(P1,N1)
0
0
P1
1
1
N1
3
1
(P1,N1)
0,811
1
= 0,251
= 0,918 Ukuran yang paling besar
= 0,044
Kesimpulannya : Dari hasil perhitungan data warna hijau ditemukan bahwa Gain ukuran
= 0,918 nilanya lebih besar.
b. Proses data warna Merah
Kelas
Berbahaya
Aman
Aman
Aman
Aman
Berbahaya
Aman
-
Kulit buah
Halus
Kasar
Halus
Kasar
Kasar
Halus
Halus
Ukuran
Besar
Kecil
Kecil
Besar
Kecil
Besar
Kecil
Bau
Lunak
Keras
Keras
Keras
Lunak
Keras
Keras
Info (D)
= I (5,2) = - 5/7 log2 (5/7) 2/7 log2 (2/7) = 0,863
Informasinya : Gain warna coklat tidak perlu dihitung lagi, yang harus
dihitung adalah kulit buah, ukuran dan bau dari warna merah.
Kulit Buah
Kasar
Halus
Warna
Merah
Merah
Merah
Merah
Merah
Merah
Merah
P1
3
2
N1
0
2
(P1,N1)
0
1
Ukuran
Besar
Kecil
- Info ukuran (D)
- Gain (ukuran)
Bau
Keras
Lunak
P1
1
4
N1
2
0
(P1,N1)
0,918
0
N1
1
1
(P1,N1)
0,722
1
= 0,292
= 0,470 Ukuran yang paling besar
= 0,062
Coklat
Hijau
Merah
Ukuran
Ukuran
(3,0)
Aman ( yes )
Besar
Kecil
(2,0)
Aman( yes )
(0,4)
Berbahaya( no )
Besar
(1,2)
Berbahaya( no )
Kecil
(4,0)
Aman( yes )
2. Gunakan software weka dan lakukanlah pengolahan data untuk beberapa dataset yang
sudah disediakan berdasarkan ketentuan : (sesuaikan dataset dengan data mahasiswa
pada presensi.xlsx)
a. Laporkan langkah / teknik yang kalian lakukan pada proses pengolahan data dalam
weka. Sertakan juga langkar pembuatan file *.arff
Jawab :
File Dataset
Kemudian lakukan save as file tersebut di atas, lalu simpan dengan tipe *.csv.
1. Ganti format
menjadi csv.
2. Klik Save.
Langkah ketiga : semua data yang telah siap, kemudian dimasukkan ke dalam
weka untuk melihat data tersebut berhasil di terima atau tidak oleh weka.
- Buka Software weka, kemudian klik pada menu kotak dialog
explorer untuk membuka dataset.
File yang dimasukkan pada langkah diatas masih file *.csv yang telah
terbaca oleh weka. Dengan mengklik menu save dataset akan
diubah ke dalam format .arff yang menjadi tujuan awal.
Bagian @relation
Bagian @attribute
Bagian @data
Menu classify
11
12
Output Model
Load model
13
Merupakan Perbandingan
dgn algoritma naive bayes,
dgn melihat tingkat
corectly & Incorectly
Dari langkat di atas hasil prediksi dari yang kita lakukan belum
ditemukan, selanjutnya kita akan melihat visualize classifer error
dari penggunakan algoritma naive bayes terhadap dataset prediksi.
14
Merupakan
class prediksi
baru dari
dataset
Menunjukkan matriks
error dari kodinat x,y
penggunaan algoritma
naive bayes
15
Merupakan Data
Prediksi Naive Bayes
16
c. Gunakan algoritma J48 untuk decision tree untuk membuat model dan memprediksi
data baru. Lampirkan informasi output ke dalam laporan dan gambar visualisasi
pohon keputusannya.
Jawab :
Membuat model menggunakan algoritma J48 decision tree.
- Langkah-langkah membuat model pada weka menggunakan file
dataset presensi monks-train menggunakan algoritma decision tree
sama dengan langkah-langkah di atas yang di pakai dalam
memodelkan data pada algoritma naive bayes. Proses memilih
algoritma, memakai use training set, kemudian mengklik tombol star
sampai save dan load model dll. Sehingga akan diperoleh sebuah
ouput dari model yang telah dibuat yaitu sbb :
Menu classify
Kemudian setelah
langkah berikut :
17
1.
2.
3.
Klik save
model untuk
membuat model
baru.
18
Merupakan perbandingan
menggunakan J48 corectly &
Incorectly.
Selanjutnya save model dan kemudian load kembali model yang baru
saja di save untuk melihat hasil model nya.
Model Information
dari Algoritma J48
19
Hasil Perbandingan
menggunakan algoritma J48
dengan corectly &
incorectly
20
Menunjukkan matriks
error dari kodinat x,y
penggunaan algoritma
Decision tree
21
22
23