You are on page 1of 5

Tugas Praktikum DWM

No. 1
Jelaskan macam2 testing option (suplied test set, cross validation,
percentage split) !

Jawab :
Training set : Classifier dievaluasi untuk mengetahui seberapa baik
classifier memprediksi class dari data-data yang sedang ditraining.

Supplied test set : Classifier dievaluasi untuk mengetahui seberapa


baik classifier ini memprediksi class dari sekumpulan data yang
di'load' dari file. Data yang di'load' file dievaluasi berdasarkan data
yang telah di'training'.

Cross-validation : Classifier dievaluasi oleh proses cross-validation


yang menggunakan banyaknya lipatan(folds) yang dimasukkan pada
'folds text-field'. Banyaknya lipatan yang dimasukkan harus lebih dari
1. Dengan menggunakan metode ini, dataset diurutkan secara acak
dan kemudian dibagi menjadi n folds dari jumlah total dataset. Dalam
setiap iterasi, satu fold(lipatan) digunakan untuk testing dan n-1 folds
lainnya digunakan untuk training. Semua hasil test kemudian
dikumpulkan dan dirata-ratakan dengan semua folds(lipatan). Hal ini
memberikan cross-validation perkiraan dari akurasinya.

Percentage split : Classifier dievaluasi untuk mengetahui seberapa


baik classifier tersebut memprediksi persentase data yang ditahan
untuk testing. Jumlah data yang ditahan untuk testing berdasarkan
kepada nilai % yang dimasukkan pada 'field'. nilai % yang dimasukkan
antara 0-100 % (0 < 'nilai persen' < 100)

No. 2
Analisis semua data dalam WEKA dengan algoritma Naïve Bayes dan
J48 !

Jawab:
a) Analisis data contact-lens, menggunakan :

• Algoritma J48, tingkat akurasi 91.6667%, yaitu 22 data


dinyatakan sesuai

• Algoritma Naïve Bayes, tingkat akurasi 95.8883%, yaitu 23


dinyatakan sesuai
Jadi, untuk data ini algoritma Naïve Bayes tingkat akurasinya lebih
tinggi daripada algoritama J48
0800325_EMILIA NOVIANTI Page 1
Tugas Praktikum DWM

b) Analisis data diabetes, menggunakan :


• Algoritma J48, tingkat akurasi 84.1146 %, yaitu 646 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 76.3021 %, yaitu 586
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih
tinggi daripada algoritma Naïve Bayes
c) Analisis data glass, menggunakan :
• Algoritma J48, tingkat akurasi 96.2617 %, yaitu 206 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 55.6075 %, yaitu2 119
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

d) Analisis data ionosphere, menggunakan :


• Algoritma J48, tingkat akurasi 99.7151 %, yaitu 350 dinyatakan
sesuai
• Algoritma Naïve Bayes tingkat akurasi 82.906 %, yaitu 291
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

e) Analisis data iris, menggunakan :


• Algoritma J48, tingkat akurasi 98 %, yaitu 147 dinyatakan sesuai
• Algoritma Naïve Bayes, tingkat akurasi 96 %, yaitu 144 dinyatakan
sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

f) Analisis data labor, menggunakan :


• Algoritma J48, tingkat akurasi 87.7193 %, yaitu 50 dinyatakan sesuai
• Algoritma Naïve Bayes, tingkat akurasi 98.2456 %, yaitu 56 dinyatakan
sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

0800325_EMILIA NOVIANTI Page 2


Tugas Praktikum DWM

g) Analisis data segment-challenge, menggunakan :


• Algoritma J48, tingkat akurasi 99 %, yaitu 1485 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 81.6667 %, yaitu 1225
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

h) Analisis data segment-test, menggunakan :


• Algoritma J48, tingkat akurasi 98.7654 %, yaitu 800 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 88.0247 %, yaitu 713
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

i) Analisis data soybean, mengunakan :


• Algoritma J48, tingkat akurasi 96.3397 %, yaitu 658 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 93.7042 %, yaitu 640
dinyatakan sesuai
Jadi, untuk data ini algoritma Naïve Bayes tingkat akurasinya lebih
tinggi daripada algoritama J48

j) Analisis data supermarket, menggunakan :


• Algoritma J48, tingkat akurasi 62.6828 %, yaitu 986 dinyatakan sesuai
• Algoritma Naïve Bayes, tingkat akurasi 62.6828 %, yaitu 986
dinyatakan sesuai
Jadi, untuk data ini algoritma Naïve Bayes dan algoritma J48
memiliki nilai akurasi yang sama

k) Analisis data vote, menggunakan :


• Algoritma J48, tingkat akurasi 97.2414 %, yaitu 423 dinyatakan
sesuai
• Algoritma Naïve Bayes, tingkat akurasi 90.3448 %, yaitu 393
dinyatakan sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes
0800325_EMILIA NOVIANTI Page 3
Tugas Praktikum DWM

l) Analisis data weather, menggunakan :


• Algoritma J48, tingkat akurasi 100%
• Algoritma Naïve Bayes, tingkat akurasi 92.8571%, yaitu 13 dinyatakan
sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

m) Analisis data weather.nominal, menggunakan :


• Algoritma J48, tingkat akurasi 100%
• Algoritma Naïve Bayes, tingkat akurasi 92.8571%, yaitu 13 dinyatakan
sesuai
Jadi, untuk data ini algoritma J48 tingkat akurasinya lebih tinggi
daripada algoritma Naïve Bayes

No. 3
Bagaimana cara untuk memilih class dari sekian banyak atribut ?

Jawab :
1. TP rate adalah true positive rate yaitu sebuah
proporsi(perbandingan) dari contoh yang diklasifikasikan sebagai
kelas x, di antara semua contoh-contoh yang benar-benar memiliki
kelas x, sebagai contoh, berapa banyak bagian dari kelas yang
diambil. Ini sama dengan Recall. di dalam confusion matrix, ini
adalah elemen diagonal dibagi dengan jumlah atas baris yang
relevan. Contoh: 7/(7+2)=0.778 untuk kelas yes dan 2/(3+2)=0.4
untuk kelas no yang ada di dalam contoh.

2. FP rate adalah false positive rate yaitu proporsi(perbandingan) dari


contoh yang diklasifikasikan sebagai kelas x, tetapi masuk ke kelas
yang berbeda, di antara semua contoh yang bukan merupakan
kelas x. Di dalam matrix, ini adalah jumlah kolom dari kelas x
minus elemen diagonal dibagi dengan jumlah baris dari semua
kelas-kelas yang lainnya. Contoh: 3/5=0.6 untuk kelas yes,
2/9=0.222 untuk kelas no.

3. The Precision adalah proporsi (perbandingan) dari contoh-contoh


yang benar-benar memiliki kelas x di antara semua yang
diklasifikasikan sebagai kelas x. Di dalam matrix, ini adalah elemen

0800325_EMILIA NOVIANTI Page 4


Tugas Praktikum DWM

diagonal dibagi dengan jumlah di atas kolom yang relevan. Contoh:


7/(7+3)=0.7 untuk kelas yes, 2/(2+2)=0.5 untuk kelas no.

4. F-Measure adalah bentuk sederhana dari 2*Precision*Recall/


(Precision+Recall), yaitu sebuah kombinasi hitungan dari precision
dan Recall.

No. 4
Jelaskan pengukuran akurasi (precision, f-measure, dll) yang ada di
confusion matrix !

Jawab:

Cara menghitung kelas adalah dengan cara menghitung nilai gain dari
setiap atribut. Jika terdapat atribut yang memiliki nilai gain paling
besar dibandingkan dengan atribut lainnya, maka atribut yang
memiliki nilai gain terbesar tersebut merupakan kelas.

0800325_EMILIA NOVIANTI Page 5

You might also like