Professional Documents
Culture Documents
SAIFUDIN ZUKHRI
Pendahuluan
Tujuan Test adalah menentukan peserta didik mana yang sudah atau yang belum mencapai
capaian pembelajaran (kompetensi) yang sudah ditetapkan
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai
dengan tujuannya (valid dan reliable). Soal perlu dianalisis agar diperoleh soal yang bermutu
sebelum soal digunakan.
Pengertian Analisis
Analisis Butir Soal merupakan proses pengumpulan, peringkasan, dan penggunaan informasi
dari jawaban siswa untuk membuat keputusan tentang setiap penilaian (Purnomo : 2010)
Item analysis uses statistics and expert judgment to evaluate tests based on the quality of
individual items, item sets, and entire sets of items, as well as the relationship of each item to
other items. It “investigates the performance of items considered individually either in relation
to some external criterion or in relation to the remaining items on the test” (Thompson &
Levitov, 1985, p. 163).
Tujuan
Kegiatan ini bertujuan untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengatahui secara diagnostik pada siswa apakah mereka
sudah/belum memahami materi yang telah diajarkan Aiken (Purnomo : 2010)
Menentukan apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistic
yang memadai, (2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3)
tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali
2. Analisis Kuantitatif
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada
data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah
diujikan. Karakteristik yg dianalisis : tingkat kesulitan, daya pembeda, distribusi jawaban,
validitas dan reliabilitas.
Tingkat Kesukaran
Peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya
dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam
bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66)
Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin
mudah soal itu. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal
yang bersangkutan dinamakan tingkat kesukaran butir soal itu
Daya Pembeda
Adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang telah
menguasai materi yang ditanyakan dan warga belajar/siswa yang tidak/kurang/belum
menguasai materi yang ditanyakan.
Penyebaran Jawaban
Penyebaran pilihan jawaban dijadikan dasar dalam penelaahan soal, untuk mengetahui
berfungsi tidaknya jawaban yang tersedia.
Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila pengecoh:
1) paling tidak dipilih oleh 5 % peserta tes/siswa,
2) lebih banyak dipilih oleh kelompok siswa yang belum paham materi.
VALIDITAS TEST
Validitas berhubungan dengan tingkat akurasi dari suatu alat ukur (tes) mengukur apa yang
akan diukur
Simply stated, validity is what a test measures and how well it does this (Anastasi, 1954;
Anastasi & Urbani, 1997
Jenis-Jenis Validitas
Prosedur Uji Validitas Banding
• Hitung koefisien korelasi antara skor hasil tes yang akan diuji validitasnya dengan hasil
tes yang terstandar yang dimiliki oleh orang yang sama dengan menggunakan rumus
korelasi produk momen menggunakan angka kasar (korelasi produk momen Pearson),
• Hitung koefisien valiliditas instrument yang diuji (rhitung) , yaing nilainya sama
dengan korelasi korelasi hasil langkah-1 x koefisien validitas instrument terstandar.
• Bandingkan nilai koefisien validitas hasil langkah-2 dengan nilai koefisien korelasi
Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih 0,05) dan n
= banyaknya data yang sesuai.
• Kriteria :
Instrumen valid, jika rhitung ≥ rtabel
Instrumen tidak valid, jika rhitung < rtabel
5. Tentukan kategori Guilford (1956, h.145)
0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)
0,60 < rxy 0,80 validitas tinggi (baik)
0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid
• Hitung koefisien validitas butir soal nomor 1 (r1) dengan cara menghitung koefisien
korelasi produk momen Pearson antara setiap skor soal nomor 1 dengan skor total
yang dimiliki oleh orang yang sama.
• Bandingkan nilai koefisien validitas hasil langkah-1 dengan nilai koefisien korelasi
Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih 0,05) dan n
= banyaknya data yang sesuai. (Lihat lampiran).
• Kriteria :
Instrumen valid, jika r1 ≥ rtabel
Instrumen tidak valid, jika r1 < rtabel
RELIABILITAS TES
Reliability, which is the best single measure of test accuracy, is the extent to which test results
are consistent, stable, and free of error variance.
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan
(precision) dan keajegan (consistency) skor tes.
Indeks reliabilitas berkisar antara 0 - 1.
Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin tinggi pula
keajegan/ketepatannya.
Faktor yang mempengaruhi reliabilitas
• Keajegan pengukuran ulang: kesesuaian antara hasil pengukuran pertama dan kedua
dari sesuatu alat ukur terhadap kelompok yang sama.
• Keajegan pengukuran setara: kesesuaian hasil pengukuran dari 2 atau lebih alat ukur
berdasarkan kompetensi kisi-kisi yang lama.
• Keajegan belah dua: kesesuaian antara hasil pengukuran belahan pertama dan
belahan kedua dari alat ukur yang sama Rrumus Spearman Brown atau Alpha
Chronbach
ITEMAN
Program ini dapat digunakan untuk:
• menganalisis data file (format ASCII) jawaban butir soal yang dihasilkan melalui
manual entry data atau dari mesin scanner;
• menskor dan menganalisis data soal pilihan ganda dan skala Likert untuk 30.000 siswa
dan 250 butir soal;
• menganalisis sebuah tes yang terdiri dari 10 skala (subtes) dan memberikan informasi
tentang validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi jawaban
pada setiap option), reliabilitas (KR-20/Alpha), standar error of measurement, mean,
variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor
minimum dan maksimum, skor median, dan frekuensi distribusi skor,
Iteman
Excel
Ada dua cara mengolah data dengan Excel, yaitu
• Uji Reliabilitas
• Kualitas Pengecoh
Kelebihan
Mudah
Lengkap
Bahasa indonesia
Kekurangan
Anates
Anates ….
Anates…
Hasil akhir anates