You are on page 1of 8

ANALISIS BUTIR SOAL

SAIFUDIN ZUKHRI
Pendahuluan

Tujuan Test adalah menentukan peserta didik mana yang sudah atau yang belum mencapai
capaian pembelajaran (kompetensi) yang sudah ditetapkan
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai
dengan tujuannya (valid dan reliable). Soal perlu dianalisis agar diperoleh soal yang bermutu
sebelum soal digunakan.

Pengertian Analisis
Analisis Butir Soal merupakan proses pengumpulan, peringkasan, dan penggunaan informasi
dari jawaban siswa untuk membuat keputusan tentang setiap penilaian (Purnomo : 2010)
Item analysis uses statistics and expert judgment to evaluate tests based on the quality of
individual items, item sets, and entire sets of items, as well as the relationship of each item to
other items. It “investigates the performance of items considered individually either in relation
to some external criterion or in relation to the remaining items on the test” (Thompson &
Levitov, 1985, p. 163).

Tujuan
Kegiatan ini bertujuan untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengatahui secara diagnostik pada siswa apakah mereka
sudah/belum memahami materi yang telah diajarkan Aiken (Purnomo : 2010)
Menentukan apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistic
yang memadai, (2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3)
tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali

Manfaat Analisis Soal


1. dapat membantu para pengguna tes dalam evaluasi atas tes yang digunakan,
2. sangat relevan bagi penyusunan tes formatif dan lokal seperti tes yang disiapkan dosen
untuk mahasiswa di kelas,
3. mendukung penulisan butir soal yang efektif,
4. secara materi dapat memperbaiki tes di kelas,
5. meningkatkan validitas soal dan reliabilitas (Anastasi and Urbina, 1997:172)

JENIS ANALISIS SOAL


1. Analisis Kualitatif
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah penulisan
soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal
digunakan/diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah
dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/pedoman penskorannya.
Yang perlu disiapkan dalam analisis kualitatif
Dalam melakukan penelaahan setiap butir soal, penelaah perlu mempersiapkan bahan-bahan
penunjang seperti
1. kisi-kisi tes,
2. kurikulum yang digunakan,
3. buku sumber, dan
4. kamus bahasa Indonesia

Prosedur Analisis Kualitatif


Dalam menganalisis butir soal secara kualitatif, penggunaan format penelaahan soal akan
sangat membantu dan mempermudah prosedur pelaksanaannya.
Format penelaahan soal digunakan sebagai dasar untuk menganalisis setiap butir soal.
Agar penelaah dapat dengan mudah menggunakan format penelaahan soal, maka para
penelaah perlu memperhatikan petunjuk pengisian formatnya

2. Analisis Kuantitatif
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada
data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah
diujikan. Karakteristik yg dianalisis : tingkat kesulitan, daya pembeda, distribusi jawaban,
validitas dan reliabilitas.

Proses Analisis Kuantitatif


Misalnya analisis untuk 32 siswa, maka langkahnya sebagia berikut :
1) urutkan skor siswa dari yang tertinggi sampai yang terendah.
2) Pilih 10 lembar jawaban pada kelompok atas dan 10 lembar jawaban pada kelompok
bawah.
3) Ambil kelompok tengah (12 lembar jawaban) dan tidak disertakan dalam analisis.
4) Untuk masing-masing soal, susun jumlah siswa kelompok atas dan bawah pada setiap
pilihan jawaban.
5) Hitung tingkat kesukaran pada setiap butir soal.
6) Hitung daya pembeda soal.
7) Analisis efektivitas pengecoh pada setiap soal (Linn dan Gronlund, 1995: 318-319).

Tingkat Kesukaran
Peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya
dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam
bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66)
Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin
mudah soal itu. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal
yang bersangkutan dinamakan tingkat kesukaran butir soal itu

Kegunaan Tingkat kesukaran


1) pengenalan konsep yang diperlukan untuk diajarkan ulang,
2) Tanda tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah,
3) memberi masukan kepada mahasiswa,
4) tanda-tanda kemungkinan adanya butir soal yang bias,
5) merakit tes yang memiliki ketepatan data soal.
6) Prediksi alat ukur (soal) dan kemmapuan peserta didik

Daya Pembeda
Adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang telah
menguasai materi yang ditanyakan dan warga belajar/siswa yang tidak/kurang/belum
menguasai materi yang ditanyakan.

Kegunaan Daya Pembeda


1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau
ditolak.
2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi
yang diajarkan guru
Jika suatu soal daya bedanya rendah, dapat berrati :
1) Kunci jawaban butir soal itu tidak tepat.
2) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar
3) Kompetensi yang diukur tidak jelas
4) Pengecoh tidak berfungsi
5) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak
6) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah
informasi dalam butir soalnya
Index Daya Beda
• Dinyatakan dalam proporsi
• Semakin tinggi indeks semakin bisa membedakan
• Rentang nilai idex = (- 1) – (+ 1)
• Jika nilainya negatif (-) = lebih banyak kelompok bawah yang menjawab benar

Rumus index daya beda

Penyebaran Jawaban
Penyebaran pilihan jawaban dijadikan dasar dalam penelaahan soal, untuk mengetahui
berfungsi tidaknya jawaban yang tersedia.
Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila pengecoh:
1) paling tidak dipilih oleh 5 % peserta tes/siswa,
2) lebih banyak dipilih oleh kelompok siswa yang belum paham materi.

VALIDITAS TEST
Validitas berhubungan dengan tingkat akurasi dari suatu alat ukur (tes) mengukur apa yang
akan diukur
Simply stated, validity is what a test measures and how well it does this (Anastasi, 1954;
Anastasi & Urbani, 1997
Jenis-Jenis Validitas
Prosedur Uji Validitas Banding

• Hitung koefisien korelasi antara skor hasil tes yang akan diuji validitasnya dengan hasil
tes yang terstandar yang dimiliki oleh orang yang sama dengan menggunakan rumus
korelasi produk momen menggunakan angka kasar (korelasi produk momen Pearson),

• Hitung koefisien valiliditas instrument yang diuji (rhitung) , yaing nilainya sama
dengan korelasi korelasi hasil langkah-1 x koefisien validitas instrument terstandar.

• Bandingkan nilai koefisien validitas hasil langkah-2 dengan nilai koefisien korelasi
Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih 0,05) dan n
= banyaknya data yang sesuai.

• Kriteria :
Instrumen valid, jika rhitung ≥ rtabel
Instrumen tidak valid, jika rhitung < rtabel
5. Tentukan kategori Guilford (1956, h.145)
0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)
0,60 < rxy 0,80 validitas tinggi (baik)
0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid

VALIDITAS BUTIR SOAL

• Hitung koefisien validitas butir soal nomor 1 (r1) dengan cara menghitung koefisien
korelasi produk momen Pearson antara setiap skor soal nomor 1 dengan skor total
yang dimiliki oleh orang yang sama.
• Bandingkan nilai koefisien validitas hasil langkah-1 dengan nilai koefisien korelasi
Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih 0,05) dan n
= banyaknya data yang sesuai. (Lihat lampiran).

• Kriteria :
Instrumen valid, jika r1 ≥ rtabel
Instrumen tidak valid, jika r1 < rtabel
RELIABILITAS TES
Reliability, which is the best single measure of test accuracy, is the extent to which test results
are consistent, stable, and free of error variance.
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan
(precision) dan keajegan (consistency) skor tes.
Indeks reliabilitas berkisar antara 0 - 1.
Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin tinggi pula
keajegan/ketepatannya.
Faktor yang mempengaruhi reliabilitas

• Semakin banyak jumlah butir soal, semakin ajek suatu tes.

• Semakin lama waktu tes, semakin ajek.

• Semakin sempit range kesukaran butir soal, semakin besar keajegan.

• Soal-soal yang saling berhubungan akan mengurangi keajegan.

• Semakin objektif pemberian skor, semakin besar keajegan.

• Ketidaktepatan pemberian skor.

• Menjawab soal dengan cara menebak.


Faktor ….
8. Semakin homogen materi semakin besar keajegan.
9. Pengalaman peserta ujlan.
10) Salah penafsiran terhadap butir soal.
11) Menjawab soal dengan buru-buru/cepat.
12) Kesiapan mental peserta ujian.
13) Adanya gangguan dalam pelaksanaan tes.
14) Jarak antara tes pertama dengan tes kedua.
15) Mencontek dalam mengerjakan tes.
16) Posisi individu dalam belajar.
17) Kondisi fisik peserta ujian.

Cara Uji Reliabilitas

• Keajegan pengukuran ulang: kesesuaian antara hasil pengukuran pertama dan kedua
dari sesuatu alat ukur terhadap kelompok yang sama.

• Keajegan pengukuran setara: kesesuaian hasil pengukuran dari 2 atau lebih alat ukur
berdasarkan kompetensi kisi-kisi yang lama.

• Keajegan belah dua: kesesuaian antara hasil pengukuran belahan pertama dan
belahan kedua dari alat ukur yang sama Rrumus Spearman Brown atau Alpha
Chronbach

• Kesetaraan Rasional : Kuder-Richardson (KR) 20


Contoh uji reliabilitas Spearman Brown
ALAT ANALISIS DATA
KALKULATOR
Komputer
ITEMAN
SPPS
Excel

ITEMAN
Program ini dapat digunakan untuk:

• menganalisis data file (format ASCII) jawaban butir soal yang dihasilkan melalui
manual entry data atau dari mesin scanner;
• menskor dan menganalisis data soal pilihan ganda dan skala Likert untuk 30.000 siswa
dan 250 butir soal;

• menganalisis sebuah tes yang terdiri dari 10 skala (subtes) dan memberikan informasi
tentang validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi jawaban
pada setiap option), reliabilitas (KR-20/Alpha), standar error of measurement, mean,
variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor
minimum dan maksimum, skor median, dan frekuensi distribusi skor,

Iteman

Iteman : contoh hasil

Iteman : contoh hasil

Excel
Ada dua cara mengolah data dengan Excel, yaitu

 melalui fungsi statistik yang terdapat di dalam Excel.

• melalui program bantu khusus perhitungan statistik misalnya ANATES


Uji validitas dan reliabilitas manual
Anates
Berbasis excel
Fasilitas yang tersedia :

• Uji Reliabilitas

• Pengelompokan Unggulan dan Asor

• Analisis Daya Beda

• Analisis Tingkat Kesukaran


• Korelasi skor tiap Butir soal dengan skor total

• Kualitas Pengecoh

• Rekap Analisis butir

Kelebihan
Mudah
Lengkap
Bahasa indonesia

Kekurangan

• Entri data manual

• Kesalahan entri mempengaruhi hasil

Anates
Anates ….
Anates…
Hasil akhir anates

You might also like