TEKNIK PENGANALISISAN ITEM TES
HASIL BELAJAR
A.
Pendahuluan
Salah satu tugas penting yang acapkali dan bahkanpada
umumnya dilupakan oleh staf pengajar (guru, dosen, dan lain-lain) adalah tugas
melakukan evaluasi terhadap alat pengukur yang telah digunakan untuk mengukur
keberhasilan belajar dari para peserta didiknya (murid, siswa, mahasiswa, dan
lain-lain). Alat pengukur dimaksud adalah tes hasil belajar, yang sebagaimana
telah kita maklumi, batang tubuhnya terdiri dari kumpulan butir-butir soal (=
item).
Kenyataan seringkali menunjukkan bahwa apabila tes hasil
belajar dimana hampir seluruh peserta tes “jatuh”, dalam arti: nilai-nilai
hasil belajar itu membentuk kurva a-simetrik miring ke kiri, maka tester (guru,
dosen, dan lain-lain) segera “menimpakan kesalahan” itu kepada testee (murid,
siswa, mahasiswa, dan lain-lain) dengan menyatakan bahwa testee memang terdiri
dari “anak-anak yang bodoh”.
Keterangan: Kurva a-simetrik miring ke kiri, dimana sebagian
besar testee “jatuh” (nilai-nilai tes yang berhasil mereka capai sangat rendah
Pernyataan yang dikemukakan oleh tester seperti yang
telah dikemukakan mungkin benar tetapi mungkin juga belum tentu tepat. Sebaliknya
tidak jarang terjadi dalam tes hasil belajar dimana testee hampir seluruhnya
berhasil meraih nilai-nilai hasil tes yang sangat tinggi, sehingga distribusi frekuensi
dari nilai-nilai hasil tes tersebut membentuk kurva a-simetrik miring ke kanan, maka tester
segera merasa puas dan bangga karena ternyata tingkat penguasaannya terhadap
materi tes tersebut sangat tinggi dan dengan segera tester menyatakan bahwa
testee adalah terdiri dari “anak-anak yang hebat”.
Pernyataan tester seperti terlihat pada kurva a-simetrik
miring ke kanan mungkin benar, tetapi mungkin juga belum tentu tepat. Suatu hal
yang patut diperhatikan oleh tester dalam keadaan dimana nilai-nilai hasil tes
hasil belajar yang dicapai oleh testee membentuk kurva a-simetrik seperti kurva
a-simetrik miring ke kiri ialah, bahwa dalam menghadapi kenyataan seperti itu
tester hendaknya tanggap bahwa distribusi frekuensi nilai-nilai hasil tes yang membentuk
kurva a-simetrik itu terjadi karena “ada sesuatu yang kurang beres”, sehingga
perlu dilakukan antisipasi.
Keterangan: Kurva a-simetrik miring ke kanan, dimana
hampir seluruh testee berhasil meraih
nilai-nilai tes yang sangat tinggi.
Salah satu cara mengantisipasi keadaan yang tidak normal
itu adalah dengan jalan melakukan penganalisisan terhadap hasil tes belajar yang
telah dijadikan alat pengukur dalam rangka mengukur keberhasilan belajar dari
para peserta tes tersebut. Disini tester perlu melakukan penelusuran dan
pelacakan dengan cermat, terhadap butir-butir soal atau item yang merupakan
bagian tak terpisahkan dair tes hasil belajar sebagai suatu totalitas.
Penelusuran atau pelacakan itu dilaksanakan oleh tester
dengan tujuan untuk mengetahui, apakah butir-butir item yang membangun tes
hasil belajar itu sudah dapat menjalankan fungsinya sebagai alat pengukur hasil
belajar yang memadai atau belum.
Identifikasi terhadap setiap butir item tes hasil belajar
itu dilakukan dengan harapan akan menghasilkan berbagai informasi berharga,
yang pada dasarnya akan merupakan umpan balik guna melakukan perbaikan, pembenahan
dan penyempurnaan kembali terhadap butir butir item yang telah dikeluarkan
dalam tes hasil belajar, sehingga pada masa-masa yang akan datang tes hasil belajar
yang disusun atau dirancang oleh tester itu betul-betul dapat fungsinya sebagai
alat pengukur hasil belajar yang memiliki kualitas yang tinggi. Rangkaian
kegiatan tersebut sering dikenal dengan istilah analisis item.
B.
Teknik
Penganalisisan Tes Hasil Belajar
1.
Teknik
Analisis Derajat Kesukaran Item
Bermutu
atau tidaknya butir-butir item tes hasil belajar dapat diketahui dari derajat
kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item
tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai
butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu
sukar dan tidak pula terlalu mudah. Dengan kata lain, derajat kesukaran item
itu adalah sedang atau cukup.
Angka
yang dapat memberikan petunjuk mengenai tingkat kesulitan item itu dikenal
dengan istilah difficulty index (=
angka indeks kesukaran item), yang dalam dilambangkan dengan huruf P, yaitu
singkatan dari kata proportion
(proporsi = proporsa).
Menurut
Witherington, angka indeks kesukaran item itu besarnya berkisar antara 0,00
sampai dengan 1,00. Angka indeks kesukaran sebesar 0,00 (P = 0,00) merupakan
petunjuk bagi tester bahwa butir item tersebut termasuk dalam kategori item
yang terlalu sukar, sebab disini seluruh testee tidak dapat menjawab item
dengan benar.
Apabila
angka indeks kesukaran item itu adalah 1,00 (P = 1,00) hal ini mengandung makna
bahwa butir item yang bersangkutan adalah termasuk dalam kategori item yang
terlalu mudah, sebab disini seluruh testee dapat menjawab dengan benar butir
item yang bersangkutan (yang dapat menjawab dengan butir = 100% = 100 : 100 =
1,00).
Angka
indeks kesukaran item itu dapat diperoleh dengan menggunakan rumus yang
dikemukakan oleh Du Bois yaitu:
dimana:
P = Proportion = proporsi = proporsa = difficulty index = angka indeks
kesukaran item.
Np = Banyaknya
testee yang dapat menjawab dengan
bentuk terhadap butir item yang bersangkutan.
N = Jumlah
testee yang mengikuti tes hasil belajar
dimana :
P = Proportion = proporsi = proporsa = difficulty index = angka indeks
kesukaran item.
B = Banyaknya
testee yang dapat menjawab
dengan betuk terhadap butir item yang bersangkutan.
JS = Jumlah
testee yang mengikuti tes hasil belajar
Cara
memberikan penafsiran (interpretasi) terhadap angka indeks kesukaran item:
a. Menurut
Robert L. Thorndike dan Elizabeth Hagen
Besarnya P
|
Interpretasi
|
Kurang
dari 0,30
|
Terlalu
sukar
|
0,30
– 0,70
|
Cukup
(Sedang)
|
Lebih
dari 0,70
|
Terlalu
Mudah
|
b. Menurut
Witherington
Besarnya P
|
Interpretasi
|
Kurang
dari 0,25
|
Terlalu
sukar
|
0,25
– 0,75
|
Cukup
(Sedang)
|
Lebih
dari 0,75
|
Terlalu
Mudah
|
Cara
kedua dalam mencari atau menghitung angka indekss kesukaran item adalah dengan
menggunakan skala kesukaran liner. Skala kesukaran liner ini disusun dengan
cara mentransformasikan nilai P menjadi nilai z, dimana perubahan P ke z itu
dilakukan dengan berkonsultasi pada tabel z yang pada umumnya dilampirkan pada
buku-buku statistik.
Adapun langkah-langkah
yang perlu ditempuh yaitu sebagai berikut:
a. Mengoreksi nilai P Kotor (Pk) menjadi nilai P bersih (Pb) dengan menggunakan rumus:
a. Mengoreksi nilai P Kotor (Pk) menjadi nilai P bersih (Pb) dengan menggunakan rumus:
dimana :
Pb = P
bersih
Pk = P
kotor
a = Alternatif
atau option yang disediakan atau
dipasangkan pada butir item yang bersangkutan
1 = Bilangan
konstan
b. Mentransformasikan nilai P bersih (Pb) menjadi nilai
z, dengan berkonsultasi pada tabel kurva normal.
Kita
ambil sebagai contoh P bersih yang dimiliki oleh butir item nomor. Butir item
nomor 9 ini memiliki P bersih sebesar 0,75. Untuk mentransformasikan P bersih
sebesar 0,75 itu menjadi nilai z, kita cari angka sebesar 0,75 itu dalam tabel
kurva normal. Dari tabel kurva normal diperoleh kenyataan sebagai berikut:
B
The Larger Area
|
z
|
C
The Smaller Area
|
0,750
|
0,6745
|
0,250
|
Berdasarkan
hasil konsultasi pada tabel kurva normal, maka dengan P bersih sebesar 0,75
diperoleh harga z sebesar 0,6745. Dengan berpegang pada patokan yang diberikan
oleh Robert L. Thorndike dan Elizabeth Hagen, maka dengan angka indeks
kesukaran item (dalam hal ini z) sebesar 0,6745 kita dapat menyatakan bahwa
butir item nomor 9 itu termasuk dalam kategori item yang telah memiliki derajat
kesukaran yang cukup (sedang), berarti butir item nomor 9 itu dinyatakan
sebagai butir item yang baik ditilik dari segi tingkat kesulitannya (z terletak
antara 0,30 – 0,70).
Sebagai
catatan tambahan perlu dikemukakan bahwa ada rumus lain untuk mencari
(menghitung) P bersih dengan hasil yang sama, yaitu:
dimana:
Pb = Angka
indeks kesukaran item (setelah dikoreksi).
B = Jumlah testee yang jawabannya benar.
S = Jumlah testee yang jawabannya salah.
a = Alternatif jawbaan yang dipasang pada
item yang bersangkutan.
2.
Teknik
Analisis Daya Pembeda Item
Daya
pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan (= mendiskriminasi) antara testee yang berkemampuan tinggi (=
pandai), dengan testee yang kemampuannya rendah (= bodoh) sedemikian rupa
sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab
butir item tersebut lebih banyak yang menjawab betul, sementara testee yang
kemampuannya rendah untuk menjawa butir item tersebut sebagian besar tidak
dapat menjawab item dengan benar.
Daya
pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya
angka indeks diskriminasi item. Angka indeks diskriminasi item adalah sebuah
angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discriminatory power) yang dimiliki
oleh sebutir item.
Indeks
diskriminasi item itu umumnya diberi lambang huruf D (singkatan dari discriminatory power), dan besarnya
berkisar antara 0 (nol) sampai dengan 1,00.
Besarnya Angka Indeks
Diskriminasi Item (D)
|
Klasifikasi
|
Interpretasi
|
Kurang dari 0,20
|
Poor
|
Butir
item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak
memiliki daya pembeda yang baik.
|
0,20 – 0,40
|
Satisfactory
|
Butir
item yang bersangkutan
telah memiliki daya pembeda yang cukup (sedang).
|
0,40 – 0,70
|
Good
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik.
|
0,70 – 1,00
|
Excellent
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik sekali.
|
Bertanda negatif
|
-
|
Butir
item yang bersangkutan daya pembedanya negatif (jelek sekali).
|
Untuk
mengetahui besar kecilnya angka indeks diskriminasi item dapat digunakan dua
macam rumus, yaitu:
a.
Rumus pertama:
D = PA – pB atau
D = PH – pL
dimana:
D
= Discriminatory
power (angka indeks diskriminasi item).
PA
atau pH = Proporsi testee kelompok atas yang dapat menjawab dengan
benar butir item yang bersangkutan.
(PH adalah singkatan
dari Proportion of the Higher Group).
pA atau pH ini dapat
diperoleh dengan rumus:
dimana:
BA = Banyaknya
testee kelompok atas (the higher group) yang dapat menjawab dengan benar butir item yang bersangkutan.
JA
= Jumlah
testee yang termasuk dalam kelompok atas.
PB
atau pL = Proporsi testee kelompok bawah yang dapat
menjawab dengan benar butir item yang bersangkutan (Pl adalah singkatan dari Proportion
of the Lower Group).
PB atau pL ini dapat
diperoleh dengan rumus:
dimana:
BB
= Banyaknya
testee kelompok bawah (the lower group) yang dapat menjawab dengan benar
butir item yang bersangkutan.
JB
= Jumlah
peserta yang termasuk dalam kelompok bawah
b.
Rumus kedua:
Dengan
rumus kedua ini, maka angka indeks diskriminasi item diperoleh dengan menggunakan
teknik korelasi Phi (ø)
dengan rumus sebagai berikut:
dimana:
ø = Angka
Indeks Korelasi Phi, yang dalam hal
ini dianggap sebagai angka indeks diskriminasi
item.
pH = Proportion
of the higher group
pL = Proportion
of the lower group
2 = Bilangan
konstan
p = Proporsi
seluruh testee yang jawabannya benar
q = Proporsi
seluruh testee yang jawabannya salah,
dimana q = (1 – p).
3.
Teknik
Analisis Fungsi Distraktor
Pada
tes obyektif bentuk multiple choice, setiap butir item yang dikeluarkan
dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawaban (=
option atau alternatif). Option atau alternatif itu jumlahnya
berkisar antara tiga sampai dengan lima buah. Salah satu dari option
atau alternatif itu merupakan jawaban yang benar (= kunci jawaban) dan sisanya
merupakan jawaban salah. Jawaban yang salah itu biasa dikenal dengan istilah distractor
atau pengecoh.
Contoh:
Tujuan
utama dari pemasangan distraktor adalah agar dari sekian banyak testee yang
mengikuti tes hasil belajar, ada yang tertarik untuk memilihnya. testee
menyangka bahwa distraktor yang mereka pilih merupakan jawaban benar. Bila
semakin banyak testee yang terkecoh, maka kita dapat menyatakan bahwa
disktraktor itu makin dapat menjalankan fungsinya dengan sebaik-baiknya. Begitu
pula sebaliknya.
Jadi,
dapat disimpulkan bahwa distraktor baru dapat dikatakan telah dapat menjalankan
fungsinya dengan baik, apabila distraktor tersebut telah memiliki daya tarik
sedemikian rupa, sehingga testee merasa bimbang serta ragu-ragu lalu pada
akhirnya mereka terkecoh dan memilih distraktor sebagai jawaban yang
benar.
Menganalisis
fungsi distraktor sering dikenal dengan istilah lain, yaitu: menganalisis pola
penyebaran jawaban item. Pola penyebaran jawaban item adalah suatu pola yang
dapat menggambarkan bagaimana testee menentukan pilihan jawabannya terhadap
kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir item.
Contoh cara
menganalisis fungsi distraktor:
Misalkan tes hasil belajar bidang studi Pendidikan Moral
Pancasila diikuti oleh 50 orang siswa Madrasah Tsanawiyah. Bentuk soalnya
adalah multiple choice dengan item sebanyak 40 butir, dimana setiap butir item
dilengkapi dengan lima alternatif, yaitu A, B, C, D dan E. Dari 40 butir item
tersebut di atas, khusus untuk butir item nomor 1, 2 dan 3 diperoleh pola
penyebaran item sebagai berikut:
Nomor Butir Item
|
Alternatif (= Option)
|
Ket.
|
||||
A
|
B
|
C
|
D
|
E
|
||
1
|
4
|
6
|
5
|
(30)
|
5
|
( ):
Kunci Jawaban
|
2
|
1
|
(44)
|
2
|
1
|
2
|
|
3
|
1
|
1
|
(10)
|
1
|
37
|
Dengan
pola penyebaran jawaban item sebagaimana tergambar pada tabel analisis diatas,
maka dengan mudah dapat kita ketahui, berapa persen testee yang telah
“terkecoh” untuk memilih distraktor yang dipasangkan pada item 1, 2 dan 3,
yaitu:
a. Untuk
item nomor 1, kunci jawabannya adalah D, sedangkan pengecoh atau distraktornya
adalah: A, B, C dan E.
·
Pengecoh A dipilih oleh 4 orang, berarti
4/50 × 100% = 8%. Jadi pengecoh A sudah dapat menjalankan fungsinya dengan
baik, sebab angka persentasenya sudah melebihi 5%.
·
Pengecoh B dipilih oleh 6 orang testee,
berarti 6/50 × 100% = 12% (telah berfungsi dengan baik).
·
Pengecoh C dipilih oleh 5 orang testee,
berarti 5/50 × 100% = 10% (telah berfungsi dengan baik).
·
Pengecoh E dipilih oleh 5 orang testee,
berarti 5/50 × 100% = 10% (telah berfungsi dengan baik).
·
Jadi, keempat pengecoh yang dipasangkan
pada item nomor 1 itu sudah dapat menjalankan fungsinya dengan sebaik-baiknya.
b. Untuk
item nomor 2, kunci jawabannya adalah B, sedangkan pengecoh atau distraktornya
adalah: A, C, D dan E.
·
Pengecoh A dipilih 1 orang testee,
berarti 1/50 × 100% = 2% (belum berfungsi).
·
Pengecoh C dipilih 2 orang testee,
berarti 2/50 × 100% = 4% (belum berfungsi).
·
Pengecoh D dipilih 1 orang testee,
berarti 1/50 × 100% = 2% (belum berfungsi).
·
Pengecoh E dipilih 2 orang testee,
berarti 2/50 × 100% = 4% (belum berfungsi).
·
Jadi, keempat pengecoh yang dipasangkan
pada item nomor 2 itu belum dapat menjalankan fungsinya seperti yang
diharapkan.
c. Untuk
item nomor 3, kunci jawabannya adalah C, sedangkan pengecoh atau distraktornya
adalah: A, B, D dan E.
·
Pengecoh A, B dan D masing-masing
dipilih oleh 1 orang testee (=2%). Berarti tiga buah pengecoh itu belum
berfungsi.
·
Adapun pengecoh E dipilih oleh 37 orang,
berarti 37/50 × 100% = 74% (telah berfungsi dengan baik).
·
Jadi, pada butir nomor 3 itu hanya 1
buah pengecoh saja yang sudah dapat menjalankan fungsinya dengan baik.
0 komentar:
Posting Komentar