Pada pengembangan tes umumnya melalui serentetan langkah-langkah yang dilakukan berturut turut.
Langkah-langkah Dalam Pengembangan Tes.
- Pengembangan spesifikasi tes.
- Penulisan soal.
- Penelaahan soal.
1. Penelaahan secara teoretis.
2. Penelaahan secara empiris.
- Menganalisis butir soal
- Administrasi tes.
A. Pengembangan Spesifikasi Tes.
Pengembangan tes adalah langkah paling awal dan paling menentukan dalam pengembangan seperangkat tes. Oleh karena itu bagian ini tujuan evaluasi harus ditetapkan yang tentu saj termasuk pada materi apa soal-soal yang akan disusun.
Langkah berikutnya adalah menyusun kisi-kisi, di dalam kisi-kisi terdapat komponen-komponen yaitu: (1) kompetensi yang diujikan, (2) materi, (3). uraian materi, (4) Indikator, (5) no soal, (6) bentuk soal, (7) aspek yang diukur.
B. Penulisan Soal.
Berdasar atas spesifikasi tes dilakukanlah penulisan soal. Penulian pada tes khususnya tes objektif yang baik memerlukan kemampuan dan keterampilan professional serta daya kreasi. Kemampuan menulis soal untuk sebagian orang masih merupakan kiat(art) bukan ilmu. Walaupun demikian telah terbukti bahwa pengetahuan teoretis mengenai teknik penulisan soal dan latihan ternyata memberikan kontribusi yang sangat besar terhadap dihasilkannya soal-soal yang baik.
C. Penelaahan Soal
Penelaahan soal adalah evaluasi terhadap soal-soal yang telah ditulis. Evaluasi itu dilihat dari tiga arah yaitu: a) dari segi bidang studi; b) dari segi format dan pertimbangan teknis penulisan soal; c) dari segi penterjemahan gagasan ke dalam bahasa.
Penelaahan soal dalam hal ini dilakukan secara teoretis. Penelaahan dilakukan oleh para ahli yang sesuai dengan keahliannya. Penelaahan secara teoretis ini sering disebut pula dengan validasi tes dengan menggunakan validitas isi (yang akan dibahas pada bagian berikutnya).
Pengujian butir-butir tes secara empiris adalah melakukan kegiatan ujicoba tes. Tujuan dilakukannya uji coba adalah untuk memperoleh butir-butir soal berdasarkan riteria tertentu.
D. Menganalisis Butir Soal.
Setelah soal di uji coba maka hasil uji coba perlu di analisis. Analisis Butir Soal akan dibahas pada bagian berikutnya.
E. Administrasi Tes.
Setelah dipunyai tes dengan butir-butir yang sesuai dengan riteria dari hasil analisis butir soal serta interpretasi hasil, maka butir-butir tes perlu dibakukan untuk selanjutnya akan digunakan.
Hasil pengukuran yang masih berupa skor mentah perrlu diolah lagi menjadi nilai dengan menggunakan skala tertentu( pada bagian ini dibahas kemudian.
Analisis Butir Soal
Sebelum suatu tes digunakan, idealnya tes tersebut harus memenuhi syarat-syarat sebagai tes yang baik. Setelah soal-soal selesai ditulis, maka soal-soal tersebut harus diuji kualitasnya baik secara teoretis maupun empiris. Penelahan secara teoretis dilakukan atas pertimbangan rasio, oleh karena itu dinamakan juga analisis rasional. Adapun penelaahan secara empiris dilakukan dengan uji coba.
1. Penelaahan Soal Secara Teoretis
Menurut Sumadi(1987: 79) untuk melakukan penelaahan soal secara teretis diperlukan tiga kemampuan (keahlian), yaitu: (1) keahlian dalam bidang studi yang diuji; (2) keahlian dalam bidang pengukuran; (3) keahlian dalam bidang gagasan.
Penelaahan soal adalah evaluasi terhadap soal-soal yang telah ditulis berdasarkan pendapat professional, dan evaluasi itu dilakukan dari tiga arah.
a. Dari segi bidang studi yang diuji.
Penelaahan dari segi bidang studi pertama-tama akan mengkaji kesesuaian soal dengan spesifikasi tes. Penelahan ini menuntut kematangan dan kemendalaman penguasaan materi bidang studi serta kejelian melihat kesesuaian cakupan anatara kumpulan soal dengan spesifikasi tes. Pada analisis ini dilakukan dengan melihat GBPP dan TPK yang ada. Kejelasan akan konsep dasar, proses fundamental, saling hubungan antara fakta dan kejadian seringkali sangat diperlukan di sini. Tidak ada rumus, tidak ada buku pedoman, tidak ada petunjuk pelaksanaan yang dapat memberi tuntunan secara mudah. Tetapi kematangan professional serta pengalaman akan menghasilkan pendapat yang yang bermutu tinggi. Validitas isi suatu tes akan tergantung pada hasil analisis dengan cara ini.
b. Penelaahan dari segi pengukuran.
Penelaahan dari segi pengukuran mengkaji soal-soal dari segi format dan pertimbangan-pertimbangan teknis dalam penulisan soal-soal yang lain. Kalau penelaahan soal dari segi bidang studi akan menentukan validitas isi suatu tes, maka penelaahan dari segi pengukuran ini akan menentukan kualitas soal. Disini kematangan professional serta pengalaman juga sangat penting peranannya.
c. Penelaahan dari segi pembahasan gagasan.
Kejelasan rumusan gagasan dalam bahasa adalah criteria yang digunakan untuk menelaah soal dari segi pembahasaan gagasan. Dalam penyusunan soal dalam hal ini kiat lebih berperan dari pada ilmu. Disini juga pengalaman memegang peranan yang sangat penting.
2. Penelaahan soal Secara Empiris
Setelah butir soal ditulis dan dikaji secara teoretis maka langkah selanjutnya adalah pengumpulan data empiris berdasrkan melalui ujicoba sebagai dasr untuk memperbaiki soal-soal terbaik untuk disusun menjadi tes dalam bentuk akhir. Setelah uji coba maka diikuti dengan analisis soal, revisi soal, dan seleksi soal. Kegiatan ujicoba dan kegiatan yang mengikutinya ini mungkin perlu dilakukan lebih dari sekali, kadang dapat terjadi pula satu kali uji coba telah memadai. Ada kalanya sebelum tes diujicobakan dilakukan terlebih dahulu pra uji coba.
Setelah diujicobakan maka selanjutnya dilakukan analisis yang meliputi.
- Taraf Kesukaran
- Daya Pembeda
- Koefisien Reliabilitas
- Validitas.
- Distraktor/Pengecoh (khusus untuk tes bentuk pilihan ganda).
Administrasi Tes
Administrasi tes adalah menindaklanjuti analisis butir. Apakah suatu butir dipakai atau tidak
Taraf Kesukaran (p)
Pad soal bentuk objektif pada umumnya siswa yang menjawab benar diberi skor 1 dan siswa yang menjawab salah diberi skor 0. Taraf kesukaran didefinisikan sebagai persentase subjek yang menjawab benar soal tersebut. Jika taraf kesukaran dilambangkan dengan p maka:
Keterangan: p = taraf kesukaran
B = banyaknya subjek yang menjawab butir soal dengan benar
T = banyaknya subjek yang mengerjakan soal
Klasifikasi taraf kesukaran adalah sebagai berikut.
0,00 – 0,30 soal sukar
0,31 – 0,70 soal sedang
0,71 – 1,00 soal mudah
Daya Pembeda (d)
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang berkemampuan tinggi dan siswa yang berkemampuan rendah. Interval daya pembeda terletak antara -1,00 sampai dengan 1,00.
Cara menentukan daya pembeda.
Seluruh perangkat tes diurutkan menurut besarnya skor total yang diperoleh, mulai dari skor yang tertinggi. Kelompokkan menjadi dua kelompok yaitu kelompok atas (yaitu kelompok dengan skor tinggi) dan kelompok bawah (yaitu kelompok dengan skor rendah). Pada butir tertentu jika kelompok atas dapat menjawab semuanya dengan benar dan kelompok bawah menjawab salah semuanya maka butir soal tersebut mempunyai daya pembeda paling besar (1,00). Sebaliknya jika kelompok atas semua menjawab salah dan kelompok bawah semua menjawab benar, maka soal tersebut tidak mampu menbedakan sama sekali sehingga daya pembedanya paling rendah (-1,00).
Untuk mencari d dapat ditentukan dengan rumus berikut.

Keterangan:
d = daya pembeda
pA = taraf kesukaran kelompok A
pB = taraf kesukaran kelompok B
Klasifikasi daya pembeda (d)
0,00 – 0,20 jelek
0,21 – 0,40 cukup
0,41 – 0,70 baik
0,71 – 1,00 baik sekali
Untuk daya pembeda yang nilainya negative semuanya tidak baik, semua butir yang mempunyai d negative sebaiknya dibuang saja. Tetapi ada juga ahli yang mengatakan bahwa daya pembeda yang baik minimal 0,30.
Reliabilitas
Reliabilitas tes adalah ketetapan suatu tes apabila diberikan pada subjek yang sama, untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil (Suharsimi, 1997). Untuk mengetahui besarnya koefisien reliabilitas (rXX’) suatu tes dapat dilakukan dengan berbagai teknik. Dalam teoi tes klasik yang penting adalah menemukan besarnya skor sesungguhnya pada peserta tes dalam suatu kerangka tes tertentu. Besarnya skor sesungguhnya ini merupakan suatu ukuran bagi kemampuan sesungguhnya dari seorang peserta tes. Namun di dalam pelaksanaannya yang dapat diamati adalah skor tampak, besarnya skor sesungguhnya maupun skor kesalahan keduanya tidak dapat di amati secara langsung. Oleh karena itu yang dapat dilakukan adalah melakukan estimasi reliabilitas berdasarkan skor tampak melalui beberapa metode tertentu yang akan disajikan berikut ini.
1. Metode Test retest
Alasan digunakan cara ini karena suatu tes yang reliabel tentu akan menghasilkan skor tampak yang relatif sama apabila dikenakan dua kali dalam waktu yang berbeda. Semakin besar variasi perbedaannya berarti semakin sulit untuk mempercayai bahwa tes itu memberikan hasil ukur yang konsisten.
Untuk memperoleh koefisien reliabilitas dengan tes retest dari suatu tes X dilakukan dengan cara menghitung koefisien korelasi antara skor tampak tes yang pertama dan skor tampak pada tes yang kedua. Koefisien korelasi ini menunjukkan koefisien reliabilitas dari tes X. Dalam penggunaan metode ini harus diperhatikan kemungkinan adanya perubahan kondisi subjek antara tes yang pertama dan tes yang kedua.
Contoh:
Tes X berbentuk pilihan ganda terdiri 10 butir, diberikan kepada 10 orang dua kali tes. Hasil tes sebagai berikut
NAMA | skor tampak 1(X) | skor tampak 2(Y) |
A | 8 | 9 |
B | 9 | 9 |
C | 10 | 9 |
D | 6 | 7 |
E | 5 | 5 |
F | 7 | 7 |
G | 8 | 7 |
H | 5 | 5 |
I | 7 | 8 |
J | 8 | 8 |
koefisien korelasi | 0,89 | |
Untuk menghitung koefisien korelasi antara skor tampak 1 dan skor tampak kedua digunakan rumus korelasi product moment sbb.

Keterangan:
rXY = koefisien korelasi antara X dan Y
X = skor tampak 1
Y = skor tampak 2
Koefisien korelasinya adalah 0,89, sehingga koefiien reliabilitasnya adalah 0,89.
2. Bentuk-bentuk Paralel
Pada cara ini tes yang akan dicari koefisien reliabilitasnya harus ada tes paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi butirnya baik secara kualitas maupun kuantitasnya. Dalam bahasa sederhana kita harus punya tes yang sama.
Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik. Dari segi praktis dua tes yang memenuhi syarat-syarat dan asumsi tertentu dapat dianggap paralel. Untuk membuat dua tes menjadi paralel, penyusunannya haruslah didasarkan pada suatu spesifikasi yang sama. Spesifikasi ini meliputi antara lain tujuan ukur, batasan objek ukur dan operasionalisasinya, indikator indikator perilakunya, banyaknya butir, format butir dan jika perlu meliputi taraf kesukaran butir.
Bila telah diperoleh dua tes yang paralel maka estimasi koefisien reliabilitasnya dilakukan dengan mengenakan dua tes tersebut bersamaan dengan kelompok subjek. Masin g-masing tes akan menghasilkan distribusi skor tampak dari seluruh subjek, dengan menghitung korelasi antara kedua distribusi skor tersebut akan diperoleh koefisien reliabilitas. Dua tes yang paralel menghasilkan skor berkorelasi tinggi satu sama lain disebut tes yang reliabel dan koefisien korelasinya merupakan koefisien reliabilitas tes yang bersangkutan.
Walaupun pendekatan reliabilitas bentuk paralel dapat menghilangkan masalah penentuan tenggang waktu yang tepat, sedangkan kelemahan utama dalam pendekatan ini terletak pada sulitnya menyusun dua tes yang paralel itu sendiri dan menyusun suatu tes yang memenuhi syarat kualitas yang baik saja tidaklah mudah apalagi menyusun dua tes yang setara.
3. Metode Internal Konsistensi
· Metode Belah dua dengan formula Spearman Brown.
Salah satu yang digunakan dalam metode ini adalah menghitung koefisien reliabilitas dengan rumus KR-20 rumus ini sangat tepat digunakan untuk menghitung koefisien reliabilitas t es bentuk objektif yang mempunyai skor dikotomi ( 0 dan 1)
Rumusnya adalah sebagai berikut.
rXX’ = 

Keterangan:
rXX’ = koefisien reliabilitas
N = banyaknya butir soal
p = proporsi jawaban benar siswa dengan selurur peserta tes (taraf kesukaran).
Menghitung koefisien reliabilitas tes uraian.
Rumus KR-20 di atas tidak cocok apabila digunakan untuk menghitung koefisien reliabilitas tes bentuk uraian. Untuk menghitung koefisien reliabilitas tes bentu uraian digunakan rumus Alpha (a) sebagai berikut.
rXX’ = 

Keterangan:
rXX’ = koefisien reliabilitas
N = banyaknya butir soal
si2 = varians tiap butir (rumus sudah ada sebelumnya)
Kriteria koefisien reliabilitas.
0,00 – 0,20 rendah sekali
0,21 – 0,40 rendah
0,41 – 0,70 sedang
0,71 – 1,00 sangat tinggi
Kriteria menurut Jemari Mardapi,
0,70 < r <= 1 reliabel
0,3<r<=0,7 soal diperbaiki
0<r<=0,3 soal diperbaiki/dibuang
KOEFISIEN RELIABILITAS SKOR GABUNGAN
Apabila dipunyai sebuah tes yang terdiri dari dua bagian, bagian pertama tes berbentuk pilihan ganda dan bagian kedua tes berbentuk uraian, bagaimanakah cara mencari koefisien reliabilitas soal tersebut?
Reliabilitas skor gabungan merupakan fungsi dari reliabilitas, penyebaran skor, interkorelasi, dan bobot relatif komponen-komponennya. Formula untuk menghitug koefisien reliabilitas skor gabungan dirumuskan oleh Mosier(Azwar S, 1986) sebagai berikut.

rsg koefisien reliabilitas skor gabungan
wj bobot relatif komponen j
wk bobot relatif komponen k
sj deviasi standard komponen j
sk deviasi standard komponen k
rjj’ koefisien reliabilitas komponen masing-masing
rjk koefisien korelasi antara dua komponen yang berbeda
Contoh
Sebuah tes terdiri dari dua bagian yaitu, bagian pertama berbentuk pilihan ganda, dan bagian kedua berbentuk uraian. Diberikan kepada 10 orang siswa hasilnya sebagai berikut.
Siswa | total pil gan | total uraian |
1 | 28 | 48 |
2 | 28 | 40 |
3 | 25 | 40 |
4 | 25 | 35 |
5 | 24 | 35 |
6 | 23 | 40 |
7 | 20 | 38 |
8 | 15 | 30 |
9 | 20 | 30 |
10 | 14 | 28 |
koef korelasi skor total | 0,82 | |
koef rel | 0,85 | 0,76 |
Varians | 23,96 | 36,93 |
std dev | 4,89 | 6,08 |
Bobot | 1 | 3 |
Tidak ada komentar:
Posting Komentar