MEMAHAMI RELIABILITAS PENILAIAN

Foto: Asia Times

Salah satu syarat tes atau penilaian yaitu reliabilitas. Apa itu reliabilitas penilaian?

Secara sederhana reliabilitas merupakan tingkat konsistensi (keajegan) skor yang dihasilkan apabila suatu tes atau penilaian dilaksanakan secara berulang pada siswa atau sekelompok siswa yang sama. Hasil tes atau penilaian disebut skor.

Reliabilitas berkaitan dengan judgment teerhadap skor yang diperoleh dari kegiatan tes atau penilaian di mana siswa memberikan jawaban (respon) terhadap butir soal yang disajikan. Istilah “reliabilitas tes atau penilaian” menunjuk pada reliabilitas dari skor yang dihasilkan dari kegiatan pengetasan atau penilaian. Dalam hal ini, reliabilitas merupakan konsistensi skor yang dihasilkan sebuah tes atau penilaian yang digunakan dari satu kegiatan penilaian ke kegiatan penilaian lainnya.

Berkaitan dengan reliabilitas, setidaknya ada empat hal yang perlu dipahami guru.

Pertama, reliabilitas menggambarkan hasil yang diperoleh dari suatu tes atau penilaian dan bukan tes atau penilaian itu sendiri. Beberapa tes atau penilaian dapat menghasilkan reliabilitas yang berbeda-beda tergantung pada kelompok siswa yang mengikutinya dan kondisi selama berlangsungnya kegitan tes atau penilaan. Oleh karena itu reliabilitas lebih tepat diterapkan pada hasil tes atau skor siswa yang dihasilkan dari kegiatan penilaian.

Kedua, estimasi reliabilitas mencerminkan konsistensi. Untuk mengestimasi reliabilitas biasanya menggunakan berbagai metode atau pendekatan yang diuji secara statistik. Yang paling sering digunakan yaitu analisis korelasi linear. Berdasarkan hasil uji statistik tersebut, kita akan mengetahui derajat reliabilitas tes atau penilaian.

Reliabilitas dapat bervariasi karena perbedaan waktu penyelanggaraan tes atau penilaian, variasi siswa yang mengikuti tes, kondisi fisik siswa, motivasi, dan lain-lain. Jadi sangat mungkin konsistensi skor dari suatu tes bisa berbeda-beda tergantung konteks dan interpretasinya.

Untuk memahami perbedaan interpretasi tersebut, tentu saja guru harus menggunakan analisis konsistensi yang berbeda-beda pula. Misalnya, mengetahui reliabilitas dari waktu ke waktu, konsistensi skor yang dihasilkan dari waktu ke waktu itulah yang harus diutamakan.

Apabila seorang guru ingin mengukur kemampuan pemahaman siswa tentang konsep, prinsip atau prosedur tertentu, tentu saja guru tersebut harus memperhatikan konsistensi kinerja atau unjuk kerja berdasarkan perintah atau tugas yang berbeda-beda yang dikonstruksi untuk mengetahui pemahaman terhadap konsep, prinsip atau prosedur tersebut. Oleh karena itu, reliabilitas berdasarkan karakteristik yang bersifat umum dapat menyebabkan kesalahan pada interpretasinya.

Ketiga, reliabilitas memang unsur yang penting, namun tidak menentukan validitas sebuah tes atau penilaian. Jadi reliabilitas dan validitas memiliki keterkaitan. Reliabilitas yang rendah mengindikasikan validitas yang juga rendah, namun reliabilitas yang tinggi tidak serta merta mengindikasikan validitas yang tinggi. Pendek kata, reliabilitas menyajikan konsistensi hasil kegiatan tes atau penilaian yang dapat mengungkapkan validitasnya.

Keempat, reliabilitas dapat diuji secara statistik. Analisis secara logis pada reliabilitas barangkali hanya menghasilkan bukti yang kurang akurat.

Agar lebih akurat, guru menggunakan Statistika untuk menguji reliabilitas seperti dijelaskan di atas. Secara statistik, suatu data yang dikatakan memiliki reliabilitas harus bebas kesalahan (error). Reliabilitas terlihat dari hasil tes yang seharusnya tidak bervariasi dari waktu ke waktu. Apabila skor siswa yang dihasilkan tidak konsisten, hal itu bisa disebabkan berbagai faktor atau yang disebut kesalahan (error).

Ada 2 (dua) jenis kesalahan yang mempengaruhi derajat reliabilitas yaitu kesalahan sistematis (systematic error) dan kesalahan acak (random error).

Kesalahan sistematis yaitu kesalahan yang tidak sengaja dilakukan pada saat guru membuat tes atau penilaian. Ada berbagai hal yang dapat menimbulkan kesalahan sistematis seperti konstruksi bahasa pada butir soal yang kurang tepat, petunjuk tes yang kurang atau bahkan tidak jelas, jumlah butir soal yang terlalu sedikit, tingkat kesukaran butir soal yang kurang sesuai, dan sebagainya. Kesalahan sistematis tersebut dapat diperbaiki atau dikendalikan, asalkan kesalahan tersebut terdeteksi sejak awal.

Kesalahan acak merupakan kesalahan yang mempengaruhi hasil tes yang kadangkala tidak dapat dikontrol atau dikendilkan. Kesalahan acak tersebut dapat ditimbulkan oleh kondisi fisik dan mental siswa, kebisingan, kondisi ruangan yang tidak nyaman, dan sebagainya.

Baik kesalahan sistematis maupun kesalahan acak tersebut dapat mempengaruhi reliabilitas tes atau penilaian. Oleh karena itu ketika guru akan menyelenggarakan tes atau penilaian, guru harus benar-benar cermat mempersiapkan dan menyusun tes yang akan digunakan.