Dalam melaksanakan suatu kegiatan tentunya
harus sesuai dengan apa yang direncanakan. Hal ini dimaksudkan agar hasil yang
diperoleh dapat lebih maksimal. Namun demikian, banyak juga orang melaksanakan
suatu kegiatan tanpa perencanaan yang jelas, sehingga hasilnyapun kurang
maksimal. Oleh sebab itu, Anda harus dapat membuat perencanaan dengan baik,
tidak terkecuali dalam kegiatan evaluasi. Sesuai dengan topik yang dibahas
dalam modul ini, maka uraian materi berikut akan difokuskan kepada perencanaan
dan pelaksanaan evaluasi pembelajaran.
Secara
lebih khusus, setelah mempelajari kegiatan belajar 1 Anda diharapkan dapat :
1.
Menjelaskan tujuan dan kegunaan perencanaan evaluasi.
2.
Menyebutkan dua komponen pokok dalam kisi-kisi.
3.
Menjelaskan syarat-syarat kisi-kisi yang baik.
4.
Membedakan antara kata kerja umum dengan kata kerja operasional
5.
Menjelaskan manfaat indikator dalam penyusunan kisi-kisi.
6.
Menjelaskan hubungan indikator dengan soal.
7.
Menjelaskan hal-hal yang harus diperhatikan dalam uji-coba soal.
8.
Menyebutkan jenis-jenis data yang perlu dikumpulkan dalam kegiatan evaluasi.
9.
Menjelaskan jenis kesalahan dalam pelaksanaan evaluasi.
A.
Perencanaan evaluasi
Langkah pertama yang perlu dilakukan dalam kegiatan evaluasi
adalah membuat perencanaan. Perencanaan ini penting karena akan mempengaruhi
langkah-langkah selanjutnya, bahkan mempengaruhi keefektifan prosedur evaluasi
secara menyeluruh. W. James Popham (1974 : 159) mengemukakan maksud perencanaan
evaluasi adalah ”to facilitate gathering data, thereby making possible valid
statements about the effect or out comes of the program, practice, or policy
under study”.
Sehubungan
hal tersebut, Robert H.Davis, dkk. mengemukakan tiga kegunaan dari perencanaan
evaluasi, yaitu :
1. Evaluation plan helps you to determine whether or not you have
stated your objective in behavioral terms. If the conditions, behavior or
standards or objective have been stated ambiguosly, you will have difficulty
designing a test to measure student achievement.
2. Evaluation plan early in the design process is that you will be
prepared to collect the information you need when it is available.
3. Evaluation plan is that it provides sufficient time for test
design. To design a good test requires careful preparation, and the quality of
a test usually improves if it can be designed in a leisurely fashion.
Implikasinya
adalah perencanaan evaluasi harus dirumuskan secara jelas dan spesifik, terurai
dan komprehensif, sehingga perencanaan tersebut bermakna dalam menentukan
langkah-langkah selanjutnya. Berdasarkan perencanaan evaluasi yang matang
inilah, Anda dapat menetapkan tujuan-tujuan tingkah laku (behavioral
objective) atau indikator yang akan dicapai, dapat mempersiapkan
pengumpulan data dan informasi yang dibutuhkan serta dapat menggunakan waktu
yang tepat.
Jika di
dalam evaluasi itu jelas-jelas akan menggunakan tes, maka ada baiknya kita
simak pendapat Norman E.Gronlund (1985) tentang langkah-langkah yang harus
ditempuh dalam perencanaan suatu tes sebagai berikut :
1. Menentukan tujuan tes (detrermine the purpose of the test).
2. Mengidentifikasi hasil belajar yang akan diukur melalui tes (identify
the learning outcomes to be measured by the test).
3. Merumuskan hasil belajar dalam bentuk perilaku yang spesifik
dan dapat diamati (define the learning outcomes in the terms of specific,
observable behavior).
4. Menyusun garis besar materi pelajaran yang akan diukur melalui
tes (outline the subject matter to be measurred by the test).
5. Menyiapkan suatu tabel yang spesifik atau kisi-kisi (prepare
a table of specifications).
6. Menggunakan tabel spesifik sebagai dasar untuk persiapan tes (use
the table of specifications as basis for preparing test.
Berdasarkan uraian di atas, maka dalam
perencanaan evaluasi, ada beberapa hal yang harus Anda perhatikan, seperti :
tujuan, kisi-kisi, menulis soal, uji-coba dan analisis soal, revisi dan merakit
soal.
1. Menentukan Tujuan Evaluasi
Dalam
melaksanakan evaluasi, Anda tentu mempunyai maksud atau tujuan tertentu. Tujuan
evaluasi jangan terlalu umum, karena tidak dapat menuntun Anda dalam menyusun
soal. Misalnya, tujuan evaluasi adalah untuk mengetahui tingkat pencapaian
suatu program pembelajaran atau untuk mengetahui tingkat penguasaan peserta
didik terhadap materi pelajaran yang disampaikan. Tujuan evaluasi dapat juga
dirumuskan untuk mengetahui kesulitan belajar peserta didik dalam proses
pembelajaran. Dengan kata lain, tujuan evaluasi harus dirumuskan sesuai dengan
jenis evaluasi yang akan dilakukan, seperti formatif, sumatif, diagnostik,
penempatan atau seleksi. Dalam penilaian hasil belajar, tujuan harus
memperhatikan domain hasil belajar. Menurut Bloom, dkk. (1956) hasil belajar
dapat dikelompokkan dalam tiga domain, yaitu :
a. Domain kognitif (cognitif domain)
1) Pengetahuan ( knowledge)
2) Pemahaman (comprehension)
3) Aplikasi (aplication)
4) Analisis (analysis)
5) Sintesis (synthesis)
6) Evaluasi (evaluation)
b. Domain afektif (affective domain)
1) Penerimaan (recieving)
2) Respons (responding)
3) Penilaian (valuing)
4) Organisasi (organization)
5) Karakterisasi (characterization by a value or value-complex)
c. Domain psikomotor (psychomotor domain)
1) Persepsi (perception)
2) Kesiapan melakukan sesuatu pekerjaan (set)
3) Respons terbimbing (guided response)
4) Kemahiran (complex overt response)
5) Adaptasi (adaptation)
6) Orijinasi (origination)
2. Menyusun Kisi-kisi
Penyusunan
kisi-kisi dimaksudkan agar materi evaluasi betul-betul representatif dan
relevan dengan materi pelajaran yang sudah diberikan olehguru kepada peserta
didik. Jika materi evaluasi tidak relevan dengan materi pelajaran yang telah
diberikan, maka akan berakibat hasil evaluasi itu kurang baik. Begitu juga jika
materi evaluasi terlalu banyak dibandingkan dengan materi pelajaran, maka akan
berakibat sama. Untuk melihat apakah materi evaluasi relevan dengan materi
pelajaran atau apakah materi evaluasi terlalu banyak atau kurang, Anda harus
menyusun kisi-kisi (lay-out atau blue-print atau table of
specifications).
Kisi-kisi adalah format pemetaan soal yang menggambarkan
distribusi item untuk berbagai topik atau pokok bahasan berdasarkan jenjang
kemampuan tertentu. Fungsi kisi-kisi adalah sebagai pedoman untuk menulis soal
atau merakit soal menjadi perangkat tes. Jika Anda memiliki kisi-kisi yang
baik, maka Anda akan memperoleh perangkat soal yang relatif sama sekalipun
penulis soalnya berbeda. Dalam konteks penilaian hasil belajar, kisi-kisi
disusun berdasarkan silabus setiap mata pelajaran. Jadi, Anda harus melakukan
analisis silabus terlebih dahulu. Perhatikan langkah-langkah berikut ini :
Langkah ke-1: Analisis
Silabus
Langkah ke-2 : Menyusun Kisi-kisi
Langkah ke-3 : Membuat Soal
Langkah ke-4 : Menyusun Lembar Jawaban
Langkah ke-5 : Membuat Kunci Jawaban
Langkah ke-6 : Menyusun Pedoman Penyekoran
Dalam
praktiknya, seringkali guru di madrasah / sekolah membuat soal langsung dari
buku sumber. Hal ini jelas sangat keliru, karena buku sumber belum tentu sesuai
dengan silabus. Kisi-kisi ini menjadi penting dalam perencanaanevaluasi, karena
didalamnya terdapat sejumlah indikator sebagai acuan dalam menulis soal.
Kisi-kisi soal yang baik harus memenuhi persyaratan tertentu, antara lain :
a. Representatif, yaitu harus betul-betul mewakili isi kurikulum
yang akan dievaluasi.
b. Komponen-komponennya harus terurai/rinci, jelas, dan mudah
dipahami.
c. Soalnya dapat dibuat sesuai dengan indikator dan bentuk soal
yang ditetapkan.
Sebenarnya, format kisi-kisi tidak ada yang baku, karena itu
banyak model format yang dikembangkan para pakar evaluasi. Namun demikian,
sekedar untuk memperoleh gambaran, format kisi-kisi dapat dibagi menjadi dua
komponen pokok, yaitu komponen identitas dan komponen matriks. Komponen
identitas ditulis di bagian atas matriks, sedangkan komponen matriks dibuat
dalam bentuk kolom yang sesuai. Komponen identitas meliputi jenis/jenjang
madrasah, jurusan/program studi (bila ada), bidang studi/mata pelajaran, tahun
ajaran dan semester, kurikulum acuan, alokasi waktu, jumlah soal keseluruhan,
dan bentuk soal. Sedangkan komponen matriks terdiri atas kompetensi dasar,
materi, jumlah soal, jenjang kemampuan, indikator, dan nomor urut soal. Contoh
:
KISI-KISI SOAL UJIAN AKHIR SEMESTER
Nama Madrasah :
...............................................................
Mata Pelajaran :
...............................................................
Jurusan/Program Studi :
...............................................................
Kurikulum Acuan :
...............................................................
Alokasi Waktu :
...............................................................
Jumlah Soal :
...............................................................
Standar
Kompetensi :
...............................................................
No
|
Kompetensi Dasar
|
Materi
|
Indikator
|
Jenjang Kemampuan
|
Bentuk Soal
|
Nomor Soal
|
|
|
|
|
|
|
|
Catatan : apabila bentuk soal yang akan
digunakan lebih dari satu, sebaiknya dimasukkan ke dalam komponen matriks.
Salah satu unsur penting dalam komponen matriks adalah indikator.
Indikator adalah rumusan pernyataan sebagai bentuk ukuran spesifik yang
menunjukkan ketercapaian kompetensi dasar dengan menggunakan kata kerja
operasional (KKO). Perhatikan contoh-contoh berikut ini :
a. Menyebutkan empat komponen dalam sistem komputer.
b. Menjelaskan fungsi monitor dalam pesawat komputer.
c. Membedakan antara hard-ware dengan soft-ware.
Perhatikan
juga indikator dalam matriks berikut ini :
Mata
Pelajaran : Pendidikan Jasmani, Olah Raga dan Kesehatan
Kelas/Semester
: IV/I
Standar Kompetensi
|
Kompetensi Dasar
|
Indikator
|
Mempraktikkan gerak dasar ke dalam permainan sederhana dan olah
raga serta nilai-nilai yang terkandung didalamnya
|
Mempraktikkan gerak dasar dalam permainan bola kecil sederhana
dengan peraturan yang dimodifikasi serta nilai kerjasama tim, sportifitas,
dan kejujuran
|
1. Melakukan berbagai teknik dasar permainan kasti.
2. Menerapkan kerjasama tim dalam permainan kasti
3. Menyebutkan manfaat permainan kasti
terhadap kesehatan tubuh.
|
Dalam praktiknya, penggunaan kata kerja operasional untuk setiap
indikator harus disesuaikan dengan domain dan jenjang kemampuan yang diukur.
Berikut contoh rumusan kata kerja operasional.
a. Domain
kognitif :
1) Pengetahuan/ingatan : mendefinisikan, memberikan,
mengidentifikasi, memberi nama, menyusun daftar, mencocokkan, menyebutkan,
membuat garis besar, menyatakan kembali, memilih, menyatakan, dan sebagainya.
2) Pemahaman : mengubah, mempertahankan, membedakan,
memprakirakan, menjelaskan, menyatakan secara luas, menyimpulkan, memberi
contoh, melukiskan kata-kata sendiri, meramalkan, menuliskan kembali,
meningkatkan, dan sebagainya.
3) Penerapan : menghitung, mendemonstrasikan, mengungkapkan,
mengerjakan dengan teliti, menjalankan, menghubungkan, menunjukkan, memecahkan,
menggunakan, dan sebagainya.
4) Analisa : mengurai, membuat diagram, memisah-misahkan,
menggambarkan kesimpulan, membuat garis besar, menghubungkan, merinci, dan
sebagainya.
5) Sintesa : menggolongkan, menggabungkan, menghimpun, menciptakan,
merencanakan, menjelaskan, membangkitkan, mengorganisir, merevisi,
menyimpulkan, menceritakan, dan sebagainya.
6) Evaluasi : menilai, membandingkan, mempertentangkan,
mengeritik, membeda-bedakan, mempertimbang-kan kebenaran, menyokong, dan
sebagainya.
b. Domain
afektif :
1) Kemauan menerima : bertanya, memilih, menggambarkan, mengikuti,
memberi, berpegang teguh, menjawab, menggunakan, dan sebagainya.
2) Kemauan menanggapi : menjawab, membantu, memperbincangkan,
memberi nama, menunjukkan, mempraktikkan, mengemukakan, membaca, melaporkan,
menuliskan, memberitahu, dan sebagainya.
3) Berkeyakinan : melengkapi, menggambarkan, membeda-bedakan,
mengusulkan, bekerjasama, mencoba, dan sebagainya.
4) Ketekunan, ketelitian : merevisi, melaksanakan, memeriksa
kebenaran, melayani, dan sebagainya.
c. Domain psikomotor :
Menirukan,
menggunakan, artikulasi (mengucapkan dengan nyata, menyatukan dengan
menyambung), mewujudkan, membina, menukar, membersihkan, menyusun,
menghubungkan, melatih, mengikuti, membuat bagan, melokalisir, mengikat,
mencampur, mengasah/menajamkan, mengaduk, mengerjakan dengan teliti, memulai,
memanaskan, mengidentifikasi, dan sebagainya.
Rumusan
indikator sebenarnya hampir sama dengan tujuan pembelajaran khusus atau tujuan
tingkah laku (behavioral objective). Bedanya, kalau tujuan pembelajaran
3khusus harus dirumuskan dengan lengkap. Contoh :
a. Siswa
dapat menyebutkan empat komponen dalam sistem komputer.
b. Siswa
dapat menjelaskan fungsi monitor dalam pesawat komputer.
c. Siswa
dapat membedakan antara hard-ware dengan soft-ware.
Lebih jauh, S.J. Montage dan J.J Koran (1969)
mendefinisikan tujuan tingkah laku sebagai “a goal for or desired outcome of
learning wich is expresed in terms of observable behavior or performance of the
leaner”. Tujuan tingkah laku adalah tujuan atau hasil belajar yang
diharapkan dan dinyatakan dalam bentuk tingkah laku atau kinerja peserta didik
yang dapat diamati. Dalam kegiatan evaluasi, fungsi utama tujuan tingkah laku
adalah sebagai alat yang sistematis untuk merancang cara-cara melakukan
evaluasi terhadap tingkah laku peserta didik.
Manfaat adanya indikator adalah (a) guru dapat memilih materi,
metode, media, dan sumber belajar yang tepat, sesuai dengan kompetensi yang
telah ditetapkan, dan (b) sebagai pedoman dan pegangan bagi guru untuk menyusun
soal atau instrument penilaian lain yang tepat, sesuai dengan standar
kompetensi dan kompetensi dasar yang telah ditetapkan.
Untuk mengukur pencapaian target dalam
indikator, sebaiknya Anda menyusun butir soal dalam format khusus. Hal ini
bermanfaat untuk menimbang apakah rumusan indikator sudah benar atau belum, dan
apakah sudah konsisten antara indikator dengan butir soal. Contoh :
HUBUNGAN INDIKATOR DENGAN SOAL
Mata Pelajaran :
.........................................................
Kelas :
.........................................................
Semester :
.........................................................
Standar Kompetensi :
.........................................................
Kompetensi Dasar :
.........................................................
No
|
Jenjang Kemampuan
|
Indiktor
|
Soal-soal
|
Nomor Naskah
|
||
No
|
Rumusan soal
|
I
|
II
|
|||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
|
|
|
|
|
|
|
Keterangan :
Kolom 1 : diisi dengan nomor urut indikator. Tiap
lembar sebaiknya hanya untuk satu nomor indikator.
Kolom 2 : diisi dengan
jenjang kemampuan, baik dalam domain kognitif (pengetahuan, pemahaman, aplikasi,
analisis, sintesis, evaluasi) maupun domain afektif dan psikomotor .
Kolom 3 : diisi dengan
rumusan indikator
Kolom 4 : diisi dengan
nomor urut soal untuk setiap indikator. Satu indikator dapat disusun
untuk beberapa
soal.
Kolom 5 : diisi
dengan rumusan soal
Kolom 6 : diisi dengan nomor soal yang bersangkutan pada naskah
ujian/tes ke satu.
Kolom 7, 8, 9, dan seterusnya : diisi sama dengan kolom 6.
Setelah
dirumuskan tujuan atau kompetensi secara rinci, Anda perlu menentukan ruang
lingkup materi yang hendak diukur dan perbandingannya. Ruang lingkup materi
yang hendak diukur harus sesuai dengan silabus/ kurikulum yang digunakan agar
derajat keesuaian dapat diperoleh secara optimal. Misalnya, aspek yang
berkenaan dengan pengertian tajwid, fungsi dan peranan ilmu tajwid, cara
membaca. al-Qur’an sesuai dengan tajwid dan makhroj. Selanjutnya, ditentukan
pula perbandingan bobot materi yang akan diukur. Berat-ringannya bobot
bergantung kepada urgensi materi dan kompetensi yang harus dikuasai peserta
didik. Di samping itu, Anda juga harus menyusun bentuk soal secara bervariasi
agar kelemahan setiap bentuk soal dapat ditutupi oleh bentuk soal yang lain.
Dalam
kisi-kisi, Anda harus memperhatikan domain yang akan diukur, seperti telah
dikemukakan sebelumnya. Ada pula sistematika yang lebih sederhana yaitu aspek recall,
komprehensi, dan aplikasi. Aspek recall berkenaan dengan aspek-aspek
pengetahuan tentang istilah-istilah, definisi, fakta, konsep, metode dan
prinsip-prinsip. Aspek komprehensi berkenaan dengan kemampuan-kemampuan antara
lain : menjelaskan, menyimpulkan suatu informasi, menafsirkan fakta (grafik,
diagram, tabel, dll), mentransferkan pernyataan dari suatu bentuk ke dalam
bentuk yang lain (misalnya dari pernyataan verbal kepada non-verbal atau dari
verbal ke dalam bentuk rumus), memprakirakan akibat atau konsekwensi logis dari
suatu situasi. Aspek aplikasi meliputi kemampuan-kemampuan antara lain :
menerapkan hukum/prinsip/teori dalam suasana yang sesungguhnya, memecahkan
masalah, membuat (grafik, diagram, dan lain-lain), mendemontrasikan penggunaan
suatu metode, prosedur, dan lain-lain.
Tingkat kesukaran soal juga harus diperhatikan agar Anda dapat
mengetahui dan menetapkan berapa jumlah soal yang termasuk sukar, sedang dan
mudah. Adapun besar-kecilnya jumlah soal untuk tiap-tiap tingkat kesukaran
tidak ada yang mutlak. Biasanya, jumlah soal sedang lebih banyak daripada
jumlah soal mudah dan sukar, sedangkan jumlah soal mudah dan soal sukar sama
banyaknya. Misalnya, soal mudah ditentukan 30%, sedang 40%, dan sukar 30 %.
Contoh :
KISI-KISI
SOAL
Nama Madrasah : ………………………………..
Mata Pelajaran : ………………………………..
Kelas/Semester : ………………………………..
Kurikulum Acuan : ………………………………..
Alokasi Waktu : ………………………………..
Jumlah Soal :
………………………………..
Materi
|
BS 50
|
PG 30
|
M 20
|
|||||||||
Peng
30%
|
Pem
30%
|
Ap
40%
|
Jml
|
Peng
30%
|
Pem
30%
|
Ap
40%
|
Jml
|
Peng
30%
|
Pem
30%
|
Ap
40%
|
Jml
|
|
A 40%
|
6
|
6
|
8
|
20
|
3
|
4
|
5
|
12
|
2
|
2
|
4
|
8
|
B 40%
|
6
|
6
|
8
|
20
|
3
|
4
|
5
|
12
|
2
|
2
|
4
|
8
|
C 20%
|
3
|
3
|
4
|
10
|
2
|
2
|
2
|
6
|
1
|
1
|
2
|
4
|
Jlh
|
15
|
15
|
20
|
50
|
8
|
10
|
12
|
30
|
5
|
5
|
10
|
20
|
Penjelasan :
a. Misalnya, jumlah soal keseluruhan adalah 100, terdiri atas 50
soal bentuk benar-salah, 30 soal bentuk pilihan-ganda, dan 20 soal bentuk
menjodohkan. Selanjutnya, tentukan pula persentase soal untuk masing-masing
materi, misalnya 40 %, 40 %, dan 20 %.
Untuk soal bentuk B – S = 50, maka jumlah soal untuk setiap materi
adalah :
Materi A = 40 % x 50 = 20 soal
Materi B = 40 % x 50 = 20 soal
Materi C = 20 % x 50 = 10 soal
Untuk bentuk P – G = 30, maka jumlah soal untuk setiap materi
adalah :
Materi A = 40 % x 30 = 12 soal
Materi B = 40 % x 30 = 12 soal
Materi C = 20 % x 30 = 6 soal
Untuk bentuk Menjodohkan = 20, maka jumlah soal untuk setiap
materi adalah :
Materi A = 40 % x 20 = 8 soal
Materi B = 40 % x 20 = 8 soal
Materi C = 20 % x 20 = 4 soal
b. Selanjutnya, menghitung jumlah soal untuk setiap jenjang
kemampuan, yaitu persentase pada setiap jenjang kemampuan dikalikan dengan
jumlah soal untuk setiap bentuk soal. Misalnya :
Pengetahuan : 30 % x 20 = 6 soal
Pemahaman : 30 % x 20 = 6 soal
Aplikasi : 40 % x 20 = 8 soal
Demikian seterusnya.
Pada kisi-kisi di atas belum tampak tingkat kesukaran soal (mudah,
sedang, sukar serta perbandingannya). Untuk menghitung tingkat kesukaran soal,
maka pada setiap jenjang kemampuan/aspek yang diukur (pengetahuan, pemahaman,
dan aplikasi) harus dibagi menjadi tiga kolom, yakni untuk kolom mudah, sedang,
dan sukar dengan perbandingan (misalnya) 30 %, 40 %, dan 30 %. Dengan demikian,
jumlah soal untuk masing-masing tingkat kesukaran pada setiap jenjang kemampuan
dapat dihitung seperti berikut :
Untuk
jenjang kemampuan pengetahuan :
Mudah : 30 % x 6 = 1,8 dihitung 2 soal.
Sedang : 40 % x 6 = 2,4 dihitung 2 soal.
Sukar : 30 % x 8 = 1,8 dihitung 2 soal.
Demikian
seterusnya, sehingga melahirkan tabel yang lebih terurai.
3. Menulis Soal
Penulisan soal merupakan salah satu langkah penting untuk dapat
menghasilkan alat ukur atau tes yang baik. Penulisan soal adalah penjabaran
indikator menjadi pertanyaan-pertanyaan yang karakteristiknya sesuai dengan
pedoman kisi-kisi. Setiap pertanyaan harus jelas dan terfokus serta menggunakan
bahasa yang efektif, baik bentuk pertanyaan maupun bentuk jawabannya. Kualitas
butir soal akan menentukan kualitas tes secara keseluruhan. Setelah semua soal
ditulis, sebaiknya soal tersebut dibaca lagi, jika perlu didiskusikan kembali
dengan tim penelaah soal, baik dari ahli bahasa, ahli bidang studi, termasuk
ahli evaluasi.
4. Uji Coba dan Analisis Soal
Jika semua
soal sudah disusun dengan baik, maka perlu diujicobakan terlebih dahulu
dilapangan. Tujuannya untuk melihat soal-soal mana yang perlu diubah,
diperbaiki, bahkan dibuang sama sekali, serta soal-soal mana yang baik untuk
dipergunakan selanjutnya. Soal yang baik adalah soal yang sudah mengalami
beberapa kali uji-coba dan revisi, yang didasarkan atas analisis empiris dan
rasional. Analisis empiris dimaksudkan untuk mengetahui kelemahan-kelemahan
setiap soal yang digunakan. Informasi empirik pada umumnya menyangkut segala hal
yang dapat mempengaruhi validitas soal, seperti aspek-aspek keterbacaan soal,
tingkat kesukaran soal, bentuk jawaban, daya pembeda soal, pengaruh kultur, dan
sebagainya. Sedangkan analisis rasional dimaksudkan untuk memperbaiki
kelemahan-kelemahan setiap soal.
Dalam
melaksanakan uji-coba soal, ada beberapa hal yang harus Anda perhatikan, antar
lain : (a) ruangan tempatnya tes hendaknya diusahakan seterang mungkin, jika
perlu dibuat papan pengumuman diluar agar orang lain tahu bahwa ada tes yang
sedang berlangsung, (b) perlu disusun tata tertib pelaksanaan tes, baik yang
berkenaan dengan peserta didik itu sendiri, guru, pengawas, maupun teknis
pelaksanaan tes, (c) para pengawas tes harus mengontrol pelaksanaan tes dengan
ketat, tetapi tidak mengganggu suasana tes. Peserta didik yang melanggar tata
tertib tes dapat dikeluarkan dari ruang tes, (d) waktu yang digunakan harus
sesuai dengan banyaknya soal yang diberikan, sehingga peserta didik dapat
bekerja dengan baik, (e) peserta didik harus benar-benar patuh mengerjakan
semua petunjuk dan perintah dari penguji. Sikap ini harus tetap dipelihara
meskipun diberikan kesempatan kepada peserta didik untuk mengajukan pertanyaan
bila ada soal yang tidak dimengerti atau kurang jelas. Tanggung jawab penguji
dalam hal ini adalah memberikan petunjuk dengan sikap yang bersifat lugas,
jujur, adil dan jelas. Namun demikian, antara penguji dan peserta didik
hendaknya dapat menciptakan suasana yang kondusif, dan (f) hasil uji coba
hendaknya diolah, dianalisis, dan diadministrasikan dengan baik, sehingga dapat
diketahui soal-soal mana yang lemah untuk selanjutnya dapat diperbaiki kembali.
5. Revisi dan Merakit Soal
Setelah soal
diuji-coba dan dianalisis, kemudian direvisi sesuai dengan proporsi tingkat
kesukaran soal dan daya pembeda. Dengan demikian, ada soal yang masih dapat
diperbaiki dari segi bahasa, ada juga soal yang harus direvisi total, baik yang
menyangkut pokok soal (stem) maupun alternatif jawaban (option),
bahkan ada soal yang harus dibuang atau disisihkan. Berdasarkan hasil revisi
soal ini, barulah Anda merakit soal menjadi suatu alat ukur yang terpadu. Semua
hal yang dapat mempengaruhi validitas skor tes, seperti nomor urut soal,
pengelompokkan bentuk soal, penataan soal, dan sebagainya haruslah
diperhatikan.
B. Pelaksanaan Evaluasi
Pelaksanaan
evaluasi artinya bagaimana cara melaksanakan suatu evaluasi sesuai dengan
perencanaan evaluasi, baik menggunakan tes (tes tertulis, tes lisan dan tes
perbuatan) maupun non-tes. Dalam pelaksanaan tes maupun non-tes tersebut akan
berbeda satu dengan lainnya, sesuai dengan tujuan dan fungsinya masing-masing.
Dalam
pelaksanaan tes lisan, Anda harus memperhatikan tempat atau ruangan tes yang
akan digunakan. Tempat ini harus terang, enak dipandang dan tidak menyeramkan,
sehingga peserta didik tidak takut dan gugup. Anda harus dapat menciptakan
suasana yang kondusif dan komunikatif, tetapi bukan berarti menciptakan suasana
tes lisan menjadi suasana diskusi, debat atau ngobrol santai. Komunikatif
dimaksudkan agar Anda dapat mengarahkan jawaban peserta didik, terutama bila
jawaban itu tidak sesuai dengan apa yang kita maksudkan, sebaliknya bukan
dengan membentak-bentak peserta didik. Mengarahkan berbeda dengan membantu. Mengarahkan
berarti memberi pengarahan secara umum untuk mencapai tujuan, sedangkan
membantu berarti ada kecenderungan untuk memberi bunyi jawaban kepada peserta
didik, karena ada rasa simpati, kasihan, dan sebagainya.
Dalam
pelaksanaan tes lisan, Anda tidak boleh membentak-bentak peserta didik dan
dilarang memberikan kata-kata yang merupakan kunci jawaban. Ada baiknya,
sebelum tes lisan dimulai, Anda menyiapkan pokok-pokok materi yang akan
ditanyakan, sehingga tidak terkecoh oleh jawaban peserta didik yang simpang
siur. Ketika peserta didik masuk dan duduk di tempat ujian, Anda hendaknya
tidak langsung memberikan pertanyaan-pertanyaan, karena yakinlah bahwa siapapun
yang menghadapi ujian atau tes lisan pasti ada perasaan gugup. Oleh sebab itu,
pada waktu mulai tes lisan (lebih kurang 2 – 3 menit), Anda harus dapat
menciptakan kondisi peserta didik agar tidak gugup, seperti menanyakan
identitas pribadi, pengalaman, kegiatan sehari-hari, dan sebagainya.
Dalam
pelaksanaan tes tertulis, Anda juga harus memperhatikan ruangan atau tempat tes
itu dilaksanakan. Ruangan dan tempat duduk peserta didik harus diatur
sedemikian rupa, sehingga gangguan suara dari luar dapat dihindari dan suasana
tes dapat berjalan lebih tertib. Anda atau panitia ujian harus menyusun tata
tertib pelaksanaan tes, baik yang menyangkut masalah waktu, tempat duduk,
pengawas, maupun jenis bidang studi yang akan diujikan. Perbandingan alokasi
waktu dengan jumlah soal harus sesuai dan proporsional. Begitu juga tempat
duduk peserta didik harus direnggangkan satu dengan lainnya untuk menghindari
peserta didik saling menyontek. Pengawas boleh berjalan-jalan, tetapi tidak
boleh mengganggu suasana ujian.
Pembagian
soal hendaknya dilakukan secara terbalik agar peserta didik tidak ada yang
lebih dahulu membaca. Semua ini harus diatur sedemikian rupa agar pelaksanaan
tes tertulis dapat berjalan dengan baik, tertib dan lancar. Pada prinsipnya
ketentuan-ketentuan di atas tidak jauh berbeda dengan pelaksanaan tes
perbuatan, hanya dalam tes perbuatan terkadang diperlukan alat bantu khusus,
misalnya untuk belajar membaca Al-Qur’an diperlukan kitab suci Al- Qur’an,
untuk tes praktik sholat dibutuhkan tempat sholat (musholla), dan sebagainya.
Untuk itu, dalam pelaksanaan tes perbuatan diperlukan tempat tes yang terbuka
dan suasananya bebas.
Pelaksanaan
nontes dimaksudkan untuk mengetahui sikap dan tingkah laku peserta didik
sehari-hari dengan menggunakan instrumen khusus, seperti pedoman observasi,
pedoman wawancara, skala sikap, skala minat, daftar cek, rating scale, anecdotal
records, sosiometri, home visit, dan sebagainya. Anda dituntut tidak
hanya mampu membuat dan melaksanakan tes yang baik, tetapi juga harus dapat
membuat alat-alat khusus dalam nontes dan melaksanakannya dengan baik sesuai
dengan prinsip-prinsip evaluasi.
Untuk
mengetahui tingkat penguasaan kompetensi peserta didik, selain menggunakan tes
tertulis (pencil and paper test), Anda juga dapat menggunakan tes
kinerja (performance test). Di samping itu, Anda dapat menilai hasil
kerja peserta didik dengan cara memberikan tugas atau proyek dan menganalisis
semua hasil kerja dalam bentuk portofolio. Anda diharapkan tidak hanya menilai
kognitif peserta didik, tetapi juga non-kognitif, seperti pengembangan pribadi,
kreatifitas, dan keterampilan interpersonal, sehingga dapat diperoleh gambaran
yang komprehensif dan utuh.
Realitas
menunjukkan bahwa tidak ada satu teknik dan bentuk evaluasi yang dapat
mengumpulkan data tentang keefektifan pembelajaran, prestasi dan kemajuan
belajar peserta didik secara sempurna. Pengukuran tunggal tidak cukup untuk
memberikan gambaran atau informasi tentang keefektifan pembelajaran dan tingkat
penguasaan kompetensi (pengetahuan, keterampilan, sikap dan nilai-nilai) peserta
didik. Hasil evaluasi juga tidak mutlak dan tidak abadi, karena sistem belajar
dan pembelajaran terus berkembang sesuai dengan perkembangan ilmu pengetahuan
dan teknologi serta pengalaman belajar peserta didik. Penetapan salah satu
teknik dan bentuk evaluasi (misalnya hanya tes objektif) dapat menghambat
penguasaan kompetensi peserta didik secara utuh, sehingga tidak memberikan
umpan balik dalam rangka diagnosis atau memodifikasi pengalaman belajar. Tujuan
pelaksanaan evaluasi adalah untuk mengumpulkan data dan informasi mengenai
keseluruhan aspek kepribadian dan prestasi belajar peserta didik yang meliputi
:
1.
Data pribadi (personal) peserta didik, seperti nama, tempat dan
tanggal lahir, jenis kelamin, golongan darah, alamat, dan lain-lain.
2.
Data tentang kesehatan peserta didik, seperti : penglihatan,
pendengaran, penyakit yang sering diderita, kondisi fisik dan sebagainya.
3.
Data tentang prestasi belajar (achievement) peserta didik
di sekolah.
4.
Data tentang sikap (attitude) peserta didik, seperti sikap
terhadap sesama teman sebaya, sikap terhadap kegiatan pembelajaran, sikap
terhadap guru dan kepala sekolah, sikap terhadap lingkungan sosial, dan
lain-lain.
5.
Data tentang bakat (aptitude) peserta didik, seperti ada
tidaknya bakat di bidang olah raga, keterampilan mekanis, manajemen, kesenian,
keguruan, dan sebagainya.
6.
Persoalan penyesuaian (adjustment), seperti kegiatan anak
dalam organisasi di sekolah, forum ilmiah, olah raga, kepanduan, dan
sebagainya.
7.
Data tentang minat (intrest) peserta didik.
8.
Data tentang rencana masa depan peserta didik yang dibantu oleh
guru dan orang tua sesuai dengan kesanggupan anak.
9.
Data tentang latar belakang keluarga peserta didik, seperti
pekerjaan orang tua, penghasilan tetap tiap bulan, kondisi lingkungan, hubungan
peserta didik dengan orang tua dan saudara-saudaranya, dan sebagainya.
Dari jenis-jenis data di atas jelas kiranya bahwa banyak data yang
harus dikumpulkan dari lapangan melalui kegiatan evaluasi. Pengumpulan data ini
harus diperhitungkan dengan cermat dan matang serta berpedoman kepada prinsip
dan fungsi evaluasi itu sendiri. Ada kecenderungan pelaksanaan evaluasi selama
ini kurang begitu memuaskan (terutama) bagi peserta didik. Hal ini dapat
dilihat dari berbagai segi, antara lain : (a) proses dan hasil evaluasi kurang
memberi keuntungan pada peserta didik, baik secara langsung maupun tidak
langsung, (b) penggunanan teknik dan prosedur evaluasi yang kurang tepat
berdasarkan apa yang sudah dipelajari peserta didik, (c) prinsip-prinsip umum
evaluasi kurang dipertimbangkan dan pemberian skor cenderung tidak adil dan
tidak objektif, dan (d) cakupan evaluasi kurang memperhatikan aspek-aspek
penting dari pembelajaran.
Jika semua
data sudah dikumpulkan, maka data itu harus diseleksi dengan teliti, sehingga
Anda dapat memperoleh data yang baik dan benar. Sebaliknya, bila data yang
terkumpul tidak diseleksi lagi, maka ada kemungkinan data itu tidak sesuai
dengan tujuan yang telah ditetapkan, bahkan mungkin pula bertentangan, sehingga
mengakibatkan kekaburan atau kekurangjelasan dari apa yang diharapkan. Data
yang harus diseleksi tidak hanya data dari hasil evaluasi, tetapi juga data
yang diperoleh dari pihak lain tentang peserta didik. Namun demikian, tidak
semua data yang diperoleh pasti mempunyai kesalahan. Jika Anda sendiri yang
melaksanakan evaluasi itu, tentu Anda akan lebih berhati-hati dalam memilih dan
menggunakan teknik dan alat evaluasi.
Ada beberapa
hal yang memungkinkan timbulnya kesalahan-kesalahan dalam pengumpulan data,
yaitu:
1. Kesalahan-kesalahan yang mungkin ditimbulkan karena kurang
sempurna alat-alat evaluasi. Misalnya, pada data yang berupa skor tes, mungkin
tes yang dipergunakan kurang baik, tidak valid, tidak reliabel, tidak praktis,
dan sebagainya. Pada data yang berupa hasil-hasil observasi, mungkin pedoman
observasinya kurang jelas, data hasil observasi kurang lengkap atau tidak
melukiskan variabel yang harus diobservasi. Prosedur verifikasinya adalah
meneliti kembali alat-alat evaluasi yang digunakan dalam pengumpulan data.
Apakah alat-alat evaluasi tersebut sudah cukup baik atau belum ? Jika
berdasarkan hasil pemeriksaan ternyata tidak ada kekeliruan, berarti
kesalahannya bukan bersumber dari alat evaluasi yang digunakan. Oleh sebab itu,
pemeriksaan harus dilanjutkan pada sumber kesalahan yang lain.
2. Kesalahan-kesalahan yang mungkin ditimbulkan oleh kurang
sempurnanya prosedur pelaksanaan evaluasi yang dilakukan. Misalnya, pada data
yang berupa skor tes, mungkin pada waktu pelaksanaan tes tersebut terjadi
peristiwa-peristiwa yang berlawanan dengan kelaziman-kelaziman yang biasa,
pengawasan kurang ketat, kondisi tempat pelaksanaan tes kurang nyaman, cahaya
kurang terang, dan sebagainya. Prosedur verifikasinya adalah meninjau kembali
komponen-komponen yang terkait dalam pelaksanaan evaluasi, syarat-syarat
pelaksanaan evaluasi, dan faktor-faktor yang menghambat pelaksanaan evaluasi.
Jika disini tidak ditemukan sebab-sebab yang menimbulkan kesalahan, maka
pemeriksaan harus dilanjutkan pada sumber kesesatan yang lain.
3. Kesalahan yang mungkin ditimbulkan oleh kurang sempurnanya cara
pencatatan hasil evaluasi. Misalnya, pada data yang berupa skor tes kemungkinan
kita sudah menjumlahkan skor yang dicapai peserta didik. Prosedur verifikasinya
adalah meneliti kembali pencatatan skor yang telah dilakukan, seperti ada
tidaknya kekeliruan pada waktu mencatat hasil evaluasi, ada tidaknya kekeliruan
dalam pemberian skor, dan ada tidaknya kekeliruan dalam menjumlahkan skor
setiap peserta didik. Jika disinipun tidak ditemukan kesalahan, berarti data
yang dikumpulkan itu tidak mengandung kesalahan. Hal-hal semacam inilah yang
diperlukan dalam menyeleksi dan meneliti data yang diperoleh.
artikel ini diposting sudah lama tapi bermanfaat sekali , saya sangat berterimakasih
BalasHapus