Dalam proses
evaluasi pembelajaran atau penilaian proses dan hasil belajar, Anda tentu
sering menggunakan alat ukur tertentu, baik tes maupun non-tes. Alat ukur ini
mempunyai fungsi dan peran yang sangat penting dalam rangka mengetahui
keefektifan proses pembelajaran di madrasah. Mengingat begitu pentingnya suatu
alat ukur dalam kegiatan evaluasi pembelajaran, maka suatu alat ukur harus
memiliki syarat-syarat tertentu sekaligus merupakan karakteristik alat ukur
yang baik. Dalam praktik di madrasah, seringkali guru membuat alat ukur tanpa
mengikuti aturan-aturan tertentu. Ada guru yang membuat alat ukur (seperti
soal-soal ulangan atau ujian akhir semester) yang langsung mengambil dari buku
sumber. Padahal kita tahu banyak buku sumber yang tidak sesuai dengan silabus
yang telah ditetapkan. Apa jadinya bila soal yang digunakan tidak sesuai dengan
materi yang disampaikan. Ada juga guru yang menggunakan soal-soal lama yang
belum diketahui kualitasnya. Hal ini semua sebagai akibat dari kekurangpahaman
guru terhadap suatu alat ukur yang baik. Di samping itu, untuk melengkapi
pengetahuan Anda tentang evaluasi, maka akan dikemukakan juga beberapa model
dan pendekatan evaluasi.
Setelah mempelajari kegiatan belajar 2 ini, Anda diharapkan dapat
:
1.
Menjelaskan pengertian valid.
2.
Menjelaskan pengertian deskriminatif.
3.
Menyebutkan ciri-ciri evaluasi yang baik.
4.
Menjelaskan model evaluasi black box.
5.
Menyebutkan alat evaluasi yang digunakan dalam model pengukuran.
6.
Menjelaskan konsep educational system model.
7.
Menyebutkan tiga langkah pokok model evaluasi iluminatif.
8.
Menjelaskan konsep penilaian acuan patokan.
9.
Menyebutkan jenis penilaian yang cocok untuk PAP.
10.Menjelaskan konsep penilaian acuan norma.
A. Karakteristik Alat Ukur yang Baik
Evaluasi
sangat berguna untuk meningkatkan kualitas proses dan hasil pembelajaran.
Pentingnya evaluasi dalam pembelajaran, dapat dilihat dari tujuan dan fungsi
evaluasi maupun sistem pembelajaran itu sendiri. Evaluasi tidak dapat
dipisahkan dari pembelajaran, sehingga guru mau tidak mau harus melakukan
evaluasi pembelajaran. Melalui evaluasi, Anda dapat melihat tingkat kemampuan
peserta didik, baik secara kelompok maupun individual. Anda juga dapat melihat
berbagai perkembangan hasil belajar peserta ddik, baik yang yang menyangkut
domain kognitif, afektif maupun psikomotor. Pada akhirnya, guru akan memperoleh
gambaran tentang keefektifan proses pembelajaran. Setelah Anda memahami
pentingnya evaluasi dalam kegiatan pembelajaran di madrasah, tentunya Anda juga
perlu tahu apa karakteristik dari alat ukur yang baik.
Pemahaman
tentang alat ukur ini menjadi penting karena dalam praktik evaluasi atau
penilaian di madrasah, pada umumnya guru melakukan proses pengukuran. Dalam
pengukuran tentu harus ada alat ukur (instrumen), baik yang berbentuk tes
maupun nontes. Alat ukur tersebut ada yang baik, ada pula yang kurang baik.
Alat ukur yang baik adalah alat ukur yang memenuhi syarat-syarat atau
kaidah-kaidah tertentu, dapat memberikan data yang akurat sesuai dengan fungsinya,
dan hanya mengukur sampel prilaku tertentu. Secara sederhana, Zainal Arifin
(2011 : 69) mengemukakan karakteristik instrumen evaluasi yang baik adalah
“valid, reliabel, relevan, representatif, praktis, deskriminatif, spesifik dan
proporsional”.
1. Valid, artinya suatu alat ukur dapat dikatakan valid jika betul-betul
mengukur apa yang hendak diukur secara tepat. Misalnya, alat ukur matapelajaran Ilmu
Fiqih, maka alat ukur tersebut harus betul-betul dan hanya mengukur kemampuan
peserta didik dalam mempelajari Ilmu Fiqih, tidak boleh dicampuradukkan dengan
materi pelajaran yang lain. Validitas suatu alat ukur dapat ditinjau dari
berbagai segi, antara lain validitas ramalan (predictive validity),
validitas bandingan (concurent validity), dan validitas isi (content
validity), validitas konstruk (construct validity), dan lain-lain.
Penjelasan tentang validitas ini dapat Anda baca uraian modul berikutnya.
2. Reliabel, artinya suatu alat ukur dapat dikatakan reliabel atau handal jika
ia mempunyai hasil yang taat asas (consistent). Misalnya, suatu alat
ukur diberikan kepada sekelompok peserta didik saat ini, kemudian diberikan
lagi kepada sekelompok peserta didik yang sama pada saat yang akan datang, dan
ternyata hasilnya sama atau mendekati sama, maka dapat dikatakan alat ukur
tersebut mempunyai tingkat reliabilitas yang tinggi.
3. Relevan, artinya alat ukur yang digunakan harus sesuai dengan standar
kompetensi, kompetensi dasar, dan indikator yang telah ditetapkan. Alatukur
juga harus sesuai dengan domain hasil belajar, seperti domain kognitif,
afektif, dan psikomotor. Jangan sampai ingin mengukur domain kognitif
menggunakan alat ukur non-tes. Hal ini tentu tidak relevan.
4. Representatif, artinya materi alat ukur harus betul-betul mewakili dari seluruh
materi yang disampaikan. Hal ini dapat dilakukan bila guru menggunakan silabus
sebagai acuan pemilihan materi tes. Guru juga harus memperhatikan proses
seleksi materi, mana materi yang bersifat aplikatif dan mana yang tidak, mana
yang penting dan mana yang tidak.
5. Praktis, artinya mudah digunakan. Jika alat ukur itu sudah
memenuhi syarat tetapi sukar digunakan, berarti tidak praktis. Kepraktisan ini
bukan hanya dilihat dari pembuat alat ukur (guru), tetapi juga bagi orang lain
yang ingin menggunakan alat ukur tersebut.
6. Deskriminatif, artinya adalah alat ukur itu harus disusun
sedemikian rupa, sehingga dapat menunjukkan perbedaan-perbedaan yang sekecil
apapun. Semakin baik suatu alat ukur, maka semakin mampu alat ukur tersebut
menunjukkan perbedaan secara teliti. Untuk mengetahui apakah suatu alat ukur
cukup deskriminatif atau tidak, biasanya didasarkan atas uji daya pembeda alat
ukur tersebut.
7. Spesifik, artinya suatu alat ukur disusun dan digunakan khusus
untuk objek yang diukur. Jika alat ukur tersebut menggunakan tes, maka jawaban
tes jangan menimbulkan ambivalensi atau spekulasi.
Karakteristik Alat Ukur Yang Baik
|
Reliabel
|
Deskriminatif
|
Valid
|
Relevan
|
Praktis
|
Spesifik
|
Proporsional
|
Representatif
|
Gambar 2.2
Karakteristik Alat
Ukur Yang Baik
Dalam buku Succesful
Teaching karangan J.Mursell yang diterjemahkan ke dalam bahasa Indonesia
oleh J. Mursell dan S.Nasution (tanpa tahun : 23) dikemukakan bahwa ciri-ciri
evaluasi yang baik adalah “evaluasi dan hasil langsung, evaluasi dan transfer,
dan evaluasi langsung dari proses belajar”.
1. Evaluasi dan hasil Langsung.
Dalam proses
pembelajaran, guru sering melakukan kegiatan evaluasi, baik ketika proses
pembelajaran sedang berlangsung maupun ketika sesudah proses pembelajaran
selesai. Jika evaluasi diadakan ketika proses pembelajaran sedang berlangsung,
maka guru ingin mengetahui keefektifan dan kesesuaian strategi pembelajaran
dengan tujuan yang ingin dicapai. Jika evaluasi dilakukan sesudah proses
pembelajaran selesai, berarti guru ingin mengetahui hasil atau prestasi belajar
yang diperoleh peserta didik.
2. Evaluasi dan transfer.
Hal penting
yang berkenaan dengan proses belajar adalah kemungkinan mentransfer hasil yang
dipelajari ke dalam situasi yang fungsional. Dasar pemikiran ini merupakan asas
psikologis yang logis dan rasional. Peserta didik tidak dapat disebut telah
menguasai ilmu tajwid (misalnya), jika ia belum dapat menggunakannya dalam
membaca Al-Qur’an. Apabila suatu hasil belajar tidak dapat ditransfer dan hanya
dapat digunakan dalam satu situasi tertentu saja, maka hasil belajar itu
disebut hasil belajar palsu. Sebaliknya, jika suatu hasil belajar dapat
ditransfer kepada penggunaan yang aktual, maka hasil belajar itu disebut hasil
belajar otentik. Jadi, evaluasi yang baik harus mengukur hasil belajar yang
otentik dan kemungkinan dapat ditransfer.
Dalam
penelitian sering ditemui hasil-hasil pembelajaran yang dicapai tampaknya baik,
tetapi sebenarnya hasil itu palsu. Peserta didik dapat mengucapkan kata-kata
yang dihafalkan dari buku pelajarannya, tetapi mereka tidak dapat
menggunakannya dalam situasi baru. Penguasaan materi pelajaran seperti ini
tidak lebih dari “penguasaan beo”. Evaluasi yang menekankan pada hasil-hasil
palsu, baik untuk informasi bagi peserta didik maupun untuk tujuan lain, berarti
evaluasi itu palsu. Jika peserta didik hanya memiliki pengetahuan yang bersifat
informatif, belum tentu menjamin pemahaman dan pengertiannya. Oleh karena itu,
penekanan pada pengetahuan yang bersifat informatif tidak akan menghasilkan
pola berpikir yang baik. Ada dua sebab mengapa hasil pembelajaran yang
mengakibatkan dan berhubungan dengan proses transfer menjadi penting
artinya dalam proses evaluasi. Pertama, hasil-hasil itu menyatakan
secara khusus dan sejelas-jelasnya kepada guru mengenai apa yang sebenarnya
terjadi ataupun tidak terjadi, dan sampai dimana pula telah tercapai hasil
belajar yang penuh makna serta otentik sifatnya. Kedua, hasil belajar
sangat erat hubungannya dengan tujuan peserta didik belajar, sehingga mempunyai
efek yang sangatkuat terhadap pembentukan pola dan karakter belajar yang
dilakukan peserta didik. Oleh karena itu, belajar hendaknya dilakukan untuk
mendapatkan hasil-hasil yang dapat ditransfer dan setiap waktu dapat digunakan
menurut keperluannya.
3. Evaluasi langsung dari proses belajar.
Di samping
harus mengetahui hasil belajar, Anda juga harus menilai proses belajar. Hal ini
dimaksudkan agar proses belajar dapat diorganisasi sedemikian rupa, sehingga
dapat mencapai hasil yang optimal. Anda dapat mengetahui proses apa yang
dilalui peserta didik dalam mempelajari sesuatu. Misalnya, apakah peserta didik
dalam mempelajari Al-Qur’an cukup sekedar membaca beberapa ayat Al-Qur’an
ataukah ia membaca seluruh ayat Al-Qur’an untuk memahami dan memecahkan masalah-masalah
kehidupan. Apakah dalam praktik ibadah, peserta didik cukup hanya melatih
gerakan-gerakan sholat atau menganalisis praktik sholat dan mencari hubungannya
dengan tingkah laku sehari-hari, mendiskusikan manfaat sholat dengan
teman-temannya, dan mencari situasi-situasi yang nyata yang dapat menggunakan
fungsi sholat itu.
Penelitian
tentang proses belajar yang diikuti oleh peserta didik merupakan suatu hal yang
sangat penting. Anda akan mengetahui dimana letak kesulitan peserta didik,
kemudian mencari alternatif bagaimana mengatasi kesulitan tersebut. Di samping
itu, penelitian tentang proses belajar bermanfaat juga bagi peserta didik itu
sendiri. Peserta didik akan melihat kelemahannya, kemudian berusaha
memperbaikinya, dan akhirnya dapat mempertinggi hasil belajarnya. Meneliti
proses belajar seorang anak bukan pekerjaan yang mudah. Hal ini memerlukan
waktu, tenaga, pemikiran, dan pengalaman. Anda dapat menggunakan suatu metode
untuk menilai proses belajar dengan memperhatikan prinsip konteks, vokalisasi,
sosialisasi, individualisasi, dan urutan (squence).
Seorang peserta didik tidak dapat belajar dengan baik, karena ia
tidak menggunakan konteks yang baik. Ia tidak menggunakan bermacam-macam sumber
dan tidak menggunakan situasi-situasi yang konkrit. Peserta didik tidak dapat
belajar dengan baik, karena tidak mempunyai fokus tertentu, misalnya tidak
melihat masalah-masalah pokok yang harus dipecahkannya, atau mungkin pula tidak
sesuai dengan bakat dan minatnya (individualisasi) serta tidak mendiskusikannya
dengan orang lain (sosialisasi). Dalam evaluasi pembelajaran, Anda jangan
terfokus kepada hasil belajar saja, tetapi juga harus memperhatikan transfer
hasil belajar dan proses belajar yang dijalani oleh peserta didik.
B. Model-model Evaluasi
Pada tahun
1949, Tyler pernah mengemukakan model evaluasi black box. Model ini
banyak digunakan oleh orang-orang yang melakukan kegiatan evaluasi. Studi
tentang evaluasi belum begitu menarik perhatian orang banyak, karena kurang
memiliki nilai praktis. Baru sekitar tahun 1960-an studi evaluasi mulai berdiri
sendiri menjadi salah satu program studi di perguruan tinggi, tidak hanya di
jenjang sarjana (S.1) dan magister (S.2) tetapi juga pada jenjang doktor (S.3).
Sekitar tahun 1972, model evaluasi mulai berkembang. Taylor dan Cowley,
misalnya, berhasil mengumpulkan berbagai pemikiran tentang model evaluasi dan
menerbitkannya dalam suatu buku. Model evaluasi yang dikembangkan lebih banyak
menggunakan pendekatan positivisme yang berakar pada teori psikometrik. Dalam
model tersebut, pengukuran dan tes masih sangat dominan, sekalipun tidak lagi
diidentikkan dengan evaluasi. Penggunaan disain eksperimen seperti yang
dikemukakan Campbell dan Stanley (1963) menjadi ciri utama dari model evaluasi.
Berkembangnya model evaluasi pada tahun 70-an tersebut diawali dengan adanya
pandangan alternatif dari para expert. Pandangan alternatif yang
dilandasi sebuah paradigma fenomenologi banyak menampilkan model evaluasi.
Dari sekian
banyak model-model evaluasi yang dikemukakan, tes dan pengukuran tidak lagi
menempati posisi yang menentukan. Penggunaannya hanya untuk tujuan-tujuan
tertentu saja, bukan lagi menjadi suatu keharusan, seperti ketika model pertama
ditampilkan. Tes dan pengukuran tidak lagi menjadi parameter kualitas suatu
studi evaluasi yang dilakukan. Perkembangan lain yang menarik dalam model
evaluasi ini adalah adanya suatu upaya untuk bersikap eklektik dalam penggunaan
pendekatan positivisme maupun fenomenologi yang oleh Patton (1980) disebut paradigm
of choice. Walaupun usaha ini tidak melahirkan model dalam pengertian
terbatas tetapi memberikan alternatif baru dalam melakukan evaluasi.
Dalam studi
tentang evaluasi, banyak sekali dijumpai model-model evaluasi dengan format
atau sistematika yang berbeda, sekalipun dalam beberapa model ada juga yang
sama. Misalnya saja, Said Hamid Hasan (2009) mengelompokkan model evaluasi
sebagai berikut :
1. Model evaluasi kuantitatif, yang meliputi : model Tyler,
model teoritik Taylor dan Maguire, model pendekatan sistem Alkin, model Countenance
Stake, model CIPP, model ekonomi mikro.
2. Model evaluasi kualitatif, yang meliputi : model studi kasus,
model iluminatif, dan model responsif
Sementara itu, Kaufman dan Thomas dalam Suharsimi Arikunto dan
Cepi Safruddin membedakan model evaluasi menjadi delapan, yaitu :
1. Goal Oriented Evaluation Model, dikembangkan oleh Tyler.
2. Goal Free Evaluation Model, dikembangkan oleh Scriven.
3. Formatif Sumatif Evaluation Model, dikembangkan oleh Michael Scriven
4. Countenance Evaluation Model, dikembangkan oleh Stake.
5. Responsive Evaluation Model, dikembangkan oleh Stake.
6. CSE-UCLA Evaluation Model, menekankan pada “kapan” evaluasi dilakukan.
7. CIPP Evaluation Model, yang dikembangkan oleh Stufflebeam.
8. Discrepancy Model, yang
dikembangkan oleh Provus.
Ada juga model evaluasi yang dikelompokkan Nana Sudjana dan
R.Ibrahim (2007 : 234) yang membagi model evaluasi menjadi empat model utama,
yaitu “measurement, congruence, educational system, dan illumination”.
Dari beberapa model evaluasi di atas, beberapa diantaranya akan dikemukakan
secara singkat sebagai berikut :
1. Model Tyler
Nama model
ini diambil dari nama pengembangnya yaitu Tyler. Dalam buku Basic Principles
of Curriculum and Instruction, Tyler banyak mengemukakan ide dan gagasannya
tentang evaluasi. Salah satu bab dari buku tersebut diberinya judul how can
the the effectiveness of learning experience be evaluated ? Model ini
dibangun atas dua dasar pemikiran. Pertama, evaluasi ditujukan kepada
tingkah laku peserta didik. Kedua, evaluasi harus dilakukan pada tingkah
laku awal peserta didik sebelum melaksanakan kegiatan pembelajaran dan sesudah
melaksanakan kegiatan pembelajaran (hasil). Dasar pemikiran yang kedua ini
menunjukkan bahwa seorang evaluator harus dapat menentukan perubahan tingkah
laku apa yang terjadi setelah peserta didik mengikuti pengalaman belajar
tertentu, dan menegaskan bahwa perubahan yang terjadi merupakan perubahan yang
disebabkan oleh pembelajaran.
Penggunaan model Tyler memerlukan informasi perubahan tingkah laku
terutama pada saat sebelum dan sesudah terjadinya pembelajaran. Istilah yang
populer dikalangan guru adalah tes awal (pre-test) dan tes akhir (post-test).
Model ini mensyaratkan validitas informasi pada tes akhir. Untuk menjamin
validitas ini maka perlu adanya kontrol dengan menggunakan disain eksperimen.
Model Tyler disebut juga model black box karena model ini sangat
menekankan adanya tes awal dan tes akhir. Dengan demikian, apa yang terjadi
dalam proses tidak perlu diperhatikan. Dimensi proses ini dianggap sebagai
kotak hitam yang menyimpan segala macam teka-teki.
Menurut
Tyler, ada tiga langkah pokok yang harus dilakukan, yaitu :
a. Menentukan tujuan pembelajaran yang akan dievaluasi.
b. Menentukan situasi dimana peserta didik memperoleh kesempatan
untuk menunjukkan tingkah laku yang berhubungan dengan tujuan.
c. Menentukan alat evaluasi yang akan dipergunakan untuk mengukur
tingkah laku peserta didik.
2. Model yang Berorientasi pada Tujuan
Sebelum KBK
2004, Anda mungkin pernah mengenal adanya tujuan pembelajaran umum dan tujuan
pembelajaran khusus. Model evaluasi ini menggunakan kedua tujuan tersebut
sebagai kriteria untuk menentukan keberhasilan. Evaluasi diartikan sebagai
proses pengukuran hinggamana tujuan pembelajaran telah tercapai. Model ini
banyak digunakan oleh guru-guru karena dianggap lebih praktis untuk menentukan
hasil yang diinginkan dengan rumusan yang dapat diukur. Dengan demikian,
terdapat hubungan yang logis antara kegiatan, hasil dan prosedur pengukuran
hasil. Tujuan model ini adalah membantu Anda merumuskan tujuan dan menjelaskan
hubungan antara tujuan dengan kegiatan. Jika rumusan tujuan pembelajaran dapat
diobservasi (observable) dan dapat diukur (measurable), maka
kegiatan evaluasi pembelajaran akan menjadi lebih praktis dan simpel.
Model ini
dapat membantu Anda menjelaskan rencana pelaksanaan pembelajaran dengan proses
pencapaian tujuan. Instrumen yang digunakan bergantung kepada tujuan yang ingin
diukur. Hasil evaluasi akan menggambarkan tingkat keberhasilan tujuan program
pembelajaran berdasarkan kriteria program khusus. Kelebihan model ini terletak
pada hubungan antara tujuan dengan kegiatan dan menekankan pada peserta didik
sebagai aspek penting dalam program pembelajaran. Kekurangannya adalah
memungkinkan terjadinya proses evaluasi melebihi konsekuensi yang tidak diharapkan.
3. Model Pengukuran
Model
pengukuran (measurement model) banyak mengemukakan pemikiran-pemikiran
dari R.Thorndike dan R.L.Ebel. Sesuai dengan namanya, model ini sangat
menitikberatkan pada kegiatan pengukuran. Pengukuran digunakan untuk menentukan
kuantitas suatu sifat (atribute) tertentu yang dimiliki oleh objek,
orang maupun peristiwa, dalam bentuk unit ukuran tertentu. Anda dapat
menggunakan model ini untuk mengungkap perbedaan-perbedaan individual maupun
kelompok dalam hal kemampuan, minat dan sikap. Hasil evaluasi digunakan untuk
keperluan seleksi peserta didik, bimbingan, dan perencanaan pendidikan. Objek
evaluasi dalam model ini adalah tingkah laku peserta didik, mencakup hasil
belajar (kognitif), pembawaan, sikap, minat, bakat, dan juga aspek-aspek
kepribadian peserta didik. Untuk itu, instrumen yang digunakan pada umumnya
adalah tes tertulis (paper and pencil test) dalam bentuk tes objektif,
yang cenderung dibakukan. Oleh sebab itu, dalam menganalisis soal sangat
memperhatikan difficulty index dan index of discrimination. Model
ini menggunakan pendekatan Penilaian Acuan Norma (norm-referenced
assessment).
4. Model Kesesuain (Ralph W.Tyler, John B.Carrol, and Lee
J.Cronbach)
Menurut
model ini, evaluasi adalah suatu kegiatan untuk melihat kesesuaian (congruence)
antara tujuan dengan hasil belajar yang telah dicapai. Hasil evaluasi dapat
Anda gunakan untuk menyempurnakan sistem bimbingan peserta didik dan untuk
memberikan informasi kepada pihak-pihak yang memerlukan. Objek evaluasi adalah
tingkah laku peserta didik, yaitu perubahan tingkah laku yang diinginkan (intended
behaviour) pada akhir kegiatan pendidikan, baik yang menyangkut aspek
kognitif, afektif maupun psikomotor. Teknik evaluasi yang dapat Anda gunakan
tidak hanya tes (tulisan, lisan, dan perbuatan), tetapi juga non-tes
(observasi, wawancara, skala sikap, dan sebagainya). Model evaluasi ini
memerlukan informasi perubahan tingkah laku pada dua tahap, yaitu sebelum dan
sesudah kegiatan pembelajaran. Berdasarkan konsep ini, Anda perlu melakukan pre
and post-test. Adapun langkah-langkah yang harus ditempuh dalam model
evaluasi ini adalah merumuskan tujuan tingkah laku (behavioural objectives),
menentukan situasi dimana peserta didik dapat memperlihatkan tingkah laku yang
akan dievaluasi, menyusun alat evaluasi, dan menggunakan hasil evaluasi. Oleh
sebab itu, model ini menekankan pada pendekatan penilaian acuan patokan (PAP).
5. Educational System Evaluation Model (Daniel L.Stufflebeam, Michael Scriven, Robert E.Stake, dan
Malcolm M.Provus)
Menurut
model ini, evaluasi berarti membandingkan performance dari berbagai
dimensi (tidak hanya dimensi hasil saja) dengan sejumlah kriteria, baik yang
bersifat mutlak/interen maupun relatif/eksteren. Model yang menekankan sistem
sebagai suatu keseluruhan ini sebenarnya merupakan penggabungan dari beberapa
model, sehingga objek evaluasinyapun diambil dari beberapa model, yaitu (1)
model countenance dari Stake, yang meliputi : keadaan sebelum kegiatan
pembelajaran berlangsung (antecedents), kegiatan yang terjadi dan saling
mempengaruhi (transactions), hasil yang diperoleh (outcomes), (2)
model CIPP dari Stufflebeam, yang meliputi Context, Input, Process, dan
Product, (3) model Scriven yang meliputi instrumental evaluation and
consequential evaluation, (4) model Provus yang meliputi : design,
operation program, interim products, dan terminal products. Dari
keempat model yangtergabung dalam educational system model, akan
dijelaskan secara singkat tentang dua model, yaitu model countenance dan
model CIPP.
Model Stake
menitikberatkan evaluasi pada dua hal pokok, yaitu description dan judgement.
Setiap hal tersebut terdiri atas tiga dimensi, seperti telah dijelaskan di
atas, yaitu antecedents (context), transaction (process), dan outcomes
(output). Description terdiri atas dua aspek, yaitu intents
(goals) dan observation (effects) atau yang sebenarnya terjadi.
Sedangkan judgement terdiri atas dua aspek, yaitu standard dan judgement.
Dalam model ini, evaluasi dilakukan dengan membandingkan antara satu program
dengan program lain yang dianggap standar. Stake mengatakan description berbeda
dengan judgement atau menilai. Dalam ketiga dimensi di atas (antecedents,
transaction, outcomes), perbandingan data tidak hanya untuk menentukan
apakah ada perbedaan tujuan dengan keadaan yang sebenarnya tetapi juga
dibandingkan dengan standar yang absolut untuk menilai manfaat program. Menurut
Stake, suatu hasil penelitian tidak dapat diandalkan jika tidak dilakukan
evaluasi.
Model CIPP
berorientasi kepada suatu keputusan (a decision oriented evaluation approach
structured). Tujuannya membantu kepala madrasah dan guru di dalam membuat
keputusan. Evaluasi diartikan sebagai suatu proses menggambarkan, memperoleh
dan menyediakan informasi yang berguna untuk menilai alternatif keputusan.
Sesuai dengan nama modelnya, model ini membagi empat jenis kegiatan evaluasi,
yaitu :
a. Context evaluation to serve planning decision, yaitu konteks evaluasi untuk membantu merencanakan keputusan,
menentukan kebutuhan yang akan dicapai oleh program pembelajaran, dan merumuskan
tujuan program pembelajaran.
b. Input evaluation, structuring decision. Kegiatan evaluasi bertujuan untuk membantu mengatur keputusan,
menentukan sumber-sumber yang ada, alternatif apa yang akan diambil, apa
rencana dan strategi untuk mencapai tujuan, dan bagaimana prosedur kerja untuk
mencapainya.
c. Process evaluation, to serve implementing decision. Kegiatan evaluasi ini bertujuan untuk membantu melaksanakan
keputusan. Pertanyaan yang harus Anda jawab adalah hinggamana suatu rencana
telah dilaksanakan, apakah rencana tersebut sesuai dengan prosedur kerja, dan
apa yang harus diperbaiki.
d. Product evaluation, to serve recycling decision. Kegiatan evaluasi ini bertujuan untuk membantu keputusan
selanjutnya. Pertanyaan yang harus Anda jawab adalah hasil apa yang telah
dicapai dan apa yang dilakukan setelah program berjalan.
Proses
evaluasi tidak hanya berakhir dengan suatu deskripsi mengenai keadaan sistem
yang bersangkutan, tetapi harus sampai pada judgment sebagai simpulan
dari hasil evaluasi. Model ini menuntut agar hasil evaluasi digunakan sebagai input
untuk decision making dalam rangka penyempurnaan sistem secara
keseluruhan. Pendekatan yang digunakan adalah penilaian acuan norma (PAN) dan
penilaian acuan patokan (PAP).
6. Illuminative Model (Malcolm Parlett dan Hamilton)
Jika model measurement
dan congruence lebih berorientasi pada evaluasi
kuantitatif-terstruktur, maka model ini lebih menekankan pada evaluasi
kualitatif-terbuka (open-ended). Kegiatan evaluasi dihubungkan dengan learning
milieu, dalam konteks madrasah sebagai lingkungan material dan
psiko-sosial, dimana guru dan peserta didik dapat berinteraksi. Tujuan evaluasi
adalah untuk mempelajari secara cermat dan hati-hati terhadap pelaksanaan sistem
pembelajaran, faktor-faktor yang mempengaruhinya, kelebihan dan kekurangan
sistem, dan pengaruh sistem terhadap pengalaman belajar peserta didik. Hasil
evaluasi lebih bersifat deskriptif dan interpretasi, bukan pengukuran dan
prediksi. Model ini lebih banyak menggunakan judgment. Fungsi evaluasi
adalah sebagai input untuk kepentingan pengambilan keputusan dalam rangka
penyesuaian dan penyempurnaan sistem pembelajaran yang sedang dikembangkan.
Objek
evaluasi model ini mencakup latar belakang dan perkembangan sistem
pembelajaran, proses pelaksanaan sistem pembelajaran, hasil belajar peserta
didik, kesukaran-kesukaran yang dialami dari perencanaan sampai dengan
pelaksanaan, termasuk efek samping dari sistem pembelajaran itu sendiri.
Pendekatan yang digunakan lebih menyerupai pendekatan yang diterapkan dalam
bidang antropologi sosial, psikiatri, dan sosiologi. Cara-cara yang digunakan
tidak bersifat standard, melainkan bersifat fleksibel dan selektif.
Berdasarkan tujuan dan pendekatan evaluasi dalam model ini, maka ada tiga fase
evaluasi yang harus Anda tempuh, yaitu : observe, inquiry further, dan seek
to explain.
7. Model Responsif
Sebagaimana
model illuminatif, model ini juga menekankan pada pendekatan
kualitatif-naturalistik. Evaluasi tidak diartikan sebagai pengukuran melainkan
pemberian makna atau melukiskan sebuah realitas dari berbagai perspektif
orang-orang yang terlibat, berminat dan berkepentingan dengan program
pembelajaran. Tujuan evaluasi adalah untuk memahami semua komponen program
pembelajaran melalui berbagai sudut pandangan yang berbeda. Sesuai dengan
pendekatan yang digunakan, maka model ini kurang percaya terhadap hal-hal yang
bersifat kuantitatif. Instrumen yang digunakan pada umumnya mengandalkan
observasi langsung maupun tak langsungdengan interpretasi data yang
impresionistik. Langkah-langkah kegiatan evaluasi meliputi observasi, merekam
hasil wawancara, mengumpulkan data, mengecek pengetahuan awal (preliminary
understanding) peserta didik dan mengembangkan disain atau model. Berdasarkan
langkah-langkah ini, evaluator mencoba responsif terhadap orang-orang yang
berkepentingan pada hasil evaluasi. Hal yang penting dalam model responsif
adalah pengumpulan dan sintesis data.
Kelebihan
model ini adalah peka terhadap berbagai pandangan dan kemampuannya
mengakomodasi pendapat yang ambigius serta tidak fokus. Sedangkan kekurangannya
antara lain (1) pembuat keputusan sulit menentukan prioritas atau
penyederhanaan informasi (2) tidak mungkin menampung semua sudut pandangan dari
berbagai kelompok (3) membutuhkan waktu dan tenaga. Evaluator harus dapat
beradaptasi dengan lingkungan yang diamati. Untuk mempelajari lebih jauh
tentang model ini, silahkan Anda membaca buku Stake (1975) atau Lincoln dan
Guba (1985).
Setelah Anda
mempelajari berbagai model evaluasi, model mana yang akan digunakan dalam
pembelajaran ? Jawabannya tentu sangat bergantung kepada tujuan evaluasi yang
ditetapkan. Namun demikian, perlu juga Anda pahami bahwa keberhasilan suatu
evaluasi pembelajaran secara keseluruhan bukan hanya dipengaruhi penggunaan
yang tepat pada sebuah model evaluasi melainkan juga dipengaruhi oleh berbagai
faktor. Pertama, tujuan pembelajaran, baik tujuan pembelajaran umum
maupun tujuan pembelajaran khusus (instructional objective). Seringkali
kedua tujuan pembelajaran ini saling bertentangan satu sama lain dilihat dari
kebutuhan madrasah, kurikulum, guru, peserta didik, lingkungan, dan sebagainya.
Bahkan, kadang-kadang guru sendiri mempunyai tujuan sendiri-sendiri. Semuanya
harus dipertimbangkan agar terdapat keseimbangan dan keserasian.
Kedua, sistem madrasah. Faktor ini perlu dipertimbangkan dengan matang
dan hati-hati karena melibatkan berbagai komponen yang saling berinteraksi dan
ketergantungan. Mengingat kompleksnya sistem madrasah, maka fungsi madrasah
juga menjadi ganda. Di satu pihak, madrasah ingin mewariskan kebudayaan masa
lampau dengan sistem norma, nilai dan adat yang dianggap terbaik untuk generasi
muda. Di pihak lain, madrasah berkewajiban mempersiapkan peserta didik
menghadapi masa depan, memperoleh keterampilan dan kemampuan untuk berinovasi,
bahkan menghasilkan perubahan. Jadi, madrasah sekaligus bersikap
konservatif-radikal serta reaksioner-progresif. Oleh sebab itu, peranan
evaluasi menjadi sangat penting. Tujuannya adalah untuk melihat dan
mempertimbangkan hal-hal apa yang perlu diberikan di madrasah. Begitu juga
bentuk kurikulum dan silabus mata pelajaran sangat bergantung pada evaluasi
yang dilaksanakanoleh guru-guru di madrasah, sehingga timbul masalah lainnya
yaitu teknik evaluasi apa yang akan digunakan untuk mencapai tujuan itu.
Ketiga, pembinaan guru. Banyak program pembinaan guru yang belum
menyentuh secara langsung tentang evaluasi. Program pembinaan guru lebih banyak
difokuskan kepada pengembangan kurikulum dan metodologi pembelajaran. Hal ini
pula yang menyebabkan perbaikan sistem evaluasi pembelajaran menjadi kurang
efektif. Guru juga sering dihadapkan dengan beragam kegiatan, seperti membuat
persiapan mengajar, mengikuti kegiatan ekstra kurikuler, penyesuaian diri, dan
kegiatan administratif lainnya. Artinya, bagaimana mungkin kualitas sistem
evaluasi pembelajaran di madrasah dapat ditingkatkan, bila fokus pembinaan guru
hanya menyentuh domain-domain tertentu saja, ditambah lagi dengan
kesibukan-kesibukan guru di luar tugas pokoknya sebagai pengajar.
C. Pendekatan Evaluasi
Pendekatan merupakan sudut pandang seseorang dalam mempelajari
sesuatu. Dengan demikian, pendekatan evaluasi merupakan sudut pandang seseorang
dalam menelaah atau mempelajari evaluasi. Dilihat dari komponen pembelajaran,
pendekatan evaluasi dapat dibagi dua, yaitu pendekatan tradisional dan
pendekatan sistem. Dilihat dari penafsiran hasil evaluasi, pendekatan evaluasi
dibagi menjadi dua, yaitu criterion-referenced evaluation dan norm-referenced
evaluation. Lihat gambar berikut ini.
Pendekatan
Gambar 2.3
Pendekatan Evaluasi
Pembelajaran
1. Pendekatan tradisional
Pendekatan
ini berorientasi kepada praktik evaluasi yang telah berjalan selama ini di
madrasah yang ditujukan kepada perkembangan aspek intelektual peserta didik.
Aspek-aspek keterampilan dan pengembangan sikap kurang mendapat perhatian yang
serius. Peserta didik hanya dituntut untuk menguasai mata pelajaran.
Kegiatan-kegiatan evaluasi juga lebih difokuskan kepada komponen produk saja,
sementara komponen proses cenderung diabaikan. Hasil kajian Spencer cukup
memberikan gambaran betapa pentingnya evaluasi pembelajaran. Ia mengemukakan
sejumlah isi pendidikan yang dapat dijadikan dasar pertimbangan untuk
merumuskan tujuan pendidikan secara komprehensif dan pada gilirannya menjadi
acuan dalam membuat perencanaan evaluasi. Namun demikian, tidak sedikit guru
mengalami kesulitan untuk mengembangkan sistem evaluasi di madrasah karena
bertentangan dengan tradisi yang selama ini sudah berjalan. Misalnya, ada
tradisi bahwa target kuantitas kelulusan setiap madrasah harus di atas 95 %,
begitu juga untuk kenaikan kelas. Ada juga tradisi bahwa dalam mata pelajaran
tertentu nilai peserta didik dalam buku rapot harus minimal enam. Seharusnya,
kebijakan evaluasi lebih menekankan kepada target kualitas yaitu kepentingan
dan kebermaknaan pendidikan bagi anak.
2. Pendekatan sistem
Sistem
adalah totalitas dari berbagai komponen yang saling berhubungan dan
ketergantungan. Jika pendekatan sistem dikaitkan dengan evaluasi, maka
pembahasan lebih difokuskan kepada komponen evaluasi, yang meliputi : komponen
kebutuhan dan feasibility, komponen input, komponen proses, dan komponen
produk. Dalam bahasa Stufflebeam disingkat CIPP, yaitu context, input,
process dan pruduct. Komponen-komponen ini harus menjadi landasan
pertimbangan dalam evaluasi pembelajaran secara sistematis. Berbeda dengan
pendekatan tradisional yang hanya menyentuh komponen produk saja, yaitu
perubahan perilaku apa yang terjadi pada peserta didik setelah mengikuti proses
pembelajaran. Pendekatan ini tentu tidak salah, hanya tidak sistematis. Padahal,
Anda juga tahu bahwa hasil belajar tidak akan ada bila tidak melalui proses,
dan proses tidak bisa berjalan bila tidak ada masukan dan guru yang
melaksanakan.
Dalam literatur modern tentang evaluasi,
terdapat dua pendekatan yang dapat digunakan untuk menafsirkan hasil evaluasi,
yaitu penilaian acuan patokan (criterion-referenced evaluation) dan
penilaian acuan norma (norm-referenced evaluation). Artinya, setelah
Anda memperoleh skor mentah dari setiap peserta didik, maka langkah selanjutnya
adalah mengubah skor mentah menjadi nilai dengan menggunakan pendekatan
tertentu.
1. Penilaian Acuan Patokan (PAP)
Pendekatan
ini sering juga disebut penilaian norma absolut. Jika Anda ingin menggunakan
pendekatan ini, berarti Anda harus membandingkan hasil yang diperoleh peserta
didik dengan sebuah patokan atau kriteria yang secara absolut atau mutlak telah
ditetapkan oleh guru. Anda juga dapat menggunakan langkah-langkah tertentu
untuk menggunakan PAP, seperti menentukan skor ideal, mencari rata-rata dan
simpangan baku ideal, kemudian menggunakan pedoman konversi skala nilai.
Pendekatan ini cocok digunakan dalam evaluasi atau penilaian formatif yang
berfungsi untuk perbaikan proses pembelajaran. Umumnya, seorang guru yang
menggunakan PAP sudah dapat menyusun pedoman konversi skor menjadi skor standar
sebelum kegiatan evaluasi dimulai. Oleh sebab itu, hasil pengukuran dari waktu
ke waktu dalam kelompok yang sama atau berbeda dapat dipertahankan keajegannya.
PAP dapat menggambarkan prestasi belajar peserta didik secara objektif apabila
alat ukur yang digunakan adalah alat ukur yang standar.
2. Penilaian Acuan Norma (PAN)
Salah satu perbedaan PAP dengan PAN adalah penggunaan tolak ukur
hasil/skor sebagai pembanding. Pendekatan ini membandingkan skor setiap peserta
didik dengan teman satu kelasnya. Makna nilai dalam bentuk angka maupun
kualifikasi memiliki sifat relatif. Artinya, jika Anda sudah menyusun pedoman
konversi skor untuk suatu kelompok, maka pedoman itu hanya berlaku untuk
kelompok itu saja dan tidak berlaku untuk kelompok yang lain, karena distribusi
skor peserta didik sudah berbeda. Untuk memahami kedua pendekatan evaluasi atau
penilaian tersebut di atas, silahkan Anda membaca modul berikutnya.
Sangat membantu guna menambah wawasan pengetahuan para pendidik agar lebih baik
BalasHapusmakasih ya. kalau disertakan jg buku sumber keren ni
BalasHapusTerima kasih
BalasHapus