Jumat, 26 Februari 2016

KARAKTERISTIK, MODEL DAN PENDEKATAN EVALUASI PEMBELAJARAN



Dalam proses evaluasi pembelajaran atau penilaian proses dan hasil belajar, Anda tentu sering menggunakan alat ukur tertentu, baik tes maupun non-tes. Alat ukur ini mempunyai fungsi dan peran yang sangat penting dalam rangka mengetahui keefektifan proses pembelajaran di madrasah. Mengingat begitu pentingnya suatu alat ukur dalam kegiatan evaluasi pembelajaran, maka suatu alat ukur harus memiliki syarat-syarat tertentu sekaligus merupakan karakteristik alat ukur yang baik. Dalam praktik di madrasah, seringkali guru membuat alat ukur tanpa mengikuti aturan-aturan tertentu. Ada guru yang membuat alat ukur (seperti soal-soal ulangan atau ujian akhir semester) yang langsung mengambil dari buku sumber. Padahal kita tahu banyak buku sumber yang tidak sesuai dengan silabus yang telah ditetapkan. Apa jadinya bila soal yang digunakan tidak sesuai dengan materi yang disampaikan. Ada juga guru yang menggunakan soal-soal lama yang belum diketahui kualitasnya. Hal ini semua sebagai akibat dari kekurangpahaman guru terhadap suatu alat ukur yang baik. Di samping itu, untuk melengkapi pengetahuan Anda tentang evaluasi, maka akan dikemukakan juga beberapa model dan pendekatan evaluasi.
Setelah mempelajari kegiatan belajar 2 ini, Anda diharapkan dapat :
1. Menjelaskan pengertian valid.
2. Menjelaskan pengertian deskriminatif.
3. Menyebutkan ciri-ciri evaluasi yang baik.
4. Menjelaskan model evaluasi black box.
5. Menyebutkan alat evaluasi yang digunakan dalam model pengukuran.
6. Menjelaskan konsep educational system model.
7. Menyebutkan tiga langkah pokok model evaluasi iluminatif.
8. Menjelaskan konsep penilaian acuan patokan.
9. Menyebutkan jenis penilaian yang cocok untuk PAP.
10.Menjelaskan konsep penilaian acuan norma.

A. Karakteristik Alat Ukur yang Baik
Evaluasi sangat berguna untuk meningkatkan kualitas proses dan hasil pembelajaran. Pentingnya evaluasi dalam pembelajaran, dapat dilihat dari tujuan dan fungsi evaluasi maupun sistem pembelajaran itu sendiri. Evaluasi tidak dapat dipisahkan dari pembelajaran, sehingga guru mau tidak mau harus melakukan evaluasi pembelajaran. Melalui evaluasi, Anda dapat melihat tingkat kemampuan peserta didik, baik secara kelompok maupun individual. Anda juga dapat melihat berbagai perkembangan hasil belajar peserta ddik, baik yang yang menyangkut domain kognitif, afektif maupun psikomotor. Pada akhirnya, guru akan memperoleh gambaran tentang keefektifan proses pembelajaran. Setelah Anda memahami pentingnya evaluasi dalam kegiatan pembelajaran di madrasah, tentunya Anda juga perlu tahu apa karakteristik dari alat ukur yang baik.
Pemahaman tentang alat ukur ini menjadi penting karena dalam praktik evaluasi atau penilaian di madrasah, pada umumnya guru melakukan proses pengukuran. Dalam pengukuran tentu harus ada alat ukur (instrumen), baik yang berbentuk tes maupun nontes. Alat ukur tersebut ada yang baik, ada pula yang kurang baik. Alat ukur yang baik adalah alat ukur yang memenuhi syarat-syarat atau kaidah-kaidah tertentu, dapat memberikan data yang akurat sesuai dengan fungsinya, dan hanya mengukur sampel prilaku tertentu. Secara sederhana, Zainal Arifin (2011 : 69) mengemukakan karakteristik instrumen evaluasi yang baik adalah “valid, reliabel, relevan, representatif, praktis, deskriminatif, spesifik dan proporsional”.
1. Valid, artinya suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa yang hendak diukur secara tepat. Misalnya, alat ukur matapelajaran Ilmu Fiqih, maka alat ukur tersebut harus betul-betul dan hanya mengukur kemampuan peserta didik dalam mempelajari Ilmu Fiqih, tidak boleh dicampuradukkan dengan materi pelajaran yang lain. Validitas suatu alat ukur dapat ditinjau dari berbagai segi, antara lain validitas ramalan (predictive validity), validitas bandingan (concurent validity), dan validitas isi (content validity), validitas konstruk (construct validity), dan lain-lain. Penjelasan tentang validitas ini dapat Anda baca uraian modul berikutnya.
2. Reliabel, artinya suatu alat ukur dapat dikatakan reliabel atau handal jika ia mempunyai hasil yang taat asas (consistent). Misalnya, suatu alat ukur diberikan kepada sekelompok peserta didik saat ini, kemudian diberikan lagi kepada sekelompok peserta didik yang sama pada saat yang akan datang, dan ternyata hasilnya sama atau mendekati sama, maka dapat dikatakan alat ukur tersebut mempunyai tingkat reliabilitas yang tinggi.
3. Relevan, artinya alat ukur yang digunakan harus sesuai dengan standar kompetensi, kompetensi dasar, dan indikator yang telah ditetapkan. Alatukur juga harus sesuai dengan domain hasil belajar, seperti domain kognitif, afektif, dan psikomotor. Jangan sampai ingin mengukur domain kognitif menggunakan alat ukur non-tes. Hal ini tentu tidak relevan.
4. Representatif, artinya materi alat ukur harus betul-betul mewakili dari seluruh materi yang disampaikan. Hal ini dapat dilakukan bila guru menggunakan silabus sebagai acuan pemilihan materi tes. Guru juga harus memperhatikan proses seleksi materi, mana materi yang bersifat aplikatif dan mana yang tidak, mana yang penting dan mana yang tidak.
5. Praktis, artinya mudah digunakan. Jika alat ukur itu sudah memenuhi syarat tetapi sukar digunakan, berarti tidak praktis. Kepraktisan ini bukan hanya dilihat dari pembuat alat ukur (guru), tetapi juga bagi orang lain yang ingin menggunakan alat ukur tersebut.
6. Deskriminatif, artinya adalah alat ukur itu harus disusun sedemikian rupa, sehingga dapat menunjukkan perbedaan-perbedaan yang sekecil apapun. Semakin baik suatu alat ukur, maka semakin mampu alat ukur tersebut menunjukkan perbedaan secara teliti. Untuk mengetahui apakah suatu alat ukur cukup deskriminatif atau tidak, biasanya didasarkan atas uji daya pembeda alat ukur tersebut.
7. Spesifik, artinya suatu alat ukur disusun dan digunakan khusus untuk objek yang diukur. Jika alat ukur tersebut menggunakan tes, maka jawaban tes jangan menimbulkan ambivalensi atau spekulasi.
Karakteristik Alat Ukur Yang Baik
8. Proporsional, artinya suatu alat ukur harus memiliki tingkat kesulitan yang proporsional antara sulit, sedang dan mudah. Begitu juga ketika menentukan jenis alat ukur, baik tes maupun non-tes.

Reliabel
Deskriminatif
Valid
Relevan
Praktis
Spesifik
Proporsional
Representatif
 













Gambar 2.2
Karakteristik Alat Ukur Yang Baik

Dalam buku Succesful Teaching karangan J.Mursell yang diterjemahkan ke dalam bahasa Indonesia oleh J. Mursell dan S.Nasution (tanpa tahun : 23) dikemukakan bahwa ciri-ciri evaluasi yang baik adalah “evaluasi dan hasil langsung, evaluasi dan transfer, dan evaluasi langsung dari proses belajar”.
1. Evaluasi dan hasil Langsung.
Dalam proses pembelajaran, guru sering melakukan kegiatan evaluasi, baik ketika proses pembelajaran sedang berlangsung maupun ketika sesudah proses pembelajaran selesai. Jika evaluasi diadakan ketika proses pembelajaran sedang berlangsung, maka guru ingin mengetahui keefektifan dan kesesuaian strategi pembelajaran dengan tujuan yang ingin dicapai. Jika evaluasi dilakukan sesudah proses pembelajaran selesai, berarti guru ingin mengetahui hasil atau prestasi belajar yang diperoleh peserta didik.
2. Evaluasi dan transfer.
Hal penting yang berkenaan dengan proses belajar adalah kemungkinan mentransfer hasil yang dipelajari ke dalam situasi yang fungsional. Dasar pemikiran ini merupakan asas psikologis yang logis dan rasional. Peserta didik tidak dapat disebut telah menguasai ilmu tajwid (misalnya), jika ia belum dapat menggunakannya dalam membaca Al-Qur’an. Apabila suatu hasil belajar tidak dapat ditransfer dan hanya dapat digunakan dalam satu situasi tertentu saja, maka hasil belajar itu disebut hasil belajar palsu. Sebaliknya, jika suatu hasil belajar dapat ditransfer kepada penggunaan yang aktual, maka hasil belajar itu disebut hasil belajar otentik. Jadi, evaluasi yang baik harus mengukur hasil belajar yang otentik dan kemungkinan dapat ditransfer.
Dalam penelitian sering ditemui hasil-hasil pembelajaran yang dicapai tampaknya baik, tetapi sebenarnya hasil itu palsu. Peserta didik dapat mengucapkan kata-kata yang dihafalkan dari buku pelajarannya, tetapi mereka tidak dapat menggunakannya dalam situasi baru. Penguasaan materi pelajaran seperti ini tidak lebih dari “penguasaan beo”. Evaluasi yang menekankan pada hasil-hasil palsu, baik untuk informasi bagi peserta didik maupun untuk tujuan lain, berarti evaluasi itu palsu. Jika peserta didik hanya memiliki pengetahuan yang bersifat informatif, belum tentu menjamin pemahaman dan pengertiannya. Oleh karena itu, penekanan pada pengetahuan yang bersifat informatif tidak akan menghasilkan pola berpikir yang baik. Ada dua sebab mengapa hasil pembelajaran yang mengakibatkan dan berhubungan dengan proses transfer menjadi penting artinya dalam proses evaluasi. Pertama, hasil-hasil itu menyatakan secara khusus dan sejelas-jelasnya kepada guru mengenai apa yang sebenarnya terjadi ataupun tidak terjadi, dan sampai dimana pula telah tercapai hasil belajar yang penuh makna serta otentik sifatnya. Kedua, hasil belajar sangat erat hubungannya dengan tujuan peserta didik belajar, sehingga mempunyai efek yang sangatkuat terhadap pembentukan pola dan karakter belajar yang dilakukan peserta didik. Oleh karena itu, belajar hendaknya dilakukan untuk mendapatkan hasil-hasil yang dapat ditransfer dan setiap waktu dapat digunakan menurut keperluannya.
3. Evaluasi langsung dari proses belajar.
Di samping harus mengetahui hasil belajar, Anda juga harus menilai proses belajar. Hal ini dimaksudkan agar proses belajar dapat diorganisasi sedemikian rupa, sehingga dapat mencapai hasil yang optimal. Anda dapat mengetahui proses apa yang dilalui peserta didik dalam mempelajari sesuatu. Misalnya, apakah peserta didik dalam mempelajari Al-Qur’an cukup sekedar membaca beberapa ayat Al-Qur’an ataukah ia membaca seluruh ayat Al-Qur’an untuk memahami dan memecahkan masalah-masalah kehidupan. Apakah dalam praktik ibadah, peserta didik cukup hanya melatih gerakan-gerakan sholat atau menganalisis praktik sholat dan mencari hubungannya dengan tingkah laku sehari-hari, mendiskusikan manfaat sholat dengan teman-temannya, dan mencari situasi-situasi yang nyata yang dapat menggunakan fungsi sholat itu.
Penelitian tentang proses belajar yang diikuti oleh peserta didik merupakan suatu hal yang sangat penting. Anda akan mengetahui dimana letak kesulitan peserta didik, kemudian mencari alternatif bagaimana mengatasi kesulitan tersebut. Di samping itu, penelitian tentang proses belajar bermanfaat juga bagi peserta didik itu sendiri. Peserta didik akan melihat kelemahannya, kemudian berusaha memperbaikinya, dan akhirnya dapat mempertinggi hasil belajarnya. Meneliti proses belajar seorang anak bukan pekerjaan yang mudah. Hal ini memerlukan waktu, tenaga, pemikiran, dan pengalaman. Anda dapat menggunakan suatu metode untuk menilai proses belajar dengan memperhatikan prinsip konteks, vokalisasi, sosialisasi, individualisasi, dan urutan (squence).
Seorang peserta didik tidak dapat belajar dengan baik, karena ia tidak menggunakan konteks yang baik. Ia tidak menggunakan bermacam-macam sumber dan tidak menggunakan situasi-situasi yang konkrit. Peserta didik tidak dapat belajar dengan baik, karena tidak mempunyai fokus tertentu, misalnya tidak melihat masalah-masalah pokok yang harus dipecahkannya, atau mungkin pula tidak sesuai dengan bakat dan minatnya (individualisasi) serta tidak mendiskusikannya dengan orang lain (sosialisasi). Dalam evaluasi pembelajaran, Anda jangan terfokus kepada hasil belajar saja, tetapi juga harus memperhatikan transfer hasil belajar dan proses belajar yang dijalani oleh peserta didik.

B. Model-model Evaluasi
Pada tahun 1949, Tyler pernah mengemukakan model evaluasi black box. Model ini banyak digunakan oleh orang-orang yang melakukan kegiatan evaluasi. Studi tentang evaluasi belum begitu menarik perhatian orang banyak, karena kurang memiliki nilai praktis. Baru sekitar tahun 1960-an studi evaluasi mulai berdiri sendiri menjadi salah satu program studi di perguruan tinggi, tidak hanya di jenjang sarjana (S.1) dan magister (S.2) tetapi juga pada jenjang doktor (S.3). Sekitar tahun 1972, model evaluasi mulai berkembang. Taylor dan Cowley, misalnya, berhasil mengumpulkan berbagai pemikiran tentang model evaluasi dan menerbitkannya dalam suatu buku. Model evaluasi yang dikembangkan lebih banyak menggunakan pendekatan positivisme yang berakar pada teori psikometrik. Dalam model tersebut, pengukuran dan tes masih sangat dominan, sekalipun tidak lagi diidentikkan dengan evaluasi. Penggunaan disain eksperimen seperti yang dikemukakan Campbell dan Stanley (1963) menjadi ciri utama dari model evaluasi. Berkembangnya model evaluasi pada tahun 70-an tersebut diawali dengan adanya pandangan alternatif dari para expert. Pandangan alternatif yang dilandasi sebuah paradigma fenomenologi banyak menampilkan model evaluasi.
Dari sekian banyak model-model evaluasi yang dikemukakan, tes dan pengukuran tidak lagi menempati posisi yang menentukan. Penggunaannya hanya untuk tujuan-tujuan tertentu saja, bukan lagi menjadi suatu keharusan, seperti ketika model pertama ditampilkan. Tes dan pengukuran tidak lagi menjadi parameter kualitas suatu studi evaluasi yang dilakukan. Perkembangan lain yang menarik dalam model evaluasi ini adalah adanya suatu upaya untuk bersikap eklektik dalam penggunaan pendekatan positivisme maupun fenomenologi yang oleh Patton (1980) disebut paradigm of choice. Walaupun usaha ini tidak melahirkan model dalam pengertian terbatas tetapi memberikan alternatif baru dalam melakukan evaluasi.
Dalam studi tentang evaluasi, banyak sekali dijumpai model-model evaluasi dengan format atau sistematika yang berbeda, sekalipun dalam beberapa model ada juga yang sama. Misalnya saja, Said Hamid Hasan (2009) mengelompokkan model evaluasi sebagai berikut :
1. Model evaluasi kuantitatif, yang meliputi : model Tyler, model teoritik Taylor dan Maguire, model pendekatan sistem Alkin, model Countenance Stake, model CIPP, model ekonomi mikro.
2. Model evaluasi kualitatif, yang meliputi : model studi kasus, model iluminatif, dan model responsif
Sementara itu, Kaufman dan Thomas dalam Suharsimi Arikunto dan Cepi Safruddin membedakan model evaluasi menjadi delapan, yaitu :
1. Goal Oriented Evaluation Model, dikembangkan oleh Tyler.
2. Goal Free Evaluation Model, dikembangkan oleh Scriven.
3. Formatif Sumatif Evaluation Model, dikembangkan oleh Michael Scriven
4. Countenance Evaluation Model, dikembangkan oleh Stake.
5. Responsive Evaluation Model, dikembangkan oleh Stake.
6. CSE-UCLA Evaluation Model, menekankan pada “kapan” evaluasi dilakukan.
7. CIPP Evaluation Model, yang dikembangkan oleh Stufflebeam.
8. Discrepancy Model, yang dikembangkan oleh Provus.
Ada juga model evaluasi yang dikelompokkan Nana Sudjana dan R.Ibrahim (2007 : 234) yang membagi model evaluasi menjadi empat model utama, yaitu “measurement, congruence, educational system, dan illumination”. Dari beberapa model evaluasi di atas, beberapa diantaranya akan dikemukakan secara singkat sebagai berikut :

1. Model Tyler
Nama model ini diambil dari nama pengembangnya yaitu Tyler. Dalam buku Basic Principles of Curriculum and Instruction, Tyler banyak mengemukakan ide dan gagasannya tentang evaluasi. Salah satu bab dari buku tersebut diberinya judul how can the the effectiveness of learning experience be evaluated ? Model ini dibangun atas dua dasar pemikiran. Pertama, evaluasi ditujukan kepada tingkah laku peserta didik. Kedua, evaluasi harus dilakukan pada tingkah laku awal peserta didik sebelum melaksanakan kegiatan pembelajaran dan sesudah melaksanakan kegiatan pembelajaran (hasil). Dasar pemikiran yang kedua ini menunjukkan bahwa seorang evaluator harus dapat menentukan perubahan tingkah laku apa yang terjadi setelah peserta didik mengikuti pengalaman belajar tertentu, dan menegaskan bahwa perubahan yang terjadi merupakan perubahan yang disebabkan oleh pembelajaran.
Penggunaan model Tyler memerlukan informasi perubahan tingkah laku terutama pada saat sebelum dan sesudah terjadinya pembelajaran. Istilah yang populer dikalangan guru adalah tes awal (pre-test) dan tes akhir (post-test). Model ini mensyaratkan validitas informasi pada tes akhir. Untuk menjamin validitas ini maka perlu adanya kontrol dengan menggunakan disain eksperimen. Model Tyler disebut juga model black box karena model ini sangat menekankan adanya tes awal dan tes akhir. Dengan demikian, apa yang terjadi dalam proses tidak perlu diperhatikan. Dimensi proses ini dianggap sebagai kotak hitam yang menyimpan segala macam teka-teki.
Menurut Tyler, ada tiga langkah pokok yang harus dilakukan, yaitu :
a. Menentukan tujuan pembelajaran yang akan dievaluasi.
b. Menentukan situasi dimana peserta didik memperoleh kesempatan untuk menunjukkan tingkah laku yang berhubungan dengan tujuan.
c. Menentukan alat evaluasi yang akan dipergunakan untuk mengukur tingkah laku peserta didik.
2. Model yang Berorientasi pada Tujuan
Sebelum KBK 2004, Anda mungkin pernah mengenal adanya tujuan pembelajaran umum dan tujuan pembelajaran khusus. Model evaluasi ini menggunakan kedua tujuan tersebut sebagai kriteria untuk menentukan keberhasilan. Evaluasi diartikan sebagai proses pengukuran hinggamana tujuan pembelajaran telah tercapai. Model ini banyak digunakan oleh guru-guru karena dianggap lebih praktis untuk menentukan hasil yang diinginkan dengan rumusan yang dapat diukur. Dengan demikian, terdapat hubungan yang logis antara kegiatan, hasil dan prosedur pengukuran hasil. Tujuan model ini adalah membantu Anda merumuskan tujuan dan menjelaskan hubungan antara tujuan dengan kegiatan. Jika rumusan tujuan pembelajaran dapat diobservasi (observable) dan dapat diukur (measurable), maka kegiatan evaluasi pembelajaran akan menjadi lebih praktis dan simpel.
Model ini dapat membantu Anda menjelaskan rencana pelaksanaan pembelajaran dengan proses pencapaian tujuan. Instrumen yang digunakan bergantung kepada tujuan yang ingin diukur. Hasil evaluasi akan menggambarkan tingkat keberhasilan tujuan program pembelajaran berdasarkan kriteria program khusus. Kelebihan model ini terletak pada hubungan antara tujuan dengan kegiatan dan menekankan pada peserta didik sebagai aspek penting dalam program pembelajaran. Kekurangannya adalah memungkinkan terjadinya proses evaluasi melebihi konsekuensi yang tidak diharapkan.
3. Model Pengukuran
Model pengukuran (measurement model) banyak mengemukakan pemikiran-pemikiran dari R.Thorndike dan R.L.Ebel. Sesuai dengan namanya, model ini sangat menitikberatkan pada kegiatan pengukuran. Pengukuran digunakan untuk menentukan kuantitas suatu sifat (atribute) tertentu yang dimiliki oleh objek, orang maupun peristiwa, dalam bentuk unit ukuran tertentu. Anda dapat menggunakan model ini untuk mengungkap perbedaan-perbedaan individual maupun kelompok dalam hal kemampuan, minat dan sikap. Hasil evaluasi digunakan untuk keperluan seleksi peserta didik, bimbingan, dan perencanaan pendidikan. Objek evaluasi dalam model ini adalah tingkah laku peserta didik, mencakup hasil belajar (kognitif), pembawaan, sikap, minat, bakat, dan juga aspek-aspek kepribadian peserta didik. Untuk itu, instrumen yang digunakan pada umumnya adalah tes tertulis (paper and pencil test) dalam bentuk tes objektif, yang cenderung dibakukan. Oleh sebab itu, dalam menganalisis soal sangat memperhatikan difficulty index dan index of discrimination. Model ini menggunakan pendekatan Penilaian Acuan Norma (norm-referenced assessment).
4. Model Kesesuain (Ralph W.Tyler, John B.Carrol, and Lee J.Cronbach)
Menurut model ini, evaluasi adalah suatu kegiatan untuk melihat kesesuaian (congruence) antara tujuan dengan hasil belajar yang telah dicapai. Hasil evaluasi dapat Anda gunakan untuk menyempurnakan sistem bimbingan peserta didik dan untuk memberikan informasi kepada pihak-pihak yang memerlukan. Objek evaluasi adalah tingkah laku peserta didik, yaitu perubahan tingkah laku yang diinginkan (intended behaviour) pada akhir kegiatan pendidikan, baik yang menyangkut aspek kognitif, afektif maupun psikomotor. Teknik evaluasi yang dapat Anda gunakan tidak hanya tes (tulisan, lisan, dan perbuatan), tetapi juga non-tes (observasi, wawancara, skala sikap, dan sebagainya). Model evaluasi ini memerlukan informasi perubahan tingkah laku pada dua tahap, yaitu sebelum dan sesudah kegiatan pembelajaran. Berdasarkan konsep ini, Anda perlu melakukan pre and post-test. Adapun langkah-langkah yang harus ditempuh dalam model evaluasi ini adalah merumuskan tujuan tingkah laku (behavioural objectives), menentukan situasi dimana peserta didik dapat memperlihatkan tingkah laku yang akan dievaluasi, menyusun alat evaluasi, dan menggunakan hasil evaluasi. Oleh sebab itu, model ini menekankan pada pendekatan penilaian acuan patokan (PAP).
5. Educational System Evaluation Model (Daniel L.Stufflebeam, Michael Scriven, Robert E.Stake, dan Malcolm M.Provus)
Menurut model ini, evaluasi berarti membandingkan performance dari berbagai dimensi (tidak hanya dimensi hasil saja) dengan sejumlah kriteria, baik yang bersifat mutlak/interen maupun relatif/eksteren. Model yang menekankan sistem sebagai suatu keseluruhan ini sebenarnya merupakan penggabungan dari beberapa model, sehingga objek evaluasinyapun diambil dari beberapa model, yaitu (1) model countenance dari Stake, yang meliputi : keadaan sebelum kegiatan pembelajaran berlangsung (antecedents), kegiatan yang terjadi dan saling mempengaruhi (transactions), hasil yang diperoleh (outcomes), (2) model CIPP dari Stufflebeam, yang meliputi Context, Input, Process, dan Product, (3) model Scriven yang meliputi instrumental evaluation and consequential evaluation, (4) model Provus yang meliputi : design, operation program, interim products, dan terminal products. Dari keempat model yangtergabung dalam educational system model, akan dijelaskan secara singkat tentang dua model, yaitu model countenance dan model CIPP.
Model Stake menitikberatkan evaluasi pada dua hal pokok, yaitu description dan judgement. Setiap hal tersebut terdiri atas tiga dimensi, seperti telah dijelaskan di atas, yaitu antecedents (context), transaction (process), dan outcomes (output). Description terdiri atas dua aspek, yaitu intents (goals) dan observation (effects) atau yang sebenarnya terjadi. Sedangkan judgement terdiri atas dua aspek, yaitu standard dan judgement. Dalam model ini, evaluasi dilakukan dengan membandingkan antara satu program dengan program lain yang dianggap standar. Stake mengatakan description berbeda dengan judgement atau menilai. Dalam ketiga dimensi di atas (antecedents, transaction, outcomes), perbandingan data tidak hanya untuk menentukan apakah ada perbedaan tujuan dengan keadaan yang sebenarnya tetapi juga dibandingkan dengan standar yang absolut untuk menilai manfaat program. Menurut Stake, suatu hasil penelitian tidak dapat diandalkan jika tidak dilakukan evaluasi.
Model CIPP berorientasi kepada suatu keputusan (a decision oriented evaluation approach structured). Tujuannya membantu kepala madrasah dan guru di dalam membuat keputusan. Evaluasi diartikan sebagai suatu proses menggambarkan, memperoleh dan menyediakan informasi yang berguna untuk menilai alternatif keputusan. Sesuai dengan nama modelnya, model ini membagi empat jenis kegiatan evaluasi, yaitu :
a. Context evaluation to serve planning decision, yaitu konteks evaluasi untuk membantu merencanakan keputusan, menentukan kebutuhan yang akan dicapai oleh program pembelajaran, dan merumuskan tujuan program pembelajaran.
b. Input evaluation, structuring decision. Kegiatan evaluasi bertujuan untuk membantu mengatur keputusan, menentukan sumber-sumber yang ada, alternatif apa yang akan diambil, apa rencana dan strategi untuk mencapai tujuan, dan bagaimana prosedur kerja untuk mencapainya.
c. Process evaluation, to serve implementing decision. Kegiatan evaluasi ini bertujuan untuk membantu melaksanakan keputusan. Pertanyaan yang harus Anda jawab adalah hinggamana suatu rencana telah dilaksanakan, apakah rencana tersebut sesuai dengan prosedur kerja, dan apa yang harus diperbaiki.
d. Product evaluation, to serve recycling decision. Kegiatan evaluasi ini bertujuan untuk membantu keputusan selanjutnya. Pertanyaan yang harus Anda jawab adalah hasil apa yang telah dicapai dan apa yang dilakukan setelah program berjalan.
Proses evaluasi tidak hanya berakhir dengan suatu deskripsi mengenai keadaan sistem yang bersangkutan, tetapi harus sampai pada judgment sebagai simpulan dari hasil evaluasi. Model ini menuntut agar hasil evaluasi digunakan sebagai input untuk decision making dalam rangka penyempurnaan sistem secara keseluruhan. Pendekatan yang digunakan adalah penilaian acuan norma (PAN) dan penilaian acuan patokan (PAP).
6. Illuminative Model (Malcolm Parlett dan Hamilton)
Jika model measurement dan congruence lebih berorientasi pada evaluasi kuantitatif-terstruktur, maka model ini lebih menekankan pada evaluasi kualitatif-terbuka (open-ended). Kegiatan evaluasi dihubungkan dengan learning milieu, dalam konteks madrasah sebagai lingkungan material dan psiko-sosial, dimana guru dan peserta didik dapat berinteraksi. Tujuan evaluasi adalah untuk mempelajari secara cermat dan hati-hati terhadap pelaksanaan sistem pembelajaran, faktor-faktor yang mempengaruhinya, kelebihan dan kekurangan sistem, dan pengaruh sistem terhadap pengalaman belajar peserta didik. Hasil evaluasi lebih bersifat deskriptif dan interpretasi, bukan pengukuran dan prediksi. Model ini lebih banyak menggunakan judgment. Fungsi evaluasi adalah sebagai input untuk kepentingan pengambilan keputusan dalam rangka penyesuaian dan penyempurnaan sistem pembelajaran yang sedang dikembangkan.
Objek evaluasi model ini mencakup latar belakang dan perkembangan sistem pembelajaran, proses pelaksanaan sistem pembelajaran, hasil belajar peserta didik, kesukaran-kesukaran yang dialami dari perencanaan sampai dengan pelaksanaan, termasuk efek samping dari sistem pembelajaran itu sendiri. Pendekatan yang digunakan lebih menyerupai pendekatan yang diterapkan dalam bidang antropologi sosial, psikiatri, dan sosiologi. Cara-cara yang digunakan tidak bersifat standard, melainkan bersifat fleksibel dan selektif. Berdasarkan tujuan dan pendekatan evaluasi dalam model ini, maka ada tiga fase evaluasi yang harus Anda tempuh, yaitu : observe, inquiry further, dan seek to explain.
7. Model Responsif
Sebagaimana model illuminatif, model ini juga menekankan pada pendekatan kualitatif-naturalistik. Evaluasi tidak diartikan sebagai pengukuran melainkan pemberian makna atau melukiskan sebuah realitas dari berbagai perspektif orang-orang yang terlibat, berminat dan berkepentingan dengan program pembelajaran. Tujuan evaluasi adalah untuk memahami semua komponen program pembelajaran melalui berbagai sudut pandangan yang berbeda. Sesuai dengan pendekatan yang digunakan, maka model ini kurang percaya terhadap hal-hal yang bersifat kuantitatif. Instrumen yang digunakan pada umumnya mengandalkan observasi langsung maupun tak langsungdengan interpretasi data yang impresionistik. Langkah-langkah kegiatan evaluasi meliputi observasi, merekam hasil wawancara, mengumpulkan data, mengecek pengetahuan awal (preliminary understanding) peserta didik dan mengembangkan disain atau model. Berdasarkan langkah-langkah ini, evaluator mencoba responsif terhadap orang-orang yang berkepentingan pada hasil evaluasi. Hal yang penting dalam model responsif adalah pengumpulan dan sintesis data.
Kelebihan model ini adalah peka terhadap berbagai pandangan dan kemampuannya mengakomodasi pendapat yang ambigius serta tidak fokus. Sedangkan kekurangannya antara lain (1) pembuat keputusan sulit menentukan prioritas atau penyederhanaan informasi (2) tidak mungkin menampung semua sudut pandangan dari berbagai kelompok (3) membutuhkan waktu dan tenaga. Evaluator harus dapat beradaptasi dengan lingkungan yang diamati. Untuk mempelajari lebih jauh tentang model ini, silahkan Anda membaca buku Stake (1975) atau Lincoln dan Guba (1985).
Setelah Anda mempelajari berbagai model evaluasi, model mana yang akan digunakan dalam pembelajaran ? Jawabannya tentu sangat bergantung kepada tujuan evaluasi yang ditetapkan. Namun demikian, perlu juga Anda pahami bahwa keberhasilan suatu evaluasi pembelajaran secara keseluruhan bukan hanya dipengaruhi penggunaan yang tepat pada sebuah model evaluasi melainkan juga dipengaruhi oleh berbagai faktor. Pertama, tujuan pembelajaran, baik tujuan pembelajaran umum maupun tujuan pembelajaran khusus (instructional objective). Seringkali kedua tujuan pembelajaran ini saling bertentangan satu sama lain dilihat dari kebutuhan madrasah, kurikulum, guru, peserta didik, lingkungan, dan sebagainya. Bahkan, kadang-kadang guru sendiri mempunyai tujuan sendiri-sendiri. Semuanya harus dipertimbangkan agar terdapat keseimbangan dan keserasian.
Kedua, sistem madrasah. Faktor ini perlu dipertimbangkan dengan matang dan hati-hati karena melibatkan berbagai komponen yang saling berinteraksi dan ketergantungan. Mengingat kompleksnya sistem madrasah, maka fungsi madrasah juga menjadi ganda. Di satu pihak, madrasah ingin mewariskan kebudayaan masa lampau dengan sistem norma, nilai dan adat yang dianggap terbaik untuk generasi muda. Di pihak lain, madrasah berkewajiban mempersiapkan peserta didik menghadapi masa depan, memperoleh keterampilan dan kemampuan untuk berinovasi, bahkan menghasilkan perubahan. Jadi, madrasah sekaligus bersikap konservatif-radikal serta reaksioner-progresif. Oleh sebab itu, peranan evaluasi menjadi sangat penting. Tujuannya adalah untuk melihat dan mempertimbangkan hal-hal apa yang perlu diberikan di madrasah. Begitu juga bentuk kurikulum dan silabus mata pelajaran sangat bergantung pada evaluasi yang dilaksanakanoleh guru-guru di madrasah, sehingga timbul masalah lainnya yaitu teknik evaluasi apa yang akan digunakan untuk mencapai tujuan itu.
Ketiga, pembinaan guru. Banyak program pembinaan guru yang belum menyentuh secara langsung tentang evaluasi. Program pembinaan guru lebih banyak difokuskan kepada pengembangan kurikulum dan metodologi pembelajaran. Hal ini pula yang menyebabkan perbaikan sistem evaluasi pembelajaran menjadi kurang efektif. Guru juga sering dihadapkan dengan beragam kegiatan, seperti membuat persiapan mengajar, mengikuti kegiatan ekstra kurikuler, penyesuaian diri, dan kegiatan administratif lainnya. Artinya, bagaimana mungkin kualitas sistem evaluasi pembelajaran di madrasah dapat ditingkatkan, bila fokus pembinaan guru hanya menyentuh domain-domain tertentu saja, ditambah lagi dengan kesibukan-kesibukan guru di luar tugas pokoknya sebagai pengajar.
C. Pendekatan Evaluasi
Pendekatan merupakan sudut pandang seseorang dalam mempelajari sesuatu. Dengan demikian, pendekatan evaluasi merupakan sudut pandang seseorang dalam menelaah atau mempelajari evaluasi. Dilihat dari komponen pembelajaran, pendekatan evaluasi dapat dibagi dua, yaitu pendekatan tradisional dan pendekatan sistem. Dilihat dari penafsiran hasil evaluasi, pendekatan evaluasi dibagi menjadi dua, yaitu criterion-referenced evaluation dan norm-referenced evaluation. Lihat gambar berikut ini.
Pendekatan Tradisional
Komponen Pembelajaran
Pendekatan Sistem
Pendekatan
Evaluasi Pembelajaran
Criterion-Referenced evaluation
Penafsiran Hasi Evaluasi
Norm-Referenced Evaluation

Gambar 2.3
Pendekatan Evaluasi Pembelajaran

1. Pendekatan tradisional
Pendekatan ini berorientasi kepada praktik evaluasi yang telah berjalan selama ini di madrasah yang ditujukan kepada perkembangan aspek intelektual peserta didik. Aspek-aspek keterampilan dan pengembangan sikap kurang mendapat perhatian yang serius. Peserta didik hanya dituntut untuk menguasai mata pelajaran. Kegiatan-kegiatan evaluasi juga lebih difokuskan kepada komponen produk saja, sementara komponen proses cenderung diabaikan. Hasil kajian Spencer cukup memberikan gambaran betapa pentingnya evaluasi pembelajaran. Ia mengemukakan sejumlah isi pendidikan yang dapat dijadikan dasar pertimbangan untuk merumuskan tujuan pendidikan secara komprehensif dan pada gilirannya menjadi acuan dalam membuat perencanaan evaluasi. Namun demikian, tidak sedikit guru mengalami kesulitan untuk mengembangkan sistem evaluasi di madrasah karena bertentangan dengan tradisi yang selama ini sudah berjalan. Misalnya, ada tradisi bahwa target kuantitas kelulusan setiap madrasah harus di atas 95 %, begitu juga untuk kenaikan kelas. Ada juga tradisi bahwa dalam mata pelajaran tertentu nilai peserta didik dalam buku rapot harus minimal enam. Seharusnya, kebijakan evaluasi lebih menekankan kepada target kualitas yaitu kepentingan dan kebermaknaan pendidikan bagi anak.
2. Pendekatan sistem
Sistem adalah totalitas dari berbagai komponen yang saling berhubungan dan ketergantungan. Jika pendekatan sistem dikaitkan dengan evaluasi, maka pembahasan lebih difokuskan kepada komponen evaluasi, yang meliputi : komponen kebutuhan dan feasibility, komponen input, komponen proses, dan komponen produk. Dalam bahasa Stufflebeam disingkat CIPP, yaitu context, input, process dan pruduct. Komponen-komponen ini harus menjadi landasan pertimbangan dalam evaluasi pembelajaran secara sistematis. Berbeda dengan pendekatan tradisional yang hanya menyentuh komponen produk saja, yaitu perubahan perilaku apa yang terjadi pada peserta didik setelah mengikuti proses pembelajaran. Pendekatan ini tentu tidak salah, hanya tidak sistematis. Padahal, Anda juga tahu bahwa hasil belajar tidak akan ada bila tidak melalui proses, dan proses tidak bisa berjalan bila tidak ada masukan dan guru yang melaksanakan.
Dalam literatur modern tentang evaluasi, terdapat dua pendekatan yang dapat digunakan untuk menafsirkan hasil evaluasi, yaitu penilaian acuan patokan (criterion-referenced evaluation) dan penilaian acuan norma (norm-referenced evaluation). Artinya, setelah Anda memperoleh skor mentah dari setiap peserta didik, maka langkah selanjutnya adalah mengubah skor mentah menjadi nilai dengan menggunakan pendekatan tertentu.
1. Penilaian Acuan Patokan (PAP)
Pendekatan ini sering juga disebut penilaian norma absolut. Jika Anda ingin menggunakan pendekatan ini, berarti Anda harus membandingkan hasil yang diperoleh peserta didik dengan sebuah patokan atau kriteria yang secara absolut atau mutlak telah ditetapkan oleh guru. Anda juga dapat menggunakan langkah-langkah tertentu untuk menggunakan PAP, seperti menentukan skor ideal, mencari rata-rata dan simpangan baku ideal, kemudian menggunakan pedoman konversi skala nilai. Pendekatan ini cocok digunakan dalam evaluasi atau penilaian formatif yang berfungsi untuk perbaikan proses pembelajaran. Umumnya, seorang guru yang menggunakan PAP sudah dapat menyusun pedoman konversi skor menjadi skor standar sebelum kegiatan evaluasi dimulai. Oleh sebab itu, hasil pengukuran dari waktu ke waktu dalam kelompok yang sama atau berbeda dapat dipertahankan keajegannya. PAP dapat menggambarkan prestasi belajar peserta didik secara objektif apabila alat ukur yang digunakan adalah alat ukur yang standar.
2. Penilaian Acuan Norma (PAN)

Salah satu perbedaan PAP dengan PAN adalah penggunaan tolak ukur hasil/skor sebagai pembanding. Pendekatan ini membandingkan skor setiap peserta didik dengan teman satu kelasnya. Makna nilai dalam bentuk angka maupun kualifikasi memiliki sifat relatif. Artinya, jika Anda sudah menyusun pedoman konversi skor untuk suatu kelompok, maka pedoman itu hanya berlaku untuk kelompok itu saja dan tidak berlaku untuk kelompok yang lain, karena distribusi skor peserta didik sudah berbeda. Untuk memahami kedua pendekatan evaluasi atau penilaian tersebut di atas, silahkan Anda membaca modul berikutnya.

3 komentar:

  1. Sangat membantu guna menambah wawasan pengetahuan para pendidik agar lebih baik

    BalasHapus
  2. makasih ya. kalau disertakan jg buku sumber keren ni

    BalasHapus