BAB I
PENDAHULUAN
1.1
Latar Belakang
Keberhasilan
pendidikan sangat ditentukan oleh proses pembelajaran. Untuk mengukur
keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis dari
evaluasi. Manfaat dari analisis evaluasi
untuk mengetahui kekuatan dan kelemahan pembelajaran dalam rangka meningkatkan
proses pembelajaran. Karena itu begitu
pentingnya guru mengadakan analisis butir soal dengan pengujian instrumen
penilaian yaitu validitas, reliabilitas, daya beda dan pola contoh soal.
Ada
tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu
terhadap guru, siswa dan prosedur pembelajaran.Fungsi analisis untuk guru
terutama untuk mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk
merevisi dan mengembangkan pembelajaran dan tes.
Bagi
siswa, analisis diharapkan berfungsi
mengetahui keberhasilan belajar, mendiagnosa mengoreksi kesalahan
belajar, serta Memotivasi siswa belajar lebih baik. Pada makalah ini akan
dibahas mengenai analisis soal berupa validitas, reliabilitas, daya beda dan
pola contoh soal yang berguna sebagai pedoman bagi pendidikan dalam melakukan
analisis soal terutama untuk soal objektif.
1.2
Rumusan Masalah
1.1.1.
Apa yang dimaksud dengan Pengujian Instrumen
Penilaian?
1.1.2.
Jelaskan jenis-jenis instrumen penilaian!
1.3
Tujuan
1.3.1
Menjelaskan pengertian dari Pengujian Instrumen
Penilaian.
1.3.2
Menjelaskan jenis-jenis instrumen penilaian.
BAB II
PEMBAHASAN
2.1 Pengertian Pengujian Instrumen Penilaian
Pengujian
merupakan bagian dari pengukuran yang dilanjutkan dengan penilaian.Instrumen
penilaian bisa berupa metode atau prosedur formal atau nonformal, untuk menghasilkan
informasi tentang peserta didik.
2.2Jenis-Jenis
Pengujian Instrumen Penilaian
2.2.1
Validitas
Merupakan derajat sejauh mana test mengukur apa yang
ingin diukur. Validitas adalah salah satu syarat tes hasil belajar (THB) yang
baik. Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur
keadaan yang akan diukurnya. Suatu alat ukur disebut memiliki
validitas apabila alat ukur tersebut isinya layak mengukur objek yang
seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya
kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Terdapat 2 macam metode pengujian validitas, antara
lain :
Ø Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai
suatu totalitas dapat dilakukan dengan dua cara, yaitu melalui penganalisisan
dengan cara berpikir secara rasional atau menggunakan logika dan penganalisisan
dengan cara menggunakan analisis empiris.
Ø Pengujian Validitas Tes secara rasional
Merupakan validitas yang diperoleh dengan berpikir
secara logis. Dengan demikian maka suatu
tes hasil belajar telah memiliki validitas rasional, apabila setelah dilakukan
penganilisisan secara rasional ternyata bahwa tes hasil belajar itu memang
dengan tepat telah dapat mengukur apa yang seharusnya dapat diukur.
Validitas rasional dapat dilakukan dari 2 segi, yaitu
:
a. Validitas Isi
Validitas
isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah
dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang
terkandung dalam tes hasil belajar.Dimana hal ini dilihat dari segi isi tes
sebagai alat pengukurhasil belajar peserta didik. Yaitu, sejauh mana tes hasil
belajar peserta didik isinya telah mewakili keseluruhan materi pelajaran
yang diujikan.
Contohnya,
dalam suatu kelas peserta didik telah menerima materi tentang “ Gelombang “, maka
soal-soal tes yang diujikan oleh pendidik harus mencakup keseluruhan materi
tentang “ Gelombang “.Selain itu, bentuk soal yang diberikan telah melalui
pengujian atau penganalisisan terlebih dahulu.
b.
Validitas Konstruk
Yaitu
validitas yang dilihat dari segi susunan, kerangka atau rekaannya.Dimana
validitas ini bukan dipandang dari susunan kalimat soalnya, atau urutan nomor
butir soal yang runtut, melainkan bahwa tes hasil belajar dikatakan telah
memiliki validitas apabila butir-butir soal yang membangun tes tersebut dapat
dengan tepat mengukur aspek kognitif, afektif dan psikomotorik peserta didik.Dengan
demikian, penganalisisan validitas konstruk dilakukan secara rasional dengan
berpikir logis atau logika.
Ø Pengujian Validitas Tes Secara Empiris
Validitas Empiris adalah ketepatan mengukur yang
didasarkan pada hasil analisis yang bersifat empiris. Dengan kata lain
validitas empiris adalah validitas yang bersumber pada atau diperoleh dari atas
dasar pengamatan di lapangan. Untuk menentukan tes hasil belajar sudah memiliki
validitas empiris atau belum dapat dilakukan penelusuran dari dua segi, yaitu:
a.
Validitas Ramalan
Validitas
Ramalan suatu tes adalah suatu kondisi yang menunjukkan seberapa jauh sebuah
tes sudah dapat dengan tepat menunjukkan kemampuannya untuk meramalkan apa yang
terjadi pada masa depan.
Contohnya, tes seleksi penerimaan calon mahasiswa baru
pada sebuah perguruan tinggi. Tes ini diharapkan mampu meramalkan keberhasilan
studi para calon mahasiswa dalam mengikuti program pendidikan di perguruan
tinggi tersebut pada masa-masa yang akan datang.
b.
Validitas Bandingan
Tes
sebagai alat pengukur telah memiliki validitas bandingan apabila tes tersebut
dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya
hubungan yang searah, antara tes pertama dengan tes berikutnya. Dalam rangka
menguji validitas bandingan, data yang mencerminkan pengalaman yang di peroleh
pada masa lalu di bandingkan dengan data hasil tes yang di peroleh
sekarang.Jika tes yang ada sekarang memiliki hubungan searah dengan hasil tes
berdasarkan pengalaman yang lalu, maka tes memiliki karakteristik validitas
bandingan.
Contohnya,
seorang guru ingin mengetahui apakah tes
sumatif yang disusun sudah valid atau belum. Untuk itu perlu sebuah kreteria
masa lalu yang datanya dimiliki sekarang. Misalnya nilai ulangan harian atau
nilai semester yang lalu.
§ Validitas Item Tes Hasil
Belajar
Validitas item tes hasil belajar adalah ketepatan
mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan
dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur
lewat butir item tersebut. Tes-tes hasil belajar yang dibuat atau disusun oleh
para pengajar, baik guru, dosen dan staf pengajar lainnnya, sebenarnya adalah
kumpulan dari sekian banyak butir-butir item. Dimana dengan item tersebut para
penyusun tes ingin mengukur hasil belajar yang telah dicapai oleh masing-masing
individu peserta didik setelah mengikuti proses pembelajaran dalam jangka waktu
tertentu.
Ø Pengujian Validitas Item Tes Hasil Belajar
Sebutir item
dapat dikatakan validitas yang tinggi atau dapat dikatakan valid, jika skor-skor
pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah
dengan skor totalnya. Skor total disini berkedudukan sebagai variable terikat,
sedangkan skor item berkedudukan sebagai variable bebasnya. Contohnya 20 orang
testee dihadapkan pada tes objektif bentuk multiple choice item yang
menghidangkan 10 butir item, dimana setiap item yang dijawab betul diberi skor
1, sedangkan butir item yang dijawab salah diberi skor 0. Setelah tes berakhir,
dilakukan koreksi dan dihitung skornya, diperoleh data hasil tes sebagaimana
tertera pada table berikut ini:
Testee
|
Skor untuk
butir item nomor
|
Skor Total (Xt)
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
3
|
B
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
7
|
C
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
6
|
D
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
E
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
7
|
F
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
3
|
G
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
H
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
I
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
K
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
6
|
L
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
5
|
M
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
4
|
N
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
7
|
O
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
P
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
Q
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
R
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
6
|
S
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
T
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
4
|
20=N
|
10
|
12
|
10
|
14
|
13
|
15
|
12
|
16
|
12
|
16
|
∑Xt=130
|
2.2.2
Reliabilitas
Reliabilitas tes marupakan suatu alat
ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya
menunjukan keakuratan dan kebenaran.Seorang dikatakan dapat di percaya apabila
orang tersebut berbicara benar, tidak berubah-ubah pembicaraannya dari waktu ke
waktu.Dalam sebuah tes pentingnya diamati kebenaran dan kepastian tes tersebut
dilihat dari hasil tes yang didapat.
Terdapat 2 macam metode reliabilitas
tes, antara lain :
§ Reliabilitas Eksternal
Merupakan kestabilan hasil pengukuran apabila tes hasil
belajar diujikan beberapa kali. Reliabitas sebagai stabilitas eksternal ini
memandang bahwa tes hasil belajar dikatakan reliabel apabila diujikan beberapa
kali akan memberikan hasil pengukuran yang relatif konsisten.
Reliabilitas eksternal dapat digolongkan dalam 2 metode,
yaitu :
a. Metode Tes Ulang
Merupakan
metode pengujian reliabilitas yang dilakukan dengan mengujikan sebuah perangkat
tes hasil belajar kepada kelompok peserta uji coba yang sama sebanyak dua kali.
Contohnya,
dapat disajikan skor hasil testing pada uji coba I dan II suatu tes hasil
belajar yang direspons oleh lima orang siswa memberikn hasil sebagai berikut :
Responden
|
X
|
Y
|
1
|
50
|
65
|
2
|
90
|
87
|
3
|
60
|
50
|
4
|
90
|
95
|
5
|
85
|
74
|
Keterangan
:
X
= skor responden pada testing uji coba I
Y
= skor responden pada testing uji coba II
N = jumlah
responden
Rumus Korelasi Product Moment :
Maka
hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,82.
b. Metode Pararel
Merupakan
pengujian reliabilitas yang dilakukan dengan cara membuat dua perangkat tes
hasil belajar yang pararel dan uji sekaligus. Dua perangkat tes hasil belajar
paralel adalah dua perangkat yang dikembangkan dari spesifikasi yang sama
seperti jumlah butir, pelaksanaan, bentuk, waktu uji coba, peserta uji coba, dan
kisi-kisi. Spesifikasi ini merupakan detail rancangan yang mengarahkan pada
penulisan buti-butir tes hasil belajar yang akan digunakan untuk pengumpulan
data.
Contoh
perhitungan koefisien reliabilitas menggunakan metode paralel pada lima orang
siswa memberikan hasil sebagai berikut :
Responden
|
X
|
Y
|
1
|
60
|
55
|
2
|
85
|
90
|
3
|
70
|
63
|
4
|
85
|
70
|
5
|
75
|
80
|
Keterangan :
X
= skor pada peringkat I
Y
= skor pada peringkat II
Perhitungan
dilakukan menggunakan rumus Korelasi Product
moment, sehingga memberikan hasil korelasi koefisien reliabilitas sebesar
0,79.
§ Reliabilitas Internal
Merupakan konsistensi internal hasil pengukuran butir-butir
tes hasil belajar.Tes hasil belajar dikatakan reliabel apabila, diantara butir
tes hasil belajar dihasilkan pengukuran yang konsisten.
Reliabilitas sebagai koefisien konsistensi internal dapat
dikelompokkan menjadi dua, yaitu :
a. Jumlah Butir Genap
Metode
pengujian reliabilitas dilakukan atas tes hasil belajar yang mempunyai jumlah
butir genap sehingga butir dapat dibelah menjadi 2 bagian yang sama besar.
1)Metode Belah Dua
Merupakan
metode pengujian reliabilitas yang dilakukan dengan cara membagi butir
perangkat tes hasil belajar menjadi dua belahan, selanjutnya mengkorelasikan
skor total kedua belahan.
Menurut
cara membelahnya pembelahan dapat dilakukan dengan membelah butir dalam butir
ganjil dan genap atau awal dan akhir.Contohnya, pada instrumen yang terdiri
dari sepuluh butir, pembelahan ganjil-genap dilakukan dengan mengelompokkan
butir 1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua.
Atau dengan cara lain, pembelahan atas dasar awal-akhir dengan mengelompokkan
butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.
No
|
Butir
Ganjil
|
∑
|
Butir
Genap
|
∑
|
∑∑
|
||||||||
1
|
3
|
5
|
7
|
9
|
2
|
4
|
6
|
8
|
10
|
||||
1
|
1
|
1
|
1
|
1
|
1
|
5
|
1
|
0
|
0
|
1
|
1
|
3
|
8
|
2
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
2
|
3
|
3
|
1
|
1
|
1
|
1
|
1
|
5
|
1
|
1
|
0
|
1
|
1
|
4
|
9
|
4
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
2
|
2
|
5
|
1
|
1
|
0
|
1
|
1
|
4
|
1
|
1
|
1
|
1
|
0
|
4
|
8
|
Jumlah
skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor kedua belahan
adalah sebagai berikut :
Responden
|
X
|
Y
|
1
|
5
|
3
|
2
|
1
|
2
|
3
|
5
|
4
|
4
|
0
|
2
|
5
|
4
|
4
|
Keterangan
:
X =
Jumlah skor butir belahan ganjil
Y =
Jumlah skor butir belahan genap
Hasil
korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus
korelasi product moment yang
memberikan hasil koefisien korelasi sebesar 0,85.
2)Metode Flanagan
Metode
ini seperti metode belah dua, juga membagi data manjadi dua belahan.Pembelahan
dapat dilakukan atas dasar ganjil – genap atau awal – akhir. Selanjutnya,
perhitungan koefisien reliabilitas dilakukan dengan rumus :
Keterangan
:
r11
= Koefisien reliabilitas
S12
= Varians skor butir belahan ganjil
S22
= Varians skor butir belahan genap
St2
= Varians skor total
Contoh
perhitungan koefisien reliabilitas dilakukan dengan langkah sebagai berikut :
-.
Menyusun tabel persiapan
No
|
Butir Ganjil
|
Xi
|
Xi2
|
Butir Genap
|
Xi
|
Xi2
|
Xt
|
Xt2
|
||||||||
1
|
3
|
5
|
7
|
9
|
2
|
4
|
6
|
8
|
10
|
|||||||
1
|
1
|
1
|
1
|
1
|
1
|
5
|
25
|
1
|
0
|
0
|
1
|
1
|
3
|
9
|
8
|
64
|
2
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
2
|
4
|
3
|
9
|
3
|
1
|
1
|
1
|
1
|
1
|
5
|
25
|
1
|
1
|
0
|
1
|
1
|
4
|
16
|
9
|
81
|
4
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
2
|
4
|
2
|
4
|
5
|
1
|
1
|
0
|
1
|
1
|
4
|
16
|
1
|
1
|
1
|
1
|
0
|
4
|
16
|
8
|
64
|
|
|
|
|
|
|
15
|
67
|
|
|
|
|
|
15
|
49
|
30
|
222
|
-.
Menghitung Varians
Perhitungan
varians dilakukan dengan menggunakan rumus sebagai berikut :
Si2
=
Varians
hasil perhitungan adalah sebagai berikut :
·
Skor Kelompok butir belahan ganjil
Si2 =
= 3,8
·
Skor kelompok butir belahan genap
Si2 =
= 0,8
·
Skor Total
Si2 =
= 8,4
·
Menghitung Koefisien reliabilitas
3)Metode Rulon
Metode
ini dilakukan dengan menghitung selisih skor pada kedua belahan. Rumus yang
digunakan yaitu :
r11=
1-
Keterangan
:
Sd2
= varians beda
St2
= varians total
b.
Jumlah Butir Ganjil
Merupakan
pengujian reliabilitas sebagai koefisien konsistensi internal dimana butir
instrumen berjumlah ganjil dapat menggunakan metode -metode, yaitu :
1)
Metode Kuder – Richardson
Perhitungan koefisien reliabilitas menggunakan metode
Kuder – Richardson di lakukan dengan rumus berikut :
Keterangan :
n = jumlah butir
St2= varians total
p = proporsi skor yang diperoleh
q = proporsi skor maksimum dikurangi skor yang
diperoleh
2)
Metode Hoyt
Perhitungan koefisien reliabilitas menggunakan metode
Hoyt dilakukan dengan rumus berikut :
Keterangan :
r11 = koefisien reliabilitas
V(r) = Varians responden
V(s) = Varians sisa
3)
Alpha Cronbach
Perhitungan koefisien reliabilitas dapat dilakukan
menggunakan metode Alpha cronbach dengan rumus berikut :
Keterangan
:
n =
jumlah butir
Si2
= varians butir
St2
= varians total
2.2.3
Daya Beda
Daya beda adalah kemampuan item untuk membedakan
antara individu yang memiliki performansi tinggi dan rendah. Daya beda adalah
analisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara
siswa kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang
baik adalah yang mampu membedakan antara siswa kelompok atas (yang mampu) dan siswa
kelompok bawah (kurang mampu). Siswa kelompok atas adalah kelompok siswa yang
tergolong pandai atau mencapai skor total hasil belajar yang tinggi dan siswa
kelompok bawah adalah kelompok siswa yang kurang pandai atau memperoleh skor
total hasil belajar yang rendah.
Daya Beda (DB) dapat ditentukan besarannya dengan
rumus sebagai berikut :
DB
= PT – PR atau
DB
=
Keterangan
:
PT = proporsi siswa yang menjawab benar
pada kelompok siswa yang mempunyai kemampuan tinggi.
PR = proporsi siswayang menjawab benar pada
kelompok siswa yang mempunyai kemampuan rendah.
TB = jumlah peserta yang menjawab benar
pada kelompok siswa yang mempunyai kemampuan tinggi.
T = jumlah kelompok siswa yang mempunyai kemampuan
tinggi.
RB = jumlah peserta yang menjawab benar
pada kelompok siswa yang mempunyai kemampuan rendah.
R = jumlah kelompok siswa yang mempunyai kemampuan
rendah.
Contohnya, 10 orang mengikuti uji coba tes hasil
belajar berbentuk objektif dengan hasil dengan hasil sebagai berikut :
Siswa
|
Butir Soal
|
Jumlah
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
B
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
3
|
C
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
8
|
D
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
E
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
4
|
F
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
G
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
5
|
H
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
3
|
I
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
2
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
Perhitungan Daya beda dapat dilakukan dengan
langkah-langkah sebagai berikut:
1.
Menetukan siswa kelompok atas dan bawah. Kelompok atas
adalah setengah kelompok siswa ( 5 orang ) yang memperoleh jumlah skor
tertinggi. Kelompok bawah adalah setengah kelompok siswa ( 5 orang ) yang
memperoleh skor terendah. Penentuan kelompok atas dan kelompok bawah dapat
disajikan dalam tabel berikut :
Kelompok atas
|
Kelompok bawah
|
||
Siswa
|
Skor
|
Siswa
|
Skor
|
A
|
10
|
B
|
3
|
C
|
8
|
E
|
4
|
D
|
9
|
G
|
5
|
F
|
9
|
H
|
3
|
J
|
10
|
I
|
2
|
2.
Menghitung perolehan skor butir pada kelompok atas dan
kelompok
Kelompok atas
|
||||||||||
Siswa
|
Butir Soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
C
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
D
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
F
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
Jumlah
|
5
|
2
|
5
|
4
|
5
|
5
|
5
|
5
|
5
|
4
|
Kelompok
bawah
|
||||||||||
Siswa
|
Butir Soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
B
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
E
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
G
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
H
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
I
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
Jumlah
|
1
|
4
|
1
|
2
|
2
|
2
|
1
|
1
|
2
|
2
|
3.
Menghitung Daya Beda
Daya beda dihitung sebagaimana rumusnya sebagai
berikut :
a.
Butir 1
Daya Beda (1) =
b.
Butir 2
Daya beda (2) =
2.2.4
Tingkat Kesukaran Soal
Tingkat kesukaran berhubungan dengan banyaknya testee
(siswa) yang bisa menjawabdengan benar suatu butir soal tes.Suatu butir soal
tes dikatakan baik, bila memenuhi fungsinya secara tepat. Butir soal yang
terlalu sukar tidak berhasil mengungkapkan apa yang diketahui siswa. Semua
tidak bisa menjawab pertanyaan dengan benar. Sebaliknya, butir soal yang
terlalu mudah ,tidakberhasil mengungkap apa yang belum diketahui siswa. Tidak
bisa mengukur secara tepat kemampuan yang dimiliki siswa.Semua bisa menjawab
dengan betul.
Untuk itu, dalam merumuskan butir soal, perlu dilihat
tingkat kesukarannya secara empiric. Rumusannya adalah sebagai berikut :
Keterangan :
P = Indeks Kesukaran
B = Banyaknya testee menjawab butir soal dengan benar.
Js = Jumlah seluruh testee (siswa)
Soal yang baik adalah soal yang memiliki tingkat
kesukaran yang memadai untuk mengungkap penguasaan siswa secara tepat. Soal
dengan P sebesar 0,0 sampai dengan 0,30 adalah soal sukar. Soal dengan P
sebesar 0,3 sampai dengan 0,70
adalah sola sedang. Soal dengan P sebesar 0,70 sampai dengan 0,70 sampai dengan
1,00 termasuk soal mudah.
Untuk merumuskan butir soal yang baik, secara umum,
bisa digunakan acuan soal yang cukup memadai; bila memiliki tingkat kesukaran
0,30 sampai dengan 0,70. Namun hal ini juga perlu mempertimbangkan proporsi
butir soal yang sukar, sedang dan mudah, sehingga bisa benar-benar tepat dalam
mengukur kemampuan siswa.
BAB III
PENUTUP
3.1
Kesimpulan
Validitas
adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas
berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan yang akan
diukurnya.
Reliabilitas
tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi
pengukuran tes yang hasilnya menunjukan keakuratan dan kebenaran.
Daya
beda adalah kemampuan item untuk membedakan antara individu yang memiliki
performansi tinggi dan rendah. Daya beda adalah analisis yang mengungkapkan
seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan
siswa kelompok rendah.
Tingkat
kesukaran berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan
benar suatu butir soal tes.Suatu butir soal tes dikatakan baik, bila memenuhi
fungsinya secara tepat.
Purwanto. 2008. Evaluasi
hasil Belajar. Yogyakarta: Pustaka
Belajar
Sudijono, A. 2012.Pengantar
Evaluasi Pendidikan.Jakarta : Raja Grafindo Persada
Tumardi.2008. Evaluasi
Pembelajaran.Malang : Laboratorium Teknologi Pendidikan Fakultas Ilmu
Pendidikan Universitas Negeri Malang
Tidak ada komentar:
Posting Komentar