Dosen pengampu : Sabar Siswoyo, MPd.
Oleh Kelompok 11 Angkatan 5:
1. Nindy Kurnianingrum (PAI)
2. Nur Fadillah Lubis (PAI)
3. Nurul Hasanah (PAI)
4. Nurul Haslinda (PAI)
5. Harnum Suri (PAI)
KATA PENGANTAR
Segala puji dan syukur atas segala limpahan karunia Allah Subhanahu wa ta’ala. Dengan pertolongan dan kemudahan dari-Nya lah kami dapat menyelesaikan makalah ini tepat waktu. Shalawat dan salam semoga tetap Allah limpahkan kepada Nabi Muhammad Shallallahu ‘Alaihi wasallam beserta keluarganya, para sahabatnya dan seluruh umatnya yang senantiasa istiqamah mengikutinya hingga akhir zaman.
Penulisan makalah ini bertujuan untuk memenuhi tugas kelompok mata kuliah Sistem Evaluasi Pendidikan yang berjudul “Analisis Item”. Dengan kerja sama yang baik dari semua pihak yang terlibat dalam penyusunan makalah ini kami mengucapkan terima kasih banyak.
Dalam penulisan makalah ini kami merasa masih banyak sekali kekurangan baik pada teknis penulisan maupun materi, mengingat akan kemampuan yang kami miliki. Oleh sebab itu kritik dan saran dari pembaca sangat kami harapkan demi membantu perbaikan dalam pembuatan makalah ini.
Akhir kata kami berharap semoga makalah ini dapat memberikan manfaat yang luas serta dapat menambah pengetahuan bagi para pembaca dalam upaya merencanakan sistem pendidikan yang lebih baik kedepannya.
Mempawah, 31 Oktober 2023
Penyusun Makalah
Kelompok 11
DAFTAR ISI
KATA PENGANTAR.. i
DAFTAR ISI ii
BAB I PENDAHULUAN.
A. Latar Belakang.
B. Rumusan Masalah.
C. Tujuan Penulisan.
BAB II 3 PEMBAHASAN.
A. Pengertian Analisis Item.
B. Analisis Item pada Test Normatif.
C. Analisis Item pada Test Kriterion.
BAB III PENUTUP.
Kesimpulan.
DAFTAR PUSTAKA.
BAB I
PENDAHULUAN
A. Latar Belakang
Menurut Barnard (1999) tujuan tes yang disusun dalam proses evaluasi dapat dikelompokkan dalam dua macam kategori, yaitu a) kategori birokrasi, dan b) kategori profesional. Tes juga dibedakan menjadi dua macam tipe, yaitu norm-referenced test dan criterion-referenced mastery test. Suatu tes dibuat oleh para evaluator dengan tetap mengikuti jenis baku yang disepakati, karena setiap tipe tes mempunyai tujuan yang berbeda. Norm-referenced test, misalnya, yang sering disebut Penilaian Acuan Normatif (PAN) merupakan jenis tes untuk mengukur penampilan atau posisi seorang siswa dibandingkan dengan siswa lain didalam grupnya sedangkan criterion-referenced test, yang populer dengan sebutan Penilaian Acuan Patokan (PAP), merupakan tes yang digunakan untuk mengukur penguasaan atau kemampuan siswa melalui kriteria tertentu yang telah di tetapkan sebelumnya oleh evaluator,tanpa membandingkan dengan penguasaan atau kemampuan siswa lainnya.
Permasalahan yang sering muncul dari dua macam tujuan diadakannya proses pengetesan di antaranya ialah bahwa tidak semua tes yang direncanakan guru atau evaluator jarang mampu mengakomodasi kedua tujuan tersebut dengan baik. Oleh karena itu, seorang evaluator perlu memutuskan bagaimana skor tes akan diarahkan. Salah satu metode untuk melaksanakan hal tersebut adalah dengan melakukan analisis item.
Tes pendidikan disusun dengan menggunakan sejumlah item Skor pada setiap item ditambahkan pada skor item lainnya untuk mencapai skor total. Tes yang digunakan untuk tujuan evaluasi sebaiknya memenuhi dua persyaratan penting, yaitu validitas dan reliabilitas. Konsekuensinya, kualitas dan nilai sebuah tes tergantung atas item individual dalam satu kesatuan. Oleh karena itu, praktik terbaik yang perlu dipertimbangkan oleh seorang guru adalah perlunya menganalisis setiap item, agar tes yang dibangun dapat disesuaikan dengan tujuan dan rasional alat yang dikonstruksi.[1]
[1] Prof. H.M. Sukardi, MS. Ph.D. EVALUASI PENDIDIKAN Prinsip dan Operasionalnya. Cetakan ketujuh (Jakarta Timur. PT. Bumi Aksara, 2012), hal 134-135.
B. Rumusan Masalah
1. Apa yang dimaksud dengan Analisis Item?
2. Bagaimana Analisis Item pada Test Normatif?
3. Bagaimana Analisis Item pada Test Kriterion?
C. Tujuan Penulisan
1. Mengetahui pengertian Analisis Item
2. Mengetahui Analisis Item pada Test Normatif
3. Mengetahui Analisis Item pada Test Kriterion
BAB II
PEMBAHASAN
A. Pengertian Analisis Item
Dalam penyusunan sebuah alat ukur, tahapan yang harus dilakukan adalah analisis item. Istilah analisis item digunakan untuk mendefinisikan perhitungan dan pengujian statistikal terhadap skor-skor item alat ukur individual. Sebuah item dapat dianalisa, baik itu analisa kualitatif (berdasarkan isi maupun bentuk dari item tersebut) dan analisa kuantitatif (berdasarkan muatan-muatan statistik seperti daya prediktif, daya beda dari item tersebut). Analisa kualitatif mencakup pertimbangan isi validitas, sedangkan analisa kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi item.
Tujuan utama dalam melakukan analisa item adalah untuk meningkatkan reliabilitas dan validitas suatu alat ukur. Menurut Crocker & Algina (1986) pengukuran yang umum digunakan dalam analisa item, adalah: Item difficulty, Item discrimination, dan Item-total correlation.
a. Item Difficulty
Jika skoring pada sebuah item itu dikotomi, maka rata-rata skor item berhubungan dengan banyaknya subyek yang menjawab item tersebut dengan benar. Proporsi orang yang menjawab benar untuk item inilah yang disebut dengan item difficulty, atau yang biasa diberi simbol p.
b. Item Discrimination
Tujuan dari kebanyakan pengukuran psikologis adalah memberikan informasi mengenai perbedaan individu (individual differences) dalam hal konstruk yang diukur tes atau dari kriteria eksternal yang ingin diprediksi oleh alat tes tersebut. Oleh karena itu sebuah tes perlu memiliki daya diskriminasi. Pengertian dari daya diskriminasi adalah derajat dimana item dapat membedakan responden dengan skor tinggi dan skor rendah.
Terdapat beberapa metode untuk melihat daya diskriminasi sebuah item. Salah satu metodenya melakukan perbandingan dengan cara membedakan kelompok responden dengan menentukan titik potong pada distribusi skor. Sedangkan metode lainnya merupakan metode koefisien korelasi. Berikut adalah penjelasan mengenai setiap metode.
c. Item Total Corellation
Metode item-total correlation merupakan suatu teknik analisis item yang mengkorelasikan skor item dengan skor total keseluruhan. Dengan kata lain, daya diskriminasi item melihat apakah subyek yang mampu menjawab sebuah item dengan benar juga bisa menjawab dengan benar pada item- item lainnya. Beberapa jenis korelasi yang digunakan dalam pengujian ini adalah Pearson’s Product Moment Correlation, Point Biserial Correlation, Biserial Correlation, Phi Coefficient, atau Tetrachoric Correlation Coefficient. Grimm (1993) menjelaskan bahwa jika skor item dan skor total berupa variabel kontinu maka metode korelasi yang digunakan adalah Pearson’s Product Moment Correlation. Kemudian jika variabel skor total adalah kontinu dan skor item dikotomi, maka metode korelasi yang digunakan adalah Point Biserial atau Biserial Correlation.[2]
[2] https://www.globalstatistik.com/analisis-item/
B. Analisis Item pada Test Normatif
Menurut Sudjana (2005:5) tes normatif adalah tes yang dilaksanakan pada akhir program belajar-mengajar untuk melihat tingkat keberhasilan proses belajar mengajar itu sendiri. Surapranata (2005: 49) menyatakan bahwa tes normatif digunakan sebagai alat untuk memperbaiki program pembelajaran yang telah dilakukan. Labih lanjut lagi beliau menyatakan bahwa indeks kesukaran yang digunakan dalam tes ini bervariasi tergantung pada program pembelajaran.
Guru melaksanakan kegiatan evaluasi bertujuan untuk mengetahui tingkat keberhasilan program pengajaran. Kegiatan evaluasi sangat perlu dilakukan untuk mengukur sejauh mana keberhasilan seorang siswa sebagai peserta didik dan pendidik, satuan pendidikan serta pemerintah sebagai penyelenggara pendidikan, sehingga hasil evaluasi harusnya menjadi acuan bagi semua pihak terkait tentang perbaikan dan peningkatan yang lebih baik. Peran guru sebagai evaluator artinya untuk mengetahui sejauh mana proses belajar dilakukan selain itu, guru harus dapat mengoreksi apakah pembelajarannya itu perlu diperbaiki atau dipertahankan.[3]
[3] ANALISIS KUALITAS BUTIR SOAL PADA TES FORMATIF KD 3.1, KD 3.2, DAN ... https://ejournal.unesa.ac.id/index.php/swara bhumi/article/view/18406.
Dalam mengevalusi item, minimal ada dua aspek utama yang perlu dipertimbangkan oleh seorang evaluator. Kedua aspek utama tersebut, yaitu tingkat kesulitan setiap item dan nilai pembeda atau diskriminatif item.
1. Tingkat kesulitan
Tingkat kesulitan item atau disebut juga indeks kesulitan item adalah angka yang menunjukkan proporsi siswa yang menjawab betul dalam satu soal yang dilakukan dengan menggunakan tes objektif. Tingkat kesulitan tes item pada umumnya ditunjukkan dengan presentase siswa yang memperoleh jawaban item benar. Kesulitan item mengikut formula seperti berikut.
Di mana :
Pi = nilai kesulitan item.
Nt = jumlah peserta didik dalam sampel.
Xij = skor item I untuk peserta didik j.
Semakin tinggi nilai Pi berarti semakin mudah item atau soal tersebut bagi para siswa yang dievaluasi. Sebaliknya, semakin rendah nilai Pi berarti semakin sulit item tes bagi para siswa. Secara impiris, batasan tentang nilai kesulitan ini dapat ditingkatkan dengan cara menjadikan nilai total Nt sama dengan jumlah siswa yang telah menjawab item. Perubahan ini suatu ketika bisa manjadi signifikan, apabila terjadi pada item-item tertentu yang pada akhir tes banyak yang mengosongkan atau tidak menjawab.
Oleh karena itu, para evaluator perlu hati-hati dan mengantisipasi kemungkinan diatas, utamanya ketika para evaluator sedang melakukan uji coba item-item tes yang dimaksud. Menurut Gronlund dan Linn (1990), item kesulitan untuk tes normatif, dapat menggunakan formula berikut.
Di mana :
R = jumlah siswa yang menjawab item benar.
T = total siswa yang mengikuti evaluasi.
2. Indeks Pembeda (IP)
Batasan tentang indeks pembeda muncul terutama pada item-item tes yang disusun secara objektif. Apa yang dimaksud dengan indeks pembeda pada tes pencapaian hasil belajar, khususnya indeks pembeda yang mengacu pada tes normatif? Indeks pembeda menurut Barnard (1999) adalah angka atau koefisien yang memberikan informasi tentang pembeda secara individual, termasuk membedakan antara siswa yang pencapaiannya tinggi dengan siswa yang pencapaiannya rendah dalam suatu tes pencapaian hasil belajar.
Indeks pembeda item pada prinsipnya membedakan pada arah positif atau arah negatif. Indeks pembeda negatif, apabila siswa pada grup atas lebih banyak jumlahnya, jika dibandingkan siswa dengan grup bawah. Indeks positif menunjukkan bahwa item tes memiliki arah yang sama dengan total skor yang merefleksikan pencapaian tujuan yang diinginkan. Sebaliknya, indeks pembeda negatif berarti item menunjukkan adanya ketidaksesuaian dengan tujuan hasil belajar yang sudah direncanakan oleh guru.
Indeks pembeda menurut Daryanto (2005) dan Slameto (2001) merupakan kemampuan sesuatu soal atau item dalam membedakan antara siswa yang pandai atau berhasil dengan siswa yang kurang berhasil atau bodoh. Formula indeks pembeda dapat ditampilkan seperti berikut.
Di mana :
IP = indeks pembeda item.
Ru = jumlah siswa yang menjawab benar pada grup atas.
RI = jumlah siswa yang menjawab benar pada grup bawah.
T = total siswa yang mengikuti tes.
Jika item pada contoh soal kelas matematika digunakan maka:
Indeks pembeda item = 50%
Indeks pembeda suatu tes pada umumnya memiliki angka baku yang besarnya 0,40. Hal ini berarti, indeks pembeda pada kasus di atas digunakan untuk membedakan yang bisa menjawab item tes dan yang tidak bisa menjawab dengan benar. Sebagai contoh, jika suatu item ternyata memiliki IP = 50% dan IP baku item besarnya > 0,40, berarti item tes pada contoh tersebut adalah cukup baik. Hal ini berarti item tes tersebut sesuai dengan tujuan tes yang telah ditentukan oleh guru.[4]
[4] Prof. H.M. Sukardi, MS. Ph.D. EVALUASI PENDIDIKAN Prinsip dan Operasionalnya. Cetakan ketujuh (Jakarta Timur. PT. Bumi Aksara, 2012), hal 135-139 .
C. Analisis Item pada Test Kriterion
Criterionre ferenced tes(CRT) atau penilaian acuan patokan(PAP) adalah penilaian yang diacukan kepada tujuan instruksional yang harus dikuasai siswa. Dengan demikian derajat siswa dibandingkan dengan tujuan yang seharusnya dicapai, bukan dibandingkan dengan rata-rata pengelompokannya. Biasanya keberhasilan siswa ditentukan kriterianya, yakni berkisar 75-80%.[5]
[5] https://www.slideshare.net/missimada/norm-reference-test-and-criterion-referenced-test
Misalnya setiap siswa diberi pertanyaan sejumlah 50 soal. Setiap jawaban yang benar mendapatkan skor 1, sehingga skor maksimal yang dicapai adalah 50. Kriteria keberhasilan 80% artinya siswa harus mencapai nilai 40 agar bisa dinyatakan lulus. Apabila siswa mendapat nilai kurang dari 40, ia dinyatakan tidak lulus.
Sistem penilaian ini mengacu pada konsep belajar tuntas atau mastery learning. Makin tinggi kriteria yang digunakan oleh pendidik di sekolah tersebut, makin tinggi pula kualitas belajar siswanya. Keberhasilan dalam penilaian ini tergantung pada penguasaan materi atas kriteria yang telah dijabarkan dalam item-item pertanyaan, guna mendukung tujuan instruksional.
Pada prinsipnya, Item analisis untuk tes criterion yang juga sering disebut penilaian acuan patokan ini melihat item atas dasar tingkat kesulitan dan indeks pembeda yang dapat diuraikan seperti berikut.
1. Tingkat kesulitan
Tingkat kesulitan untuk tes kriterion tidak terlalu mendasar pada kemampuan item dalam membedakan antara tinggi dan rendahnya siswa dalam menjawab soal. Kesulitan setiap item tes kriterion pada prinsipnya ditentukan oleh hasil belajar yang ingin diukur.
Jika tugas dalam hasil pembelajaran yang ditentukan direncanakan mudah maka tes yang dibuat oleh seorang evaluator juga mudah. Sebaliknya, jika tugas dalam hasil pembelajaran memiliki tingkat kesulitan tinggi maka tes yang dibuat oleh evaluator juga direncanakan memiliki tingkat kesulitan tinggi.
Dalam tes yang mengacu pada penilaian acuan patokan, tidak ada usaha yang dibuat untuk mengubah tingkat kesulitan item tanpa melihat tugas dalam proses pembelajaran.Agar meningkatkan daya pembeda atau mencapai penyebaran skor tes yang baik, formula baku untuk menentukan kesulitan item dapat diaplikasikan pada tes dengan penilaian patokan.Walaupun demikian, hasilnya belum tentu dapat digunakan untuk memiliki item atau memanipulasi kesulitan item yang ada. Hal ini terjadi karena hampir semua item pada teskriterion biasanya mempunyai kesulitan tinggi atau rendah sesuai dengan instruksi tes yang direncanakan.
2. Indeks pembeda
Kemampuan item tes untuk membedakan antara siswa yang menjawab benar dalam kelompok tinggi dan siswa yang menjawab benar dalam kelompok rendah, pada umumnya tidak terlalu penting untuk tes yang disusun dengan penilaian acuan patokan. Ada kemungkinan suatu item mempunyai indeks pembeda rendah atau mendekati 0; ini berarti para siswa dalam satu kelas memiliki dua peluang, yaitu;
a) Semua menjawab benar, atau sebaliknya.
b) Semua menjawab salah.
Dalam analisis item dengan penilaian acuan nomatif, maka item tersebut harus dibuang, karena tidak memiliki daya pembeda. Sebaliknya, pada analisis item dengan penilaian acuan patokan, item tersebut tidak perlu dibuang. Karena walaupun tidak memiliki daya pembeda,item tersebut tetap memberikan informasi penting, yakni tentang siswa dalam penampilan hasil pembelajaran di kelas.
Pertanyaan yang perlu dipertimbangkan oleh seorang evaluator dalam menganalisis item dengan penilaian acuanpatokan adalah apakah item item tes telah benar-benar mengukur pengaruh instruksional atau pengajaran seorang guru? Untuk menjawab pertanyaan tersebut,seorang guru perlu dianjurkan pentingnya menerapkan prinsip eksperimen semu (quasi experiment) di kelas. Eksperimen semua ini dapat dilakukan, salah satu caranya dengan memberikan tes yang dua kali.
Pertama, pada saat pembelajaran dimulai sebagai hasil pretes; kedua, sesudah proses pembelajaran berakhir, sebagai hasil potes. Hasil yang dicapai adalah dapat diperolehnya indeks sensitivitas pengaruh pengajaran (S) yang mengikuti formula seperti berikut.
Di mana :
S = Sensitivitas pengaruh pengajaran.
Ra = jumlah siswa menjawab benar sesudah proses pengajaran.
Rb = jumlah siswa menjawab benar sebelum proses pengajaran.
T = total siswa yang mengikuti kedua proses testing.
Indeks sensitivitas merupakan koefisien atau angka yang menunjukkan selisih antara siswa menjawab benar sesudah dan sebelum proses pembelajaran dibagi jumlah siswa yang mengikuti dua tes dalam proses evaluasi.
Item ideal atau sempurna pada tes kriterion menghasilkan indeks 1,00. Dalam implementasi, item nilai indeks dikatakan efektif pada umumnya mempunyai nilai 0,00 sampai1,00. Semakin tinggi nilai positif, dapat diartikan item lebih sensitive terhadap pengaruhpengajaran hasil belajar. Sebaliknya, item dengan nilai 0,0 dan nilai negative berarti item tidak merefleksikan pengaruh pengajaran yang terencana.
Dalam tes kriterion pada umumnya selalu ada jawaban penjebak (distracter). Jawaban penjebak ini direncanakan oleh penyusun evaluasi atau guru kelas untuk mengacukan siswa yang tidak belajar dengan baik, sehingga akan memilih jawaban yang tidak benar. Maka seorang evaluator sebaiknya memperhatikan jawaban penjebak pada setiap item. Pengecekan tersebut fokus pada jawaban penjebak yang sering atau tidaknya dipilih oleh para siswa.
Pengecekan jawaban penjebak sebaiknya dilakukan ketika evaluasi pretes dilaksanakan, dimana Sebagian siswa diharapkan memilih jawaban penjebak yang disediakan. Jika item-item yang berisi jawaban penjebak tidak dipilih semuanya maka seorang evaluator perlu melakukan cek ulangkembali dan merevisi jawaban penjebak tersebut.[6]
[6] .Prof. H.M. Sukardi, MS. Ph.D. EVALUASI PENDIDIKAN Prinsip dan Operasionalnya. Cetakan ketujuh (Jakarta Timur. PT. Bumi Aksara, 2012), hal. 139-142
BAB III
PENUTUP
Kesimpulan
Analisis item merupakan salah satu tahapan dalam penyusunan sebuah alat ukur yang digunakan untuk mendefinisikan perhitungan dan pengujian statistikal terhadap skor-skor item alat ukur individual. Tujuan utama dalam melakukan analisia item adalah untuk meningkatkan reliabilitas dan validitas suatu alat ukur. Adapun pengukuran yang umum digunakan dalam analisa item yaitu : Item Difficualty, Item Discrimination, dan Item Total Correlation.
Analisis item pada test normatif adalah tes yang dilaksanakan pada akhir program belajar-mengajar untuk melihat tingkat keberhasilan proses belajar mengajar itu sendiri. Ada juga yang menyatakan bahwa tes normatif digunakan sebagai alat untuk memperbaiki program pembelajaran yang telah dilakukan. Dalam mengevaluasi item pada tes normatif seorang evaluator perlu mempertimbangkan dua hal yaitu tingkat kesulitan tiap item dan nilai pembeda atau diskriminatif item. Analisis item pada test kriterion adalah penilaian yang diacukan kepada tujuan instruksional yang harus dikuasai siswa.
Kesulitan setiap item tes kriterion (criterion referenced mastery) pada prinsipnya ditentukan belajar yang ingin diukur. Jawaban distracter direncanakan oleh penyusun evaluasi untuk mengacaukan siswa yang tidak benar-benar belajar agar tidak memilih jawaban yang benar. Item ideal pada cruerion-referenced test menghasilkan indeks 1,00. Item dikatakan efektif pada umumnya mempunyai nilai 0,00 sampai 1,00. Semakin tinggi nilai positif, berarti item lebih sensitif terhadap pengaruh instruksional. Item dengan nilai 0,00 dan nilai negatif berarti item tidak merefleksikan pengaruh instruksional yang terencana.
Indeks kesulitan item adalah angka yang menunjukkan proporsi siswa menjawab betul dalam satu soal yang dilakukan dengan menggunakan tes objektif. Indeks pembeda merupakan kemampuan suatu soal atau item dalam membedakan antara siswa yang pandai atau berhasil dengan siswa yang kurang berhasil atau bodoh.
DAFTAR PUSTAKA
ANALISIS KUALITAS BUTIR SOAL PADA TES FORMATIF KD 3.1, KD 3.2, DAN ... https://ejournal.unesa.ac.id/index.php/swara-bhumi/article/view/18406.
https://www.globalstatistik.com/analisis-item/
https://www.slideshare.net/missimada/norm-reference-test-and-criterion-referenced-test.
Prof. H.M. Sukardi, MS. Ph.D. EVALUASI PENDIDIKAN Prinsip dan Operasionalnya. Cetakan ketujuh (Jakarta Timur. PT. Bumi Aksara, 2012).
Tidak ada komentar:
Posting Komentar