Kamis, 21 September 2023

Persyaratan Reliabilitas Instrumen

Disusun untuk memenuhi tugas mata kuliah Sistem Evaluasi Pendidikan
Dosen pengampu : Sabar Siswoyo, MPd.
Oleh Kelompok 04 Angkatan 5:
1. Binty Sholikhah (SBA)
2. Efni Redho (PAI)
3. Nanda Nur Azizah (PAI)

KATA PENGANTAR

انَّ الْحَمْدَ لِلَّهِ نَحْمَدُهُ وَنَسْتَعِيْنُهُ وَنَسْتَغْفِرُهُ، وَنَعُوذُ بِاللهِ مِنْ شُرُوْرِ أَنْفُسِنَا وَمِنْ سَيِّئَاتِ أَعْمَالِنَا، مَنْ يَهْدِهِ اللهُ فَلاَ مُضِلَّ لَهُ وَمَنْ يُضْلِلْ فَلاَ هَادِيَ لَهُ أَشْهَدُ أَنْ لاَ إِلَهَ إِلاَّ اللهُ وَحْدَهُ لاَشَرِيْكَ لَهُ، وَأَشْهَدُ أَنَّ مُحَمَّدًا عَبْدُهُ وَرَسُوْلُهُ.، أَمَّا بَعْدُ

Segala puji hanya milik Allah semata Rabb alam semesta yang sudah melimpahkan rahmat serta taufik-Nya sehingga kami dapat menyelesaikan tugas mata kuliah Sistem Evaluasi Pendidikan dengan baik serta tepat waktu. Shalawat serta salam semoga tercurahkan kepada Nabi kita Muhammad Shallallahu ‘alihi wasallam, kepada para kerabatnya, serta para sahabatnya.

Adapun makalah ini tentang “ Pengertin Realibilitas ” telah kami usahakan semaksimal mungkin dan tentunya dengan bantuan rekan-rekan kelompok 4, sehingga dapat memperlancar pembuatan makalah ini. Untuk itu kami tidak lupa menyampaikan banyak terima kasih kepada rekan-rekan sekalian yang telah membantu kami dalam pembuatan makalah ini.

Kami menyadari bahwa dalam penyusunan makalah ini jauh dari sempurna, baik dari segi penyusunan, bahasa ataupun penulisannya. Oleh karena itu kami mengharapkan kritik dan saran yang sifatnya membangun, khususnya dari guru mata pelajaran gun menjadi acuan dalam bekal pengalaman bagi kami untuk lebih baik di masa yang akan datang.

Penyusun berharap mudah-mudahan makalah ini dapat bermanfaat kkhususnya bagi penulis dan pembaca pada umumnya.

Depok , September 2023
Penyusun

DAFTAR ISI

Kata Pengantar.
Daftar Isi.
BAB I : PENDAHULUAN
A. Latar Belakang.
B. Rumusan Masalah.
C. Manfaat penelitiaan.
BAB II : PEMBAHASAN
A. Pengertian Reliabilitas.
B. Reliabilitas Dengan Tes-Retes.
C. Reliabilitas Bentuk Ekivalensi.
D. Reliabilitas Dengan Belah Dua.
E. Mengukur Homogenitas.
F. Alfa Cronbach.
G. Kesalahan Buku Dalam Pengukuran.
H. Faktor-Faktor Yang Memengaruhi Reliabilitas.
I. Persyaratan Kegunaan Kesimpulan.
BAB III : PENUTUP
A. Kesimpulan.
B. Kritik & Saran.
DAFTAR PUSTAKA

BAB I
PENDAHULUAN

A. Latar Belakang

Reliabilitas adalah istilah yang banyak digunakan dalam evaluasi pendidikan, terutama dalam masalah tes reliabilitas tes dapat di artikan sebagai ajeg atau tetapnya suatu tes, reliabilitas tes mempunyai ukuran-ukuran tertentu, dan tes yang baik dalam buku dasar dasar evaluasi pendidikan karya suharsimi arikuto adalah memiliki validitas dan realibilitas. Bila tes tidak mengandung kedua sifat tersebut maka hasil dari tes bisa di katakan kurang sesuai atau tidak sah.

Setelah memahami pengertian dan urgensi secara umum reliabilitas dalam tes, maka dalam makalah ini akan mencoba menguraikan pengertian reliabilitas sejelas mungkin, sehingga teman-teman sekalian memahami apa sebenarnya validitas dan reliabilitas dan contoh-contoh nya.

B. Rumusan Masalah

1. Apa pengertian dari reliabilitas?
2. Bagaimana cara melakukan reliabilitas dengan tes-retes?
3. Bagaimana cara melakukan reliabilitas bentuk ekivalensi?
4. Bagaimana cara melakukan reliabilitas dengan belah dua?
5. Bagaimana mengukur homogenitas?
6. Apakah alfa cronbach?
7. Apa sajakah kesalahan baku dalam pengukuran?
8. Apa saja faktor-faktor yang memengaruhi reliabilitas instrumen?
9. Apa persyaratan kegunaan instrumen?

C. Manfaat Penelitian

1. Mengetahui pengertian dari reliabilitas.
2. Mengetahui cara melakukan reliabilitas dengan tes-retes.
3. Mengetahui cara melakukan reliabilitas bentuk ekivalensi.
4. Mengetahui cara melakukan reliabilitas dengan belah dua.
5. Mengetahui cara mengukur homogenitas.
6. Mengetahui alfa cronbach.
7. Mengetahui kesalahan baku dalam pengukuran.
8. Mengetahui faktor-faktor yang memengaruhi reliabilitas instrumen.
9. Mengetahui persyaratan kegunaan instrument.

BAB II
PEMBAHASAN

A. Pengertian Reliabilitas

Banyak ahli yang menjelaskan pengetian reliabilitas, diantaranya Wiersma (1986:288) yang menyatakan reliabilitas adalah konsistensi dari hendak diukur. Gronlud (1982 : 132 ) juga menyatakan bahwa reliablitas adalah konsistensi skor instrument, yaitu seberapa jauh konsistensi skor itu dari satu pengukuran ke pengukuran yang lain.

Memperhatikan pendapat diatas, maka reliabilitas adalah merupaka koefisien yang menunjukkan sejauh mana suatu instrument/alat pengukur dapat dipercaya, artinya apabila suatu instrumenn digunakan berullang-ulang untuk mengukur sesuatu yang sama, maka hasilnya relative stabil atau konsiste. Secara empiris tinggi rendahnya reliabilitas ditunjukkan oleh suatu angka yang disebut koefisien reliabilitas, besrnya koefisien reliabilitas berisar antara 0 sampai dengan 1, dimana semakin tinggi angka reliabilitas berarti semakin konsisten hasil pengukuran, akan tetapi secara empiris koefisien reliabilitas yang mencapai angka 1 jarang dijumpai.

Menurut Allen dan Yen (1979 : 75) koefisien reliabilitas besarnya ditentukan oleh satu dikurangi dengan perbandingan varians skor tampak. Atas dasar yang demikian semakin kecil varians kesalahan pengukuran, maka akan seakin tinggi koefisien reliabilitas, sehingga varians tampak dapat digunakan sebagai atribut koefisien reliabilitas yang sesungguhnya.

Reliabilitas instrumen dapat diuji dengan beberapa uji reliabilitas. Beberapa uji reliabilitas suatu instrumen yang bisa digunakan antara lain test-retest, ekuivalen, dan internal consistency. Internal consistency sendiri memiliki beberapa teknik uji yang berbeda. Teknik uji relibilitas internal consistency terdiri dari uji split half, KR 20, KR 21, dan Alfa Cronbach. Namun, setiap uji memiliki kriteria instrumen seperti apa yang bisa diuji dengan teknik tersebut.

B. Reliabilitas Tes-Retes

Reliabilitas dengan Tes-Retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-retes mennjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, untuk mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya. Dengan melakukan Tes-Retes seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur. [1]
[1] https://www-statology-org.translate.goog/test-retest-reliability/?_x_tr_sl=en&_x_tr_tl=id&_x_tr_hl=id&_x_tr_pto=tc (diakses pada tanggal 23 september 2023 pukul 08:42 )

Reliabilitas Tes-Retes dapat dilakukan dengan cara seperti berikut:
1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
2. Setelah selang waktu tertentu, misalnya 1 minggu atau 2 minggu lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
3. Korelasikan hasil kedua tes tersebut.

Contoh: Menghitung Reliabilitas Test-Retest

Misalkan peneliti memberikan tes kepada 20 orang dan kemudian memberikan jenis tes yang sama satu bulan kemudian kepada 20 orang yang sama.

Skor mereka ditunjukkan di bawah ini:
Kita dapat menggunakan kalkulator korelasi untuk mengetahui bahwa Koefisien Korelasi Pearson antara dua kumpulan skor adalah 0,836.

Karena korelasi ini lebih besar dari 0,80, peneliti dapat menyimpulkan bahwa tes tersebut memiliki reliabilitas tes-tes ulang yang baik.

Dengan kata lain, tes ini memberikan hasil yang dapat diandalkan dan dapat direplikasi pada waktu yang berbeda.

Potensi Bias dalam Keandalan Test-Retest

Keandalan pengujian-pengujian ulang adalah metrik yang berguna untuk dihitung, namun waspadai potensi bias berikut yang dapat memengaruhi metrik ini:

1. Efek Latihan

Efek latihan terjadi ketika peserta menjadi lebih baik dalam beberapa tes karena latihan. Artinya, mereka cenderung menunjukkan hasil yang lebih baik pada tes selanjutnya karena mereka punya waktu untuk berlatih dan meningkatkan kemampuan.

Cara untuk mencegah bias jenis ini adalah dengan memberikan tes kepada individu yang tingkat kesulitannya sama tetapi variasi soalnya berbeda sehingga mereka tidak bisa menghafal jawaban jenis soal yang diajukan pada tes pertama.

2. Efek Kelelahan

Efek kelelahan terjadi ketika peserta menjadi lebih buruk pada suatu tes karena mentalnya terkuras atau lelah karena mengikuti tes sebelumnya.

Cara untuk mencegah bias seperti ini adalah dengan menyediakan banyak waktu di antara tes (idealnya berminggu-minggu atau bahkan berbulan-bulan) sehingga peserta tetap segar saat mengikuti kedua tes tersebut.

3. Perbedaan Kondisi

Ketika peserta mengikuti dua tes dalam kondisi yang berbeda (yaitu pencahayaan yang berbeda, waktu yang berbeda, waktu yang berbeda untuk menyelesaikan tes, dll.) ada kemungkinan bahwa mereka mendapat nilai yang berbeda pada tes tersebut hanya karena perbedaan dalam lingkungan pengujian.

Cara untuk mencegah bias seperti ini adalah dengan memastikan bahwa peserta mengikuti kedua tes dalam kondisi yang sama, yaitu pada waktu yang sama, dengan pencahayaan dan lingkungan umum yang sama, serta diberikan jumlah waktu yang sama untuk menyelesaikan tes.

C. Reliabilitas Untuk Ekivalensi

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah bahasa Inggris disebut alternate-forms method (parallel forms).

Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda. Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument yang satu dengan data instrument yang dijadikan ekuivalen. Bila korelasi positif dan signifikan, maka instrument dapat danyatakan reliable. [2]
[2] https://www.kajianpustaka.com/2017/11/pengertian-karakteristik-pengujian-rumus-reliabilitas.html (diakses pada tanggal 23 september 2023 pada pukul 08:42 WIB )

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

Langkah-langkah tersebut di antaranya adalah seperti berikut:
a. Tentukan subjek sasaran yang hendak dites.
b. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
c. Administrasikan hasilnya secara baik.
d. Dalam waktu yang tidak terlalu lama, Lakukan pengetesan untuk yang kedua kalinya pada grup tersebut.
e. Korelasikan kedua hasil tes skor.

D. Reliabilitas Belah Dua

Metode belah dua atau split half method terlahir untuk mengatasi kelemahan pada metode tes ulang dan tes pararel. Metode belah dua menggunakan sebuah tes dan dicobakan satu kali. Melalui metode ini kelemahan seperti carry-over effect, reactivity effect,dan khususnya pengaruh waktu terhadap perolehan skor dapat diminimalisir. Terdapat beberapa syarat yang harus dipenuhi ketika membelah tes, yaitu:

1. Jumlah soal harus genap sehingga jumlah soal belahan sama banyak.

2. Soal harus homogen sehingga apabila dibagi dua akan terdapat keseimbangan antara belahan pertama dengan belahan kedua.

Terdapat dua metode belah dua. Yang pertama adalah dengan pembelahan gasal-genap. Adapun tahapan dalam pembelahan gasal-genap adalah sebagai berikut.

1. Membuat tabel persiapan perhitungan reliabilitas belah dua gasal-genap.

2. Menentukan jumlah skor gasal, skor genap, kuadrat jumlah skor gasal, dan kuadrat jumlah skor genap.

3. Menghitung rumus korelasi dengan produk momen dengan persamaan:

Menghitung reliabilitas tes dengan rumus Spearman-Brown yaitu:Menginterpretasikan hasil koefisien reliabilitas yang diperoleh.

Adapun metode yang kedua adalah pembelahan awal-akhir dengan tahapan sebagai berikut.

1. Membuat tabel persiapan perhitungan reliabilitas dengan belah awal akhir.

2. Menentukan jumlah skor awal, skor akhir, kuadrat jumlah skor awal, dan kuadrat jumlah skor butir.

3. Menghitung rumus korelasi dengan produk momen dengan persamaan

Cara melakukan reliabilitas belah dua pada garis besarnya dapat dilakukan dengan urutan seperti berikut.

1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.

2. Bagi tes yang ada menjadi dua atas dasar jumlah item-yang paling umum dengan membagi ganjil dan genap pada kelompok tersebut.

3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.

4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran. [3]
[3] https://www.kajianpustaka.com/2017/11/pengertian-karakteristik-pengujian-rumus-reliabilitas.html (diakses pada tanggal 23 september 2023 pada pukul 08:42 WIB )

Jika hasil koefisien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik. Akan dapat diartikan sebaliknya jika hasil korelasi ternyata rendah.

E. Mengukur Homogensi

Cara mengukur konsistensi internal lain, tidak harus dengan membagi tes menjadi 2 bagian. Prosedur ini menilai konsistensi antar item atau homogenitas item-item dalam satu tes evaluasi yang direncanakan.

tujuan utama dari uji homogenitas adalah memastikan bahwa sejumlah populasi yang akan diukur adalah homogen. Dengan kata lain, tidak jauh berbeda keragamannya. Uji homogenitas adalah sebuah persyaratan sebelum melakukan pengujian lainnya seperti T Test dan Anova.

Uji homogenitas adalah proses untuk memastikan bahwa dua atau lebih kelompok populasi yang akan diukur memiliki tingkat keragaman yang serupa atau homogen. Tujuan utama dari uji homogenitas adalah untuk memastikan validitas hasil pengukuran dan memenuhi syarat sebelum melakukan pengujian statistik lainnya, seperti T Test dan Anova.

Uji homogenitas penting dalam penelitian untuk membandingkan varians atau perbedaan antara kelompok-kelompok populasi. Misalnya, jika ingin membandingkan tingkat stres antara karyawan pria dan karyawan wanita, perlu dilakukan uji homogenitas untuk memastikan bahwa kedua kelompok tersebut homogen dalam hal variabilitas stres.

Dengan melakukan uji homogenitas sebelum melakukan pengujian statistik lanjutan, kita dapat memastikan bahwa kelompok-kelompok populasi yang dibandingkan memiliki tingkat keragaman yang serupa. Hal ini penting untuk menghasilkan analisis yang valid dan menghindari kesalahan interpretasi

Contoh Uji Homogenitas

Untuk memperkaya hasil penelitian, kita dapat melakukan uji perbandingan pada dua kelompok populasi yang diukur menggunakan T Test dan Anova. Sebelumnya, kita perlu melakukan uji homogenitas terlebih dahulu untuk meyakinkan dan memastikan bahwa kelompok data berasal dari sampel yang sama. Mari kita simak contoh dan ilustrasi berikut ini:

Contohnya, sebuah penelitian bertujuan untuk mengukur tingkat stres karyawan pada sebuah pabrik tekstil. Setelah data terkumpul, ternyata kita dapat mengamati data apa saja yang dapat diteliti lebih lanjut dengan membandingkan dua kelompok populasi.

Dengan melakukan analisis tambahan tersebut, ternyata kita dapat mengetahui perbedaan tingkat stres karyawan jika ditinjau dari jenis kelamin.Kita juga dapat mengetahui perbedaan tingkat stres jika ditinjau dari jabatan dan status perkawinan.

Sebelum melakukan uji perbandingan pada dua kelompok populasi di atas, kita harus melakukan uji homogenitas terlebih dahulu. Secara statistika, populasi yang diukur harus homogen agar hasil pengukuran menjadi valid dan akurat.

F. Alfa Cronbach

Alfa Cronbach digunakan, ketika mengukur tes sikap yang mempunyai item standar pilihan ganda atau dalam bentuk tes esai. Alfa Cronbach pada prinsipnya termasuk mengukur homoginitas yang didalamnya memfokuskan pada dua aspek penting, yaitu aspek isi (content) dan aspek heterogenitas dari tes tersebut. Penerapan Alfa Cronbach, misalnya seorang peneliti menentukan varians dari semua skor dari 1 – 5 tergantung optional yang dipilih atau tes esai dengan angka yang berbeda diberikan untuk setiap jawaban.

Dengan perkembangan teknologi informasi dan semakin intensifnya penggunaan kompeter untuk mendukung suatu penelitian, perhitungan formula Alfa sudah banyak dilakukan menggunakan program komputer dengan Alfa sebagai indeks reliabilitas. Jika item tes heterogen, berarti mereka mengukur lebih dari satu karakteristik, traits atau attribute dan akan menyebabkan koefisien alpha semakin rendah. Sebaliknya, jika tes semakin homogeny maka harga koefisien Alfa akan semkin tinggi yang berarti tes tersebut semakin konsisten. [4]
[4] https://jurnal.untirta.ac.id/index.php/jft/article/view/1732/1538 ( diakses pada tanggal 23 september pukul 20:11)

Pengujian reliabilitas menggunakan uji Alfa Cronbach dilakukan untuk instrumen yang memiliki jawaban benar lebih dari 1 (Adamson & Prion, 2013). Instrumen tersebut misalnya instrumen berbentuk esai, angket, atau kuesioner.

Jika koefisien reliabilitas Alfa Cronbach telah dihitung (ri), nilai tersebut kemudian dibandingkan dengan kriteria koefisien reliabilitas Alfa Cronbach untuk instrumen yang reliabel. Menurut Nunnally (dalam Streiner, 2003) menyatakan bahwa instrumen dikatakan reliabel jika koefisien reliabilitas Alfa Cronbach lebih dari 0,70 (ri > 0,70) dan Streiner sendiri (2003) menyatakan bahwa koefisien reliabilitas Alfa Cronbach, tidak boleh lebih dari 0,90 (ri < 0,9)

Mereka menyarankan untuk mengurangi jumlah soal dengan kriteria soal yang sama meskipun dalam bentuk kalimat yang berbeda.

G. Kesalahan Baku Dalam Pengukuran

Konsep lain yang juga merefleksikan konsistensi suatu tes adalah nilai kesalahan baku pengukuran (standard error of measurement). Kesalahan baku pengukuran merupakan estimasi tentang bagaimana seorang peneliti evaluasi mengharapkan kesalahan dari tes yang telah dibuat.

Kesalahan baku pengukuran pada umumnya dapat juga menunjukkan tingkat reliabilias tes. Jika nilai kesalahan baku pengukuran suatu tes yang telah dibuat kecil, berarti reliabilitas tes tersebut tinggi. Sebaliknya, jika nilai kesalahan baku pengukuran besar berarti bahwa tes yang telah dibuat mempunyai reliabilitas rendah. Apa yang terjadi seandainya tes yang telah dibuat mempunyai reliabilitas sempurna (+1 atau -1 ) ? Walaupun hal itu tidak pernah terjadi, pertanyaan tersebut dapat dijawab bahwa skor tes yang dicapai dari pengetesan adalah menunjukkan nilai yang sebenarnya.

Formula kesalahan baku pengukuran dapat ditunjukkan seperti berikut.
Di mana

Sm = Kesalahan baku pengukuran
SD = Simpang baku skor tes
R = Koefisien konsistensi

Sebagai contoh : dari satu set tes setelah dihitung memiliki simpang baku (SD) = 8, Koefisien relibalitas belah dua = 0,84. Estimasi kesalahan ukur baku tes dapat dihitung sebgai berikut
Apa yang terjadi apabila kofisien konsistensi tesnya adalah rendah ?
Estimasi kesalahan pengukuran yang diperoleh dari masing-masing metode dapat digunakan untuk mengestimasi interval skor murni. Lebar atau sempitnya interval skor murni pada taraf kepercayaan tertentu tergantung pada besar kecilnya kesalahan baku pengukuran. Kesalahan baku pengukuran membantu menyatakan batas kesalahan yang terjadi pada setiap tes dan secara khusus berguna untuk mengestimasi skor peserta tes yang sebenarnya. Kesalahan baku pengukuran membantu menginterpretasikan kedekatan antara skor tampak dan skor sebenarnya, dalam hal ini menetapkan interval kepercayaan. Semakin kecil kesalahan baku pengukuran semakin sempit interval kepercayaan skor sebenarnya, yang berarti hasil tes semakin cermat. Sebaliknya, semakin besar kesalahan baku pengukuran maka akan semakin lebar pula interval kepercayaan yang terjadi

Menurut Crocker dan Algina (1986), dikutip dari Sumarna, menyebutkan bahwa faktor yang mempengaruhi reliabilitas tes antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. Menurut Alen dan Yen (1979) dan Crocker dan Algina (1986) tingkat kesukaran itu memegang peranan yang paling dominan. Hasil penelitian Aiken et. al, dikutip dari Sumarna, menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan yang paling besar pada koefisien reliabilitas. Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar pula reliabilitas tes tersebut. Sebaliknya, semakin rendah tingkat kesukaran suatu soal semakin kecil pula reliabilitasnya. Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang akan diujikan kepada mereka. Penambahan panjang tes akan menaikkan koefisien reliabilitas sepanjang soal yang digunakan untuk menambah tes itu memiliki kualitas yang sama baik dengan soal-soal lainnya.

Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat dan terlalu jauh, akan memengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi relibilitas instrument evaluasi diantaranya sebagai berikut.

1. Panjang tes ; semakin panjang suatu tes evaluasi, semakin banya jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak.Berarti akan semakin tinggi nilai koefisien reliabilitas.

2. Penyebaran skor ; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas (Grondlund 1990 : 94). Hal ini terjadi karena posisi skor siswa secara individual mempunyai kedudukan sama pada tes retes lain, sebagai acuan.

3. Kesulitan tes ; tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk tes yang terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas, mislanya 9 atau 10. Untuk tes yang terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung sebaliknya, atau rendah. Dua gejala tersebut mempunyai kesamaan yaiu bahwa perbedaan diantara individu adalah kecil dan cenderung tidak relevan.

4. Objektivitas ; yang dimaksud dengan objektiv yaitu derajat di mana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki objektivitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran. Item tes skor objekif yang dihasilkan tidak dipengaruhi pertimbangan atau opini dari seorang evaluator.

H. Faktor-faktor Yang Memengaruhi Reliabilitas

Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes tersebut memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada responden yang sama. Reliabilitas merupakan salah satu kriteria yang harus dipenuhi oleh instrumen pengukuran sebelum digunakan untuk mengumpulkan data. Reliabilitas mengacu pada ketetapan atau kekonsistenan alat ukur, meskipun digunakan berulang kali pada subjek yang sama. Hal ini bukanlah berarti bahwa untuk mendapatkan alat ukur yang reliabel harus selalu melalui pengulangan penggunaan alat ukur tersebut pada subjek yang sama Tujuan utama mengestimasi reliabilitas adalah untuk menentukan seberapa besar variabilitas yang terjadi akibat adanya kesalahan pengukuran dan seberapa besar variabilitas skor tes sebenarnya. Banyak prosedur yang dapat ditempuh untuk mengetahui indek koefisien reliabilitas suatu instrumen pengukuran. Ada banyak faktor yang mempengaruhi reliabilitas suatu instrumen.

Menurut teori klasik, reliabilitas dihubungkan dengan pengertian adanya ketepatan suatu tes dalam pengukuran. Reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari satu pengukuran ke pengukuran lainnya. jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi.

Menurut Crocker dan Algina (1986), dikutip dari Sumarna, menyebutkan bahwa faktor yang mempengaruhi reliabilitas tes antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. Menurut Alen dan Yen (1979) dan Crocker dan Algina (1986) tingkat kesukaran itu memegang peranan yang paling dominan. Hasil penelitian Aiken et. al, dikutip dari Sumarna, menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan yang paling besar pada koefisien reliabilitas. Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar pula reliabilitas tes tersebut. Sebaliknya, semakin rendah tingkat kesukaran suatu soal semakin kecil pula reliabilitasnya. Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang akan diujikan kepada mereka. Penambahan panjang tes akan menaikkan koefisien reliabilitas sepanjang soal yang digunakan untuk menambah tes itu memiliki kualitas yang sama baik dengan soal-soal lainnya.[5]
[5] Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung: Remaja Rosdakarya, 2006

Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat dan terlalu jauh, akan memengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi relibilitas instrument evaluasi diantaranya sebagai berikut.

3. Panjang tes ; semakin panjang suatu tes evaluasi, semakin banya jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak.Berarti akan semakin tinggi nilai koefisien reliabilitas.

4. Penyebaran skor ; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas (Grondlund 1990 : 94). Hal ini terjadi karena posisi skor siswa secara individual mempunyai kedudukan sama pada tes retes lain, sebagai acuan.

5. Kesulitan tes ; tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk tes yang terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas, mislanya 9 atau 10. Untuk tes yang terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung sebaliknya, atau rendah.

I. Persyaratan Kegunaan

Syarat lain yang juga perlu dipertimbangkan, ketika seorang guru hendak menggunakan instrument evaluasi, yaitu syarat kegunnaan atau sering disebut usability. Kegunaan merupakan syarat instrumen evaluasi yang lebih berorientasi pada pertimbangan praktis. Di samping itu, bagi para guru yang banyak menggunakan instumen buatan sendiri dari pada instrument buatan lembaga pembuat tes, maka pertimbangan praktis ini sangat penting perannya. Beberapa pertimbangan praktis yang perlu diperhatikan itu di anataranya seperti berikut.

1. Tes atau instrument yang hendak digunakan sebaiknya memiliki kemudahan administrasi yang di dalamnya mengandung unsur : mudah diatur, disimpan dan digunakan sewaktu-waktu secara mudah.

2. Waktu yang diperlukan untuk proses administrasi sebaiknya singkat, cepat, dan tepat.

3. Instrumen sebaiknya juga mudah diinterpretasi oleh guru ahli maupun guru yang kurang mendapat latihan di bidang instrumen evaluasi.

4. Adanya bebrapa macam jenis instrument yang memiliki ekivalensi sama sehingga bisa digunakan sebagai pengganti atau variasi instrument

5. Instrumen evaluasi sebaiknya memiliki katrateristik biaya murah, dan dapat dijangkau oleh guru atau sekolah yang hendak mengunakannya.

BAB III
PENUTUP

A. Kesimpulan

Penyusunan tes hasil belajar merupakan hal yang urgen dalam proses pembelajaran. Maka dari itu, tes yang disusun harus mempunyai kualitas yang baik, diantaranya adalah tes bersifat reliabel atau memiliki reliabilitas. Agar tes bersifat reliabel kita perlu tahu faktor apa sajakah yang mempengaruhi reliabilitas tes. Berdasarkan uraian sebelumnya, dapatdisimpulkan bahwa faktor-faktor yang mempengaruhi reliabilitas suatu tes adalah tes-retes, bentuk ekivalensi, reliabilitas dengan belah dua, Alfa Cronbach, kesalahan baku dalam pengukuran, factor-faktor yang mempengaruhi reliabilitas. Jika guru memperhatikan hal-hal tersebut diharapkan tes hasil belajar memiliki kualitas yang baik.

B. Kritik Dan Saran

Harapan kami penulis dan siapa yang membaca makalah ini bisa memahami dan mengambil manfaatnya sebaik-baiknya. Kami menyadari dalam penyusunan makalah ini terdapat banyak kekurangan dari pembaca kritik dan saran yang membangun.

DAFTAR PUSTAKA

Adhi Setiyawan (20140 Faktor-faktor yang mempengaruhi reliabilitas tes

Yusup Febrianawati (2018) Jurnal Tarbiyah: Jurnal Ilmiah Kependidikan

Prof. H.M Sukardi,MS.,Ph.D. “Evaluasi penndidikan prinssip & operasionalnya”

Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung:

Remaja doskarya 2006

https://jurnal.untirta.ac.id/index.php/jft/article/view/1732/1538

Tidak ada komentar:

Posting Komentar