PENDAHULUAN
A. Latar Belakang
Kegiatan mengukur, menilai, dan mengevaluasi sangatlah penting dalam
dunia pendidikan. Hal ini tidak terlepas karena kegiatan tersebut merupakan
suatu siklus yang dibutuhkan untuk mengetahui sejauhmana pencapaian pendidikan
telah terlaksana. Tehnik evaluasi disebut juga instrumen atau alat pengumpul
data hasil belajar (Sudjana, 2006). Di dalam dunia pendidikan, kita mengetahui bahwa setiap jenis atau bentuk
pendidikan pada waktu-waktu tertentu selama satu periode pendidikan, selalu
mengadakan evaluasi. Artinya pada waktu-waktu tertentu selama satu periode
pendidikan, selalu mengadakan penilaian terhadap hasil yang telah dicapai, baik
oleh pihak terdidik maupun oleh pendidik. Kegiatan ini
dimaksudkan untuk mengetahui apakah tujuan yang telah dirumuskan itu tercapai
atau belum, dan apakah materi pelajaran yang diajarkan sudah tepat. Semua
pertanyaan tersebut akan dapat dijawab melalui kegiatan evaluasi atau
penilaian. Informasi yang diperoleh melalui evaluasi ini merupakan umpan balik (feed back) terhadap proses belajar
mengajar. Umpan balik ini akan dijadikan titik tolak untuk memperbaiki dan
meningkatkan proses belajar mengajar selanjutnya. Dengan demikian proses
belajar mengajar akan terus dapat ditingkatkan untuk memperoleh hasil yang
optimal.
Evaluasi memiliki kedudukan yang penting dalam proses
pembelajaran. Dengan melakukan evaluasi, guru sebagai pengelola kegiatan
pembelajaran dapat mengetahui kemampuan yang dimiliki peserta didik, ketepatan
metode yang digunakan, dan keberhasilan peserta didik dalam meraih kompetensi
yang telah ditetapkan.
Berdasarkan hasil penilaian, pendidik dapat mengambil
keputusan secara tepat untuk menentukan langkah yang akan diambil selanjutnya .
Hasil penilaian juga dapat
memberikan motivasi kepada peserta didik
untuk berprestasi lebih baik di kemudian hari.
Selanjutnya
didalam melakukan evaluasi ada dua teknik evaluasi yang kita kenal yaitu teknik
evaluasi menggunakan tes dan evaluasi dengan teknik non tes, Teknik non tes
pada umumnya memegang peranan penting dalam rangka mengevaluasi hasil belajar
peserta didik dari segi ranah sikap (affective domain) dan ranah
ketrampilan (Psychomotoric domain), sedangkan teknik tes lebih banyak
digunakan untuk mengevaluasi hasil belajar peserta didik dari segi ranah proses
berfikirnya (cognitif domain) (Sudiyono, 2005). Pada makalah ini penulis
berkesempatan menyajikan teknik penilaian non tes secara lebih mendalam baik
pengertian, bentuk-bentuknya maupun penggunannya dalam menilai hasil belajar.
B. Rumusan Masalah
Berdasarkan
latar belakang di atas, maka rumusan masalah pada makalah ini adalah sebagai
berikut.
1. Apa
pengertian instrumen non tes?
2. Apa
pengertian validitas?
3. Apa
saja jenis-jenis validitas?
4. Apa
pengertian reliabilitas?
5. Apa
saja jenis-jenis reliabilitas?
6. Bagaimana
analisis instrumen non tes?
C. Tujuan Penulisan
Berdasarkan rumusan masalah di
atas, maka tujuan penulisan dari makalah ini adalah sebagai berikut.
1. Untuk
mengetahui pengertian instrumen non tes.
2. Untuk
mengetahui pengertian validitas.
3. Untuk
mengetahui jenis-jenis validitas.
4. Untuk
mengetahui pengertian reliabilitas.
5. Untuk
mengetahui jenis-jenis reliabilitas.
6. Untuk
mengetahui cara menganalisis instrumen non tes.
BAB
II
PEMBAHASAN
A. Pengertian Instrumen Non Tes
Dalam
pengertian umum, alat adalah sesuatu yang dapat digunakan untuk mempermudah seseorang
untuk melaksanakan tugas atau mencapai tujuan secara lebih efektif dan efisien.
Kata alat biasa disebut juga dengan istilah instrumen (Arikunto, 2001).
Teknis
nontes adalah suatu alat penilaian yang biasanya dipergunakan untuk mendapatkan
informasi tertentu tentang keadaan peserta tes yang (dalam bahasa Inggris
disebut dengan testee) dengan tidak menggunakan tes. Hal ini berarti bahwa
jawaban yang diberikan oleh peserta tes tidak bisa dikategorikan sebagai
jawaban benar atau salah sebagaimana interpretasi jawaban tes. Dengan teknik
nontes maka penilaian atau evaluasi hasil belajar peserta didik dilakukan tanpa
menguji peserta didik melainkan dilakukan dengan cara tertentu.
Adapun
menurut Hasyim (1997) dalam Disnawati (2012), penilaian non tes adalah
penilaian yang mengukur kemampuan siswa secara langsung dengan tugas-tugas riil
dalam proses pembelajaran. Penilaian non tes banyak terdapat pada keterampilan
menulis untuk bahasa, percobaan laboratorium, bongkar pasang mesin, teknik dan
sebagainya.
Penilaian
yang dilakukan dengan teknis nontes terutama bertujuan untuk memperoleh
informasi yang berkaitan dengan evaluasi hasil belajar peserta didik dari segi
ranah sikap (affective domain) dan ranah
ketrampilan (psychomotoric domain) (Sudiyono,
2005).
Berdasarkan
pengertian-pengertian diatas maka instrument evaluasi jenis non tes diartikan sebagai
sesuatu yang digunakan untuk mempermudah pihak-pihak tertentu untuk memperoleh
kualitas atas suatu objek dengan tidak menggunakan tes.
B. Pengertian Validitas
Menurut Azwar dalam Uno dan Koni (2012) validitas berasal dari kata
validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu
alat ukur dalam melakukam fungsi ukurannya. Selain itu validitas adalah suatu
ukuran yang menunjukkan bahwa variabel yang diukur memang benar-benar variabel
yang hendak diteliti oleh peneliti (Cooper dan Schindler, dalam Zulganef,
2006).
Sedangkan menurut Sugiharto dan Sitinjak dalam Uno dan Koni (2012),
validitas berhubungan dengan suatu peubah mengukur apa yang seharusnya diukur.
Validitas dalam penelitian menyatakan derajat ketepatan alat ukur penelitian
terhadap isi sebenarnya yang diukur. Ghozali dalam Disnawati (2012) menyatakan
bahwa uji validitas digunakan untuk mengukur sah, atau valid tidaknya
suatu kuesioner. Suatu kuesioner dikatakan valid jika pertanyaan pada kuesioner
mampu untuk mengungkapkan sesuatu yang akan diukur oleh kuesioner tersebut.
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran.
Suatu alat ukur yang valid dapat menjalankan fungsi ukurnya dengan tepat, juga
memiliki kecermatan tinggi. Arti kecermatan di sini adalah dapat mendeteksi
perbedaan-perbedaan kecil yang ada pada atribut yang diukurnya. Karakteristik pertama
dan memiliki peranan sangat penting dalam instrumen evaluasi, yakni
karakteristik valid (validity).
Valid, menurut Gronlund dalam Arifin (2013) dapat diartikan sebagai ketepatan
interpretasi yang dihasilkan dari skor tes atau instrumen evaluasi.
Suatu instrumen evaluasi dikatakan
valid, seperti yang diterangkan oleh Gay dan Johnson dalam Sukardi (2010),
apabila instrumen yang digunakan dapat mengukur apa yang hendak diukur. Jadi,
jika tes tersebut adalah tes pencapaian hasil belajar maka hasil tes tersebut
apabila diinterpretasi secara intensif, hasil yang dicapai memang benar
menunjukkan ranah evaluasi pencapaian hasil belajar. Validitas suatu instrumen evaluasi, tidak lain adalah derajat yang
menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu
instrumen evaluasi mempunyai beberapa makna penting di antaranya seperti
berikut.
1. Validitas
berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi
untuk grup individual dan bukan instrumen itu sendiri.
2. Validitas
diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori
redah, menengah, dan tinggi.
3. Prinsip
suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan
oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan tertentu
saja. Tes valid untuk bidang studi metrologi industri belum tentu valid untuk
bidang yang lain misalnya bidang mekanika teknik.
Berdasarkan
dari beberapa pengertian validitas menurut para ahli dapat disimpulkan bahwa
validitas merupakan suatu keadaan apabila suatu instrumen evaluasi dapat
mengukur apa yang sebenarnya harus diukur secara tepat.
C. Jenis-Jenis Validitas
Validitas suatu tes dalam Arifin (2013) dapat
dibedakan menjadi empat jenis, anatara lain permukaan (face validity), validitas isi (content
validity), validitas empiris (empirical
validity), dan validitas konstruk (construct
validity), dan validitas faktor (factorial
validity) yang akan diuraikan dengan lebih jelas seperti berikut.
1.
Validitas
Permukaan (Face Validity)
Validitas
ini menggunakan kriteria yang sangat sederhana,karena hanya melihat dari sisi
muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka
tes tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan,
sehingga tidak perlu lagi adanya judgement
mendalam.
2.
Validitas
Isi (Content Validity)
Validitas
isi berhubungan dengan kesanggupan tes untuk mengukur isi yang seharusnya
diukur. Validitas ini sering digunakan dalam penilaian hasil belajar. Tujuan
utamanya adalah untuk mengetahui sejauh mana peserta didik menguasai materi
pelajaran yang telah disampaikan, dan perubahan-perubahan psikologis apa yang
timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran
tertentu. Jika dilihat dari kegunaannya dalam penilaian hasil belajar,
validitas ini sering juga disebut validitas kurikuler atau validitas perumusan.
Untuk
mendapatkan validitas isi memerlukan dua aspek penting, yaitu valid isi dan
valid teknik sa,pling. Vilid isi mencakup hal-hal yang berkaitan dengan apakah
item-item evaluasi menggambarkan pengukuran dalam cakupan yang ingin diukur.
Sedangkan validitas teknik sampling pada umumnya berkaitan dengan bagaimanakah
baiknya suatu sampel item tes merepresentasikan total cakupan isi.
3.
Validitas
Empiris (Empirical Validity)
Istilah
validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen
dapat dikatakan mememiliki validitas empiris apabila sudah diuji dari
pengalaman.
Validitas
ini biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini
disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu
kriteria tertentu yang merupakan suatu tolak ukur di luar tes yang
bersangkutan. Namun, kriteria itu harus relevan dengan apa yang harus diukur.
Validitas empiris disebut juga validitas yang dihubungkan dengan kriteria (criterion-related validity) atau
validitas statistik (statistical
validity).
4. Validitas Konstruk (Construct Validity)
Validitas
konstruk menunjuk pada sejauh mana suatu instrumen mampu mengukur
pengertian-pengertian yang terkandung dalam materi yang akan diukur. Misalnya,
instrumen minat harus mampu mengukur pengertian-pengertian yang terkandung pada
variabel minat.Agar lebih jelas, biasanya variabel tersebut diuraikan dulu
menjadi indikator-indikator.
Konstruk
adalah konsep yang dapat diobservasi (observable)
dan dapat diukur (measurable).
Validitas konstruk sering juga disebut validitas logis (logical validity). Validitas konstruk berkenaan dengan pertanyaan
hingga mana suatu tes betul-betul dapat mengobservasi dan mengukur fungsi
psikologis yang merupakan deskripsi perilaku peserta didik yang akan diukur
oleh tes tersebut. Validitas konstruk banyak dikenal dan digunakan dalam
tes-tes psikologis untuk mengukur gejala perilaku yang abstrak, seperti
kesetiakawanan, kematangan emosi, sikap, motivasi, minat dan sebagainya.
5.
Validitas
faktor (Factorial Validity)
Dalam
penilaian hasil belajar sering digunakan skala pengukuran tentang suatu
variabel yang terdiri ats beberapa faktor. Faktor-faktor tersebut diperoleh
berdasarkan dimensi/indikator dari variabel yang diukur deduai dengan apa yang
terungkap dalam konstruksi teoritisny, Meskipun variabel terdiri atas beberapa
faktor, tetapi prinsip homogenitas untuk keseluruhan faktor harus tetap
dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor dengan
faktor yang lain.Dengan demikian kriterium yang digunakan dalam validitas
faktor ini dapat diketahui dengan menghitung homogenitas skor setipa faktor
dengan total skor, dan antara skor fari faktor yang satu dengan skor dari
faktor yang lain.
D. Pengertian Reliabilitas
Reliabilitas berasal dari kata reliability. Pengertian dari reliability
(rliabilitas) adalah keajegan pengukuran (Walizer, dalam Arikunto, 2001).
Sugiharto dan Situnjak dalam Uno dan Koni (2012) menyatakan bahwa reliabilitas
menunjuk pada suatu pengertian bahwa instrumen yang digunakan dalam penelitian
untuk memperoleh informasi yang digunakan dapat dipercaya sebagai alat
pengumpulan data dan mampu mengungkap informasi yang sebenarnya dilapangan.
Ghozali dalam Disnawati (2012) menyatakan bahwa reliabilitas adalah alat
untuk mengukur suatu kuesioner yang merupakan indikator dari peubah atau
konstruk. Suatu kuesioner dikatakan reliabel atau handal jika jawaban seseorang
terhadap pernyataan adalah konsisten atau stabil dari waktu ke waktu.
Reliabilitas suatu tes merujuk pada derajat stabilitas, konsistensi, daya
prediksi, dan akurasi. Pengukuran yang memiliki reliabilitas yang tinggi adalah
pengukuran yang dapat menghasilkan data yang reliabel
Singarimbun dalam Arikunto (2001), realibilitas adalah indeks yang
menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan.
Bila suatu alat pengukur dipakai dua kali untuk mengukur gejala yang sama dan
hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut
reliabel. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat
pengukur di dalam mengukur gejala yang sama.
Menuru Suryabrata dalam Sudiyono (2005) reliabilitas menunjukkan
sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil
pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan
kemantapan.Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes
dengan tes ulang) akan memberikan hasil yang sama. Reliabilitas tidak sama
dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara
konsisten, tapi belum tentu mengukur apa yang seharusnya diukur. Dalam
penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap
konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi
yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang
konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran
yang berulang itu memberikan hasil yang berbeda-beda.
Reliabilitas berhubungan dengan
konsistensi hasil pengukuran yaitu seberapa konsistensi skor tes dari satu
pengukuran ke pengukuran berikutnya. Reliabilitas dinyatakan dengan koefisien
reliabilitas, yaitu koefisien korelasi yang menunjukkan derajat hubungan antara
dua hasil pengukuran yang diperoleh dari instrumen atau prosedur yang sama.
Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa
yang diinginkan, atrinya kapan puan alat tersebut digunakan akan memkberikan hasil
yang ralatif sama. Tes hasil belajar dikatakan ajeg apabila hasil pengukuran
saat ini menunjukkan kesamaan hasil pada saat yang berlainan, jika dikenakan
pada siswa yang sama. Meskipun masih memungkinkan terjadi perbedaan hasil untuk
hal-hal tertentu akibat dari faktor kebetulan, selang waktu, perubahan
pandangan siswa terhadap soal.
Jadi,
dapat disimpulkan bahawa reliabilitas adalah tingkat atau derajat konsistensi dari suatu
instrument. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti
dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan.Suatu tes
diteskan pada kelompok yang sama bila di teskan pada kelompok yang sama pada
waktu atau kesempatan yang berbeda.
E. Jenis-Jenis Reliabilitas
Ada
beberapa tipe reliabilitas tes dalam Sukardi (2010) yang sering digunakan dalam
kegiatan evaluasi dan masing-masing reliabilitas mempunyai konsistensi yang
berbeda-beda. Beberapa tipe reliabilitas diantaranya adalah sebagai berikut.
1.
Reliabilitas
Dengan Tes-Retes
Realibilitas tes-retes tidak lain adalah
derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu.
Tes-retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes
evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan
pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor
siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa
tersebut dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut,
seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa
yang ingin diukur.
Realibilitas tes-retes ini penting,
khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan.
Tes kemampuan tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu
berubah-ubah secara signifikan saat diberikan kepada responden. Penentuan
pemakaian reliabilitas tes-retes juga tepat ketika bentuk tes alternatif
lainnya tidak ada, dan ketika tampak bahwa orang yang mengambil tes kedua
kalinya tidak ingat atas jawaban tes yang pertama. Para pengambil tes pada
umumnya akan terus mengingat jawabannya, jika item-item yang ada banyak
mengandung faktor sejarah, dibanding bentuk jawaban item ilmu pengetahuan
aljabar misalnya.
Realibilitas tes-retes dapat dilakukan
dengan cara seperti berikut.
a. Selenggarakan
tes pada suatu kelompok yang tepat sesuai dengan rencana.
b. Setelah
selang waktu tertentu, misalnya 1 minggu atau dua minggu, lakukan kembali tes
yang sama dengan kelompok yang sama tersebut.
c. Korelasikan
hasil kedua tes tersebut.
Jika hasil korelasi menunjukkan tinggi,
berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah,
berarti tes tersebut mempunyai korelasi rendah.
Tes-retes juga mempunyai beberapa
permasalahan. Di antaranya ialah faktor waktu jeda atau tenggang yang diambil,
ketika dilakukan tes pertama dengan tes kedua. Jika interval waktu terlalu
pendek, mahasiswa memiliki kesempatan untuk mengingat jawaban dalam tes
sehingga tes yang kedua dapat dipastikan lebih baik, karena faktor retensi atau
sisa-sisa hafalan yang terjadi pada subjek pelaku. Jika interval waktu terlalu
panjang, kemampuan para pelaku yang mengikuti tes mungkin bertambah karena dua
kemungkinan, yakni faktor maturasi atau kedewasaan dan faktor intervensi dari
faktor belajar dari para subjek.
Faktor-faktor tersebut menjadikan
konsistensi tes cenderung artifisial dan rendah. Mengenai interval waktu yang
baik antara tes pertama dengan tes berikutnyadiberikan kepada subjek pelaku
pilot studi, Gay (1983: 118) memberikan referensi bahwa 1 hari terlalu pendek,
sebaliknya 1 bulan terlalu panjang. Oleh karena itu, selisih waktu pemberian
tes melalui tes-retes diantara 1 atau 2 minggu.
2.
Reliabilitas
Bentuk Ekivalensi
Sesuai dengan namanya yaitu ekivalen,
maka tes evaluasi yang hendak diukur reliabilitasnya
dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat
berbeda. Kedua tes tersebut sebaiknya mempunyai karakteristik sama.
Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai
jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai
petunjuk, cara penskoran, dan interpretasi yang sama.
Dari semua kondisi yang direncanakan
secara ekivalen di atas, idealnya jika suatu kelompok mengambil dua tes
tersebut maka rerata skor maupun variabilitas skor yang dicapai dari kedua tes
yang diambil mestinya sama. Jika dikehendaki sebenarnya, kita dapat memilih,
mengambil sampel, dan item yang berbeda dari ranah tingkah laku sama. Yang
perlu diperhatikan mestinya adalah dalam hal apakah pemberian skor tergantung
item pilihan atau pada penampilan atas item-item yang dapat digeneralisasi pada
lainnya. Jika item terpilih baik dan setiap setnya menggambarkan ranah yang
setaraf, maka penggambaran tersebut mestinya benar.
Reliabilitas ekivalen, pada umumnya juga
menggambarkan bentuk konsistensi alternatif, yang dapat menunjukkan variasi
skor yang terjadi dari bentuk tes evaluasi satu dengan bentuk tes lainnya. Akan
tetapi, yang juga perlu diingat ialah bahwa pengambil tes reliabilitas ekivalen
ini akan dapat mencapai hasil yang tepat, jika pengamilan tes hafal terhadap
jawaban tes yang dibuat dalam sesi pertama, sehingga mereka dapat menjawab
kembali tes yang kedua. Ketika dua bentuk alternatif tes tersedia, yang perlu
diketahui dari kedua tes adalah berapa rliabilitas ekivalensi. Hal ini perlu
diyakinkan kembali, agar terjadi bahwa skor seseorang tidak akan dipengaruhi
oleh cara mengadministrasi tes tersebut.
Implikasi dari analisis di atas ialah
bahwa seringkali terjadi bahwa sebuah tes evaluasi diberikan lehih dari satu
kali padu grup yang sama. Pertama tes diherikan pada grup sebagai pre tes dan
setelah selang waktu tertentu diberikannya untuk yang kedua kalinya sbagai
postes. Hal lain yang juga perlu diketahui ialah bahwa ada kemungkinan pengaruh
kegiatan intervening, ketika mengukur suatu hal yang esensinya sama dengan
menggunakan tes sama.
Beberapa langkah yang perlu diambil oleh
seorang mahasiswa peneliti. Langkah-langkah tersebut di antaranya adalah
seperti berikut.
a. Tentukan
subjek sasaran yang hendak di tes.
b. Lakukan
tes yang dimaksud kepada subjek sasaran tersebut.
c. Administrasi
hasilnya secara baik.
d. Dalam
waktu yang tidak terlalu lama, lakukan pengetesan untuk yang kedua kalinya pada
kelompok tersebut.
e. Korelasikan
kedua hasil set skor.
Jika hasil koefisien ekivalen tinggi,
berani tes memiliki reliabilitas ekivalen baik; sebaliknya, jika ternyata bahwa
koefisien rendah maka reliabilitas ekivalen tes adalah rendah. Reliabilitas
ekivalen merupakan salah satu bentuk yang dapat diterima dan umum dipakai
penelitian terutama penelitian pendidikan. Yang perlu diketahui juga bagi para
peneliti adalah bahwa tes ekivalen mempunyai kelemahan yaitu bahwa membuat dua
buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu
tarjadi kesalahan pengukuran.
3.
Reliabilitas
dengan Belah Dua
Realibilitas
belah dua ini termasuk realibilitas yang mengukur konsistensi internal. Yang
dimaksud dengan konsistensi internal ialah salah satu tipe reliabilitas yang
didasarkan pada keajegan dalam setiap item tes evaluasi. Reliabilitas belah dua
ini pelaksanaannya hanya memerlukan waktu satu kali. Ada beberapa kemungkinan
dalam cara ini. Termasuk peredaan kondisi tes yang terjadi, ketika menggunakan
metode tes-retes dapat dihilangkan. Reliabilitas belah dua juga tepat
digunakan, ketika tes evaluasi yang ada terlalu panjang.
Cara melakukan
reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan seperti
berikut.
a. Lakukan
pengetesan item-item yang telah dibuat kepada subjek sasaran.
b. Bagi
tes yang ada menjadi dua atas dasar jumlah item yang paling umum dengan membagi
item dengan nomor ganjil dan genap pada kelompok tersebut.
c. Hitung
skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
d. Korelasikan
kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik
pengukuran.
Jika
hasil koefisien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik.
Akan terjadinya sebaliknya, jika hasil korelasi belah dua item tes ternyata
rendah.
F.
Analisis
Instrumen Non Tes
Berikut akan dijelaskan cara
menganalisis valididtas dan reliabilitas dari instrumen non tes menurut Uno dan
Koni (2012).
1.
Pengujian
Validitas Instrumen
Teknik pengujian yang sering digunakan para peneliti untuk uji validitas
adalah menggunakan korelasi Bivariate Pearson (Produk Momen Pearson).
Analisis ini dengan cara mengkorelasikan masing-masing skor item dengan skor
total. Skor total adalah penjumlahan dari keseluruhan item. Item-item
pertanyaan yang berkorelasi signifikan dengan skor total menunjukkan item-item
tersebut mampu memberikan dukungan dalam mengungkap apa yang ingin diungkap
Azwar dalam Uno dan Koni (2012)
berpendapat bahwa kalau skor butir bukan dikotomi, tetapi berskala interval,
maka teknik korelasi product momment
dapat digunakan. Kemudian untuk melihat hasil pengujian valid atau tidak, hasil
perhitungan validitas dibandingkan dengan tabel harga kritik. Koefisien
korelasi product momment (
) dari semua item kemudian dibandingkan dengan harga
untuk mengetahui
validitas masing-masing item (uji 2 sisi dengan sig. 0,05). Jika
maka item bersangkutan
dinyatakan valid, sebaliknya jika
maka item bersangkutan
dinyatakan tidak valid.
Formula statistik yang digunakan
dalam analisi validitas butir non tes digunakan korelasi product momment. Model formula statistik sebagai berikut.
Keterangan:
r:
nilai korelasi product momment
n:
banyaknya responden
x:
skor butir
y:
skor total butir
Sebagai gambaran perhitungan
diperlihatkan cara menghitung secara manual sebagai berikut: pertama diperlukan
tabel kerja. Selengkapnya pengujian tiap item dalam instrumen adalah sebagai
berikut.
a. Validitas
item nomor 1
Tabel
kerja untuk menghitung koefisien korelasi product
momment untuk item nomor 1 adalah sebagai berikut
Tabel
2.1 Tabel Kerja untuk Menghitung Koefisisen Korelasi Product Momment Item 1
Siswa
|
x
|
y
|
|
|
Xy
|
A
|
2
|
94
|
4
|
8836
|
188
|
B
|
3
|
63
|
9
|
3969
|
189
|
C
|
4
|
54
|
16
|
2916
|
216
|
D
|
3
|
104
|
9
|
10816
|
312
|
E
|
3
|
99
|
9
|
9801
|
297
|
F
|
5
|
80
|
25
|
6400
|
400
|
G
|
1
|
69
|
1
|
4761
|
69
|
H
|
2
|
69
|
4
|
4761
|
138
|
I
|
4
|
111
|
16
|
12321
|
444
|
J
|
2
|
51
|
4
|
2601
|
102
|
K
|
4
|
109
|
16
|
11881
|
436
|
L
|
4
|
76
|
16
|
5776
|
304
|
M
|
3
|
84
|
9
|
7056
|
252
|
N
|
1
|
57
|
1
|
3249
|
57
|
O
|
4
|
102
|
16
|
10404
|
408
|
P
|
4
|
94
|
16
|
8836
|
376
|
Q
|
2
|
78
|
4
|
6084
|
156
|
R
|
3
|
86
|
9
|
7396
|
258
|
S
|
3
|
93
|
9
|
8649
|
279
|
T
|
3
|
87
|
9
|
7569
|
261
|
U
|
3
|
66
|
9
|
4356
|
198
|
V
|
3
|
80
|
9
|
6400
|
240
|
W
|
2
|
61
|
4
|
3721
|
122
|
X
|
3
|
66
|
9
|
4356
|
198
|
Y
|
3
|
83
|
9
|
6889
|
249
|
Z
|
1
|
76
|
1
|
5776
|
76
|
AA
|
4
|
80
|
16
|
6400
|
320
|
BB
|
1
|
70
|
1
|
4900
|
70
|
CC
|
4
|
88
|
16
|
7744
|
352
|
DD
|
2
|
62
|
4
|
3844
|
124
|
Total
|
86
|
2392
|
280
|
198468
|
7091
|
Sumber:
Uno,
Hamzah dan Koni, Satria. 2012. hlm 160
b. Validitas
item nomor 2
Tabel
kerja untuk menghitung koefisien korelasi product
momment untuk item nomor 2 adalah sebagai berikut
Tabel 2.2 Tabel Kerja untuk Menghitung Koefisisen
Korelasi Product Momment Item 2
Siswa
|
x
|
y
|
|
|
Xy
|
A
|
5
|
94
|
25
|
8836
|
470
|
B
|
2
|
63
|
4
|
3969
|
126
|
C
|
3
|
54
|
9
|
2916
|
162
|
D
|
2
|
104
|
4
|
10816
|
208
|
E
|
5
|
99
|
25
|
9801
|
495
|
F
|
2
|
80
|
4
|
6400
|
160
|
G
|
4
|
69
|
16
|
4761
|
276
|
H
|
1
|
69
|
1
|
4761
|
69
|
I
|
3
|
111
|
9
|
12321
|
333
|
J
|
1
|
51
|
1
|
2601
|
51
|
K
|
3
|
109
|
9
|
11881
|
327
|
L
|
4
|
76
|
16
|
5776
|
304
|
M
|
2
|
84
|
4
|
7056
|
168
|
N
|
2
|
57
|
4
|
3249
|
114
|
O
|
4
|
102
|
16
|
10404
|
408
|
P
|
3
|
94
|
9
|
8836
|
282
|
Q
|
3
|
78
|
9
|
6084
|
234
|
R
|
5
|
86
|
25
|
7396
|
430
|
S
|
4
|
93
|
16
|
8649
|
372
|
T
|
4
|
87
|
16
|
7569
|
348
|
U
|
1
|
66
|
1
|
4356
|
66
|
V
|
3
|
80
|
9
|
6400
|
240
|
W
|
2
|
61
|
4
|
3721
|
122
|
X
|
3
|
66
|
9
|
4356
|
198
|
Y
|
3
|
83
|
9
|
6889
|
249
|
Z
|
2
|
76
|
4
|
5776
|
152
|
AA
|
3
|
80
|
9
|
6400
|
240
|
BB
|
2
|
70
|
4
|
4900
|
140
|
CC
|
4
|
88
|
16
|
7744
|
352
|
DD
|
2
|
62
|
4
|
3844
|
124
|
Total
|
87
|
2392
|
291
|
198468
|
7220
|
Sumber:
Uno,
Hamzah dan Koni, Satria. 2012. hlm 161
c. Validitas item nomor 3
Tabel kerja untuk menghitung
koefisien korelasi product momment untuk item nomor 3 adalah sebagai berikut
Tabel 2.3 Tabel Kerja untuk Menghitung Koefisisen
Korelasi Product Momment Item 3
Siswa
|
x
|
y
|
|
|
Xy
|
A
|
4
|
94
|
16
|
8836
|
376
|
B
|
2
|
63
|
4
|
3969
|
126
|
C
|
1
|
54
|
1
|
2916
|
54
|
D
|
3
|
104
|
9
|
10816
|
312
|
E
|
4
|
99
|
16
|
9801
|
396
|
F
|
3
|
80
|
9
|
6400
|
240
|
G
|
3
|
69
|
9
|
4761
|
207
|
H
|
2
|
69
|
4
|
4761
|
138
|
I
|
5
|
111
|
25
|
12321
|
555
|
J
|
4
|
51
|
16
|
2601
|
204
|
K
|
4
|
109
|
16
|
11881
|
436
|
L
|
3
|
76
|
9
|
5776
|
228
|
M
|
2
|
84
|
4
|
7056
|
168
|
N
|
2
|
57
|
4
|
3249
|
114
|
O
|
3
|
102
|
9
|
10404
|
306
|
P
|
4
|
94
|
16
|
8836
|
376
|
Q
|
3
|
78
|
9
|
6084
|
234
|
R
|
4
|
86
|
16
|
7396
|
344
|
S
|
3
|
93
|
9
|
8649
|
279
|
T
|
3
|
87
|
9
|
7569
|
261
|
U
|
2
|
66
|
4
|
4356
|
132
|
V
|
4
|
80
|
16
|
6400
|
320
|
W
|
1
|
61
|
1
|
3721
|
61
|
X
|
2
|
66
|
4
|
4356
|
132
|
Y
|
3
|
83
|
9
|
6889
|
249
|
Z
|
2
|
76
|
4
|
5776
|
152
|
AA
|
2
|
80
|
4
|
6400
|
160
|
BB
|
2
|
70
|
4
|
4900
|
140
|
CC
|
2
|
88
|
4
|
7744
|
176
|
DD
|
3
|
62
|
9
|
3844
|
186
|
Total
|
85
|
2392
|
269
|
198468
|
7062
|
Sumber:
Uno,
Hamzah dan Koni, Satria. 2012. hlm 163
Berdasarkan
cara yang sama dihitung koefisien korelasi untuk item-item nomor 4 sampai
dengan nomor 30. Koefisien korelasi product momment (
) dari semua item kemudian dibandingkan dengan harga
untuk mengetahui
validitas masing-masing item. Jika
maka item bersangkutan
dinyatakan valid, sebaliknya jika
maka item bersangkutan
dinyatakan tidak valid. Harga
dari masing-masing item beserta perbandingannya dengan
dan keputusan
validitas item adalah seperti tercantum pada tabel berikut.
Tabel
2.4 Perbandingan Koefisien Korelasi Product Momment dengan Harga
Item
|
|
|
Keterangan
|
1
|
0,4595
|
0,361
|
Valid
|
2
|
0,5173
|
0,361
|
Valid
|
3
|
0,6094
|
0,361
|
Valid
|
4
|
0,4759
|
0,361
|
Valid
|
5
|
0,1758
|
0,361
|
Tidak
Valid
|
6
|
0,5293
|
0,361
|
Valid
|
7
|
0,2844
|
0,361
|
Tidak
Valid
|
8
|
0,673
|
0,361
|
Valid
|
9
|
0,5627
|
0,361
|
Valid
|
10
|
0,8326
|
0,361
|
Valid
|
11
|
0,5868
|
0,361
|
Valid
|
12
|
0,6476
|
0,361
|
Valid
|
13
|
0,4837
|
0,361
|
Valid
|
14
|
0,5574
|
0,361
|
Valid
|
15
|
0,4312
|
0,361
|
Valid
|
16
|
0,1357
|
0,361
|
Tidak
Valid
|
17
|
0,5117
|
0,361
|
Valid
|
18
|
0,4042
|
0,361
|
Valid
|
19
|
0,6991
|
0,361
|
Valid
|
20
|
-0,0048
|
0,361
|
Tidak
Valid
|
21
|
0,5873
|
0,361
|
Valid
|
22
|
0,5453
|
0,361
|
Valid
|
23
|
0,4519
|
0,361
|
Valid
|
24
|
0,4028
|
0,361
|
Valid
|
25
|
0,4855
|
0,361
|
Valid
|
26
|
0,191
|
0,361
|
Tidak
Valid
|
27
|
0,5178
|
0,361
|
Valid
|
28
|
0,6199
|
0,361
|
Valid
|
29
|
0,104
|
0,361
|
Tidak
Valid
|
30
|
0,5981
|
0,361
|
Valid
|
Sumber:
Uno,
Hamzah dan Koni, Satria. 2012. hlm 164
2.
Menentukan
Reliabilitas Instrumen
Tinggi rendahnya reliabilitas, ditunjukan oleh suatu angka yang disebut
nilai koefisien reliabilitas. Reliabilitas yang tinggi ditunjukan dengan nilai
mendekati angka 1.
Kesepakatan secara umum reliabilitas yang dianggap sudah cukup memuaskan jika ≥
0.700.
Jika nilai alpha > 0.7 artinya reliabilitas mencukupi (sufficient
reliability) sementara jika alpha > 0.80 ini mensugestikan seluruh item
reliabel dan seluruh tes secara konsisten memiliki reliabilitas yang kuat.
Atau, ada pula yang memaknakannya sebagai berikut:
Jika alpha > 0.90 maka reliabilitas sempurna. Jika alpha antara 0.70 –
0.90 maka reliabilitas tinggi. Jika alpha 0.50 – 0.70 maka reliabilitas
moderat. Jika alpha < 0.50 maka reliabilitas rendah. Jika alpha rendah,
kemungkinan satu atau beberapa item tidak reliabel.
Koefisien reliabilitas instrumen
dihitung dengan menggunakan rumus Koefisien Alpha. Sebelum perhitungan terlebih
dahulu dibuat tabel kerja dengan langkah-langkah sebagai berikut.
a. Item-item
yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi reliabilitas
instrumen dihitung hanya untuk item-item yang dinyatakan valid.
b. Menghitung
dan
untuk tiap-tiap item dan skor total.
Misalnya
nilai varian butir instrumen nomor 1 adalah sebagai berikut.
Tabel
2.5 Nilai Varian Butir Instrumen Nomor 1
No.
|
|
|
Resp
|
1
|
5
|
25
|
2
|
4
|
16
|
3
|
4
|
16
|
4
|
4
|
16
|
5
|
4
|
16
|
6
|
5
|
25
|
7
|
4
|
16
|
8
|
5
|
25
|
9
|
5
|
25
|
10
|
4
|
16
|
11
|
5
|
25
|
12
|
5
|
25
|
13
|
5
|
25
|
14
|
4
|
16
|
15
|
4
|
16
|
16
|
5
|
25
|
17
|
5
|
25
|
18
|
4
|
16
|
19
|
4
|
16
|
20
|
5
|
25
|
21
|
3
|
9
|
22
|
4
|
16
|
23
|
2
|
4
|
24
|
5
|
25
|
25
|
5
|
25
|
26
|
4
|
16
|
27
|
5
|
25
|
28
|
4
|
16
|
29
|
5
|
25
|
30
|
4
|
16
|
S
|
131
|
587
|
Sumber:
Uno,
Hamzah dan Koni, Satria. 2012. hlm 167
c. Menghitung
variansi (
) untuk tiap-tiap item dan skor total, dengan rumus:
Keterangan:
: Varians skor
tiap-tiap item
: Jumlah kuadrat
item
: Jumlah item
dikuadratkan
: Jumlah
responden
d. Setelah
dihitung variansi untuk keseluruhan item dan skor total, maka keudian
menghitung total varians butr instrumen dengan rumus sebagai berikut.
e. Selanjutnya
bisa dihitung harga koefisien reliabilitas instrumen dengan menggunakan rumus
Alpha sebagai berikut.
Keterangan:
: Reliabilitas
yang dicari
: Jumlah item
pernyataan yang diuji
: Jumlah varians skor
tiap-tiap item
: Varians total
Sehingga:
Jadi,
koefisien reliabilitas instrumen adalah 0,929 yang berarti tingkat reabilitas
instrumen termasuk tinggi.
DAFTAR
RUJUKAN
Arifin,
Zainal. 2013. Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur. Bandung: PT
Remaja Rosdakarya.
Arikunto,
Suharsimi. 2001. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Disnawati.
2012. Instrumen Penilaian dengan Teknik Non Tes, (Online),
(https://disnawati.wordpress.com/2012/03/13/instrumen-penilaian-dengan-teknik-non-tes/),
diakses pada 15 Februari 2016.
Sudiyono, Anas. 2005. Pengantar
Evaluasi Pendidikan. Jakarta: PT
Raja Grafindo Persada.
Sudjana, Djuju. 2006. Evaluasi
Program Pendidikan Luar Sekolah; untuk Pendidikan Non Formal dan Pengembangan
Sumber Daya Manusia. Bandung: PT Remaja Rosdakarya.
Sukardi.
2010. Evaluasi Pendidikan: Prinsip dan Operasionalnya. Jakarta: Bumi
Aksara.
Uno,
Hamzah dan Koni, Satria. 2012. Assessement Pembelajaran. Jakarta: Bumi
Aksara.
Zulganef,
MM. 2006. Konsep Persamaan Srtuktural dan Aplikasinya Menggunakan AMOS.
Bandung: Pustaka.