2016 ~ ONE STEP

BAB I

PENDAHULUAN

A. Latar Belakang

Kegiatan mengukur, menilai, dan mengevaluasi sangatlah penting dalam dunia pendidikan. Hal ini tidak terlepas karena kegiatan tersebut merupakan suatu siklus yang dibutuhkan untuk mengetahui sejauhmana pencapaian pendidikan telah terlaksana. Tehnik evaluasi disebut juga instrumen atau alat pengumpul data hasil belajar (Sudjana, 2006). Di dalam dunia pendidikan, kita mengetahui bahwa setiap jenis atau bentuk pendidikan pada waktu-waktu tertentu selama satu periode pendidikan, selalu mengadakan evaluasi. Artinya pada waktu-waktu tertentu selama satu periode pendidikan, selalu mengadakan penilaian terhadap hasil yang telah dicapai, baik oleh pihak terdidik maupun oleh pendidik. Kegiatan ini dimaksudkan untuk mengetahui apakah tujuan yang telah dirumuskan itu tercapai atau belum, dan apakah materi pelajaran yang diajarkan sudah tepat. Semua pertanyaan tersebut akan dapat dijawab melalui kegiatan evaluasi atau penilaian. Informasi yang diperoleh melalui evaluasi ini merupakan umpan balik (feed back) terhadap proses belajar mengajar. Umpan balik ini akan dijadikan titik tolak untuk memperbaiki dan meningkatkan proses belajar mengajar selanjutnya. Dengan demikian proses belajar mengajar akan terus dapat ditingkatkan untuk memperoleh hasil yang optimal.

Evaluasi memiliki kedudukan yang penting dalam proses pembelajaran. Dengan melakukan evaluasi, guru sebagai pengelola kegiatan pembelajaran dapat mengetahui kemampuan yang dimiliki peserta didik, ketepatan metode yang digunakan, dan keberhasilan peserta didik dalam meraih kompetensi yang telah ditetapkan. Berdasarkan hasil penilaian, pendidik dapat mengambil keputusan secara tepat untuk menentukan langkah yang akan diambil selanjutnya . Hasil penilaian juga dapat memberikan motivasi kepada peserta didik untuk berprestasi lebih baik di kemudian hari.

Selanjutnya didalam melakukan evaluasi ada dua teknik evaluasi yang kita kenal yaitu teknik evaluasi menggunakan tes dan evaluasi dengan teknik non tes, Teknik non tes pada umumnya memegang peranan penting dalam rangka mengevaluasi hasil belajar peserta didik dari segi ranah sikap (affective domain) dan ranah ketrampilan (Psychomotoric domain), sedangkan teknik tes lebih banyak digunakan untuk mengevaluasi hasil belajar peserta didik dari segi ranah proses berfikirnya (cognitif domain) (Sudiyono, 2005). Pada makalah ini penulis berkesempatan menyajikan teknik penilaian non tes secara lebih mendalam baik pengertian, bentuk-bentuknya maupun penggunannya dalam menilai hasil belajar.

B. Rumusan Masalah

Berdasarkan latar belakang di atas, maka rumusan masalah pada makalah ini adalah sebagai berikut.

1. Apa pengertian instrumen non tes?

2. Apa pengertian validitas?

3. Apa saja jenis-jenis validitas?

4. Apa pengertian reliabilitas?

5. Apa saja jenis-jenis reliabilitas?

6. Bagaimana analisis instrumen non tes?

C. Tujuan Penulisan

Berdasarkan rumusan masalah di atas, maka tujuan penulisan dari makalah ini adalah sebagai berikut.

1. Untuk mengetahui pengertian instrumen non tes.

2. Untuk mengetahui pengertian validitas.

3. Untuk mengetahui jenis-jenis validitas.

4. Untuk mengetahui pengertian reliabilitas.

5. Untuk mengetahui jenis-jenis reliabilitas.

6. Untuk mengetahui cara menganalisis instrumen non tes.

BAB II

PEMBAHASAN

A. Pengertian Instrumen Non Tes

Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan untuk mempermudah seseorang untuk melaksanakan tugas atau mencapai tujuan secara lebih efektif dan efisien. Kata alat biasa disebut juga dengan istilah instrumen (Arikunto, 2001).

Teknis nontes adalah suatu alat penilaian yang biasanya dipergunakan untuk mendapatkan informasi tertentu tentang keadaan peserta tes yang (dalam bahasa Inggris disebut dengan testee) dengan tidak menggunakan tes. Hal ini berarti bahwa jawaban yang diberikan oleh peserta tes tidak bisa dikategorikan sebagai jawaban benar atau salah sebagaimana interpretasi jawaban tes. Dengan teknik nontes maka penilaian atau evaluasi hasil belajar peserta didik dilakukan tanpa menguji peserta didik melainkan dilakukan dengan cara tertentu.

Adapun menurut Hasyim (1997) dalam Disnawati (2012), penilaian non tes adalah penilaian yang mengukur kemampuan siswa secara langsung dengan tugas-tugas riil dalam proses pembelajaran. Penilaian non tes banyak terdapat pada keterampilan menulis untuk bahasa, percobaan laboratorium, bongkar pasang mesin, teknik dan sebagainya.

Penilaian yang dilakukan dengan teknis nontes terutama bertujuan untuk memperoleh informasi yang berkaitan dengan evaluasi hasil belajar peserta didik dari segi ranah sikap (affective domain) dan ranah ketrampilan (psychomotoric domain) (Sudiyono, 2005).

Berdasarkan pengertian-pengertian diatas maka instrument evaluasi jenis non tes diartikan sebagai sesuatu yang digunakan untuk mempermudah pihak-pihak tertentu untuk memperoleh kualitas atas suatu objek dengan tidak menggunakan tes.

B. Pengertian Validitas

Menurut Azwar dalam Uno dan Koni (2012) validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukam fungsi ukurannya. Selain itu validitas adalah suatu ukuran yang menunjukkan bahwa variabel yang diukur memang benar-benar variabel yang hendak diteliti oleh peneliti (Cooper dan Schindler, dalam Zulganef, 2006).

Sedangkan menurut Sugiharto dan Sitinjak dalam Uno dan Koni (2012), validitas berhubungan dengan suatu peubah mengukur apa yang seharusnya diukur. Validitas dalam penelitian menyatakan derajat ketepatan alat ukur penelitian terhadap isi sebenarnya yang diukur. Ghozali dalam Disnawati (2012) menyatakan bahwa uji validitas digunakan untuk mengukur sah, atau valid tidaknya suatu kuesioner. Suatu kuesioner dikatakan valid jika pertanyaan pada kuesioner mampu untuk mengungkapkan sesuatu yang akan diukur oleh kuesioner tersebut.

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid dapat menjalankan fungsi ukurnya dengan tepat, juga memiliki kecermatan tinggi. Arti kecermatan di sini adalah dapat mendeteksi perbedaan-perbedaan kecil yang ada pada atribut yang diukurnya. Karakteristik pertama dan memiliki peranan sangat penting dalam instrumen evaluasi, yakni karakteristik valid (validity). Valid, menurut Gronlund dalam Arifin (2013) dapat diartikan sebagai ketepatan interpretasi yang dihasilkan dari skor tes atau instrumen evaluasi.

Suatu instrumen evaluasi dikatakan valid, seperti yang diterangkan oleh Gay dan Johnson dalam Sukardi (2010), apabila instrumen yang digunakan dapat mengukur apa yang hendak diukur. Jadi, jika tes tersebut adalah tes pencapaian hasil belajar maka hasil tes tersebut apabila diinterpretasi secara intensif, hasil yang dicapai memang benar menunjukkan ranah evaluasi pencapaian hasil belajar. Validitas suatu instrumen evaluasi, tidak lain adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu instrumen evaluasi mempunyai beberapa makna penting di antaranya seperti berikut.

1. Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup individual dan bukan instrumen itu sendiri.

2. Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori redah, menengah, dan tinggi.

3. Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan tertentu saja. Tes valid untuk bidang studi metrologi industri belum tentu valid untuk bidang yang lain misalnya bidang mekanika teknik.

Berdasarkan dari beberapa pengertian validitas menurut para ahli dapat disimpulkan bahwa validitas merupakan suatu keadaan apabila suatu instrumen evaluasi dapat mengukur apa yang sebenarnya harus diukur secara tepat.

C. Jenis-Jenis Validitas

Validitas suatu tes dalam Arifin (2013) dapat dibedakan menjadi empat jenis, anatara lain permukaan (face validity), validitas isi (content validity), validitas empiris (empirical validity), dan validitas konstruk (construct validity), dan validitas faktor (factorial validity) yang akan diuraikan dengan lebih jelas seperti berikut.

1. Validitas Permukaan (Face Validity)

Validitas ini menggunakan kriteria yang sangat sederhana,karena hanya melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement mendalam.

2. Validitas Isi (Content Validity)

Validitas isi berhubungan dengan kesanggupan tes untuk mengukur isi yang seharusnya diukur. Validitas ini sering digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran tertentu. Jika dilihat dari kegunaannya dalam penilaian hasil belajar, validitas ini sering juga disebut validitas kurikuler atau validitas perumusan.

Untuk mendapatkan validitas isi memerlukan dua aspek penting, yaitu valid isi dan valid teknik sa,pling. Vilid isi mencakup hal-hal yang berkaitan dengan apakah item-item evaluasi menggambarkan pengukuran dalam cakupan yang ingin diukur. Sedangkan validitas teknik sampling pada umumnya berkaitan dengan bagaimanakah baiknya suatu sampel item tes merepresentasikan total cakupan isi.

3. Validitas Empiris (Empirical Validity)

Istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen dapat dikatakan mememiliki validitas empiris apabila sudah diuji dari pengalaman.

Validitas ini biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu kriteria tertentu yang merupakan suatu tolak ukur di luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan apa yang harus diukur. Validitas empiris disebut juga validitas yang dihubungkan dengan kriteria (criterion-related validity) atau validitas statistik (statistical validity).

4. Validitas Konstruk (Construct Validity)

Validitas konstruk menunjuk pada sejauh mana suatu instrumen mampu mengukur pengertian-pengertian yang terkandung dalam materi yang akan diukur. Misalnya, instrumen minat harus mampu mengukur pengertian-pengertian yang terkandung pada variabel minat.Agar lebih jelas, biasanya variabel tersebut diuraikan dulu menjadi indikator-indikator.

Konstruk adalah konsep yang dapat diobservasi (observable) dan dapat diukur (measurable). Validitas konstruk sering juga disebut validitas logis (logical validity). Validitas konstruk berkenaan dengan pertanyaan hingga mana suatu tes betul-betul dapat mengobservasi dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku yang abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi, minat dan sebagainya.

5. Validitas faktor (Factorial Validity)

Dalam penilaian hasil belajar sering digunakan skala pengukuran tentang suatu variabel yang terdiri ats beberapa faktor. Faktor-faktor tersebut diperoleh berdasarkan dimensi/indikator dari variabel yang diukur deduai dengan apa yang terungkap dalam konstruksi teoritisny, Meskipun variabel terdiri atas beberapa faktor, tetapi prinsip homogenitas untuk keseluruhan faktor harus tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor dengan faktor yang lain.Dengan demikian kriterium yang digunakan dalam validitas faktor ini dapat diketahui dengan menghitung homogenitas skor setipa faktor dengan total skor, dan antara skor fari faktor yang satu dengan skor dari faktor yang lain.

D. Pengertian Reliabilitas

Reliabilitas berasal dari kata reliability. Pengertian dari reliability (rliabilitas) adalah keajegan pengukuran (Walizer, dalam Arikunto, 2001). Sugiharto dan Situnjak dalam Uno dan Koni (2012) menyatakan bahwa reliabilitas menunjuk pada suatu pengertian bahwa instrumen yang digunakan dalam penelitian untuk memperoleh informasi yang digunakan dapat dipercaya sebagai alat pengumpulan data dan mampu mengungkap informasi yang sebenarnya dilapangan.

Ghozali dalam Disnawati (2012) menyatakan bahwa reliabilitas adalah alat untuk mengukur suatu kuesioner yang merupakan indikator dari peubah atau konstruk. Suatu kuesioner dikatakan reliabel atau handal jika jawaban seseorang terhadap pernyataan adalah konsisten atau stabil dari waktu ke waktu. Reliabilitas suatu tes merujuk pada derajat stabilitas, konsistensi, daya prediksi, dan akurasi. Pengukuran yang memiliki reliabilitas yang tinggi adalah pengukuran yang dapat menghasilkan data yang reliabel

Singarimbun dalam Arikunto (2001), realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliabel. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam mengukur gejala yang sama.

Menuru Suryabrata dalam Sudiyono (2005) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama. Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur. Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.

Reliabilitas berhubungan dengan konsistensi hasil pengukuran yaitu seberapa konsistensi skor tes dari satu pengukuran ke pengukuran berikutnya. Reliabilitas dinyatakan dengan koefisien reliabilitas, yaitu koefisien korelasi yang menunjukkan derajat hubungan antara dua hasil pengukuran yang diperoleh dari instrumen atau prosedur yang sama. Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, atrinya kapan puan alat tersebut digunakan akan memkberikan hasil yang ralatif sama. Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan, jika dikenakan pada siswa yang sama. Meskipun masih memungkinkan terjadi perbedaan hasil untuk hal-hal tertentu akibat dari faktor kebetulan, selang waktu, perubahan pandangan siswa terhadap soal.

Jadi, dapat disimpulkan bahawa reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrument. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan.Suatu tes diteskan pada kelompok yang sama bila di teskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.

E. Jenis-Jenis Reliabilitas

Ada beberapa tipe reliabilitas tes dalam Sukardi (2010) yang sering digunakan dalam kegiatan evaluasi dan masing-masing reliabilitas mempunyai konsistensi yang berbeda-beda. Beberapa tipe reliabilitas diantaranya adalah sebagai berikut.

1. Reliabilitas Dengan Tes-Retes

Realibilitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa tersebut dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut, seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur.

Realibilitas tes-retes ini penting, khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu berubah-ubah secara signifikan saat diberikan kepada responden. Penentuan pemakaian reliabilitas tes-retes juga tepat ketika bentuk tes alternatif lainnya tidak ada, dan ketika tampak bahwa orang yang mengambil tes kedua kalinya tidak ingat atas jawaban tes yang pertama. Para pengambil tes pada umumnya akan terus mengingat jawabannya, jika item-item yang ada banyak mengandung faktor sejarah, dibanding bentuk jawaban item ilmu pengetahuan aljabar misalnya.

Realibilitas tes-retes dapat dilakukan dengan cara seperti berikut.

a. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.

b. Setelah selang waktu tertentu, misalnya 1 minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.

c. Korelasikan hasil kedua tes tersebut.

Jika hasil korelasi menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai korelasi rendah.

Tes-retes juga mempunyai beberapa permasalahan. Di antaranya ialah faktor waktu jeda atau tenggang yang diambil, ketika dilakukan tes pertama dengan tes kedua. Jika interval waktu terlalu pendek, mahasiswa memiliki kesempatan untuk mengingat jawaban dalam tes sehingga tes yang kedua dapat dipastikan lebih baik, karena faktor retensi atau sisa-sisa hafalan yang terjadi pada subjek pelaku. Jika interval waktu terlalu panjang, kemampuan para pelaku yang mengikuti tes mungkin bertambah karena dua kemungkinan, yakni faktor maturasi atau kedewasaan dan faktor intervensi dari faktor belajar dari para subjek.

Faktor-faktor tersebut menjadikan konsistensi tes cenderung artifisial dan rendah. Mengenai interval waktu yang baik antara tes pertama dengan tes berikutnyadiberikan kepada subjek pelaku pilot studi, Gay (1983: 118) memberikan referensi bahwa 1 hari terlalu pendek, sebaliknya 1 bulan terlalu panjang. Oleh karena itu, selisih waktu pemberian tes melalui tes-retes diantara 1 atau 2 minggu.

2. Reliabilitas Bentuk Ekivalensi

Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabilitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaiknya mempunyai karakteristik sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama.

Dari semua kondisi yang direncanakan secara ekivalen di atas, idealnya jika suatu kelompok mengambil dua tes tersebut maka rerata skor maupun variabilitas skor yang dicapai dari kedua tes yang diambil mestinya sama. Jika dikehendaki sebenarnya, kita dapat memilih, mengambil sampel, dan item yang berbeda dari ranah tingkah laku sama. Yang perlu diperhatikan mestinya adalah dalam hal apakah pemberian skor tergantung item pilihan atau pada penampilan atas item-item yang dapat digeneralisasi pada lainnya. Jika item terpilih baik dan setiap setnya menggambarkan ranah yang setaraf, maka penggambaran tersebut mestinya benar.

Reliabilitas ekivalen, pada umumnya juga menggambarkan bentuk konsistensi alternatif, yang dapat menunjukkan variasi skor yang terjadi dari bentuk tes evaluasi satu dengan bentuk tes lainnya. Akan tetapi, yang juga perlu diingat ialah bahwa pengambil tes reliabilitas ekivalen ini akan dapat mencapai hasil yang tepat, jika pengamilan tes hafal terhadap jawaban tes yang dibuat dalam sesi pertama, sehingga mereka dapat menjawab kembali tes yang kedua. Ketika dua bentuk alternatif tes tersedia, yang perlu diketahui dari kedua tes adalah berapa rliabilitas ekivalensi. Hal ini perlu diyakinkan kembali, agar terjadi bahwa skor seseorang tidak akan dipengaruhi oleh cara mengadministrasi tes tersebut.

Implikasi dari analisis di atas ialah bahwa seringkali terjadi bahwa sebuah tes evaluasi diberikan lehih dari satu kali padu grup yang sama. Pertama tes diherikan pada grup sebagai pre tes dan setelah selang waktu tertentu diberikannya untuk yang kedua kalinya sbagai postes. Hal lain yang juga perlu diketahui ialah bahwa ada kemungkinan pengaruh kegiatan intervening, ketika mengukur suatu hal yang esensinya sama dengan menggunakan tes sama.

Beberapa langkah yang perlu diambil oleh seorang mahasiswa peneliti. Langkah-langkah tersebut di antaranya adalah seperti berikut.

a. Tentukan subjek sasaran yang hendak di tes.

b. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.

c. Administrasi hasilnya secara baik.

d. Dalam waktu yang tidak terlalu lama, lakukan pengetesan untuk yang kedua kalinya pada kelompok tersebut.

e. Korelasikan kedua hasil set skor.

Jika hasil koeﬁsien ekivalen tinggi, berani tes memiliki reliabilitas ekivalen baik; sebaliknya, jika ternyata bahwa koefisien rendah maka reliabilitas ekivalen tes adalah rendah. Reliabilitas ekivalen merupakan salah satu bentuk yang dapat diterima dan umum dipakai penelitian terutama penelitian pendidikan. Yang perlu diketahui juga bagi para peneliti adalah bahwa tes ekivalen mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu tarjadi kesalahan pengukuran.

3. Reliabilitas dengan Belah Dua

Realibilitas belah dua ini termasuk realibilitas yang mengukur konsistensi internal. Yang dimaksud dengan konsistensi internal ialah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap item tes evaluasi. Reliabilitas belah dua ini pelaksanaannya hanya memerlukan waktu satu kali. Ada beberapa kemungkinan dalam cara ini. Termasuk peredaan kondisi tes yang terjadi, ketika menggunakan metode tes-retes dapat dihilangkan. Reliabilitas belah dua juga tepat digunakan, ketika tes evaluasi yang ada terlalu panjang.

Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan seperti berikut.

a. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.

b. Bagi tes yang ada menjadi dua atas dasar jumlah item yang paling umum dengan membagi item dengan nomor ganjil dan genap pada kelompok tersebut.

c. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.

d. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran.

Jika hasil koeﬁsien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik. Akan terjadinya sebaliknya, jika hasil korelasi belah dua item tes ternyata rendah.

F. Analisis Instrumen Non Tes

Berikut akan dijelaskan cara menganalisis valididtas dan reliabilitas dari instrumen non tes menurut Uno dan Koni (2012).

1. Pengujian Validitas Instrumen

Teknik pengujian yang sering digunakan para peneliti untuk uji validitas adalah menggunakan korelasi Bivariate Pearson (Produk Momen Pearson). Analisis ini dengan cara mengkorelasikan masing-masing skor item dengan skor total. Skor total adalah penjumlahan dari keseluruhan item. Item-item pertanyaan yang berkorelasi signifikan dengan skor total menunjukkan item-item tersebut mampu memberikan dukungan dalam mengungkap apa yang ingin diungkap

Azwar dalam Uno dan Koni (2012) berpendapat bahwa kalau skor butir bukan dikotomi, tetapi berskala interval, maka teknik korelasi product momment dapat digunakan. Kemudian untuk melihat hasil pengujian valid atau tidak, hasil perhitungan validitas dibandingkan dengan tabel harga kritik. Koefisien korelasi product momment ( ) dari semua item kemudian dibandingkan dengan harga untuk mengetahui validitas masing-masing item (uji 2 sisi dengan sig. 0,05). Jika maka item bersangkutan dinyatakan valid, sebaliknya jika maka item bersangkutan dinyatakan tidak valid.

Formula statistik yang digunakan dalam analisi validitas butir non tes digunakan korelasi product momment. Model formula statistik sebagai berikut.

Keterangan:

r: nilai korelasi product momment

n: banyaknya responden

x: skor butir

y: skor total butir

Sebagai gambaran perhitungan diperlihatkan cara menghitung secara manual sebagai berikut: pertama diperlukan tabel kerja. Selengkapnya pengujian tiap item dalam instrumen adalah sebagai berikut.

a. Validitas item nomor 1

Tabel kerja untuk menghitung koefisien korelasi product momment untuk item nomor 1 adalah sebagai berikut

Tabel 2.1 Tabel Kerja untuk Menghitung Koefisisen Korelasi Product Momment Item 1

Siswa	x	y			Xy
A	2	94	4	8836	188
B	3	63	9	3969	189
C	4	54	16	2916	216
D	3	104	9	10816	312
E	3	99	9	9801	297
F	5	80	25	6400	400
G	1	69	1	4761	69
H	2	69	4	4761	138
I	4	111	16	12321	444
J	2	51	4	2601	102
K	4	109	16	11881	436
L	4	76	16	5776	304
M	3	84	9	7056	252
N	1	57	1	3249	57
O	4	102	16	10404	408
P	4	94	16	8836	376
Q	2	78	4	6084	156
R	3	86	9	7396	258
S	3	93	9	8649	279
T	3	87	9	7569	261
U	3	66	9	4356	198
V	3	80	9	6400	240
W	2	61	4	3721	122
X	3	66	9	4356	198
Y	3	83	9	6889	249
Z	1	76	1	5776	76
AA	4	80	16	6400	320
BB	1	70	1	4900	70
CC	4	88	16	7744	352
DD	2	62	4	3844	124
Total	86	2392	280	198468	7091

Sumber: Uno, Hamzah dan Koni, Satria. 2012. hlm 160

b. Validitas item nomor 2

Tabel kerja untuk menghitung koefisien korelasi product momment untuk item nomor 2 adalah sebagai berikut

Tabel 2.2 Tabel Kerja untuk Menghitung Koefisisen Korelasi Product Momment Item 2

Siswa	x	y			Xy
A	5	94	25	8836	470
B	2	63	4	3969	126
C	3	54	9	2916	162
D	2	104	4	10816	208
E	5	99	25	9801	495
F	2	80	4	6400	160
G	4	69	16	4761	276
H	1	69	1	4761	69
I	3	111	9	12321	333
J	1	51	1	2601	51
K	3	109	9	11881	327
L	4	76	16	5776	304
M	2	84	4	7056	168
N	2	57	4	3249	114
O	4	102	16	10404	408
P	3	94	9	8836	282
Q	3	78	9	6084	234
R	5	86	25	7396	430
S	4	93	16	8649	372
T	4	87	16	7569	348
U	1	66	1	4356	66
V	3	80	9	6400	240
W	2	61	4	3721	122
X	3	66	9	4356	198
Y	3	83	9	6889	249
Z	2	76	4	5776	152
AA	3	80	9	6400	240
BB	2	70	4	4900	140
CC	4	88	16	7744	352
DD	2	62	4	3844	124
Total	87	2392	291	198468	7220

Sumber: Uno, Hamzah dan Koni, Satria. 2012. hlm 161

c. Validitas item nomor 3

Tabel kerja untuk menghitung koefisien korelasi product momment untuk item nomor 3 adalah sebagai berikut

Tabel 2.3 Tabel Kerja untuk Menghitung Koefisisen Korelasi Product Momment Item 3

Siswa	x	y			Xy
A	4	94	16	8836	376
B	2	63	4	3969	126
C	1	54	1	2916	54
D	3	104	9	10816	312
E	4	99	16	9801	396
F	3	80	9	6400	240
G	3	69	9	4761	207
H	2	69	4	4761	138
I	5	111	25	12321	555
J	4	51	16	2601	204
K	4	109	16	11881	436
L	3	76	9	5776	228
M	2	84	4	7056	168
N	2	57	4	3249	114
O	3	102	9	10404	306
P	4	94	16	8836	376
Q	3	78	9	6084	234
R	4	86	16	7396	344
S	3	93	9	8649	279
T	3	87	9	7569	261
U	2	66	4	4356	132
V	4	80	16	6400	320
W	1	61	1	3721	61
X	2	66	4	4356	132
Y	3	83	9	6889	249
Z	2	76	4	5776	152
AA	2	80	4	6400	160
BB	2	70	4	4900	140
CC	2	88	4	7744	176
DD	3	62	9	3844	186
Total	85	2392	269	198468	7062

Sumber: Uno, Hamzah dan Koni, Satria. 2012. hlm 163

Berdasarkan cara yang sama dihitung koefisien korelasi untuk item-item nomor 4 sampai dengan nomor 30. Koefisien korelasi product momment ( ) dari semua item kemudian dibandingkan dengan harga untuk mengetahui validitas masing-masing item. Jika maka item bersangkutan dinyatakan valid, sebaliknya jika maka item bersangkutan dinyatakan tidak valid. Harga dari masing-masing item beserta perbandingannya dengan dan keputusan validitas item adalah seperti tercantum pada tabel berikut.

Tabel 2.4 Perbandingan Koefisien Korelasi Product Momment dengan Harga

Item			Keterangan
1	0,4595	0,361	Valid
2	0,5173	0,361	Valid
3	0,6094	0,361	Valid
4	0,4759	0,361	Valid
5	0,1758	0,361	Tidak Valid
6	0,5293	0,361	Valid
7	0,2844	0,361	Tidak Valid
8	0,673	0,361	Valid
9	0,5627	0,361	Valid
10	0,8326	0,361	Valid
11	0,5868	0,361	Valid
12	0,6476	0,361	Valid
13	0,4837	0,361	Valid
14	0,5574	0,361	Valid
15	0,4312	0,361	Valid
16	0,1357	0,361	Tidak Valid
17	0,5117	0,361	Valid
18	0,4042	0,361	Valid
19	0,6991	0,361	Valid
20	-0,0048	0,361	Tidak Valid
21	0,5873	0,361	Valid
22	0,5453	0,361	Valid
23	0,4519	0,361	Valid
24	0,4028	0,361	Valid
25	0,4855	0,361	Valid
26	0,191	0,361	Tidak Valid
27	0,5178	0,361	Valid
28	0,6199	0,361	Valid
29	0,104	0,361	Tidak Valid
30	0,5981	0,361	Valid

Sumber: Uno, Hamzah dan Koni, Satria. 2012. hlm 164

2. Menentukan Reliabilitas Instrumen

Tinggi rendahnya reliabilitas, ditunjukan oleh suatu angka yang disebut nilai koefisien reliabilitas. Reliabilitas yang tinggi ditunjukan dengan nilai mendekati angka 1. Kesepakatan secara umum reliabilitas yang dianggap sudah cukup memuaskan jika ≥ 0.700.

Jika nilai alpha > 0.7 artinya reliabilitas mencukupi (sufficient reliability) sementara jika alpha > 0.80 ini mensugestikan seluruh item reliabel dan seluruh tes secara konsisten memiliki reliabilitas yang kuat. Atau, ada pula yang memaknakannya sebagai berikut:

Jika alpha > 0.90 maka reliabilitas sempurna. Jika alpha antara 0.70 – 0.90 maka reliabilitas tinggi. Jika alpha 0.50 – 0.70 maka reliabilitas moderat. Jika alpha < 0.50 maka reliabilitas rendah. Jika alpha rendah, kemungkinan satu atau beberapa item tidak reliabel.

Koefisien reliabilitas instrumen dihitung dengan menggunakan rumus Koefisien Alpha. Sebelum perhitungan terlebih dahulu dibuat tabel kerja dengan langkah-langkah sebagai berikut.

a. Item-item yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi reliabilitas instrumen dihitung hanya untuk item-item yang dinyatakan valid.

b. Menghitung dan untuk tiap-tiap item dan skor total.

Misalnya nilai varian butir instrumen nomor 1 adalah sebagai berikut.

Tabel 2.5 Nilai Varian Butir Instrumen Nomor 1

No.
Resp
1	5	25
2	4	16
3	4	16
4	4	16
5	4	16
6	5	25
7	4	16
8	5	25
9	5	25
10	4	16
11	5	25
12	5	25
13	5	25
14	4	16
15	4	16
16	5	25
17	5	25
18	4	16
19	4	16
20	5	25
21	3	9
22	4	16
23	2	4
24	5	25
25	5	25
26	4	16
27	5	25
28	4	16
29	5	25
30	4	16
S	131	587

Sumber: Uno, Hamzah dan Koni, Satria. 2012. hlm 167

c. Menghitung variansi ( ) untuk tiap-tiap item dan skor total, dengan rumus:

Keterangan:

: Varians skor tiap-tiap item

: Jumlah kuadrat item

: Jumlah item dikuadratkan

: Jumlah responden

d. Setelah dihitung variansi untuk keseluruhan item dan skor total, maka keudian menghitung total varians butr instrumen dengan rumus sebagai berikut.

e. Selanjutnya bisa dihitung harga koefisien reliabilitas instrumen dengan menggunakan rumus Alpha sebagai berikut.

Keterangan:

: Reliabilitas yang dicari

: Jumlah item pernyataan yang diuji

: Jumlah varians skor tiap-tiap item

: Varians total

Sehingga:

Jadi, koefisien reliabilitas instrumen adalah 0,929 yang berarti tingkat reabilitas instrumen termasuk tinggi.

DAFTAR RUJUKAN

Arifin, Zainal. 2013. Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur. Bandung: PT Remaja Rosdakarya.

Arikunto, Suharsimi. 2001. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Disnawati. 2012. Instrumen Penilaian dengan Teknik Non Tes, (Online), (https://disnawati.wordpress.com/2012/03/13/instrumen-penilaian-dengan-teknik-non-tes/), diakses pada 15 Februari 2016.

Sudiyono, Anas. 2005. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo Persada.

Sudjana, Djuju. 2006. Evaluasi Program Pendidikan Luar Sekolah; untuk Pendidikan Non Formal dan Pengembangan Sumber Daya Manusia. Bandung: PT Remaja Rosdakarya.

Sukardi. 2010. Evaluasi Pendidikan: Prinsip dan Operasionalnya. Jakarta: Bumi Aksara.

Uno, Hamzah dan Koni, Satria. 2012. Assessement Pembelajaran. Jakarta: Bumi Aksara.

Zulganef, MM. 2006. Konsep Persamaan Srtuktural dan Aplikasinya Menggunakan AMOS. Bandung: Pustaka.

Continue reading →

ONE STEP

Memberi Inspirasi untuk Berkreasi

Main menu

21 April, 2016

Sejarah Singkat Hari Kartini 21 April

14 April, 2016

ANALISIS INSTRUMEN NON TES

About Me

:)

Popular Posts

Categories

Blog Archive