Penilaian Berbasis Kompetensi

PENILAIAN BERBASIS KOMPETENSI

A. Pengertian

Penilaian berbasis kompetensi merupakan teknik evaluasi yang harus dilakukan guru dalam pembelajaran di sekolah. Teknik dan pelaksanaannya diatur di dalam:

· Undang-Undang Republik Indonesia No. 20 Tahun 2003 tentang Sistem Pendidikan Nasional

· Peraturan Pemerintah No. 19 Tahun 2005 tentang Standar Nasional Pendidikan

· Peraturan Menteri Pendidikan Nasional No. 22 Tahun 2006 tentang Standar Isi

· Peraturan Menteri Pendidikan Nasional No. 23 tahun 2006 tentang Standar Kompetensi Lulusan

· Peraturan Menteri Pendidikan Nasional No. 20 tahun 2007 tentang Standar Penilaian Pendidikan

Standar Kompetensi dan Kompetensi Dasar di dalam Standar Isi menjadi fokus perhatian utama dalam penilaian.

B. Bentuk dan Proses Penilaian

Untuk mengetahui tingkat pencapaian kompetensi, guru dapat melakukan penilaian melalui tes dan non tes. Tes meliputi tes lisan, tertulis (bentuk uraian, pilihan ganda, jawaban singkat, isian, menjodohkan, benar-salah), dan tes perbuatan yang meliputi: kinerja (performance), penugasan (projek) dan hasil karya (produk). Penilaian non-tes contohnya seperti penilaian sikap, minat, motivasi, penilaian diri, portfolio, life skill. Tes perbuatan dan penilaian non tes dilakukan melalui pengamatan (observasi).

Langkah-langkah pengembangan tes meliputi (1) menentukan tujuan penilaian, (2) menentukan kompetensi yang diujikan (3) menentukan materi penting pendukung kompetensi (urgensi, kontinuitas, relevansi, keterpakaian), (4) menentukan jenis tes yang tepat (tertulis, lisan, perbuatan), (5) menyusun kisi-kisi, butir soal, dan pedoman penskoran, (6) melakukan telaah butir soal. Penilaian non tes dilakukan melalui pengamatan dengan langkah-langkah (1) menentukan tujuan penilaian, (2) menentukan kompetensi yang diujikan, (3) menentukan aspek yang diukur, (4) menyusun tabel pengamatan dan pedoman penskorannya, (5) melakukan penelaahan.

C. Kriteria Bahan Ulangan/Ujian

Bahan ulangan/ujian yang akan digunakan hendaknya menenuhi dua kriteria dasar berikut ini.

1. adanya kesesuaian materi yang diujikan dan target kompetensi yang harus dicapai melalui materi yang diajarkan. Hal ini dapat memberikan informasi tentang siapa atau peserta didik mana yang telah mencapai tingkatan pengetahuan tertentu yang disyaratkan sesuai dengan target kompetensi dalam silabus/kurikulum dan dapat memberikan informasi mengenai apa dan seberapa banyak materi yang telah dipelajari peserta didik. Berdasarkan ilmu pengukuran pendidikan, ujian yang bahannya tidak sesuai dengan target kompetensi yang harus dicapai bukan saja kurang memberikan informasi tentang hasil belajar seorang peserta didik, melainkan juga tidak menghasilkan umpan balik bagi penyempurnaan proses belajar-mengajar.

2. bahan ulangan/ujian hendaknya menghasilkan informasi atau data yang dapat dijadikan landasan bagi pengembangan standar sekolah, standar wilayah, atau standar nasional melalui penilaian hasil proses belajar-mengajar.

D. Soal yang Bermutu

Bahan ujian atau soal yang bermutu dapat membantu pendidik meningkatkan pembelajaran dan memberikan informasi dengan tepat tentang peserta didik mana yang belum atau sudah mencapai kompetensi. Salah satu ciri soal yang bermutu adalah bahwa soal itu dapat membedakan setiap kemampuan peserta didik. Semakin tinggi kemampuan peserta didik dalam memahami materi pembelajaran, semakin tinggi pula peluang menjawab benar soal atau mencapai kompetensi yang ditetapkan. Makin rendah kemampuan peserta didik dalam memahami materi pembelajaran, makin kecil pula peluang menjawab benar soal untuk mengukur pencapaian kompetensi yang ditetapkan.

Syarat soal yang bermutu adalah bahwa soal harus sahih (valid), dan handal. Sahih maksudnya bahwa setiap alat ukur hanya mengukur satu dimensi/aspek saja. Mistar hanya mengukur panjang, timbangan hanya mengukur berat, bahan ujian atau soal PKn hanya mengukur materi pembelajaran PKn bukan mengukur keterampilan/kemampuan materi yang lain. Handal maksudnya bahwa setiap alat ukur harus dapat memberikan hasil pengukuran yang tepat, cermat, dan ajeg. Untuk dapat menghasilkan soal yang sahih dan handal, penulis soal harus merumuskan kisi-kisi dan menulis soal berdasarkan kaidah penulisan soal yang baik (kaidah penulisan soal bentuk objektif/pilihan ganda, uraian, atau praktik).

Linn dan Gronlund (1995: 47) menyatakan bahwa tes yang baik harus memenuhi tiga karakteristik, yaitu: validitas, reliabilitas, dan usabilitas. Validitas artinya ketepatan interpretasi hasil prosedur pengukuran, reliabilitas artinya konsistensi hasil pengukuran, dan usabilitas artinya praktis prosedurnya. Di samping itu, Cohen dkk. (1992: 28) juga menyatakan bahwa tes yang baik adalah tes yang valid artinya mengukur apa yang hendak diukur. Nitko (1996 : 36) menyatakan bahwa validitas berhubungan dengan interpretasi atau makna dan penggunaan hasil pengukuran peserta didik. Messick (1993: 13) menjelaskan bahwa validitas tes merupakan suatu integrasi pertimbangan evaluatif derajat keterangan empiris yang mendasarkan pemikiran teoritis yang mendukung ketepatan dan kesimpulan berdasarkan pada skor tes. Adapun validitas dalam model Rasch adalah sesuai atau fit dengan model (Hambleton dan Swaminathan, 1985: 73).

Messick (1993: 16) menyatakan bahwa validitas secara tradisional terdiri dari: (1) validitas isi, yaitu ketepatan materi yang diukur dalam tes; (2) validitas criterion-related, yaitu membandingkan tes dengan satu atau lebih variabel atau kriteria, (3) valitidas prediktif, yaitu ketepatan hasil pengukuran dengan alat lain yang dilakukan kemudian; (4) validitas serentak (concurrent), yaitu ketepatan hasil pengukuran dengan dua alat ukur lainnya yang dilakukan secara serentak; (5) validitas konstruk, yaitu ketepatan konstruksi teoretis yang mendasari disusunnya tes. Linn dan Gronlund (1995 : 50) menyatakan hahwa valilitas terdiri dari: (1) konten. (2) test-criterion relationship, (3) konstruk, dan (4) consequences, yaitu ketepatan penggunaan hasil pengukuran. Sedangkan menurut Oosterhof (190 : 23) yang mengutip berdasarkan "Standards for Educational and Psychological Testing, 1985" yang didukung oleh Ebel dan Frisbie (1991 : 102-109), serta Popham (1995 : 43) bahwa tipe validitas adalah validitas: (1) content, (2) criterion, dan (3) construction.

Di samping validitas, informasi tentang reliabilitas tes sangat diperlukan. Nitko (1999 : 62) dan Popham (1995 : 21) menyatakan bahwa reliabilitas berhubungan dengan konsistensi hasil pengukuran. Pernyataan ini didukung oleh Cohen dkk, yaitu bahwa reliabilitas merupakan persamaan dependabilitas atau konsistensi (Cohen dkk : 192 : 132) karena tes yang memiliki konsistensi/reliabilitas tinggi, maka tesnya adalah akurat, reproducible; dan gereralizable terhadap kesempatan testing dan instrumen tes yang sama. (Ebel dan Frisbie (1991 : 76). Faktor yang mempengaruhi reliabilitas yang berhubungan dengan tes adalah: (1) banyak butir, (2) homogenitas materi tes, (3) homogenitas karakteristik butir, dan (4) variabilitas skor. Reliabilitas yang berhubungan dengan peserta didik dipengaruhi oleh faktor: (1) heterogenitas kelompok, (2) pengalaman peserta didik mengikuti tes, dan (3) motivasi peserta didik. Sedangkan faktor yang mempengaruhi reliabilitas yang berhubungan dengan administrasi adalah batas waktu dan kesempatan menyontek (Ebel dan Frisbie, 1991: 88-93).

Linn dan Gronlund menyatakan bahwa metode estimasi dapat dilakukan dengan mempergunakan: (1) metode test-retest, yaitu diberikan tes yang sama dua kali pada kelompok yang sama dengan interval waktu; tujuannya adalah pengukuran stabilitas; (2) metode equivalent form, yaitu diberikan dua tes paralel pada kelompok yang sama dan waktu yang sama; tujuannya adalah pengukuran menjadi ekuivalen; (3) metode test-retest dengan equivalen form, yaitu diberikan dua tes paralel pada kelompok yang sama dengan interval waktu; tujuannya adalah pengukuran stabilitas dan ekuivalensi; (4) metode split-half, yaitu diberikan tes sekali, kemudian skor pada butir yang ganjil dan genap dkorelasikan dengan menggunakan rumus Spearman-Brown; tujuannya adalah pengukuran konsistensi internal; (5) metode Kuder-Richardson dan koefisien Alfa, yaitu diberikan tes sekali kemudian skor total tes dihitung dengan rumus Kuder-Richardson, tujuannya adalah pengukuran konsistensi internal; (6) metode inter-rater, yaitu diberikan satu set jawaban peserta didik untuk diskor/judgement oleh 2 atau lebih rater; tujuannya adalah pengukuran konsistensi rating. Menurut Popham (1995: 22), reliabilitas terdiri dari 3 jenis yaitu: (1) stabilitas, yaitu konsistensi hasil di antara kesempatan testing yang berbeda, (2) format bergantian (alternate form), yaitu konsistensi hasil di antara dua atau lebih tes yang berbeda, (3) internal konsistensi, yaitu konsistensi melalui suatu pengukuran fungsi butir instrumen.

Reliabilitas skor tes dalam teori respon butir adalah penggunaan fungsi informasi tes. Menurut Hambleton dan Swaminathan (1985: 236), pengukuran fungsi informasi tes lebih akurat bila dibandingkan dengan penggunaan reliabilitas karena: (1) bentuknya tergantung hanya pada butir-butir dalam tes, (2) mempunyai estimasi kesalahan pengukuran pada setiap level abilitas. Pernyataan ini didukung oleh Gustafson (1981 : 41), yaitu bahwa konsep reliabilitas dalam model Rasch memerankan bagian subordinate sebab model pengukuran ini diorientasikan pada estimasi kemampuan individu.

Untuk meningkatkan validitas dan reliabilitas tes perlu dilakukan analisis butir soal. Kegunaan analisis butir soal di antaranya adalah: (1) dapat membantu para pengguna tes dalam evaluasi atas tes yang diterbitkan, (2) sangat relevan bagi penyusunan tes informal dan lokal seperti kuis, ulangan yang disiapkan guru untuk peserta didik di kelas, (3) mendukung penulisan butir soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas soal dan reliabilitas (Anastasi dan Urbina, 1997: 172).

Daftar Pustaka :

Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh Edition). New Jersey: Prentice-Hall, Inc.

Cohen, Ronald Jay; Swerdlik, Mark E. and Smith, Douglas K. (1992). Psychological Testing and Assessment: An Introduction to Test and Measurement, second edition. California: Mayfield Publishing Company.

Ebel, Robert L. and Frisbie, David A. (1991). Essentials of Education Measurement. New Jersey: Prentice Hall.

Hambleton, Ronald K. and Swaminathan, Hariharan. (1985). Item Response Theory, Principles, and Aplications. Boston: Kluwer. Nijhoff Publishing.

Linn, Robert L. and Gronlund, Norman E. (1995). Measurement and Assessment in Teaching. (Seventh Edition). Ohio: Prentice-Hall, Inc.

Messick, Samuel. (1993). “Validity”, Educational Measurement, Third Edition, ed. Robert L. Linn. New York: American Council on Education and Macmillan Publishing Company, A Division of Macmillan, Inc.

Nitko, Anthony J. (1996). Educational Assessment of Students, Second Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.

Popham, W.James. (1995). Classroom Assesment: What Teachers Need to Know. Boston: Allyn and Bacon

Sumber :

Panduan Penulisan Butir Soal

Departemen Pendidikan Nasional

Direktorat Jenderal Manajemen Pendidikan Dasar dan Menengah

Tahun 2008

Cari Blog Ini

Cakap Melayu Dabo Singkep

Penilaian Berbasis Kompetensi

Komentar

Posting Komentar

Postingan populer dari blog ini

Tanggapan atas Pertanyaan Modul 6 tentang Perkembangan Menulis Anak pada Mata Kuliah Metode Pengembangan Bahasa untuk Mahasiswa Program Studi S.1 PGPAUD Universitas Terbuka UPBJJ Batam Pokjar Dabo Singkep Masa Ujian 2016.1

Penilaian Pengetahuan dan Keterampilan dalam K13

Tanggapan atas Pertanyaan Modul 7 tentang Perkembangan Membaca Anak pada Mata Kuliah Metode Pengembangan Bahasa untuk Mahasiswa Program Studi S.1 PGPAUD Universitas Terbuka UPBJJ Batam Pokjar Dabo Singkep