ARTIKELKU

Selasa, 22 Mei 2012

Using And Appraising Criterion Referenced Test (CRT) ( Menggunakan dan Menilai Penilaian Acuan Patokan (PAP))


A.    Ringkasan
Seperti disebutkan sebelumnya, Penilaian Acuan Patokan (PAP) adalah yang paling efektif ketika terbatas pada pengajaran unit yang relatif kecil. Hal ini memungkinkan supaya lebih jelas mendefinisikan pokok perilaku yang akan diuji dan untuk mendapatkan sampel yang memadai dari prestasi siswa. Pengujian prestasi siswa pada setiap pengajaran unit kecil, tentu saja, membutuhkan cukup banyak waktu untuk pengujian. Karena hal ini membutuhkan banyak waktu dari kegiatan pembelajaran lain, ujian lebih sering dapat dipertahankan jika memberikan kontribusi langsung terhadap proses belajar-mengajar. Dengan demikian, ujian harus menjadi bagian integral pengajaran.
Dalam bab ini kita akan menggambarkan berbagai cara bahwa PAP dapat digunakan dalam program pengajaran kelas dan beberapa metode untuk mengevaluasi efektivitas mereka sebagai alat ukur.

1.      Pretest
Tes ini dapat diberikan pada awal kursus atau bagian pengajaran, juga untuk melayani salah satu penggunaan berikut.
a.       Untuk mengukur keterampilan prasyarat yang diperlukan untuk pengajaran (kesiapan)
b.      Untuk menentukan dimana siswa harus ditempatkan dalam sebuah pengajaran (penempatan)
c.       Untuk menentukan bagian mana dari pengajaran siswa yang telah dikuasai (modifikasi kurikulum)
d.      Menyediakan dasar untuk mengukur belajar selama pengajaran (pretest dan posttest)

PAP ini ternyata jug sesuai untuk melayani fungsi sebagian besar pra tes karena hasilnya memberikan gambaran pengetahuan dan keterampilan yang dimiliki oleh siswa. Untuk tujuan pra tes kebanyakan, kita tidak tertarik pada peringkat relatif dari siswa (mengacu-norma tes) karena kita mengetahui apa yang siswa mampu dan tidak mampu lakukan. Hal ini memungkinkan kami untuk memberikan pengajaran perbaikan yang dibutuhkan, untuk menempatkan siswa dalam kelompok belajar yang tepat, dan untuk memodifikasi pelajaran agar sesuai dengan kemampuan dan kelemahan siswa.
Dimana kita ingin mengukur keuntungan belajar, pra tes kita mungkin sangat baik termasuk bagian-bagian di kedua penguasaan dan tingkat perkembangan. Jika postest kami dirancang untuk mengukur semua hasil belajar tentu saja, misalnya, pra tes akan membutuhkan cakupan yang sama komprehensif.
2.      Tes Formatif
PAP tes ini juga cocok untuk tes formatif. Artinya, tes dilakukan selama pengajaran di mana tujuan utama adalah untuk meningkatkan pembelajaran siswa. Langkah-langkah berikut, yang dimodifikasi bloom (1971), menggambarkan prosedur yang efektif untuk menggunakan PAP sebagai bagian integral dari proses pembelajaran.
  1. Mengadministrasi PAP pada akhir setiap bagian pengajaran.
  2. Menganalisis hasil untuk menentukan tujuan masing-masing siswa setelah menguasai (lihat formulir laporan dan angka 1, halaman 32).
  3. Dimana suatu tujuan belum dikuasai, memeriksa bagian tes individu untuk mengidentifikasi kekurangan dalam belajar siswa tertentu.
  4. Menentukan setiap siswa dalam pembelajaran materi tertentu dan prosedur, ia mungkin menggunakan untuk memperbaiki kekurangan belajarnya (misalnya referensi halaman dalam buku teks, bahan acara, latihan praktek, dll)
  5. Tes ulang bagi setiap siswa dengan bentuk lain dari tes setelah dia memiliki cukup waktu untuk memperbaiki kekurangan belajarnya.
  6. Menggunakan informasi dari PAP untuk meningkatkan pengajaran (misalnya modifikasi metode, bahan, atau urutan).
Prosedur di atas mengasumsikan, tentu saja bahwa setiap PAP uji cermat dikembangkan mengikuti langkah-langkah yang diuraikan dalam bab 4.  Prosedur ini juga mengasumsikan bahwa tes yang akan digunakan untuk meningkatkan pembelajaran dan pengajaran dan bukan untuk menetapkan nilai saja. Karena setiap siswa dapat diajari ulang melalui materi sampai memahaminya, penugasan tentu saja membuat hasil tes menjadi tidak berarti.
Tes bagian pada tingkat perkembangan mungkin juga dimasukkan dalam tes unit, untuk menentukan apakah siswa telah belajar di atas penguasaan minimum. Dimana hal ini dilakukan, bagian-bagian ini harus ditempatkan di bagian terpisah pada akhir tes. Sejak penguasaan terpenuhi tidak mungkin pada tingkat perkembangan, prosedur di atas untuk pengujian dan daur ulang tidak sepenuhnya berlaku. Bahan resep dan prosedur yang akan membantu siswa untuk meningkatkan kemajuan ke arah tujuan perkembangan, tentu saja, baik sesuai yang diinginkan. Hanya saja itu tidak layak untuk menjaga pengulangan sampai dia mencapai tujuan penguasaan tercapai. Jika standar tidak menguasai telah ditetapkan untuk tujuan perkembangan, ini mungkin, tentu saja, dapat digunakan sebagai panduan dalam proses pengujian dan pengulangan.
3.      Tes Diagnostik
PAP kecuali digunakan untuk pengujian formatif juga dapat digunakan untuk tujuan diagnostik jika mereka digabungkan dengan penggunaan pikiran. Sebuah tes diagnostik didasarkan pada kesalahan umum siswa sama bagusnya pada sampel yang representatif dari tugas-tugas yang akan dilakukan. 
4.      Tes Sumatif 
Sebuah tes sumatif adalah tes yang diberikan pada akhir kursus, atau periode lain dari pengajaran, dan digunakan terutama untuk menentukan nilai saja. beberapa kombinasi dari mereka, dapat digunakan untuk pelaporan hasil tes untuk siswa. Contoh lain dari bentuk laporan berdasarkan tujuan pengajaranonal disajikan dalam publikasi sebelumnya (Gronlund, 1970).
Dimana perlu untuk melaporkan hasil tes dalam hal nilai ini, nilai ini mungkin akan tujuannya sebagai berikut:
A.      Mencapai semua tujuan penguasaan dan tinggi pada tujuan perkembangan.
B.       Mencapai semua tujuan penguasaan dan rendah pada tujuan perkembangan.
C.       Mencapai semua tujuan penguasaan saja
Distribusi nilai ini mencerminkan fakta bahwa siswa harus diizinkan untuk bekerja pada penguasaan tujuan sampai mereka telah berhasil. Proses daur ulang yang sama yang digunakan dengan tes formatif dapat digunakan dengan bagian penguasaan tes sumatif. Dengan demikian, siswa tidak gagal. Mereka hanya tidak ditugaskan kelas sampai mereka sudah menunjukkan penguasaan yang penting minimal kursus. Dimana daur ulang tidak mungkin, atau tidak diinginkan, nilai akhir D dan E dapat, tentu saja, ditugaskan kepada siswa yang belum menguasai nilai minimum.



5.      Analisis Penilaian Acuan Patokan (PAP)
Sebelum PAP digunakan harus ditinjau untuk memastikan bahwa itu memenuhi kriteria tes yang baik.  "cek list untuk mengevaluasi tes", yang disajikan  dalam lampiran, dapat berfungsi sebagai acuan untuk tujuan ini.
Setelah PAP diberikan pada kelompok kelas, analisis hasil itemdengan item lainnya dapat berguna. Analisis seperti ini membantu dalam mendiagnosis kesulitan belajar siswa, dalam mengevaluasi efektivitas item, dan dalam meningkatkan pengajaran. Bentuk sederhana dari analisis item digambarkan dalam tabel V.
Catatan dalam tabel V bahwa nama-nama siswa yang tertera pada bagian kiri dan jumlah bagian tes yang tercantum di bagian atas meja. Tanda plus menunjukkan response benar dan tanda minus menunjukkan tanggapan yang salah. Kinerja masing-masing siswa dapat ditentukan dengan melihat baris dalam tabel. Kolom dalam tabel menunjukkan jumlah tanggapan yang benar dan salah untuk setiap item. Pada garis vertikal dalam kelompok meja bersama-sama mereka mengukur barang daerah yang sama dari konten (tekanan udara, suhu udara, dll). Pengelompokan item tertentu didasarkan pada tabel spesifikasi dalam tabel IV, bab 4. Sebuah grafik item-respon lengkap, tentu saja, termasuk sejumlah besar siswa dan akan menampilkan daftar item untuk semua tujuan unit. Bagian dari grafik yang disajikan dalam tabel V hanya dimaksudkan untuk menggambarkan format.
Pola respon dalam tabel V menunjukkan bahwa mayoritas siswa tahu istilah di daerah tempat pertama dari konten tapi mengalami kesulitan dengan dua daerah terakhir (awan dan depan). Bahkan, barang-barang cukup terlewati dalam bidang ini surat untuk menyarankan peninjauan umum. Sebelum meninjau, namun, akan lebih bijaksana untuk memeriksa item tes individu untuk difect mungkin. Barang sepuluh adalah khusus mencurigakan, karena tidak ada yang menjawab dengan benar, mungkin defectiveor mengetik tidak benar.
Pemeriksaan pola setiap siswa individu tanggapan dalam tabel V mengungkapkan dua siswa yang membutuhkan bantuan khusus. Mary baker memerlukan bantuan dengan empat bidang lalu konten dan douglas smith membutuhkan bantuan semua. Meskipun grafik respon item yang tidak menunjukkan sifat khusus dari kesulitan individu belajar, itu mengingatkan kita untuk masalah ini dan menunjukkan area umum kelemahan.
Sebuah analisis item yang lebih komprehensif dapat dibuat di mana tes yang sama diberikan sebelum dan setelah sebuah unit dari pengajaran. Bila ini dilakukan, tanggapan siswa untuk setiap item pada pretest dibandingkan dengan tanggapan mereka terhadap item yang sama pada posttest. Prosedur ini sangat efektif untuk mengevaluasi setiap item dalam ujian. Contoh singkat dari jenis barang-respon grafik disajikan dalam tabel VI. Hasil dalam tabel yang sengaja didistorsi untuk menggambarkan pola dasar beberapa respon barang.
Satu item dalam tabel VI menggambarkan item yang ideal dalam tes creterion-referenced penguasaan. Semua studnts menjawab item salah sebelum pengajaran dan benar setelah intruksi, menunjukkan bahwa kedua item dan pengajaran yang efektif. Barang merupakan dua item yang terlalu mudah dan item yang mewakili tiga item yang terlalu sulit. Karena baik jenis item mengukur prestasi yang dihasilkan dari pengajaran, kita perlu baik merevisi item, merevisi pengajaran, atau keduanya. Produk seperti barang empat dapat diharapkan terjadi jarang, tapi mereka jelas menunjukkan cacat item atau pengajaran miskin. Barang lima menggambarkan pettern respon lebih normal untuk item uji yang efektif. Artinya, beberapa siswa dapat diharapkan untuk merespon dengan benar pada pretest tetapi proporsi yang lebih besar dari para siswa akan merespon dengan benar setelah pengajaran.
Metode tradisional analisis item, dikembangkan untuk digunakan dengan PAN, memerlukan variabilitas dalam skor tes. Dengan demikian, mereka menyediakan  untuk tes pada tingkat perkembangan, di mana kisaran nilai yang diharapkan. Mereka tepat menggunakan PAP, namun, karena di sini variabilitas dalam nilai tes tidak relevan. Idealnya, kami ingin semua siswa untuk mendapatkan nilai sempurna pada tes penguasaan pada akhir pengajaran. Masalah memperoleh indeks kecukupan item untuk PAP, dan beberapa kemungkinan, telah dibahas secara rinci oleh Popham (1971).

6.      Validitas PAP
Selama pembuatan dan penggunaan PAP, kita prihatin terutama dengan validitas isi. Artinya, sejauh mana item tes telah cukup menjadi sampel tujuan dan isi subyek masalah dari unit pengajaranonal. Langkah dalam perencanaan tes, diuraikan pada bab 4, berfungsi sebagai pedoman untuk mempersiapkan tes yang konten yang valid. Daftar tujuan pengajaranonal dan garis konten mendefinisikan pokok perilaku yang akan diukur, dan tabel spesifikasi menjelaskan sifat dari sampel uji. Jika item tes tersebut kemudian dengan hati-hati disusun sesuai dengan spesifikasi tes, respon siswa harus memberikan indikator yang valid pencapaian. Dengan demikian, validitas isi sebagian besar merupakan masalah penghakiman. Kita harus menilai relevansi dan kecukupan sampel tugas tes untuk mengukur hasil belajar yang diharapkan dari pengajaran.
Meskipun validitas isi adalah perhatian utama kami dengan interpretasi kriteria-referensi hasil tes, kita mungkin juga tertarik dalam memprediksi kemungkinan siswa untuk berhasil dalam suatu kegiatan di masa depan. Kita mungkin, misalnya, ingin tahu apakah siswa tersebut cenderung menguasai materi pada akhir unit atau mendapatkan kelulusan di endof kursus. Sejauh hasil tes di antaranya adalah akurat dalam memprediksi beberapa kinerja masa depan termasuk dalam provinsi kriteria yang berhubungan dengan validitas dan dapat terlihat dengan jelas melalui tabel harapan.
Tabel harapan adalah tabel dua kali lipat yang menempatkan nilai tes di sisi kiri dan kriteria-skor (ukuran keberhasilan) di bagian atas. Sebuah tabel ilustrasi, untuk memprediksi penguasaan pada akhir unit pengajaranonal, akan ditampilkan dalam tabel VII. Perhatikan bahwa tiga siswa mencetak di atas 40 pada penguasaan pretest dan bahwa hanya ada dari sepuluh siswa mencetak 20, atau lebih rendah, dalam mencapai penguasaan. Meskipun hasil ini didasarkan pada hanya 30 siswa, mereka menyarankan bahwa siswa masa depan mencetak 20 atau lebih rendah pada pretest cenderung gagal penguasaan kecuali mereka diberikan bantuan khusus.
Tabel lain harapan ilustrasi disajikan dalam tabel VIII. Tabel ini mengilustrasikan penggunaan skor pretest dalam aritmatika untuk memprediksi keberhasilan dalam sembilan kelas aljabar. Dalam hal ini nilai akhir yang diterima pada akhir kursus aljabar menjadi kriteria keberhasilan. Meja itu costructed dengan menghitung-hitung jumlah siswa di setiap tingkat skor yang diperoleh masing-masing nilai-huruf. Jumlah ini sangat kemudian konverter untuk sen per. Meskipun sen per mengacu pada apa yang siswa lakukan di masa lalu, mereka dapat digunakan untuk memprediksi apa siswa llikely dapat dilakukan di masa depan. dengan demikian, kita bisa masuk meja dengan skor setiap siswa pada pretest dan, dengan pergi di seluruh baris itu, menentukan peluangnya untuk mencapai masing-masing nilai-huruf. Misalnya, seorang siswa dengan skor 52 akan memiliki 67 kesempatan dari 100 menerima nilai A, sedangkan siswa dengan skor 36 akan hanya memiliki kesempatan 10 dari 100 menerima A. Probabilitas produktif masing-masing lain huruf nilai dibaca dengan cara mirip
Harus dicatat bahwa tabel harapan memberikan prediksi kriteria-referenced dari kesuksesan masa depan. Tidak ada kebutuhan untuk norma-norma.Untuk setiap nilai ujian tertentu. Kami dapat membuat prediksi lurus ke depan tentang probabilty kesuksesan pada beberapa aktivitas masa depan. Di mana kemungkinan keberhasilan tampak ramping, kita dapat, tentu saja, mengambil tindakan korektif. Dalam kasus ourpretest dalam aljabar, misalnya, rendah-skor siswa mungkin ditempatkan dalam kursus matematika umum atau diberi pekerjaan khusus perbaikan. Membentuk sudut pandang validitas, kami tertarik untuk seberapa baik nilai ujian kami memprediksi kesuksesan masa depan. Dari sudut pandang mengajar, namun, kami terutama tertarik bagaimana kita bisa marah prediksi kinerja rendah.

7.      Statistik Pengukuran Validitas dan Reabilitas
Ukuran statistik validitas dan reabilitas biasanya dinyatakan dengan cara koefisien korelasi. Ukuran ini memerlukan variabilitas dalam skor tes. Karena variabilitas skor tidak perlu hadir dalam sejumlah kriteria-referenced tes penguasaan (e, g. Dimana semua mendapatkan skor sempurna), ukuran statistik semacam itu tidak tepat (Popham dan Husek, 1971). Meskipun upaya yang dilakukan untuk mengembangkan statistik baru untuk memperkirakan validitas dan reliabilitas dari penguasaan PAP, solusi yang memuaskan belum tercapai.
Validitas dan realibilitas PAP untuk digunakan dalam ruang kelas dapat terbaik dijamin oleh persiapan ujian hati-hati. Artinya, dengan mengikuti langkah sebelumnya diuraikan untuk mendapatkan validitas isi dan dengan menggunakan jumlah yang cukup besar dari item tes untuk setiap hasil belajar untuk mendapatkan hasil diandalkan. Dimana penafsiran harus didasarkan pada sejumlah kecil item (katakanlah kurang dari 10) kita harus membuat penilaian hanya sangat tentatif dan mencari konfirmasi melalui langkah-langkah lain dan melalui observasi kelas.
Pengujian pada tingkat perkembangan tidak meminjamkan dirinya untuk ukuran statistik dari validitas dan reliabilitas, karena di sini variabilitas dalam nilai tes di diharapkan. Prosedur tradisional yang dijelaskan dalam buku pengukuran standar, sesuai untuk digunakan dengan tes ini (lihat Gronlund, 1971).
8.      Perhatian dalam menggunakan PAP
Meskipun guru telah menggunakan elemen pengujian PAP selama bertahun-tahun (e, g Persentase-benar skor.), Penggunaan tes tersebut untuk mengukur sampel yang dipilih dengan cermat hasil belajar jelas relatif baru. Karena ada teori sedikit atau reserch untuk membimbing praktisi, masalah cukup mendefinisikan domain perilaku, untuk memperoleh suatu contoh reprsentative hasil belajar, dan membangun item tes yang relevan dapat ditangani hanya dengan cara perkiraan. Similary, sampai secara lebih memadai untuk menentukan standar yang tersedia, penetapan standar performansi harus sangat tergantung pada penilaian wewenang guru tersebut. Untuk menggunakan PAP secara efektif, pada tahap pengembangan, membutuhkan pengakuan dari fakta bahwa itu adalah jenis bootstraps operasi. Artinya, kita membuat penilaian tentang tentatif dalam tujuan pengajaranonal, item tes, dan standar kinerja, dan merevisi dan menyempurnakan penilaian sebagai pengalaman dan menentukan informasi baru.
Berikut ini memperingatkan harus membantu dalam menghindari beberapa perangkap yang lebih umum dari pengujian PAP.
a.       Jangan mengurangi semua pengajaran dan pengujian untuk tingkat penguasaan. Jika ini dilakukan, hasil pembelajaran yang lebih kompleks cenderung diabaikan.
b.      Hindari penekanan yang berlebihan dari orang-hasil pembelajaran yang mudah untuk mengidentifikasi dan menentukan. Pentingnya pendidikan harus menjadi kriteria utama dalam memilih hasil yang akan diuji.
c.       Dalam menetapkan standard kinerja, perlu diingat bahwa pengalaman belajar masa depan sangat relevan. Belajar yang tidak digunakan akan segera dilupakan dan kebiasaan belajar yang digunakan diperkuat.
d.      Ketika pengujian ulang siswa untuk penguasaan tidak tes ulang mereka pada item terjawab saja, karena hal ini belajar langsung mereka terhadap sampel tertentu dari tugas. Juga, jika pemilihan tipe item yang digunakan, sebagian dari jawaban yang benar pada tes dapat accouted untuk dengan menebak. Tes ulang dengan bentuk kedua dari tes.
e.       Jangan memberikan kriteria-referenced tes untuk siswa untuk tujuan penelitian atau mengajar langsung untuk ujian. Sebuah tes hampir selalu sampel tugas dan siswa tidak harus didorong untuk mempelajari sampel tugas saja.
f.       Menafsirkan kriteria-referenced hasil uji hati-hati. Jika sejumlah siswa gagal untuk menguasai suatu tujuan, kesalahan bisa berada dalam pengajaran, item tes, standar penguasaan, atau tujuan itu sendiri. Karena ini adalah semua hal penghakiman, tidak satupun dari mereka adalah sempurna.
PAP dapat memberikan kontribusi signifikan terhadap proses belajar-mengajar jika hati-hati disiapkan dan digunakan dengan bijaksana. Interpretasi Demikian juga, PAP pada tingkat perkembangan dapat memberikan tambahan yang berguna untuk interpretasi norma-referenced. Apa yang kita butuhkan sekarang adalah teori yang lebih dan penelitian untuk guid kita. Sampai ini akan datang, kita harus melanjutkan dengan hati-hati dan sepenuhnya mengenali sifat sementara dari penilaian kami.
B.     Pembahasan
Tes kriteria-referenced (PAP) adalah tes yang menyediakan dasar untuk menentukan tingkat pengetahuan dan keterampilan dalam kaitannya dengan tujuan yang diningkan dengan baik dalam sebuah materi. Seringkali satu atau lebih standar kinerja yang ditetapkan pada skala skor tes untuk membantu dalam interpretasi skor tes. PAP, jenis tes yang diperkenalkan oleh Glaser (1962) dan Popham dan Husek (1969), juga dikenal sebagai domain-referenced tes, tes kompetensi, keterampilan dasar tes, tes penguasaan, tes kinerja atau penilaian, penilaian otentik, tujuan-referenced tes, berbasis standar tes, ujian credentialing, dan banyak lagi. Apa semua tes ini memiliki kesamaan adalah bahwa mereka berusaha untuk menentukan tingkat kandidat kinerja dalam kaitannya dengan tujuan yang jelas dari isi materi
PAP juga merupakan salah satu yang menyediakan untuk menerjemahkan nilai ujian ke dalam sebuah pernyataan tentang perilaku yang diharapkan dari seseorang dengan skor atau hubungan mereka dengan subyek tertentu. Kebanyakan tes dan kuis yang ditulis oleh guru sekolah adalah PAP. Tujuannya adalah hanya untuk melihat apakah siswa telah belajar materi. Kriteria penilaian mengacu-dapat dibandingkan dengan penilaian mengacu-norma dan penilaian
PAP didasarkan pada adanya tujuan pengajaranonal yang dapat diukur. Tujuan inilah yang dipedomani untuk melaksanakan pembelajaran dan untuk mengembangkan (menulis) alat ukur. Dengan kata lain apa yang direncanakan, maka dilaksanakan dalam proses pembelajaran dan diukur untuk menentukan apakah proses pembelajaran sudah mencapai tujuan.
Dengan PAP setiap individu dapat diketahui apa yang telah dan belum dikuasainya. Bimbingan individual untuk meningkatkan penguasaan siswa terhadap materi pelajaran dapat dirancang, demikian pula untuk memantapkan apa yang telah dikuasainya dapat dikembangkan. Guru dan setiap peserta didik (siswa) mendapat manfaat dari adanya PAP.
Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran dengan melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir dengan test awal merupakan petunjuk tentang kualitas proses pembelajaran. Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan termuat pada Penilaian Acuan Patokan kurikulum saat ini, PAP merupakan cara pandang yang harus diterapkan.
PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya kurang terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar tuntas (mastery learning).
Pada cara ini hanya mereka yang telah menguasai paling sedikit sekian persen soal-soal yang ditanyakan, siswa yang dianggap menguasai materi yang ditanyakan itu. Batas kelulusan itu misalnya dapat menjawab pertanyaan-pertanyaan sebanyak 75%. Bila hendak dikonversi terhadap nilai A, B, C, D atau E, dapat menggunakan pedoman berikut:
Jika dibandingkan dengan Penilaian acuan Norma ( PAN ) dan PAP, kedua jenis tes ini memiliki tujuan yang berbeda secara fundamental, tidak mengherankan bahwa mereka dibangun secara berbeda dan dievaluasi secara berbeda. Tes mengacu-kriteria (PAP) dimaksudkan untuk mengukur seberapa baik seseorang telah belajar tubuh tertentu dari pengetahuan dan keterampilan. Tes pilihan ganda kebanyakan orang mengambil untuk mendapatkan surat izin mengemudi dan on-the-road tes mengemudi keduanya adalah contoh tes mengacu-kriteria. Seperti pada PAP lainnya, adalah mungkin bagi setiap orang untuk mendapatkan skor yang lewat jika mereka tahu tentang aturan mengemudi dan jika mereka berkendara cukup baik.
Sebaliknya, norma-referenced tes (PAN) yang dibuat untuk membandingkan peserta tes satu sama lain. Pada tes mengemudi PAN, peserta tes akan dibandingkan siapa yang tahu sebagian besar atau setidaknya tentang aturan mengemudi atau yang mengendarai lebih baik atau lebih buruk. Skor akan dilaporkan sebagai persentase peringkat dengan setengah angka di atas dan setengah di bawah titik tengah
Dalam pendidikan, PAP biasanya dibuat untuk menentukan apakah seorang siswa telah mempelajari materi yang diajarkan di kelas khusus atau kursus. Sebuah PAP aljabar akan mencakup pertanyaan berdasarkan apa yang seharusnya diajarkan di kelas aljabar. Ini tidak termasuk pertanyaan geometri aljabar atau lebih maju daripada berada di kurikulum. Hampir semua mahasiswa yang mengambil aljabar bisa lulus tes ini jika mereka diajarkan dengan baik dan mereka belajar cukup dan tes itu dibuat dengan baik.
Pada PAP standar (yang diambil oleh siswa di banyak sekolah), lewat atau "cut-off" skor biasanya diatur oleh sebuah komite ahli, sementara di ruang kelas guru menetapkan skor yang lewat. Dalam kedua kasus, memutuskan skor yang lewat adalah subyektif, bukan obyektif. Nilai Kadang-kadang dipotong telah ditetapkan dengan cara yang memaksimalkan jumlah penghasilan rendah atau siswa minoritas yang gagal tes. Perubahan kecil dalam skor dipotong tidak akan mengubah arti dari tes tetapi akan sangat menaikkan tingkat suku minoritas lulus.
Beberapa dari PAP, seperti tes banyak negara, tidak didasarkan pada kurikulum tertentu, tetapi pada ide yang lebih umum tentang apa siswa dapat diajarkan. Karena itu, mereka mungkin tidak sesuai kurikulum. Sebagai contoh, nilai tes matematika 10 negara mungkin termasuk bidang matematika yang beberapa siswa belum belajar.
Sebuah variasi terbaru dari pengujian mengacu-kriteria adalah "standar-referenced testing" atau "penilaian berbasis standar." Banyak negara dan daerah telah mengadopsi standar isi (atau "kerangka kurikulum") yang menjelaskan apa yang siswa harus ketahui dan mampu lakukan pada subyek yang berbeda pada tingkat kelas yang berbeda. Mereka juga memiliki standar kinerja yang menentukan berapa banyak siswa konten standar harus tahu untuk mencapai tingkat "dasar" atau "mahir" atau "maju" di daerah subjek. Tes ini kemudian berdasarkan standar dan hasilnya dilaporkan dalam hal ini "tingkat," yang, tentu saja, merupakan penilaian manusia. Di beberapa negara, standar kinerja telah terus meningkat, sehingga mahasiswa terus harus tahu lebih banyak untuk memenuhi tingkat yang sama.
Pendidik sering tidak setuju tentang kualitas himpunan standar. Standar yang seharusnya untuk menutupi pengetahuan penting dan keterampilan siswa harus belajar - ". Gambaran besar" mereka menentukan Standar negara harus ditulis dengan baik dan wajar. Beberapa standar negara telah dikritik karena termasuk terlalu banyak, karena terlalu samar-samar, karena ridiculously sulit, untuk melemahkan kurikulum berkualitas tinggi lokal dan pengajaran, dan untuk memihak dalam kontroversi pendidikan dan politik. Jika standar yang cacat atau terbatas, tes berdasarkan mereka juga akan. Dalam hal apapun, standar ditegakkan dengan tes negara akan memiliki - dan dimaksudkan untuk memiliki - dampak yang kuat pada kurikulum lokal dan pengajaran.
Bahkan jika standar yang berkualitas tinggi, penting untuk mengetahui seberapa baik tes tertentu benar-benar sesuai dengan standar. Secara khusus, adalah semua bagian penting dari standar diukur dengan ujian? Seringkali, banyak topik penting atau keterampilan tidak dinilai. Alasan utama untuk ini adalah bahwa kebanyakan ujian negara masih mengandalkan hampir sepenuhnya pada pertanyaan pilihan ganda dan jawaban pendek. Tes tersebut tidak dapat mengukur jenis penting dari pembelajaran, seperti kemampuan untuk melakukan dan melaporkan sebuah percobaan ilmiah, menganalisis dan menginterpretasikan informasi untuk menyajikan penjelasan yang masuk akal penyebab Perang Saudara, untuk melakukan proyek seni atau sebuah makalah penelitian , atau untuk terlibat dalam diskusi serius atau membuat presentasi publik (lihat LI pada tes pilihan ganda). Sebuah berbasis standar beberapa ujian telah melampaui pilihan ganda dan jawaban pendek, tetapi bahkan kemudian mereka mungkin tidak seimbang atau langkah-langkah lengkap dari standar.
Kadang-kadang satu jenis tes digunakan untuk dua tujuan sekaligus. Selain peserta tes peringkat dalam kaitannya dengan sampel nasional siswa, PAN dapat digunakan untuk memutuskan apakah siswa telah belajar konten yang mereka diajarkan. Sebuah PAP dapat digunakan untuk menilai penguasaan dan peringkat siswa atau sekolah berdasarkan nilai mereka. Di banyak negara, siswa harus lulus baik sebagai PAN atau PAP untuk mendapatkan ijazah atau dipromosikan. Ini adalah penyalahgunaan serius tes. Karena sekolah yang melayani siswa kaya biasanya mencetak lebih tinggi dari sekolah lain, peringkat sering hanya membandingkan sekolah berdasarkan kekayaan masyarakat. Praktek ini tidak menawarkan bantuan nyata bagi sekolah untuk memperbaiki.
PAN dirancang untuk siswa mengurutkan dan peringkat "pada kurva," tidak untuk melihat apakah mereka bertemu dengan standar atau kriteria. Oleh karena itu, PAN tidak boleh digunakan untuk menilai apakah siswa telah memenuhi standar. Namun, di beberapa negara atau kabupaten yang PAN digunakan untuk mengukur belajar siswa dalam kaitannya dengan standar. Spesifik cut-off nilai pada PAN tersebut kemudian dipilih (biasanya oleh sebuah panitia) untuk tingkat yang terpisah dari pencapaian pada standar. Dalam beberapa kasus, PAP dibuat dengan menggunakan prosedur teknis yang dikembangkan untuk PAN, menyebabkan PAP untuk mengurutkan siswa dengan cara yang tidak sesuai untuk berbasis standar keputusan.
Kadang-kadang PAN berubah untuk lebih dekat sesuai dengan standar negara dan melaporkan standar-referenced skor. Akibatnya, negara dapat melaporkan bahwa 35 persen siswa yang mahir sesuai dengan standar negara (tergantung, tentu saja, di mana nilai cut-off diatur), tetapi bahwa 60 persen siswa yang berada di atas skor rata-rata nasional pada tes norma-referenced. Mengadaptasi PAN juga berarti bahwa sementara semua yang ada di tes ini adalah dalam standar, banyak dari apa yang ada dalam standar tidak dalam tes.
C.    Penutup
Tuntutan publik untuk akuntabilitas, dan akibatnya tinggi nilai tes standar, tidak akan hilang. Pada tahun 1994, tiga puluh satu negara diberikan NRTs, sedangkan tiga puluh tiga negara diberikan CRT. Di antara negara-negara ini, dua puluh dua diberikan keduanya. Hanya dua negara bagian mengandalkan NRTs secara eksklusif, sedangkan satu negara bergantung secara eksklusif pada CRT. Mengakui rekomendasi untuk reformasi pendidikan dan popularitas tes standar, beberapa negara sedang merancang tes yang "mencerminkan, sejauh mungkin, apa yang kita yakini sebagai praktik pendidikan yang sesuai" (NCTM, 1991, halaman 9). Selain itu, kebanyakan negara juga mengatur bentuk-bentuk penilaian seperti contoh penulisan, beberapa bentuk terbuka penilaian kinerja atau portofolio (CCSSO / NCREL, 1994)
Sebelum suatu negara dapat memilih jenis tes standar digunakan, pejabat negara pendidikan harus mempertimbangkan jika tes yang memenuhi tiga standar. Kriteria ini apakah strategi penilaian (ies) dari tes tertentu sesuai tujuan pendidikan negara, membahas isi negara ingin menilai, dan memungkinkan jenis-jenis pejabat pendidikan interpretasi negara ingin membuat tentang kinerja siswa. Begitu mereka telah menentukan tiga hal ini, tugas memilih antara NRT dan CRT akan menjadi lebih mudah.





DAFTAR PUSTAKA

Cizek, G. (ed.). (2001). Menetapkan standar kinerja: Konsep, metode, dan perspektif.

Mahwah, NJ: Erlbaum. Glaser, R. (1963). Instruksional teknologi dan pengukuran hasil belajar. Psikolog Amerika, 18, 519-521.

Hambleton, R. K., & Pitoniak, M. (2006). Menetapkan standar kinerja. Dalam RL Brennan (ed.), Pendidikan pengukuran (hal. 433-470). Westport, CT: Amerika Dewan Pendidikan.

Hambleton, R. K., & Zenisky, A. (2003). Isu dan praktek penilaian kinerja. Di C. Reynolds dan R. Kampaus (Eds.), Handbook of penilaian psikologis dan pendidikan anak-anak (hal. 377-404). New York: Guilford

Corbett, H.D. & Wilson, B.L. (1991). Pengujian, Reformasi dan Pemberontakan. Norwood, New Jersey: Ablex Publishing Company.



1 komentar: