A.
Ringkasan
Seperti disebutkan
sebelumnya, Penilaian Acuan Patokan (PAP) adalah yang paling efektif ketika terbatas pada pengajaran unit yang relatif kecil. Hal
ini memungkinkan supaya lebih jelas mendefinisikan pokok perilaku yang akan
diuji dan untuk mendapatkan sampel yang memadai dari prestasi siswa. Pengujian
prestasi siswa pada setiap pengajaran unit kecil, tentu saja,
membutuhkan cukup banyak waktu untuk pengujian. Karena hal ini membutuhkan banyak waktu dari kegiatan
pembelajaran lain, ujian lebih sering dapat dipertahankan jika memberikan
kontribusi langsung terhadap proses belajar-mengajar. Dengan demikian,
ujian harus menjadi bagian integral pengajaran.
Dalam bab ini kita akan
menggambarkan berbagai cara bahwa PAP dapat digunakan dalam program pengajaran kelas
dan beberapa metode untuk mengevaluasi efektivitas mereka sebagai alat ukur.
1. Pretest
Tes ini dapat diberikan pada
awal kursus atau bagian pengajaran, juga untuk melayani salah
satu penggunaan berikut.
a. Untuk mengukur
keterampilan prasyarat yang diperlukan untuk pengajaran (kesiapan)
b. Untuk menentukan dimana siswa harus
ditempatkan dalam sebuah pengajaran (penempatan)
c. Untuk menentukan bagian
mana dari pengajaran siswa yang telah dikuasai (modifikasi kurikulum)
d. Menyediakan dasar untuk
mengukur belajar selama pengajaran (pretest dan posttest)
PAP ini ternyata jug sesuai untuk melayani
fungsi sebagian besar pra tes karena hasilnya memberikan gambaran pengetahuan
dan keterampilan yang dimiliki oleh siswa. Untuk tujuan pra tes
kebanyakan, kita tidak tertarik pada peringkat relatif dari siswa
(mengacu-norma tes) karena kita mengetahui apa yang siswa mampu dan tidak mampu
lakukan. Hal ini memungkinkan kami untuk memberikan pengajaran perbaikan
yang dibutuhkan, untuk menempatkan siswa dalam kelompok belajar yang tepat, dan
untuk memodifikasi pelajaran agar sesuai dengan kemampuan dan kelemahan siswa.
Dimana kita ingin
mengukur keuntungan belajar, pra tes kita mungkin sangat baik termasuk
bagian-bagian di kedua penguasaan dan tingkat perkembangan. Jika
postest kami dirancang untuk mengukur semua hasil belajar tentu saja, misalnya,
pra tes akan membutuhkan cakupan yang sama komprehensif.
2. Tes Formatif
PAP tes ini juga cocok
untuk tes formatif. Artinya, tes dilakukan selama pengajaran di mana tujuan utama adalah untuk meningkatkan pembelajaran
siswa. Langkah-langkah berikut, yang dimodifikasi bloom
(1971), menggambarkan prosedur yang efektif untuk menggunakan PAP sebagai bagian
integral dari proses pembelajaran.
- Mengadministrasi PAP pada akhir setiap bagian pengajaran.
- Menganalisis hasil untuk menentukan tujuan masing-masing siswa setelah menguasai (lihat formulir laporan dan angka 1, halaman 32).
- Dimana suatu tujuan belum dikuasai, memeriksa bagian tes individu untuk mengidentifikasi kekurangan dalam belajar siswa tertentu.
- Menentukan setiap siswa dalam pembelajaran materi tertentu dan prosedur, ia mungkin menggunakan untuk memperbaiki kekurangan belajarnya (misalnya referensi halaman dalam buku teks, bahan acara, latihan praktek, dll)
- Tes ulang bagi setiap siswa dengan bentuk lain dari tes setelah dia memiliki cukup waktu untuk memperbaiki kekurangan belajarnya.
- Menggunakan informasi dari PAP untuk meningkatkan pengajaran (misalnya modifikasi metode, bahan, atau urutan).
Prosedur di atas
mengasumsikan, tentu saja bahwa setiap PAP uji cermat
dikembangkan mengikuti langkah-langkah yang diuraikan dalam bab 4.
Prosedur ini juga mengasumsikan bahwa tes yang akan digunakan untuk
meningkatkan pembelajaran dan pengajaran dan bukan untuk menetapkan nilai
saja. Karena setiap siswa dapat diajari ulang melalui materi sampai
memahaminya, penugasan tentu saja membuat hasil tes menjadi tidak berarti.
Tes bagian pada tingkat
perkembangan mungkin juga dimasukkan dalam tes unit, untuk menentukan apakah
siswa telah belajar di atas penguasaan minimum. Dimana hal ini
dilakukan, bagian-bagian ini harus ditempatkan di bagian terpisah pada akhir
tes. Sejak penguasaan terpenuhi tidak mungkin pada tingkat perkembangan,
prosedur di atas untuk pengujian dan daur ulang tidak sepenuhnya
berlaku. Bahan resep dan prosedur yang akan membantu siswa untuk
meningkatkan kemajuan ke arah tujuan perkembangan, tentu saja, baik sesuai yang
diinginkan. Hanya saja itu tidak layak untuk menjaga pengulangan sampai
dia mencapai tujuan penguasaan tercapai. Jika standar tidak menguasai
telah ditetapkan untuk tujuan perkembangan, ini mungkin, tentu saja, dapat
digunakan sebagai panduan dalam proses pengujian dan pengulangan.
3. Tes Diagnostik
PAP kecuali digunakan untuk
pengujian formatif juga dapat digunakan untuk tujuan diagnostik jika mereka
digabungkan dengan penggunaan pikiran. Sebuah tes diagnostik didasarkan
pada kesalahan umum siswa sama bagusnya pada sampel yang representatif dari
tugas-tugas yang akan dilakukan.
4. Tes Sumatif
Sebuah tes sumatif adalah tes yang diberikan pada akhir
kursus, atau periode lain dari pengajaran, dan digunakan terutama untuk
menentukan nilai saja. beberapa kombinasi dari mereka, dapat digunakan untuk
pelaporan hasil tes untuk siswa. Contoh lain dari bentuk laporan
berdasarkan tujuan pengajaranonal disajikan dalam publikasi sebelumnya
(Gronlund, 1970).
Dimana perlu untuk melaporkan hasil
tes dalam hal nilai ini, nilai ini mungkin akan tujuannya sebagai berikut:
A. Mencapai semua tujuan
penguasaan dan tinggi pada tujuan perkembangan.
B. Mencapai semua tujuan
penguasaan dan rendah pada tujuan perkembangan.
C. Mencapai semua tujuan
penguasaan saja
Distribusi nilai ini mencerminkan fakta bahwa siswa harus
diizinkan untuk bekerja pada penguasaan tujuan sampai mereka telah berhasil. Proses daur ulang yang
sama yang digunakan dengan tes formatif dapat digunakan dengan bagian
penguasaan tes sumatif. Dengan demikian, siswa tidak gagal. Mereka
hanya tidak ditugaskan kelas sampai mereka sudah menunjukkan penguasaan yang
penting minimal kursus. Dimana daur ulang tidak mungkin, atau tidak
diinginkan, nilai akhir D dan E dapat, tentu saja, ditugaskan kepada siswa yang
belum menguasai nilai minimum.
5. Analisis Penilaian Acuan Patokan (PAP)
Sebelum PAP digunakan harus
ditinjau untuk memastikan bahwa itu memenuhi kriteria tes yang baik.
"cek list untuk mengevaluasi tes", yang disajikan dalam lampiran, dapat berfungsi sebagai acuan
untuk tujuan ini.
Setelah PAP diberikan pada
kelompok kelas, analisis hasil itemdengan item lainnya dapat berguna. Analisis
seperti ini membantu dalam mendiagnosis kesulitan belajar siswa, dalam
mengevaluasi efektivitas item, dan dalam meningkatkan pengajaran. Bentuk sederhana
dari analisis item digambarkan dalam tabel V.
Catatan dalam tabel V
bahwa nama-nama siswa yang tertera pada
bagian kiri dan jumlah bagian tes yang tercantum di bagian atas
meja. Tanda plus menunjukkan response benar dan tanda minus menunjukkan
tanggapan yang salah. Kinerja masing-masing siswa dapat ditentukan dengan
melihat baris dalam tabel. Kolom dalam tabel menunjukkan jumlah tanggapan
yang benar dan salah untuk setiap item. Pada garis vertikal dalam kelompok
meja bersama-sama mereka mengukur barang daerah yang sama dari konten (tekanan
udara, suhu udara, dll). Pengelompokan item tertentu didasarkan pada tabel
spesifikasi dalam tabel IV, bab 4. Sebuah grafik item-respon lengkap,
tentu saja, termasuk sejumlah besar siswa dan akan menampilkan daftar item
untuk semua tujuan unit. Bagian dari grafik yang disajikan dalam tabel V
hanya dimaksudkan untuk menggambarkan format.
Pola respon dalam tabel
V menunjukkan bahwa mayoritas siswa tahu istilah di daerah tempat pertama dari
konten tapi mengalami kesulitan dengan dua daerah terakhir (awan dan
depan). Bahkan, barang-barang cukup terlewati dalam bidang ini surat untuk
menyarankan peninjauan umum. Sebelum meninjau, namun, akan lebih bijaksana
untuk memeriksa item tes individu untuk difect mungkin. Barang sepuluh
adalah khusus mencurigakan, karena tidak ada yang menjawab dengan benar,
mungkin defectiveor mengetik tidak benar.
Pemeriksaan pola setiap
siswa individu tanggapan dalam tabel V mengungkapkan dua siswa yang membutuhkan
bantuan khusus. Mary baker memerlukan bantuan dengan empat bidang lalu
konten dan douglas smith membutuhkan bantuan semua. Meskipun
grafik respon item yang tidak menunjukkan sifat khusus dari kesulitan individu
belajar, itu mengingatkan kita untuk masalah ini dan menunjukkan area umum
kelemahan.
Sebuah analisis item yang lebih komprehensif dapat dibuat di
mana tes yang sama diberikan sebelum dan setelah sebuah unit dari pengajaran. Bila ini dilakukan, tanggapan siswa untuk setiap item pada pretest
dibandingkan dengan tanggapan mereka terhadap item yang sama pada
posttest. Prosedur ini sangat efektif untuk mengevaluasi setiap item dalam
ujian. Contoh singkat dari jenis barang-respon grafik disajikan dalam
tabel VI. Hasil dalam tabel yang sengaja didistorsi untuk menggambarkan
pola dasar beberapa respon barang.
Satu item dalam tabel
VI menggambarkan item yang ideal dalam tes creterion-referenced
penguasaan. Semua studnts menjawab item salah sebelum pengajaran dan benar
setelah intruksi, menunjukkan bahwa kedua item dan pengajaran yang
efektif. Barang merupakan dua item yang terlalu mudah dan item yang
mewakili tiga item yang terlalu sulit. Karena baik jenis item mengukur
prestasi yang dihasilkan dari pengajaran, kita perlu baik merevisi item,
merevisi pengajaran, atau keduanya. Produk seperti barang empat dapat
diharapkan terjadi jarang, tapi mereka jelas menunjukkan cacat item atau pengajaran
miskin. Barang lima menggambarkan pettern respon lebih normal untuk item
uji yang efektif. Artinya, beberapa siswa dapat diharapkan untuk merespon
dengan benar pada pretest tetapi proporsi yang lebih besar dari para siswa akan
merespon dengan benar setelah pengajaran.
Metode tradisional
analisis item, dikembangkan untuk digunakan dengan PAN, memerlukan
variabilitas dalam skor tes. Dengan demikian, mereka menyediakan untuk tes pada tingkat perkembangan,
di mana kisaran nilai yang diharapkan. Mereka tepat menggunakan PAP, namun, karena di sini variabilitas dalam nilai tes tidak
relevan. Idealnya, kami ingin semua siswa untuk mendapatkan nilai sempurna
pada tes penguasaan pada akhir pengajaran. Masalah
memperoleh indeks kecukupan item untuk PAP, dan beberapa kemungkinan, telah dibahas secara rinci oleh Popham (1971).
6. Validitas PAP
Selama pembuatan dan penggunaan PAP, kita prihatin
terutama dengan validitas isi. Artinya, sejauh
mana item tes telah cukup menjadi sampel tujuan dan isi
subyek masalah dari unit pengajaranonal. Langkah dalam perencanaan tes,
diuraikan pada bab 4, berfungsi sebagai pedoman untuk mempersiapkan tes yang
konten yang valid. Daftar tujuan pengajaranonal dan garis konten
mendefinisikan pokok perilaku yang akan
diukur, dan tabel spesifikasi menjelaskan sifat dari sampel uji. Jika item tes tersebut kemudian
dengan hati-hati disusun sesuai dengan spesifikasi tes, respon siswa harus memberikan indikator yang valid pencapaian. Dengan demikian, validitas isi sebagian besar merupakan masalah penghakiman. Kita
harus menilai relevansi dan kecukupan sampel tugas tes untuk mengukur hasil
belajar yang diharapkan dari pengajaran.
Meskipun validitas isi
adalah perhatian utama kami dengan interpretasi kriteria-referensi hasil tes,
kita mungkin juga tertarik dalam memprediksi kemungkinan siswa untuk berhasil
dalam suatu kegiatan di masa depan. Kita mungkin, misalnya, ingin tahu
apakah siswa tersebut cenderung menguasai materi pada akhir unit atau
mendapatkan kelulusan di endof kursus. Sejauh hasil tes di antaranya
adalah akurat dalam memprediksi beberapa kinerja masa depan termasuk dalam
provinsi kriteria yang berhubungan dengan validitas dan dapat terlihat dengan
jelas melalui tabel harapan.
Tabel harapan adalah tabel dua kali lipat yang
menempatkan nilai tes di sisi kiri dan kriteria-skor (ukuran keberhasilan) di
bagian atas. Sebuah tabel ilustrasi, untuk memprediksi penguasaan pada
akhir unit pengajaranonal, akan ditampilkan dalam tabel VII. Perhatikan bahwa tiga siswa mencetak di atas 40 pada penguasaan pretest dan bahwa hanya ada dari sepuluh
siswa mencetak 20, atau lebih rendah, dalam mencapai penguasaan. Meskipun hasil ini
didasarkan pada hanya 30 siswa, mereka menyarankan bahwa siswa masa depan
mencetak 20 atau lebih rendah pada pretest cenderung gagal penguasaan kecuali
mereka diberikan bantuan khusus.
Tabel lain harapan
ilustrasi disajikan dalam tabel VIII. Tabel ini mengilustrasikan
penggunaan skor pretest dalam aritmatika untuk memprediksi keberhasilan dalam
sembilan kelas aljabar. Dalam hal ini nilai akhir yang diterima pada akhir
kursus aljabar menjadi kriteria keberhasilan. Meja itu costructed dengan
menghitung-hitung jumlah siswa di setiap tingkat skor yang diperoleh
masing-masing nilai-huruf. Jumlah ini sangat kemudian konverter untuk sen
per. Meskipun sen per mengacu pada apa yang siswa lakukan di masa lalu,
mereka dapat digunakan untuk memprediksi apa siswa llikely dapat dilakukan di
masa depan. dengan demikian, kita bisa masuk meja dengan skor setiap siswa
pada pretest dan, dengan pergi di seluruh baris itu, menentukan peluangnya
untuk mencapai masing-masing nilai-huruf. Misalnya, seorang siswa dengan
skor 52 akan memiliki 67 kesempatan dari 100 menerima nilai A, sedangkan siswa
dengan skor 36 akan hanya memiliki kesempatan 10 dari 100 menerima A.
Probabilitas produktif masing-masing lain huruf nilai dibaca dengan cara mirip
Harus dicatat bahwa
tabel harapan memberikan prediksi kriteria-referenced dari kesuksesan masa
depan. Tidak ada kebutuhan untuk norma-norma.Untuk setiap nilai ujian
tertentu. Kami dapat membuat prediksi lurus ke depan tentang probabilty
kesuksesan pada beberapa aktivitas masa depan. Di mana kemungkinan keberhasilan
tampak ramping, kita dapat, tentu saja, mengambil tindakan korektif. Dalam
kasus ourpretest dalam aljabar, misalnya, rendah-skor siswa mungkin ditempatkan
dalam kursus matematika umum atau diberi pekerjaan khusus
perbaikan. Membentuk sudut pandang validitas, kami tertarik untuk seberapa
baik nilai ujian kami memprediksi kesuksesan masa depan. Dari sudut
pandang mengajar, namun, kami terutama tertarik bagaimana kita bisa marah
prediksi kinerja rendah.
7. Statistik Pengukuran Validitas dan Reabilitas
Ukuran statistik validitas
dan reabilitas biasanya dinyatakan dengan cara koefisien korelasi. Ukuran
ini memerlukan variabilitas dalam skor tes. Karena variabilitas skor tidak
perlu hadir dalam sejumlah kriteria-referenced tes penguasaan (e, g. Dimana
semua mendapatkan skor sempurna), ukuran statistik semacam itu tidak tepat
(Popham dan Husek, 1971). Meskipun upaya yang dilakukan untuk
mengembangkan statistik baru untuk memperkirakan validitas dan reliabilitas
dari penguasaan PAP, solusi yang memuaskan belum tercapai.
Validitas dan realibilitas
PAP untuk digunakan dalam ruang kelas dapat terbaik dijamin oleh persiapan
ujian hati-hati. Artinya, dengan mengikuti langkah sebelumnya diuraikan
untuk mendapatkan validitas isi dan dengan menggunakan jumlah yang cukup besar
dari item tes untuk setiap hasil belajar untuk mendapatkan hasil
diandalkan. Dimana penafsiran harus didasarkan pada sejumlah kecil item
(katakanlah kurang dari 10) kita harus membuat penilaian hanya sangat tentatif
dan mencari konfirmasi melalui langkah-langkah lain dan melalui observasi
kelas.
Pengujian pada tingkat
perkembangan tidak meminjamkan dirinya untuk ukuran statistik dari validitas
dan reliabilitas, karena di sini variabilitas dalam nilai tes di
diharapkan. Prosedur tradisional yang dijelaskan dalam buku pengukuran
standar, sesuai untuk digunakan dengan tes ini (lihat Gronlund, 1971).
8. Perhatian dalam
menggunakan PAP
Meskipun guru telah
menggunakan elemen pengujian PAP selama bertahun-tahun
(e, g Persentase-benar skor.), Penggunaan tes tersebut untuk mengukur sampel
yang dipilih dengan cermat hasil belajar jelas relatif baru. Karena ada
teori sedikit atau reserch untuk membimbing praktisi, masalah cukup
mendefinisikan domain perilaku, untuk memperoleh suatu contoh reprsentative
hasil belajar, dan membangun item tes yang relevan dapat ditangani hanya dengan
cara perkiraan. Similary, sampai secara lebih memadai untuk menentukan
standar yang tersedia, penetapan standar performansi harus sangat tergantung
pada penilaian wewenang guru tersebut. Untuk
menggunakan PAP secara efektif, pada tahap pengembangan, membutuhkan pengakuan dari fakta
bahwa itu adalah jenis bootstraps operasi. Artinya, kita membuat penilaian
tentang tentatif dalam tujuan pengajaranonal, item tes, dan standar
kinerja, dan merevisi dan menyempurnakan penilaian sebagai pengalaman dan
menentukan informasi baru.
Berikut ini
memperingatkan harus membantu dalam menghindari beberapa perangkap yang lebih
umum dari pengujian PAP.
a. Jangan mengurangi semua
pengajaran dan pengujian untuk tingkat penguasaan. Jika ini dilakukan,
hasil pembelajaran yang lebih kompleks cenderung diabaikan.
b. Hindari penekanan yang
berlebihan dari orang-hasil pembelajaran yang mudah untuk mengidentifikasi dan
menentukan. Pentingnya pendidikan harus menjadi kriteria utama dalam
memilih hasil yang akan diuji.
c. Dalam menetapkan
standard kinerja, perlu diingat bahwa pengalaman belajar masa depan sangat
relevan. Belajar yang tidak digunakan akan segera dilupakan dan kebiasaan
belajar yang digunakan diperkuat.
d. Ketika pengujian ulang
siswa untuk penguasaan tidak tes ulang mereka pada item terjawab saja, karena
hal ini belajar langsung mereka terhadap sampel tertentu dari tugas. Juga,
jika pemilihan tipe item yang digunakan, sebagian dari jawaban yang benar pada
tes dapat accouted untuk dengan menebak. Tes ulang dengan bentuk kedua
dari tes.
e. Jangan memberikan
kriteria-referenced tes untuk siswa untuk tujuan penelitian atau mengajar
langsung untuk ujian. Sebuah tes hampir selalu sampel tugas dan siswa
tidak harus didorong untuk mempelajari sampel tugas saja.
f. Menafsirkan
kriteria-referenced hasil uji hati-hati. Jika sejumlah siswa gagal untuk
menguasai suatu tujuan, kesalahan bisa berada dalam pengajaran, item tes,
standar penguasaan, atau tujuan itu sendiri. Karena ini adalah semua hal
penghakiman, tidak satupun dari mereka adalah sempurna.
PAP dapat memberikan
kontribusi signifikan terhadap proses belajar-mengajar jika hati-hati disiapkan
dan digunakan dengan bijaksana. Interpretasi Demikian juga, PAP pada tingkat
perkembangan dapat memberikan tambahan yang berguna untuk interpretasi
norma-referenced. Apa yang kita butuhkan sekarang adalah teori yang lebih
dan penelitian untuk guid kita. Sampai ini akan datang, kita harus
melanjutkan dengan hati-hati dan sepenuhnya mengenali sifat sementara dari
penilaian kami.
B. Pembahasan
Tes
kriteria-referenced (PAP)
adalah tes
yang menyediakan dasar untuk menentukan
tingkat pengetahuan dan keterampilan dalam kaitannya dengan
tujuan yang
diningkan dengan baik
dalam sebuah materi.
Seringkali satu atau lebih standar kinerja yang ditetapkan pada skala skor tes untuk
membantu dalam interpretasi skor
tes. PAP,
jenis tes yang diperkenalkan oleh
Glaser (1962) dan Popham dan Husek
(1969), juga dikenal sebagai domain-referenced tes, tes kompetensi, keterampilan dasar tes, tes penguasaan, tes kinerja atau penilaian, penilaian otentik, tujuan-referenced tes, berbasis standar tes,
ujian credentialing, dan banyak lagi.
Apa semua tes ini memiliki kesamaan adalah bahwa mereka berusaha untuk menentukan tingkat
kandidat kinerja dalam
kaitannya dengan tujuan yang jelas dari isi materi
PAP
juga merupakan salah satu yang menyediakan
untuk menerjemahkan nilai ujian ke dalam sebuah pernyataan tentang perilaku
yang diharapkan dari seseorang dengan skor atau
hubungan mereka dengan subyek tertentu. Kebanyakan tes dan kuis yang ditulis oleh guru sekolah adalah PAP.
Tujuannya adalah hanya untuk melihat apakah siswa telah
belajar materi. Kriteria penilaian mengacu-dapat dibandingkan
dengan penilaian mengacu-norma dan penilaian
PAP didasarkan pada adanya tujuan pengajaranonal
yang dapat diukur. Tujuan inilah yang dipedomani untuk melaksanakan
pembelajaran dan untuk mengembangkan (menulis) alat ukur. Dengan kata lain apa
yang direncanakan, maka dilaksanakan dalam proses pembelajaran dan diukur untuk
menentukan apakah proses pembelajaran sudah mencapai tujuan.
Dengan PAP setiap individu dapat
diketahui apa yang telah dan belum dikuasainya. Bimbingan individual untuk
meningkatkan penguasaan siswa terhadap materi pelajaran dapat dirancang,
demikian pula untuk memantapkan apa yang telah dikuasainya dapat dikembangkan.
Guru dan setiap peserta didik (siswa) mendapat manfaat dari adanya PAP.
Melalui PAP berkembang upaya untuk
meningkatkan kualitas pembelajaran dengan melaksanakan tes awal (pre
test) dan tes akhir (post test). Perbedaan hasil tes
akhir dengan test awal merupakan petunjuk tentang kualitas proses pembelajaran. Pembelajaran yang menuntut
pencapaian kompetensi tertentu sebagaimana diharapkan dan termuat pada
Penilaian Acuan Patokan kurikulum saat ini, PAP merupakan cara pandang yang
harus diterapkan.
PAP juga dapat digunakan untuk
menghindari hal-hal yang tidak diinginkan, misalnya kurang terkontrolnya
penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak dipenuhinya
nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar
tuntas (mastery learning).
Pada cara ini hanya mereka yang
telah menguasai paling sedikit sekian persen soal-soal yang ditanyakan, siswa
yang dianggap menguasai materi yang ditanyakan itu. Batas kelulusan itu
misalnya dapat menjawab pertanyaan-pertanyaan sebanyak 75%. Bila hendak
dikonversi terhadap nilai A, B, C, D atau E, dapat menggunakan pedoman berikut:
Jika dibandingkan
dengan Penilaian acuan Norma ( PAN ) dan PAP, kedua jenis tes
ini memiliki tujuan yang berbeda secara
fundamental, tidak mengherankan bahwa mereka dibangun secara berbeda dan
dievaluasi secara berbeda. Tes
mengacu-kriteria (PAP) dimaksudkan untuk mengukur seberapa baik seseorang telah
belajar tubuh tertentu dari pengetahuan dan keterampilan. Tes pilihan ganda
kebanyakan orang mengambil untuk mendapatkan surat izin mengemudi dan
on-the-road tes mengemudi keduanya adalah contoh tes mengacu-kriteria. Seperti
pada PAP lainnya, adalah mungkin bagi setiap orang untuk mendapatkan skor yang
lewat jika mereka tahu tentang aturan mengemudi dan jika mereka berkendara
cukup baik.
Sebaliknya,
norma-referenced tes (PAN) yang dibuat untuk membandingkan peserta tes satu
sama lain. Pada tes mengemudi PAN, peserta tes akan dibandingkan siapa yang
tahu sebagian besar atau setidaknya tentang aturan mengemudi atau yang
mengendarai lebih baik atau lebih buruk. Skor akan dilaporkan sebagai
persentase peringkat dengan setengah angka di atas dan setengah di bawah titik
tengah
Dalam
pendidikan, PAP biasanya dibuat untuk menentukan apakah seorang siswa telah
mempelajari materi yang diajarkan di kelas khusus atau kursus. Sebuah PAP
aljabar akan mencakup pertanyaan berdasarkan apa yang seharusnya diajarkan di
kelas aljabar. Ini tidak termasuk pertanyaan geometri aljabar atau lebih maju
daripada berada di kurikulum. Hampir semua mahasiswa yang mengambil aljabar
bisa lulus tes ini jika mereka diajarkan dengan baik dan mereka belajar cukup
dan tes itu dibuat dengan baik.
Pada
PAP standar (yang diambil oleh siswa di banyak sekolah), lewat atau
"cut-off" skor biasanya diatur oleh sebuah komite ahli, sementara di
ruang kelas guru menetapkan skor yang lewat. Dalam kedua kasus, memutuskan skor
yang lewat adalah subyektif, bukan obyektif. Nilai Kadang-kadang dipotong telah
ditetapkan dengan cara yang memaksimalkan jumlah penghasilan rendah atau siswa
minoritas yang gagal tes. Perubahan kecil dalam skor dipotong tidak akan
mengubah arti dari tes tetapi akan sangat menaikkan tingkat suku minoritas
lulus.
Beberapa
dari PAP, seperti tes banyak negara, tidak didasarkan pada kurikulum tertentu,
tetapi pada ide yang lebih umum tentang apa siswa dapat diajarkan. Karena itu,
mereka mungkin tidak sesuai kurikulum. Sebagai contoh, nilai tes matematika 10
negara mungkin termasuk bidang matematika yang beberapa siswa belum belajar.
Sebuah
variasi terbaru dari pengujian mengacu-kriteria adalah "standar-referenced
testing" atau "penilaian berbasis standar." Banyak negara dan
daerah telah mengadopsi standar isi (atau "kerangka kurikulum") yang
menjelaskan apa yang siswa harus ketahui dan mampu lakukan pada subyek yang
berbeda pada tingkat kelas yang berbeda. Mereka juga memiliki standar kinerja
yang menentukan berapa banyak siswa konten standar harus tahu untuk mencapai
tingkat "dasar" atau "mahir" atau "maju" di
daerah subjek. Tes ini kemudian berdasarkan standar dan hasilnya dilaporkan
dalam hal ini "tingkat," yang, tentu saja, merupakan penilaian
manusia. Di beberapa negara, standar kinerja telah terus meningkat, sehingga
mahasiswa terus harus tahu lebih banyak untuk memenuhi tingkat yang sama.
Pendidik
sering tidak setuju tentang kualitas himpunan standar. Standar yang seharusnya
untuk menutupi pengetahuan penting dan keterampilan siswa harus belajar -
". Gambaran besar" mereka menentukan Standar negara harus ditulis
dengan baik dan wajar. Beberapa standar negara telah dikritik karena termasuk
terlalu banyak, karena terlalu samar-samar, karena ridiculously sulit, untuk
melemahkan kurikulum berkualitas tinggi lokal dan pengajaran, dan untuk memihak
dalam kontroversi pendidikan dan politik. Jika standar yang cacat atau
terbatas, tes berdasarkan mereka juga akan. Dalam hal apapun, standar ditegakkan
dengan tes negara akan memiliki - dan dimaksudkan untuk memiliki - dampak yang
kuat pada kurikulum lokal dan pengajaran.
Bahkan
jika standar yang berkualitas tinggi, penting untuk mengetahui seberapa baik
tes tertentu benar-benar sesuai dengan standar. Secara khusus, adalah semua
bagian penting dari standar diukur dengan ujian? Seringkali, banyak topik
penting atau keterampilan tidak dinilai. Alasan
utama untuk ini adalah bahwa kebanyakan ujian negara masih mengandalkan hampir
sepenuhnya pada pertanyaan pilihan ganda dan jawaban pendek. Tes tersebut tidak
dapat mengukur jenis penting dari pembelajaran, seperti kemampuan untuk
melakukan dan melaporkan sebuah percobaan ilmiah, menganalisis dan
menginterpretasikan informasi untuk menyajikan penjelasan yang masuk akal
penyebab Perang Saudara, untuk melakukan proyek seni atau sebuah makalah
penelitian , atau untuk terlibat dalam diskusi serius atau membuat presentasi
publik (lihat LI pada tes pilihan ganda). Sebuah berbasis standar beberapa
ujian telah melampaui pilihan ganda dan jawaban pendek, tetapi bahkan kemudian
mereka mungkin tidak seimbang atau langkah-langkah lengkap dari standar.
Kadang-kadang
satu jenis tes digunakan untuk dua tujuan sekaligus. Selain peserta tes
peringkat dalam kaitannya dengan sampel nasional siswa, PAN dapat digunakan
untuk memutuskan apakah siswa telah belajar konten yang mereka diajarkan.
Sebuah PAP dapat digunakan untuk menilai penguasaan dan peringkat siswa atau
sekolah berdasarkan nilai mereka. Di banyak negara, siswa harus lulus baik
sebagai PAN atau PAP untuk mendapatkan ijazah atau dipromosikan. Ini adalah
penyalahgunaan serius tes. Karena sekolah yang melayani siswa kaya biasanya
mencetak lebih tinggi dari sekolah lain, peringkat sering hanya membandingkan
sekolah berdasarkan kekayaan masyarakat. Praktek ini tidak menawarkan bantuan
nyata bagi sekolah untuk memperbaiki.
PAN
dirancang untuk siswa mengurutkan dan peringkat "pada kurva," tidak
untuk melihat apakah mereka bertemu dengan standar atau kriteria. Oleh karena
itu, PAN tidak boleh digunakan untuk menilai apakah siswa telah memenuhi
standar. Namun, di beberapa negara atau kabupaten yang PAN digunakan untuk
mengukur belajar siswa dalam kaitannya dengan standar. Spesifik cut-off nilai
pada PAN tersebut kemudian dipilih (biasanya oleh sebuah panitia) untuk tingkat
yang terpisah dari pencapaian pada standar. Dalam beberapa kasus, PAP dibuat
dengan menggunakan prosedur teknis yang dikembangkan untuk PAN, menyebabkan PAP
untuk mengurutkan siswa dengan cara yang tidak sesuai untuk berbasis standar
keputusan.
Kadang-kadang
PAN berubah untuk lebih dekat sesuai dengan standar negara dan melaporkan standar-referenced
skor. Akibatnya, negara dapat melaporkan bahwa 35 persen siswa yang mahir
sesuai dengan standar negara (tergantung, tentu saja, di mana nilai cut-off
diatur), tetapi bahwa 60 persen siswa yang berada di atas skor rata-rata
nasional pada tes norma-referenced. Mengadaptasi PAN juga berarti bahwa
sementara semua yang ada di tes ini adalah dalam standar, banyak dari apa yang
ada dalam standar tidak dalam tes.
C. Penutup
Tuntutan publik untuk akuntabilitas, dan akibatnya tinggi
nilai tes standar, tidak akan hilang. Pada tahun 1994, tiga puluh satu negara
diberikan NRTs, sedangkan tiga puluh tiga negara diberikan CRT. Di antara
negara-negara ini, dua puluh dua diberikan keduanya. Hanya dua negara bagian
mengandalkan NRTs secara eksklusif, sedangkan satu negara bergantung secara
eksklusif pada CRT. Mengakui rekomendasi untuk reformasi pendidikan dan
popularitas tes standar, beberapa negara sedang merancang tes yang
"mencerminkan, sejauh mungkin, apa yang kita yakini sebagai praktik
pendidikan yang sesuai" (NCTM, 1991, halaman 9). Selain itu, kebanyakan
negara juga mengatur bentuk-bentuk penilaian seperti contoh penulisan, beberapa
bentuk terbuka penilaian kinerja atau portofolio (CCSSO / NCREL, 1994)
Sebelum suatu negara dapat memilih jenis tes standar digunakan,
pejabat negara pendidikan harus mempertimbangkan jika tes yang memenuhi tiga
standar. Kriteria ini apakah strategi penilaian (ies) dari tes tertentu sesuai
tujuan pendidikan negara, membahas isi negara ingin menilai, dan memungkinkan
jenis-jenis pejabat pendidikan interpretasi negara ingin membuat tentang
kinerja siswa. Begitu mereka telah menentukan tiga hal ini, tugas memilih
antara NRT dan CRT akan menjadi lebih mudah.
DAFTAR PUSTAKA
Cizek, G. (ed.). (2001). Menetapkan
standar kinerja: Konsep, metode, dan perspektif.
Mahwah, NJ: Erlbaum. Glaser, R. (1963). Instruksional teknologi dan pengukuran hasil belajar. Psikolog Amerika, 18, 519-521.
Hambleton, R. K., & Pitoniak, M. (2006). Menetapkan standar kinerja. Dalam RL Brennan (ed.), Pendidikan pengukuran (hal. 433-470). Westport, CT: Amerika Dewan Pendidikan.
Hambleton, R. K., & Zenisky, A. (2003). Isu dan praktek penilaian kinerja. Di C. Reynolds dan R. Kampaus (Eds.), Handbook of penilaian psikologis dan pendidikan anak-anak (hal. 377-404). New York: Guilford
Mahwah, NJ: Erlbaum. Glaser, R. (1963). Instruksional teknologi dan pengukuran hasil belajar. Psikolog Amerika, 18, 519-521.
Hambleton, R. K., & Pitoniak, M. (2006). Menetapkan standar kinerja. Dalam RL Brennan (ed.), Pendidikan pengukuran (hal. 433-470). Westport, CT: Amerika Dewan Pendidikan.
Hambleton, R. K., & Zenisky, A. (2003). Isu dan praktek penilaian kinerja. Di C. Reynolds dan R. Kampaus (Eds.), Handbook of penilaian psikologis dan pendidikan anak-anak (hal. 377-404). New York: Guilford
Corbett, H.D. & Wilson, B.L.
(1991). Pengujian, Reformasi dan Pemberontakan. Norwood, New Jersey: Ablex
Publishing Company.
wah bermanfaat sekali
BalasHapus