Post on 05-Dec-2014
1
UNIT PELAJARAN 1
KONSEP ASAS PENGUJIAN, PENGUKURAN, PENILAIAN DAN PENTAKSIRAN
HASIL PEMBELAJARAN Di akhir unit ini, anda diharap dapat:
1. Menghuraikan maksud pengujian (testing), pengukuran (measurement),
penaksiran (assessment) dan penilaian (evaluation).
2. Menghuraikan perkaitan di antara pengujian, pengukuran, penaksiran
dan penilaian.
PENGENALAN
2
Sebagai seorang guru atau pelajar kita harus memahami bahawa matlamat utama
penilaian adalah untuk membekalkan maklumat. Situasi seperti di Rajah 1.1 mungkin
anda hadapi ketika anda ingin mengumpul maklumat tersebut. Untuk mengumpul
maklumat tersebut, guru akan memberi ujian kepada murid-muridnya. Pada pendapat anda,
adakah kaedah ujian yang dijalankan seperti dalam rajah di atas boleh dilaksanakan?
dakah anda sedar bahawa biasanya, murid ingin mengetahui prestasinya sendiri melalui
ujian dan guru pula boleh mengenal pasti kelemahan murid, dan menilai keberkesanan
pengajarannya. Di pihak ibu bapa pula, mereka boleh menilai prestasi anaknya melalui
laporan kemajuan murid. Bagi pentadbir pula, berbagai-bagai keputusan boleh dibuat berdasarkan
maklumat ujian tersebut.
ISI KANDUNGAN Apa maksud pengujian?
aiklah. Selepas menyedari kepentingan penilaian kepada murid serta pihak-pihak yang
berkepentingan, kita akan mempelajari apakah maksud ujian atau pengujian itu. Ujian
merupakan satu kaedah, tugas atau prosedur untuk memperoleh pemerhatian yang
sistematik tentang sifat seseorang berhubung dengan aspek pendidikan atau psikologi.
Tujuan ujian pencapaian adalah untuk mengukur prestasi murid dalam berbagai-bagai mata
pelajaran di sekolah. Manakala ujian psikologi adalah untuk mengukur sikap, minat, personaliti
dan ciri-ciri psikologi yang lain. Kebiasaannya ujian memerlukan murid bertindak balas terhadap
soalan atau butiran. Ujian boleh dibuat secara bertulis dalam bentuk soalan pelbagai pilihan atau
esei dan juga dalam bentuk pemerhatian yang memerlukan pemerhati membuat pemeringkatan
atau catatan rekod. Oleh itu, murid tidak semestinya sedar bahawa ia sedang diuji.
Cronbach (1970) telah mendefinisikan ujian sebagai satu prosedur sistematik untuk memerhati
tingkah laku seseorang dan memperihalkannya dengan bantuan skala bernombor atau satu sistem
berkategori. Contoh skala bernombor adalah seperti angka 20/100 untuk ujian penglihatan, 120
untuk ujian kecerdasan (IQ Test) dan 75/100 untuk ujian pencapaian bagi mata pelajaran Geografi.
A
B
3
Bagi sistem berkategori ialah ’ekstrovert’ atau ’introvert’ bagi ujian personaliti dan buta warna hijau
–merah bagi ujian penglihatan.
Dari segi perlaksanaannya, ujian terbahagi kepada dua kumpulan:
1. ujian berbahasa
2. ujian bukan berbahasa
Ujian berbahasa adalah seperti ujian pensel dan kertas (ujian bertulis) dan ujian lisan. Ujian bukan
berbahasa adalah ujian prestasi yang lebih menumpukan kepada kemahiran psikomotor daripada
kemahiran kognitif. Contohnya ujian membaiki radas elektronik.
Bilangan calon yang mengambil ujian terbahagi kepada ujian perseorangan dan ujian
berkumpulan. Ujian berkumpulan seperti ujian pencapaian di sekolah, manakala ujian
perseorangan seperti ujian kecerdasan The Stanford Biner Intelligence Scale dan The Weschsler
Intelligence Scale. Kedua-dua ujian kecerdasan itu ditadbir kepada seorang murid
pada satu-satu masa.
Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengujian?. ____________________________________________________________
______________________________________________________________________
Apa maksud pengukuran?
Sax (1997), mendefinisikan pengukuran sebagai umpukan atau pemberian angka-angka atau
nombor kepada sesuatu objek atau perkara mengikut satu set peraturan yang telah ditetapkan.
Dalam erti kata lain, ujian berupaya mengukur pencapaian murid. Bagi seseorang guru di bilik
darjah, aspek pengukuran pendidikan itu selalu dikaitkan dengan ujian di bilik darjah. Bagi ahli
psikologi klinikal, pengukuran pendidikan melibatkan ujian-ujian psikologi yang lebih bertumpu
kepada pengukuran nilai-nilai afektif individu.
4
Pengukuran dalam pendidikan sebenarnya adalah langkah untuk menentukan tahap sejauh mana
seseorang memiliki sifat tertentu. Biasanya suatu indeks berangka kepada prestasi seseorang
diberikan supaya status individu tersebut secara lebih tepat dapat mewakili sifat tertentu.
Misalnya, Azman dapat markah 75 peratus dalam ujian Bahasa Melayu, atau prestasi purata
sekumpulan murid dalam mata pelajaran Matematik ialah 60 peratus. Kita hanya mengukur dan
tidak menentukan nilai. Sebab itu, contoh tersebut tidak dinyatakan sama ada prestasi tersebut
baik atau sebaliknya. Pengukuran ialah penentuan status dan penilaian ialah penentuan nilai.
Seseorang murid mungkin mengukur panjang sebuah meja, jarak masa larian satu kilometer,
rintangan satu litar arus elektrik atau pencapaian seseorang murid. Setiap pengukuran ini
melibatkan sifat atau pemboleh ubah yang berbeza-beza bagi satu objek atau perlakuan tertentu.
Pengukuran memberi maklumat tentang sifat atau aktiviti yang diukur. Biasanya maklumat yang
diperoleh ada kaitan dengan telahan ke atas fenomena tertentu. Contohnya panjang meja
diperlukan untuk mengetahui sama ada meja itu boleh ataupun tidak untuk diletakkan di ruang
tamu. Sebenarnya, apa yang diukur bukanlah objek tetapi sifat objek. Begitu juga kita tidak
mengukur pelajar tetapi mengukur tinggi, berat atau pencapaian pelajar. Atribut-atribut
yang boleh diukur mempunyai sifat-sifat kuantitatif, iaitu nilainya adalah dalam bentuk
nombor.
Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengukuran?. _______________________________________________________________
________________________________________________________________________
Apa maksud penaksiran?
Pada umumnya penaksiran melibatkan membuat keputusan berdasarkan kepada sesuatu peraturan atau piawaian. Penaksiran mempunyai ciri-ciri berikut: a) Merupakan satu proses mengumpul data bertujuan membuat keputusan tentang individu atau kumpulan b) Ujian merupakan sebahagian daripada penaksiran
5
c) Apabila penaksiran dibuat ke atas pelajar, guru sebenarnya mengukur tahap kecekapan untuk menentukan sama ada tahap kecekapan yang perlu dikuasai pada satu-satu peringkat pengajaran dan pembelajaran telah dapat diwujudkan. Penaksiran boleh dibahagikan kepada beberapa jenis mengikut kriteria tertentu, iaitu pembahagian mengikut:
1. tujuan penaksiran,
2. darjah keutamaan antara faktor ekonomi, ketulenan atau realisme (autentik), dengan
kebolehpercayaan,
3. cara bagaimana data yang dikumpul ditafsir dan dinilai.
Pengkelasan penaksiran mengikut tujuan penaksiran.
Tujuan Jenis
Mengenal pasti kelemahan dan kesediaan belajar
Penaksiran diagnostik (diagnostic assessment)
Mempelbagaikan penaksiran secara berkala bagi tujuan memberi gred
Penaksiran formatif (formative assessment)
Membantu pelajar belajar secara berterusan
Penaksiran untuk pembelajaran (assessment for learning dan assessment as learning)
Memberi gred Melapor kepada pihak luar Membuat keputusan tentang sesuatu tindakan
Penaksiran sumatif (summative assessment) atau penaksiran hasil pembelajaran (assessment of learning)
Perbezaan antara ‘assessment for learning’ dengan ‘assessment as learning’
Assessment for learning Assessment as learning
Sejauh mana pembelajaran berlaku dibuat perbandingan dengan kriteria yang merujuk kepada hasil pembelajaran yang diharapkan
Sejauh mana pembelajaran berlaku dibuat perbandingan dengan prestasi kendiri sebelumnya
Pengkelasan penaksiran mengikut darjah keutamaan antara faktor ketulenan (realisme), ekonomi
(praktikal) dan kebolehpercayaan (konsisten)
Faktor yang diutamakan Jenis
6
Ketulenan (authenticity) Penaksiran autentik
Ekonomi dan kebolehpercayaan Penaksiran konvensional/tradisional atau pengujian
Menyeimbangkan faktor ketulenan, ekonomi, dan kebolehpercayaan penaksiran Apabila konteks penaksiran prestasi mempunyai darjah ketulenan yang sangat tinggi,
biasanya ia tidak seragam dan/atau tidak ekonomi untuk dijalankan.
Memaksimumkan salah satu daripada tiga faktor ini (ketulenan, kebolehpercayaan, dan
ekonomi) akan menyebabkan dua faktor lain terjejas dengan teruk.
Oleh sebab ketulenan, ekonomi, dan kebolehpercayaan semuanya penting, guru perlu
mempertimbangkan dengan teliti semua faktor ini dan cuba menonjolkan salah satu hanya
apabila faktor lain itu tidak begitu terjejas.
Strategi terbaik adalah mencari titik keseimbangan di mana tahap setiap faktor itu cukup
tinggi berbanding memaksimumkan hanya satu faktor. Namun pemilihan banyak juga
bergantung kepada tujuan penaksiran itu dijalankan.
Perbezaan antara penaksiran autentik dengan penaksiran konvensional/tradisional atau pengujian
Penaksiran autentik Penaksiran konvensional/ tradisional atau pengujian
Biasanya pelajar perlu melakukan sesuatu tugasan
Biasanya pelajar memilih respon dan/atau menulis ayat pendek
Konteks kehidupan sebenar Konteks terkawal
Membina/mengaplikasi Mengingat kembali/mengenal pasti
Penstrukturan pelajar Penstrukturan guru/pengajar
Bukti secara langsung Bukti secara tidak langsung
Terdapat juga istilah penaksiran alternatif yang agak sinonim dengan penaksiran autentik.
Namun terdapat sedikit perbezaan iaitu penaksiran alternatif merupakan penaksiran selain
daripada penaksiran kertas-dan-pensel. Ada kalanya darjah ketulenannya tidak begitu tinggi,
cuma ia bukan ujian kertas-dan-pensel, maka mungkin tidak boleh dikategorikan sebagai
penaksiran autentik. Penaksiran autentik biasanya mempunyai darjah ketulenan yang tinggi
iaitu penaksiran itu dijalankan dalam konteks kehidupan sebenar. Sebagai contoh, menaksir
kebolehan mengajar semasa pelajar menjalankan latihan mengajar di makmal
mikropengajaran merupakan penaksiran alternatif tetapi darjah ketulenannya tidak begitu
7
tinggi berbanding menjalankan latihan mengajar di sekolah, di mana ia dilakukan dalam
konteks kehidupan sebenar. Namun jika dibandingkan latihan mengajar di makmal dengan
ujian kertas-dan-pensel seperti peperiksaan akhir semester, darjah ketulenan latihan mengajar
di makmal mikropengajaran bagi mengukur kebolehan mengajar itu adalah lebih tinggi, maka
lebih autentik daripada ujian kertas-dan-pensel. Walau bagaimanapun, dalam konteks
kebolehan menghasilkan penulisan kreatif, misalnya, penaksiran kertas-dan-pensel
merupakan penaksiran autentik jika diberi kebebasan dari segi masa kerana bertepatan
dengan situasi penulisan kreatif dalam kehidupan seharian.
Pengkelasan penaksiran mengikut cara bagaimana data yang dikumpul ditafsir dan dinilai
Cara tafsir dan nilai Jenis
Mengikut kriteria tertentu yang telah ditetapkan lebih awal
Penaksiran rujukan kriteria (criterion-referenced assessment)
Membandingkan prestasi seorang pelajar dengan pelajar lain
Penaksiran rujukan norma (norm-referenced assessment)
Bagi penaksiran rujukan kriteria, contoh kriteria yang ditetapkan yang digunakan di UPSI adalah seperti berikut:
Peratus Markah Penilaian
80-100 Cemerlang (A)
75-79 Cemerlang (A-)
70-74 Kepujian (B+)
65-69 Kepujian (B)
60-64 Kepujian (B-)
55-59 Lulus (C+)
50-54 Lulus (C)
45-49 Lulus (C-)
40-44 Lulus (D+)
35-39 Lulus (D)
<35 Gagal
Setiap pelajar yang mencapai peratus markah tertentu akan dinilai sewajarnya mengikut penilaian
yang telah ditetapkan tanpa mengira prestasi pelajar lain. Penaksiran rujukan kriteria bertujuan
8
membezakan antara pelajar berpencapaian tinggi dengan rendah dan menyusun mereka dari segi
pencapaian tersebut.
Bagi penaksiran rujukan norma pula, pencapaian atau prestasi setiap pelajar dibuat
perbandingan dengan pelajar lain dalam satu kumpulan besar bagi menetapkan kedudukannya.
Oleh itu, jika seorang pelajar mendapat markah 75% misalnya, jikalau mengikut rujukan kriteria,
pencapaian pelajar ini akan dinilai sebagai cemerlang (A-), tetapi jikalau dibandingkan dengan
pelajar lain yang dinilai bersama, pelajar ini kemungkinan mendapat prestasi cemerlang (A) jikalau
markah 75% ini merupakan markah yang tertinggi dalam kumpulan pelajar yang ditaksir.
Penaksiran jenis ini meletakkan pelajar mengikut lengkung taburan normal. Pelajar bersaing antara
satu sama lain. Peperiksaan peringkat kebangsaan seperti SPM, PMR, dan UPSR biasanya
merupakan penaksiran rujukan norma
Airasian (1991) mengatakan bahawa ramai orang membuat tanggapan tentang perkataan
penaksiran bilik darjah membawa imej pelajar mengambil uijan kertas dan pensil, guru menskor
jawapan dan memberikan gred sepadan dengan prestasi yang ditunjukkan. Penaksiran dimulakan
dengan yang tak formal di bilik darjah dan diakhiri dengan keputusan tentang penggredan dan
ulangan bagi seseorang murid.
Bagi Principles for Fair Students Assessment Practices Education in Canada (1993), penaksiran
adalah satu proses mengumpul dan menginterpretasi maklumat yang boleh digunakan untuk :
a. memaklumkan pelajar atau ibu bapa mereka tentang kemajuan terhadap penguasaan
pengetahuan, kemahiran, sikap dan perlakuan yang sepatutnya telah dipelajari atau
dikuasai
b. memaklumkan kepada mereka yang terlibat dalam membuat keputusan pendidikan (
pengajaran, perancangan kurikulum, dasar dan pembentangan program) tentang pelajar.
Sekolah-sekolah di Malaysia biasanya menggunakan kertas dan pensil untuk menaksir dan menilai
pelajar mereka. Guru akan mengajar dan membuat ujian terhadap apa yang diajar. Guru
membina satu ujian, mentadbirkan ujian berkenaan, menskor ujian, merekod markah yang didapati
ke dalam buku rekod pelajar, memulangkan kertas ujian kepada pelajar untuk semakan dan guru
9
akan mencampurkan semua skor dari pelbagai mata pelajaran secara keseluruhan. Masalah yang
dihadapi ialah ujian bilik darjah, umumnya, menguji kemahiran aras rendah dalam
domain kognitif. Kebanyakan soalan yang dibina oleh guru kurang menekankan Jadual
Penentuan Ujian (JPU), ini menyebabkan pengujian hanya dibuat pada aras
pengetahuan dan kefahaman sahaja.
Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penaksiran? _______________________________________________________________
________________________________________________________________________
Apa maksud penilaian?
Penilaian adalah satu pertimbangan atau pembuatan keputusan tentang nilai sesuatu perkara atau
benda. Gay (1985), mengatakan bahawa penilaian merupakan satu proses yang sistematik dalam
pengumpulan dan analisis data untuk menentukan sama ada sesuatu objektif itu telah tercapai
yang membolehkan sesuatu pertimbangan atau keputusan dibuat. Pengukuran melibatkan
pemberian nombor atau peringkat maklumat yang diperlukan dan lebih kepada kuantitatif.
Penilaian boleh menggunakan maklumat kualitatif yang mengandungi pernyataan deskriptif
bertujuan untuk menghuraikan dengan lebih lanjut, jelas atau membuat analisis terhadap sesuatu
isu. Jika sesuatu objektif itu telah tercapai, maka perlu juga diketahui tahap pencapaian objektif
berkenaan. Ini bermakna setakat mana pencapaian objektif itu boleh diterima. Keadaan ini boelh
memudahkan guru untuk membuat keputusan. Dalam proses penilaian komponen pentingnya
ialah untuk membuat keputusan.
Penilaian bertujuan menentukan status sesuatu objek yang dinilai dengan membanding status
berkenaan dengan satu set standard atau kriteria uantuk dibuat keputusan.
Proses yang terlibat dalam membuat penilaian ialah:
a) menentukan jenis data yang harus dikumpulkan b) menentukan jenis responden
10
c) pengumpulan data
d) analisis data
e) interpretasi data
f) membuat keputusan
Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penilaian?. _______________________________________________________________
_______________________________________________________________________
Apa perkaitan antara penaksiran, pengujian, pengukuran, penaksiran dan penilaian? Penaksiran merupakan keseluruhan proses mengumpul data sehinggalah kepada membuat
keputusan berdasarkan data tersebut (contohnya membuat keputusan sama ada pelajar tertentu
layak bergraduat atau tidak). Jika data dikumpul dalam keadaan terkawal, maka proses itu
dipanggil pengujian; jika sebaliknya, dipanggil penaksiran autentik atau alternatif. Selepas data
dikumpul ia perlu dinyatakan dalam bentuk kuantiti, sebaiknya dalam bentuk yang membenarkan
perbandingan antara individu atau kumpulan dilakukan. Maka proses ini dipanggil pengukuran.
Proses seterusnya ialah penilaian di mana perbandingan dengan satu set kriteria atau kumpulan
dilakukan bagi menentukan nilai atau kualiti data tersebut (contohnya menetapkan pencapaian
sebagai cemerlang, sederhana atau gagal). Namun ada pihak yang mengkonsepsi proses
penilaian sebagai sinonim dengan penaksiran iaitu sebagai keseluruhan proses mengumpul data
dan akhirnya menilai dan membuat keputusan.
RUMUSAN Peranan penaksiran dan penilaian menentukan sama ada keperluan kanak-kanak boleh dipenuhi,
dapat diperbaiki kandungan kurikulum serta amalan pengajaran atau menentukan kualiti tadika.
Oleh kerana terdapat tadika yang menjalankan penaksiran dan penilaian secara formal, iaitu
kanak-kanak prasekolah perlu menduduki ujian dan diberi gred markah dan kedudukan selepas
11
dinilai. Kesan dari kemasukan gred dan markah adalah penglabelan ke atas kanak-kanak secara
langsung. Melabelkan kanak-kanak hasil satu atau dua ujian adalah tidak sesuai. Sewajarnya,
guru harus memahami bagaimana untuk membuat pengujian, pengukuran, penaksiran dan
penilaian ke atas kanak-kanak supaya tidak melakukan kesilapan dalam membuat keputusan
tentang pendidikan.
KATA KUNCI Pengujian Pengukuran Penaksiran Penilaian
PENILAIAN KENDIRI
1. Dengan menggunakan perkataan sendiri, huraikan apa yang dimaksudkan dengan
pengujian psikologi?
2. Senaraikan satu contoh ujian berkumpulan dan satu ujian perseorangan?.
3. Apakah perbezaan utama di antara pengujian dan pengukuran?
4. Apakah perbezaan di antara penaksiran autentik dengan penaksiran konvensional?
5. Huraikan perkaitan di antara pengujian, pengukuran, penaksiran dan penilaian?
RUJUKAN
Linn, R.L & Gronlund, N.E.(2000). Measurement and Assessment in Teaching (8th ed.). New
Jersey: Prentice-Hall Inc.
Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia :
Quantum Books.
Mokhtar Ismail, (1995). Penilaian di Bilik Darjah. Kuala Lumpur: Dewan Bahasa Pustaka
UNIT 2
PENTAKSIRAN KONVENSIONAL DAN PENGUJIAN
HASIL PEMBELAJARAN
Di akhir unit ini anda akan dapat
1. Mengetahui langkah-langkah perancangan dan pembinaan ujian 2. Membina ujian sumatif berdasarkan tajuk-tajuk dalam sukatan pelajaran masing-
masing 3. Memahami pentingnya menganalisis item untuk menilai kualiti ujian 4. Memahami perbezaan di antara konsep „kesukaran item‟ dan „diskriminasi item‟ dalam
analisis item 5. Memahami perkaitan antara kesukaran item dan diskriminasi item
PENGENALAN
Dalam Unit 1, kita telah membincangkan tentang beberapa konsep asas seperti pengujian, pengukuran, pentaksiran dan penilaian. Memahami perkaitan di antara konsep-konsep tersebut adalah amat berguna kepada guru dalam merancang pengajaran dan pembelajaran. Unit ini akan memberikan tumpuan kepada pengujian untuk mendapatkan maklumat yang penting tentang pembelajaran dan pencapaian pelajar. Memandangkan peserta kursus ini terdiri daripada guru-guru yang telah mengajar dan mempunyai pengetahuan dan pengalaman dalam merancang dan membina ujian, maka Unit ini akan juga menumpukan kepada perbincangan tentang isu-isu yang berkaitan dengan pengujian dan penilaian.
ISI KANDUNGAN
Perancangan dan pembinaan ujian
Sebagai guru kita perlu merancang pengujian yang sesuai dengan topik yang diajar dan kebolehan pelajar-pelajar. Perancangan yang teliti adalah penting bagi mempastikan ujian yang ditadbirkan dapat menghasilkan maklumat yang sah dan boleh dipercayai. Dalam merancang dan membina ujian, beberapa pertimbangan umum berikut boleh dijadikan panduan:
i. Mengetahui kandungan pelajaran dengan baik – guru perlulah menguasai dengan baik kandungan pelajaran yang diajar. Ini penting bagi mempastikan yang guru dapat menentukan apakah skop kandungan pelajaran yang hendak diuji serta tahap kebolehan pelajar dalam memahami topik-topik yang diajar.
ii. Mengetahui dan memahami pelajar yang akan diuji – ujian yang dirancang perlulah mengambil kira latar belakang serta kebolehan pelajar. Ini perlu supaya guru dapat menyesuaikan kandungan ujian, format ujian, item ujian dengan tahap pelajar.
iii. Berkemahiran – menulis item ujian memerlukan kemahiran serta penguasaan bahasa yang baik supaya dapat menghasilkan ujian yang berkualiti.
iv. Kreatif – menulis item ujian juga memerlukan kreativiti bagi menghasilkan item-item yang sesuai dan menarik. Penggunaan pelbagai media, rajah, simbol, gambar serta lain-lain bentuk rangsangan atau stimulus akan menjadikan item-item lebih pelbagai bentuk serta dapat mengukur pelbagai aras kemahiran.
v. Kesahan dan Kebolehpercayaan Ujian – Sejauhmanakah ujian mengukur apa yang sepatutnya diukur adalah merupakan soalan berkait dengan kesahan ujian. Guru perlu mempastikan skop kandungan yang diuji merupakan pengetahuan dan kemahiran yang telah diajar dan penting untuk diketahui oleh pelajar. Ini melibatkan kesahan kandungan yang merupakan aspek penting dalam penyediaan ujian. Di samping itu, ketekalan skor yang dihasilkan oleh ujian juga perlu diperhatikan bagi mempastikan keboleh percayaan ujian. Konsep kesahan dan kebolehpercayaan akan dibincangkan dengan lebih lanjut dalam Unit 4.
Proses Asas Pembinaan Ujian
Sebagai seorang guru sudah tentu anda mempunyai pengalaman dalam menyediakan ujian bagi mengukur pengetahuan dan kemahiran pelajar anda. Dalam menyediakan ujian sudah tentu anda mengikuti proses dan prosedur yang telah ditetapkan oleh pihak sekolah. Berikut dinyatakan proses asas dalam pembinaan ujian yang standard dan mungkin anda boleh bandingkan dengan amalan yang dilakukan selama ini.
i. Penentuan Tujuan Ujian – sebelum sesuatu ujian dibina, guru perlu terlebih dahulu tentukan tujuan ujian diadakan. Adakah untuk tujuan formatif, sumatif, penempatan atau diagnostik.
ii. Menyediakan Jadual Penentuan Ujian - menentukan bidang cakupan ujian - kandungan yang perlu diuji serta menentukan aras kemahiran atau jenis perlakuan yang diharapkan
iii. Penulisan Item- tentukan perlakuan yang akan diukur dengan merujuk kepada objektif pengajaran. Di samping itu tentukan jenis-jenis item yang sesuai
iv. Menilai semula soalan - dikaji semula oleh rakan-rakan lain atau jawatankuasa untuk memperbaiki aspek-aspek seperti idea yang diuji, kemahiran yang diuji, format item, pokok soalan, penyusunan ayat, struktur pilihan jawapan dan kunci soalan.
v. Analisis Item/Soalan - untuk mengetahui peratus pelajar yang dapat menjawab sesuatu item dengan betul, keberkesanan pengganggu, kuasa diskriminasi soalan dan sejauhmana soalan menepati objektif pembelajaran.
vi. Pemilihan Soalan Yang Bermutu - pemilihan soalan-soalan untuk memenuhi JPU yang ditetapkan - berdasarkan analisis item
vii. Susunan Soalan - Soalan yang terpilih disusun mengikut jenis item untuk mengelakkan kekeliruan, memudahkan pelajar mengekalkan „mental set‟, memudahkan guru memeriksa. Soalan juga disusun mengikut aras kesukaran, aktiviti mental berkembang dari mudah ke kompleks, menimbulkan keyakinan dan motivasi dan jawapan betul disusun mengikut „random pattern‟.
vii. Percetakan Soalan - kualiti percetakan adalah penting dan perkara-perkara seperti kualiti kertas, ruang antara soalan, penggunaan gambar rajah serta dakwat perlu diberi perhatian.
Sekarang cuba anda renungkan adalah langkah-langkah tersebut di atas dijalankan dalam merancang dan membina ujian. Sekairanya ada, langkah-langkah yang manakah yang anda
belum lakukan dan kenapa?
Bagaimana membina ujian yang baik?
1. Aspek keseluruhan ujian
Ujian yang dibina dengan baik memastikan inferens atau kesimpulan yang dibuat tentang pengetahuan dan kemahiran pelajar adalah tepat, adil, dan sah. Selain daripada itu, ujian tersebut adalah stabil dari segi mutu, tahap, dan kesukarannya dari setahun ke setahun. Oleh itu adalah penting membina Jadual
Spesifikasi Ujian yang merupakan satu dokumen yang merakamkan buah fikiran dan perancangan keseluruhan ujian. Langkah-langkah umum pembinaan JSU ini adalah seperti berikut:
• Tentukan skop ujian (topik yang akan dimasukkan) • Anggarkan % masa pembelajaran bagi setiap topik • Tentukan hasil pembelajaran yang ingin ditaksir serta arasnya • Tentukan jenis ujian yang sesuai (objektif dan/atau subjektif) • Tentukan bilangan soalan bagi setiap topik (% masa x jumlah markah) • Tentukan masa yang diperuntukkan untuk menjawab (kebiasaannya, 1–3 min/soalan
bagi ujian aneka pilihan dan 15-30 min/soalan bagi ujian berstruktur/esei)
Jana atau pilih soalan yang sesuai daripada bank soalan berdasarkan Jadual Spesifikasi Ujian. Contoh JSU yang biasa dibina adalah seperti berikut:
Contoh JSU bagi peperiksaan akhir semester kursus Kurikulum dan Pengajaran Fizik (5 soalan struktur dan 5 esei)
BIL Topik Pengetahuan Kefahaman Aplikasi Analisis Sintesis Penilaian Peratus wajaran, %
1 Teras pengetahuan guru
1 1 15
2 Pendekatan Inkuri 1 1 15
3 Penaksiran 1 1 20
4 Miskonsepsi Fizik 1 1 30
5 Kemahiran mikropengajaran
1 15
6 Teknologi & Media 1 10
Peratus wajaran (%) 10 30 20 20 20 100
2. Aspek khusus ujian soalan objektif
Ujian objektif adalah merupakan bentuk ujian yang luas digunakan sama ada di peringkat bilik darjah mahu pun di peringkat peperiksaan kebangsaan. Sebagai seorang guru anda juga pernah menggunakan ujian objektif dalam mengukur pengetahuan dan kemahiran pelajar anda. Sebagai refleksi, cuba anda senaraikan format soalan objektif yang biasa anda gunakan:
i. ___________________________________
ii. ___________________________________
iii. ___________________________________
iv. ___________________________________
Soalan objektif terbahagi kepada dua jenis:
i. Jenis membekalkan jawapan - jawapan pendek ii. Jenis memilih jawapan - betul/salah, padanan dan anika pilihan
Secara umumnya, soalan objektif ini merupakan cara mudah mendapatkan maklumat serta memerlukan masa yang kurang dibandingkan dengan ujian esei. Di samping itu lebih banyak isi kandungan boleh diuji, maka sampelan kandungan yang diuji adalah lebih representatif. Ini secara langsung dapat meningkatkan kebolehpercayaan dan kesahan ujian. Ujian objektif juga lebih mudah diperiksa secara tepat dan objektif. Walaubagaimana pun, ujian objektif memerlukan masa serta kemahiran yang baik untuk membinanya. Oleh itu, di bawah disenaraikan panduan umum dalam menulis soalan objektif.
• Jangan ada item yang menjadi jawapan kepada item yang lain • Setiap item menaksir satu konsep sahaja • Setiap item bermula dengan pangkal item dan berakhir dengan sebaik-baiknya 5 pilihan
jawapan. Jika ingin mengelakkan pelajar meneka, pilihan kelima diletakkan sebagai “Saya tidak tahu”. Jangan sekali-kali meletakkan jawapan tepat bagi pilihan kelima.
• Pangkal item perlu jelas menyatakan masalah yang hendak diselesaikan. • Format yang lebih baik bagi pangkal item adalah berbentuk soalan ayat penuh. Jikalau
item dalam bentuk ayat tergantung, pilihan jawapan harus merupakan penyambung sehingga terbentuk ayat penuh.
• Elakkan penggunaan ayat negatif, iaitu yang mengandungi perkataan „bukan‟, „tidak‟, „melainkan‟. Jika perlu digunakan juga, hitamkan, gariskan, atau gunakan huruf besar.
• Pangkal item tidak sepatutnya mengandungi kiu dengan menggunakan perkataan penting yang diulang dalam pilihan jawapan.
• Pilihan jawapan mesti ada hanya satu jawapan tepat mengikut pakar. • Pilihan jawapan haruslah semuanya mempunyai struktur ayat yang serupa, termasuk
istilah dan panjang yang hampir serupa juga. • Susun pilihan jawapan mengikut susunan logik di mana sesuai, misalnya apabila
menyenarai nombor. • Pilihan jawapan harus disusun secara rawak bagi keseluruhan item ujian supaya pelajar
tidak mudah meneka.
Sebagai latihan, cuba anda teliti item-item objektif berikut, dan berikan ulasan anda tentang kelemahan yang terdapat pada item-item tersebut.
i. Yang manakah di antara berikut yang merupakan contoh amalan penyelidikan yang beretika?
A. Sebagai pelajar universiti anda tidak dikehendaki terlibat dalam sebarang penyelidikan B. Sekiranya ada di antara keputusan penyelidikan adalah berbeza daripada yang lain, adalah
dibolehkan membuang mana-mana yang berbeza C. Adalah boleh menjalankan penyelidikan yang melibatkan pelajar di bawah umur 18 tanpa
mendapatkan kebenaran sekiranya penyelidikan itu untuk pendidikan D. Adalah beretika untuk melibatkan kanak-kanak dalam penyelidikan tanpa kebenaran ibubapa
mereka
ii. Pentaksiran tradisonal dikatakan tidak bersesuaian dengan paradigma dan teori pembelajaran konstruktivisme yang sedang berkembang sekarang. Pandangan ini lebih menekankan kepada kelemahan pentaksiran tradisional dalam mengukur kemahiran berfikir tahap tinggi pelajar-pelajar. Kelemahan lain yang pada pandangan anda juga merupakan kelemahan pentaksiran tradisional adalah
I. penggunaan prosedur dan proses yang standard bagi pelajar-pelajar yang berbeza kebolehan
II. tidak dapat mengukur kemampuan sebenar pelajar III. kesahan dan kebolehpercayaan yang rendah terutama ujian tara IV. lebih memihak kepada golongan pelajar yang berkebolehan (elit)
A. I & II sahaja B. III & IV sahaja C. I, II & III sahaja D. I, II & IV sahaja
iii. Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah seperti berikut:
"Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampungan orang asli".
Untuk mengukur kemahiran-kemahiran tersebut, jenis pentaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah
A. Pentaksiran persembahan terbuka B. Pentaksiran persembahan terhad C. Ujian Subjektif D. Ujian Objektif
3. Aspek khusus ujian soalan berstruktur dan esei Soalan berstruktur dan esei juga merupakan bentuk ujian yang biasa dijalankan di sekolah. Berbanding dengan ujian objektif, soalan esei dikatakan lebih baik untuk mengukur aras kemahiran yang kompleks. Ini memandangkan ujian esei memberi peluang kepada pelajar untuk mengoraganisasi, menyepadu dan mensintesis pengetahuan serta menggunakan maklumat yang dipelajari untuk menyelesaikan masalah dalam situasi yang sebenar. Secara umumnya, soalan berstruktur dan esei ini mempunyai dua jenis:
Jenis soalan respon terhad Soalan bentuk ini meletakkan had pada jawapan yang perlu diberikan oleh calon. Sempadan kandungan mata pelajaran yang perlu dipertimbangkan biasanya ditakrifkan secara sempit oleh masalah, dan bentuk jawapan yang khusus juga lazimnya ditunjukkan (oleh kata tugasan seperti; senaraikan, takrifkan, dan beri alasan). Dalam sesetengah kes, respon dihadkan oleh penggunaan arahan khusus atau maklumat pengenalan. Soalan jenis ini adalah paling sesuai pada peringkat aras pengetahuan, pemahaman, aplikasi dan analisis Contoh soalan: Beri sebab-sebab mengapa masalah penyalahgunaan dadah masih lagi merupakan masalah yang utama di kalangan belia-belia di negara ini. Jawapan anda mestilah tidak melebihi 100 patah perkataan
Jenis soalan respon lanjutan Soalan jenis ini memberi kebebasan kepada calon untuk menjawab. Had pada bahan yang boleh dimasukkan dalam jawapan dan pada bentuk respon adalah minimum walaupun dalam sesetengah kes, had yang munasabah boleh dikenakan seperti had masa dan had halaman. Dalam soalan jenis ini, calon hendaklah diberi kebebasan untuk menunjukkan kemahiran kepada aras sintesis dan penilaian. Soalan ini dapat mengukur penyepaduan idea yang kreatif, penilaian bahan secara keseluruhan, dan pendekatan yang luas kepada penyelesaian masalah. Contoh soalan: Kebelakangan ini keamanan dunia sering terancam dengan pelbagai tragedi dan peperangan. Pertubuhan Bangsa-Bangsa Bersatu tidak dapat menjalankan tugas menjaga keamanan dunia dengan berkesan. Huraikan mengapakah badan ini tidak dapat
menjalankan tugas dengan berkesan dan cadangkan langkah-langkah yang boleh diambil oleh badan ini untuk mengekalkan keamanan dunia.
Dalam membina soalan berstruktur dan esei, secara keseluruhannya perkara-perkara berikut boleh dijadikan panduan:
• Pastikan sama ada rangsangan soalan (gambar rajah, gambar, perangkaan dan lain-
lain) perlu bagi soalan yang akan digubal serta relevan kepada soalan. • Gubal soalan dengan menggabungkan tugasan soalan, tajuk dan rangsangan (jika
ada) dengan memberikan pertimbangan kepada perkara berikut:
o Soalan hendaklah seberapa ringkas yang mungkin o Soalan hendaklah tepat dan jelas o Soalan hendaklah berkemampuan membezakan pelajar baik, sederhana
dan lemah (Kebiasaaannya aras kemahiran menentukan kedudukan soalan) o Konsep yang disoalkan hendaklah sesuai dengan peringkat pemelajaran
yang telah diajarkan. o Tidak mengandungi unsur emosi, keperibadian, kepercayaan, kebudayaan,
agama dan lain-lain perkara sensitif. o Sediakan rangka model jawapan kepada soalan supaya mudah untuk
menyemak) o Sediakan skema pemarkahan beserta dengan pecahan dan wajaran
markah. o Tentukan soalan-soalan mengikut standard (dari segi aras kesukaran, masa
untuk menjawab, liputan jawapan dan kepentingan tajuk) o Dapatkan pandangan kedua – semakan
Sebagai kesimpulan, berdasarkan pemahaman dan pengalaman anda, cuba anda senaraikan TIGA kekuatan dan kelemahan kedua-dua bentuk ujian objektif dan ujian esei:
Kekuatan:
I. _____________________________________________________________
II. _____________________________________________________________
III. _____________________________________________________________
Kelemahan:
i. _____________________________________________________________
ii. _____________________________________________________________
iii. _____________________________________________________________
Analisis item
Kualiti sesuatu ujian bergantung kepada kualiti tiap-tiap item dalam ujian tersebut. Kualiti item-item memberi kesan kepada kesahan, kebolehpercayaan dan kegunaan sesuatu ujian. Pada umumnya, analisis item merupakan teknik untuk menilai kekuatan dan kelemahan ujian, memberikan maklumbalas yang berguna kepada guru, membantu guru menulis item ujian yang baik. Mengikut Mehren (1975), analisis item adalah proses meneliti tindakbalas calon terhadap tiap-tiap item untuk membuat
pertimbangan tentang kualiti item-item tersebut. Penilaian ke atas tiap-tiap item dengan mengaitkannya dengan kriteria luaran atau hubungannya dengan lain-lain item dalam ujian. Analisis ini menilai kualiti item dan juga ujian. Analisis juga boleh digunakan untuk meneliti semula setiap item dan meningkatkan keberkesanan setiap item dan juga ujian Tujuan analisis item
Pada umumnya analisis item bertujuan:
untuk mengenalpasti item yang baik dan item yang tidak baik untuk mengenalpasti pengetahuan atau kemahiran yang pelajar telah dan belum menguasai
Kesukaran Item Kesukaran item merupakan peratus pelajar yang mengambil ujian yang menjawab dengan betul. Lebih besar peratus yang mendapat jawapan betul, lebih mudah item tersebut. Untuk mendapatkan kesukaran item, bahagikan bilangan calon yang menjawab betul dengan umlah calon yang menjawab item tersebut. Kesukaran item juga dikenali sebagai nilai p. Oleh itu, sesuatu item yang dijawab dengan betul oleh 85% calon akan mempunyai kesukaran item atau nilai p .85.
Nilai p pada asasnya adalah merupakan ukuran tingkahlaku. Ini kerana kesukaran item lebih didefinisikan dari segi kekerapan relatif dengan calon-calon lain yang memilih jawapan betul daripada didefinisikan dari segi ciri-ciri intrinsik item tersebut. Dengan ertikata lain, kesukaran item atau nilai p memberi kesan ke atas kepelbagaian/sebaran skor serta ketepatan skor ujian membezakan di antara kumpulan yang berbeza. Contohnya, apabila tidak ada calon yang memilih jawapan yang betul, sudah tentu tidak ada perbezaan individu dari skor ke atas item tersebut. Keadaan yang sama juga benar sekiranya semua calon memilih jawapan yang betul bagi item tersebut. Dengan ertikata lain, kesukaran item atau nilai p .0 (tidak seorang yang memilih jawapan betul) atau nilai p 1.0 (semua calon memilih jawapan betul) tidak memberi apa-apa sumbangan dalam mengukur perbezaan individu, oleh itu ianya tidak berguna.
Untuk mendapatkan indeks kesukaran item, cara yang mudah biasanya diperolehi melalui formula berikut:
NT + NR
__________
N
NT = Bilangan calon Kump. Tinggi yang menjawab betul
NR = Bilangan calon Kump. Rendah yang menjawab betul
N = Jumlah semua calon yang menjawab item berkenaan
Garis panduan umum tentang indeks kesukaran item
Nilai p Aras kesukaran
0.7 ke atas mudah
0.3 hingga 0.69 sederhana
0.29 ke bawah sukar
Diskriminasi Item Secara umumnya, sesuatu item yang baik dapat mendiskriminasikan di antara pelajar yang mendapat pencapaian tinggi dalam ujian dengan pelajar berpencapaian rendah dalam ujian tersebut. Dengan ertikata lain, pelajar yang berpencapaian tinggi dalam ujian akan memilih jawapan yang betul dalam sesuatu item dan yang berpencapaian rendah akan memilih pengganggu (jawapan salah).
Indeks diskriminasi item, D
Indeks diskriminasi item diperolehi dengan menolak bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian tinggi dengan bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian rendah, dibahagi dengan bilangan calon bagi kedua-dua kumpulan tersebut. Ini boleh digambarkan dalam formula berikut:
NT - NR
D = ___________
N/2
Di mana,
NT = bilangan calon dari kumpulan tinggi yang memilih jawapan betul
NR = bilangan calon dari kumpulan rendah yang memilih jawapan betul
N = jumlah calon
Contoh:
Kumpulan Rendah (27%) Kumpulan Tinggi (27%)
Omit 0 0
A 2 0
B 10 0
C 2 0
D 11 26
E 11 10
JUMLAH 36 36
*D adalah jawapan betul
Indeks diskriminasi = 26 –11
----------
36
= 0.42
Lebih tinggi indeks diskriminasi lebih baik item tersebut dalam mendiskriminasi di antara pelajar yang baik dan pelajar yang lemah. Di mana pelajar yang baik sepatutnya dapat menjawab jawapan betul lebih daripada pelajar lemah bagi item tersebut. Bagi item yang di mana semua pelajar dapat memilih jawapan betul (nilai D=.0) atau item di mana semua pelajar tidak dapat memilih jawapan yang betul (nilai D=1.0) adalah merupakan item-item yang tidak dapat memberi apa-apa maklumat yang berguna tentang pencapaian pelajar. Bagi item yang nilai D adalah negatif, ini menunjukkan yang item tersebut mempunyai kesilapan-kesilapan tertentu. Indeks diskriminasi negatif mungkin berlaku apabila sesuatu item itu merangkumi bahan-bahan yang kompleks dan ditulis dengan cara dimana memerlukan kefahaman yang tinggi. Pelajar yang lemah mungkin meneka dan mendapat jawapan betul. Pelajar yang baik pula mungkin mempunyai pelbagai interpretasi atau penyelesaian masalah untuk menjawabnya dan akhirnya mungkin memilih jawapan yang salah.
Garispanduan Umum Indeks Diskriminasi
Nilai D Penjelasan Cadangan
0.4 atau lebih Diskriminasi positif yang tinggi Item disimpan dan boleh digunakan
0.2 hingga 0.39 Diskriminasi positif yang
sederhana
Kaji dan baiki
0.10 hingga 0.19 Diskriminasi positif rendah Item ditulis semula
0 atau negatif Tiada kuasa dismriminasi Item dibuang
Sumber: Ebel & Frisbie, 1986
Langkah-langkah Analisis Item Ujian Bilik Darjah
i. Kertas jawapan diperiksa dan skor disusun mengikut skor rendah kepada yang tinggi ii. Asingkan skor kepada dua kumpulan iaitu kumpulan berpencapaian tinggi dalam ujian (T) dan
kumpulan berpencapaian rendah dalam ujian (R). Jumlah kedua-dua kumpulan memadai sebanyak 27% atau 25% sahaja daripada jumlah kesemua calon dalam kumpulan tersebut, sekiranya calon ramai.
iii. Bagi tiap-tiap item, tentukan bilangan yang tidak memilih sebarang jawapan (omit),bilangan calon yang memilih pilihan jawapan A,B,C,D,E. Sediakan jadual yang sesuai seperti berikut:
Kumpulan Rendah (27%) Kumpulan Tinggi (27%)
Omit 0 0
A 2 0
B 10 0
C 2 0
*D 11 26
E 11 10
JUMLAH 36 36
*D adalah jawapan betul
iv. Kira indeks kesukaran item (nilai p) dan indeks diskriminasi item (nilai D) mengikut formula yang diberikan. Kemudian sediakan satu penjelasan analisis bagi setiap item.
Pengganggu (Distractors)
Menganalisis pengganggu (pilihan jawapan salah) adalah berguna dalam menentukan kegunaan relatif pengganggu dalam setiap item. Indeks diskriminasi item perlu diperolehi bagi setiap item untuk menentukan keberkesanan pengganggu. Sepatutnya nilai diskriminasi bagi jawapan betul adalah positif dan nilai diskriminasi bagi pengganggu sepatutnya rendah atau negatif. Pengganggu perlu diteliti dengan betul apabila item menunjukkan nilai diskriminasi positif yang besar.
Di bawah adalah sampel analisis item yang menunjukkan ringkasan jadual untuk semua item dalam satu ujian objektif anika pilihan. Sila teliti kesukaran item (nilai p), indeks diskriminasi (nilai D) dan pengganggu (pilihan B – E). Berdasarkan jadual analisis item di bawah, sila beri
pandangan anda terhadap soalan-soalan berikutnya.
Analisis Item (sampel 10 item) – jawapan betul adalah “A”
N = 932 Min = 69.4 Sisihan Piawai = 10.2 Alfa = .84
ITEM p D OMIT A B C D E
1. 0.72 0.34 1 667 187 37 30 10
2. 0.90 0.21 1 840 1 76 9 5
3. 0.60 0.39 0 561 233 46 88 4
4. 0.99 -0.06 0 923 3 3 3 0
5. 0.94 0.14 0 876 0 12 24 20
6. 0.77 -0.01 0 716 16 25 35 140
7. 0.47 0.31 3 432 107 68 165 157
8. 0.12 0.08 8 114 218 264 153 175
9. 0.08 0.04 0 75 64 120 67 606
10. 0.35 0.42 0 330 98 74 183 247
.
.
40.
Item atau item-item yang manakah yang boleh dibuang? Mengapa?
Pengganggu-pengganggu yang manakah yang perlu disemak semula? Mengapa?
Item-item yang manakah yang berfungsi dengan baik?
RUMUSAN
Membina ujian yang sempurna adalah sesuatu yang mustahil. Walaupun garispanduan membina item yang betul dipatuhi, namun banyak faktor-faktor yang mempengaruhi persepsi pelajar tentang item-item ujian yang mereka cuba jawab. Namun, dengan melakukan item analisis dan melihat kesukaran dan diskriminasi item akan membantu penggubal soalan menentukan apakah kesilapan bagi tiap-tiap item
ujian. Analisis item dan ujian menyediakan data empirikal tentang bagaimana individu item dan seluruh ujian berfungsi dalam situasi ujian sebenar.
KATA KUNCI
Perancangan ujian
Pembinaan ujian
Jadual Spesifikasi Ujian
Item objektif
Item esei
Analisis item
PENILAIAN KENDIRI
1. Apakah pertimbangan yang perlu diberi perhatian dalam merancang dan membina ujian?
2. Mengapakah perlunya disediakan Jadual Spesifikasi Ujian dalam merancang dan membina
ujian?
3. Adakah dengan menambah bilangan item dalam ujian akan meningkatkan kesahan dan
keboleh percayaan ujian? Mengapa?
4. Aras kesukaran dan indeks diskriminasi diperolehi dengan mengambil kira skor semua calon
yang memberi respons kepada setiap item dalam ujian. Adakah kemungkinan bahawa aras
kesukaran dan indeks diskriminasi akan berbeza mengikut kumpulan yang mengambil ujian
yang sama?
RUJUKAN
Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New
York: Mc-Graw Hill.
Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and
Bacon
UNIT 3
PENAKSIRAN PRESTASI DAN AUTENTIK
HASIL PEMBELAJARAN Di akhir unit ini anda akan dapat 1. Menerangkan bagaimana penaksiran prestasi berbeza dengan pentaksiran tradisional 2. Mengenalpasti bentuk-bentuk penaksiran prestasi 3. Mengenalpasti kekuatan dan kekurangan penaksiran prestasi 4. Menerangkan tatacara umum menjalankan penaksiran prestasi 5. Menyediakan perancangan pemerhatian, merekod dan penskoran tugasan penaksiran
prestasi 6. Menggunakan portfolio untuk mengumpul, mempersembahkan/memaparkan dan
menilai kerja-kerja pelajar
PENGENALAN Penaksiran prestasi merupakan satu bentuk penaksiran yang berdasarkan kepada pemerhatian dan penilaian terhadap sesuatu proses atau produk hasil daripada pelaksanaan sesuatu tugasan (Stiggin, 1997, p.175). Oleh itu penaksiran prestasi meliputi kaedah pengujian yang begitu luas yang memerlukan pelajar menunjukkan kecekapannya atau pengetahuannya dengan memberikan jawapan yang tepat atau satu hasil produk yang baik. Menurut Linn dan Gronlund (1995, p.238), penaksiran prestasi kadang-kadang disebut juga sebagai penaksiran authentik. Penaksiran authentik lebih kepada penggunaan/amali terhadap sesuatu tugasan seperti yang dilakukan di dalam keadaan sebenarnya. Pada umumnya, ujian yang authentik harus mempunyai empat ciri:
a. Soalan yang dibina mestilah benar-benar mewakili prestasi yang berlaku dalam keadaan sebenar
b. Penekanan yang khusus hendaklah diberikan kepada pengajaran dan pembelajaran tentang kriteria yang harus digunakan
c. Penaksiran kendiri memainkan lebih peranan berbanding dengan ujian konvensional
d. Pelajar dikehendaki membentangkan dan mempertahankan kerja-kerja secara umum dan secara lisan untuk menentukan bahawa penguasaannya adalah benar.
Penaksiran prestasi adalah satu bentuk penaksiran yang memerlukan guru membuat penilaian terhadap pengetahuan, kemahiran dan ciri-ciri afektif pelajar. Di sini pelajar dikehendaki melakukan satu tugasan dan prestasi mereka melakukan tugasan itu akan ditaksir. Ia melibatkan
penaksiran pelajar dalam konteks tugasan di bilik darjah di mana pelajar dikehendaki melakukan sesuatu tugasan yang kompleks tetapi bererti, berdasarkan pengetahuan awal, pembelajaran semasa dan kemahiran yang relevan untuk menyelesaikan masalah yang sebenar atau authentik. Guru akan menentukan prestasi pelajar berdasarkan kepada kriteria yang telah ditetapkan dan dipersetujui bersama.
Dalam pengajaran anda, sila senaraikan 3 contoh pentaksiran prestasi yang telah anda jalankan.
1. _____________________________________________________ 2.______________________________________________________ 3.______________________________________________________
ISI KANDUNGAN
Mengapa Penaksiran Prestasi? Terdapat dua trend pendidikan yang menjadikan penaksiran prestasi diberi penekanan semula dalam aspek penilaian pelajar. Pertama, berkaitan dengan perubahan penekanan daripada ujian rujukan norma kepada ujian rujukan kriteria dalam penilaian pelajar dan penilaian bilik darjah yang memerlukan pengukuran yang lebih langsung tentang prestasi pelajar-pelajar. Jadi, sekiranya kita hendak menjelaskan kecekapan pelajar dalam melakukan sesuatu aktiviti atau kemahiran, maka penaksiran prestasi biasanya digunakan. Kedua, teori pembelajaran moden menekankan kepada perlunya memberi tumpuan kepada hasil pembelajaran yang lebih kompleks (misalnya, kemahiran menaakul dan berfikir), menggalakkan pelajar membuat projek yang komprehensif berasaskan kepada masalah sebenar, dan menggalakan pelajar melakukan aktiviti-aktiviti yang membolehkan mereka membina makna sendiri. Dengan ertikata lain, teori pembelajaran moden menyarankan penggunaan penaksiran prestasi terbuka sebagai asas kepada peningkatan pembelajaran. Penaksiran prestasi menyediakan cara yang sistematik untuk menilai kemahiran berfikir dan menaakul serta hasilnya yang tidak dapat diukur oleh ujian objektif dan esei yang biasa. Walaupun ujian dapat menyediakan data yang menunjukkan pelajar tahu melakukan sesuatu dalam keadaan-keadaan tertentu, penaksiran prestasi adalah perlu untuk menilai kemahiran-kemahiran sebenar yang sedang dilakukan. Kemahiran-kemahiran ini adalah penting dalam banyak mata pelajaran yang diajar di sekolah. Contohnya, dalam mata pelajaran Sains, mementingkan kemahiran menyelesaikan masalah dan kemahiran-kemahiran makmal; matapelajaran Matematik menumpukan kepada pelbagai jenis kemahiran penyelesaian masalah praktikal; mata pelajaran Bahasa pula menekankan kepada kemahiran berkomunikasi; matapelajaran kajian sosial mementingkan kemahiran melukis dan membina graf, peta dan sebagainya.
Apakah Ciri-ciri Penaksiran Prestasi? Penaksiran prestasi ini mempunyai beberapa ciri seperti berikut:
tugasan-tugasan yang berkait rapat dengan dunia sebenar
tugasan-tugasan yang lebih kompleks dan kurang berstruktur yang menggalakkan keaslian dan kemahiran berfikir serta mempunyai pelbagai cara penyelesaiannya
masa yang lebih diperlukan untuk menilai – ini berkaitan dengan kesukaran mereka bentuk tugasan, bentuk tugasan yang komprehensif dan masa yang lebih diperlukan untuk menilai hasil-hasil tugasan
lebih banyak menggunakan judgment dalam memeriksa tugasan pelajar – ini disebabkan tugasan yang kompleks, keaslian tugasan yang dihasilkan, dan dalam kes-kes tertentu terdapat pelbagai kemungkinan cara penyelesaian yang dikemukakan
Dan, apakah pula bentuk-bentuk tugasan yang sering digunakan dalam penaksiran prestasi? Biasanya bentuk-bentuk tugasan melibatkan: i. Menyelesaikan masalah yang realistik (contoh: bagaimana mencegah penyalahgunaan
dadah di Malaysia) ii. Kemahiran-kemahiran lisan dan psikomotor tanpa produk (contoh: memberi ucapan,
bertutur bahasa asing, menggunakan mikroskop, dan membaiki enjin) iii. Kemahiran penulisan dan psikomotor dengan produk yang dihasilkan (contoh: menulis
laporan kajian, menulis cerita pendek, membina tempat letak buku)
Bagaimana pemahaman anda setakat ini tentang penaksiran prestasi? Sila tuliskan satu ayat yang dapat menggambarkan pentaksiran prestasi sebagaimana yang anda faham.
____________________________________________________________________________________________________________________________
Kategori Penaksiran Prestasi Jenis tugasan penaksiran prestasi boleh dibahagikan kepada dua kategori berdasarkan kepada objektif pengajaran yang dicakupinya. Bagi tugasan yang terhad dan mencakupi objektif pengajaran yang spesifik, penilaian ini dipanggil sebagai penaksiran prestasi terhad. Namun begitu terdapat juga tugasan yang komprehensif yang mencakupi beberapa objektif pengajaran, penilaian ini dipanggil penaksiran prestasi terbuka (extended).
Penaksiran Prestasi Terhad Penaksiran prestasi terhad adalah lebih berstruktur dan terhad skopnya. Dengan menghadkan skop tugasan, memudahkan untuk dikaitkan dengan objektif-objektif tertentu, mentadbirkannya dan menilainya. Contohnya:
Tulis satu muka surat laporan tentang lawatan ke muzium
Bina graf daripada data-data yang diberi
Tunjukkan bagaimana menyediakan alat makmal Penaksiran Prestasi Terbuka Penaksiran prestasi terbuka pula mempunyai skop tugasan yang lebih komprehensif dan tidak begitu berstruktur. Ini bagi membolehkan pelajar mempersembahkan kebolehannya dalam membuat tugasan atau menyelesaikan masalah yang berkait rapat dengan dunia sebenar. Dengan kata lain, kita boleh mendapatkan maklumat tentang kebolehan pelajar dalam mengenalpasti punca sebenar sesuatu masalah, mengumpul dan mengatur maklumat untuk menyelesaikan masalah dan menyediakan kesimpulan yang asli dan mantap. Dalam aspek kemahiran pula, penaksiran prestasi terbuka ini membolehkan kita menentukan bagaimana pelajar boleh mensepadukan beberapa kemahiran-kemahiran spesifik bagi melakukan pergerakan yang kompleks ataupun menghasilkan produk yang lebih baik dan canggih. Sesetengah projek pentaksiran prestasi terbuka menggabungkan ketiga-tiga jenis kemahiran: menyelesaikan masalah, komunikasi dan psikomotor bagi menghasilkan sesuatu produk. Antara contoh-contoh tugasan adalah seperti berikut:
Reka bentuk dan jalankan eksperimen ke atas topik-topik yang disediakan dan persembahkan serta pertahankan dapatan kajian
Baca sebuah novel dan tulis kritik ke atas novel tersebut
Reka bentuk dan bina tempat letak buku dan tulis satu penilaian sama ada ia menepati kriteria-kriteria yang diberi
Projek penaksiran prestasi terbuka akan memberikan pelajar lebih kebebasan dalam memilih projek, bagaimana menjalankannya, membuat penilaian kendiri dan mempertahankan kualitinya. Perbincangan hasil kajian pelajar dengan guru biasanya menumpukan kepada kualiti projek serta penilaian kendiri yang dibuat oleh pelajar.
Langkah-langkah Melaksanakan Penaksiran Prestasi Sekarang kita akan cuba melihat secara lebih terperinci bagaimana melaksanakan penaksiran prestasi. Secara umumnya terdapat lima langkah untuk melaksanakan penaksiran prestasi. Langkah-langkah tersebut adalah: Langkah I: Menetapkan hasil prestasi Langkah II: Memilih fokus penilaian (prosedur, produk atau kedua-duanya) Langkah III: Memilih darjah realisme yang sesuai Langkah IV: Memilih situasi tugasan Langkah V: Memilih metod pemerhatian, merekod dan memeriksa Langkah I: Menetapkan hasil prestasi atau hasil pembelajaran Hasil prestasi yang hendak diukur perlu dikenal pasti dan didefinisikan. Hasil penaksiran prestasi terhad biasanya menggunakan perkataan-perkataan seperti kenalpasti, membina, menunjukkan dan lain-lain. Spesifikasi hasil prestasi termasuklah analisis tugasan bagi mengenalpasti faktor-faktor spesifik yang kritikal bagi prestasi yang hendak diukur. Pensampelan tugasan-tugasan yang sesuai adalah penting bagi menentukan pemerhatian dan
penilaian yang lebih tepat. Berikut adalah contoh-contoh bagi satu set tugasan-tugasan untuk penaksiran prestasi terhad:
i. Kemahiran Dalam Membuat Laporan Secara Lisan: 1. Berdiri dengan cara yang natural 2. Mengekalkan eye contact dengan baik 3. Menggunakan ekspresi muka yang sesuai 4. Menggunakan gerakbadan secara berkesan 5. Bercakap dengan jelas dan nada yang terang 6. Bercakap pada kadar kelajuan yang sesuai 7. Mempersembahkan idea-idea dengan teratur 8. Menggunakan bahasa yang sesuai 9. Mengekalkan minat kumpulan
ii. Membaiki Injin Rosak
1. Kenalpasti tahap kerosakan 2. Kenalpasti sistem yang menyebabkan kerosakan 3. Pilih ujian-ujian yang akan dilakukan 4. Menjalankan ujian-ujian mengikut sekuen yang betul 5. Mengenalpasti komponen-komponen yang tidak berfungsi 6. Ganti atau baiki komponen 7. Ubah dan ganti alatganti dengan sekuen yang sesuai 8. Menggunakan alat-alat yang sesuai dengan cara yang betul 9. Mematuhi peraturan-peraturan keselamatan sepanjang kerja-kerja
membaiki Dalam keadaan-keadaan tertentu, senarai tugasan-tugasan tidak perlu mengikut aturan-aturan tertentu (seperti dalam contoh pertama) dalam keadaan yang lain pula, terdapat langkah-langkah yang disusun mengikut sekuen supaya memudahkan dibuat pemerhatian dan penilaian (seperti dalam contoh kedua)
Projek berbentuk penaksiran prestasi terbuka biasanya melibatkan pelbagai objektif pengajaran dan hasil pembelajaran. Bagi satu projek penyelidikan, hasil pembelajaran antaranya adalah seperti berikut:
Memilih tugasan-tugasan kajian yang sesuai
Menggunakan perpustakaan dengan berkesan
Mengesan, menganalisis dan mensepadukan maklumat-maklumat yang relevan
Mereka bentuk dan menjalankan eksperimen
Menulis laporan kajian dengan tepat
Menyatakan kesimpulan yang sah
Menulis kritik tentang tatacara kajian dan dapatan kajian
Mempersembahkan dan mempertahankan dapatan kajian dalam kelas
Hasil-hasil pembelajaran di atas perlu didefinisikan lagi dengan lebih spesifik. Menyatakan objektif umum dahulu dan kemudian menyatakannya dengan lebih spesifik adalah merupakan
tatacara yang berkesan. Dalam mendefinisikan setiap hasil pembelajaran utama, mungkin perlu dibahagikan kepada dua hasil pembelajaran (Misalnya: merekabentuk eksperimen, menjalankan eksperimen). Dalam kes-kes yang lain, mungkin digabungkan, seperti „nyatakan kesimpulan yang sah‟ boleh digabungkan sebagai sebahagian daripada „Menulis laporan kajian dengan tepat‟. Yang pentingnya, senarai hasil pembelajaran utama perlu menyatakan deskripsi tentang apa yang pelajar boleh buat untuk menunjukkan pencapaian hasil pembelajaran. Langkah II: Memilih Fokus Penaksiran Penaksiran prestasi boleh menumpukan kepada prosedur, produk atau gabungan kedua-duanya. Menilai Prosedur Bagi jenis-jenis tugasan yang tidak menghasilkan produk, memerlukan tugasan tersebut dinilai semasa ianya dilakukan. Dalam banyak keadaan, kedua-dua prosedur dan produk merupakan aspek penting dalam sesuatu tugasan. Selalunya prosedur ditekankan pada tahap awal pembelajaran, dan kemudiannya produk, iaitu selepas prosedur telah dikuasai. Misalnya, dalam membaiki set television, memerlukan prosedur yang sistematik diikuti, sebelum dapat menghasilkan set television yang telah dibaiki. Perkara yang sama juga dijalankan dalam tugasan memasak, kerja pertukangan, melukis dan lain-lain lagi. Penilaian prosedur ini juga boleh digunakan di peringkat akhir pengajaran, dengan tujuan untuk mengesan kesilapan-kesilapan yang berlaku dalam prosedur yang boleh memberi kesan kepada kualiti produk. Secara amnya, fokus penaksiran prestasi ke atas prosedur bila: i. Tiada produk atau penilaian produk tidak dapat dijalankan – sukar didapati atau pun
terlalu mahal ii. Prosedur yang digunakan adalah teratur dan boleh dilihat dengan jelas iii. Prosedur yang betul adalah penting untuk menentukan kejayaan dalam melakukan
sesuatu iv. Analisis ke atas langkah-langkah dalam prosedur boleh memberi panduan dalam
meningkatkan produk Menilai Produk
Penaksiran prestasi perlu memberi fokus kepada produk apabila:
i. Prosedur-prosedur yang berbeza boleh menghasilkan produk yang sama mutunya ii. Prosedur tidak dapat dilihat dengan jelas (misalnya: kerja rumah, penaakulan dalam
menyelesaikan masalah matematik) iii. Langkah-langkah dalam prosedur telah dikuasai iv. Produk mempunyai kualiti yang boleh di kenal dan dinilai dengan jelas Langkah III: Memilih Darjah Realisme Yang Sesuai Autentik adalah merupakan satu darjah. Dalam konteks penaksiran prestasi, darjah kehampiran kepada realiti dunia (apa yang sebenarnya berlaku) adalah merupakan tumpuan
utama perkara-perkara yang hendak diukur. Soalnya, setakat manakah realisme yang perlu atau mampu diukur dalam penaksiran prestasi? Lebih hampir kepada realiti adalah lebih baik.
Dalam konteks pengajaran dan pembelajaran, penggunaan kaedah simulasi boleh menunjukkan masalah yang dikemukakan itu mempunyai darjah realisme yang rendah atau tinggi. Misalnya dalam Matematik, penggunaan kemahiran matematik dalam memahami jumlah wang, boleh dilakukan dalam bentuk cerita (rendah darjah realisme) atau membeli barang-barang dalam situasi gerai (tinggi darjah realisme).
Darjah realisme yang akan dipilih bagi satu-satu situasi bergantung kepada beberapa faktor. Pertamanya, perlu dipertimbangkan objektif pengajaran. Sama ada objektif pengajaran yang hendak dicapai itu merupakan objektif yang berbentuk memahami sesuatu fakta baru atau pun untuk menguasai sesuatu kemahiran. Keduanya, sekuen pengajaran mungkin mengikuti aturan yang memerlukan pengukuran dalam bentuk pensil dan kertas dahulu sebelum pengukuran berbentuk amali (hands-on). Ketiganya, beberapa kekangan seperti masa, kos, kemudahan peralatan, kesukaran untuk mentadbir dan memberi markah, mungkin akan mengurangkan darjah realisme yang akan diperolehi. Keempat, tugasan yang hendak dilakukan mungkin boleh mengurangkan darjah realisme dalam situasi ujian. Misalnya, dalam menilai kemahiran-kemahiran pertolongan cemas, adalah sukar untuk menggunakan pesakit sebenar yang mengalami kemalangan untuk menjadikan situasi penilaian itu lebih realistik.
Langkah IV: Memilih Situasi Tugasan Penaksiran prestasi boleh diklasifikasikan mengikut jenis situasi atau latar (setting) yang digunakan. Sistem klasifikasi berikut berdasarkan darjah realisme yang terdapat dalam satu-satu situasi:
i. Tugasan Kertas dan Pensil
Tugasan kertas dan pensil berbeza daripada ujian kertas dan pensil tradisional yang menekankan kepada aplikasi pengetahuan atau kemahiran dalam situasi yang telah ditetapkan (simulated setting). Aplikasi kertas dan pensil ini mungkin menghasilkan hasil pembelajaran yang diharapkan atau ia mungkin boleh dijadikan sebagai langkah ke arah tugasan yang melibatkan darjah realism yang lebih tinggi (misalnya, penggunaan alat yang sebenar). Dalam beberapa keadaan, tugasan kertas dan pensil boleh menyediakan produk yang mempunyai signifikan dari segi pendidikan. Kursus dalam pembinaan ujian, misalnya memerlukan pelajar melaksanakan aktiviti-aktiviti seperti berikut:
Bina satu set Jadual Penentuan Ujian bagi satu ujian pengajaran Bina item-item ujian yang sesuai dengan Jadual Penentuan Ujian Bina satu senarai semak untuk menilai ujian pencapaian
Perkataan „bina‟ selalu digunakan dalam ujian prestasi kertas dan pensil. Misalnya, pelajar mungkin disuruh membina peta cuaca, graf, pelan lantai, mereka bentuk pakaian, puisi, cerita pendek atau rancang satu percubaan. Dalam kes ini, produk kertas dan pensil adalah hasil daripada kedua-dua pengetahuan dan kemahiran.
Dalam lain-lain kes, tugasan kertas dan pensil mungkin merupakan langkah pertama kearah tugasan hands-on. Misalnya, sebelum menggunakan alat ukuran tertentu,
seperti mikrometer, mungkin sesuai sekiranya pelajar mempelajari pelbagai ukuran daripada gambar-gambar. Walaupun kebolehan membaca skala tidak mencukupi untuk pengukuran yang tepat, tetapi ia adalah sesuatu yang perlu. Dalam keadaan yang lain pula, sekiranya prestasi tersebut agak kompleks dan peralatannya mahal, menjalankan tugasan dalam situasi kertas dan pensil mungkin boleh mengelakkan kemalangan ataupun kerosakan kepada peralatan tersebut.
ii Ujian Identifikasi
Ujian identifikasi terdapat dalam pelbagai situasi dan pelbagai darjah realisme. Dalam setengah keadaan, pelajar mungkin diminta untuk mengenalpasti sejenis alat dan jelaskan fungsinya. Dalam keadaan yang lebih kompleks, pelajar akan diberi tugasan seperti mengenalpasti litar pintas dan meminta pelajar mengenal pasti alat dan tatacara yang sesuai untuk membaikinya. Jenis ujian identifikasi yang lebih kompleks lagi mungkin melibatkan mendengar kepada mesin yang tidak berfungsi dengan baik, dan dari bunyinya, pelajar diminta mengenalpasti punca-punca yang menyebabkan mesin tersebut tidak berfungsi dengan baik.
Walaupun ujian identifikasi luas digunakan dalam pendidikan industri, ia juga digunakan dalam mata pelajaran-mata pelajaran lain. Guru biologi misalnya boleh meminta pelajar mengenalpasti spesimen-spesimen yang diletakkan di beberapa stesen di dalam bilik atau mengenalpasti peralatan dan prosedur yang diperlukan untuk menjalankan percubaan. Guru bahasa juga misalnya boleh meminta pelajar mengenal pasti sebutan yang betul, guru matematik pula boleh meminta pelajar mengenal pasti prosedur menyelesai masalah yang betul. Mengenal pasti prosedur yang betul juga penting dalam pendidikan seni, muzik, pendidikan jasmani dan bidang-bidang vokasional seperti pertanian, perdagangan dan ekonomi rumah tangga.
iii. Ujian Prestasi Berstruktur
Ujian prestasi berstruktur ini dijalankan dalam keadaan yang terkawal dan pelajar diminta melaksanakan sesuatu tugasan mengikut prosedur dan nilai tara yang setara. Misalnya, memasang mikroskop, mematuhi prosedur keselamatan dalam menghidupkan enjin, atau mengesan kerosakan pada alat elektronik.
Pembinaan ujian prestasi berstruktur lebih kurang sama seperti membina lain-lain ujian pencapaian. Namun begitu, biasanya jarang sesuatu keadaan itu dapat dikawal dan disetarakan sepenuhnya, di samping mengambil masa lebih untuk menyedia dan mentadbirnya serta selalunya agak sukar untuk diperiksa. Untuk meningkatkan situasi ujian yang terkawal dan setara untuk semua pelajar, arahan-arahan yang jelas perlu diberikan terutama tentang situasi ujian dan tugasan yang akan dijalankan. Arahan-arahan untuk mengesan peralatan elektronik yang rosak, misalnya, termasuk perkara-perkara berikut:
i. Tujuan ujian ii. Peralatan yang disediakan iii. Prosedur ujian
a. Jenis dan keadaan peralatan b. Deskripsi prestasi yang dikehendaki c. Had masa serta lain-lain keadaan
iv. Metod dalam menilai prestasi Bila menggunakan ujian prestasi, adalah perlu ditentukan nilai tara prestasi yang menunjukkan tahap minima prestasi yang boleh diterima. Ini mungkin berkaitan dengan ketepatan (ch: mengukur suhu kepada darjah dua persepuluh yang paling hampir), mengikut urutan langkah-langkah yang betul (ch: ubah mikroskop mengikut urutan langkah-langkah yang betul), mengikut prosedur sepenuhnya (ch: periksa semua safety guard sebelum menghidupkan mesin), atau kelajuan prestasi (ch: kesan kerosakan peralatan elektronik dalam masa tiga minit). Di antara nilai tara yang biasa digunakan untuk menilai prestasi adalah seperti berikut:
Jenis Contoh
Kadar Selesaikan sepuluh masalah campur dalam masa
dua minit Taip 40 perkataan seminit
Kesilapan Tidak lebih daripada dua kesilapan bagi satu muka surat yang ditaip Kira sebanyak 20 dalam Bahasa Arab tanpa kesilapan
Masa Sediakan peralatan makmal dalam masa lima minit
Kesan kerosakan peralatan dalam masa tiga minit
Kepersisan (precision) Baca thermometer sehingga darjah dua persepuluh
Kuantiti Lengkapkan 20 percubaan makmal Kesan 15 rujukan yang relevan
Kualiti Tulis surat perniagaan yang kemas
Persembahkan bentuk yang betul dalam penerjunan
iv. Persembahan berbentuk Simulasi
Bertujuan untuk memadankan persembahan dengan situasi sebenar sama ada secara keseluruhan atau sebahagian
Contoh:
Pendidikan Jasmani: memukul bola, berenang, pukulan tenis
Sains sosial: simulasi perbicaraan, mesyuarat, latihan penerbangan
Kemahiran yang ditunjukkan dalam situasi berbentuk simulasi menandakan kesediaan pelajar untuk melakukan tugasan sebenar
v. Sampelan Kerja/Tugasan
Memerlukan pelajar melakukan tugasan sebenar yang mewakili keseluruhan tugasan yang diukur. Sampelan tugasan biasanya termasuk elemen yang paling penting dalam keseluruahn tugasan dan dilakukan dalam keadaan yang terkawal
Contoh:
Menaip surat Menggunakan komputer dalam menganalisis data Membaiki alat
vi. Projek penyelidikan
Jenis penaksiran yang paling komprehensif. Melibatkan kombinasi beberapa kemahiran dan proses berfikir dalam menyelesaikan masalah, menghasilkan produk atau kedua-duanya sekali
Contoh:
Mengenalpasti masalah Menjalankan kajian Menulis laporan Merekabentuk dan membina produk Mempertahankan hasil kajian
Langkah V: Memilih Metod Pemerhatian, Merekod dan Menskor Terdapat beberapa prosedur digunakan untuk menilai prosedur, produk atau kedua-dua prosedur dan produk. Di antara prosedur yang sering digunakan:
i. Pemerhatian Bersistematik
Bagi tugasan yang kecil/mudah, pemerhatian secara informal mungkin boleh dijalankan. Bagi tugasan yang lebih komprehensif, pemerhatian perlu lebih bersistematik bagi meningkatkan keobjektifan dan kegunaannya kemudian. Pemerhatian biasanya dibantu oleh senarai semak atau skala kadar
ii. Rekod Anekdot
Deskripsi ringkas tentang sesuatu peristiwa yang signifikan. Ia termasuk tingkahlaku yang diperhatikan, latar di mana tingkahlaku berlaku dan interpretasi tentang peristiwa. Rekod akan lebih bermakna apabila:
Ia menumpukan kepada peristiwa/perkara yang bermakna
Ia direkodkan sebaik sahaja insiden selesai
Ia mengandungi maklumat yang mencukupi untuk mudah difahami kemudian
Perlakuan yang diperhatikan dan interpretasinya diasingkan
iii. Senarai Semak
Merupakan senarai dimensi prestasi atau produk yang boleh diukur dan mempunyai ruang untuk merekod penilaian “ya” atau “tidak”. Sekiranya senarai semak digunakan untuk menilai satu set prosedur, misalnya, langkah-langkah yang diikuti mungkin diletakkan dalam urutan pangkatan dalam borang; pemerhati akan menyemak sama ada setiap tindakan telah diambil atau tidak. Senarai semak untuk menilai produk pula biasanya mengandungi senarai ciri-ciri produk yang baik seperti saiz, warna, bentuk dan lain-lain serta terdapat ruang untuk merekod sama ada setiap ciri yang dikehendaki ada atau tidak.
iv. Skala kadar
Skala kadar adalah sama dengan senarai semak dan mempunyai tujuan yang sama iaitu untuk menilai prosedur dan produk. Perbezaan yang utama adalah skala kadar menyediakan peluang untuk menandakan darjah berdasarkan skala tertentu. Skala untuk pengkadaran biasanya berasaskan kepada kekerapan sesuatu tindakan itu dilaksanakan (contoh: selalu, kadang-kadang, tidak pernah), kualiti sesuatu prestasi (contoh: cemerlang, kepujian, sederhana, lemah) atau satu set frasa deskripotif yang menandakan darjah penerimaan prestasi (contoh: menyelesaikan tugasan dengan cepat, lambat dalam menyelesaikan tugasan, tidak dapat menyelesaikan tugasan tanpa bantuan.
Anda mungkin telah pernah menjalankan penaksiran prestasi, cuba anda berikan LIMA faedah yang boleh diperolehi melalui penaksiran prestasi:
i. __________________________________________________________________ ii. __________________________________________________________________ iii. __________________________________________________________________ iv. __________________________________________________________________ v. __________________________________________________________________ Penskoran dan Penggredan Penaksiran Prestasi Pada asasnya terdapat dua pendekatan penskoran yang lazim digunakan dalam penaksiran prestasi penskoran analitik dan penskoran holistik. i. Penskoran Analitik Penilaian ke atas setiap kriteria yang digunakan untuk mentaksir tugasan/produk
Contoh: Skala kadar ii. Penskoran Holistik Berasaskan pandangan keseluruhan sesuatu tugasan/produk daripada elemen-elemen spesifik. Penskoran boleh berpandukan kepada rubrik yang menjelaskan tentang kualiti bagi setiap tahap/kriteria yang digunakan
Untuk tujuan pengajaran, kedua-kedua bentuk penskoran adalah berguna. Sekiranya kedua-duanya digunakan, penskoran secara holistik perlu dibuat dahulu supaya sesuatu elemen yang spesifik tidak menjejaskan pandangan kepada keseluruhan produk. Rubrik Penskoran Rubrik merupakan satu panduan atau format untuk melakukan satu penaksiran bagi sesuatu perkara. Rubrik kerap digunakan di dalam pentaksiran kerja kursus. Dalam sesuatu penggredan yang menggunakan rubrik, ia menjelaskan tentang penskoran bagi sesuatu tahap pencapaian atau jawapan yang pelajar kemukakan. Rubrik digunakan untuk mentaksir secara analitik atau pun secara holistik.
Rubrik analitik: Digunakan apabila penaksiran memerlukan maklumat terperinci yang
boleh menunjukkan kelemahan dan kekuatan pelajar. Ia biasanya digunakan apabila
prestasi yang ditaksir adalah “more than the sum of its parts” (contohnya prestasi
mengajar dan pengucapan awam). Rubrik analitik mempunyai kesahan dan
kebolehpercayaan yang lebih tinggi.
Rubrik holistik: Digunakan apabila penaksiran hanya memerlukan gambaran
keseluruhan prestasi dengan komponen yang secukupnya sahaja bagi membolehkan
pengukuran yang konsisten dijalankan.
Kedua-dua jenis rubrik boleh digunakan bersama-sama di mana rubrik analitik
dijadikan panduan untuk menilai secara holistik.
Contoh penskoran yang menggunakan rubrik adalah seperti berikut:
Gred Poin Maknanya
A 5 Cemerlang – Telah menguasai semua objektif utama dan minor. Dapat memberikan hujah yang baik dan berkesan
B 4 Baik – Telah menguasai semua objektif utama dan kebanyakan objektif minor. Dapat memberikan hujah dengan baik.
C 3 Memuaskan – Hampir menguasai semua objektif utama tetapi masih memerlukan bantuan dalam objektif minor. Dapat memberikan hujah dengan memuaskan.
D 2 Lemah – Memerlukan lebih bimbingan daripada guru. Perlu menguasai separuh daripada objektif utama dan sedikit objektif minor. Hujah yang diberikan masih belum cukup memuaskan.
E 1 Kurang Memuaskan – Belum lagi menguasai ssebarang objektif utama yang telah ditetapkan. Jika terdapat item betul pun adalah disebabkan bernasib baik, pelajar mungkin kurang faham kuliah yang diberikan. Hujah yang diberikan adalah lemah.
Pada umumnya rubrik penskoran boleh dibahagikan kepada tiga jenis. a. Holistik dan analitik
Pemilihan dibuat secara umum tentang sesuatu prestasi. Rubrik yang holistik mempunyai
label-label kecekapan yang berkaitan dengannya seperti: cekap, lemah, cemerlang dan sebagainya. Manakala analitik pula merupakan rubrik yang lebih terperinci daripada holistik. Kriteria yang disediakan adalah lebih kemas.
b. Perkembangan dan kuantitatif
Rubrik ini dibina untuk memanjangkan aras gred atau jarak kecekapan di atas satu kontinuum. Kuantiti merujuk kepada penggunaan skala kadar (rating) yang telah didefinisikan dalam angka dan digunakan secara holistik atau analitik.
c. Umum dan spesifik Satu set kategori kriteria dibentuk untuk semua tugasan – kerap menggunakan rubrik
holistik. Manakala rubrik yang tertentu dibina untuk tugasan yang tertentu sahaja seperti dalam soalan jawapan pendek atau soalan terbuka.
Portfolio Kita akan cuba membincangkan satu contoh penaksiran prestasi yang banyak digunakan dalam mentaksir pembelajaran pelajar iaitu portfolio. Portfolio telah didefinisikan dalam pelbagai bentuk. Secara umumnya, portfolio… “A portfolio is more than just a container full of stuff. It‟s a systematic and organized collection
of evidence used by the teacher and student to monitor growth of the student‟s knowledge,
skills, and attitudes in a specific subject area”
Vavrus, 1990, ms.48
Berdasarkan definisi di atas, bolehlah dikatakan bahawa portfolio merupakan proses mendokumentasi pembelajaran merentas masa bagi menunjukkan progres pelajar dan mengajar mereka melalui pentaksiran kendiri, penyuntingan, dan penambahbaikan tugasan. Bahan-bahan yang biasanya terdapat di dalam sesebuah portfolio termasuklah penulisan jurnal, penulisan reflektif, ulasan rakan sebaya, hasil kerja seni, gambar rajah, nota pelajar, draf dan penulisan yang siap. Bagi portfolio yang mempunyai ciri yang baik mestilah:
Mengandungi bahan terpilih sahaja
Menunjukkan progres pembelajaran
Sistematik dan tersusun
Menunjukkan bukti bimbingan yang diterima daripada ibu bapa, guru, dan rakan
sebaya
Menunjukkan bukti kerja kolaboratif dan interaksi dengan rakan sebaya
Menunjukkan bukti hasil pemikiran kritis dan kreatif
Membina portfolio Secara umumnya, langkah-langkah membina portfolio adalah seperti berikut:
1. Kenalpasti bidang kemahiran dan pengetahuan yang pelajar perlu bina
2. Tentukan hasil pembelajaran yang perlu pelajar capai berdasarkan bidang ini
3. Kenalpasti indikator prestasi yang menunjukkan pelajar telah mencapai hasil
pembelajaran dan nyatakan bukti yang pelajar perlu kumpulkan
4. Kumpulkan bukti yang menunjukkan pelajar telah mencapai indikator prestasi tersebut
5. Susun bukti ini dalam satu portfolio supaya penilai mudah memahami bagaimana bukti
dikaitkan dengan setiap indikator prestasi
Mengurus dan mengguna portfolio Pelajar adalah terlibat secara aktif dalam mengurus dan menjaga portfolio. Oleh kerana portfolio adalah merupakan koleksi kerja pelajar, maka mereka perlu dibimbing tentang apa yang perlu dimasukkan ke dalam portfolio, dalam memilih sampel kerja dan dalam menilai perkembangan pembelajaran sebagaimana yang digambarkan dalam sampelan kerja tersebut. Porfolio akan disemak secara berkala semasa konferen pelajar-guru yang memberi peluang kepada pelajar dan guru membandingkan penilaian mereka serta membincangkan kekuatan dan kelemahan pembelajaran serta aspek-aspek yang memerlukan penambahbaikkan. Portfolio juga digunakan semasa konferen ibubapa-guru untuk mempersembahkan perkembangan pembelajaran pelajar berdasarkan bukti-bukit hasil kerja yang konkrit.
RUMUSAN 1. Penaksiran prestasi mementingkan darjah realisme tugasan serta mengukur tugasan
yang lebih kompleks dibandingkan dengan ujian pensil dan kertas 2. Penaksiran prestasi terhad biasanya adalah lebih berstruktur dan terhad skopnya serta
merangkumi hasil pembelajaran yang spesifik yang hendak diukur. Sedangkan penaksiran prestasi terbuka kurang berstruktur, lebih terbuka dan luas skopnya serta boleh merangkumi beberapa hasil pembelajaran dalam satu-satu tugasan
3. Fokus penaksiran prestasi adalah kepada mentaksir produk, proses atau kedua-duanya sekali
4. Terdapat pelbagai darjah realisme dalam penaksiran prestasi, dan matlamatnya adalah untuk mendapatkan setinggi darjah realisme yang mungkin dalam kekangan yang terdapat seperti kekangan masa, kos, kelengkapan, instrumen dan lain-lain
5. Langkah-langkah melaksanakan penaksiran prestasi bermula dengan mendefinisikan hasil pembelajaran; diikuti dengan memilih fokus penaksiran (prosedur, produk atau kedua-dua); seterusnya memilih darjah realisme tugasan yang sesuai; memilih situasi tugasan; dan akhirnya memilih metod pemerhatian, merekod dan menskor.
6. Beberapa teknik pemerhatian yang biasa digunakan adalah seperti pemerhatian berstruktur, rekod anekdot, senarai semai dan skala kadar.
7. Penskoran penaksiran prestasi boleh dilakukan secara analitik atau pun secara holistik dengan menggunakan rubrik penskoran yang sesuai.
8. Portfolio merupakan satu contoh pentaksiran prestasi yang sering digunakan untuk mentaksir progress pembelajaran pelajar dengan meneliti hasil kerja pelajar dalam
satu tempoh masa. Portfolio menekankan kekuatan pembelajaran pelajar, pembentukan penilaian kendiri serta penglibatan aktif pelajar dalam proses pengajaran dan pembelajaran.
Kuiz
Sila jawab soalan-soalan berikut: 1. Dalam mentaksir kebolehan pelajar mengesan kerosakan enjin kereta berdasarkan
kriteria yang telah ditetapkan, Cikgu Rama telah membawa pelajar-pelajarnya ke sebuah bengkel yang berhampiran dengan sekolah. Dengan bantuan mekanik di bengkel tersebut, Cikgu Rama telah meminta pelajar-pelajar nya mengesan jenis kerosakan pada enjin kereta yang terdapat di bengkel tersebut Tindakan Cikgu Rama ini menunjukkan yang beliau
A. ingin memberi peluang kepada pelajar-pelajarnya bekerja di bengkel kereta B. mementingkan darjah realisme pentaksiran yang dilakukannya C. cuba untuk mengelakkan pelajar-pelajar yang nakal membuat bising di kelas D. ingin membezakan pentaksiran bilik darjah dan pentaksiran persembahan
2. Penaksiran prestasi dikatakan sebagai penaksiran alternatif atau penaksiran autentik
dan tergolong dalam bentuk-bentuk penaksiran yang sedang dikembangkan dalam paradigma penaksiran pada masa ini. Kenyataan ini menggambarkan bahawa penaksiran prestasi
I. mementingkan penaksiran ke atas kebolehan berfikir aras tinggi II. bersesuaian dengan paradigma pembelajaran konstruktivisme III. boleh menggantikan penaksiran tradisional yang menekankan pengukuran
saintifik IV. adalah merupakan sebahagian daripada proses pengajaran dan pembelajaran
A. I & II sahaja B. 111 & IV sahaja C. I, II & III sahaja D. I, II & IV sahaja
3. Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah
seperti berikut:
"Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampongan orang asli".
Untuk mengukur kemahiran-kemahiran tersebut, jenis penaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah A. Penaksiran prestasi terbuka B. Penaksiran prestasi terhad C. Ujian Subjektif D. Ujian Objektif
4. Penaksiran prestasi dilaksanakan dengan mengikut langkah-langkah yang sesuai bagi
mempastikan penaksiran tersebut dapat mengukur dengan tepat pengetahuan dan kemahiran yang hendak diukur. Berikut adalah langkah-langkah yang biasa digunakan dalam menjalankan penaksiran prestasi:
I. Memilih situasi tugasan II. Memilih fokus penaksiran (prosedur, produk atau kedua-duanya) III. Memilih metod pemerhatian, merekod dan memeriksa IV. Menetapkan hasil tugasan V. Memilih darjah realisme yang sesuai
Pada pandangan anda, susunan langkah-langkah yang manakah yang paling sesuai untuk menjalankan penaksiran prestasi yang berkesan? A. I, II, III, IV, V B. II, III, I, IV, V C. III, I, II,V, IV D. IV,II,V,I,III
5. Dibandingkan dengan bentuk-bentuk penaksiran lain, portfolio sebagai metod
penaksiran merupakan satu cara yang terbaik untuk
A. merakamkan tingkahlaku autentik B. menggantikan penaksiran berbentuk ujian pensel-kertas C. berkomunikasi tentang apa yang pelajar sebenarnya tahu D. mengesahkan skor-skor ujian yang diperolehi daripada bentuk-bentuk
penaksiran lain 6. Kekuatan portfolio sebagai metod penaksiran pelajar yang menjadi tarikan kepada
guru-guru menggunakannya adalah A. kebolehpercayaan yang tinggi B. keberkesanan tinggi dan menjimatkan masa C. keseragaman tugasan untuk tujuan penggredan
D. kemudahan untuk guru mengintegrasikannya dengan pengajaran 7. Untuk tujuan pemberian gred, penilaian sesuatu portfolio paling baik dilakukan dengan
menggunakan
A. penilaian rakan sebaya
B. penilaian kendiri pelajar C. kriteria pemarkahan holistik D. kriteria pemarkahan analitik 8. Portfolio sangat berguna dalam konferen antara guru-ibubapa. Ia menyediakan
maklumat tentang perkembangan pembelajaran pelajar kepada ibubapa berserta dengan
A. rekod kerja pelajar yang lengkap B. skor yang boleh dipercayai dan mudah difahami C. contoh-contoh konkrit tentang pencapaian pelajar
D. gred bagi setiap sampelan kerja yang dimasukkan dalam portfolio 9. Di antara ciri-ciri penting penaksiran autentik adalah
A. Penaksiran kendiri dibuat seiring dengan ujian konvensional B. Penekanan kepada soalan yang memerlukan pelajar menghafal fakta C. Soalan atau tugasan yang dibina menggambarkan apa yang berlaku dalam
keadaan sebenar D. Pelajar dikehendaki membentangkan dan mempertahankan secara lisan untuk
menentukan bahawa penguasaan nya adalah benar JAWAPAN:
1. B 2. D 3. A 4. D 5. C 6. D 7. C 8. C 9. C
KATA KUNCI Penaksiran prestasi Penaksiran autentik Penaksiran alternatif Penaksiran rujukan kriteria Penaksiran proses Darjah realisme Kemahiran berfikir aras tinggi Portfolio
PENILAIAN KENDIRI
1. Apakah perbezaan asas di antara penaksiran tradisional dan penaksiran prestasi? 2. Mengapakah penaksiran prestasi lebih merupakan penaksiran rujukan kriteria? 3. Dalam sistem penaksiran di sekolah didapati penaksiran prestasi kurang diberikan
tumpuan, mengapa? 4. Apakah ciri-ciri yang ada pada penaksiran portfolio yang sesuai dengan kriteria
penaksiran prestasi?
RUJUKAN Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New
York: Mc-Graw Hill. Gronlund, N.E., (1998). Assessment of Student Achievement, 6th ed., Boston:Allyn & Bacon
K e s a h a n d a n K e b o l e h p e r c a y a a n | 1
UNIT 4
KESAHAN DAN KEBOLEHPERCAYAAN
HASIL PEMBELAJARAN
Di akhir unit ini, anda seharusnya dapat:
Menghuraikan maksud kesahan (validity) dan kebolehpercayaan (reliability). Menjelaskan kepentingan kesahan dan kebolehpercayaan dalam pentaksiran
pendidikan. Menjelaskan beberapa kaedah bagi menganggarkan kebolehpercayaan dan kesahan. Menghuraikan faktor-faktor yang mempengaruhi kesahan dan kebolehpercayaan. Menjelaskan langkah-langkah yang perlu diambil untuk mempertingkatkan kesahan dan
kebolehpercayaan.
PENGENALAN
Rajah 1: Ilustrasi contoh penggunaan konsep kesahan dan kebolehpercayaan
Cerita dalam Rajah 1 tadi biasa kita dengar, malah sebahagian daripada kita juga
mungkin pernah mengalaminya. Peristiwa tersebut boleh meninggalkan kesan yang
besar kepada sesetengah orang. Dalam cerita di atas, Bob berkemungkinan menjadi
murung dan enggan menjamah makanan beberapa hari sehingga beliau jatuh sakit.
“Berat badan saya hanya 52 kg, bukan 59 kg. Semua alat penimbang lain menunjukkan bacaan 51.5 atau 52 kg. Alat penimbang ini memberi bacaan yang berbeza-beza. Pagi tadi berat badan saya 55 kg, tapi sekarang 59 kg
pula. Saya rasa alat penimbang ini rosak! ” Bob, 10 tahun.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 2
Hal yang sama juga boleh berlaku apabila ramai pelajar yang berpencapaian tinggi gagal dalam
satu ujian penting disebabkan oleh kualiti ujian. Kejadian ini akan mencetuskan beberapa
persoalan yang meragui kualiti ujian yang dibina guru. Ia juga boleh menurunkan konsep
kendiri pelajar dalam subjek tersebut dan berkemungkinan membawa kepada kesan negatif
yang tidak diingini. Guru pula mungkin akan dipanggil oleh pengetua sekolah untuk
menjelaskan pertanyaan yang datang bertubi-tubi daripada ibu bapa pelajar. Sebagai guru,
apakah yang boleh kita lakukan untuk mengelakkan kejadian seperti itu?
Mari kita membuat sedikit refleksi. Pernahkah anda membina soalan ujian sebelum
ini? Kalau anda pernah mengajar, tentu sekali anda berpengalaman membina soalan-
soalan ujian atau peperiksaan akhir tahun. Cuba ingat kembali, bagaimana
kebiasaannya anda membina soalan-soalan tersebut? Apakah anda membina sendiri soalan-
soalan ujian secara individu atau berkumpulan, atau mengambil terus soalan daripada buku-
buku komersial yang ada di pasaran? Adakah kita duduk berbincang bersama guru lain dan
meneliti soalan satu persatu untuk menentukan kesesuaian dan aras kemahiran yang berkaitan
dengan setiap soalan? Mengapa kita perlu melakukan semua proses tersebut? Anda mungkin
berkata, “Saya dah mengajar lebih 10 tahun. Semua pengetahuan dihujung jari. Saya boleh
sediakan 40 soalan objektif dalam setengah jam sahaja. Saya tak perlu buat semua tu..”
Tunggu, selepas menyelesaikan modul ini, saya yakin persepsi anda akan berubah.
Sekarang mari kita meneliti konsep kesahan dan kebolehpercayaan dan bagaimana kita boleh
mengaplikasi konsep ini untuk mempertingkatkan kualiti ujian yang kita bina.
ISI KANDUNGAN
Apakah Kesahan?
esahan adalah berkaitan kesesuaian. Ia bermaksud instrumen yang digunakan mestilah
benar-benar mengukur apa yang ingin diukur. Dalam penyelidikan, instrumen yang
digunakan perlulah mempunyai kesahan dan kebolehpercayaan yang tinggi agar hasil
atau dapatan kajian tersebut boleh diterima pakai, seterusnya syor yang dicadangkan boleh
dipertimbang untuk dilaksanakan. Sebaliknya jika kesahan dan kebolehpercayaan rendah,
hasil kajian tersebut tidak boleh diterima seterusnya syor tidak boleh dipertimbangkan walaupun
kaedah analisis data yang sofistikated digunakan.
alam pentaksiran pendidikan pula, soalan ujian yang dibina perlulah sesuai, iaitu ujian
tersebut benar-benar mengukur apa yang ingin kita ukur. Ujian yang mempunyai
kesahan yang tinggi membolehkan hasil ujian tersebut ditafsir seterusnya penilaian
boleh dibuat berdasarkan hasil ujian tersebut. Sebaliknya pula jika kesahan ujian rendah, hasil
daripada ujian tersebut tidak dapat ditafsir secara bermakna, seterusnya penilaian yang dibuat
berdasarkan ujian tersebut juga tidak bermakna.
K
D
K e s a h a n d a n K e b o l e h p e r c a y a a n | 3
Contohnya jika kita ingin mengukur kemahiran pelajar menyediakan apron dalam subjek
Kemahiran Hidup, bagaimanakah bentuk ujian yang anda fikir paling sesuai untuk mencungkil
kemahiran tersebut? Adakah anda akan memberi mereka ujian objektif, ujian esei, atau ujian
amali? Apakah item tugasan atau soalan-soalan yang perlu diberi untuk membolehkan pelajar
melahirkan kemahiran membuat apron tersebut? Cuba fikirkan dan tulis jawapan anda dalam
ruang berikut:
_________________
Cikgu Anis memilih untuk memberi ujian objektif untuk mengukur kemahiran menyediakan
apron tersebut bagi memudahkan beliau memeriksa jawapan. Pada fikiran anda, adakah
soalan objektif sesuai untuk mengukur kemahiran tersebut?
_________________
Anda mungkin menjawab “Ya, sebab soalan yang berkaitan dengan teori boleh ditanya
dalam soalan objektif.” Benar, kita boleh mengukur pengetahuan mereka tetapi tidak
kemahiran mereka seperti kemahiran menggunting dan menjahit.
Cikgu Lim pula mungkin memilih untuk memberi soalan esei bagi mengukur kemahiran
tersebut. Adakah soalan esei sesuai?
__________________
Anda mungkin menjawab “Ya. Lebih baik daripada soalan objektif sebab pelajar berpeluang
menulis dengan perkataan sendiri langkah-langkah kerja, melakar pelan, dan menerangkan
setiap langkah dengan jelas dari mula hingga akhir”. Benar, tetapi kita masih belum dapat
melihat hasil yang sebenar. Bolehkah mereka menggunting dan menjahit dengan baik?
Cikgu Linda pula mungkin memilih untuk member ujian amali bagi mengukur kemahiran
membuat apron tersebut. Adakah ini sesuai?
__________________
Sekali lagi anda mungkin menjawab, “Ya. Kita dapat lihat bagaimana cara pelajar merancang
dan membuat pelan, menggunting kain, menjahit, dan seterusnya kita boleh melihat kualiti
apron yang terhasil.
Jadi soalan jenis mana harus dipilih. Kesemuanya kelihatan sesuai – ada yang agak
sesuai juga, lebih sesuai, dan sangat sesuai. Kita perlulah memilih yang paling
sesuai, kerana ia akan menentukan kesahan yang tinggi. Sebenarnya, kesahan
berkaitan dengan darjah kesesuaian. Messick (1989) mendefinisikan kesahan sebagai penilaian
tentang sejauhmana bukti empirikal dan hujah teori menyokong kecukupan dan kesesuaian
inferens yang dibuat berdasarkan skor ujian atau bentuk pentaksiran yang lain.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 4
Bagaimana Menganggarkan Kesahan?
erdapat beberapa jenis kesahan yang boleh digunakan untuk menunjukkan instrumen
atau ujian yang kita bina mempunyai bukti kesahan yang mencukupi. Antara yang utama
adalah seperti berikut:
Kesahan Kandungan : Untuk menentukan sejauhmana sampel tugasan ujian mewakili apa yang ingin diukur. Di sini kita perlu membandingkan item ujian atau tugasan dengan objektif atau spesifikasi domain tugasan yang ingin diukur. Proses ini dilakukan ketika membina Jadual Penentu Ujian (JPU). Oleh sebab itu, kesahan kandungan sebenarnya sudah dipenuhi bila kita membina JPU.
Kesahan Konstruk : Untuk menentukan sejauhmana pencapaian dalam ujian boleh ditafsir sebagai penting atau bermakna untuk mengukur kualiti yang ingin diukur. Berguna untuk pembolehubah berbentuk konsep dan tidak dapat diukur dengan mudah seperti kecerdasan, kebimbangan, dan personaliti. Dalam kaedah ini, kita perlu menentukan terlebih dahulu ciri-ciri atau indikator untuk menunjukkan kualiti yang ingin diukur. Contohnya bagi mengukur ’tahap sosio-ekonomi (SES)’, indikator yang boleh digunakan termasuklah tahap pendidikan; pendapatan; jenis pekerjaan; bilangan tanggungan; perbelanjaan; harta dimiliki; dan kawasan tempat tinggal.
Bagi mengukur kemahiran penakulan sains dan penyelesaian masalah pula, indikator yang boleh dipertimbangkan termasuklah kebolehan menerangkan alasan di sebalik idea; menganalisis perkaitan menggunakan graf, carta,atau jadual; menyelesaikan soalan yang tiada langkah penyelesaian yang jelas atau serta merta; menghuraikan pemerhatian; serta menyusun objek atau peristiwa dalam urutan dan menyatakan sebab.
Kesahan Kriterion : Untuk menentukan sejauhmana pencapaian dalam ujian yang dibina boleh meramalkan pencapaian pada masa depan (kriterion ramalan); atau sejauhmana ia berkait dengan pencapaian ujian lalu yang telah diakui kesahannya (kriterion ramalan); atau ujian lain lain pada masa yang sama (kriterion semasa). Caranya ialah dengan membandingkan prestasi dalam kedua-dua ujian dan dapatkan pekali korelasi bagi kedua-dua ujian tersebut.
Kesahan Pakar : Untuk menentukan sejauh mana pencapaian dalam ujian boleh ditafsir sesuai untuk mengukur kualiti yang ingin diukur berdasarkan pandangan pakar-pakar dalam bidang tersebut. Dalam kaedah ini, instrumen yang telah dibina ditunjukkan kepada sekumpulan pakar untuk diteliti dan diniliai. Jika instrumen tersebut mendapat persetujuan pakar-pakar, kesahan pakar telah dipenuhi.
Kesahan Muka : Kesahan ini merujuk kepada format dan pandangan kasar tentang ujian
tersebut. Sekali pandang ujian kelihatan mengukur kandungan (kemahiran/ pengetahuan/nilai) yang hendak diukur kepada kumpulan sasaran. Walau bagaimanapun, kesahan jenis ini sahaja tidak mencukupi untuk menentukan kualiti ujian.
T
K e s a h a n d a n K e b o l e h p e r c a y a a n | 5
Bagaimanakah kita boleh menentukan kaedah atau jenis yang mana
untuk digunakan?
Jawapannya mengikut kesesuaian, bergantung kepada jenis instrumen atau alat ukur
yang kita bina. Jika kita ingin membina ujian bagi melihat pencapaian pelajar dalam subjek
tertentu atau pencapaian peserta dalam kursus tertentu, kesahan kandungan dan kesahan
kriterion boleh digunakan untuk menganggar kesahan ujian tersebut. Sekiranya kita ingin
membina instrumen berbentuk soal selidik untuk mengukur suatu kualiti yang abstrak pula,
kesahan konstruk dan kesahan pakar mungkin lebih sesuai.
Cuba fikirkan beberapa contoh kualiti abstrak yang tidak boleh diukur secara
langsung, sebaliknya memerlukan kita membina konstruk tertentu dan mengenalpasti
indikator yang berkaitan.
o Personaliti_____________ o _____________________ o _____________________ o _____________________ o _____________________
Rujuk kepada Lampiran A4.1. Lampiran tersebut merupakan satu ujian mengandungi 5 item
untuk subjek nuclear perubatan. Jawab semua soalan tersebut dan rekodkan jawapan anda
dalam ruangan berikut.
1. __________ 2. __________ 3. __________ 4. __________ 5. __________
Pada pendapat anda, adakah tersebut sesuai untuk mengukur pencapaian sains
pelajar Tingkatan 2?
Apakah Faktor-faktor Yang Mempengaruhi Kesahan?
Kesahan akan menjadi rendah jika item ujian kurang baik, iaitu item tidak dapat mengukur
dengan tepat kemahiran atau pengetahuan yang ingin diukur. Berikut adalah antara faktor yang
boleh menyebabkan kesahan menjadi rendah dan perlu dielakkan:
Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur
Arahan kurang jelas
Soalan kabur
K e s a h a n d a n K e b o l e h p e r c a y a a n | 6
Penggunaan perbendaharaan kata yang sukar difahami pelajar
Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi
Bilangan item tidak mencukupi
Susunan jawapan item objektif boleh diramal
Apakah Kebolehpercayaan?
Kita mungkin pernah mendengar dialog seperti ini: “Saya tidak percaya macamana
saya boleh mendapat markah 25/40 sahaja bagi Bahagian Esei dalam Ujian Sains
bulan Mac. Jawapan saya hampir sama dengan jawapan Aishah, tapi dia mendapat
36 markah. Cikgu Nora mungkin silap memberi markah. Saya telah meminta Cikgu
Jaya yang mengajar Sains Tingkatan 4 Melati pula memeriksa kertas jawapan saya, dan saya
memperolehi 33 markah.”
ebanyakan kamus mendifinisikan kebolehpercayaan daripada sudut kebergantungan
atau darjah keyakinan terhadap sesuatu. Walau bagaimanapun, dalam konteks
pengukuran, kebolehpercayaan merujuk kepada ketekalan atau kestabilan (consistency)
hasil pengukuran. Kita ingin mengetahui sejauhmana keputusan ujian konsisten jika ditadbirkan
pada salah satu daripada keadaan berikut:
o ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau
o ditadbirkan kepada kumpulan yang berlainan; atau
o jawapan calon yang sama diperiksa oleh guru yang berlainan.
Dalam contoh di atas, Cikgu Nora dan Cikgu Jaya telah memberi markah yang berbeza kepada
kertas jawapan murid yang sama. Pada pendapat anda, mengapakah hal tersebut boleh
berlaku?
____________________________________________________________________
_____________________________________________________________________
______________________________________________
Bagaimana Menganggarkan Kebolehpercayaan?
erdapat beberapa jenis kebolehpercayaan yang boleh digunakan untuk menunjukkan
instrumen atau ujian yang kita bina mempunyai bukti kebolehpercayaan yang mencukupi.
Antara yang utama adalah seperti berikut:
Bentuk Belah Dua (Split-Half) – Kaedah ini biasa digunakan untuk mengukur ketekalan
dalaman. Satu ujian dibahagikan kepada dua sub-ujian melalui kaedah berikut:
Item ganjil – Bentuk A, Item genap - Bentuk B; atau
Item disusun mengikut aras kesukaran. Kemudian, kelompokkan item, contohnya
Item ganjil – Bentuk A, Item genap – Bentuk B; atau
K
T
K e s a h a n d a n K e b o l e h p e r c a y a a n | 7
Item dikelompokkan kepada Bentuk A dan Bentuk B berdasarkan tugasan yang
sepadan.
Setiap murid akan memperolehi 2 skor, satu untuk jumlah skor bagi item Bentuk A dan
satu lagi jumlah skor bagi item Bentuk B. Akhirnya dua set skor (Bentuk A dan B) akan
diperolehi bagi semua pelajar dan pekali korelasi akan dihitung. Nilai pekali korelasi
yang tinggi menunjukkan ketekalan dalaman yang tinggi bagi ujian tersebut.
Kebohpercayaan ujian akan dianggar menggunakan formula berikut:
Bentuk A Bentuk B
Amin
Nawi Rozy
Kebolehpercayaan, rxx = 2r1/2,1/2
--------------------
1 + r1/2,1/2
yang mana rxx = kebolehpercayaan ujian
r1/2,1/2 = korelasi antara dua sub-ujian (Bentuk A dan B)
Menggunakan Kovarian Item – Dalam kaedah ini, ketekalan dalaman dianggarkan
dengan menggunakan formula:
Pekali alpha Formula Kuder-Richardson
Formula Cronbach alpha:
Kebolehpercayaan,
α = k ∑ σi2
------- ( 1 - ----- ) ; yang mana
k – 1 σx2
k = bilangan item
∑ σi2 = jumlah varian bagi setiap item
σx2 = varian bagi keseluruhan ujian berkenaan
36
27
32
25
..
..
..
39 28 30 27 ..
..
..
K e s a h a n d a n K e b o l e h p e r c a y a a n | 8
Formula Kuder-Richardson 20:
Digunakan untuk item dengan jawapan betul/salah.
Kebolehpercayaan,
KR20 = k ∑ pq
------- ( 1 - ----- ); yang mana
k – 1 σr2
p = perkadaran calon yang dapat jawapan betul;
(0<p<1)
q = perkadaran calon yang dapat jawapan salah
(1-p)
σr2 = varian bagi jumlah skor
k = bilangan item
Formula Kuder-Richardson 21:
Kebolehpercayaan,
KR20 = k m(k-m)
------- ( 1 - ----------- ); yang mana k – 1 ks2
k = bilangan item dalam ujian
m = min ujian
s2 = varian ujian
Kaedah Uji dan Ulang Uji (Test-Retest) – Ujian yang sama ditadbirkan kepada kumpulan
pelajar yang sama dalam dua masa yang berbeza. Dapatkan pekali korelasi (r) bagi
dua set skor tersebut.
Ujian 1 Ujian 2
Lim Rais Ravi
76
77
62
55
..
..
..
78 78 63 54 ..
..
..
K e s a h a n d a n K e b o l e h p e r c a y a a n | 9
Kaedah Bentuk Setara (Equivalent Form) – Dua ujian yang berlainan tetapi setara dari
segi aras kemahiran dan kandungan diberi kepada pelajar. Dapatkan pekali korelasi (r)
antara bagi dua skor tersebut.
Ketekalan antara Pemeriksa (Inter-rater Reliability) – Ketekalan skor yang diberi oleh
beberapa orang pemeriksa atau pakar. Dalam kaedah ini, jika dua orang atau lebih
pemeriksa memberi skor yang sama atau hampir sama, ujian dikatakan mempunyai
kebolehpercayaan yang tinggi. Kaedah ini tidak sesuai bagi soalan objektif yang
mempunyai satu jawapan tepat.
Faktor Yang Mempengaruhi Kebolehpercayaan
Panjang ujian atau bilangan item. Lebih banyak item atau lebih panjang ujian, lebih
tinggi kebolehpercayaan.
Kepelbagaian kebolehan individu dalam kumpulan. Kumpulan heterogen –
kebolehpercayaan lebih tinggi berbanding kumpulan homogen.
Kebolehan pelajar yang mengambil ujian. Jika item terlalu sukar – pelajar akan meneka
jawapan menyebabkan ketekalan keputusan rendah.
Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. Contoh -
Kebolehpercayaan yang diperolehi daripada kaedah bentuk setara biasanya lebih
rendah berbanding prosedur uji dan ulang uji atau bentuk belah dua.
Pembolehubah yang diukur. Kebolehpercayaan umumnya lebih tinggi bila kita
mengukur pengetahuan atau kemahiran berbanding sikap atau nilai. Contohnya
mengukur pencapaian akademik – keputusan biasanya lebih konsisten berbanding
sahsiah atau sikap.
Jenis ujian. Kebolehpercayaan bagi ujian objektif biasanya lebih tinggi berbanding ujian
esei disebabkan panjang ujian dan juga perbezaan antara pemeriksa. Skema
pemarkahan yang jelas boleh membantu mengurangkan perbezaan antara pemeriksa
seterusnya mempertingkatkan kebolehpercayaan ujian.
Hubungan antara Kesahan dan Kebolehpercayaan
Ujian perlu mempunyai kesahan dan kebolehpercayaan yang tinggi supaya keputusan daripada ujian tersebut boleh ditafsir dengan tepat.
Kesahan akan menentukan sejauhmana ujian yang dibina menepati matlamat, manakala kebolehpercayaan pula memastikan ketekalan dalam pengukuran pencapaian murid dalam ujian tersebut.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 10
Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum mencukupi untuk memastikan kesahan.
Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang
mempunyai kebolehpercayaan tidak semestinya sah. Perkaitan ini digambarkan dalam rajah berikut:
Konsisten tetapi tidak sah Tidak sah dan tidak Sah dan konsisten (tidak menepati sasaran) konsisten
Rajah 2: Hubungan antara kesahan dan kebolehpercayaan Sumber: http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf
RUMUSAN
erdasarkan apa yang telah kita bincangkan dalam Unit ini, apakah yang boleh anda
rumuskan tentang kebolehpercayaan dan kesahan?
_________________________________________________________________
_________________________________________________________________________
____________________________________________________________________
Berikut adalah beberapa rumusan yang boleh dibuat:
Pengertian kesahan :
o Berkaitan kesesuaian (appropriateness).
o Sejauhmana instrumen/ujian mengukur objektif pembelajaran yang ingin diukur.
o Menentukan sejauhmana hasil penilaian itu boleh digunakan.
o Spesifik untuk tujuan tertentu sahaja.
o Melibatkan penilaian darjah kesesuaian
B
K e s a h a n d a n K e b o l e h p e r c a y a a n | 11
Kaedah menentukan kesahan :
o Kesahan kandungan
o Kesahan kriterion
o Kesahan konstruk
o Kesahan pakar
o Kesahan muka
Faktor-faktor yang mempengaruhi kesahan : o Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur
o Arahan kurang jelas
o Soalan kabur
o Penggunaan perbendaharaan kata yang sukar difahami pelajar
o Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi
o Bilangan item tidak mencukupi
o Susunan jawapan item objektif boleh diramal
Kebolehpercayaan o Berkaitan ketekalan, kestabilan (consistency) hasil pengukuran.
o Menunjukkan sejauhmana keputusan ujian konsisten jika ditadbirkan pada salah
satu daripada berikut:
ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau
ditadbirkan kepada kumpulan yang berlainan; atau
jawapan calon yang sama diperiksa oleh guru yang berlainan.
Kaedah menentukan kebolehpercayaan :
o Kaedah belah dua
o Kaedah kovarian item
o Kaedah uji dan ulang uji
o Kaedah bentuk setara
o Ketekalan pemeriksa
Faktor yang mempengaruhi kebolehpercayaan :
o Panjang ujian atau bilangan item. o Kepelbagaian kebolehan individu dalam kumpulan. o Kebolehan pelajar yang mengambil ujian. o Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. o Pembolehubah yang diukur. o Jenis ujian.
Hubungan antara kebolehpercayaan dan kesahan
o Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum dapat memastikan kesahan.
o Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang mempunyai kebolehpercayaan tidak semestinya sah.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 12
KATA KUNCI
1. Kesahan 9. Kesahan kandungan 2. Kebolehpercayaan 10. Kesahan kriterion 3. Ketekalan 11. Kesahan konstruk 4. Konsisten 12. Kesahan pakar 5. Kesesuaian 13. Kesahan muka 6. Ketekalan dalaman 14. Uji dan ulang uji 7. Bentuk belah dua 15. Bentuk setara 8. Ketekalan antara pemeriksa 16. Korelasi
PENILAIAN KENDIRI
Uji kefahaman anda dengan menjawab soalan-soalan berikut:
1. Semasa menentukan kesahan berasaskan kriterion semasa, Cikgu Abby mendapati pekali korelasi (r) antara skor bagi ujian matematik dan sains bagi 93 orang pelajar Tingkatan 2 di sekolahnya ialah +1.25. Dapatan ini menunjukkan
A. perhubungan antara skor matematik dan sains sangat kuat. B. terdapat kesilapan dalam pengiraan pekali korelasi (r). * C. perhubungan antara skor matematik dan sains adalah positif. D. pelajar yang mendapat skor tinggi dalam sains juga mendapat skor tinggi dalam matematik.
2. Data berikut diperolehi daripada satu kajian tentang faktor yang mempengaruhi kepuasan kerja daripada persepsi pekerja dan majikan yang dibuat di Hulu Langat, Selangor. Didapati pekali korelasi (r) antara ranking oleh pekerja dan majikan ialah -.75. Faktor manakah yang paling banyak menyumbang kepada pekali korelasi yang negative tersebut?
Faktor Urutan Kepentingan (Ranking)
Majikan Pekerja
P. Penghargaan dan pujian Q. Gaji memuaskan R. Kerja menarik S. Suasana kerja yang baik T. Kebajikan pekerja dijaga U. Kenaikan gaji berdasarkan merit V. Jaminan pekerjaan
1 2 3 4 5 6 7
6 3 1 5 7 4 2
A. Faktor P dan T B. Faktor R dan U C. Faktor P dan V * D. Faktor R dan V
A
K e s a h a n d a n K e b o l e h p e r c a y a a n | 13
3. Semenjak beberapa tahun lalu, ujian M-TeSt digunakan untuk tapisan memasuki program perguruan di Institut Perguruan di seluruh negara. Sekumpulan penyelidik menyiasat korelasi antara keputusan ujian M-TeST dan gred purata kumulatif (PNGK) pelajar di akhir pengajian mereka. Prosedur tersebut adalah berkaitan dengan penentuan
A. kebolehpercayaan ujian B. kesahan kriterion * C. keobjektifan ujian D. kualiti ujian
4. Jadual Penentu Ujian (JPU) disediakan dengan tujuan untuk
I. memastikan ujian mengandungi perwakilan yang mencukupi bagi tajuk-tajuk dalam kandungan sukatan.
II. memastikan soalan mengandungi pelbagai aras kemahiran. III. menentukan kesahan kandungan. IV. memastikan soalan ujian tidak terlalu mudah atau terlalu sukar.
A. I dan III sahaja. B. I, II dan III sahaja.* C. IV sahaja. D. I, II, III dan IV.
5. Dari aspek manakah ujian esei lebih baik daripada ujian objektif?
A. Perwakilan kandungan yang lebih menyeluruh mengikut topik. B. Kesahan muka yang lebih tinggi. C. Kebolehpercayaan ujian yang lebih tinggi. D. Mengukur kebolehan penyelesaian masalah yang melibatkan pelbagai kemahiran
dan pengetahuan dengan lebih berkesan. * 6. Manakah daripada ujian esei berikut yang mungkin mempunyai kebolehpercayaan
paling tinggi? A. Satu soalan dengan 500 patah perkataan. B. Dua soalan dengan 250 patah perkataan setiap satu. C. Lima soalan dengan 100 patah perkataan setiap satu. * D. Kebolehpercayaan soalan essei sukar dianggarkan. 7. Melissa mendapat markah 75 dalam satu ujian geografi di sekolahnya baru-baru ini.
Rumah gurunya ditenggelami air dan semua kertas jawapan turut musnah. Melissa dan rakan-rakannya dikehendaki mengambil ujian tersebut sekali lagi pada keesokan harinya. Kali ini Melissa mendapat 75 markah juga. Apakah kesimpulan yang boleh dibuat berdasarkan keputusan ujian Melissa?
A. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut boleh
dipercayai. * B. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut TIDAK boleh
dipercayai.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 14
C. Tiada bukti yang boleh digunakan untuk membuat penilaian tentang kebolehpercayaan ujian geografi tersebut.
D. Keputusan ujian tersebut menunjukkan bukti kesahan yang tinggi.
8. Dalam satu penilaian personaliti menggunakan skala kadar, Cikgu Nora memberi skor yang tinggi kepada Elly yang menunjukkan Ella seorang pelajar popular di kalangan rakan-rakannya. Pembantu guru di kelas tersebut pula memberi skor yang rendah menunjukkan Elly sukar bekerjasama dalam tugasan kumpulan. Hal ini menunjukkan
A. keputusan pengukuran tersebut tidak boleh dipercayai. * B. keputusan pengukuran tersebut boleh dipercayai, tetapi sukar diinterpretasi. C. tiada bukti yang boleh digunakan untuk membuat penilaian tentang
kebolehpercayaan pengukuran tersebut. D. keputusan pengukuran tersebut menunjukkan bukti kesahan yang rendah.
9. Manakah antara berikut paling tepat menggambarkan kesahan?
A. Kesahan menerangkan sama ada proses pengumpulan data konsisten dalam mengukur apa yang diukur.
B. Kesahan menerangkan sama ada proses pengumpulan data mempunyai aras kesukaran yang sesuai.
C. Kesahan adalah berkaitan dengan keseragaman prosedur pentadbiran, pemarkahan, dan interpretasi data.
D. Kesahan menerangkan sama ada proses pengumpulan data benar-benar mengukur apa yang sepatutnya diukur. *
10. Pengetua SMK Keembong menerima aduan daripada ibu bapa yang tidak berpuas hati dengan kualiti Peperiksaan Percubaan Sains PMR yang dikatakan mengandungi terlalu banyak soalan daripada tajuk fizik, sedangkan daripada tajuk Kimia dan Biologi tidak mencukupi. Setelah disiasat, aduan tersebut didapati benar. Manakah antara ciri-ciri ujian berikut yang kurang memuaskan?
A. Kesahan criterion. B. Kebolehpercayaan bentuk setara. C. Kesahan kandungan. * D. Ketekalan dalaman.
JAWAPAN 1. B 6. C 2. C 7. A 3. B 8. A 4. B 9. D 5. D 10. C
K e s a h a n d a n K e b o l e h p e r c a y a a n | 15
RUJUKAN
Rujukan Utama Linn, R.L. & Miller, D. E.(2005). Measurement and Assessment in Teaching ( 9th ed.). New Jersey: Prentice-Hall, Inc.
Reynolds, C. R., Livingston, R. B., and Willson, V. (2009). Measurement and assessment in
education. New Jersey: Pearson Education, Inc.
Rujukan Tambahan
Abu Bakar Nordin, (1995). Penilaian Afektif. Kajang, West Malaysia: Masa
Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia :
Quantum Books.
Cunningham, G.K. (1998). Assessment in the Classroom. London : Falmer Press.
Hopkins, K.D. (1998). Educational and Psychological Measurement and Evaluation ( 8th ed.).
Needham Heights : Allyn & Bacon.
Linn, R.L. & Gronlund, N.E.(2000). Measurement and Assessment in Teaching ( 8th ed.). New Jersey: Prentice-Hall, Inc.
Notes on Reliability and Validity of the Delaware Student Testing Program,
http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf, retrieved on 21 Feb 2011.
Popham, W.J. (1999). Classroom Assessment. Boston : Allyn & Bacon.
Payne, D.A. (1997). Applied Educational Assessment. London : Wadsworth Pub. Company.
Reynolds, C. R., Livingston, R. B., and Willson, V. (2006). Measurement and assessment in
education. New Jersey: Pearson Education, Inc.
Sax, G. (1997). Principles of Educational and Psychological Measurement and Evaluation (4th
ed.). Belmont : Wadsworth Pub. Company.
Tan Hui Leng & Ee Ah Meng, (1996). Penilaian dalam Proses Pendidikan. Kulala Lumpur: Fajar
Bakti.
Ward, A.W. (1999). Assessment in the Classroom. Belmont : Wadsworth Pub. Co.
K e s a h a n d a n K e b o l e h p e r c a y a a n | 16
K e s a h a n d a n K e b o l e h p e r c a y a a n | 17
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 1
UNIT 5
PENSKORAN, PENGGREDAN, PENTAFSIRAN DAN PELAPORAN
HASIL PEMBELAJARAN
Di akhir unit ini, anda diharap dapat:
1. Menganalisis dan mentafsir skor. 2. Menggunakan hasil penilaian untuk menambah baik pengajaran. 3. Menghuraikan cara melapor kepada pelajar, ibu bapa dan pihak lain.
PENGENALAN
Murid takut hendak tunjukkan kad laporan kepada bapa
Rajah 5.1 Kesan gred dan pelaporan kepada murid dan bapa
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 2
Pernahkah anda berada dalam situasi murid di atas? Pernahkah juga anda merasakan bahawa
diri anda tidak cukup tepat digambarkan melalui penaksiran yang menggunakan sekeping kad
sahaja?
dakah anda tahu bahawa gred yang guru berikan kepada murid sangatlah besar kesannya kepada
pembelajaran murid. Selain gred yang terdapat di dalam kad laporan murid, bagaimana pelaporan
prestasi murid itu didokumenkan adalah penting. Adakah pelaporan itu bersifat objektif, telus dan
mempunyai kebolehpercayaan? Adakah pelaporan itu bersifat berterusan? Adakah pelaporan itu juga
bersifat professional? Iaitu bertujuan untuk menggalakkan pembelajaran terus berlaku dengan lebh maju.
Mari kita bayangkan beberapa keadaan dalam masyarakat kita. Pertama, Halim adalah seorang murid
yang pandai tetapi dia seorang yang cepat panik dan amat gementar apabila hendak menduduki
peperiksaan.bertulis. Walaupun semasa dalam kelas, Halim dapat menjawab dan mengikuti pelajaran
dengan baik tetapi keputusan gred peperiksaannya sentiasa kurang baik. Kedua, Bapa Rudy seorang
yang panas baran dan sentiasa menghendaki Rudy memperoleh gred A dalam semua mata pelajarannya
di sekolah. Ketiga, Sarah seorang yang pasif, tidak suka bercakap dan tidak mempunyai ramai kawan, dia
hanya menghabiskan masanya dengan membaca dan tidak berinteraksi dengan orang lain.
Bagaimanapun gred peperiksaan Sarah adalah cemerlang. Bila anda sudah selesai memahami ketiga-tiga
situasi berkenaan, buat refleksi dengan menjawab soalan berikut:
Adakah gred yang diperoleh menggambarkan prestasi sebenar murid-murid itu? Adakah
berkemungkinan gred yang mereka perolehi akan menimbulkan ,
kemurungan, salah laku seperti menipu dalam peperiksaan atau
kesombongan?
Adakah pelaporan gred murid-murid tersebut membantu murid belajar dengan
cemerlang dan mencapai matlamat pembelajaran untuk menghasilkan individu yang
seimbang dari segi jasmani, emosi, rohani, intelek dan sosial?
ISI KANDUNGAN
Apa itu penskoran?
Sebelum kita mempelajari berkenaan penggredan, kita akan melihat dahulu apa itu penskoran. Penskoran
sangat berkait rapat dengan pengukuran. Di dalam bilik darjah, contoh pengukuran yang paling lazim ialah
apabila guru memberikan skor selepas sesuatu ujian atau kuiz dijalankan. Penskoran ialah proses
memberi skor kepada jawapan murid. Iaitu penskoran menghasilkan satu huraian prestasi dalam bentuk
numerik.
Terdapat dua kaedah penskoran iaitu penskoran holistik dan penskoran analitik. Penskoran holistik
melihat yang keseluruhan itu adalah lebih besar daripada jumlah kesemua bahagian yang terlibat. Ia
melihat hubungan dan saling kaitan di antara kesemua bahagian yang terlibat. Seandainya mana-mana
A
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 3
satu bahagian itu didapati sangat lemah, keseluruhan prestasi berkemungkinan akan terjejas dengan
teruk.Oleh kerana itu, penskoran holistik biasanya dilakukan selepas penskoran analitik serta memperoleh
maklumat daripada penskoran analitik. Penskoran analitik boleh membantu seseorang guru daripada
terlepas pandang akan ciri-ciri yang sepatutnya merupakan faktor penting yang patut dimasukkan dalam
penskoran holistik. Dengan lain perkataan,penskoran holistik menggambarkan pandangan keseluruhan,
misalnya sebuah karangan, dengan memberikan satu skor sahaja.
Manakala penskoran analitik melihat sebuah karangan itu terdiri daripada banyak bahagian, dan
memberikan skor berasingan bagi setiap bahagian. Penskoran analitik memberikan maklumbalas yang
mendalam untuk pelajar menambahbaik aspek berbeza dalam karangan mereka. Dengan kata
lain,penskoran analitik bermaksud menjumlahkan kesemua markah setiap satu bahagian. Penskoran
analitik mempunyai dua tujuan. Pertamanya, ia membimbing guru untuk menumpukan perhatian ke atas
perkara-perkara yang relevan. Keduanya ialah untuk menyediakan maklum balas yang spesifik kepada
pelajar untuk membantu mereka dalam membuat persediaan.
Apakah langkah-langkah untuk memastikan penskoran dibuat secara objektif?
Isikan carta alir di bawah bagi menunjukkan secara ringkas langkah-langkah untuk
memastikan penskoran dibuat secara objektif, sama ada seseorang guru menggunakan
penskoran holistik maupun analitik.
Rajah 5.2 Carta alir menunjukkan langkah-langkah utama penskoran secara objektif
A
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 4
Selepas mengetahui bahawa terdapat dua kaedah penskoran iaitu holistik dan analitik, mari kita melihat
jenis-jenis skor yang ada. Dua jenis skor yang dikenalpasti ialah skor mentah dan skor terbitan.
Mungkin anda pernah dengar kedua-dua istilah ini.
Oleh itu,tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan skor mentah dan skor
terbitan
___________________________________________________________________________
____________________________________________________________________________
__________________________________________________________________________________
Perhati semula jawapan yang anda telah tulis, adakah sama dengan huraian di bawah.
Skor mentah ialah jumlah poin yang diperolehi pelajar atau bilangan jawapan yang betul. Contohnya:
1. Dua puluh huruf abjad dapat dinamakan dengan betul. 2. Empat puluh poin diperolehi dalam ujian pengetahuan am.
Skor mentah dan skor peratusan adalah sangat serupa. Contohnya:
1. Sembilan puluh peratus daripada100 soalan telah dijawab dengan betul. 2. Tujuh puluh lapan peratus daripada soalan sains itu dijawab dengan betul.
Jikalau anda menyatakan skor mentah adalah sama dengan skor peratusan, ia adalah benar bila bahan
dikenalpasti dengan jelas. Contohnya, “Sam dapat menamakan semua huruf abjad dengan betul” atau
“Nora menjawab 80% daripada soalan matematik dengan betul”.
Bagaimanapun, apabila tugasan yang perlu dilakukan dikenalpasti dengan eksplisit, skor mentah
mempunyai makna yang jelas tetapi tidak selalunya jelas bagi skor peratusan. Contohnya, “Rohani
menamatkan larian 200 meter dalam 12 saat”.
Skor terbitan ialah skor yang dimodifikasi atau ditukar daripada skor mentah. Kedua-dua skor mentah
dan skor peratusan tidak menunjukkan status rujukan norma. Supaya prestasi calon boleh dibandingkan
dengan kumpulan atau orang lain, skor mentah perlu ditukar kepada skor terbitan.
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 5
Skor terbitan mutlak dan skor terbitan relatif (norma) adalah dua jenis skor terbitan. Bagi skor terbitan
mutlak, lazimnya skor diberikan sebagai perbandingan prestasi murid berasaskan satu standard yang telah
ditentukan lebih awal, iaitu selalunya menggunakan sistem 100-poin. Manakala skor terbitan relatif ialah
skor yang membandingkan prestasi murid berdasarkan prestasi ahli kumpulan.
Apabila anda sudah memahami apakah itu penskoran, langkah seterusnya anda perlu memahami apakah
penggredan. Cuba anda huraikan apakah yang ada tahu mengenai penggredan dengan menulisnya di
ruangan yang disediakan.
____________________________________________________________________________
_________________________________________________________________________
__________________________________________________________________________________
Apa itu penggredan?
agi menjawab soalan tersebut, mari kita mendefinisikan istilah penggredan. Penggredan ialah
proses memberi gred ke atas jawapan atau skor murid dan biasanya gred diberi dalam bentuk
abjad. Gred yang akan diberikan kepada murid sepatutnya melambangkan sejauh mana objektif
pengajaran dan pembelajaran telah dicapai, dan sepatutnya selari dengan polisi sekolah atau negara.
Jika penaksiran yang dijalankan mengandungi pelbagai kaedah seperti penaksiran konvensional dan
penaksiran autentik, maka masalah untuk menggred ialah bagaimana untuk merumuskan koleksi
maklumat-maklumat yang berbeza ini hanya dengan menggunakan satu gred huruf atau laporan ringkas
sahaja.
Tahukah anda bahawa terdapat dua jenis penggredan? Iaitu penggredan rujukan norma dan
penggredan rujukan kriteria.
Penggredan rujukan kriteria menyatakan prestasi seseorang yang dibandingkan dengan kriteria piawai
yang telah ditetapkan terlebih dahulu. Misalnya,
menaip pada kadar 37 perkataan seminit .
melakukan CPR, menggunakan peralatan yang disediakan, dengan cara yang telah dihuraikan.
Supaya penggredan jenis ini berguna, kriteria yang bermaksud “asas perbandingan” atau “ pemerolehan
satu kontinum ilmu, daripada tiada kecekapan langsung kepada satu prestasi yang sempurna” (Glaser,
1963, dalam Hanna & Dettmer, 2004). Ia bukan bermaksud “aras pencapaian yang diperlukan”. Kriteria itu
mestilah bidang kandungan atau kemahiran yang boleh dikenalpasti secara eksplisit. Bidang itu mestilah
B
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 6
boleh diperhalusi dan dapat ditunjukkan dengan jelas perlakuan yang bagaimana termasuk dalam bidang
tersebut dan bahagian mana yang tidak termasuk.
Penggredan rujukan norma menyatakan prestasi seseorang yang dibandingkan dengan prestasi
sekumpulan orang lain. Misalnya,
memperoleh gred ekuivalen 4.7 daripada kumpulan kebangsaan dalam ujian pemahaman.
memenangi peraduan menaip laju.
Supaya penggredan jenis ini berguna, ia mesti lah membandingkan prestasi seseorang itu dengan prestasi
kumpulan yang relevan dan betul. Kumpulan rujukan atau “norma” mestilah dihuraikan dengan jelas,
barulah perbandingan yang bermakna boleh dilakukan. Jadi, apabila kumpulan rujukan itu dihuraikan
dengan secukupnya dan relevan bagi tujuan pemberian makna, maka ia dapat menghuraikan status calon
secara perbandingan yang bermakna di antaranya dengan orang lain.
Bagaimanakah kedudukan murid ditentukan? Mari kita tentukannya berdasarkan penggredan rujukan
kriteria dan penggredan rujukan norma.
erdasarkan penggredan rujukan kriteria , kedudukan murid dapat ditentukan melalui berbagai cara.
Salah satunya ialah dengan mencampurkan semua skor mentah tanpa wajaran. Jikalau pemberian
gred yang lazimnya melibatkan gabungan keputusan daripada berlainan jenis penaksiran, termasuk
ujian, projek, laporan, dan kerja makmal, maka jika setiap elemen hendak dimasukkan dalam gred
berasaskan kepentingan relatif setiap elemen itu, data mestilah digabungkan dengan cara membuat
wajaran yang betul. Begitu juga skor-skor mentah dicampurkan dengan wajaran mengikut mata pelajaran
apabila melibatkan lebih daripada satu mata pelajaran. Akhirnya kita akan memperoleh skor komposit.
Rubrik iaitu “panduan penskoran” juga boleh digunakan. Apabila semua skor komposit bagi setiap murid
telah diperolehi, kedudukan murid akan dapat ditentukan dengan tepat.
ebelum penggredan rujukan norma digunakan untuk menentukan kedudukan murid, skor mentah
perlu ditukarkan ke skor terbitan. Untuk membandingkan prestasi di kalangan murid, semua ujian
yang diambil mereka mestilah berada pada skala yang sama. Skor-skor mentah tidak boleh
digunakan kerana ujian-ujian itu mungkin berbeza dari segi bilangan item ujian ataupun darjah kesukaran
item.
B
S
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 7
Apakah kategori skor terbitan yang utama dan selalu digunakan di sekolah?
Isikan tiga kategori utama skor terbitan ke dalam Rajah 5.4 di bawah
Rajah 5.3 Tiga kategori utama skor terbitan
angkat persentil (Percentile Rank) ialah suatu peratusan daripada satu kumpulan rujukan. Ia
dapat menunjukkan kedudukan relatif seseorang murid dalam satu kumpulan berasaskan peratusan
ahli-ahli kumpulan itu yang memperoleh skor pada atau di bawah skor mentah murid tersebut.
Sebagai contoh, jika skor mentah 30 bersamaan dengan persentil rank 60, itu bermakna 60 % daripada
ahli kumpulan tersebut memperoleh skor mentah sama dengan atau lebih rendah daripada 30. Dengan
menukarkan skor mentah kepada pangkat persentil , skor-skor mentah itu telah berada di atas skala yang
mempunyai makna yang sama dengan kumpulan-kumpulan yang berbeza saiz dan tempoh masa ujian
yang berbeza.
Supaya lebih jelas, mari kita kira dan bentukkan satu jadual sebaran kekerapan dan pangkat persentil
untuk satu ujian objektif yang terdiri daripada 40 item. Ikut langkah-langkah berikut:
Skor mentah disusun dari tinggi ke rendah (kolum 1).
Bilangan murid yang memperoleh setiap skor itu disenaraikan ke dalam kolum frekuensi (kolum
2).
Skor frekuensi ditambah dari bawah ke atas (iaitu dengan menambah setiap skor frekuensi
kepada jumlah frekuensi dari semua skor di bawahnya untuk memperoleh frekuensi kumulatif
(CF)(kolum 3).
Untuk memperoleh pangkat persentil (kolum 4), gunakan formula berikut:
P
B
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 8
Di mana PR = pangkat persentil
CF = frekuensi kumulatif
Untuk menunjukkan bagaimana mengira pangkat persentil, mari kira dua skor mentah berikut:
Jadual 5.1 Taburan frekuensi dan pangkat persentil untuk satu ujian objektif terdiri daripada 40 item
_____________________________________________________________________________________
1 2 3 4
Skor Ujian Frekuensi Frekuensi Kumulatif Pangkat Persentil *
_____________________________________________________________________________________
37 1 30 98
36 1 29 95
35 0 28 93
34 2 28 90
33 2 26 83
32 3 24 75
31 2 21 67
30 2 19 60
29 4 17 50
28 2 13 40
27 2 11 33
26 2 9 27
25 4 7 17
24 2 3 7
23 1 1 2
________________
N = 30
_________________________________________________________________________________
* Dibundarkan kepada nombor bulat yang terdekat.
Bila mentafsir pangkat persentil, pelajar hendaklah berhati-hati, kerana pangkat persentil menghuraikan
prestasi ujian berdasarkan peratusan murid-murid yang memperoleh skor yang lebih rendah dan bukan
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 9
peratusan item yang dijawab dengan betul. Peratusan skor betul ialah tafsiran rujukan kriteria manakala
pangkat persentil adalah tafsiran rujukan norma kerana ia menunjukkan satu kedudukan relatif.
Keduanya pangkat persentil sentiasa spesifik kepada sesuatu kumpulan tertentu. Sebagai contoh, pangkat
persentil 95 dalam kumpulan murid cerdik mewakili prestasi ujian yang lebih tinggi daripada pangkat
persentil 90 dalam kumpulan murid sederhana. Jadi pelajar perlu mengetahui sifat semulajadi sesuatu
kumpulan bila hendak menghuraikan kedudukan relatif seseorang murid.
Ketiganya, pangkat persentil tidak tersusun pada jarak yang sama di atas skala. Perbezaan 5 pangkat
persentil di tengah-tengah taburan skor mewakili prestasi ujian yang lebih kecil berbanding perbezaan 5
pangkat persentil di hujung-hujung taburan. Ini adalah kerana persentil rank adalah didasarkan kepada
peratus murid yang dilangkau atau dapat ditandingi. Dan terdapat peratusan murid yang lebih besar di
tengah-tengah taburan skor untuk dilangkau berbanding di hujung-hujung taburan. Misalnya, di hujung
taburan, perbezaan beberapa poin skor mentah tidak banyak mengubah pangkat persentil disebabkan
terdapat hanya sedikit sahaja skor tinggi.
kor gred ekuivalen selalu digunakan di tahap sekolah rendah. Skor mentah seorang murid
daripada satu ujian ditukarkan ke tahap gred yang sepadan dengan skor mentah purata murid-murid
di dalam kumpulan norma. Jadual di dalam manual ujian menunjukkan kolum-kolum yang selari di
antara skor mentah dengan gred ekuivalen. Pelajar hanya perlu merujuk jadual dalam manual itu dan
mendapatkan gred ekuivalen untuk mana-mana skor mentah yang diingini.
Dikatakan skor gred ekuivalen berkemungkinan merupakan skor yang paling kerap disalah tafsir. Mari kita
lihat apakah yang dimaksudkan dengan skor gred ekuivalen dan yang mana tidak. Katalah kita
memperoleh skor gred ekuivalen berikut daripada suatu ujian bateri untuk Liam, yang berada dalam
pertengahan tahun di darjah empat.
Membaca 4.5
Bahasa 6.5
Matematik 7.8
Perhatikan bahawa skor gred ekuivalen dipersembahkan berdasarkan tahap gred dan bulan dalam tahun
pengajian. Dilihat di sini bahawa skor Liam dalam membaca bersamaan dengan skor purata yang
diperoleh oleh murid-murid (daripada kumpulan norma) yang berada di pertengahan tahun di darjah empat.
Jadi dari aspek membaca, Liam ditafsirkan sebagai sederhana. Dari aspek bahasa, Liam ditafsirkan ke
hadapan dua tahun, dan dari aspek matematik, dia ditafsirkan ke hadapan lebih dari tiga tahun. Adakah itu
bermakna Liam boleh membuat kerja dan tugasan pada tahap-tahap ini?
Tidak, sebaliknya besar kemungkinan itu bermaksud yang Liam boleh melakukan tugasan gred empat
lebih cepat dan lebih cekap daripada murid darjah empat yang lain. Dalam ujian-ujian tersebut
S
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 10
berkemungkinan besar tiada soalan-soalan pada tahap enam dan tujuh dimasukkan. Demikian juga jika
gred ekuivalen yang rendah diperolehi, misalnya jika Sara, murid darjah empat, memperoleh skor
matemaik 3.0, itu bukan bermaksud Sara hanya dapat selesaikan tugasan matematik darjah tiga. Lebih
tepat ialah itu bermaksud sara menyelesaikan tugasan matematik darjah empat dengan lebih lambat dan
melakukan lebih banyak kesalahan berbanding murid darjah empat yang lain.
Oleh kerana itu, pelajar perlu ingat bahawa skor gred ekuivalen bukanlah satu standard yang hendak
dicapai tetapi hanyalah skor purata murid-murid dalam kumpulan norma. Juga,skor gred ekuivalen yang
terlalu tinggi atau rendah bukan indikator prestasi ujian yang boleh disandarkan sebagaimana skor gred
ujian yang berdekatan dengan tahap gred murid itu. Ini adalah kerana skor ekuivalen yang tinggi dan
rendah lazimnya diperolehi melalui proses ekstrapolasi dan tidak mewakili skor purata yang diperoleh oleh
kumpulan-kumpulan tersebut.
kor piawaian dapat menghuraikan prestasi ujian berdasarkan berapa jauh suatu skor mentah itu di
atas atau di bawah purata. Ianya dinyatakan dalam unit yang dihitung daripada min dan sisihan
piawai suatu set skor. Sebagai mana pelajar tahu min digunakan sebagai suatu purata. Iaitu
dengan menjumlahkan semua skor dan kemudian dibahagi dengan bilangan skor. Sisihan piawai
menunjukkan sebaran semua skor dalam satu set skor. Formula untuk menghitung sisihan piawai ialah
Di mana ∑ = jumlah
X = satu skor ujian
N = bilangan skor
M = min
√ = punca ganda dua
Sisihan piawai sangat penting dan digunakan dengan meluas dalam pengujian. Supaya pelajar lebih
memahami min dan sisihan piawai, elok kita menggunakan keluk norma supaya lebih jelas. Rajah 5.4
menunjukkan satu contoh keluk norma. Ianya berbentuk loceng yang simetrikal. Taburan skor tertumpu
berdekatan dengan min yang berada di titik tengah dalam taburan norma. Frekuensi skor berkurangan
apabila semakin jauh daripada min. Apabila keluk norma dibahagikan ke dalam unit sisihan piawai yang
sama jaraknya sepanjang garisan dasar keluk itu, setiap bahagian di bawah keluk mengandungi peratusan
kes yang tetap. Jadi, 34 peratus daripada kes, jatuh di antara min dan +1 SD, 14 peratus di antara +1 SD
dan +2 SD, dan 2 peratus di antara +2 SD dan +3 SD. Oleh kerana hanya 0.13 peratus sahaja kes jatuh di
S
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 11
atas dan di bawah tiga sisihan piawai dari min, rata-rata skor taburan norma jatuh di antara -3 dan +3
sisihan piawai dari min.
Untuk membantu pemahaman maksud sisihan piawai, satu set skor mentah yang mempunyai min 40 dan
sisihan piawai 5 diletakkan di bawah garisan dasar keluk. Perhatikan bahawa min skor mentah 40
diletakkan di titik sifar dan jarak satu sisihan piawai ialah 5 poin skor mentah di merata garisan dasar lekuk.
Jadi, titik satu sisihan piawai di atas min bersamaan 45 (40 + 5) dan titik satu sisihan piawai di bawah min
bersamaan 35 (40 – 5). Bagi set skor ini, dianggarkan 68 peratus skornya (lebih kurang dua per tiga) jatuh
di antara 35 dan 45, dan 99.7 peratus jatuh di antara 25 dan 55.
Apabila kita mengira sisihan piawai bagi satu set skor yang bertaburan norma, kita sebenarnya
menentukan sejauh mana kita perlu pergi di atas (atau di bawah) min dalam poin skor mentah untuk
memasukkan 34 peratus dari semua kes.
Rajah 5.4 Keluk norma dengan anggaran peratus kes di dalam setiap sela (peratusan telah dibundarkan)
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 12
Apakah skor-z, skor-T, skor NCE, skor abiliti, dan stanine?
Adakah pelajar tahu yang semua skor berkenaan adalah skor piawaian? Ya, semuanya adalah skor
piawaian yang berasaskan unit sisihan piawai. Mari kita lihat satu demi satu.
kor-z ini menunjukkan berapa jauhkah suatu skor mentah berada di atas atau di bawah min, dalam
unit sisihan piawai. Skor mentah 45 dalam Rajah 5.4 yang dibincangkan tadi akan dinyatakan
sebagai satu skor-z 1.0 sebab ianya satu sisihan piawai di atas min. Skor mentah 30 pula akan
dinyatakan sebagai satu skor-z -2.0 sebab ianya dua sisihan piawai di bawah min. Formula untuk
mengira skor-z ialah:
Contohnya, skor-z untuk 47 dalam Rajah 5.4 dikira begini:
Oleh itu, skor mentah 47 ialah 1.4 sisihan piawai di atas min. Oleh kerana skor-z didapati menggunakan
titik perpuluhan dan adakalanya bertanda negatif, untuk mengelakkan kekeliruan, skor-z jarang digunakan
secara terus. Sebaliknya skor-z ditukar kepada jenis skor piawaian yang lain yang menggunakan nombor
bulat dan bernilai positif.
kor-T memiliki min 50 dan sisihan piawai 10. Skor-T diperolehi daripada skor-z dengan
menggunakan formula:
Skor- T = 50 + 10 (skor-z )
Misalnya bila skor-z ialah 1.4, maka skor-T = 50 + 10 (1.4) = 64
Skor- T adalah mudah untuk ditafsirkan sebab skor-T sentiasa mempunyai min dan sisihan piawai yang
sama. Suatu skor-T 60 sentiasa bermaksud satu sisihan piawai di atas min dan suatu skor-T 30 sentiasa
bermaksud dua sisihan piawai di bawah min. Jadi, dengan menggunakan skor-T, prestasi seseorang
individu daripada pelbagai ujian boleh dibandingkan secara terus, dan skor-skor boleh digabung atau
S
S
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 13
dipuratakan tanpa berlakunya perubahan pada saiz sisihan piawai, tidak seperti bila menggunakan skor
mentah.
Bilamana taburan norma boleh djangkakan, skor-T boleh ditafsirkan berdasarkan persentil rank kerana
keduanya saling berhubungan seperti yang ditunjukkan dalam Rajah 5.5. Perhatikan bahawa skor-T 30
adalah bersamaan dengan persentil rank 2, skor-T 40 bersamaan dengan persentil rank 16, dan
begitulah seterusnya.
Supaya pelajar tidak keliru, perlu diingatkan bahawa walaupun kedua-dua skor-T dan persentil rank
menggunakan 50 sebagai min dan nombor dua digit, persentil rank merujuk kepada peratus individu yang
jatuh pada atau di bawah sesuatu skor, manakala skor-T merujuk kepada berapa unit sisihan piawai
sesuatu skor di atas atau di bawah min. Perhatikan juga bahawa walaupun kedua-duanya mempunyai min
yang sama, di bawah min persentil rank bernilai lebih kecil daripada skor-T dan di atas min persentil rank
lebih besar daripada skor-T. Ini adalah kerana seperti pelajar sudah tahu persentil rank bertumpu di
tengah-tengah taburan dan tersebar keluar di hujung-hujung, manakala skor-T bertabur pada unit yang
sekata di seluruh taburan skor.
kor ekuivalen keluk-norma (Normal-curve equivalent score,NCE) merupakan satu lagi skor
piawaian yang dibimbangi mengelirukan pelajar. Ini adalah kerana skor NCE juga menggunakan 50
sebagai min, tetapi sisihan piawai ialah 21.06. Ini membolehkan terbentuknya satu set skor yang
memiliki unit yang sekata, seperti skor-T, tetapi julat skornya ialah dari 1 ke 99. Julat persentil rank juga
dari 1 ke 99, tetapi persentil rank tidak berada dalam unit yang sekata. Jadi bila pelajar mentafsirkan skor
NCE, jangan keliru dengan skor-T, yang selalunya mempunyai julat yang terhad (lazimnya 20 ke 80).
Baiklah, kita akan lihat apakah pula skor abiliti dan skor stanine.
kor abiliti dahulunya dipanggil sisihan IQ. Ia selalu melibatkan penerbit ujian bateri yang
melaksanakan ujian abiliti pembelajaran, kognitif, atau kecerdasan ke atas kumpulan norma. Skor
yang diperolehi daripada ujian-ujian ini dilaporkan sebagai skor piawaian dengan minnya 100 dan
sisihan piawainya 16 atau 15. Skor ini ditafsirkan sama seperti mana-mana skor piawaian yang lain. Skor
116 bermaksud satu sisihan piawai di atas min, (Rajah 5.5).
kor stanine merupakan skor ujian yang dipersembahkan dalam bentuk satu digit. Iaitu skala
stanine menaburkan skor mentah kepada sembilan bahagian. Skor stanine yang tertinggi ialah 9,
yang terendah ialah 1, dan stanine 5 terletak di tengah tengah taburan. Setiap satu stanine, kecuali
9 dan 1, merangkum satu band skor mentah, separuh dari kelebaran satu sisihan piawai. Jadi stanine
S
S
S
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 14
adalah skor piawaian yang mempunyai minnya 5 dan sisihan piawainya 2. Taburan stanine dan peratusan
kes dalam setiap stanine ditunjukkan dalam Rajah 5.5.
Rajah 5.5 Hubungan persentil rank, skor-z, skor-T, skor NCE, skor abiliti, dan stanine.
Sewaktu pelajar membandingkan skor murid daripada dua ujian yang berlainan dalam satu ujian bateri,
perbezaan dua stanine lazimnya adalah signifikan. Jadi bila mentafsirkan skor-skor berikut bagi murid ini,
kita merumuskan pencapaian murid ini adalah tinggi dalam matematik tetapi tidak ada perbezaan di antara
membaca dan bahasa.
Stanine membaca = 5
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 15
Stanine bahasa = 4
Stanine matematik = 7
Menukarkan skor mentah kepada stanine meletakkan skor daripada ujian berlainan ke atas satu skala
piawaian yang sama, dengan unit-unit yang setara. Jadi perbezaan di antara stanine 5 dan stanine 7
adalah sama seperti perbezaan antara stanine 4 dan stanine 6.
Bolehkah pelajar fikirkan apakah tujuan dan peranan penggredan? Adakah penggredan
memberikan munafaat kepada murid dan ibu bapa mereka? Adakah penggredan memberi
faedah kepada guru, sekolah dan masyarakat? Bagaimana?
Mengapa penggredan diperlukan?
agi menjawab soalan di atas, kita perlu memikirkan apakah tujuan penggredan dijalankan di
sekolah. Pada amnya penggredan adalah perlu untuk memberi gambaran atau petunjuk sejauh
mana murid-murid telah mencapai matlamat pengajaran dan pembelajaran. Namun tujuan
penggredan juga telah menjadi pelbagai disebabkan oleh tuntutan keperluan hidup. Mungkin tujuan dan
peranan penggredan boleh dikategorikan kepada tiga:
Boleh memberi faedah kepada setiap murid dan ibu bapa mereka.
Membimbing tugas guru dan sekolah.
Memenuhi keperluan masyarakat.
Adakah anda bersetuju dengan hujah ini? Mengapa?
embantu murid dan ibu bapa adalah salah satu tujuan penggredan yang utama. Markah
merupakan maklumbalas kepada murid dan ibu bapa mengenai pencapaian murid. Ibu bapa
boleh memantau usaha murid, memberi semangat dan galakan, menawarkan bantuan, serta
dapat maklumat mengenai perkembangan murid.
Maklumbalas mengenai pencapaian membolehkan murid mengetahui tentang dirinya. Gred dapat
memberikan petunjuk akan kekuatan dan kelemahan relatif intraindividu dan mengenai kebolehan dan
batasan dirinya berbanding murid lain. Maklumat ini akan membimbing murid untuk membuat keputusan-
keputusan penting seperti memilih bidang, pendidikan di masa depan, dan memilih karier. Dapat
mengenali konsep diri yang realistik adalah amat penting semasa murid membesar.
Maklumbalas daripada gred bagaimanapun sepatutnya disampaikan kepada murid dengan cara yang tidak
menggambarkan penilaian harga diri seseorang murid.
B
M
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 16
embantu guru dan sekolah adalah tujuan penggredan yang seterusnya. Gred membantu guru
memantau kemajuan murid. Kepada murid secara individu, guru dapat memberi arahan yang
spesifik kepada individu berkenaan. Jadi pengajaran berpusatkan individu boleh dilaksanakan.
Manakala bagi kedua-dua peringkat individu dan kumpulan, guru boleh merencana dan melaksanakan
pelbagai strategi pengajaran.
Strategi seperti mengumpul murid-murid kepada kumpulan yang homogeneous berdasarkan kelemahan
atau kekuatan mereka dalam sesuatu mata pelajaran atau satu bahagian daripada mata pelajaran
membolehkan guru memberi peneguhan dan tumpuan kepada subjek berkenaan.
Gred juga digunakan di sekolah sebagai syarat kemasukan murid ke dalam kursus atau bidang yang
memerlukan prasyarat. Misalnya, untuk mengambil mata pelajaran fizik, murid berkenaan perlulah
mendapat sekurang-kurangnya gred C untuk algebra.
emenuhi keperluan masyarakat tidak dapat dielakkan, di mana gred digunakan oleh institusi di
luar sekolah seperti kolej, universiti, matrikulasi dan seumpamanya. Sama ada sebagai rujukan
untuk syarat menerima murid di institusi berkenaan, atau menentukan kursus dan bidang yang
paling sesuai diikuti. Gred juga selalu dijadikan sebagai asas untuk menghulurkan bantuan biasiswa atau
anugerah.
Gred juga digunakan oleh bidang perniagaan, industri, dan kerajaan. Markah daripada sekolah dan kolej
yang diterima oleh murid dan pelajar memberikan kepada prospektif majikan maklumat yang sangat
berguna. Akhirnya markah terlibat dalam pemberian lesen untuk menjalankan tugas ataupun merupakan
sijil kecekapan. Ini untuk memastikan masyarakat dan orang ramai mendapat khidmat daripada petugas
dan pekerja yang sah dan berkelulusan dalam bidang pekerjaan yang dijalankannya.
Bagaimanakah pelaporan patut dilakukan?
Bagaimanakah anda akan laporkan prestasi murid anda kepada ibu bapa mereka? Bolehkah anda
namakan beberapa cara yang boleh dilakukan? Sila tuliskan idea anda di sini:
__________________________________________________________________________
__________________________________________________________________________
M
M
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 17
dakah anda telah menulis kaedah seperti menggunakan gred abjad, penilaian bertulis, dan
konferen? Jika itu yang anda tulis saya ucapkan syabas! Tidak boleh dipertikaikan bahawa
pelaporan yakni proses memberi maklumbalas kepada ibu bapa tentang prestasi murid mestilah
bersifat objektif, berterusan, dan ada kebolehpercayaan. Kita boleh merangkumkan kaedah menggunakan
gred abjad dan penilaian bertulis dalam kaedah konferen. Iaitu pertemuan dengan ibu bapa murid untuk
melaporkan prestasi murid.
Adakah anda perlukan sebarang kemahiran untuk konferen yang berkesan? Sudah tentu. Mana-mana
komunikasi memerlukan tiga elemen: penghantar, mesej, dan penerima. Kordinasi di antara ketiga-tiga
elemen ini adalah penting untuk memastikan kejayaan sesuatu konferen dan memerlukan langkah-langkah
asas yang berikut:
Menyediakan bahan dan maklumat untuk konferen.
Menyusun kemudahan dan aturcara.
Membentuk hubungan baik dengan ibu bapa dan menghormati kepelbagaian.
Mendengar dengan teliti dan responsif kepada ahli keluarga dan murid.
Menyampaikan maklumat secara professional dan prihatin.
Mengenalpasti masalah dan perkara yang perlu diberikan perhatian.
Menyelesaikan masalah secara berpasukan.
Menunjukkan keikhlasan dan komited terhadap perkembangan murid.
Membuat tindak ikut dan susur ikut hasil konferen.
Membuat penilaian konferen untuk penambahbaikan perjumpaan di masa akan datang.
ersediaan untuk konferen melibatkan proses memaklumkan kepada ibu bapa tujuan dan perkara
yang akan dibincangkan. Guru perlu mengumpul sampel kerja-kerja murid, yang baik dan juga
yang kurang baik untuk dilihat oleh ibu bapa dan untuk dibincangkan. Sampel sepatutnya daripada
pelbagai pemerhatian dan merupakan asas kepada markah yang murid perolehi. Ini akan meningkatkan
kebolehpercayaan pentafsiran. Kesahan akan meningkat jika penaksiran dibuat berasaskan ciri-ciri murid
yang relevan.
Untuk memastikan ibu bapa dapat memahami bahan murid , masa yang cukup perlu diperuntukkan
kepada ibu bapa. Semasa mereka membaca dan meneliti bahan murid, komunikasi tidak patut
berlangsung. Adalah penting untuk sekolah merancang aturcara dan masa yang sesuai untuk konferen ini
supaya ibu bapa dapat datang dan guru tidak terlalu penat kerana perjumpaan yang padat. Ibu bapa juga
sepatutnya berjumpa dengan guru dalam suasana yang ada privasi dan perbincangan ibu bapa dengan
guru tidak didengari oleh ibu bapa yang lain.
enjalankan konferen sebenar dengan lancar adalah penting. Dua peraturan perlu dipegang
untuk menjayakan sesuatu konferen, iaitu memulakan konferen dalam nada positif dan
menamatkannya mengikut masa yang telah ditetapkan. Mulakan dengan menceritakan apa yang
murid telah capai dan kemajuan yang telah dilakukannya. Komunikasi yang sesuai ialah mendengar
A
P
M
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 18
dengan responsif. Bila ibu bapa telah menjelaskan apa yang hendak dijelaskan dan menyoal soalan, guru
barulah boleh berkongsi maklumat dan memulakan proses penyelesaian masalah. Guru hendaklah jujur,
objektif dan melengkapkan diri dengan evidens kerja murid. Guru yang bijak tidak bercakap tentang guru
lain, murid lain dan ibu bapa lain.
indak ikut dan susur ikut hasil konferen adalah penting tetapi selalu diabaikan. Di penghujung
konferen, guru sepatutnya dapat melihat dengan jelas apakah rancangan yang akan dibuat di masa
akan datang. Siapa yang bertanggungjawab untuk apa? Bila? Di mana? Bagaimana keputusan itu
nanti hendak disampaikan kepada semua yang terlibat? Jadi terpulanglah kepada guru untuk menjadikan
dirinya mudah untuk dihubungi dan selalu menghubungi keluarga murid-muridnya.
enilai konferen sangat sesuai ditegaskan di sini. Guru mungkin bertanya secara tidak formal
soalan-soalan seperti, “Adakah ini satu pengalaman yang baik?” “Adakah semua orang pulang
dengan rasa puas hati?” “Adakah semua orang telah mengetahui kekuatan, kelemahan, dan
keperluan murid?” dan sebagainya. Namun adalah lebih baik lagi jika guru-guru mengisi rubrik atau
senarai semak yang sesuai untuk menilai konferen. Terkandung dalam rubrik itu mungkin mengenai
persiapan (agenda, portfolio, kemudahan), tujuan dan peranan setiap orang, rancangan tindakan yang
sesuai untuk akan datang, dan sebagainya. Ibu bapa juga boleh diberikan borang untuk menilai konferen.
Jika diberikan borang maka sediakan tempat untuk mengisi (misalnya di perpustakaan) dan ibu bapa
memasukkannya ke dalam kotak yang disediakan.
RINGKASAN
1. Penskoran ialah proses memberi skor kepada jawapan murid. Dua kaedah penskoran ialah penskoran holistik dan analitik. Skor biasanya berbentuk numerik. Jenis-jenis skor ialah skor mentah dan skor terbitan. Skor terbitan pula terbahagi dua iaitu skor terbitan mutlak dan skor terbitan relatif.
2. Penggredan ialah proses memberi gred ke atas jawapan atau skor murid. Gred biasanya dalam bentuk abjad. Terdapat dua jenis penggredan iaitu penggredan rujukan norma dan penggredan rujukan kriteria. Kedudukan pelajar boleh ditentukan berdasarkan penggredan rujukan kriteria dan juga berdasarkan rujukan norma.
3. Pelaporan ialah proses memberi maklumbalas kepada ibu bapa tentang prestasi murid. Pelaporan gred dan pencapaian murid mestilah objektif, ada kebolehpercayaan dan berterusan.
PENILAIAN KENDIRI
1. Dengan menggunakan perkataan sendiri, huraikan apa yang membezakan penskoran holistik
daripada penskoran analitik?
T
M
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 19
2. Huraikan dengan terperinci langkah-langkah yang perlu dilakukan untuk memastikan penskoran
soalan subjektif dibuat secara objektif.
3. Apakah perbezaan utama antara pensentil rank daripada skor NCE?
4. Bagaimanakah anda akan menerangkan kedudukan murid anda kepada ibu bapanya berdasarkan
persentil rank?
5. Kenapakah min dan sisihan piawai itu penting dan perlu difahami? Bagaimanakah anda akan
terangkan maksud min dan sisihan piawai? Berikan beberapa contoh kegunaan min dan sisihan
piawai.
RUJUKAN Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New York: Mc-Graw
Hill.
Hanna, G. S. & Dettmer, P. A. (2004). Assessment for effective teaching: using context-adaptive planning.
Mexico City: Allyn and Bacon.
Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and Bacon
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 20
JAWAPAN SERTA MAKLUM BALAS
Selain di atas ada lagi langkah-langkah yang lain yang boleh dikenalpasti. Masa perlu disediakan untuk
menanda jawapan subjektif secara objektif.
A
B
P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 21