KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

79
1 UNIT PELAJARAN 1 KONSEP ASAS PENGUJIAN, PENGUKURAN, PENILAIAN DAN PENTAKSIRAN HASIL PEMBELAJARAN Di akhir unit ini, anda diharap dapat: 1. Menghuraikan maksud pengujian (testing), pengukuran (measurement), penaksiran (assessment) dan penilaian (evaluation). 2. Menghuraikan perkaitan di antara pengujian, pengukuran, penaksiran dan penilaian. PENGENALAN

Transcript of KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Page 1: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

1

UNIT PELAJARAN 1

KONSEP ASAS PENGUJIAN, PENGUKURAN, PENILAIAN DAN PENTAKSIRAN

HASIL PEMBELAJARAN Di akhir unit ini, anda diharap dapat:

1. Menghuraikan maksud pengujian (testing), pengukuran (measurement),

penaksiran (assessment) dan penilaian (evaluation).

2. Menghuraikan perkaitan di antara pengujian, pengukuran, penaksiran

dan penilaian.

PENGENALAN

Page 2: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

2

Sebagai seorang guru atau pelajar kita harus memahami bahawa matlamat utama

penilaian adalah untuk membekalkan maklumat. Situasi seperti di Rajah 1.1 mungkin

anda hadapi ketika anda ingin mengumpul maklumat tersebut. Untuk mengumpul

maklumat tersebut, guru akan memberi ujian kepada murid-muridnya. Pada pendapat anda,

adakah kaedah ujian yang dijalankan seperti dalam rajah di atas boleh dilaksanakan?

dakah anda sedar bahawa biasanya, murid ingin mengetahui prestasinya sendiri melalui

ujian dan guru pula boleh mengenal pasti kelemahan murid, dan menilai keberkesanan

pengajarannya. Di pihak ibu bapa pula, mereka boleh menilai prestasi anaknya melalui

laporan kemajuan murid. Bagi pentadbir pula, berbagai-bagai keputusan boleh dibuat berdasarkan

maklumat ujian tersebut.

ISI KANDUNGAN Apa maksud pengujian?

aiklah. Selepas menyedari kepentingan penilaian kepada murid serta pihak-pihak yang

berkepentingan, kita akan mempelajari apakah maksud ujian atau pengujian itu. Ujian

merupakan satu kaedah, tugas atau prosedur untuk memperoleh pemerhatian yang

sistematik tentang sifat seseorang berhubung dengan aspek pendidikan atau psikologi.

Tujuan ujian pencapaian adalah untuk mengukur prestasi murid dalam berbagai-bagai mata

pelajaran di sekolah. Manakala ujian psikologi adalah untuk mengukur sikap, minat, personaliti

dan ciri-ciri psikologi yang lain. Kebiasaannya ujian memerlukan murid bertindak balas terhadap

soalan atau butiran. Ujian boleh dibuat secara bertulis dalam bentuk soalan pelbagai pilihan atau

esei dan juga dalam bentuk pemerhatian yang memerlukan pemerhati membuat pemeringkatan

atau catatan rekod. Oleh itu, murid tidak semestinya sedar bahawa ia sedang diuji.

Cronbach (1970) telah mendefinisikan ujian sebagai satu prosedur sistematik untuk memerhati

tingkah laku seseorang dan memperihalkannya dengan bantuan skala bernombor atau satu sistem

berkategori. Contoh skala bernombor adalah seperti angka 20/100 untuk ujian penglihatan, 120

untuk ujian kecerdasan (IQ Test) dan 75/100 untuk ujian pencapaian bagi mata pelajaran Geografi.

A

B

Page 3: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

3

Bagi sistem berkategori ialah ’ekstrovert’ atau ’introvert’ bagi ujian personaliti dan buta warna hijau

–merah bagi ujian penglihatan.

Dari segi perlaksanaannya, ujian terbahagi kepada dua kumpulan:

1. ujian berbahasa

2. ujian bukan berbahasa

Ujian berbahasa adalah seperti ujian pensel dan kertas (ujian bertulis) dan ujian lisan. Ujian bukan

berbahasa adalah ujian prestasi yang lebih menumpukan kepada kemahiran psikomotor daripada

kemahiran kognitif. Contohnya ujian membaiki radas elektronik.

Bilangan calon yang mengambil ujian terbahagi kepada ujian perseorangan dan ujian

berkumpulan. Ujian berkumpulan seperti ujian pencapaian di sekolah, manakala ujian

perseorangan seperti ujian kecerdasan The Stanford Biner Intelligence Scale dan The Weschsler

Intelligence Scale. Kedua-dua ujian kecerdasan itu ditadbir kepada seorang murid

pada satu-satu masa.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengujian?. ____________________________________________________________

______________________________________________________________________

Apa maksud pengukuran?

Sax (1997), mendefinisikan pengukuran sebagai umpukan atau pemberian angka-angka atau

nombor kepada sesuatu objek atau perkara mengikut satu set peraturan yang telah ditetapkan.

Dalam erti kata lain, ujian berupaya mengukur pencapaian murid. Bagi seseorang guru di bilik

darjah, aspek pengukuran pendidikan itu selalu dikaitkan dengan ujian di bilik darjah. Bagi ahli

psikologi klinikal, pengukuran pendidikan melibatkan ujian-ujian psikologi yang lebih bertumpu

kepada pengukuran nilai-nilai afektif individu.

Page 4: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

4

Pengukuran dalam pendidikan sebenarnya adalah langkah untuk menentukan tahap sejauh mana

seseorang memiliki sifat tertentu. Biasanya suatu indeks berangka kepada prestasi seseorang

diberikan supaya status individu tersebut secara lebih tepat dapat mewakili sifat tertentu.

Misalnya, Azman dapat markah 75 peratus dalam ujian Bahasa Melayu, atau prestasi purata

sekumpulan murid dalam mata pelajaran Matematik ialah 60 peratus. Kita hanya mengukur dan

tidak menentukan nilai. Sebab itu, contoh tersebut tidak dinyatakan sama ada prestasi tersebut

baik atau sebaliknya. Pengukuran ialah penentuan status dan penilaian ialah penentuan nilai.

Seseorang murid mungkin mengukur panjang sebuah meja, jarak masa larian satu kilometer,

rintangan satu litar arus elektrik atau pencapaian seseorang murid. Setiap pengukuran ini

melibatkan sifat atau pemboleh ubah yang berbeza-beza bagi satu objek atau perlakuan tertentu.

Pengukuran memberi maklumat tentang sifat atau aktiviti yang diukur. Biasanya maklumat yang

diperoleh ada kaitan dengan telahan ke atas fenomena tertentu. Contohnya panjang meja

diperlukan untuk mengetahui sama ada meja itu boleh ataupun tidak untuk diletakkan di ruang

tamu. Sebenarnya, apa yang diukur bukanlah objek tetapi sifat objek. Begitu juga kita tidak

mengukur pelajar tetapi mengukur tinggi, berat atau pencapaian pelajar. Atribut-atribut

yang boleh diukur mempunyai sifat-sifat kuantitatif, iaitu nilainya adalah dalam bentuk

nombor.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengukuran?. _______________________________________________________________

________________________________________________________________________

Apa maksud penaksiran?

Pada umumnya penaksiran melibatkan membuat keputusan berdasarkan kepada sesuatu peraturan atau piawaian. Penaksiran mempunyai ciri-ciri berikut: a) Merupakan satu proses mengumpul data bertujuan membuat keputusan tentang individu atau kumpulan b) Ujian merupakan sebahagian daripada penaksiran

Page 5: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

5

c) Apabila penaksiran dibuat ke atas pelajar, guru sebenarnya mengukur tahap kecekapan untuk menentukan sama ada tahap kecekapan yang perlu dikuasai pada satu-satu peringkat pengajaran dan pembelajaran telah dapat diwujudkan. Penaksiran boleh dibahagikan kepada beberapa jenis mengikut kriteria tertentu, iaitu pembahagian mengikut:

1. tujuan penaksiran,

2. darjah keutamaan antara faktor ekonomi, ketulenan atau realisme (autentik), dengan

kebolehpercayaan,

3. cara bagaimana data yang dikumpul ditafsir dan dinilai.

Pengkelasan penaksiran mengikut tujuan penaksiran.

Tujuan Jenis

Mengenal pasti kelemahan dan kesediaan belajar

Penaksiran diagnostik (diagnostic assessment)

Mempelbagaikan penaksiran secara berkala bagi tujuan memberi gred

Penaksiran formatif (formative assessment)

Membantu pelajar belajar secara berterusan

Penaksiran untuk pembelajaran (assessment for learning dan assessment as learning)

Memberi gred Melapor kepada pihak luar Membuat keputusan tentang sesuatu tindakan

Penaksiran sumatif (summative assessment) atau penaksiran hasil pembelajaran (assessment of learning)

Perbezaan antara ‘assessment for learning’ dengan ‘assessment as learning’

Assessment for learning Assessment as learning

Sejauh mana pembelajaran berlaku dibuat perbandingan dengan kriteria yang merujuk kepada hasil pembelajaran yang diharapkan

Sejauh mana pembelajaran berlaku dibuat perbandingan dengan prestasi kendiri sebelumnya

Pengkelasan penaksiran mengikut darjah keutamaan antara faktor ketulenan (realisme), ekonomi

(praktikal) dan kebolehpercayaan (konsisten)

Faktor yang diutamakan Jenis

Page 6: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

6

Ketulenan (authenticity) Penaksiran autentik

Ekonomi dan kebolehpercayaan Penaksiran konvensional/tradisional atau pengujian

Menyeimbangkan faktor ketulenan, ekonomi, dan kebolehpercayaan penaksiran Apabila konteks penaksiran prestasi mempunyai darjah ketulenan yang sangat tinggi,

biasanya ia tidak seragam dan/atau tidak ekonomi untuk dijalankan.

Memaksimumkan salah satu daripada tiga faktor ini (ketulenan, kebolehpercayaan, dan

ekonomi) akan menyebabkan dua faktor lain terjejas dengan teruk.

Oleh sebab ketulenan, ekonomi, dan kebolehpercayaan semuanya penting, guru perlu

mempertimbangkan dengan teliti semua faktor ini dan cuba menonjolkan salah satu hanya

apabila faktor lain itu tidak begitu terjejas.

Strategi terbaik adalah mencari titik keseimbangan di mana tahap setiap faktor itu cukup

tinggi berbanding memaksimumkan hanya satu faktor. Namun pemilihan banyak juga

bergantung kepada tujuan penaksiran itu dijalankan.

Perbezaan antara penaksiran autentik dengan penaksiran konvensional/tradisional atau pengujian

Penaksiran autentik Penaksiran konvensional/ tradisional atau pengujian

Biasanya pelajar perlu melakukan sesuatu tugasan

Biasanya pelajar memilih respon dan/atau menulis ayat pendek

Konteks kehidupan sebenar Konteks terkawal

Membina/mengaplikasi Mengingat kembali/mengenal pasti

Penstrukturan pelajar Penstrukturan guru/pengajar

Bukti secara langsung Bukti secara tidak langsung

Terdapat juga istilah penaksiran alternatif yang agak sinonim dengan penaksiran autentik.

Namun terdapat sedikit perbezaan iaitu penaksiran alternatif merupakan penaksiran selain

daripada penaksiran kertas-dan-pensel. Ada kalanya darjah ketulenannya tidak begitu tinggi,

cuma ia bukan ujian kertas-dan-pensel, maka mungkin tidak boleh dikategorikan sebagai

penaksiran autentik. Penaksiran autentik biasanya mempunyai darjah ketulenan yang tinggi

iaitu penaksiran itu dijalankan dalam konteks kehidupan sebenar. Sebagai contoh, menaksir

kebolehan mengajar semasa pelajar menjalankan latihan mengajar di makmal

mikropengajaran merupakan penaksiran alternatif tetapi darjah ketulenannya tidak begitu

Page 7: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

7

tinggi berbanding menjalankan latihan mengajar di sekolah, di mana ia dilakukan dalam

konteks kehidupan sebenar. Namun jika dibandingkan latihan mengajar di makmal dengan

ujian kertas-dan-pensel seperti peperiksaan akhir semester, darjah ketulenan latihan mengajar

di makmal mikropengajaran bagi mengukur kebolehan mengajar itu adalah lebih tinggi, maka

lebih autentik daripada ujian kertas-dan-pensel. Walau bagaimanapun, dalam konteks

kebolehan menghasilkan penulisan kreatif, misalnya, penaksiran kertas-dan-pensel

merupakan penaksiran autentik jika diberi kebebasan dari segi masa kerana bertepatan

dengan situasi penulisan kreatif dalam kehidupan seharian.

Pengkelasan penaksiran mengikut cara bagaimana data yang dikumpul ditafsir dan dinilai

Cara tafsir dan nilai Jenis

Mengikut kriteria tertentu yang telah ditetapkan lebih awal

Penaksiran rujukan kriteria (criterion-referenced assessment)

Membandingkan prestasi seorang pelajar dengan pelajar lain

Penaksiran rujukan norma (norm-referenced assessment)

Bagi penaksiran rujukan kriteria, contoh kriteria yang ditetapkan yang digunakan di UPSI adalah seperti berikut:

Peratus Markah Penilaian

80-100 Cemerlang (A)

75-79 Cemerlang (A-)

70-74 Kepujian (B+)

65-69 Kepujian (B)

60-64 Kepujian (B-)

55-59 Lulus (C+)

50-54 Lulus (C)

45-49 Lulus (C-)

40-44 Lulus (D+)

35-39 Lulus (D)

<35 Gagal

Setiap pelajar yang mencapai peratus markah tertentu akan dinilai sewajarnya mengikut penilaian

yang telah ditetapkan tanpa mengira prestasi pelajar lain. Penaksiran rujukan kriteria bertujuan

Page 8: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

8

membezakan antara pelajar berpencapaian tinggi dengan rendah dan menyusun mereka dari segi

pencapaian tersebut.

Bagi penaksiran rujukan norma pula, pencapaian atau prestasi setiap pelajar dibuat

perbandingan dengan pelajar lain dalam satu kumpulan besar bagi menetapkan kedudukannya.

Oleh itu, jika seorang pelajar mendapat markah 75% misalnya, jikalau mengikut rujukan kriteria,

pencapaian pelajar ini akan dinilai sebagai cemerlang (A-), tetapi jikalau dibandingkan dengan

pelajar lain yang dinilai bersama, pelajar ini kemungkinan mendapat prestasi cemerlang (A) jikalau

markah 75% ini merupakan markah yang tertinggi dalam kumpulan pelajar yang ditaksir.

Penaksiran jenis ini meletakkan pelajar mengikut lengkung taburan normal. Pelajar bersaing antara

satu sama lain. Peperiksaan peringkat kebangsaan seperti SPM, PMR, dan UPSR biasanya

merupakan penaksiran rujukan norma

Airasian (1991) mengatakan bahawa ramai orang membuat tanggapan tentang perkataan

penaksiran bilik darjah membawa imej pelajar mengambil uijan kertas dan pensil, guru menskor

jawapan dan memberikan gred sepadan dengan prestasi yang ditunjukkan. Penaksiran dimulakan

dengan yang tak formal di bilik darjah dan diakhiri dengan keputusan tentang penggredan dan

ulangan bagi seseorang murid.

Bagi Principles for Fair Students Assessment Practices Education in Canada (1993), penaksiran

adalah satu proses mengumpul dan menginterpretasi maklumat yang boleh digunakan untuk :

a. memaklumkan pelajar atau ibu bapa mereka tentang kemajuan terhadap penguasaan

pengetahuan, kemahiran, sikap dan perlakuan yang sepatutnya telah dipelajari atau

dikuasai

b. memaklumkan kepada mereka yang terlibat dalam membuat keputusan pendidikan (

pengajaran, perancangan kurikulum, dasar dan pembentangan program) tentang pelajar.

Sekolah-sekolah di Malaysia biasanya menggunakan kertas dan pensil untuk menaksir dan menilai

pelajar mereka. Guru akan mengajar dan membuat ujian terhadap apa yang diajar. Guru

membina satu ujian, mentadbirkan ujian berkenaan, menskor ujian, merekod markah yang didapati

ke dalam buku rekod pelajar, memulangkan kertas ujian kepada pelajar untuk semakan dan guru

Page 9: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

9

akan mencampurkan semua skor dari pelbagai mata pelajaran secara keseluruhan. Masalah yang

dihadapi ialah ujian bilik darjah, umumnya, menguji kemahiran aras rendah dalam

domain kognitif. Kebanyakan soalan yang dibina oleh guru kurang menekankan Jadual

Penentuan Ujian (JPU), ini menyebabkan pengujian hanya dibuat pada aras

pengetahuan dan kefahaman sahaja.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penaksiran? _______________________________________________________________

________________________________________________________________________

Apa maksud penilaian?

Penilaian adalah satu pertimbangan atau pembuatan keputusan tentang nilai sesuatu perkara atau

benda. Gay (1985), mengatakan bahawa penilaian merupakan satu proses yang sistematik dalam

pengumpulan dan analisis data untuk menentukan sama ada sesuatu objektif itu telah tercapai

yang membolehkan sesuatu pertimbangan atau keputusan dibuat. Pengukuran melibatkan

pemberian nombor atau peringkat maklumat yang diperlukan dan lebih kepada kuantitatif.

Penilaian boleh menggunakan maklumat kualitatif yang mengandungi pernyataan deskriptif

bertujuan untuk menghuraikan dengan lebih lanjut, jelas atau membuat analisis terhadap sesuatu

isu. Jika sesuatu objektif itu telah tercapai, maka perlu juga diketahui tahap pencapaian objektif

berkenaan. Ini bermakna setakat mana pencapaian objektif itu boleh diterima. Keadaan ini boelh

memudahkan guru untuk membuat keputusan. Dalam proses penilaian komponen pentingnya

ialah untuk membuat keputusan.

Penilaian bertujuan menentukan status sesuatu objek yang dinilai dengan membanding status

berkenaan dengan satu set standard atau kriteria uantuk dibuat keputusan.

Proses yang terlibat dalam membuat penilaian ialah:

a) menentukan jenis data yang harus dikumpulkan b) menentukan jenis responden

Page 10: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

10

c) pengumpulan data

d) analisis data

e) interpretasi data

f) membuat keputusan

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penilaian?. _______________________________________________________________

_______________________________________________________________________

Apa perkaitan antara penaksiran, pengujian, pengukuran, penaksiran dan penilaian? Penaksiran merupakan keseluruhan proses mengumpul data sehinggalah kepada membuat

keputusan berdasarkan data tersebut (contohnya membuat keputusan sama ada pelajar tertentu

layak bergraduat atau tidak). Jika data dikumpul dalam keadaan terkawal, maka proses itu

dipanggil pengujian; jika sebaliknya, dipanggil penaksiran autentik atau alternatif. Selepas data

dikumpul ia perlu dinyatakan dalam bentuk kuantiti, sebaiknya dalam bentuk yang membenarkan

perbandingan antara individu atau kumpulan dilakukan. Maka proses ini dipanggil pengukuran.

Proses seterusnya ialah penilaian di mana perbandingan dengan satu set kriteria atau kumpulan

dilakukan bagi menentukan nilai atau kualiti data tersebut (contohnya menetapkan pencapaian

sebagai cemerlang, sederhana atau gagal). Namun ada pihak yang mengkonsepsi proses

penilaian sebagai sinonim dengan penaksiran iaitu sebagai keseluruhan proses mengumpul data

dan akhirnya menilai dan membuat keputusan.

RUMUSAN Peranan penaksiran dan penilaian menentukan sama ada keperluan kanak-kanak boleh dipenuhi,

dapat diperbaiki kandungan kurikulum serta amalan pengajaran atau menentukan kualiti tadika.

Oleh kerana terdapat tadika yang menjalankan penaksiran dan penilaian secara formal, iaitu

kanak-kanak prasekolah perlu menduduki ujian dan diberi gred markah dan kedudukan selepas

Page 11: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

11

dinilai. Kesan dari kemasukan gred dan markah adalah penglabelan ke atas kanak-kanak secara

langsung. Melabelkan kanak-kanak hasil satu atau dua ujian adalah tidak sesuai. Sewajarnya,

guru harus memahami bagaimana untuk membuat pengujian, pengukuran, penaksiran dan

penilaian ke atas kanak-kanak supaya tidak melakukan kesilapan dalam membuat keputusan

tentang pendidikan.

KATA KUNCI Pengujian Pengukuran Penaksiran Penilaian

PENILAIAN KENDIRI

1. Dengan menggunakan perkataan sendiri, huraikan apa yang dimaksudkan dengan

pengujian psikologi?

2. Senaraikan satu contoh ujian berkumpulan dan satu ujian perseorangan?.

3. Apakah perbezaan utama di antara pengujian dan pengukuran?

4. Apakah perbezaan di antara penaksiran autentik dengan penaksiran konvensional?

5. Huraikan perkaitan di antara pengujian, pengukuran, penaksiran dan penilaian?

RUJUKAN

Linn, R.L & Gronlund, N.E.(2000). Measurement and Assessment in Teaching (8th ed.). New

Jersey: Prentice-Hall Inc.

Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia :

Quantum Books.

Mokhtar Ismail, (1995). Penilaian di Bilik Darjah. Kuala Lumpur: Dewan Bahasa Pustaka

Page 12: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

UNIT 2

PENTAKSIRAN KONVENSIONAL DAN PENGUJIAN

HASIL PEMBELAJARAN

Di akhir unit ini anda akan dapat

1. Mengetahui langkah-langkah perancangan dan pembinaan ujian 2. Membina ujian sumatif berdasarkan tajuk-tajuk dalam sukatan pelajaran masing-

masing 3. Memahami pentingnya menganalisis item untuk menilai kualiti ujian 4. Memahami perbezaan di antara konsep „kesukaran item‟ dan „diskriminasi item‟ dalam

analisis item 5. Memahami perkaitan antara kesukaran item dan diskriminasi item

PENGENALAN

Dalam Unit 1, kita telah membincangkan tentang beberapa konsep asas seperti pengujian, pengukuran, pentaksiran dan penilaian. Memahami perkaitan di antara konsep-konsep tersebut adalah amat berguna kepada guru dalam merancang pengajaran dan pembelajaran. Unit ini akan memberikan tumpuan kepada pengujian untuk mendapatkan maklumat yang penting tentang pembelajaran dan pencapaian pelajar. Memandangkan peserta kursus ini terdiri daripada guru-guru yang telah mengajar dan mempunyai pengetahuan dan pengalaman dalam merancang dan membina ujian, maka Unit ini akan juga menumpukan kepada perbincangan tentang isu-isu yang berkaitan dengan pengujian dan penilaian.

ISI KANDUNGAN

Perancangan dan pembinaan ujian

Sebagai guru kita perlu merancang pengujian yang sesuai dengan topik yang diajar dan kebolehan pelajar-pelajar. Perancangan yang teliti adalah penting bagi mempastikan ujian yang ditadbirkan dapat menghasilkan maklumat yang sah dan boleh dipercayai. Dalam merancang dan membina ujian, beberapa pertimbangan umum berikut boleh dijadikan panduan:

i. Mengetahui kandungan pelajaran dengan baik – guru perlulah menguasai dengan baik kandungan pelajaran yang diajar. Ini penting bagi mempastikan yang guru dapat menentukan apakah skop kandungan pelajaran yang hendak diuji serta tahap kebolehan pelajar dalam memahami topik-topik yang diajar.

ii. Mengetahui dan memahami pelajar yang akan diuji – ujian yang dirancang perlulah mengambil kira latar belakang serta kebolehan pelajar. Ini perlu supaya guru dapat menyesuaikan kandungan ujian, format ujian, item ujian dengan tahap pelajar.

iii. Berkemahiran – menulis item ujian memerlukan kemahiran serta penguasaan bahasa yang baik supaya dapat menghasilkan ujian yang berkualiti.

iv. Kreatif – menulis item ujian juga memerlukan kreativiti bagi menghasilkan item-item yang sesuai dan menarik. Penggunaan pelbagai media, rajah, simbol, gambar serta lain-lain bentuk rangsangan atau stimulus akan menjadikan item-item lebih pelbagai bentuk serta dapat mengukur pelbagai aras kemahiran.

Page 13: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

v. Kesahan dan Kebolehpercayaan Ujian – Sejauhmanakah ujian mengukur apa yang sepatutnya diukur adalah merupakan soalan berkait dengan kesahan ujian. Guru perlu mempastikan skop kandungan yang diuji merupakan pengetahuan dan kemahiran yang telah diajar dan penting untuk diketahui oleh pelajar. Ini melibatkan kesahan kandungan yang merupakan aspek penting dalam penyediaan ujian. Di samping itu, ketekalan skor yang dihasilkan oleh ujian juga perlu diperhatikan bagi mempastikan keboleh percayaan ujian. Konsep kesahan dan kebolehpercayaan akan dibincangkan dengan lebih lanjut dalam Unit 4.

Proses Asas Pembinaan Ujian

Sebagai seorang guru sudah tentu anda mempunyai pengalaman dalam menyediakan ujian bagi mengukur pengetahuan dan kemahiran pelajar anda. Dalam menyediakan ujian sudah tentu anda mengikuti proses dan prosedur yang telah ditetapkan oleh pihak sekolah. Berikut dinyatakan proses asas dalam pembinaan ujian yang standard dan mungkin anda boleh bandingkan dengan amalan yang dilakukan selama ini.

i. Penentuan Tujuan Ujian – sebelum sesuatu ujian dibina, guru perlu terlebih dahulu tentukan tujuan ujian diadakan. Adakah untuk tujuan formatif, sumatif, penempatan atau diagnostik.

ii. Menyediakan Jadual Penentuan Ujian - menentukan bidang cakupan ujian - kandungan yang perlu diuji serta menentukan aras kemahiran atau jenis perlakuan yang diharapkan

iii. Penulisan Item- tentukan perlakuan yang akan diukur dengan merujuk kepada objektif pengajaran. Di samping itu tentukan jenis-jenis item yang sesuai

iv. Menilai semula soalan - dikaji semula oleh rakan-rakan lain atau jawatankuasa untuk memperbaiki aspek-aspek seperti idea yang diuji, kemahiran yang diuji, format item, pokok soalan, penyusunan ayat, struktur pilihan jawapan dan kunci soalan.

v. Analisis Item/Soalan - untuk mengetahui peratus pelajar yang dapat menjawab sesuatu item dengan betul, keberkesanan pengganggu, kuasa diskriminasi soalan dan sejauhmana soalan menepati objektif pembelajaran.

vi. Pemilihan Soalan Yang Bermutu - pemilihan soalan-soalan untuk memenuhi JPU yang ditetapkan - berdasarkan analisis item

vii. Susunan Soalan - Soalan yang terpilih disusun mengikut jenis item untuk mengelakkan kekeliruan, memudahkan pelajar mengekalkan „mental set‟, memudahkan guru memeriksa. Soalan juga disusun mengikut aras kesukaran, aktiviti mental berkembang dari mudah ke kompleks, menimbulkan keyakinan dan motivasi dan jawapan betul disusun mengikut „random pattern‟.

vii. Percetakan Soalan - kualiti percetakan adalah penting dan perkara-perkara seperti kualiti kertas, ruang antara soalan, penggunaan gambar rajah serta dakwat perlu diberi perhatian.

Sekarang cuba anda renungkan adalah langkah-langkah tersebut di atas dijalankan dalam merancang dan membina ujian. Sekairanya ada, langkah-langkah yang manakah yang anda

belum lakukan dan kenapa?

Bagaimana membina ujian yang baik?

1. Aspek keseluruhan ujian

Ujian yang dibina dengan baik memastikan inferens atau kesimpulan yang dibuat tentang pengetahuan dan kemahiran pelajar adalah tepat, adil, dan sah. Selain daripada itu, ujian tersebut adalah stabil dari segi mutu, tahap, dan kesukarannya dari setahun ke setahun. Oleh itu adalah penting membina Jadual

Page 14: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Spesifikasi Ujian yang merupakan satu dokumen yang merakamkan buah fikiran dan perancangan keseluruhan ujian. Langkah-langkah umum pembinaan JSU ini adalah seperti berikut:

• Tentukan skop ujian (topik yang akan dimasukkan) • Anggarkan % masa pembelajaran bagi setiap topik • Tentukan hasil pembelajaran yang ingin ditaksir serta arasnya • Tentukan jenis ujian yang sesuai (objektif dan/atau subjektif) • Tentukan bilangan soalan bagi setiap topik (% masa x jumlah markah) • Tentukan masa yang diperuntukkan untuk menjawab (kebiasaannya, 1–3 min/soalan

bagi ujian aneka pilihan dan 15-30 min/soalan bagi ujian berstruktur/esei)

Jana atau pilih soalan yang sesuai daripada bank soalan berdasarkan Jadual Spesifikasi Ujian. Contoh JSU yang biasa dibina adalah seperti berikut:

Contoh JSU bagi peperiksaan akhir semester kursus Kurikulum dan Pengajaran Fizik (5 soalan struktur dan 5 esei)

BIL Topik Pengetahuan Kefahaman Aplikasi Analisis Sintesis Penilaian Peratus wajaran, %

1 Teras pengetahuan guru

1 1 15

2 Pendekatan Inkuri 1 1 15

3 Penaksiran 1 1 20

4 Miskonsepsi Fizik 1 1 30

5 Kemahiran mikropengajaran

1 15

6 Teknologi & Media 1 10

Peratus wajaran (%) 10 30 20 20 20 100

2. Aspek khusus ujian soalan objektif

Ujian objektif adalah merupakan bentuk ujian yang luas digunakan sama ada di peringkat bilik darjah mahu pun di peringkat peperiksaan kebangsaan. Sebagai seorang guru anda juga pernah menggunakan ujian objektif dalam mengukur pengetahuan dan kemahiran pelajar anda. Sebagai refleksi, cuba anda senaraikan format soalan objektif yang biasa anda gunakan:

i. ___________________________________

ii. ___________________________________

iii. ___________________________________

iv. ___________________________________

Soalan objektif terbahagi kepada dua jenis:

i. Jenis membekalkan jawapan - jawapan pendek ii. Jenis memilih jawapan - betul/salah, padanan dan anika pilihan

Secara umumnya, soalan objektif ini merupakan cara mudah mendapatkan maklumat serta memerlukan masa yang kurang dibandingkan dengan ujian esei. Di samping itu lebih banyak isi kandungan boleh diuji, maka sampelan kandungan yang diuji adalah lebih representatif. Ini secara langsung dapat meningkatkan kebolehpercayaan dan kesahan ujian. Ujian objektif juga lebih mudah diperiksa secara tepat dan objektif. Walaubagaimana pun, ujian objektif memerlukan masa serta kemahiran yang baik untuk membinanya. Oleh itu, di bawah disenaraikan panduan umum dalam menulis soalan objektif.

Page 15: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

• Jangan ada item yang menjadi jawapan kepada item yang lain • Setiap item menaksir satu konsep sahaja • Setiap item bermula dengan pangkal item dan berakhir dengan sebaik-baiknya 5 pilihan

jawapan. Jika ingin mengelakkan pelajar meneka, pilihan kelima diletakkan sebagai “Saya tidak tahu”. Jangan sekali-kali meletakkan jawapan tepat bagi pilihan kelima.

• Pangkal item perlu jelas menyatakan masalah yang hendak diselesaikan. • Format yang lebih baik bagi pangkal item adalah berbentuk soalan ayat penuh. Jikalau

item dalam bentuk ayat tergantung, pilihan jawapan harus merupakan penyambung sehingga terbentuk ayat penuh.

• Elakkan penggunaan ayat negatif, iaitu yang mengandungi perkataan „bukan‟, „tidak‟, „melainkan‟. Jika perlu digunakan juga, hitamkan, gariskan, atau gunakan huruf besar.

• Pangkal item tidak sepatutnya mengandungi kiu dengan menggunakan perkataan penting yang diulang dalam pilihan jawapan.

• Pilihan jawapan mesti ada hanya satu jawapan tepat mengikut pakar. • Pilihan jawapan haruslah semuanya mempunyai struktur ayat yang serupa, termasuk

istilah dan panjang yang hampir serupa juga. • Susun pilihan jawapan mengikut susunan logik di mana sesuai, misalnya apabila

menyenarai nombor. • Pilihan jawapan harus disusun secara rawak bagi keseluruhan item ujian supaya pelajar

tidak mudah meneka.

Sebagai latihan, cuba anda teliti item-item objektif berikut, dan berikan ulasan anda tentang kelemahan yang terdapat pada item-item tersebut.

i. Yang manakah di antara berikut yang merupakan contoh amalan penyelidikan yang beretika?

A. Sebagai pelajar universiti anda tidak dikehendaki terlibat dalam sebarang penyelidikan B. Sekiranya ada di antara keputusan penyelidikan adalah berbeza daripada yang lain, adalah

dibolehkan membuang mana-mana yang berbeza C. Adalah boleh menjalankan penyelidikan yang melibatkan pelajar di bawah umur 18 tanpa

mendapatkan kebenaran sekiranya penyelidikan itu untuk pendidikan D. Adalah beretika untuk melibatkan kanak-kanak dalam penyelidikan tanpa kebenaran ibubapa

mereka

ii. Pentaksiran tradisonal dikatakan tidak bersesuaian dengan paradigma dan teori pembelajaran konstruktivisme yang sedang berkembang sekarang. Pandangan ini lebih menekankan kepada kelemahan pentaksiran tradisional dalam mengukur kemahiran berfikir tahap tinggi pelajar-pelajar. Kelemahan lain yang pada pandangan anda juga merupakan kelemahan pentaksiran tradisional adalah

I. penggunaan prosedur dan proses yang standard bagi pelajar-pelajar yang berbeza kebolehan

II. tidak dapat mengukur kemampuan sebenar pelajar III. kesahan dan kebolehpercayaan yang rendah terutama ujian tara IV. lebih memihak kepada golongan pelajar yang berkebolehan (elit)

A. I & II sahaja B. III & IV sahaja C. I, II & III sahaja D. I, II & IV sahaja

Page 16: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

iii. Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah seperti berikut:

"Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampungan orang asli".

Untuk mengukur kemahiran-kemahiran tersebut, jenis pentaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah

A. Pentaksiran persembahan terbuka B. Pentaksiran persembahan terhad C. Ujian Subjektif D. Ujian Objektif

3. Aspek khusus ujian soalan berstruktur dan esei Soalan berstruktur dan esei juga merupakan bentuk ujian yang biasa dijalankan di sekolah. Berbanding dengan ujian objektif, soalan esei dikatakan lebih baik untuk mengukur aras kemahiran yang kompleks. Ini memandangkan ujian esei memberi peluang kepada pelajar untuk mengoraganisasi, menyepadu dan mensintesis pengetahuan serta menggunakan maklumat yang dipelajari untuk menyelesaikan masalah dalam situasi yang sebenar. Secara umumnya, soalan berstruktur dan esei ini mempunyai dua jenis:

Jenis soalan respon terhad Soalan bentuk ini meletakkan had pada jawapan yang perlu diberikan oleh calon. Sempadan kandungan mata pelajaran yang perlu dipertimbangkan biasanya ditakrifkan secara sempit oleh masalah, dan bentuk jawapan yang khusus juga lazimnya ditunjukkan (oleh kata tugasan seperti; senaraikan, takrifkan, dan beri alasan). Dalam sesetengah kes, respon dihadkan oleh penggunaan arahan khusus atau maklumat pengenalan. Soalan jenis ini adalah paling sesuai pada peringkat aras pengetahuan, pemahaman, aplikasi dan analisis Contoh soalan: Beri sebab-sebab mengapa masalah penyalahgunaan dadah masih lagi merupakan masalah yang utama di kalangan belia-belia di negara ini. Jawapan anda mestilah tidak melebihi 100 patah perkataan

Jenis soalan respon lanjutan Soalan jenis ini memberi kebebasan kepada calon untuk menjawab. Had pada bahan yang boleh dimasukkan dalam jawapan dan pada bentuk respon adalah minimum walaupun dalam sesetengah kes, had yang munasabah boleh dikenakan seperti had masa dan had halaman. Dalam soalan jenis ini, calon hendaklah diberi kebebasan untuk menunjukkan kemahiran kepada aras sintesis dan penilaian. Soalan ini dapat mengukur penyepaduan idea yang kreatif, penilaian bahan secara keseluruhan, dan pendekatan yang luas kepada penyelesaian masalah. Contoh soalan: Kebelakangan ini keamanan dunia sering terancam dengan pelbagai tragedi dan peperangan. Pertubuhan Bangsa-Bangsa Bersatu tidak dapat menjalankan tugas menjaga keamanan dunia dengan berkesan. Huraikan mengapakah badan ini tidak dapat

Page 17: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

menjalankan tugas dengan berkesan dan cadangkan langkah-langkah yang boleh diambil oleh badan ini untuk mengekalkan keamanan dunia.

Dalam membina soalan berstruktur dan esei, secara keseluruhannya perkara-perkara berikut boleh dijadikan panduan:

• Pastikan sama ada rangsangan soalan (gambar rajah, gambar, perangkaan dan lain-

lain) perlu bagi soalan yang akan digubal serta relevan kepada soalan. • Gubal soalan dengan menggabungkan tugasan soalan, tajuk dan rangsangan (jika

ada) dengan memberikan pertimbangan kepada perkara berikut:

o Soalan hendaklah seberapa ringkas yang mungkin o Soalan hendaklah tepat dan jelas o Soalan hendaklah berkemampuan membezakan pelajar baik, sederhana

dan lemah (Kebiasaaannya aras kemahiran menentukan kedudukan soalan) o Konsep yang disoalkan hendaklah sesuai dengan peringkat pemelajaran

yang telah diajarkan. o Tidak mengandungi unsur emosi, keperibadian, kepercayaan, kebudayaan,

agama dan lain-lain perkara sensitif. o Sediakan rangka model jawapan kepada soalan supaya mudah untuk

menyemak) o Sediakan skema pemarkahan beserta dengan pecahan dan wajaran

markah. o Tentukan soalan-soalan mengikut standard (dari segi aras kesukaran, masa

untuk menjawab, liputan jawapan dan kepentingan tajuk) o Dapatkan pandangan kedua – semakan

Sebagai kesimpulan, berdasarkan pemahaman dan pengalaman anda, cuba anda senaraikan TIGA kekuatan dan kelemahan kedua-dua bentuk ujian objektif dan ujian esei:

Kekuatan:

I. _____________________________________________________________

II. _____________________________________________________________

III. _____________________________________________________________

Kelemahan:

i. _____________________________________________________________

ii. _____________________________________________________________

iii. _____________________________________________________________

Analisis item

Kualiti sesuatu ujian bergantung kepada kualiti tiap-tiap item dalam ujian tersebut. Kualiti item-item memberi kesan kepada kesahan, kebolehpercayaan dan kegunaan sesuatu ujian. Pada umumnya, analisis item merupakan teknik untuk menilai kekuatan dan kelemahan ujian, memberikan maklumbalas yang berguna kepada guru, membantu guru menulis item ujian yang baik. Mengikut Mehren (1975), analisis item adalah proses meneliti tindakbalas calon terhadap tiap-tiap item untuk membuat

Page 18: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

pertimbangan tentang kualiti item-item tersebut. Penilaian ke atas tiap-tiap item dengan mengaitkannya dengan kriteria luaran atau hubungannya dengan lain-lain item dalam ujian. Analisis ini menilai kualiti item dan juga ujian. Analisis juga boleh digunakan untuk meneliti semula setiap item dan meningkatkan keberkesanan setiap item dan juga ujian Tujuan analisis item

Pada umumnya analisis item bertujuan:

untuk mengenalpasti item yang baik dan item yang tidak baik untuk mengenalpasti pengetahuan atau kemahiran yang pelajar telah dan belum menguasai

Kesukaran Item Kesukaran item merupakan peratus pelajar yang mengambil ujian yang menjawab dengan betul. Lebih besar peratus yang mendapat jawapan betul, lebih mudah item tersebut. Untuk mendapatkan kesukaran item, bahagikan bilangan calon yang menjawab betul dengan umlah calon yang menjawab item tersebut. Kesukaran item juga dikenali sebagai nilai p. Oleh itu, sesuatu item yang dijawab dengan betul oleh 85% calon akan mempunyai kesukaran item atau nilai p .85.

Nilai p pada asasnya adalah merupakan ukuran tingkahlaku. Ini kerana kesukaran item lebih didefinisikan dari segi kekerapan relatif dengan calon-calon lain yang memilih jawapan betul daripada didefinisikan dari segi ciri-ciri intrinsik item tersebut. Dengan ertikata lain, kesukaran item atau nilai p memberi kesan ke atas kepelbagaian/sebaran skor serta ketepatan skor ujian membezakan di antara kumpulan yang berbeza. Contohnya, apabila tidak ada calon yang memilih jawapan yang betul, sudah tentu tidak ada perbezaan individu dari skor ke atas item tersebut. Keadaan yang sama juga benar sekiranya semua calon memilih jawapan yang betul bagi item tersebut. Dengan ertikata lain, kesukaran item atau nilai p .0 (tidak seorang yang memilih jawapan betul) atau nilai p 1.0 (semua calon memilih jawapan betul) tidak memberi apa-apa sumbangan dalam mengukur perbezaan individu, oleh itu ianya tidak berguna.

Untuk mendapatkan indeks kesukaran item, cara yang mudah biasanya diperolehi melalui formula berikut:

NT + NR

__________

N

NT = Bilangan calon Kump. Tinggi yang menjawab betul

NR = Bilangan calon Kump. Rendah yang menjawab betul

N = Jumlah semua calon yang menjawab item berkenaan

Page 19: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Garis panduan umum tentang indeks kesukaran item

Nilai p Aras kesukaran

0.7 ke atas mudah

0.3 hingga 0.69 sederhana

0.29 ke bawah sukar

Diskriminasi Item Secara umumnya, sesuatu item yang baik dapat mendiskriminasikan di antara pelajar yang mendapat pencapaian tinggi dalam ujian dengan pelajar berpencapaian rendah dalam ujian tersebut. Dengan ertikata lain, pelajar yang berpencapaian tinggi dalam ujian akan memilih jawapan yang betul dalam sesuatu item dan yang berpencapaian rendah akan memilih pengganggu (jawapan salah).

Indeks diskriminasi item, D

Indeks diskriminasi item diperolehi dengan menolak bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian tinggi dengan bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian rendah, dibahagi dengan bilangan calon bagi kedua-dua kumpulan tersebut. Ini boleh digambarkan dalam formula berikut:

NT - NR

D = ___________

N/2

Di mana,

NT = bilangan calon dari kumpulan tinggi yang memilih jawapan betul

NR = bilangan calon dari kumpulan rendah yang memilih jawapan betul

N = jumlah calon

Contoh:

Kumpulan Rendah (27%) Kumpulan Tinggi (27%)

Omit 0 0

A 2 0

B 10 0

C 2 0

D 11 26

E 11 10

JUMLAH 36 36

*D adalah jawapan betul

Page 20: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Indeks diskriminasi = 26 –11

----------

36

= 0.42

Lebih tinggi indeks diskriminasi lebih baik item tersebut dalam mendiskriminasi di antara pelajar yang baik dan pelajar yang lemah. Di mana pelajar yang baik sepatutnya dapat menjawab jawapan betul lebih daripada pelajar lemah bagi item tersebut. Bagi item yang di mana semua pelajar dapat memilih jawapan betul (nilai D=.0) atau item di mana semua pelajar tidak dapat memilih jawapan yang betul (nilai D=1.0) adalah merupakan item-item yang tidak dapat memberi apa-apa maklumat yang berguna tentang pencapaian pelajar. Bagi item yang nilai D adalah negatif, ini menunjukkan yang item tersebut mempunyai kesilapan-kesilapan tertentu. Indeks diskriminasi negatif mungkin berlaku apabila sesuatu item itu merangkumi bahan-bahan yang kompleks dan ditulis dengan cara dimana memerlukan kefahaman yang tinggi. Pelajar yang lemah mungkin meneka dan mendapat jawapan betul. Pelajar yang baik pula mungkin mempunyai pelbagai interpretasi atau penyelesaian masalah untuk menjawabnya dan akhirnya mungkin memilih jawapan yang salah.

Garispanduan Umum Indeks Diskriminasi

Nilai D Penjelasan Cadangan

0.4 atau lebih Diskriminasi positif yang tinggi Item disimpan dan boleh digunakan

0.2 hingga 0.39 Diskriminasi positif yang

sederhana

Kaji dan baiki

0.10 hingga 0.19 Diskriminasi positif rendah Item ditulis semula

0 atau negatif Tiada kuasa dismriminasi Item dibuang

Sumber: Ebel & Frisbie, 1986

Langkah-langkah Analisis Item Ujian Bilik Darjah

i. Kertas jawapan diperiksa dan skor disusun mengikut skor rendah kepada yang tinggi ii. Asingkan skor kepada dua kumpulan iaitu kumpulan berpencapaian tinggi dalam ujian (T) dan

kumpulan berpencapaian rendah dalam ujian (R). Jumlah kedua-dua kumpulan memadai sebanyak 27% atau 25% sahaja daripada jumlah kesemua calon dalam kumpulan tersebut, sekiranya calon ramai.

iii. Bagi tiap-tiap item, tentukan bilangan yang tidak memilih sebarang jawapan (omit),bilangan calon yang memilih pilihan jawapan A,B,C,D,E. Sediakan jadual yang sesuai seperti berikut:

Page 21: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Kumpulan Rendah (27%) Kumpulan Tinggi (27%)

Omit 0 0

A 2 0

B 10 0

C 2 0

*D 11 26

E 11 10

JUMLAH 36 36

*D adalah jawapan betul

iv. Kira indeks kesukaran item (nilai p) dan indeks diskriminasi item (nilai D) mengikut formula yang diberikan. Kemudian sediakan satu penjelasan analisis bagi setiap item.

Pengganggu (Distractors)

Menganalisis pengganggu (pilihan jawapan salah) adalah berguna dalam menentukan kegunaan relatif pengganggu dalam setiap item. Indeks diskriminasi item perlu diperolehi bagi setiap item untuk menentukan keberkesanan pengganggu. Sepatutnya nilai diskriminasi bagi jawapan betul adalah positif dan nilai diskriminasi bagi pengganggu sepatutnya rendah atau negatif. Pengganggu perlu diteliti dengan betul apabila item menunjukkan nilai diskriminasi positif yang besar.

Page 22: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Di bawah adalah sampel analisis item yang menunjukkan ringkasan jadual untuk semua item dalam satu ujian objektif anika pilihan. Sila teliti kesukaran item (nilai p), indeks diskriminasi (nilai D) dan pengganggu (pilihan B – E). Berdasarkan jadual analisis item di bawah, sila beri

pandangan anda terhadap soalan-soalan berikutnya.

Analisis Item (sampel 10 item) – jawapan betul adalah “A”

N = 932 Min = 69.4 Sisihan Piawai = 10.2 Alfa = .84

ITEM p D OMIT A B C D E

1. 0.72 0.34 1 667 187 37 30 10

2. 0.90 0.21 1 840 1 76 9 5

3. 0.60 0.39 0 561 233 46 88 4

4. 0.99 -0.06 0 923 3 3 3 0

5. 0.94 0.14 0 876 0 12 24 20

6. 0.77 -0.01 0 716 16 25 35 140

7. 0.47 0.31 3 432 107 68 165 157

8. 0.12 0.08 8 114 218 264 153 175

9. 0.08 0.04 0 75 64 120 67 606

10. 0.35 0.42 0 330 98 74 183 247

.

.

40.

Item atau item-item yang manakah yang boleh dibuang? Mengapa?

Pengganggu-pengganggu yang manakah yang perlu disemak semula? Mengapa?

Item-item yang manakah yang berfungsi dengan baik?

RUMUSAN

Membina ujian yang sempurna adalah sesuatu yang mustahil. Walaupun garispanduan membina item yang betul dipatuhi, namun banyak faktor-faktor yang mempengaruhi persepsi pelajar tentang item-item ujian yang mereka cuba jawab. Namun, dengan melakukan item analisis dan melihat kesukaran dan diskriminasi item akan membantu penggubal soalan menentukan apakah kesilapan bagi tiap-tiap item

Page 23: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

ujian. Analisis item dan ujian menyediakan data empirikal tentang bagaimana individu item dan seluruh ujian berfungsi dalam situasi ujian sebenar.

KATA KUNCI

Perancangan ujian

Pembinaan ujian

Jadual Spesifikasi Ujian

Item objektif

Item esei

Analisis item

PENILAIAN KENDIRI

1. Apakah pertimbangan yang perlu diberi perhatian dalam merancang dan membina ujian?

2. Mengapakah perlunya disediakan Jadual Spesifikasi Ujian dalam merancang dan membina

ujian?

3. Adakah dengan menambah bilangan item dalam ujian akan meningkatkan kesahan dan

keboleh percayaan ujian? Mengapa?

4. Aras kesukaran dan indeks diskriminasi diperolehi dengan mengambil kira skor semua calon

yang memberi respons kepada setiap item dalam ujian. Adakah kemungkinan bahawa aras

kesukaran dan indeks diskriminasi akan berbeza mengikut kumpulan yang mengambil ujian

yang sama?

RUJUKAN

Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New

York: Mc-Graw Hill.

Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and

Bacon

Page 24: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

UNIT 3

PENAKSIRAN PRESTASI DAN AUTENTIK

HASIL PEMBELAJARAN Di akhir unit ini anda akan dapat 1. Menerangkan bagaimana penaksiran prestasi berbeza dengan pentaksiran tradisional 2. Mengenalpasti bentuk-bentuk penaksiran prestasi 3. Mengenalpasti kekuatan dan kekurangan penaksiran prestasi 4. Menerangkan tatacara umum menjalankan penaksiran prestasi 5. Menyediakan perancangan pemerhatian, merekod dan penskoran tugasan penaksiran

prestasi 6. Menggunakan portfolio untuk mengumpul, mempersembahkan/memaparkan dan

menilai kerja-kerja pelajar

PENGENALAN Penaksiran prestasi merupakan satu bentuk penaksiran yang berdasarkan kepada pemerhatian dan penilaian terhadap sesuatu proses atau produk hasil daripada pelaksanaan sesuatu tugasan (Stiggin, 1997, p.175). Oleh itu penaksiran prestasi meliputi kaedah pengujian yang begitu luas yang memerlukan pelajar menunjukkan kecekapannya atau pengetahuannya dengan memberikan jawapan yang tepat atau satu hasil produk yang baik. Menurut Linn dan Gronlund (1995, p.238), penaksiran prestasi kadang-kadang disebut juga sebagai penaksiran authentik. Penaksiran authentik lebih kepada penggunaan/amali terhadap sesuatu tugasan seperti yang dilakukan di dalam keadaan sebenarnya. Pada umumnya, ujian yang authentik harus mempunyai empat ciri:

a. Soalan yang dibina mestilah benar-benar mewakili prestasi yang berlaku dalam keadaan sebenar

b. Penekanan yang khusus hendaklah diberikan kepada pengajaran dan pembelajaran tentang kriteria yang harus digunakan

c. Penaksiran kendiri memainkan lebih peranan berbanding dengan ujian konvensional

d. Pelajar dikehendaki membentangkan dan mempertahankan kerja-kerja secara umum dan secara lisan untuk menentukan bahawa penguasaannya adalah benar.

Penaksiran prestasi adalah satu bentuk penaksiran yang memerlukan guru membuat penilaian terhadap pengetahuan, kemahiran dan ciri-ciri afektif pelajar. Di sini pelajar dikehendaki melakukan satu tugasan dan prestasi mereka melakukan tugasan itu akan ditaksir. Ia melibatkan

Page 25: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

penaksiran pelajar dalam konteks tugasan di bilik darjah di mana pelajar dikehendaki melakukan sesuatu tugasan yang kompleks tetapi bererti, berdasarkan pengetahuan awal, pembelajaran semasa dan kemahiran yang relevan untuk menyelesaikan masalah yang sebenar atau authentik. Guru akan menentukan prestasi pelajar berdasarkan kepada kriteria yang telah ditetapkan dan dipersetujui bersama.

Dalam pengajaran anda, sila senaraikan 3 contoh pentaksiran prestasi yang telah anda jalankan.

1. _____________________________________________________ 2.______________________________________________________ 3.______________________________________________________

ISI KANDUNGAN

Mengapa Penaksiran Prestasi? Terdapat dua trend pendidikan yang menjadikan penaksiran prestasi diberi penekanan semula dalam aspek penilaian pelajar. Pertama, berkaitan dengan perubahan penekanan daripada ujian rujukan norma kepada ujian rujukan kriteria dalam penilaian pelajar dan penilaian bilik darjah yang memerlukan pengukuran yang lebih langsung tentang prestasi pelajar-pelajar. Jadi, sekiranya kita hendak menjelaskan kecekapan pelajar dalam melakukan sesuatu aktiviti atau kemahiran, maka penaksiran prestasi biasanya digunakan. Kedua, teori pembelajaran moden menekankan kepada perlunya memberi tumpuan kepada hasil pembelajaran yang lebih kompleks (misalnya, kemahiran menaakul dan berfikir), menggalakkan pelajar membuat projek yang komprehensif berasaskan kepada masalah sebenar, dan menggalakan pelajar melakukan aktiviti-aktiviti yang membolehkan mereka membina makna sendiri. Dengan ertikata lain, teori pembelajaran moden menyarankan penggunaan penaksiran prestasi terbuka sebagai asas kepada peningkatan pembelajaran. Penaksiran prestasi menyediakan cara yang sistematik untuk menilai kemahiran berfikir dan menaakul serta hasilnya yang tidak dapat diukur oleh ujian objektif dan esei yang biasa. Walaupun ujian dapat menyediakan data yang menunjukkan pelajar tahu melakukan sesuatu dalam keadaan-keadaan tertentu, penaksiran prestasi adalah perlu untuk menilai kemahiran-kemahiran sebenar yang sedang dilakukan. Kemahiran-kemahiran ini adalah penting dalam banyak mata pelajaran yang diajar di sekolah. Contohnya, dalam mata pelajaran Sains, mementingkan kemahiran menyelesaikan masalah dan kemahiran-kemahiran makmal; matapelajaran Matematik menumpukan kepada pelbagai jenis kemahiran penyelesaian masalah praktikal; mata pelajaran Bahasa pula menekankan kepada kemahiran berkomunikasi; matapelajaran kajian sosial mementingkan kemahiran melukis dan membina graf, peta dan sebagainya.

Apakah Ciri-ciri Penaksiran Prestasi? Penaksiran prestasi ini mempunyai beberapa ciri seperti berikut:

tugasan-tugasan yang berkait rapat dengan dunia sebenar

Page 26: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

tugasan-tugasan yang lebih kompleks dan kurang berstruktur yang menggalakkan keaslian dan kemahiran berfikir serta mempunyai pelbagai cara penyelesaiannya

masa yang lebih diperlukan untuk menilai – ini berkaitan dengan kesukaran mereka bentuk tugasan, bentuk tugasan yang komprehensif dan masa yang lebih diperlukan untuk menilai hasil-hasil tugasan

lebih banyak menggunakan judgment dalam memeriksa tugasan pelajar – ini disebabkan tugasan yang kompleks, keaslian tugasan yang dihasilkan, dan dalam kes-kes tertentu terdapat pelbagai kemungkinan cara penyelesaian yang dikemukakan

Dan, apakah pula bentuk-bentuk tugasan yang sering digunakan dalam penaksiran prestasi? Biasanya bentuk-bentuk tugasan melibatkan: i. Menyelesaikan masalah yang realistik (contoh: bagaimana mencegah penyalahgunaan

dadah di Malaysia) ii. Kemahiran-kemahiran lisan dan psikomotor tanpa produk (contoh: memberi ucapan,

bertutur bahasa asing, menggunakan mikroskop, dan membaiki enjin) iii. Kemahiran penulisan dan psikomotor dengan produk yang dihasilkan (contoh: menulis

laporan kajian, menulis cerita pendek, membina tempat letak buku)

Bagaimana pemahaman anda setakat ini tentang penaksiran prestasi? Sila tuliskan satu ayat yang dapat menggambarkan pentaksiran prestasi sebagaimana yang anda faham.

____________________________________________________________________________________________________________________________

Kategori Penaksiran Prestasi Jenis tugasan penaksiran prestasi boleh dibahagikan kepada dua kategori berdasarkan kepada objektif pengajaran yang dicakupinya. Bagi tugasan yang terhad dan mencakupi objektif pengajaran yang spesifik, penilaian ini dipanggil sebagai penaksiran prestasi terhad. Namun begitu terdapat juga tugasan yang komprehensif yang mencakupi beberapa objektif pengajaran, penilaian ini dipanggil penaksiran prestasi terbuka (extended).

Penaksiran Prestasi Terhad Penaksiran prestasi terhad adalah lebih berstruktur dan terhad skopnya. Dengan menghadkan skop tugasan, memudahkan untuk dikaitkan dengan objektif-objektif tertentu, mentadbirkannya dan menilainya. Contohnya:

Tulis satu muka surat laporan tentang lawatan ke muzium

Bina graf daripada data-data yang diberi

Page 27: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Tunjukkan bagaimana menyediakan alat makmal Penaksiran Prestasi Terbuka Penaksiran prestasi terbuka pula mempunyai skop tugasan yang lebih komprehensif dan tidak begitu berstruktur. Ini bagi membolehkan pelajar mempersembahkan kebolehannya dalam membuat tugasan atau menyelesaikan masalah yang berkait rapat dengan dunia sebenar. Dengan kata lain, kita boleh mendapatkan maklumat tentang kebolehan pelajar dalam mengenalpasti punca sebenar sesuatu masalah, mengumpul dan mengatur maklumat untuk menyelesaikan masalah dan menyediakan kesimpulan yang asli dan mantap. Dalam aspek kemahiran pula, penaksiran prestasi terbuka ini membolehkan kita menentukan bagaimana pelajar boleh mensepadukan beberapa kemahiran-kemahiran spesifik bagi melakukan pergerakan yang kompleks ataupun menghasilkan produk yang lebih baik dan canggih. Sesetengah projek pentaksiran prestasi terbuka menggabungkan ketiga-tiga jenis kemahiran: menyelesaikan masalah, komunikasi dan psikomotor bagi menghasilkan sesuatu produk. Antara contoh-contoh tugasan adalah seperti berikut:

Reka bentuk dan jalankan eksperimen ke atas topik-topik yang disediakan dan persembahkan serta pertahankan dapatan kajian

Baca sebuah novel dan tulis kritik ke atas novel tersebut

Reka bentuk dan bina tempat letak buku dan tulis satu penilaian sama ada ia menepati kriteria-kriteria yang diberi

Projek penaksiran prestasi terbuka akan memberikan pelajar lebih kebebasan dalam memilih projek, bagaimana menjalankannya, membuat penilaian kendiri dan mempertahankan kualitinya. Perbincangan hasil kajian pelajar dengan guru biasanya menumpukan kepada kualiti projek serta penilaian kendiri yang dibuat oleh pelajar.

Langkah-langkah Melaksanakan Penaksiran Prestasi Sekarang kita akan cuba melihat secara lebih terperinci bagaimana melaksanakan penaksiran prestasi. Secara umumnya terdapat lima langkah untuk melaksanakan penaksiran prestasi. Langkah-langkah tersebut adalah: Langkah I: Menetapkan hasil prestasi Langkah II: Memilih fokus penilaian (prosedur, produk atau kedua-duanya) Langkah III: Memilih darjah realisme yang sesuai Langkah IV: Memilih situasi tugasan Langkah V: Memilih metod pemerhatian, merekod dan memeriksa Langkah I: Menetapkan hasil prestasi atau hasil pembelajaran Hasil prestasi yang hendak diukur perlu dikenal pasti dan didefinisikan. Hasil penaksiran prestasi terhad biasanya menggunakan perkataan-perkataan seperti kenalpasti, membina, menunjukkan dan lain-lain. Spesifikasi hasil prestasi termasuklah analisis tugasan bagi mengenalpasti faktor-faktor spesifik yang kritikal bagi prestasi yang hendak diukur. Pensampelan tugasan-tugasan yang sesuai adalah penting bagi menentukan pemerhatian dan

Page 28: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

penilaian yang lebih tepat. Berikut adalah contoh-contoh bagi satu set tugasan-tugasan untuk penaksiran prestasi terhad:

i. Kemahiran Dalam Membuat Laporan Secara Lisan: 1. Berdiri dengan cara yang natural 2. Mengekalkan eye contact dengan baik 3. Menggunakan ekspresi muka yang sesuai 4. Menggunakan gerakbadan secara berkesan 5. Bercakap dengan jelas dan nada yang terang 6. Bercakap pada kadar kelajuan yang sesuai 7. Mempersembahkan idea-idea dengan teratur 8. Menggunakan bahasa yang sesuai 9. Mengekalkan minat kumpulan

ii. Membaiki Injin Rosak

1. Kenalpasti tahap kerosakan 2. Kenalpasti sistem yang menyebabkan kerosakan 3. Pilih ujian-ujian yang akan dilakukan 4. Menjalankan ujian-ujian mengikut sekuen yang betul 5. Mengenalpasti komponen-komponen yang tidak berfungsi 6. Ganti atau baiki komponen 7. Ubah dan ganti alatganti dengan sekuen yang sesuai 8. Menggunakan alat-alat yang sesuai dengan cara yang betul 9. Mematuhi peraturan-peraturan keselamatan sepanjang kerja-kerja

membaiki Dalam keadaan-keadaan tertentu, senarai tugasan-tugasan tidak perlu mengikut aturan-aturan tertentu (seperti dalam contoh pertama) dalam keadaan yang lain pula, terdapat langkah-langkah yang disusun mengikut sekuen supaya memudahkan dibuat pemerhatian dan penilaian (seperti dalam contoh kedua)

Projek berbentuk penaksiran prestasi terbuka biasanya melibatkan pelbagai objektif pengajaran dan hasil pembelajaran. Bagi satu projek penyelidikan, hasil pembelajaran antaranya adalah seperti berikut:

Memilih tugasan-tugasan kajian yang sesuai

Menggunakan perpustakaan dengan berkesan

Mengesan, menganalisis dan mensepadukan maklumat-maklumat yang relevan

Mereka bentuk dan menjalankan eksperimen

Menulis laporan kajian dengan tepat

Menyatakan kesimpulan yang sah

Menulis kritik tentang tatacara kajian dan dapatan kajian

Mempersembahkan dan mempertahankan dapatan kajian dalam kelas

Hasil-hasil pembelajaran di atas perlu didefinisikan lagi dengan lebih spesifik. Menyatakan objektif umum dahulu dan kemudian menyatakannya dengan lebih spesifik adalah merupakan

Page 29: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

tatacara yang berkesan. Dalam mendefinisikan setiap hasil pembelajaran utama, mungkin perlu dibahagikan kepada dua hasil pembelajaran (Misalnya: merekabentuk eksperimen, menjalankan eksperimen). Dalam kes-kes yang lain, mungkin digabungkan, seperti „nyatakan kesimpulan yang sah‟ boleh digabungkan sebagai sebahagian daripada „Menulis laporan kajian dengan tepat‟. Yang pentingnya, senarai hasil pembelajaran utama perlu menyatakan deskripsi tentang apa yang pelajar boleh buat untuk menunjukkan pencapaian hasil pembelajaran. Langkah II: Memilih Fokus Penaksiran Penaksiran prestasi boleh menumpukan kepada prosedur, produk atau gabungan kedua-duanya. Menilai Prosedur Bagi jenis-jenis tugasan yang tidak menghasilkan produk, memerlukan tugasan tersebut dinilai semasa ianya dilakukan. Dalam banyak keadaan, kedua-dua prosedur dan produk merupakan aspek penting dalam sesuatu tugasan. Selalunya prosedur ditekankan pada tahap awal pembelajaran, dan kemudiannya produk, iaitu selepas prosedur telah dikuasai. Misalnya, dalam membaiki set television, memerlukan prosedur yang sistematik diikuti, sebelum dapat menghasilkan set television yang telah dibaiki. Perkara yang sama juga dijalankan dalam tugasan memasak, kerja pertukangan, melukis dan lain-lain lagi. Penilaian prosedur ini juga boleh digunakan di peringkat akhir pengajaran, dengan tujuan untuk mengesan kesilapan-kesilapan yang berlaku dalam prosedur yang boleh memberi kesan kepada kualiti produk. Secara amnya, fokus penaksiran prestasi ke atas prosedur bila: i. Tiada produk atau penilaian produk tidak dapat dijalankan – sukar didapati atau pun

terlalu mahal ii. Prosedur yang digunakan adalah teratur dan boleh dilihat dengan jelas iii. Prosedur yang betul adalah penting untuk menentukan kejayaan dalam melakukan

sesuatu iv. Analisis ke atas langkah-langkah dalam prosedur boleh memberi panduan dalam

meningkatkan produk Menilai Produk

Penaksiran prestasi perlu memberi fokus kepada produk apabila:

i. Prosedur-prosedur yang berbeza boleh menghasilkan produk yang sama mutunya ii. Prosedur tidak dapat dilihat dengan jelas (misalnya: kerja rumah, penaakulan dalam

menyelesaikan masalah matematik) iii. Langkah-langkah dalam prosedur telah dikuasai iv. Produk mempunyai kualiti yang boleh di kenal dan dinilai dengan jelas Langkah III: Memilih Darjah Realisme Yang Sesuai Autentik adalah merupakan satu darjah. Dalam konteks penaksiran prestasi, darjah kehampiran kepada realiti dunia (apa yang sebenarnya berlaku) adalah merupakan tumpuan

Page 30: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

utama perkara-perkara yang hendak diukur. Soalnya, setakat manakah realisme yang perlu atau mampu diukur dalam penaksiran prestasi? Lebih hampir kepada realiti adalah lebih baik.

Dalam konteks pengajaran dan pembelajaran, penggunaan kaedah simulasi boleh menunjukkan masalah yang dikemukakan itu mempunyai darjah realisme yang rendah atau tinggi. Misalnya dalam Matematik, penggunaan kemahiran matematik dalam memahami jumlah wang, boleh dilakukan dalam bentuk cerita (rendah darjah realisme) atau membeli barang-barang dalam situasi gerai (tinggi darjah realisme).

Darjah realisme yang akan dipilih bagi satu-satu situasi bergantung kepada beberapa faktor. Pertamanya, perlu dipertimbangkan objektif pengajaran. Sama ada objektif pengajaran yang hendak dicapai itu merupakan objektif yang berbentuk memahami sesuatu fakta baru atau pun untuk menguasai sesuatu kemahiran. Keduanya, sekuen pengajaran mungkin mengikuti aturan yang memerlukan pengukuran dalam bentuk pensil dan kertas dahulu sebelum pengukuran berbentuk amali (hands-on). Ketiganya, beberapa kekangan seperti masa, kos, kemudahan peralatan, kesukaran untuk mentadbir dan memberi markah, mungkin akan mengurangkan darjah realisme yang akan diperolehi. Keempat, tugasan yang hendak dilakukan mungkin boleh mengurangkan darjah realisme dalam situasi ujian. Misalnya, dalam menilai kemahiran-kemahiran pertolongan cemas, adalah sukar untuk menggunakan pesakit sebenar yang mengalami kemalangan untuk menjadikan situasi penilaian itu lebih realistik.

Langkah IV: Memilih Situasi Tugasan Penaksiran prestasi boleh diklasifikasikan mengikut jenis situasi atau latar (setting) yang digunakan. Sistem klasifikasi berikut berdasarkan darjah realisme yang terdapat dalam satu-satu situasi:

i. Tugasan Kertas dan Pensil

Tugasan kertas dan pensil berbeza daripada ujian kertas dan pensil tradisional yang menekankan kepada aplikasi pengetahuan atau kemahiran dalam situasi yang telah ditetapkan (simulated setting). Aplikasi kertas dan pensil ini mungkin menghasilkan hasil pembelajaran yang diharapkan atau ia mungkin boleh dijadikan sebagai langkah ke arah tugasan yang melibatkan darjah realism yang lebih tinggi (misalnya, penggunaan alat yang sebenar). Dalam beberapa keadaan, tugasan kertas dan pensil boleh menyediakan produk yang mempunyai signifikan dari segi pendidikan. Kursus dalam pembinaan ujian, misalnya memerlukan pelajar melaksanakan aktiviti-aktiviti seperti berikut:

Bina satu set Jadual Penentuan Ujian bagi satu ujian pengajaran Bina item-item ujian yang sesuai dengan Jadual Penentuan Ujian Bina satu senarai semak untuk menilai ujian pencapaian

Perkataan „bina‟ selalu digunakan dalam ujian prestasi kertas dan pensil. Misalnya, pelajar mungkin disuruh membina peta cuaca, graf, pelan lantai, mereka bentuk pakaian, puisi, cerita pendek atau rancang satu percubaan. Dalam kes ini, produk kertas dan pensil adalah hasil daripada kedua-dua pengetahuan dan kemahiran.

Dalam lain-lain kes, tugasan kertas dan pensil mungkin merupakan langkah pertama kearah tugasan hands-on. Misalnya, sebelum menggunakan alat ukuran tertentu,

Page 31: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

seperti mikrometer, mungkin sesuai sekiranya pelajar mempelajari pelbagai ukuran daripada gambar-gambar. Walaupun kebolehan membaca skala tidak mencukupi untuk pengukuran yang tepat, tetapi ia adalah sesuatu yang perlu. Dalam keadaan yang lain pula, sekiranya prestasi tersebut agak kompleks dan peralatannya mahal, menjalankan tugasan dalam situasi kertas dan pensil mungkin boleh mengelakkan kemalangan ataupun kerosakan kepada peralatan tersebut.

ii Ujian Identifikasi

Ujian identifikasi terdapat dalam pelbagai situasi dan pelbagai darjah realisme. Dalam setengah keadaan, pelajar mungkin diminta untuk mengenalpasti sejenis alat dan jelaskan fungsinya. Dalam keadaan yang lebih kompleks, pelajar akan diberi tugasan seperti mengenalpasti litar pintas dan meminta pelajar mengenal pasti alat dan tatacara yang sesuai untuk membaikinya. Jenis ujian identifikasi yang lebih kompleks lagi mungkin melibatkan mendengar kepada mesin yang tidak berfungsi dengan baik, dan dari bunyinya, pelajar diminta mengenalpasti punca-punca yang menyebabkan mesin tersebut tidak berfungsi dengan baik.

Walaupun ujian identifikasi luas digunakan dalam pendidikan industri, ia juga digunakan dalam mata pelajaran-mata pelajaran lain. Guru biologi misalnya boleh meminta pelajar mengenalpasti spesimen-spesimen yang diletakkan di beberapa stesen di dalam bilik atau mengenalpasti peralatan dan prosedur yang diperlukan untuk menjalankan percubaan. Guru bahasa juga misalnya boleh meminta pelajar mengenal pasti sebutan yang betul, guru matematik pula boleh meminta pelajar mengenal pasti prosedur menyelesai masalah yang betul. Mengenal pasti prosedur yang betul juga penting dalam pendidikan seni, muzik, pendidikan jasmani dan bidang-bidang vokasional seperti pertanian, perdagangan dan ekonomi rumah tangga.

iii. Ujian Prestasi Berstruktur

Ujian prestasi berstruktur ini dijalankan dalam keadaan yang terkawal dan pelajar diminta melaksanakan sesuatu tugasan mengikut prosedur dan nilai tara yang setara. Misalnya, memasang mikroskop, mematuhi prosedur keselamatan dalam menghidupkan enjin, atau mengesan kerosakan pada alat elektronik.

Pembinaan ujian prestasi berstruktur lebih kurang sama seperti membina lain-lain ujian pencapaian. Namun begitu, biasanya jarang sesuatu keadaan itu dapat dikawal dan disetarakan sepenuhnya, di samping mengambil masa lebih untuk menyedia dan mentadbirnya serta selalunya agak sukar untuk diperiksa. Untuk meningkatkan situasi ujian yang terkawal dan setara untuk semua pelajar, arahan-arahan yang jelas perlu diberikan terutama tentang situasi ujian dan tugasan yang akan dijalankan. Arahan-arahan untuk mengesan peralatan elektronik yang rosak, misalnya, termasuk perkara-perkara berikut:

i. Tujuan ujian ii. Peralatan yang disediakan iii. Prosedur ujian

a. Jenis dan keadaan peralatan b. Deskripsi prestasi yang dikehendaki c. Had masa serta lain-lain keadaan

Page 32: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

iv. Metod dalam menilai prestasi Bila menggunakan ujian prestasi, adalah perlu ditentukan nilai tara prestasi yang menunjukkan tahap minima prestasi yang boleh diterima. Ini mungkin berkaitan dengan ketepatan (ch: mengukur suhu kepada darjah dua persepuluh yang paling hampir), mengikut urutan langkah-langkah yang betul (ch: ubah mikroskop mengikut urutan langkah-langkah yang betul), mengikut prosedur sepenuhnya (ch: periksa semua safety guard sebelum menghidupkan mesin), atau kelajuan prestasi (ch: kesan kerosakan peralatan elektronik dalam masa tiga minit). Di antara nilai tara yang biasa digunakan untuk menilai prestasi adalah seperti berikut:

Jenis Contoh

Kadar Selesaikan sepuluh masalah campur dalam masa

dua minit Taip 40 perkataan seminit

Kesilapan Tidak lebih daripada dua kesilapan bagi satu muka surat yang ditaip Kira sebanyak 20 dalam Bahasa Arab tanpa kesilapan

Masa Sediakan peralatan makmal dalam masa lima minit

Kesan kerosakan peralatan dalam masa tiga minit

Kepersisan (precision) Baca thermometer sehingga darjah dua persepuluh

Kuantiti Lengkapkan 20 percubaan makmal Kesan 15 rujukan yang relevan

Kualiti Tulis surat perniagaan yang kemas

Persembahkan bentuk yang betul dalam penerjunan

iv. Persembahan berbentuk Simulasi

Bertujuan untuk memadankan persembahan dengan situasi sebenar sama ada secara keseluruhan atau sebahagian

Contoh:

Pendidikan Jasmani: memukul bola, berenang, pukulan tenis

Sains sosial: simulasi perbicaraan, mesyuarat, latihan penerbangan

Kemahiran yang ditunjukkan dalam situasi berbentuk simulasi menandakan kesediaan pelajar untuk melakukan tugasan sebenar

v. Sampelan Kerja/Tugasan

Page 33: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Memerlukan pelajar melakukan tugasan sebenar yang mewakili keseluruhan tugasan yang diukur. Sampelan tugasan biasanya termasuk elemen yang paling penting dalam keseluruahn tugasan dan dilakukan dalam keadaan yang terkawal

Contoh:

Menaip surat Menggunakan komputer dalam menganalisis data Membaiki alat

vi. Projek penyelidikan

Jenis penaksiran yang paling komprehensif. Melibatkan kombinasi beberapa kemahiran dan proses berfikir dalam menyelesaikan masalah, menghasilkan produk atau kedua-duanya sekali

Contoh:

Mengenalpasti masalah Menjalankan kajian Menulis laporan Merekabentuk dan membina produk Mempertahankan hasil kajian

Langkah V: Memilih Metod Pemerhatian, Merekod dan Menskor Terdapat beberapa prosedur digunakan untuk menilai prosedur, produk atau kedua-dua prosedur dan produk. Di antara prosedur yang sering digunakan:

i. Pemerhatian Bersistematik

Bagi tugasan yang kecil/mudah, pemerhatian secara informal mungkin boleh dijalankan. Bagi tugasan yang lebih komprehensif, pemerhatian perlu lebih bersistematik bagi meningkatkan keobjektifan dan kegunaannya kemudian. Pemerhatian biasanya dibantu oleh senarai semak atau skala kadar

ii. Rekod Anekdot

Deskripsi ringkas tentang sesuatu peristiwa yang signifikan. Ia termasuk tingkahlaku yang diperhatikan, latar di mana tingkahlaku berlaku dan interpretasi tentang peristiwa. Rekod akan lebih bermakna apabila:

Ia menumpukan kepada peristiwa/perkara yang bermakna

Ia direkodkan sebaik sahaja insiden selesai

Ia mengandungi maklumat yang mencukupi untuk mudah difahami kemudian

Perlakuan yang diperhatikan dan interpretasinya diasingkan

iii. Senarai Semak

Page 34: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Merupakan senarai dimensi prestasi atau produk yang boleh diukur dan mempunyai ruang untuk merekod penilaian “ya” atau “tidak”. Sekiranya senarai semak digunakan untuk menilai satu set prosedur, misalnya, langkah-langkah yang diikuti mungkin diletakkan dalam urutan pangkatan dalam borang; pemerhati akan menyemak sama ada setiap tindakan telah diambil atau tidak. Senarai semak untuk menilai produk pula biasanya mengandungi senarai ciri-ciri produk yang baik seperti saiz, warna, bentuk dan lain-lain serta terdapat ruang untuk merekod sama ada setiap ciri yang dikehendaki ada atau tidak.

iv. Skala kadar

Skala kadar adalah sama dengan senarai semak dan mempunyai tujuan yang sama iaitu untuk menilai prosedur dan produk. Perbezaan yang utama adalah skala kadar menyediakan peluang untuk menandakan darjah berdasarkan skala tertentu. Skala untuk pengkadaran biasanya berasaskan kepada kekerapan sesuatu tindakan itu dilaksanakan (contoh: selalu, kadang-kadang, tidak pernah), kualiti sesuatu prestasi (contoh: cemerlang, kepujian, sederhana, lemah) atau satu set frasa deskripotif yang menandakan darjah penerimaan prestasi (contoh: menyelesaikan tugasan dengan cepat, lambat dalam menyelesaikan tugasan, tidak dapat menyelesaikan tugasan tanpa bantuan.

Anda mungkin telah pernah menjalankan penaksiran prestasi, cuba anda berikan LIMA faedah yang boleh diperolehi melalui penaksiran prestasi:

i. __________________________________________________________________ ii. __________________________________________________________________ iii. __________________________________________________________________ iv. __________________________________________________________________ v. __________________________________________________________________ Penskoran dan Penggredan Penaksiran Prestasi Pada asasnya terdapat dua pendekatan penskoran yang lazim digunakan dalam penaksiran prestasi penskoran analitik dan penskoran holistik. i. Penskoran Analitik Penilaian ke atas setiap kriteria yang digunakan untuk mentaksir tugasan/produk

Contoh: Skala kadar ii. Penskoran Holistik Berasaskan pandangan keseluruhan sesuatu tugasan/produk daripada elemen-elemen spesifik. Penskoran boleh berpandukan kepada rubrik yang menjelaskan tentang kualiti bagi setiap tahap/kriteria yang digunakan

Page 35: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Untuk tujuan pengajaran, kedua-kedua bentuk penskoran adalah berguna. Sekiranya kedua-duanya digunakan, penskoran secara holistik perlu dibuat dahulu supaya sesuatu elemen yang spesifik tidak menjejaskan pandangan kepada keseluruhan produk. Rubrik Penskoran Rubrik merupakan satu panduan atau format untuk melakukan satu penaksiran bagi sesuatu perkara. Rubrik kerap digunakan di dalam pentaksiran kerja kursus. Dalam sesuatu penggredan yang menggunakan rubrik, ia menjelaskan tentang penskoran bagi sesuatu tahap pencapaian atau jawapan yang pelajar kemukakan. Rubrik digunakan untuk mentaksir secara analitik atau pun secara holistik.

Rubrik analitik: Digunakan apabila penaksiran memerlukan maklumat terperinci yang

boleh menunjukkan kelemahan dan kekuatan pelajar. Ia biasanya digunakan apabila

prestasi yang ditaksir adalah “more than the sum of its parts” (contohnya prestasi

mengajar dan pengucapan awam). Rubrik analitik mempunyai kesahan dan

kebolehpercayaan yang lebih tinggi.

Rubrik holistik: Digunakan apabila penaksiran hanya memerlukan gambaran

keseluruhan prestasi dengan komponen yang secukupnya sahaja bagi membolehkan

pengukuran yang konsisten dijalankan.

Kedua-dua jenis rubrik boleh digunakan bersama-sama di mana rubrik analitik

dijadikan panduan untuk menilai secara holistik.

Contoh penskoran yang menggunakan rubrik adalah seperti berikut:

Gred Poin Maknanya

A 5 Cemerlang – Telah menguasai semua objektif utama dan minor. Dapat memberikan hujah yang baik dan berkesan

B 4 Baik – Telah menguasai semua objektif utama dan kebanyakan objektif minor. Dapat memberikan hujah dengan baik.

C 3 Memuaskan – Hampir menguasai semua objektif utama tetapi masih memerlukan bantuan dalam objektif minor. Dapat memberikan hujah dengan memuaskan.

D 2 Lemah – Memerlukan lebih bimbingan daripada guru. Perlu menguasai separuh daripada objektif utama dan sedikit objektif minor. Hujah yang diberikan masih belum cukup memuaskan.

E 1 Kurang Memuaskan – Belum lagi menguasai ssebarang objektif utama yang telah ditetapkan. Jika terdapat item betul pun adalah disebabkan bernasib baik, pelajar mungkin kurang faham kuliah yang diberikan. Hujah yang diberikan adalah lemah.

Pada umumnya rubrik penskoran boleh dibahagikan kepada tiga jenis. a. Holistik dan analitik

Page 36: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Pemilihan dibuat secara umum tentang sesuatu prestasi. Rubrik yang holistik mempunyai

label-label kecekapan yang berkaitan dengannya seperti: cekap, lemah, cemerlang dan sebagainya. Manakala analitik pula merupakan rubrik yang lebih terperinci daripada holistik. Kriteria yang disediakan adalah lebih kemas.

b. Perkembangan dan kuantitatif

Rubrik ini dibina untuk memanjangkan aras gred atau jarak kecekapan di atas satu kontinuum. Kuantiti merujuk kepada penggunaan skala kadar (rating) yang telah didefinisikan dalam angka dan digunakan secara holistik atau analitik.

c. Umum dan spesifik Satu set kategori kriteria dibentuk untuk semua tugasan – kerap menggunakan rubrik

holistik. Manakala rubrik yang tertentu dibina untuk tugasan yang tertentu sahaja seperti dalam soalan jawapan pendek atau soalan terbuka.

Portfolio Kita akan cuba membincangkan satu contoh penaksiran prestasi yang banyak digunakan dalam mentaksir pembelajaran pelajar iaitu portfolio. Portfolio telah didefinisikan dalam pelbagai bentuk. Secara umumnya, portfolio… “A portfolio is more than just a container full of stuff. It‟s a systematic and organized collection

of evidence used by the teacher and student to monitor growth of the student‟s knowledge,

skills, and attitudes in a specific subject area”

Vavrus, 1990, ms.48

Berdasarkan definisi di atas, bolehlah dikatakan bahawa portfolio merupakan proses mendokumentasi pembelajaran merentas masa bagi menunjukkan progres pelajar dan mengajar mereka melalui pentaksiran kendiri, penyuntingan, dan penambahbaikan tugasan. Bahan-bahan yang biasanya terdapat di dalam sesebuah portfolio termasuklah penulisan jurnal, penulisan reflektif, ulasan rakan sebaya, hasil kerja seni, gambar rajah, nota pelajar, draf dan penulisan yang siap. Bagi portfolio yang mempunyai ciri yang baik mestilah:

Mengandungi bahan terpilih sahaja

Menunjukkan progres pembelajaran

Sistematik dan tersusun

Menunjukkan bukti bimbingan yang diterima daripada ibu bapa, guru, dan rakan

sebaya

Menunjukkan bukti kerja kolaboratif dan interaksi dengan rakan sebaya

Page 37: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Menunjukkan bukti hasil pemikiran kritis dan kreatif

Membina portfolio Secara umumnya, langkah-langkah membina portfolio adalah seperti berikut:

1. Kenalpasti bidang kemahiran dan pengetahuan yang pelajar perlu bina

2. Tentukan hasil pembelajaran yang perlu pelajar capai berdasarkan bidang ini

3. Kenalpasti indikator prestasi yang menunjukkan pelajar telah mencapai hasil

pembelajaran dan nyatakan bukti yang pelajar perlu kumpulkan

4. Kumpulkan bukti yang menunjukkan pelajar telah mencapai indikator prestasi tersebut

5. Susun bukti ini dalam satu portfolio supaya penilai mudah memahami bagaimana bukti

dikaitkan dengan setiap indikator prestasi

Mengurus dan mengguna portfolio Pelajar adalah terlibat secara aktif dalam mengurus dan menjaga portfolio. Oleh kerana portfolio adalah merupakan koleksi kerja pelajar, maka mereka perlu dibimbing tentang apa yang perlu dimasukkan ke dalam portfolio, dalam memilih sampel kerja dan dalam menilai perkembangan pembelajaran sebagaimana yang digambarkan dalam sampelan kerja tersebut. Porfolio akan disemak secara berkala semasa konferen pelajar-guru yang memberi peluang kepada pelajar dan guru membandingkan penilaian mereka serta membincangkan kekuatan dan kelemahan pembelajaran serta aspek-aspek yang memerlukan penambahbaikkan. Portfolio juga digunakan semasa konferen ibubapa-guru untuk mempersembahkan perkembangan pembelajaran pelajar berdasarkan bukti-bukit hasil kerja yang konkrit.

RUMUSAN 1. Penaksiran prestasi mementingkan darjah realisme tugasan serta mengukur tugasan

yang lebih kompleks dibandingkan dengan ujian pensil dan kertas 2. Penaksiran prestasi terhad biasanya adalah lebih berstruktur dan terhad skopnya serta

merangkumi hasil pembelajaran yang spesifik yang hendak diukur. Sedangkan penaksiran prestasi terbuka kurang berstruktur, lebih terbuka dan luas skopnya serta boleh merangkumi beberapa hasil pembelajaran dalam satu-satu tugasan

3. Fokus penaksiran prestasi adalah kepada mentaksir produk, proses atau kedua-duanya sekali

4. Terdapat pelbagai darjah realisme dalam penaksiran prestasi, dan matlamatnya adalah untuk mendapatkan setinggi darjah realisme yang mungkin dalam kekangan yang terdapat seperti kekangan masa, kos, kelengkapan, instrumen dan lain-lain

5. Langkah-langkah melaksanakan penaksiran prestasi bermula dengan mendefinisikan hasil pembelajaran; diikuti dengan memilih fokus penaksiran (prosedur, produk atau kedua-dua); seterusnya memilih darjah realisme tugasan yang sesuai; memilih situasi tugasan; dan akhirnya memilih metod pemerhatian, merekod dan menskor.

6. Beberapa teknik pemerhatian yang biasa digunakan adalah seperti pemerhatian berstruktur, rekod anekdot, senarai semai dan skala kadar.

7. Penskoran penaksiran prestasi boleh dilakukan secara analitik atau pun secara holistik dengan menggunakan rubrik penskoran yang sesuai.

8. Portfolio merupakan satu contoh pentaksiran prestasi yang sering digunakan untuk mentaksir progress pembelajaran pelajar dengan meneliti hasil kerja pelajar dalam

Page 38: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

satu tempoh masa. Portfolio menekankan kekuatan pembelajaran pelajar, pembentukan penilaian kendiri serta penglibatan aktif pelajar dalam proses pengajaran dan pembelajaran.

Kuiz

Sila jawab soalan-soalan berikut: 1. Dalam mentaksir kebolehan pelajar mengesan kerosakan enjin kereta berdasarkan

kriteria yang telah ditetapkan, Cikgu Rama telah membawa pelajar-pelajarnya ke sebuah bengkel yang berhampiran dengan sekolah. Dengan bantuan mekanik di bengkel tersebut, Cikgu Rama telah meminta pelajar-pelajar nya mengesan jenis kerosakan pada enjin kereta yang terdapat di bengkel tersebut Tindakan Cikgu Rama ini menunjukkan yang beliau

A. ingin memberi peluang kepada pelajar-pelajarnya bekerja di bengkel kereta B. mementingkan darjah realisme pentaksiran yang dilakukannya C. cuba untuk mengelakkan pelajar-pelajar yang nakal membuat bising di kelas D. ingin membezakan pentaksiran bilik darjah dan pentaksiran persembahan

2. Penaksiran prestasi dikatakan sebagai penaksiran alternatif atau penaksiran autentik

dan tergolong dalam bentuk-bentuk penaksiran yang sedang dikembangkan dalam paradigma penaksiran pada masa ini. Kenyataan ini menggambarkan bahawa penaksiran prestasi

I. mementingkan penaksiran ke atas kebolehan berfikir aras tinggi II. bersesuaian dengan paradigma pembelajaran konstruktivisme III. boleh menggantikan penaksiran tradisional yang menekankan pengukuran

saintifik IV. adalah merupakan sebahagian daripada proses pengajaran dan pembelajaran

A. I & II sahaja B. 111 & IV sahaja C. I, II & III sahaja D. I, II & IV sahaja

3. Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah

seperti berikut:

"Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampongan orang asli".

Page 39: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

Untuk mengukur kemahiran-kemahiran tersebut, jenis penaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah A. Penaksiran prestasi terbuka B. Penaksiran prestasi terhad C. Ujian Subjektif D. Ujian Objektif

4. Penaksiran prestasi dilaksanakan dengan mengikut langkah-langkah yang sesuai bagi

mempastikan penaksiran tersebut dapat mengukur dengan tepat pengetahuan dan kemahiran yang hendak diukur. Berikut adalah langkah-langkah yang biasa digunakan dalam menjalankan penaksiran prestasi:

I. Memilih situasi tugasan II. Memilih fokus penaksiran (prosedur, produk atau kedua-duanya) III. Memilih metod pemerhatian, merekod dan memeriksa IV. Menetapkan hasil tugasan V. Memilih darjah realisme yang sesuai

Pada pandangan anda, susunan langkah-langkah yang manakah yang paling sesuai untuk menjalankan penaksiran prestasi yang berkesan? A. I, II, III, IV, V B. II, III, I, IV, V C. III, I, II,V, IV D. IV,II,V,I,III

5. Dibandingkan dengan bentuk-bentuk penaksiran lain, portfolio sebagai metod

penaksiran merupakan satu cara yang terbaik untuk

A. merakamkan tingkahlaku autentik B. menggantikan penaksiran berbentuk ujian pensel-kertas C. berkomunikasi tentang apa yang pelajar sebenarnya tahu D. mengesahkan skor-skor ujian yang diperolehi daripada bentuk-bentuk

penaksiran lain 6. Kekuatan portfolio sebagai metod penaksiran pelajar yang menjadi tarikan kepada

guru-guru menggunakannya adalah A. kebolehpercayaan yang tinggi B. keberkesanan tinggi dan menjimatkan masa C. keseragaman tugasan untuk tujuan penggredan

D. kemudahan untuk guru mengintegrasikannya dengan pengajaran 7. Untuk tujuan pemberian gred, penilaian sesuatu portfolio paling baik dilakukan dengan

menggunakan

A. penilaian rakan sebaya

Page 40: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

B. penilaian kendiri pelajar C. kriteria pemarkahan holistik D. kriteria pemarkahan analitik 8. Portfolio sangat berguna dalam konferen antara guru-ibubapa. Ia menyediakan

maklumat tentang perkembangan pembelajaran pelajar kepada ibubapa berserta dengan

A. rekod kerja pelajar yang lengkap B. skor yang boleh dipercayai dan mudah difahami C. contoh-contoh konkrit tentang pencapaian pelajar

D. gred bagi setiap sampelan kerja yang dimasukkan dalam portfolio 9. Di antara ciri-ciri penting penaksiran autentik adalah

A. Penaksiran kendiri dibuat seiring dengan ujian konvensional B. Penekanan kepada soalan yang memerlukan pelajar menghafal fakta C. Soalan atau tugasan yang dibina menggambarkan apa yang berlaku dalam

keadaan sebenar D. Pelajar dikehendaki membentangkan dan mempertahankan secara lisan untuk

menentukan bahawa penguasaan nya adalah benar JAWAPAN:

1. B 2. D 3. A 4. D 5. C 6. D 7. C 8. C 9. C

KATA KUNCI Penaksiran prestasi Penaksiran autentik Penaksiran alternatif Penaksiran rujukan kriteria Penaksiran proses Darjah realisme Kemahiran berfikir aras tinggi Portfolio

Page 41: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

PENILAIAN KENDIRI

1. Apakah perbezaan asas di antara penaksiran tradisional dan penaksiran prestasi? 2. Mengapakah penaksiran prestasi lebih merupakan penaksiran rujukan kriteria? 3. Dalam sistem penaksiran di sekolah didapati penaksiran prestasi kurang diberikan

tumpuan, mengapa? 4. Apakah ciri-ciri yang ada pada penaksiran portfolio yang sesuai dengan kriteria

penaksiran prestasi?

RUJUKAN Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New

York: Mc-Graw Hill. Gronlund, N.E., (1998). Assessment of Student Achievement, 6th ed., Boston:Allyn & Bacon

Page 42: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 1

UNIT 4

KESAHAN DAN KEBOLEHPERCAYAAN

HASIL PEMBELAJARAN

Di akhir unit ini, anda seharusnya dapat:

Menghuraikan maksud kesahan (validity) dan kebolehpercayaan (reliability). Menjelaskan kepentingan kesahan dan kebolehpercayaan dalam pentaksiran

pendidikan. Menjelaskan beberapa kaedah bagi menganggarkan kebolehpercayaan dan kesahan. Menghuraikan faktor-faktor yang mempengaruhi kesahan dan kebolehpercayaan. Menjelaskan langkah-langkah yang perlu diambil untuk mempertingkatkan kesahan dan

kebolehpercayaan.

PENGENALAN

Rajah 1: Ilustrasi contoh penggunaan konsep kesahan dan kebolehpercayaan

Cerita dalam Rajah 1 tadi biasa kita dengar, malah sebahagian daripada kita juga

mungkin pernah mengalaminya. Peristiwa tersebut boleh meninggalkan kesan yang

besar kepada sesetengah orang. Dalam cerita di atas, Bob berkemungkinan menjadi

murung dan enggan menjamah makanan beberapa hari sehingga beliau jatuh sakit.

“Berat badan saya hanya 52 kg, bukan 59 kg. Semua alat penimbang lain menunjukkan bacaan 51.5 atau 52 kg. Alat penimbang ini memberi bacaan yang berbeza-beza. Pagi tadi berat badan saya 55 kg, tapi sekarang 59 kg

pula. Saya rasa alat penimbang ini rosak! ” Bob, 10 tahun.

Page 43: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 2

Hal yang sama juga boleh berlaku apabila ramai pelajar yang berpencapaian tinggi gagal dalam

satu ujian penting disebabkan oleh kualiti ujian. Kejadian ini akan mencetuskan beberapa

persoalan yang meragui kualiti ujian yang dibina guru. Ia juga boleh menurunkan konsep

kendiri pelajar dalam subjek tersebut dan berkemungkinan membawa kepada kesan negatif

yang tidak diingini. Guru pula mungkin akan dipanggil oleh pengetua sekolah untuk

menjelaskan pertanyaan yang datang bertubi-tubi daripada ibu bapa pelajar. Sebagai guru,

apakah yang boleh kita lakukan untuk mengelakkan kejadian seperti itu?

Mari kita membuat sedikit refleksi. Pernahkah anda membina soalan ujian sebelum

ini? Kalau anda pernah mengajar, tentu sekali anda berpengalaman membina soalan-

soalan ujian atau peperiksaan akhir tahun. Cuba ingat kembali, bagaimana

kebiasaannya anda membina soalan-soalan tersebut? Apakah anda membina sendiri soalan-

soalan ujian secara individu atau berkumpulan, atau mengambil terus soalan daripada buku-

buku komersial yang ada di pasaran? Adakah kita duduk berbincang bersama guru lain dan

meneliti soalan satu persatu untuk menentukan kesesuaian dan aras kemahiran yang berkaitan

dengan setiap soalan? Mengapa kita perlu melakukan semua proses tersebut? Anda mungkin

berkata, “Saya dah mengajar lebih 10 tahun. Semua pengetahuan dihujung jari. Saya boleh

sediakan 40 soalan objektif dalam setengah jam sahaja. Saya tak perlu buat semua tu..”

Tunggu, selepas menyelesaikan modul ini, saya yakin persepsi anda akan berubah.

Sekarang mari kita meneliti konsep kesahan dan kebolehpercayaan dan bagaimana kita boleh

mengaplikasi konsep ini untuk mempertingkatkan kualiti ujian yang kita bina.

ISI KANDUNGAN

Apakah Kesahan?

esahan adalah berkaitan kesesuaian. Ia bermaksud instrumen yang digunakan mestilah

benar-benar mengukur apa yang ingin diukur. Dalam penyelidikan, instrumen yang

digunakan perlulah mempunyai kesahan dan kebolehpercayaan yang tinggi agar hasil

atau dapatan kajian tersebut boleh diterima pakai, seterusnya syor yang dicadangkan boleh

dipertimbang untuk dilaksanakan. Sebaliknya jika kesahan dan kebolehpercayaan rendah,

hasil kajian tersebut tidak boleh diterima seterusnya syor tidak boleh dipertimbangkan walaupun

kaedah analisis data yang sofistikated digunakan.

alam pentaksiran pendidikan pula, soalan ujian yang dibina perlulah sesuai, iaitu ujian

tersebut benar-benar mengukur apa yang ingin kita ukur. Ujian yang mempunyai

kesahan yang tinggi membolehkan hasil ujian tersebut ditafsir seterusnya penilaian

boleh dibuat berdasarkan hasil ujian tersebut. Sebaliknya pula jika kesahan ujian rendah, hasil

daripada ujian tersebut tidak dapat ditafsir secara bermakna, seterusnya penilaian yang dibuat

berdasarkan ujian tersebut juga tidak bermakna.

K

D

Page 44: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 3

Contohnya jika kita ingin mengukur kemahiran pelajar menyediakan apron dalam subjek

Kemahiran Hidup, bagaimanakah bentuk ujian yang anda fikir paling sesuai untuk mencungkil

kemahiran tersebut? Adakah anda akan memberi mereka ujian objektif, ujian esei, atau ujian

amali? Apakah item tugasan atau soalan-soalan yang perlu diberi untuk membolehkan pelajar

melahirkan kemahiran membuat apron tersebut? Cuba fikirkan dan tulis jawapan anda dalam

ruang berikut:

_________________

Cikgu Anis memilih untuk memberi ujian objektif untuk mengukur kemahiran menyediakan

apron tersebut bagi memudahkan beliau memeriksa jawapan. Pada fikiran anda, adakah

soalan objektif sesuai untuk mengukur kemahiran tersebut?

_________________

Anda mungkin menjawab “Ya, sebab soalan yang berkaitan dengan teori boleh ditanya

dalam soalan objektif.” Benar, kita boleh mengukur pengetahuan mereka tetapi tidak

kemahiran mereka seperti kemahiran menggunting dan menjahit.

Cikgu Lim pula mungkin memilih untuk memberi soalan esei bagi mengukur kemahiran

tersebut. Adakah soalan esei sesuai?

__________________

Anda mungkin menjawab “Ya. Lebih baik daripada soalan objektif sebab pelajar berpeluang

menulis dengan perkataan sendiri langkah-langkah kerja, melakar pelan, dan menerangkan

setiap langkah dengan jelas dari mula hingga akhir”. Benar, tetapi kita masih belum dapat

melihat hasil yang sebenar. Bolehkah mereka menggunting dan menjahit dengan baik?

Cikgu Linda pula mungkin memilih untuk member ujian amali bagi mengukur kemahiran

membuat apron tersebut. Adakah ini sesuai?

__________________

Sekali lagi anda mungkin menjawab, “Ya. Kita dapat lihat bagaimana cara pelajar merancang

dan membuat pelan, menggunting kain, menjahit, dan seterusnya kita boleh melihat kualiti

apron yang terhasil.

Jadi soalan jenis mana harus dipilih. Kesemuanya kelihatan sesuai – ada yang agak

sesuai juga, lebih sesuai, dan sangat sesuai. Kita perlulah memilih yang paling

sesuai, kerana ia akan menentukan kesahan yang tinggi. Sebenarnya, kesahan

berkaitan dengan darjah kesesuaian. Messick (1989) mendefinisikan kesahan sebagai penilaian

tentang sejauhmana bukti empirikal dan hujah teori menyokong kecukupan dan kesesuaian

inferens yang dibuat berdasarkan skor ujian atau bentuk pentaksiran yang lain.

Page 45: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 4

Bagaimana Menganggarkan Kesahan?

erdapat beberapa jenis kesahan yang boleh digunakan untuk menunjukkan instrumen

atau ujian yang kita bina mempunyai bukti kesahan yang mencukupi. Antara yang utama

adalah seperti berikut:

Kesahan Kandungan : Untuk menentukan sejauhmana sampel tugasan ujian mewakili apa yang ingin diukur. Di sini kita perlu membandingkan item ujian atau tugasan dengan objektif atau spesifikasi domain tugasan yang ingin diukur. Proses ini dilakukan ketika membina Jadual Penentu Ujian (JPU). Oleh sebab itu, kesahan kandungan sebenarnya sudah dipenuhi bila kita membina JPU.

Kesahan Konstruk : Untuk menentukan sejauhmana pencapaian dalam ujian boleh ditafsir sebagai penting atau bermakna untuk mengukur kualiti yang ingin diukur. Berguna untuk pembolehubah berbentuk konsep dan tidak dapat diukur dengan mudah seperti kecerdasan, kebimbangan, dan personaliti. Dalam kaedah ini, kita perlu menentukan terlebih dahulu ciri-ciri atau indikator untuk menunjukkan kualiti yang ingin diukur. Contohnya bagi mengukur ’tahap sosio-ekonomi (SES)’, indikator yang boleh digunakan termasuklah tahap pendidikan; pendapatan; jenis pekerjaan; bilangan tanggungan; perbelanjaan; harta dimiliki; dan kawasan tempat tinggal.

Bagi mengukur kemahiran penakulan sains dan penyelesaian masalah pula, indikator yang boleh dipertimbangkan termasuklah kebolehan menerangkan alasan di sebalik idea; menganalisis perkaitan menggunakan graf, carta,atau jadual; menyelesaikan soalan yang tiada langkah penyelesaian yang jelas atau serta merta; menghuraikan pemerhatian; serta menyusun objek atau peristiwa dalam urutan dan menyatakan sebab.

Kesahan Kriterion : Untuk menentukan sejauhmana pencapaian dalam ujian yang dibina boleh meramalkan pencapaian pada masa depan (kriterion ramalan); atau sejauhmana ia berkait dengan pencapaian ujian lalu yang telah diakui kesahannya (kriterion ramalan); atau ujian lain lain pada masa yang sama (kriterion semasa). Caranya ialah dengan membandingkan prestasi dalam kedua-dua ujian dan dapatkan pekali korelasi bagi kedua-dua ujian tersebut.

Kesahan Pakar : Untuk menentukan sejauh mana pencapaian dalam ujian boleh ditafsir sesuai untuk mengukur kualiti yang ingin diukur berdasarkan pandangan pakar-pakar dalam bidang tersebut. Dalam kaedah ini, instrumen yang telah dibina ditunjukkan kepada sekumpulan pakar untuk diteliti dan diniliai. Jika instrumen tersebut mendapat persetujuan pakar-pakar, kesahan pakar telah dipenuhi.

Kesahan Muka : Kesahan ini merujuk kepada format dan pandangan kasar tentang ujian

tersebut. Sekali pandang ujian kelihatan mengukur kandungan (kemahiran/ pengetahuan/nilai) yang hendak diukur kepada kumpulan sasaran. Walau bagaimanapun, kesahan jenis ini sahaja tidak mencukupi untuk menentukan kualiti ujian.

T

Page 46: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 5

Bagaimanakah kita boleh menentukan kaedah atau jenis yang mana

untuk digunakan?

Jawapannya mengikut kesesuaian, bergantung kepada jenis instrumen atau alat ukur

yang kita bina. Jika kita ingin membina ujian bagi melihat pencapaian pelajar dalam subjek

tertentu atau pencapaian peserta dalam kursus tertentu, kesahan kandungan dan kesahan

kriterion boleh digunakan untuk menganggar kesahan ujian tersebut. Sekiranya kita ingin

membina instrumen berbentuk soal selidik untuk mengukur suatu kualiti yang abstrak pula,

kesahan konstruk dan kesahan pakar mungkin lebih sesuai.

Cuba fikirkan beberapa contoh kualiti abstrak yang tidak boleh diukur secara

langsung, sebaliknya memerlukan kita membina konstruk tertentu dan mengenalpasti

indikator yang berkaitan.

o Personaliti_____________ o _____________________ o _____________________ o _____________________ o _____________________

Rujuk kepada Lampiran A4.1. Lampiran tersebut merupakan satu ujian mengandungi 5 item

untuk subjek nuclear perubatan. Jawab semua soalan tersebut dan rekodkan jawapan anda

dalam ruangan berikut.

1. __________ 2. __________ 3. __________ 4. __________ 5. __________

Pada pendapat anda, adakah tersebut sesuai untuk mengukur pencapaian sains

pelajar Tingkatan 2?

Apakah Faktor-faktor Yang Mempengaruhi Kesahan?

Kesahan akan menjadi rendah jika item ujian kurang baik, iaitu item tidak dapat mengukur

dengan tepat kemahiran atau pengetahuan yang ingin diukur. Berikut adalah antara faktor yang

boleh menyebabkan kesahan menjadi rendah dan perlu dielakkan:

Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur

Arahan kurang jelas

Soalan kabur

Page 47: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 6

Penggunaan perbendaharaan kata yang sukar difahami pelajar

Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi

Bilangan item tidak mencukupi

Susunan jawapan item objektif boleh diramal

Apakah Kebolehpercayaan?

Kita mungkin pernah mendengar dialog seperti ini: “Saya tidak percaya macamana

saya boleh mendapat markah 25/40 sahaja bagi Bahagian Esei dalam Ujian Sains

bulan Mac. Jawapan saya hampir sama dengan jawapan Aishah, tapi dia mendapat

36 markah. Cikgu Nora mungkin silap memberi markah. Saya telah meminta Cikgu

Jaya yang mengajar Sains Tingkatan 4 Melati pula memeriksa kertas jawapan saya, dan saya

memperolehi 33 markah.”

ebanyakan kamus mendifinisikan kebolehpercayaan daripada sudut kebergantungan

atau darjah keyakinan terhadap sesuatu. Walau bagaimanapun, dalam konteks

pengukuran, kebolehpercayaan merujuk kepada ketekalan atau kestabilan (consistency)

hasil pengukuran. Kita ingin mengetahui sejauhmana keputusan ujian konsisten jika ditadbirkan

pada salah satu daripada keadaan berikut:

o ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau

o ditadbirkan kepada kumpulan yang berlainan; atau

o jawapan calon yang sama diperiksa oleh guru yang berlainan.

Dalam contoh di atas, Cikgu Nora dan Cikgu Jaya telah memberi markah yang berbeza kepada

kertas jawapan murid yang sama. Pada pendapat anda, mengapakah hal tersebut boleh

berlaku?

____________________________________________________________________

_____________________________________________________________________

______________________________________________

Bagaimana Menganggarkan Kebolehpercayaan?

erdapat beberapa jenis kebolehpercayaan yang boleh digunakan untuk menunjukkan

instrumen atau ujian yang kita bina mempunyai bukti kebolehpercayaan yang mencukupi.

Antara yang utama adalah seperti berikut:

Bentuk Belah Dua (Split-Half) – Kaedah ini biasa digunakan untuk mengukur ketekalan

dalaman. Satu ujian dibahagikan kepada dua sub-ujian melalui kaedah berikut:

Item ganjil – Bentuk A, Item genap - Bentuk B; atau

Item disusun mengikut aras kesukaran. Kemudian, kelompokkan item, contohnya

Item ganjil – Bentuk A, Item genap – Bentuk B; atau

K

T

Page 48: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 7

Item dikelompokkan kepada Bentuk A dan Bentuk B berdasarkan tugasan yang

sepadan.

Setiap murid akan memperolehi 2 skor, satu untuk jumlah skor bagi item Bentuk A dan

satu lagi jumlah skor bagi item Bentuk B. Akhirnya dua set skor (Bentuk A dan B) akan

diperolehi bagi semua pelajar dan pekali korelasi akan dihitung. Nilai pekali korelasi

yang tinggi menunjukkan ketekalan dalaman yang tinggi bagi ujian tersebut.

Kebohpercayaan ujian akan dianggar menggunakan formula berikut:

Bentuk A Bentuk B

Amin

Nawi Rozy

Kebolehpercayaan, rxx = 2r1/2,1/2

--------------------

1 + r1/2,1/2

yang mana rxx = kebolehpercayaan ujian

r1/2,1/2 = korelasi antara dua sub-ujian (Bentuk A dan B)

Menggunakan Kovarian Item – Dalam kaedah ini, ketekalan dalaman dianggarkan

dengan menggunakan formula:

Pekali alpha Formula Kuder-Richardson

Formula Cronbach alpha:

Kebolehpercayaan,

α = k ∑ σi2

------- ( 1 - ----- ) ; yang mana

k – 1 σx2

k = bilangan item

∑ σi2 = jumlah varian bagi setiap item

σx2 = varian bagi keseluruhan ujian berkenaan

36

27

32

25

..

..

..

39 28 30 27 ..

..

..

Page 49: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 8

Formula Kuder-Richardson 20:

Digunakan untuk item dengan jawapan betul/salah.

Kebolehpercayaan,

KR20 = k ∑ pq

------- ( 1 - ----- ); yang mana

k – 1 σr2

p = perkadaran calon yang dapat jawapan betul;

(0<p<1)

q = perkadaran calon yang dapat jawapan salah

(1-p)

σr2 = varian bagi jumlah skor

k = bilangan item

Formula Kuder-Richardson 21:

Kebolehpercayaan,

KR20 = k m(k-m)

------- ( 1 - ----------- ); yang mana k – 1 ks2

k = bilangan item dalam ujian

m = min ujian

s2 = varian ujian

Kaedah Uji dan Ulang Uji (Test-Retest) – Ujian yang sama ditadbirkan kepada kumpulan

pelajar yang sama dalam dua masa yang berbeza. Dapatkan pekali korelasi (r) bagi

dua set skor tersebut.

Ujian 1 Ujian 2

Lim Rais Ravi

76

77

62

55

..

..

..

78 78 63 54 ..

..

..

Page 50: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 9

Kaedah Bentuk Setara (Equivalent Form) – Dua ujian yang berlainan tetapi setara dari

segi aras kemahiran dan kandungan diberi kepada pelajar. Dapatkan pekali korelasi (r)

antara bagi dua skor tersebut.

Ketekalan antara Pemeriksa (Inter-rater Reliability) – Ketekalan skor yang diberi oleh

beberapa orang pemeriksa atau pakar. Dalam kaedah ini, jika dua orang atau lebih

pemeriksa memberi skor yang sama atau hampir sama, ujian dikatakan mempunyai

kebolehpercayaan yang tinggi. Kaedah ini tidak sesuai bagi soalan objektif yang

mempunyai satu jawapan tepat.

Faktor Yang Mempengaruhi Kebolehpercayaan

Panjang ujian atau bilangan item. Lebih banyak item atau lebih panjang ujian, lebih

tinggi kebolehpercayaan.

Kepelbagaian kebolehan individu dalam kumpulan. Kumpulan heterogen –

kebolehpercayaan lebih tinggi berbanding kumpulan homogen.

Kebolehan pelajar yang mengambil ujian. Jika item terlalu sukar – pelajar akan meneka

jawapan menyebabkan ketekalan keputusan rendah.

Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. Contoh -

Kebolehpercayaan yang diperolehi daripada kaedah bentuk setara biasanya lebih

rendah berbanding prosedur uji dan ulang uji atau bentuk belah dua.

Pembolehubah yang diukur. Kebolehpercayaan umumnya lebih tinggi bila kita

mengukur pengetahuan atau kemahiran berbanding sikap atau nilai. Contohnya

mengukur pencapaian akademik – keputusan biasanya lebih konsisten berbanding

sahsiah atau sikap.

Jenis ujian. Kebolehpercayaan bagi ujian objektif biasanya lebih tinggi berbanding ujian

esei disebabkan panjang ujian dan juga perbezaan antara pemeriksa. Skema

pemarkahan yang jelas boleh membantu mengurangkan perbezaan antara pemeriksa

seterusnya mempertingkatkan kebolehpercayaan ujian.

Hubungan antara Kesahan dan Kebolehpercayaan

Ujian perlu mempunyai kesahan dan kebolehpercayaan yang tinggi supaya keputusan daripada ujian tersebut boleh ditafsir dengan tepat.

Kesahan akan menentukan sejauhmana ujian yang dibina menepati matlamat, manakala kebolehpercayaan pula memastikan ketekalan dalam pengukuran pencapaian murid dalam ujian tersebut.

Page 51: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 10

Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum mencukupi untuk memastikan kesahan.

Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang

mempunyai kebolehpercayaan tidak semestinya sah. Perkaitan ini digambarkan dalam rajah berikut:

Konsisten tetapi tidak sah Tidak sah dan tidak Sah dan konsisten (tidak menepati sasaran) konsisten

Rajah 2: Hubungan antara kesahan dan kebolehpercayaan Sumber: http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf

RUMUSAN

erdasarkan apa yang telah kita bincangkan dalam Unit ini, apakah yang boleh anda

rumuskan tentang kebolehpercayaan dan kesahan?

_________________________________________________________________

_________________________________________________________________________

____________________________________________________________________

Berikut adalah beberapa rumusan yang boleh dibuat:

Pengertian kesahan :

o Berkaitan kesesuaian (appropriateness).

o Sejauhmana instrumen/ujian mengukur objektif pembelajaran yang ingin diukur.

o Menentukan sejauhmana hasil penilaian itu boleh digunakan.

o Spesifik untuk tujuan tertentu sahaja.

o Melibatkan penilaian darjah kesesuaian

B

Page 52: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 11

Kaedah menentukan kesahan :

o Kesahan kandungan

o Kesahan kriterion

o Kesahan konstruk

o Kesahan pakar

o Kesahan muka

Faktor-faktor yang mempengaruhi kesahan : o Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur

o Arahan kurang jelas

o Soalan kabur

o Penggunaan perbendaharaan kata yang sukar difahami pelajar

o Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi

o Bilangan item tidak mencukupi

o Susunan jawapan item objektif boleh diramal

Kebolehpercayaan o Berkaitan ketekalan, kestabilan (consistency) hasil pengukuran.

o Menunjukkan sejauhmana keputusan ujian konsisten jika ditadbirkan pada salah

satu daripada berikut:

ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau

ditadbirkan kepada kumpulan yang berlainan; atau

jawapan calon yang sama diperiksa oleh guru yang berlainan.

Kaedah menentukan kebolehpercayaan :

o Kaedah belah dua

o Kaedah kovarian item

o Kaedah uji dan ulang uji

o Kaedah bentuk setara

o Ketekalan pemeriksa

Faktor yang mempengaruhi kebolehpercayaan :

o Panjang ujian atau bilangan item. o Kepelbagaian kebolehan individu dalam kumpulan. o Kebolehan pelajar yang mengambil ujian. o Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. o Pembolehubah yang diukur. o Jenis ujian.

Hubungan antara kebolehpercayaan dan kesahan

o Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum dapat memastikan kesahan.

o Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang mempunyai kebolehpercayaan tidak semestinya sah.

Page 53: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 12

KATA KUNCI

1. Kesahan 9. Kesahan kandungan 2. Kebolehpercayaan 10. Kesahan kriterion 3. Ketekalan 11. Kesahan konstruk 4. Konsisten 12. Kesahan pakar 5. Kesesuaian 13. Kesahan muka 6. Ketekalan dalaman 14. Uji dan ulang uji 7. Bentuk belah dua 15. Bentuk setara 8. Ketekalan antara pemeriksa 16. Korelasi

PENILAIAN KENDIRI

Uji kefahaman anda dengan menjawab soalan-soalan berikut:

1. Semasa menentukan kesahan berasaskan kriterion semasa, Cikgu Abby mendapati pekali korelasi (r) antara skor bagi ujian matematik dan sains bagi 93 orang pelajar Tingkatan 2 di sekolahnya ialah +1.25. Dapatan ini menunjukkan

A. perhubungan antara skor matematik dan sains sangat kuat. B. terdapat kesilapan dalam pengiraan pekali korelasi (r). * C. perhubungan antara skor matematik dan sains adalah positif. D. pelajar yang mendapat skor tinggi dalam sains juga mendapat skor tinggi dalam matematik.

2. Data berikut diperolehi daripada satu kajian tentang faktor yang mempengaruhi kepuasan kerja daripada persepsi pekerja dan majikan yang dibuat di Hulu Langat, Selangor. Didapati pekali korelasi (r) antara ranking oleh pekerja dan majikan ialah -.75. Faktor manakah yang paling banyak menyumbang kepada pekali korelasi yang negative tersebut?

Faktor Urutan Kepentingan (Ranking)

Majikan Pekerja

P. Penghargaan dan pujian Q. Gaji memuaskan R. Kerja menarik S. Suasana kerja yang baik T. Kebajikan pekerja dijaga U. Kenaikan gaji berdasarkan merit V. Jaminan pekerjaan

1 2 3 4 5 6 7

6 3 1 5 7 4 2

A. Faktor P dan T B. Faktor R dan U C. Faktor P dan V * D. Faktor R dan V

A

Page 54: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 13

3. Semenjak beberapa tahun lalu, ujian M-TeSt digunakan untuk tapisan memasuki program perguruan di Institut Perguruan di seluruh negara. Sekumpulan penyelidik menyiasat korelasi antara keputusan ujian M-TeST dan gred purata kumulatif (PNGK) pelajar di akhir pengajian mereka. Prosedur tersebut adalah berkaitan dengan penentuan

A. kebolehpercayaan ujian B. kesahan kriterion * C. keobjektifan ujian D. kualiti ujian

4. Jadual Penentu Ujian (JPU) disediakan dengan tujuan untuk

I. memastikan ujian mengandungi perwakilan yang mencukupi bagi tajuk-tajuk dalam kandungan sukatan.

II. memastikan soalan mengandungi pelbagai aras kemahiran. III. menentukan kesahan kandungan. IV. memastikan soalan ujian tidak terlalu mudah atau terlalu sukar.

A. I dan III sahaja. B. I, II dan III sahaja.* C. IV sahaja. D. I, II, III dan IV.

5. Dari aspek manakah ujian esei lebih baik daripada ujian objektif?

A. Perwakilan kandungan yang lebih menyeluruh mengikut topik. B. Kesahan muka yang lebih tinggi. C. Kebolehpercayaan ujian yang lebih tinggi. D. Mengukur kebolehan penyelesaian masalah yang melibatkan pelbagai kemahiran

dan pengetahuan dengan lebih berkesan. * 6. Manakah daripada ujian esei berikut yang mungkin mempunyai kebolehpercayaan

paling tinggi? A. Satu soalan dengan 500 patah perkataan. B. Dua soalan dengan 250 patah perkataan setiap satu. C. Lima soalan dengan 100 patah perkataan setiap satu. * D. Kebolehpercayaan soalan essei sukar dianggarkan. 7. Melissa mendapat markah 75 dalam satu ujian geografi di sekolahnya baru-baru ini.

Rumah gurunya ditenggelami air dan semua kertas jawapan turut musnah. Melissa dan rakan-rakannya dikehendaki mengambil ujian tersebut sekali lagi pada keesokan harinya. Kali ini Melissa mendapat 75 markah juga. Apakah kesimpulan yang boleh dibuat berdasarkan keputusan ujian Melissa?

A. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut boleh

dipercayai. * B. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut TIDAK boleh

dipercayai.

Page 55: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 14

C. Tiada bukti yang boleh digunakan untuk membuat penilaian tentang kebolehpercayaan ujian geografi tersebut.

D. Keputusan ujian tersebut menunjukkan bukti kesahan yang tinggi.

8. Dalam satu penilaian personaliti menggunakan skala kadar, Cikgu Nora memberi skor yang tinggi kepada Elly yang menunjukkan Ella seorang pelajar popular di kalangan rakan-rakannya. Pembantu guru di kelas tersebut pula memberi skor yang rendah menunjukkan Elly sukar bekerjasama dalam tugasan kumpulan. Hal ini menunjukkan

A. keputusan pengukuran tersebut tidak boleh dipercayai. * B. keputusan pengukuran tersebut boleh dipercayai, tetapi sukar diinterpretasi. C. tiada bukti yang boleh digunakan untuk membuat penilaian tentang

kebolehpercayaan pengukuran tersebut. D. keputusan pengukuran tersebut menunjukkan bukti kesahan yang rendah.

9. Manakah antara berikut paling tepat menggambarkan kesahan?

A. Kesahan menerangkan sama ada proses pengumpulan data konsisten dalam mengukur apa yang diukur.

B. Kesahan menerangkan sama ada proses pengumpulan data mempunyai aras kesukaran yang sesuai.

C. Kesahan adalah berkaitan dengan keseragaman prosedur pentadbiran, pemarkahan, dan interpretasi data.

D. Kesahan menerangkan sama ada proses pengumpulan data benar-benar mengukur apa yang sepatutnya diukur. *

10. Pengetua SMK Keembong menerima aduan daripada ibu bapa yang tidak berpuas hati dengan kualiti Peperiksaan Percubaan Sains PMR yang dikatakan mengandungi terlalu banyak soalan daripada tajuk fizik, sedangkan daripada tajuk Kimia dan Biologi tidak mencukupi. Setelah disiasat, aduan tersebut didapati benar. Manakah antara ciri-ciri ujian berikut yang kurang memuaskan?

A. Kesahan criterion. B. Kebolehpercayaan bentuk setara. C. Kesahan kandungan. * D. Ketekalan dalaman.

JAWAPAN 1. B 6. C 2. C 7. A 3. B 8. A 4. B 9. D 5. D 10. C

Page 56: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 15

RUJUKAN

Rujukan Utama Linn, R.L. & Miller, D. E.(2005). Measurement and Assessment in Teaching ( 9th ed.). New Jersey: Prentice-Hall, Inc.

Reynolds, C. R., Livingston, R. B., and Willson, V. (2009). Measurement and assessment in

education. New Jersey: Pearson Education, Inc.

Rujukan Tambahan

Abu Bakar Nordin, (1995). Penilaian Afektif. Kajang, West Malaysia: Masa

Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia :

Quantum Books.

Cunningham, G.K. (1998). Assessment in the Classroom. London : Falmer Press.

Hopkins, K.D. (1998). Educational and Psychological Measurement and Evaluation ( 8th ed.).

Needham Heights : Allyn & Bacon.

Linn, R.L. & Gronlund, N.E.(2000). Measurement and Assessment in Teaching ( 8th ed.). New Jersey: Prentice-Hall, Inc.

Notes on Reliability and Validity of the Delaware Student Testing Program,

http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf, retrieved on 21 Feb 2011.

Popham, W.J. (1999). Classroom Assessment. Boston : Allyn & Bacon.

Payne, D.A. (1997). Applied Educational Assessment. London : Wadsworth Pub. Company.

Reynolds, C. R., Livingston, R. B., and Willson, V. (2006). Measurement and assessment in

education. New Jersey: Pearson Education, Inc.

Sax, G. (1997). Principles of Educational and Psychological Measurement and Evaluation (4th

ed.). Belmont : Wadsworth Pub. Company.

Tan Hui Leng & Ee Ah Meng, (1996). Penilaian dalam Proses Pendidikan. Kulala Lumpur: Fajar

Bakti.

Ward, A.W. (1999). Assessment in the Classroom. Belmont : Wadsworth Pub. Co.

Page 57: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 16

Page 58: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

K e s a h a n d a n K e b o l e h p e r c a y a a n | 17

Page 59: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 1

UNIT 5

PENSKORAN, PENGGREDAN, PENTAFSIRAN DAN PELAPORAN

HASIL PEMBELAJARAN

Di akhir unit ini, anda diharap dapat:

1. Menganalisis dan mentafsir skor. 2. Menggunakan hasil penilaian untuk menambah baik pengajaran. 3. Menghuraikan cara melapor kepada pelajar, ibu bapa dan pihak lain.

PENGENALAN

Murid takut hendak tunjukkan kad laporan kepada bapa

Rajah 5.1 Kesan gred dan pelaporan kepada murid dan bapa

Page 60: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 2

Pernahkah anda berada dalam situasi murid di atas? Pernahkah juga anda merasakan bahawa

diri anda tidak cukup tepat digambarkan melalui penaksiran yang menggunakan sekeping kad

sahaja?

dakah anda tahu bahawa gred yang guru berikan kepada murid sangatlah besar kesannya kepada

pembelajaran murid. Selain gred yang terdapat di dalam kad laporan murid, bagaimana pelaporan

prestasi murid itu didokumenkan adalah penting. Adakah pelaporan itu bersifat objektif, telus dan

mempunyai kebolehpercayaan? Adakah pelaporan itu bersifat berterusan? Adakah pelaporan itu juga

bersifat professional? Iaitu bertujuan untuk menggalakkan pembelajaran terus berlaku dengan lebh maju.

Mari kita bayangkan beberapa keadaan dalam masyarakat kita. Pertama, Halim adalah seorang murid

yang pandai tetapi dia seorang yang cepat panik dan amat gementar apabila hendak menduduki

peperiksaan.bertulis. Walaupun semasa dalam kelas, Halim dapat menjawab dan mengikuti pelajaran

dengan baik tetapi keputusan gred peperiksaannya sentiasa kurang baik. Kedua, Bapa Rudy seorang

yang panas baran dan sentiasa menghendaki Rudy memperoleh gred A dalam semua mata pelajarannya

di sekolah. Ketiga, Sarah seorang yang pasif, tidak suka bercakap dan tidak mempunyai ramai kawan, dia

hanya menghabiskan masanya dengan membaca dan tidak berinteraksi dengan orang lain.

Bagaimanapun gred peperiksaan Sarah adalah cemerlang. Bila anda sudah selesai memahami ketiga-tiga

situasi berkenaan, buat refleksi dengan menjawab soalan berikut:

Adakah gred yang diperoleh menggambarkan prestasi sebenar murid-murid itu? Adakah

berkemungkinan gred yang mereka perolehi akan menimbulkan ,

kemurungan, salah laku seperti menipu dalam peperiksaan atau

kesombongan?

Adakah pelaporan gred murid-murid tersebut membantu murid belajar dengan

cemerlang dan mencapai matlamat pembelajaran untuk menghasilkan individu yang

seimbang dari segi jasmani, emosi, rohani, intelek dan sosial?

ISI KANDUNGAN

Apa itu penskoran?

Sebelum kita mempelajari berkenaan penggredan, kita akan melihat dahulu apa itu penskoran. Penskoran

sangat berkait rapat dengan pengukuran. Di dalam bilik darjah, contoh pengukuran yang paling lazim ialah

apabila guru memberikan skor selepas sesuatu ujian atau kuiz dijalankan. Penskoran ialah proses

memberi skor kepada jawapan murid. Iaitu penskoran menghasilkan satu huraian prestasi dalam bentuk

numerik.

Terdapat dua kaedah penskoran iaitu penskoran holistik dan penskoran analitik. Penskoran holistik

melihat yang keseluruhan itu adalah lebih besar daripada jumlah kesemua bahagian yang terlibat. Ia

melihat hubungan dan saling kaitan di antara kesemua bahagian yang terlibat. Seandainya mana-mana

A

Page 61: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 3

satu bahagian itu didapati sangat lemah, keseluruhan prestasi berkemungkinan akan terjejas dengan

teruk.Oleh kerana itu, penskoran holistik biasanya dilakukan selepas penskoran analitik serta memperoleh

maklumat daripada penskoran analitik. Penskoran analitik boleh membantu seseorang guru daripada

terlepas pandang akan ciri-ciri yang sepatutnya merupakan faktor penting yang patut dimasukkan dalam

penskoran holistik. Dengan lain perkataan,penskoran holistik menggambarkan pandangan keseluruhan,

misalnya sebuah karangan, dengan memberikan satu skor sahaja.

Manakala penskoran analitik melihat sebuah karangan itu terdiri daripada banyak bahagian, dan

memberikan skor berasingan bagi setiap bahagian. Penskoran analitik memberikan maklumbalas yang

mendalam untuk pelajar menambahbaik aspek berbeza dalam karangan mereka. Dengan kata

lain,penskoran analitik bermaksud menjumlahkan kesemua markah setiap satu bahagian. Penskoran

analitik mempunyai dua tujuan. Pertamanya, ia membimbing guru untuk menumpukan perhatian ke atas

perkara-perkara yang relevan. Keduanya ialah untuk menyediakan maklum balas yang spesifik kepada

pelajar untuk membantu mereka dalam membuat persediaan.

Apakah langkah-langkah untuk memastikan penskoran dibuat secara objektif?

Isikan carta alir di bawah bagi menunjukkan secara ringkas langkah-langkah untuk

memastikan penskoran dibuat secara objektif, sama ada seseorang guru menggunakan

penskoran holistik maupun analitik.

Rajah 5.2 Carta alir menunjukkan langkah-langkah utama penskoran secara objektif

A

Page 62: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 4

Selepas mengetahui bahawa terdapat dua kaedah penskoran iaitu holistik dan analitik, mari kita melihat

jenis-jenis skor yang ada. Dua jenis skor yang dikenalpasti ialah skor mentah dan skor terbitan.

Mungkin anda pernah dengar kedua-dua istilah ini.

Oleh itu,tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan skor mentah dan skor

terbitan

___________________________________________________________________________

____________________________________________________________________________

__________________________________________________________________________________

Perhati semula jawapan yang anda telah tulis, adakah sama dengan huraian di bawah.

Skor mentah ialah jumlah poin yang diperolehi pelajar atau bilangan jawapan yang betul. Contohnya:

1. Dua puluh huruf abjad dapat dinamakan dengan betul. 2. Empat puluh poin diperolehi dalam ujian pengetahuan am.

Skor mentah dan skor peratusan adalah sangat serupa. Contohnya:

1. Sembilan puluh peratus daripada100 soalan telah dijawab dengan betul. 2. Tujuh puluh lapan peratus daripada soalan sains itu dijawab dengan betul.

Jikalau anda menyatakan skor mentah adalah sama dengan skor peratusan, ia adalah benar bila bahan

dikenalpasti dengan jelas. Contohnya, “Sam dapat menamakan semua huruf abjad dengan betul” atau

“Nora menjawab 80% daripada soalan matematik dengan betul”.

Bagaimanapun, apabila tugasan yang perlu dilakukan dikenalpasti dengan eksplisit, skor mentah

mempunyai makna yang jelas tetapi tidak selalunya jelas bagi skor peratusan. Contohnya, “Rohani

menamatkan larian 200 meter dalam 12 saat”.

Skor terbitan ialah skor yang dimodifikasi atau ditukar daripada skor mentah. Kedua-dua skor mentah

dan skor peratusan tidak menunjukkan status rujukan norma. Supaya prestasi calon boleh dibandingkan

dengan kumpulan atau orang lain, skor mentah perlu ditukar kepada skor terbitan.

Page 63: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 5

Skor terbitan mutlak dan skor terbitan relatif (norma) adalah dua jenis skor terbitan. Bagi skor terbitan

mutlak, lazimnya skor diberikan sebagai perbandingan prestasi murid berasaskan satu standard yang telah

ditentukan lebih awal, iaitu selalunya menggunakan sistem 100-poin. Manakala skor terbitan relatif ialah

skor yang membandingkan prestasi murid berdasarkan prestasi ahli kumpulan.

Apabila anda sudah memahami apakah itu penskoran, langkah seterusnya anda perlu memahami apakah

penggredan. Cuba anda huraikan apakah yang ada tahu mengenai penggredan dengan menulisnya di

ruangan yang disediakan.

____________________________________________________________________________

_________________________________________________________________________

__________________________________________________________________________________

Apa itu penggredan?

agi menjawab soalan tersebut, mari kita mendefinisikan istilah penggredan. Penggredan ialah

proses memberi gred ke atas jawapan atau skor murid dan biasanya gred diberi dalam bentuk

abjad. Gred yang akan diberikan kepada murid sepatutnya melambangkan sejauh mana objektif

pengajaran dan pembelajaran telah dicapai, dan sepatutnya selari dengan polisi sekolah atau negara.

Jika penaksiran yang dijalankan mengandungi pelbagai kaedah seperti penaksiran konvensional dan

penaksiran autentik, maka masalah untuk menggred ialah bagaimana untuk merumuskan koleksi

maklumat-maklumat yang berbeza ini hanya dengan menggunakan satu gred huruf atau laporan ringkas

sahaja.

Tahukah anda bahawa terdapat dua jenis penggredan? Iaitu penggredan rujukan norma dan

penggredan rujukan kriteria.

Penggredan rujukan kriteria menyatakan prestasi seseorang yang dibandingkan dengan kriteria piawai

yang telah ditetapkan terlebih dahulu. Misalnya,

menaip pada kadar 37 perkataan seminit .

melakukan CPR, menggunakan peralatan yang disediakan, dengan cara yang telah dihuraikan.

Supaya penggredan jenis ini berguna, kriteria yang bermaksud “asas perbandingan” atau “ pemerolehan

satu kontinum ilmu, daripada tiada kecekapan langsung kepada satu prestasi yang sempurna” (Glaser,

1963, dalam Hanna & Dettmer, 2004). Ia bukan bermaksud “aras pencapaian yang diperlukan”. Kriteria itu

mestilah bidang kandungan atau kemahiran yang boleh dikenalpasti secara eksplisit. Bidang itu mestilah

B

Page 64: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 6

boleh diperhalusi dan dapat ditunjukkan dengan jelas perlakuan yang bagaimana termasuk dalam bidang

tersebut dan bahagian mana yang tidak termasuk.

Penggredan rujukan norma menyatakan prestasi seseorang yang dibandingkan dengan prestasi

sekumpulan orang lain. Misalnya,

memperoleh gred ekuivalen 4.7 daripada kumpulan kebangsaan dalam ujian pemahaman.

memenangi peraduan menaip laju.

Supaya penggredan jenis ini berguna, ia mesti lah membandingkan prestasi seseorang itu dengan prestasi

kumpulan yang relevan dan betul. Kumpulan rujukan atau “norma” mestilah dihuraikan dengan jelas,

barulah perbandingan yang bermakna boleh dilakukan. Jadi, apabila kumpulan rujukan itu dihuraikan

dengan secukupnya dan relevan bagi tujuan pemberian makna, maka ia dapat menghuraikan status calon

secara perbandingan yang bermakna di antaranya dengan orang lain.

Bagaimanakah kedudukan murid ditentukan? Mari kita tentukannya berdasarkan penggredan rujukan

kriteria dan penggredan rujukan norma.

erdasarkan penggredan rujukan kriteria , kedudukan murid dapat ditentukan melalui berbagai cara.

Salah satunya ialah dengan mencampurkan semua skor mentah tanpa wajaran. Jikalau pemberian

gred yang lazimnya melibatkan gabungan keputusan daripada berlainan jenis penaksiran, termasuk

ujian, projek, laporan, dan kerja makmal, maka jika setiap elemen hendak dimasukkan dalam gred

berasaskan kepentingan relatif setiap elemen itu, data mestilah digabungkan dengan cara membuat

wajaran yang betul. Begitu juga skor-skor mentah dicampurkan dengan wajaran mengikut mata pelajaran

apabila melibatkan lebih daripada satu mata pelajaran. Akhirnya kita akan memperoleh skor komposit.

Rubrik iaitu “panduan penskoran” juga boleh digunakan. Apabila semua skor komposit bagi setiap murid

telah diperolehi, kedudukan murid akan dapat ditentukan dengan tepat.

ebelum penggredan rujukan norma digunakan untuk menentukan kedudukan murid, skor mentah

perlu ditukarkan ke skor terbitan. Untuk membandingkan prestasi di kalangan murid, semua ujian

yang diambil mereka mestilah berada pada skala yang sama. Skor-skor mentah tidak boleh

digunakan kerana ujian-ujian itu mungkin berbeza dari segi bilangan item ujian ataupun darjah kesukaran

item.

B

S

Page 65: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 7

Apakah kategori skor terbitan yang utama dan selalu digunakan di sekolah?

Isikan tiga kategori utama skor terbitan ke dalam Rajah 5.4 di bawah

Rajah 5.3 Tiga kategori utama skor terbitan

angkat persentil (Percentile Rank) ialah suatu peratusan daripada satu kumpulan rujukan. Ia

dapat menunjukkan kedudukan relatif seseorang murid dalam satu kumpulan berasaskan peratusan

ahli-ahli kumpulan itu yang memperoleh skor pada atau di bawah skor mentah murid tersebut.

Sebagai contoh, jika skor mentah 30 bersamaan dengan persentil rank 60, itu bermakna 60 % daripada

ahli kumpulan tersebut memperoleh skor mentah sama dengan atau lebih rendah daripada 30. Dengan

menukarkan skor mentah kepada pangkat persentil , skor-skor mentah itu telah berada di atas skala yang

mempunyai makna yang sama dengan kumpulan-kumpulan yang berbeza saiz dan tempoh masa ujian

yang berbeza.

Supaya lebih jelas, mari kita kira dan bentukkan satu jadual sebaran kekerapan dan pangkat persentil

untuk satu ujian objektif yang terdiri daripada 40 item. Ikut langkah-langkah berikut:

Skor mentah disusun dari tinggi ke rendah (kolum 1).

Bilangan murid yang memperoleh setiap skor itu disenaraikan ke dalam kolum frekuensi (kolum

2).

Skor frekuensi ditambah dari bawah ke atas (iaitu dengan menambah setiap skor frekuensi

kepada jumlah frekuensi dari semua skor di bawahnya untuk memperoleh frekuensi kumulatif

(CF)(kolum 3).

Untuk memperoleh pangkat persentil (kolum 4), gunakan formula berikut:

P

B

Page 66: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 8

Di mana PR = pangkat persentil

CF = frekuensi kumulatif

Untuk menunjukkan bagaimana mengira pangkat persentil, mari kira dua skor mentah berikut:

Jadual 5.1 Taburan frekuensi dan pangkat persentil untuk satu ujian objektif terdiri daripada 40 item

_____________________________________________________________________________________

1 2 3 4

Skor Ujian Frekuensi Frekuensi Kumulatif Pangkat Persentil *

_____________________________________________________________________________________

37 1 30 98

36 1 29 95

35 0 28 93

34 2 28 90

33 2 26 83

32 3 24 75

31 2 21 67

30 2 19 60

29 4 17 50

28 2 13 40

27 2 11 33

26 2 9 27

25 4 7 17

24 2 3 7

23 1 1 2

________________

N = 30

_________________________________________________________________________________

* Dibundarkan kepada nombor bulat yang terdekat.

Bila mentafsir pangkat persentil, pelajar hendaklah berhati-hati, kerana pangkat persentil menghuraikan

prestasi ujian berdasarkan peratusan murid-murid yang memperoleh skor yang lebih rendah dan bukan

Page 67: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 9

peratusan item yang dijawab dengan betul. Peratusan skor betul ialah tafsiran rujukan kriteria manakala

pangkat persentil adalah tafsiran rujukan norma kerana ia menunjukkan satu kedudukan relatif.

Keduanya pangkat persentil sentiasa spesifik kepada sesuatu kumpulan tertentu. Sebagai contoh, pangkat

persentil 95 dalam kumpulan murid cerdik mewakili prestasi ujian yang lebih tinggi daripada pangkat

persentil 90 dalam kumpulan murid sederhana. Jadi pelajar perlu mengetahui sifat semulajadi sesuatu

kumpulan bila hendak menghuraikan kedudukan relatif seseorang murid.

Ketiganya, pangkat persentil tidak tersusun pada jarak yang sama di atas skala. Perbezaan 5 pangkat

persentil di tengah-tengah taburan skor mewakili prestasi ujian yang lebih kecil berbanding perbezaan 5

pangkat persentil di hujung-hujung taburan. Ini adalah kerana persentil rank adalah didasarkan kepada

peratus murid yang dilangkau atau dapat ditandingi. Dan terdapat peratusan murid yang lebih besar di

tengah-tengah taburan skor untuk dilangkau berbanding di hujung-hujung taburan. Misalnya, di hujung

taburan, perbezaan beberapa poin skor mentah tidak banyak mengubah pangkat persentil disebabkan

terdapat hanya sedikit sahaja skor tinggi.

kor gred ekuivalen selalu digunakan di tahap sekolah rendah. Skor mentah seorang murid

daripada satu ujian ditukarkan ke tahap gred yang sepadan dengan skor mentah purata murid-murid

di dalam kumpulan norma. Jadual di dalam manual ujian menunjukkan kolum-kolum yang selari di

antara skor mentah dengan gred ekuivalen. Pelajar hanya perlu merujuk jadual dalam manual itu dan

mendapatkan gred ekuivalen untuk mana-mana skor mentah yang diingini.

Dikatakan skor gred ekuivalen berkemungkinan merupakan skor yang paling kerap disalah tafsir. Mari kita

lihat apakah yang dimaksudkan dengan skor gred ekuivalen dan yang mana tidak. Katalah kita

memperoleh skor gred ekuivalen berikut daripada suatu ujian bateri untuk Liam, yang berada dalam

pertengahan tahun di darjah empat.

Membaca 4.5

Bahasa 6.5

Matematik 7.8

Perhatikan bahawa skor gred ekuivalen dipersembahkan berdasarkan tahap gred dan bulan dalam tahun

pengajian. Dilihat di sini bahawa skor Liam dalam membaca bersamaan dengan skor purata yang

diperoleh oleh murid-murid (daripada kumpulan norma) yang berada di pertengahan tahun di darjah empat.

Jadi dari aspek membaca, Liam ditafsirkan sebagai sederhana. Dari aspek bahasa, Liam ditafsirkan ke

hadapan dua tahun, dan dari aspek matematik, dia ditafsirkan ke hadapan lebih dari tiga tahun. Adakah itu

bermakna Liam boleh membuat kerja dan tugasan pada tahap-tahap ini?

Tidak, sebaliknya besar kemungkinan itu bermaksud yang Liam boleh melakukan tugasan gred empat

lebih cepat dan lebih cekap daripada murid darjah empat yang lain. Dalam ujian-ujian tersebut

S

Page 68: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 10

berkemungkinan besar tiada soalan-soalan pada tahap enam dan tujuh dimasukkan. Demikian juga jika

gred ekuivalen yang rendah diperolehi, misalnya jika Sara, murid darjah empat, memperoleh skor

matemaik 3.0, itu bukan bermaksud Sara hanya dapat selesaikan tugasan matematik darjah tiga. Lebih

tepat ialah itu bermaksud sara menyelesaikan tugasan matematik darjah empat dengan lebih lambat dan

melakukan lebih banyak kesalahan berbanding murid darjah empat yang lain.

Oleh kerana itu, pelajar perlu ingat bahawa skor gred ekuivalen bukanlah satu standard yang hendak

dicapai tetapi hanyalah skor purata murid-murid dalam kumpulan norma. Juga,skor gred ekuivalen yang

terlalu tinggi atau rendah bukan indikator prestasi ujian yang boleh disandarkan sebagaimana skor gred

ujian yang berdekatan dengan tahap gred murid itu. Ini adalah kerana skor ekuivalen yang tinggi dan

rendah lazimnya diperolehi melalui proses ekstrapolasi dan tidak mewakili skor purata yang diperoleh oleh

kumpulan-kumpulan tersebut.

kor piawaian dapat menghuraikan prestasi ujian berdasarkan berapa jauh suatu skor mentah itu di

atas atau di bawah purata. Ianya dinyatakan dalam unit yang dihitung daripada min dan sisihan

piawai suatu set skor. Sebagai mana pelajar tahu min digunakan sebagai suatu purata. Iaitu

dengan menjumlahkan semua skor dan kemudian dibahagi dengan bilangan skor. Sisihan piawai

menunjukkan sebaran semua skor dalam satu set skor. Formula untuk menghitung sisihan piawai ialah

Di mana ∑ = jumlah

X = satu skor ujian

N = bilangan skor

M = min

√ = punca ganda dua

Sisihan piawai sangat penting dan digunakan dengan meluas dalam pengujian. Supaya pelajar lebih

memahami min dan sisihan piawai, elok kita menggunakan keluk norma supaya lebih jelas. Rajah 5.4

menunjukkan satu contoh keluk norma. Ianya berbentuk loceng yang simetrikal. Taburan skor tertumpu

berdekatan dengan min yang berada di titik tengah dalam taburan norma. Frekuensi skor berkurangan

apabila semakin jauh daripada min. Apabila keluk norma dibahagikan ke dalam unit sisihan piawai yang

sama jaraknya sepanjang garisan dasar keluk itu, setiap bahagian di bawah keluk mengandungi peratusan

kes yang tetap. Jadi, 34 peratus daripada kes, jatuh di antara min dan +1 SD, 14 peratus di antara +1 SD

dan +2 SD, dan 2 peratus di antara +2 SD dan +3 SD. Oleh kerana hanya 0.13 peratus sahaja kes jatuh di

S

Page 69: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 11

atas dan di bawah tiga sisihan piawai dari min, rata-rata skor taburan norma jatuh di antara -3 dan +3

sisihan piawai dari min.

Untuk membantu pemahaman maksud sisihan piawai, satu set skor mentah yang mempunyai min 40 dan

sisihan piawai 5 diletakkan di bawah garisan dasar keluk. Perhatikan bahawa min skor mentah 40

diletakkan di titik sifar dan jarak satu sisihan piawai ialah 5 poin skor mentah di merata garisan dasar lekuk.

Jadi, titik satu sisihan piawai di atas min bersamaan 45 (40 + 5) dan titik satu sisihan piawai di bawah min

bersamaan 35 (40 – 5). Bagi set skor ini, dianggarkan 68 peratus skornya (lebih kurang dua per tiga) jatuh

di antara 35 dan 45, dan 99.7 peratus jatuh di antara 25 dan 55.

Apabila kita mengira sisihan piawai bagi satu set skor yang bertaburan norma, kita sebenarnya

menentukan sejauh mana kita perlu pergi di atas (atau di bawah) min dalam poin skor mentah untuk

memasukkan 34 peratus dari semua kes.

Rajah 5.4 Keluk norma dengan anggaran peratus kes di dalam setiap sela (peratusan telah dibundarkan)

Page 70: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 12

Apakah skor-z, skor-T, skor NCE, skor abiliti, dan stanine?

Adakah pelajar tahu yang semua skor berkenaan adalah skor piawaian? Ya, semuanya adalah skor

piawaian yang berasaskan unit sisihan piawai. Mari kita lihat satu demi satu.

kor-z ini menunjukkan berapa jauhkah suatu skor mentah berada di atas atau di bawah min, dalam

unit sisihan piawai. Skor mentah 45 dalam Rajah 5.4 yang dibincangkan tadi akan dinyatakan

sebagai satu skor-z 1.0 sebab ianya satu sisihan piawai di atas min. Skor mentah 30 pula akan

dinyatakan sebagai satu skor-z -2.0 sebab ianya dua sisihan piawai di bawah min. Formula untuk

mengira skor-z ialah:

Contohnya, skor-z untuk 47 dalam Rajah 5.4 dikira begini:

Oleh itu, skor mentah 47 ialah 1.4 sisihan piawai di atas min. Oleh kerana skor-z didapati menggunakan

titik perpuluhan dan adakalanya bertanda negatif, untuk mengelakkan kekeliruan, skor-z jarang digunakan

secara terus. Sebaliknya skor-z ditukar kepada jenis skor piawaian yang lain yang menggunakan nombor

bulat dan bernilai positif.

kor-T memiliki min 50 dan sisihan piawai 10. Skor-T diperolehi daripada skor-z dengan

menggunakan formula:

Skor- T = 50 + 10 (skor-z )

Misalnya bila skor-z ialah 1.4, maka skor-T = 50 + 10 (1.4) = 64

Skor- T adalah mudah untuk ditafsirkan sebab skor-T sentiasa mempunyai min dan sisihan piawai yang

sama. Suatu skor-T 60 sentiasa bermaksud satu sisihan piawai di atas min dan suatu skor-T 30 sentiasa

bermaksud dua sisihan piawai di bawah min. Jadi, dengan menggunakan skor-T, prestasi seseorang

individu daripada pelbagai ujian boleh dibandingkan secara terus, dan skor-skor boleh digabung atau

S

S

Page 71: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 13

dipuratakan tanpa berlakunya perubahan pada saiz sisihan piawai, tidak seperti bila menggunakan skor

mentah.

Bilamana taburan norma boleh djangkakan, skor-T boleh ditafsirkan berdasarkan persentil rank kerana

keduanya saling berhubungan seperti yang ditunjukkan dalam Rajah 5.5. Perhatikan bahawa skor-T 30

adalah bersamaan dengan persentil rank 2, skor-T 40 bersamaan dengan persentil rank 16, dan

begitulah seterusnya.

Supaya pelajar tidak keliru, perlu diingatkan bahawa walaupun kedua-dua skor-T dan persentil rank

menggunakan 50 sebagai min dan nombor dua digit, persentil rank merujuk kepada peratus individu yang

jatuh pada atau di bawah sesuatu skor, manakala skor-T merujuk kepada berapa unit sisihan piawai

sesuatu skor di atas atau di bawah min. Perhatikan juga bahawa walaupun kedua-duanya mempunyai min

yang sama, di bawah min persentil rank bernilai lebih kecil daripada skor-T dan di atas min persentil rank

lebih besar daripada skor-T. Ini adalah kerana seperti pelajar sudah tahu persentil rank bertumpu di

tengah-tengah taburan dan tersebar keluar di hujung-hujung, manakala skor-T bertabur pada unit yang

sekata di seluruh taburan skor.

kor ekuivalen keluk-norma (Normal-curve equivalent score,NCE) merupakan satu lagi skor

piawaian yang dibimbangi mengelirukan pelajar. Ini adalah kerana skor NCE juga menggunakan 50

sebagai min, tetapi sisihan piawai ialah 21.06. Ini membolehkan terbentuknya satu set skor yang

memiliki unit yang sekata, seperti skor-T, tetapi julat skornya ialah dari 1 ke 99. Julat persentil rank juga

dari 1 ke 99, tetapi persentil rank tidak berada dalam unit yang sekata. Jadi bila pelajar mentafsirkan skor

NCE, jangan keliru dengan skor-T, yang selalunya mempunyai julat yang terhad (lazimnya 20 ke 80).

Baiklah, kita akan lihat apakah pula skor abiliti dan skor stanine.

kor abiliti dahulunya dipanggil sisihan IQ. Ia selalu melibatkan penerbit ujian bateri yang

melaksanakan ujian abiliti pembelajaran, kognitif, atau kecerdasan ke atas kumpulan norma. Skor

yang diperolehi daripada ujian-ujian ini dilaporkan sebagai skor piawaian dengan minnya 100 dan

sisihan piawainya 16 atau 15. Skor ini ditafsirkan sama seperti mana-mana skor piawaian yang lain. Skor

116 bermaksud satu sisihan piawai di atas min, (Rajah 5.5).

kor stanine merupakan skor ujian yang dipersembahkan dalam bentuk satu digit. Iaitu skala

stanine menaburkan skor mentah kepada sembilan bahagian. Skor stanine yang tertinggi ialah 9,

yang terendah ialah 1, dan stanine 5 terletak di tengah tengah taburan. Setiap satu stanine, kecuali

9 dan 1, merangkum satu band skor mentah, separuh dari kelebaran satu sisihan piawai. Jadi stanine

S

S

S

Page 72: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 14

adalah skor piawaian yang mempunyai minnya 5 dan sisihan piawainya 2. Taburan stanine dan peratusan

kes dalam setiap stanine ditunjukkan dalam Rajah 5.5.

Rajah 5.5 Hubungan persentil rank, skor-z, skor-T, skor NCE, skor abiliti, dan stanine.

Sewaktu pelajar membandingkan skor murid daripada dua ujian yang berlainan dalam satu ujian bateri,

perbezaan dua stanine lazimnya adalah signifikan. Jadi bila mentafsirkan skor-skor berikut bagi murid ini,

kita merumuskan pencapaian murid ini adalah tinggi dalam matematik tetapi tidak ada perbezaan di antara

membaca dan bahasa.

Stanine membaca = 5

Page 73: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 15

Stanine bahasa = 4

Stanine matematik = 7

Menukarkan skor mentah kepada stanine meletakkan skor daripada ujian berlainan ke atas satu skala

piawaian yang sama, dengan unit-unit yang setara. Jadi perbezaan di antara stanine 5 dan stanine 7

adalah sama seperti perbezaan antara stanine 4 dan stanine 6.

Bolehkah pelajar fikirkan apakah tujuan dan peranan penggredan? Adakah penggredan

memberikan munafaat kepada murid dan ibu bapa mereka? Adakah penggredan memberi

faedah kepada guru, sekolah dan masyarakat? Bagaimana?

Mengapa penggredan diperlukan?

agi menjawab soalan di atas, kita perlu memikirkan apakah tujuan penggredan dijalankan di

sekolah. Pada amnya penggredan adalah perlu untuk memberi gambaran atau petunjuk sejauh

mana murid-murid telah mencapai matlamat pengajaran dan pembelajaran. Namun tujuan

penggredan juga telah menjadi pelbagai disebabkan oleh tuntutan keperluan hidup. Mungkin tujuan dan

peranan penggredan boleh dikategorikan kepada tiga:

Boleh memberi faedah kepada setiap murid dan ibu bapa mereka.

Membimbing tugas guru dan sekolah.

Memenuhi keperluan masyarakat.

Adakah anda bersetuju dengan hujah ini? Mengapa?

embantu murid dan ibu bapa adalah salah satu tujuan penggredan yang utama. Markah

merupakan maklumbalas kepada murid dan ibu bapa mengenai pencapaian murid. Ibu bapa

boleh memantau usaha murid, memberi semangat dan galakan, menawarkan bantuan, serta

dapat maklumat mengenai perkembangan murid.

Maklumbalas mengenai pencapaian membolehkan murid mengetahui tentang dirinya. Gred dapat

memberikan petunjuk akan kekuatan dan kelemahan relatif intraindividu dan mengenai kebolehan dan

batasan dirinya berbanding murid lain. Maklumat ini akan membimbing murid untuk membuat keputusan-

keputusan penting seperti memilih bidang, pendidikan di masa depan, dan memilih karier. Dapat

mengenali konsep diri yang realistik adalah amat penting semasa murid membesar.

Maklumbalas daripada gred bagaimanapun sepatutnya disampaikan kepada murid dengan cara yang tidak

menggambarkan penilaian harga diri seseorang murid.

B

M

Page 74: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 16

embantu guru dan sekolah adalah tujuan penggredan yang seterusnya. Gred membantu guru

memantau kemajuan murid. Kepada murid secara individu, guru dapat memberi arahan yang

spesifik kepada individu berkenaan. Jadi pengajaran berpusatkan individu boleh dilaksanakan.

Manakala bagi kedua-dua peringkat individu dan kumpulan, guru boleh merencana dan melaksanakan

pelbagai strategi pengajaran.

Strategi seperti mengumpul murid-murid kepada kumpulan yang homogeneous berdasarkan kelemahan

atau kekuatan mereka dalam sesuatu mata pelajaran atau satu bahagian daripada mata pelajaran

membolehkan guru memberi peneguhan dan tumpuan kepada subjek berkenaan.

Gred juga digunakan di sekolah sebagai syarat kemasukan murid ke dalam kursus atau bidang yang

memerlukan prasyarat. Misalnya, untuk mengambil mata pelajaran fizik, murid berkenaan perlulah

mendapat sekurang-kurangnya gred C untuk algebra.

emenuhi keperluan masyarakat tidak dapat dielakkan, di mana gred digunakan oleh institusi di

luar sekolah seperti kolej, universiti, matrikulasi dan seumpamanya. Sama ada sebagai rujukan

untuk syarat menerima murid di institusi berkenaan, atau menentukan kursus dan bidang yang

paling sesuai diikuti. Gred juga selalu dijadikan sebagai asas untuk menghulurkan bantuan biasiswa atau

anugerah.

Gred juga digunakan oleh bidang perniagaan, industri, dan kerajaan. Markah daripada sekolah dan kolej

yang diterima oleh murid dan pelajar memberikan kepada prospektif majikan maklumat yang sangat

berguna. Akhirnya markah terlibat dalam pemberian lesen untuk menjalankan tugas ataupun merupakan

sijil kecekapan. Ini untuk memastikan masyarakat dan orang ramai mendapat khidmat daripada petugas

dan pekerja yang sah dan berkelulusan dalam bidang pekerjaan yang dijalankannya.

Bagaimanakah pelaporan patut dilakukan?

Bagaimanakah anda akan laporkan prestasi murid anda kepada ibu bapa mereka? Bolehkah anda

namakan beberapa cara yang boleh dilakukan? Sila tuliskan idea anda di sini:

__________________________________________________________________________

__________________________________________________________________________

M

M

Page 75: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 17

dakah anda telah menulis kaedah seperti menggunakan gred abjad, penilaian bertulis, dan

konferen? Jika itu yang anda tulis saya ucapkan syabas! Tidak boleh dipertikaikan bahawa

pelaporan yakni proses memberi maklumbalas kepada ibu bapa tentang prestasi murid mestilah

bersifat objektif, berterusan, dan ada kebolehpercayaan. Kita boleh merangkumkan kaedah menggunakan

gred abjad dan penilaian bertulis dalam kaedah konferen. Iaitu pertemuan dengan ibu bapa murid untuk

melaporkan prestasi murid.

Adakah anda perlukan sebarang kemahiran untuk konferen yang berkesan? Sudah tentu. Mana-mana

komunikasi memerlukan tiga elemen: penghantar, mesej, dan penerima. Kordinasi di antara ketiga-tiga

elemen ini adalah penting untuk memastikan kejayaan sesuatu konferen dan memerlukan langkah-langkah

asas yang berikut:

Menyediakan bahan dan maklumat untuk konferen.

Menyusun kemudahan dan aturcara.

Membentuk hubungan baik dengan ibu bapa dan menghormati kepelbagaian.

Mendengar dengan teliti dan responsif kepada ahli keluarga dan murid.

Menyampaikan maklumat secara professional dan prihatin.

Mengenalpasti masalah dan perkara yang perlu diberikan perhatian.

Menyelesaikan masalah secara berpasukan.

Menunjukkan keikhlasan dan komited terhadap perkembangan murid.

Membuat tindak ikut dan susur ikut hasil konferen.

Membuat penilaian konferen untuk penambahbaikan perjumpaan di masa akan datang.

ersediaan untuk konferen melibatkan proses memaklumkan kepada ibu bapa tujuan dan perkara

yang akan dibincangkan. Guru perlu mengumpul sampel kerja-kerja murid, yang baik dan juga

yang kurang baik untuk dilihat oleh ibu bapa dan untuk dibincangkan. Sampel sepatutnya daripada

pelbagai pemerhatian dan merupakan asas kepada markah yang murid perolehi. Ini akan meningkatkan

kebolehpercayaan pentafsiran. Kesahan akan meningkat jika penaksiran dibuat berasaskan ciri-ciri murid

yang relevan.

Untuk memastikan ibu bapa dapat memahami bahan murid , masa yang cukup perlu diperuntukkan

kepada ibu bapa. Semasa mereka membaca dan meneliti bahan murid, komunikasi tidak patut

berlangsung. Adalah penting untuk sekolah merancang aturcara dan masa yang sesuai untuk konferen ini

supaya ibu bapa dapat datang dan guru tidak terlalu penat kerana perjumpaan yang padat. Ibu bapa juga

sepatutnya berjumpa dengan guru dalam suasana yang ada privasi dan perbincangan ibu bapa dengan

guru tidak didengari oleh ibu bapa yang lain.

enjalankan konferen sebenar dengan lancar adalah penting. Dua peraturan perlu dipegang

untuk menjayakan sesuatu konferen, iaitu memulakan konferen dalam nada positif dan

menamatkannya mengikut masa yang telah ditetapkan. Mulakan dengan menceritakan apa yang

murid telah capai dan kemajuan yang telah dilakukannya. Komunikasi yang sesuai ialah mendengar

A

P

M

Page 76: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 18

dengan responsif. Bila ibu bapa telah menjelaskan apa yang hendak dijelaskan dan menyoal soalan, guru

barulah boleh berkongsi maklumat dan memulakan proses penyelesaian masalah. Guru hendaklah jujur,

objektif dan melengkapkan diri dengan evidens kerja murid. Guru yang bijak tidak bercakap tentang guru

lain, murid lain dan ibu bapa lain.

indak ikut dan susur ikut hasil konferen adalah penting tetapi selalu diabaikan. Di penghujung

konferen, guru sepatutnya dapat melihat dengan jelas apakah rancangan yang akan dibuat di masa

akan datang. Siapa yang bertanggungjawab untuk apa? Bila? Di mana? Bagaimana keputusan itu

nanti hendak disampaikan kepada semua yang terlibat? Jadi terpulanglah kepada guru untuk menjadikan

dirinya mudah untuk dihubungi dan selalu menghubungi keluarga murid-muridnya.

enilai konferen sangat sesuai ditegaskan di sini. Guru mungkin bertanya secara tidak formal

soalan-soalan seperti, “Adakah ini satu pengalaman yang baik?” “Adakah semua orang pulang

dengan rasa puas hati?” “Adakah semua orang telah mengetahui kekuatan, kelemahan, dan

keperluan murid?” dan sebagainya. Namun adalah lebih baik lagi jika guru-guru mengisi rubrik atau

senarai semak yang sesuai untuk menilai konferen. Terkandung dalam rubrik itu mungkin mengenai

persiapan (agenda, portfolio, kemudahan), tujuan dan peranan setiap orang, rancangan tindakan yang

sesuai untuk akan datang, dan sebagainya. Ibu bapa juga boleh diberikan borang untuk menilai konferen.

Jika diberikan borang maka sediakan tempat untuk mengisi (misalnya di perpustakaan) dan ibu bapa

memasukkannya ke dalam kotak yang disediakan.

RINGKASAN

1. Penskoran ialah proses memberi skor kepada jawapan murid. Dua kaedah penskoran ialah penskoran holistik dan analitik. Skor biasanya berbentuk numerik. Jenis-jenis skor ialah skor mentah dan skor terbitan. Skor terbitan pula terbahagi dua iaitu skor terbitan mutlak dan skor terbitan relatif.

2. Penggredan ialah proses memberi gred ke atas jawapan atau skor murid. Gred biasanya dalam bentuk abjad. Terdapat dua jenis penggredan iaitu penggredan rujukan norma dan penggredan rujukan kriteria. Kedudukan pelajar boleh ditentukan berdasarkan penggredan rujukan kriteria dan juga berdasarkan rujukan norma.

3. Pelaporan ialah proses memberi maklumbalas kepada ibu bapa tentang prestasi murid. Pelaporan gred dan pencapaian murid mestilah objektif, ada kebolehpercayaan dan berterusan.

PENILAIAN KENDIRI

1. Dengan menggunakan perkataan sendiri, huraikan apa yang membezakan penskoran holistik

daripada penskoran analitik?

T

M

Page 77: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 19

2. Huraikan dengan terperinci langkah-langkah yang perlu dilakukan untuk memastikan penskoran

soalan subjektif dibuat secara objektif.

3. Apakah perbezaan utama antara pensentil rank daripada skor NCE?

4. Bagaimanakah anda akan menerangkan kedudukan murid anda kepada ibu bapanya berdasarkan

persentil rank?

5. Kenapakah min dan sisihan piawai itu penting dan perlu difahami? Bagaimanakah anda akan

terangkan maksud min dan sisihan piawai? Berikan beberapa contoh kegunaan min dan sisihan

piawai.

RUJUKAN Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New York: Mc-Graw

Hill.

Hanna, G. S. & Dettmer, P. A. (2004). Assessment for effective teaching: using context-adaptive planning.

Mexico City: Allyn and Bacon.

Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and Bacon

Page 78: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 20

JAWAPAN SERTA MAKLUM BALAS

Selain di atas ada lagi langkah-langkah yang lain yang boleh dikenalpasti. Masa perlu disediakan untuk

menanda jawapan subjektif secara objektif.

A

B

Page 79: KPD3016 Pengajaran, Teknologi Dan Penaksiran (Modul 3)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 21