TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

28
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN Menurut Mokhtar (1995), reliabiliti ujian boleh disebut sebagai darjah ketekalan antara dua pengukuran terhadap sesuatu benda, sesuatu ciri, atau sifat seseorang. Secara umum, kesilapan angkubah pengukuran adalah banyak terdapat dalam skor ujian dalam pendidikan (atau, dengan kata lain, ujian pendidikan cenderung kepada tidak reliabel) melainkan kerja yang lebih berhati-hati dilakukan bagi menentukan aras reliabiliti yang diterima (Martuza, 1977). Ini menunjukkan bahawa reliabiliti bukan sahaja skor yang sama didapati walaupun orang lain yang menilainya, tetapi jika kita harus memberikan skor yang sama juga walaupun kita menilai pada masa yang berbeza. Fakta mengenai reliabiliti rendah memeriksa kertas peperiksaan secara individu telah ditunjukkan oleh Dicker (1973), yang menemukan bahawa pekali korelasi hanya 0.46 apabila 24 guru memeriksa sekali dan kemudian diperiksa semula selepas tiga bulan. Aschersleben (1971) menganalisis pemeriksaan oleh 24 guru ke atas 623 pelajar dalam empat Anuar bin Salleh – 66907 Rosli bin Abdullah - 66900 1

description

Subjek En. Mus dulu.

Transcript of TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

Page 1: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

Menurut Mokhtar (1995), reliabiliti ujian boleh disebut sebagai darjah

ketekalan antara dua pengukuran terhadap sesuatu benda, sesuatu ciri, atau sifat

seseorang.

Secara umum, kesilapan angkubah pengukuran adalah banyak terdapat dalam skor

ujian dalam pendidikan (atau, dengan kata lain, ujian pendidikan cenderung kepada tidak

reliabel) melainkan kerja yang lebih berhati-hati dilakukan bagi menentukan aras

reliabiliti yang diterima (Martuza, 1977). Ini menunjukkan bahawa reliabiliti bukan

sahaja skor yang sama didapati walaupun orang lain yang menilainya, tetapi jika kita

harus memberikan skor yang sama juga walaupun kita menilai pada masa yang berbeza.

Fakta mengenai reliabiliti rendah memeriksa kertas peperiksaan secara individu

telah ditunjukkan oleh Dicker (1973), yang menemukan bahawa pekali korelasi hanya

0.46 apabila 24 guru memeriksa sekali dan kemudian diperiksa semula selepas tiga bulan.

Aschersleben (1971) menganalisis pemeriksaan oleh 24 guru ke atas 623 pelajar dalam

empat ujian matematik yang bersiri dan empat ujian ‘dictation’. Beliau mendapati

kebanyakan korelasi adalah di bawah 0.60, dengan kertas matematik menunjukkan,

secara purata, nilai lebih kecil (Ingenkamp, 1977). Ini menunjukkan bahawa pemeriksaan

seseorang pemeriksa bukan sahaja tidak tekal tetapi amat berbeza di antara seorang

pemeriksa dengan pemeriksa lain. Dengan kata lain pemeriksaan mereka mempunyai

reliabiliti yang rendah.

Kebolehpercayaan sesuatu ujian merujuk kepada ketekalan, ketepatan, dan

kebolehbergantungan ujian berkenaan. Ini bermaksud sesuatu ujian yang boleh dipercayai

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

1

Page 2: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian

yang telah dijalankan), tepat seperti yang sepatutnya serta boleh diterima pakai tanpa

keraguan.

Pada kebiasaannya , sesuatu ukuran itu tidak lepas daripada ralat (error). Ini amat

ketara dalam prestasi fizikal. Jauh lompatan seseorang misalnya, tidak sentiasa sama

kerana pengaruh halaju angin keadaan fizikalnya, keadaan atau jenis kasut yang dipakai,

latihan, larian atau sebagainya. Sedangkan berat seseorang pun boleh berubah dalam satu

hari disebabkan oleh pakaiannya, kenyang laparnya dan lain-lain.

Indeks kebolehpercayaan digunakan untuk menunjukkan ketekalan sesuatu ujian.

Indeks ini ditentukan dengan menggunakan kaedah korelasi antara dua set markat ujian.

Dua set markat boleh diperolehi dengan menggunakan 3 kaedah iaitu;

i. Kaedah uji dan uji kembali ( Uji – Ulang -Uji)

ii. Kaedah Ujian Bentuk Setara.

iii. Kaedah Ujian Bahagi Dua.

Sekurang-kurangnya indeks kebolehpercayaan 0.60 diperlukan bagi memastikan

ujian yang dibina boleh dipercayai.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

2

Page 3: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Kaedah Uji dan Uji Kembali (Uji-Ulang- Uji)

Sesuatu pengukuran itu apabila diulangi dan jika dengan keputusan yang sama

merupakan pengukuran yang boleh dipercayai. Oleh yang demikian korelasi di antara

skor ujian dengan skor ulang-uji dianggap sebagai satu anggaran kebolehpercayaan ujian

yang diukur. Ukuran yang boleh diulangi dengan keputusan yang sama adalah sangat

bermakna dan ukuran itu dianggap stabil. Oleh itu korelasi uji-ulang- uji dirujukkan

sebagai satu indeks atau koefisien stabiliti.

Dalam penggunaan kaedah uji-ulang- uji dua faktor yang patut diambil kira, iaitu

tempoh masa antara uji dan ulang-uji dan kestabilan pembolehubah yang berkenaan . Ini

akan dihuraikan dengan menggunakan persamaan-persamaan dalam model matematik.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

3

2 2 2

S = S + S p b s

( C )

S

Sr

2

2

p

b

( D )

S

Sr 1

2

2

s

p

( E )

Page 4: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Faktor ingatan memainkan peranan yang besar dalam anggaran

kebolehpercayaan lebih-lebih lagi kalau tempoh masa antara uji dan ulang uji itu adalah

singkat. Ingatan calon-calon akan membesarkan

iaitu kepada bahagian dalam persamaan ( C )

Jika ini berlaku nilai akan menjadi lebih besar daripada apa yang

sebenarnya. Ini menyebabkan nilai r yang diperoleh , satu anggaran yang lebih

tinggi . Nilai anggaran yang tinggi ini boleh dikurangkan kalau tempoh masa antara uji

dan ulang-uji itu dipanjangkan. Kalau masa antara uji-ulang- uji panjang, faktor yang

kedua menjadi penting, iaitu turun naik skor benar.

Turun naik skor benar bagi sesuatu pembolehubah bergantung kepada

stabilitinya . Pembolehubah afektif atau personaliti misalnya, konsep diri, bimbingan dan

sebagainya berubah semakin banyak apabila tempoh masa antara dua pengukurannya

semakin lama. Pembolehubah domain kognitif adalah lebih stabil tetapi akan juga

mengalami perubahan dengan peredaran masa. Maka boleh dikatakan secara am, kalau

tempoh masa antara uji dan ulang-uji itu adalah panjang varians turun naik skor benar

diukur sebagai varians selisihan, ini adalah satu kesilapan. Oleh yang demikian

dalam persamaan ( E ) telah menjadi lebih besar daripada yang

sebenarnya. Akibat r yang didapati telah menjadi kurang besar daripada yang

sebenarnya atau satu satu anggapan yang agak kurang. Kesan stabiliti atas anggaran

kebolehpercayaan dapat diminimunkan dengan memendekkan tempoh masa antara uji

dan ulang-uji.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

4

2

S 2

S b

2

S p

2

S s

Page 5: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Boleh dikatakan bahawa kesan ingatan dan kesan turun naik skor benar adalah

dua perkara bertentangan dan satu imbangan antara kedua-dua faktor itu patut dicapai

dalam menentukan masa di antara uji dan ulang-uji. Di samping itu stabiliti

pembolehubah yang berkenaan juga perlu dipertimbangkan. Ujian yang tinggi tahap

kebolehpercayaannya boleh digunakan untuk mengukur pembolehubah yang kurang

stabil. Misalnya, pembaris adalah boleh dipercayai tetapi jarak yang dilompat oleh

seseorang juga berubah dengan beberapa kali lompatan.Kalau kaedah uji -ulang-uji itu

digunakan, tempoh masa di antara uji dan ulang-uji itu harus dinyatakan secara eksplisit.

Untuk ujian praktikal beberapa bantahan umum telah dibangkitkan tentang uji ulang-uji.

Di antaranya ialah:

i. Ujian hanyalah merupakan satu sampel daripada populasi item. Kalau

sampel lain digunakanan bagaimana pula keputusannya?

ii. Ujian pertama sudah pasti mempengaruhi ulang-uji. Oleh itu kesannya

didapati kurang jelas.

iii. Kalau tempoh masa di antara uji dan ulang-uji itu adalah panjang,

selisihan telah dikelirukan dengan pembelajaran atau perkembangan

personaliti individu yang diukur.

iv. Uji ulang-uji tidak menarik kepada semua pihak termasuk calon ujian.

Minat calon akan menurun dalam ujian ulangan. Apakah makna kesan itu?

v. Ulang-uji memerlukan masa , kerja dan perbelanjaan tambahan.

Walaubagaimanapun kaedah uji-ulang-uji masih popular digunakan sebagai

kaedah menganggarkan kebolehpercayaan khususnya untuk ujian terstandard.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

5

Page 6: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Akan tetapi kaedah ini jarang atau tidak langsung digunakan dalam sekolah.

Kalau digunakan di sekolah hanya item-item spesifik sahaja yang digunakan.

Kaedah Ujian Setara.

Kaedah ujiian setara ini menggunakan prosedur yang sama dengan kaedah uji

ulang-uji. Yang berlainan sedikit ialah ujian yang digunakan dalam ulang -uji

ialah ujian setara. Ujian setara bolehlah dianggap sebagai satu persampelan

daripada populasi item yang sama. Item-item daripada ujian setara ini mempunyai

aras kesukaran yang sama , dan seharusnya juga mengukur pembolehubah yang

sama. Di samping itu semua arahan, cara pentadbiran ujian, cara respondan

sebagainya adalah sama untuk semua ujian setara. Walaupun ujian setara

mengukur pembolehubah yang sama , ujian itu dibentuk sebegitu rupa supaya

kesan dari ujian yang pertama tidak akan mempengaruhi keputusan ujian setara,

yakni ujian yang kedua. Salah satu langkah untuk menjamin hasrat ini ialah

dengan mengubah susunan item-item dalam ujian tersebut. Bahasa yang

digunakan dalam ujian setara itu juga perlu diubahsuai.

Tiga indeks statistik yang penting dan biasa digunakan untuk menguji

sama ada ujian itu setara atau tidak ialah min, varians, dan korelasi. Andainya dua

ujian atau lebih itu dikatakan ketara maka seharusnya min, varians, dan korelasi

antara ujian itu sama sahaja. Sifat-sifat ini adalah diandaikan benar, lebih-lebih

lagi jika ujian-ujian setara dianggap sebagai ujian –ujian yang mempunyai

bilangan item yang sama dan item-item itu dipilih secara rawak daripada satu

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

6

Page 7: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

populasi item. Ini bermakna ujian-ujian itu adalah ujian-ujian setara secara rawak.

Sifat-sifat ujian jenis ini diringkaskan sebagai ;

Untuk ujian setara U1 U2 . . . Un dan U1 = ujian pertama dan seterusnya.

= = . . . = Min sama

= = . . . = Varians sama

r ui uj = tetap Korelasi sama untuk semua ujian Ui dan Uj

Korelasi di antara dua keputusan daripada dua ujian setara digunakan sebagai anggaran

kebolehpercayaan ujian-ujian itu Kadang-kadang korelasi ini dianggap sebagai satu

ukuran tentang kesetaraan di antara dua ujian setara. Oleh itu, korelasi di antara dua ujian

yang setara disebut juga koefisien samaan.

Terdapat juga satu lagi jenis ujian setara yang berlainan sedikit. Ujian setara

berpadan yang mempunyai semua sifat di atas termasuk ciri tiap-tiap item dalam satu

ujian setara berpadan yang dipadankan dengan yang sama isi dari ujian asal.

Sama seperti kaedah uji –ulang-uji, kaedah ujian setara juga menghadapi

beberapa bantahan yang agak serupa. Biasanya ujian setara juga tidak dipraktikkan di

sekolah untuk tujuan mencari kebolehpercayaan. Mungkin keperluan itu tidak dirasai

pada masa kini.

Kaedah Ujian Bahagi Dua.

Untuk menggangarkan kebolehpercayaan , kita menggunakan koefisien korelasi.

Ini memerlukan ujian dua kali. Kaedah uji-ulang-uji dan ujian setara pada dasarnya

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

7

M U 1

M U 2

M U n

2

S U 1

2

S U 2

2

S U n

Page 8: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

memenuhi keperluan ini tetapi kaedah-kaedah itu menghadapi banyak bantahan. Kaedah

ujian bahagi dua diwujudkan untuk mengatasi bantahan-bantahan itu dan telah menjadi

kaedah biasa dan selalu digunakan untuk menggangarkan kebolehpercayaan . Dalam

kaedah ini prinsip-prinsip pengujian dua kali dipenuhi dengan membahagikan satu ujian

kepada dua ujian setara yang sama panjangnya. Bilangan item dalam setiap separuh ujian

itu adalah setengah bilangan item daripada ujian asal. Dengan itu calon-calon tidak perlu

mengambil dua ujian sama atau diuji dua kali dalam perkara yang sama. Perbelanjaan,

tenaga kerja dan masa tambahan tidak diperlukan lagi. Hanya ada satu kelemahan kecil

yang ditemui. Kebolehpercayaan yang didapati ialah untuk ujian yang panjangnya adalah

setengah daripada ujian asal. Tetapi anggaran kebolehpercayaan ujian asal itu dapat

dikirakan dengan menggunakan formula Spearman-Brown.

Ujian boleh dibahagikan kepada dua ujian pendek yang setara dengan mudah.

Kedua-dua ujian setara itu haruslah memenuhi tiga sifat yang disebutkan . Kalau sesuatu

ujian asal itu adalah sejenis, yakni semua butir adalah mengukur trait yang sama , maka

ujian asal boleh dibahagikan kepada ujian separuh bahagian yang atas dan ujian separuh

bahagian yang bawah. Misalnya bagi ujian yang mempunyai 24 item, item nombor 1

hingga 12 menjadi ujian separuh atas dan item nombor 13 hingga 24 menjadi ujian

separuh bawah. Ujian asal boleh dibahagikan kepada dua separuh berdasarkan item

ganjil-genap. Dengan menggunakan contoh tadi, item nombor 1,3,5…23 termasuk dalam

separuh ganjil dan item nombor 2,4,6….24 termasuk dalam separuh genap. Lain-lain

kombinasi boleh juga digunakan kalau sekiranya bilangan item dalam dua separuh ujian

itu adalah sama.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

8

Page 9: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Jikalau item-item ujian itu tidak sejenis, atau tidak sama aras kesukaran serta

kuasa diskriminasi , susunan item-item dalam ujian asal harus disusun semula mengikut

kesukaran item. Kemudian susunan baru ini digunakan sebagai asas dalam pembahagian

ujian kepada dua separuh yang sama dengan cara item ganjil-genap. Ini menjamin yang

kedua-dua ujian separuh itu mempunyai min dan varians yang sama.

Untuk ujian aneka jenis (item-itemnya beraneka jenis dalam isi) kedua-dua ujian

separuh yang dipilih harus setara dan sepadan. Ini bermakna bahawa ujian-ujian separuh

itu berpadan dalam isi dan aras kesukaran.

Satu contoh pengiraan kebolehpercayaan dengan menggunakan kaedah ujian

bahagi dua adalah seperti berikut. Katakan lima orang murid mengambil ujian dan skor-

kor yang diperoleh adalah seperti berikut:

JADUAL 1

Markah untuk lima pelajar dalam ujian (hipotetikal)

PELAJAR

A B C D E

1 Jumlah markah untuk item ganjil (x) 1 2 3 4 5

2 Jumlah markah untuk item genap (y) 2 1 5 3 4

3 Perbezaan (x – y ) -1 1 -2 1 1

4 Jumlah ( x + y ) 3 3 8 7 9

Mengaplikasikan cara hasil darab momen ( atas baris 1 dan 2 ) korelasi untuk ujian

separuh ( r1 ) = 0.6

Selepas menggunakan formula Spearman-Brown korelasi untuk ujian penuh :

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

9

Page 10: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

r2 =

= 0.75

Keputusan : Kebolehpercayaan ujian itu adalah 0.75

Satu interpretasi dari sudut yang berlainan terhadap kolerasi yang diperoleh daripada

kaedah ini ialah kita menganggapkan yang korelasi ini mencerminkan ‘ketekalan dalam’

ujian. Kaedah Rulon (1939) ialah satu lagi cara yang boleh mengganggarkan ‘ketekalan

dalam’ seperti kaedah bahagi dua.Di sini satu andaian khas dibuat oleh Rulon tentang

varians selisihan.Rulon berpendapat bahawa perbezaan antara markah-markah dua ujian

separuh menunjukkan amaun selisihan, pengukuran, jadi varians perbezaan di antara dua

ujian separuh itu adalah sama dengan varians selisihan. Contoh:

= Varians perbezaan antara dua ujian separuh.

=

Kemudian kebolehpercayaan r ditakrif sebagai,

Merujuk kepada Jadual 1

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

10

2

S s 2

S (x-y)

2

2

p

s

2

2

(x-y)

(x-y)

(x+y)

2

S (x+y)

2

S (x-y)

Page 11: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

dan

dapat dikira dengan menggunakan data dalam baris 3 dan 4

Keputusan : = dan =

Dan r = 1 - = 0.75

Yang menarik di sini ialah , walaupun Rulon menggunakan kaedah yang

berlainan tetapi r yang diperoleh adalah sama dengan nilai r yang dikira dengan cara

ujian bahagi dua ( r = 0.75) .

Kaedah Guttman pula adalah satu kaedah yang berasaskan kaedah Rulon .

Caranya memudahkan pengiraan . Guttman dalam tahun 1945 dengan menggunakan

prinsip dan andaian cara Rulon telah mendapatkan formula bahawa kebolehpercayan satu

ujian dapat dirumuskan seperti berikut:

R = 2 [1 – ]

Kalau data dalam Jadual 1 digunakan maka

R = 2 [1 – ]

2 = [ ]

= 0.75

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

11

2

S (x + y)

2

S (x - y)

2 + 2

2 2

(S + S) X y 2

SX + y

2

S (x-y)

2

S (x+y)

Page 12: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Perhatikan di sini bahawa prosedur yang digunakan dalam kaedah cantuman ini

adalah lebih mudah daripada kaedah Rulon. Ini disebabkan perbezaan di antara kedua-

dua ujian separuh tidak diperlukan lagi. Keputusan yang didapati secara ini juga sama

dengan yang diperoleh dengan cara Rulon dan cara ujian bahagi dua. Ini berlaku kalau

varians kedua-dua ujian separuh adalah sama seperti dalam contoh ini. Dalam ujian

apabila varians tidak sama , r dari cara ujian bahagi dua dan cara Guttman adalah sama

dan kedua-duanya lebih daripada r yang diperoleh dari cara Rulon. Tetapi pada lazimnya

perbezaan di antara r yang didapati dari tiga cara itu adalah kecil sahaja.

Kaedah Kuder – Richardson

Dalam kaedah ujian bahagi dua, ujian dibahagi kepada dua separuh ujian setara.

Prinsip ini dapat digunakan untuk membahagikan suatu ujian kepada beberapa ujian yang

setara yang mana bilangannya adalah sama dengan bilangan item yang terdapat dalam

ujian itu. Di sini tiap-tiap item itu dianggap sebagai suatu ujian. Kalau begitu ujian yang

mempunyai 100 item bolehlah dibahagikan kepada 100 ujian kecil yang setara. Kuder

dan Richardson dalam tahun 1937 dengan membuat beberapa andaian telah mencipta satu

cara baru untuk menganggarkan kebolehpercayaan suatu ujian. Cara ini dianggap lebih

teknikal daripada cara lain. Kaedah ini juga popular untuk menganggarkan

kebolehpercayaan dalam penyelidikan dan pembentukan ujian standard.

Andaian-andaian yang perlu dibuat untuk kaedah Kuder-Richardson adalah

seperti berikut:

i. Tiap-tiap item itu dianggap sebagai satu ujian setara.

ii. Semua korelasi di antara item-item itu adalah sama.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

12

Page 13: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Mengikut Kuder dan Richardson kebolehpercayaan suatu ujian boleh dianggarkan

dengan formula berikut:

Kebolehpercayaan r =

Dan kalau hanya dua kemungkinan boleh terjadi bagi tiap-tiap item

( misalnya : betul = 1 , salah = 0)

Maka r =

Kedua-dua formula ini disebut formula KR-20.

Tetapi , jika diandaikan bahawa tiap-tiap item mempunyai kekerapan jawapan yang

betul / salah yang sama ( iaitu p = p ) atau aras kesukaran tiap-tiap item adalah sama ,

maka = n , = min , = min

Kemudian =

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

13

n = bilangan items

= varians item i

= varians jumlah skor

dan varians perhatikan

p = perkadaran betul ( 1) untuk butir i

q = perkadaran salah (0) untuk butir i

n = bilangan butirM = Min

= varians perhatikan

Page 14: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Atau =

Formula ini disebutkan formula KR-21

Contoh kiraan: Ujian mempunyai 10 butir objektif p = 0.6 bermakna 0.6 bilangan murid

menjawab betul.

Maka q = 0.4 bermakna 0.4 bilangan murid menjawab salah.

Butir 1 2 3 4 5 6 7 8 9 10

Perkadaran 0.7 0.8 0.8 0.8 0.6 0.6 0.7 0.7 0.6 0.7

Jawapan betul

Perkadaran 0.3 0.2 0.2 0.2 0.4 0.4 0.3 0.3 0.4 0.3

Jawapan salah

0.21 0.16 0.16 0.16 0.24 0.24 0.21 0.21 0.24 0.21

Maka = 2.04, =0.7, = 0.3

Kalau = 6 (katakan)

Maka KR-20

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

14

Page 15: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

=

=

=0.733

Kalau data yang sama digunakan untuk KR-21

=

=

=

=0.722

Perhatikan bahawa r dikira dengan KR-20 dan KR-21 adalah hampir sama. Ini adalah

disebabkan andaian = telah dipenuhi.

Ringkasan

Bagi menganggarkan kebolehpercayaan ujian dua faktor harus diambil kira, faktor

pertama ialah jenis ujian, sama ada ujian itu terdiri daripada item aneka jenis atau sejenis.

Faktor kedua ialah tentang aspek kebolehpercayaan yang ditegaskan atau dipersoalkan,

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

15

Page 16: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

iaitu sama ada stabiliti atau ketepatan atau ketekalan dalam ? Oleh sebab

kebolehpercayan merupakan sesuatu yang relatif dan juga berbeza-beza dari masa ke

semasa, situasi dan populasi, adalah lebih baik jika kebolehpercayaan ujian itu

didapatkan dengan cara yang berlainan. Maka untuk kegunaan penyelidikan dan ujian

terstandard yang mana skor benar diutamakan, ujian yang digunakan haruslah

mempunyai kebolehpercayaan dari berbagai-bagai aspek. Selain itu kebolehpercayaan

mestilah dikemaskinikan dari semasa ke semasa. Ini dibuat untuk menjamin bahawa

kebolehpercayaan itu masih boleh di pakai dengan penuh keyakinan pada masa ujian itu

digunakan.

Sebagai panduan jadual 2 memberikan cara untuk mendapatkan kebolehpercayaan

yang sesuai dengan jenis ujian dan aspek kebolehpercayaan yang terlibat.

Cara kebolehpercayaan untuk jenis-jenis ujian dan aspek kebolehpercayaan.

Aspek

kebolehpercayaan

Ujian sejenis Ujian aneka jenis

Ketepatan dan stabiliti Uji-ulang-uji Uji-ulang-uji

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

16

Page 17: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Markat benar - -

ketepatan Ujian setara KR20

Ketekalan dalam Ujian bahagi dua Rulon,

Guttman, KR20, KR21

Ujian bahagi dua berpadan.

Seperkara yang penting yang perlu dipersoalkan ialah tentang saiz, koefisien

kebolehpercayaan yang diperoleh daripada mana-mana ujian. Berapakah nilai yang boleh

dianggap sebagai r yang boleh diterima ?

Sebenarnya tiada jawapan yang lengkap dan memuaskan dapat diberi bagi persoalan

tersebut akan tetapi , di kalangan ujian yang sah ujian yang mempunyai indeks

kebolehpercayan terbesar merupakan ujian yang lebih diutamakan dan menjadi pilihan.

Ini juga bergantung kepada kegunaan maklumat yang diperoleh daripada ujian itu.

Pengguna maklumat atau ujian menentukan taraf kejituan yang dikehendaki dan memilih

ujian yang sesuai untuk tujuannya. Biasanya untuk pengukuran dan membuat keputusan

tentang seorang individu ujian yang mempunyai kenolehpercayaan ( r ) yang kurang

daripada 0.75 adalah kurang memuaskan . tetapi dalam kes lain untuk tujuan ramalan satu

kumpulan yang saiznya lebih daripada 25 ( n = 25)r = 0.3 mungkin boleh diterima.

Walaubagaimanapun pembolehubah kognitif seperti kecerdasan , pencapaian akademik,

nilai r haruslah lebih daripada 0.8 dan untuk pembolehubah personaliti dan afektif seperti

motivasi bimbingan , konsep-diri, nilai r = 0.5 bolehlah dianggap sebagai memuaskan.

Akhir kata, ujian yang mempunyai kebolehpercayaan tinggi boleh dianggap hanya

mengukur apa yang ujian itu mengukur dengan tepat. Tetapi ujian itu tidak semestinya

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

17

Page 18: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

mengukur apa yang harus diukur. Dengan kata lain kebolehpercayaan tidak semestinya

bermakna keesahan tetapi keesahan mengimplikasikan kebolehpercayaan.

Rujukan Istilah:

Bibliografi

Krynock, K. & Robb, L. (1996). Is problem-based learning a problem for your

curriculum? Illinois School Research and Development Journal, 33(1), 21 – 24.

Lee Shok Mee dan Mook Soon Sang (1989). Pengujian dan penilaian dalam pendidikan,

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

18

Korelasi= hubungan atau kaitan secara timbal balik Kamus .Dewan m/s 707

Varians= sesuatu yang menyimpang atau berlainan daripada yang lazim atau standard, kelainan; bentuk atau ejaan yang berlainan bagi perkataan yang sama. Kamus Dewan m/s 1536

Page 19: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Kuala Lumpur : Kumpulan Budiman

Mohamad Najib Abdul Ghafar. (1999). Penyelidikan pendidikan. Skudai : Penerbit

Universiti Teknologi Malaysia.

Mohd. Majid Konting. (1998). Kaedah penyelidikan pendidikan. Kuala Lumpur : Dewan

Bahasa & Pustaka.

Mokhtar Ismail (1995).Penilaian di bilik darjah. Kuala Lumpur: Dewan Bahasa &

Pustaka.

Yap Yee Khiong et al. (1985). Pengukuran dan penilaian dalam pendidikan. Selangor

Darul Ehsan : Longman.

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

19

Page 20: TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

Anuar bin Salleh – 66907Rosli bin Abdullah - 66900

20