Pengukuran, Kesahan (Validity) Dan Kebolehpercayaan (Reliability) Instrumen

30
©2014 Dr. Ferlis bin Bullare @ Bahari PENGUKURAN, KESAHAN (VALIDITY) DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN Dr. Ferlis Bin Bullare @ Hj. Bahari Pensyarah Kanan/Ketua Unit Penyelidikan Psikologi & Kesihatan Sosial Universiti Malaysia Sabah Tel (O) : 088 320 000 (8979) H/P : 016 520 2070 e-mel : [email protected] ; [email protected] A. PENGUKURAN 1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa: ... jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika ia wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah data atau khususnya pembolehubah. 2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu simbol yang diberikan perangkaan atau nilai. 3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya dikomputerkan. 4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua jenis: (i) Pemboleh ubah bebas dan terikat (ii) Pemboleh ubah berterusan dan kategorikal

description

nice

Transcript of Pengukuran, Kesahan (Validity) Dan Kebolehpercayaan (Reliability) Instrumen

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    PENGUKURAN, KESAHAN (VALIDITY)

    DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN

    Dr. Ferlis Bin Bullare @ Hj. Bahari

    Pensyarah Kanan/Ketua

    Unit Penyelidikan Psikologi & Kesihatan Sosial

    Universiti Malaysia Sabah

    Tel (O) : 088 320 000 (8979)

    H/P : 016 520 2070

    e-mel : [email protected]; [email protected]

    A. PENGUKURAN

    1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa: ... jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika ia

    wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah

    data atau khususnya pembolehubah.

    2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu simbol yang diberikan perangkaan atau nilai.

    3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya dikomputerkan.

    4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua jenis:

    (i) Pemboleh ubah bebas dan terikat (ii) Pemboleh ubah berterusan dan kategorikal

    mailto:[email protected]:[email protected]

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang menyebabkan berlakunya pemboleh ubah terikat; ia juga melibatkan

    kesan atau pengaruhnya ke atas pemboleh ubah terikat.

    6. Pemboleh ubah berterusan mengambil nilai perangkaan berjulat. Misalnya umur memperlihatkan perbezaan seorang bayi berumur

    dua bulan dengan seorang tua berumur 70 tahun.

    7. Pemboleh ubah kategorikal mempunyai ukuran berbentuk nominal, iaitu objek dimasukkan ke dalam satu kategori yang ditentukan.

    Misalnya jantina (lelaki dikodkan dengan nombor 1 dan perempuan

    dikodkan dengan nombor 2). Komputer tidak membezakan antara

    peringkat-peringkat ukuran yang berlainan seperti contoh umur dan

    jantina di atas. Komputer akan memproses sebarang jenis angka

    yang diberikan kepadanya tanpa membezakan sama ada sesuatu

    ukuran itu bersifat mutlak (umur) atau bersifat sembarangan

    (jantina).

    8. Mengukur pemboleh ubah bererti memberi angka kepada objek, kejadian atau manusia mengikut aturan tertentu (Stevens, 1951).

    Cohen & Nagel (1934) mendefinisikan ukuran sebagai mengkorelasi

    entiti yang bukan angka dengan angka.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala pengukuran:

    (i) Nominal atau kategori (Nominal)

    Setiap nilai yang diberikan sebagai kategori tersendiri (label dan tanda semata-mata).

    Tidak boleh melakukan operasi aritmetik (menjumlah, menolak, mendarab dan membahagi) terhadap data angka

    tersebut kerana hasilnya tidak memberi apa-apa makna.

    Contohnya jantina (1 = lelaki; 2 = perempuan);

    Contohnya Etnik (1 = Melayu; 2 = Kadazan; 3 = Bajau; 4 = Murut; 5 = Bisaya; 6 = Iban; 7 = Lain-lain)

    Statistik perihalan (mod dan frekuensi) boleh digunakan untuk memerihalkan pembolehubah yang diukur. Statistik

    tak berparameter (ujian khi kuasa dua dan ujian binomial)

    sesuai digunakan menganalisis data yang melibatkan skala

    nominal.

    (ii) Ordinal atau darjah (Ordinal)

    Untuk pembolehubah yang boleh diatur atau disusun mengikut pangkat atau darjah.

    Jarak antara dua paras ukuran masih belum diketahui. Kita tidak ketahui berapa tingginya SES kelas atasan daripada SES kelas

    menengah atas atau antara kelas menengah atas dengan menengah

    bawah. Kita Cuma tahu SES kelas atasan lebih tinggi daripada kelas

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    menengah atas, yang lebih tinggi pula daripada kelas bawahan.

    Tidak lebih daripada itu.

    Dengan kata lain, susunan pangkat yang dibuat hanya memberikan kategori manakah yang tinggi atau rendah dan BUKAN berapa

    banyakkah ia lebih besar, lebih baik atau lebih tinggi dipilih

    berbanding kategori lain.

    Kita tidak boleh melakukan apa-apa operasi aritmetik.

    Namun, statistik yang sesuai untuk menghuraikan kecenderungan memusat untuk kategori-kategori dalam skala ordinal ialah

    penengah dan mod.

    Bagi menentukan perbezaan antara kategori-kategori dalam skala ordinal, ujian-ujian statistik tak parametrik yang sesuai digunakan

    seperti Ujian Kolmogorov-Smirnov, Ujian Larian Satu Sampel,

    Ujian Tanda, Ujian Wilcoxon, Ujian Median, Ujian Mann-Whitney,

    Ujian Wald-Wolfowitz, Ujian Friedman dan Ujian Kruskal-Wallis.

    Untuk menentukan perkaitan antara pembolehubah, pekali korelasi pangkat Spearman dan pekali korelasi pangkat Kendall sesuai

    digunakan.

    Contohnya, jawapan berbentuk skala Likert iaitu, 1 = sangat tidak setuju;

    2 = tidak setuju; 3 = tidak pasti; 4 = setuju; 5 = sangat setuju

    Contoh lain ialah status ekonomi social (SES) seseorang iaitu, 1 = kelas

    atasan; 2 = kelas menengah atas; 3 = kelas menengah bawah; 4

    = kelas bawahan

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    (iii) Sela atau selang (Interval)

    Pengukuran yang menggunakan skel sela tidak mempunyai titik sifar yang mutlak (nilai sifar sebenar), misalnya sukatan suhu Celsius dan

    Fahrenheit.

    Operasi aritmatik (campur dan tolak) boleh dilakukan ke atas cerapan skala sela. Skala sela adalah skala pertama yang bersifat

    kuantitatif.

    Semua statistik parametrik umum (min, sisihan piawai dan pekali korelasi Pearson) boleh digunakan.

    Angka sela boleh dijumlah dan ditolak antara satu sama lain, misalnya kita boleh mencampurkan suhu beberapa tempat di

    Malaysia pada hari tertentu dan mengira puratanya. Namun kita

    tidak boleh mengira nisbah dua suhu kerana kita tidak boleh

    membahagi angkubah yang bersifat sela. Dengan kata lain, operasi

    bahagi dan darab tidak boleh dilakukan bagi data sela (interval).

    Contohnya 32F31F=1F. Jarak 1 darjah ini sama dengan 1 darjah bagi perbezaan 85F84F atau 78F77F. Tapi salah sama sekali jika

    kita mengatakan bahawa haba 100F bernilai dua kali ganda haba

    yang ada pada 50F.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    (iv) Nisbah (Ratio)

    Pengukuran secara nisbah mempunyai sifat pengukuran sela, dengan ditambah satu sifat lagi, iaitu titik sifar mutlak sudah dapat

    ditakrifkan baginya (ataupun mempunyai nilai sifar sebenar).

    Contohnya, markah pelajar bagi subjek Matematik dalam

    peperiksaan antara 0 hingga 100. Angka 0 merupakan sifar yang

    sebenar kerana pelajar yang mendapat markah 0 menunjukkan

    mereka menjawab salah dalam semua soalan.

    Apabila ada titik sifar yang mutlak, semua operasi aritmetik dapat dilakukan. Misalnya timbangan berat, jarak jauh, umur, keluasan

    tanah, jumlah pendapatan (RM).

    Misalnya berat badan seorang kanak-kanak 30kg semestinya melebihi berat badan seorang yang berat badan 15kg sebanyak dua

    kali ganda (30/15=2).

    Contoh lain ialah pendapatan sebanyak RM 4,000 sebulan adalah RM1,000 lebih tinggi daripada pendapatan RM3,000 sebulan.

    Pendapatan RM 5,000 sebulan ini adalah dua kali lebih tinggi

    daripada RM2,000. Oleh yang demikian, semua operasi aritmetik

    (campur, tolak, darab dan bahagi) boleh digunakan bagi data nisbah

    (ratio).

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    B. KESAHAN (VALIDITY)

    B1 Pendahuluan

    1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana alat itu mengukur data yang sepatutnya ia dikehendaki mengukur.

    2. Anastasi (1967) mendefinisikan kesahan sebagai satu ujian yang menekankan tentang apa yang hendak diukur dan sejauhmana ia

    boleh berbuat demikian.

    3. Kerlinger (1973) menyatakan bahawa kesahan alat ujian mempunyai ciri-ciri kestabilan (stabiliti), konsistensi, keramalan dan ketepatan.

    4. Sekiranya data yang dikehendaki ialah ketinggian pelajar, alat ukur yang digunakan mestilah dapat mengukur ketinggian pelajar dengan

    tepat. Misalnya, timbang adalah alat sah mengukur berat dan tidak

    sah digunakan untuk mengukur ketinggian. Ketinggian pelajar sah

    diukur menggunakan pembaris.

    5. Persoalan utama yang perlu diambilkira tentang pengukur yang digunakan dalam sesuatu kajian ialah:

    Apakah yang alat itu telah ukur?

    Adakah alat itu benar-benar mengukur apa yang kita ingin ukur?

    Adakah dengan menggunakannya, alat itu membenarkan pengutipan data yang relevan dengan apa yang menjadi

    tumpuan kajian?

    6. Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh ubah iaitu pemboleh ubah fizikal atau kuantitatif (ketinggian pembaris;

    berat timbang) dan kualitatif/gagasan/konsep (pencapaian, stres,

    kecerdasan, sikap, motivasi).

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    7. Satu konsep yang digunakan dalam kajian sains sosial ialah satu yang abstrak seperti kecerdasan. Ujian diberikan untuk melihat tahap

    kecerdasan. Adakah ujian kecerdasan ini menguji kecerdasan

    seseorang? Oleh itu pengukuran bagi sesuatu yang abstrak biasanya

    menimbulkan keraguan.

    8. Seperkara lagi iaitu tentang penerimaan satu ujian sebagai sah atau tidak. Kesahan ujian bagi satu kumpulan di sesuatu tempat tidak

    semestinya sah bagi ujian lain di tempat berasingan. Misalnya ujian

    kecerdasan atau kesulitan ekonomi di Afrika tidak tentu sama

    keberkesanan kesahannya di negara Malaysia kerana masing-masing

    mempunyai kebudayaan dan gaya hidup yang berlainan.

    9. Gronlund (1985) menyatakan bahawa perkara yang perlu diingat semasa menggunakan kesahan ialah:

    9.1 Kesahan berhubung rapat dengan keputusan ujian dan

    hubungannya terhadap alat ukuran itu sendiri.

    9.2 Kesahan sepatutnya tidak dilihat dari segi sah atau tidak sah tetapi

    dari segi darjah kesahannya sama ada tinggi, sederhana atau rendah.

    9.3 Kesahan perlu dirujuk kepada satu kegunaan yang khusus dan ujian

    tidak akan menunjukkan kesahan untuk semua tujuan.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    B2 Jenis Kesahan

    B2.1 Kesahan Muka (Face Validity)

    1. Bailey (1984) menyatakan bagi mengetahui sama ada instrumen atau soal selidik mempunyai kesahan, penyelidik perlu tahu bagaimana

    konsep hendak diukur itu didefinisikan dan sama ada maklumat

    yang dikumpulkan itu berkaitan dengan konsep itu. Kesahan muka

    adalah perkara yang perlu dipertimbangkan oleh pengkaji sendiri,

    kumpulan penyelidik ataupun pakar.

    2. Kesahan muka juga dapat dinilai berdasarkan penyelidikan pengkaji tentang konsep yang hendak diukur dan pertimbangan berdasarkan

    sama ada alat itu berjaya mendekati satu konsep itu dengan

    sepenuhnya atau tidak. Jika ukuran itu mengukur satu konsep pada

    keseluruhannya, maka pengkaji berjaya dengan mengemukakan

    kesahan muka.

    3. Misalnya seorang penyelidik ingin membentuk instrumen kajian. Penyelidik itu akan memberikan instrumen kepada pakar dalam

    bidang yang hendak dikaji bagi dinilai sekali imbas. Pengesahan

    awal soal selidik itu memperlihatkan ciri-ciri pengukuran yang

    hendak diukur adalah merupakan kesahan muka bagi instrumen

    tersebut. Dengan kata lain, apabila dilihat kali pertama, instrumen

    ini mengukur apa yang hendak diukur dan nampak sesuai.

    4. Bagi mengetahui suatu alat pengukur itu mempunyai kesahan muka atau tidak; definisi konsep yang hendak dikur serta maklumat yang

    dikumpulkan itu bersesuaian ataupun tidak dengan konsep tersebut

    perlu diketahui.

    5. Contohnya, seorang pelajar ingin menjalankan kajian tentang penyusuan susu ibu tetapi item-item atau soalan-soalan dalam soal

    selidik yang digunakan berkaitan dengan stres, maka dapat

    dikatakan item-item tersebut tidak mempunyai kesahan muka.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat tentang sesuatu konsep. Misalnya percanggahan tentang sesuatu

    ujian / soalan peperiksaan antara pensyarah dengan pelajar.

    Pensyarah yakin bahawa ujian yang dijalankan mempunyai kesahan

    muka yang tinggi, namun para pelajar mungkin ada pendapat

    tersendiri.

    7. Satu isu lagi yang wujud iaitu dimensi atau gagasan sesuatu konsep itu berubah dari semasa ke semasa.

    8. LATIHAN 1: Tentukan dan kenal pasti kesahan muka bagi

    IKSOKU-F.

    B2.2 Kesahan Kandungan (Content Validity)

    1. Ia adalah kesahan kedua selepas kesahan muka. Ia lebih mendalam di mana soal selidik akan dipastikan memang mengukur konsep-

    konsep yang hendak diukur. Contohnya pengukuran kepuasan

    kerja meliputi pelbagai komponen seperti gaji, rakan sekerja,

    pangkat, penghargaan, pengiktirafan dan sebagainya. Oleh itu,

    semua komponen ini perlu diambilkira sewaktu memilih item.

    2. Item-item ini akan diperiksa dari segi perkataan, ayat, dan istilah yang digunakan.

    3. Kesahan kandungan dapat dilakukan dengan menggunakan khidmat panel / pakar bagi menimbangkan sejauhmana instrumen itu

    memenuhi piawaian. Cadangan pakar dalam bidang yang diukur

    perlu bagi tujuan pembaikan, pembetulan, penambahan ataupun

    pengurangan ke atas skala dan item dalam soal selidik yang

    digunakan.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu dipenuhi sebelum sesuatu ujian itu dikatakan mempunyai kesahan

    kandungan:

    Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku secara umum diterima maknanya

    Bidang mestilah dihuraikan dengan jelas

    Bidang mestilah relevan dengan tujuan penggunaan ujian

    Hakim-hakim/ panel/ pakar yang berkelayakan mestilah bersetuju bahawa bidang telah disampel secara mencukupi

    Gerak balas mestilah diperhati dan dinilai secara tekal

    5. Latihan: Tentukan dan kenal pasti kesahan kandungan (content

    validity) bagi IKSOKU-F.

    B2.3 Kesahan Kriteria (Kesahan Serentak & Kesahan Peramal)

    1. Kesahan ini diperolehi apabila sesuatu ujian yang dijalankan membezakan ukuran melalui sesuatu kriteria yang ingin dilihat

    dalam sesuatu soal selidik.

    2. Tujuan kesahan kriteria ialah untuk menggunakan ujian sebagai pentaksir terhadap satu tingkah laku atau sikap. Misalnya, apabila

    seseorang itu telah melalui ujian memandu dan disahkan lulus, kita

    akan mentaksirkan bahawa dia akan dapat memandu dengan baik

    dan cermat.

    3. Kesahan Serentak/ Selari (Concurrent Validity) : Ialah kriteria yang ditunjukkan pada masa yang sama atau hampir sama dengan

    pengukuran yang dikenakan ke atas kriteria tersebut. Ia digunakan

    untuk mengukur sesuatu fenomena pada masa kini.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik dikatakan mempunyai kesahan kriteria serentak yang tinggi jika

    seseorang pelajar yang mencapai kebolehan yang cemerlang

    dalam ujian tersebut juga pada masa itu boleh menunjukkan

    kebolehannya bermain muzik dengan baik.

    Contoh 2 : Di dalam satu kilang, seorang pengkaji telah mendapatkan ukuran bahawa mereka yang mengikuti latihan

    jasmani pada tiap-tiap pagi adalah mereka yang menunjukkan

    prestasi dan dapat mengeluarkan produktiviti yang lebih tinggi

    berbanding pekerja lain. Masa yang sama, penyelia diminta

    memberikan laporan samada benar bahawa pekerja yang

    mengikuti latihan jasmani tersebut mencatat daya pengeluaran

    yang tinggi. Jika ini betul, maka pihak kilang akan melakukan

    ujian jasmani tersebut kerana ia ada kaitan dengan daya

    pengeluaran pekerja.

    4. Kesahan Peramal (Predictive Validity) : Merujuk kepada keupayaan ukuran itu meramalkan peristiwa masa akan datang atau

    sejauhmanakah sesuatu /soal selidik ujian (peramal) itu dapat

    meramalkan sesuatu yang sebenar (kriteria). Bagi menentukan

    kesahan ramalan, korelasi antara ujian ramalan dengan kejadian

    sebenar akan dibuat. Jika korelasi yang diperoleh tinggi, ini

    bermakna ujian itu mempunyai kesahan ramalan yang tinggi.

    Contoh 1: Sejauhmana ujian percubaan SPM dapat meramal kejayaan akademik seterusnya iaitu peperiksaan SPM sebenar.

    Ujian SPM sebenar akan dibandingkan dengan ujian

    percubaan SPM; yang mana penyelidik merasa yakin dapat

    mengukur konstruk ini iaitu prestasi akademik di sekolah

    menengah. Indeks statistik bagi kesahan ramalan ini ialah

    ukuran korelasi di antara peramal (agregat dalam ujian

    percubaan SPM) dengan kriteria (agregat dalam ujian SPM

    sebenar).

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Contoh 2: Kesahan STPM sebagai pengukur kejayaan seseorang itu dalam universiti kelak.

    Contoh 3 : Apabila seseorang itu lulus dan dapat sijil memandu, dia akan dapat memandu kenderaan dengan baik.

    Namun, keadaan ini tidak selalu benar.

    Contoh 4 : Majikan mengadakan ujian seperti temuduga, ujian bertulis dan lisan bagi calon-calon yang akan diterima bekerja

    di dalam syarikat/organisasi.

    LATIHAN 3: Tentukan dan kenal pasti kesahan peramal

    IKSOKU-F.

    B2.4 Kesahan Konstruk/ Gagasan, Kesahan

    Konvergens dan Kesahan Discriminant

    Pengenalan

    1. Gagasan (construct) merujuk kepada sekumpulan pemikiran yang ada dalam fikiran tetapi tidak dapat dilihat objek tersebut secara

    langsung / dengan mata kasar.

    2. Kesahan gagasan melibatkan hubungan di antara satu kerangka teori yang menyeluruh supaya dapat menentukan sama ada alat ukuran

    yang digunakan mempunyai hubungan dengan konsep dan andaian

    yang digunakan.

    3. Kesahan gagasan digunakan bagi mengukur sifat-sifat yang tidak dapat diukur oleh kriteria luaran, misalnya kepuasan. Kelebihan

    menggunakan kesahan gagasan ialah ia mengukur kesahan sifat yang

    tersembunyi bagi satu-satu ukuran. Ia membolehkan pengkaji

    menentukan komponen satu-satu sifat yang ditunjukkan oleh sesuatu

    alat (Siti Saleha Samsuddin, 2002).

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    4. LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan SSKSOKU-F menggunakan analisis faktor.

    Kesahan Convergens

    1. Cara mendapatkan kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk dengan

    soal selidik yang lain yang telah ada yang mengukur konsep yang

    sama. Sekiranya keputusan menunjukkan hasil korelasi yang tinggi,

    maka kesahan konvergen dikatakan telah diperolehi. Ini adalah

    kerana kedua-dua soal selidik tadi mengukur konsep yang sama.

    2. Sebaliknya sekiranya keputusan korelasi rendah atau tidak signifikan, ini bermakna soal selidik yang baru dibentuk itu

    mungkin tidak sesuai dengan teori kerana tidak mempunyai

    hubungan dengan konsep yang sama dalam soal selidik yang telah

    ada (piawai).

    3. LATIHAN 5: Uji kesahan konvergen kedua-dua skala dengan PWB dan SWLS dengan menggunakan korelasi Pearson.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Kesahan Discriminant

    1. Cara memperolehi kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk itu

    dengan soal selidik yang lain yang telah ada yang tidak mengukur

    konsep yang sama. Sekiranya tidak ada korelasi yang signifikan yang

    dicatatkan, ini bermakna berdasarkan teori konsep dalam soal

    selidik baru mempunyai kesahan diskriminan.

    2. Sekiranya ada korelasi yang signifikan, ini bermakna konsep dalam soal selidik yang baru tadi tidak mengukur apa yang hendak diukur

    kerana ia berkorelasi dengan konsep yang tidak sepatutnya dalam

    soal selidik yang ada.

    3. LATIHAN 6: Uji kesahan diskriminan kedua-dua instrumen dengan skala tertentu dengan menggunakan korelasi Pearson.

    Jadual 1: Perbezaan antara Kesahan Konvergen dan Kesahan

    Diskriminan

    Kesahan Konvergen (KK) Kesahan Diskriminan/Divergent

    (KD)

    1. A construct-validated

    instrument should have high

    correlations with other measures

    or methods of measuring the

    same construct samb

    1. samb but low correlations

    with measure of different

    constructs

    2. KK baik apabila nilai korelasi

    tinggi

    2. KD baik apabila nilai korelasi

    rendah

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    C. KEBOLEHPERCAYAAN (RELIABILITY)

    C1 Pengenalan

    1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada pengukuran atau instrumen yang digunakan oleh pengkaji terhadap

    sesuatu konstruk teorinya.

    2. Menurut Carmines dan Zeller (1979), kebolehpercayaan ialah sejauhmana satu uji kaji, ujian atau prosedur kajian apabila

    diulangkan akan memberikan keputusan yang sama.

    3. Ia juga merujuk kepada ketekalan dalam pengukuran berkenaan sesuatu set data yang diperoleh.

    4. Kerlinger (1973) menyatakan bahawa ujian yang amat tinggi kebolehpercayaannya mempunyai ciri-ciri stabiliti, konsistensi,

    keramalan dan ketepatan.

    Contoh 1 : Apabila rakan rapat anda mempunyai sikap dan tabii yang konsisten, tepat dan dapat diramalkan, anda akan

    menganggap rakan anda itu boleh dipercayai.

    Contoh 2 : Jam sebagai ukuran masa. Jika sebuah jam itu sentiasa memberikan waktu yang tepat, tekal dan stabil, kita yakin

    akan tahap kebolehpercayaan jam tersebut sebagai pengukur

    masa.

    5. Satu pengukur yang mempunyai tahap kebolehpercayaan yang tinggi akan mempunyai ralat yang kecil (tiada langsung). Lebih kecil ralat,

    maka lebih tinggi tahap kebolehpercayaan sesuatu pengukur atau

    alat ujian/kajian.

    Misalnya dalam ujian A (jam tangan A), kita akan dapati bahawa ralatnya ialah 10% sahaja, sementara dalam ujian B (jam tangan

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    B), kita akan dapati ralatnya ialah 40%. Ini bermakna bahawa

    sekali dalam 10 kali, jam tangan A tidak akan menunjukkan

    waktu yang tepat, manakala bagi jam tangan B, 4 kali dalam 10

    kali jam tangan itu akan memberikan waktu yang salah. Kita

    akan lebih mengharapkan jam A daripada jam tangan B.

    6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan sesuatu alat ujian boleh dipertingkat dengan beberapa cara iaitu:

    Pernyataan item yang tepat dan jelas

    Item-item yang digunakan hendaklah homogenous

    Arahan-arahan ujian mestilah jelas, ringkas dan padat

    Mengelakkan gangguan semasa subjek menjawab ujian

    Pengumpulan data dilakukan dalam keadaan yang piawai, serupa dan terkawal.

    7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item bagi mengukur kepuasan perkahwinan di kalangan responden ibu

    etnik Rungus, Sabah. Item-item tersebut dibahagikan kepada dua

    item positif dan dua item negatif seperti berikut:

    V1 Saya berpuas hati dengan perkahwinan saya (+)

    V2 Saya tidak berpuas hati dengan suami saya (-)

    V3 Saya berpuas hati dgn kasih sayang yang suami saya berikan (+)

    V4 Saya tidak berpuas hati dgn layanan yang suami saya berikan (-)

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    8. Jawapan bagi item positif dan negatif yang boleh dipilih oleh responden berdasarkan Jadual 9.1 berikut:

    Jadual 9.1 Skor Bagi Item Positif dan Negatif

    Item Positif (+) Item Negatif (-)

    5 = Sangat Setuju 5 = Sangat Tidak Setuju

    4 = Setuju 4 = Tidak Setuju

    3 = Tidak Pasti 3 = Tidak Pasti

    2 = Tidak Setuju 2 = Setuju

    1 = Sangat Tidak Setuju 1 = Sangat Setuju

    Nota: Recode boleh dibuat pada program SPSS

    9. Kebolehpercayaan sesuatu alat ujian boleh diukur melalui tiga cara iaitu:

    C2 Jenis Kebolehpercayaan

    C2.1 Ketekalan/Kebolehpercayaan Luaran

    1. Kaedah Uji-Uji Kembali (Test-Retest)

    Sesuatu ujian/soal selidik diberikan kepada responden yang sama pada dua masa berlainan. Contohnya, ujian/soal selidik

    diberikan pada hari ini, dan kemudian ujian/soal selidik yang

    sama diberikan semula seminggu kemudian kepada

    responden yang sama. Ujian korelasi dilakukan dan semakin

    tinggi korelasi antara dua ujian/soal selidik ini, maka semakin

    boleh dipercayai ujian/soal selidik tersebut.

    Dalam kebolehpercayaan Uji-Uji Kembali, ujian yang sama diberikan semula kepada subjek yang sama selepas satu

    jangkamasa tertentu. Jangkamasa yang diberikan boleh jadi

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    daripada beberapa minit kepada beberapa tahun (Brown,

    1976).

    Bila reliabiliti ujian semula ini dilaporkan di dalam test manual, jarak masa yang digunakan mestilah dinyatakan.

    Korelasi ujian kembali akan menjadi rendah jika jarak masa

    terlalu lama. Perkara ini terjadi disebabkan oleh beberapa

    angkubah lain seperti umur, kematangan dan pembelajaran

    yang mungking mempengaruhi subjek (Anastasi, 1968).

    Di samping itu pekali kebolehpercayaan juga akan menjadi tinggi jika jangka masa yang digunakan terlalu singkat kerana

    individu itu masih dapat mengingati kembali jawapan pada

    item-item yang tertentu (Mehrens & Lehmann, 1978).

    Namun begitu, kelesuan dan jemu pada satu ujian itu juga mungkin mempengaruhi prestasi subjek untuk menjawab ujian

    yang diberikan dan akibatnya reliabiliti akan menjadi rendah.

    Mohd Majid Konting (1990) menyatakan kaedah test-retest merupakan kaedah bagi mendapatkan dua set markat dengan

    mentadbir alat ukur yang sama ke atas subjek yang sama

    sebanyak dua kali. Skor-skor yang diperoleh pada

    pengukuran pertama dan pengukuran kedua dikorelasikan.

    Pengkaji mengandaikan responden dapat mencapai keputusan yang sama dalam ujian pertama dan kedua. Sekiranya kedua-

    dua skor dalam ujian pertama dan kedua itu mempunyai

    korelasi yang tinggi, menunjukkan alat pengukuran (alat

    ujian/soal selidik) itu mempunyai kebolehpercayaan yang

    tinggi.

    Contoh 1 : Mesin pemberat untuk mengukur berat badan A. Dua hari kemudian kita ukur semula berat A. Kita berharap

    mendapatkan ukuran yang sama jika pengukur (mesin

    pemberat) adalah dalam keadaan yang sama. Masalah yang

    timbul ialah jika kita ulangi pengukuran ini 4 bulan kemudian,

    mungkin A telah mengurangkan berat badannya dengan

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    berdiet, maka berat badannya akan lebih ringan berbanding

    permulaannya. Ini tidak bermakna mesin mengukur berat

    badan yang salah, tetapi yang telah berubah ialah berat badan

    A.

    Contoh 2 : Soalan bertanyakan tarikh lahir responden B dan jawapannya ialah 30 November 1947, maka pada ujian yang

    kedua kita menanyakan soalan sama, sudah tentu kita akan

    mendapat jawapan yang sama. Masalahnya ialah, jika

    ditanya pada waktu lain, responden lupa bila tarikh lahirnya,

    maka soalan yang kita reka sebagai pengukur bukanlah salah.

    Yang silap ialah jawapan responden.

    TUGASAN 7: Uji kebolehpercayaan uji-uji kembali

    IKSOKU-F dengan menggunakan korelasi Pearson.

    2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)

    Dalam ujian ini, pengkaji mempunyai dua ujian (2 bahagian soal selidik), tetapi kedua-duanya mengukur perkara yang

    sama. Ia ditadbir ke atas kumpulan orang/ responden yang

    sama bagi mendapat hubung kait antara dua ujian.

    Mohd Majid Konting (1990) menyatakan bahawa kaedah ini menggunakan satu alat ukur yang dibina dan satu alat ukur

    yang piawai. Kedua-dua alat ukur tersebut adalah setara dari

    segi kandungannya tetapi mungkin berbeza dari segi

    penyampaian. Kedua-dua alat ukur ditadbir pada subjek yang

    sama dan skor yang diperoleh daripada kedua-dua alat ukuran

    itu dikorelasikan.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Perkara yang sama seperti dilakukan dalam prosedur test-retest. Cuma perkataan dan susunan item dalam alat

    ujian/soal selidik ditukar supaya nampak berbeza namun

    isinya tetap sama.

    Sekiranya korelasi yang dicatat tinggi, maka alat ujian/soal selidik itu boleh dipercayai.

    Masalah yang dihadapi ialah untuk menentukan supaya kedua-dua ujian tersebut mengukur fenomena yang sama.

    C2.2 Ketekalan Dalaman (Internal Consistency)

    1. Menurut Brown (1984), analisis kebolehpercayaan

    ketekalan dalaman merujuk kepada sejauh mana item-

    item dalam sesuatu ujian saling berhubung kait. Ini

    bermakna semakin tinggi korelasi antara item, semakin

    tinggi kebolehpercayaan item itu.

    2. Ketekalan dalaman berhubung kait dengan korelasi

    purata antara item. Sesuatu ujian dikatakan seragam

    sekiranya skor bagi keseluruhan item dalam ujian

    tesebut adalah berkorelasi positif.

    3. Bagi memaksimumkan korelasi antara item ini,

    kepayahan item sepatutnya adalah sama. Jika dua item

    mengukur tingkah laku yang sama tetapi berbeza dalam

    kepayahan masing-masing, kedua-dua item ini

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    dikatakan mempunyai korelasi antara item yang sangat

    rendah.

    4. Secara umumnya, boleh dikatakan bahawa

    kebolehpercayaan sesuatu ujian itu sangat berhubung

    kait dengan darjah kepayahan iaitu pelbagai item dalam

    sesuatu ujian adalah berkorelasi di antara satu sama

    lain.

    5. Kebolehpercayaan sesuatu ujian dijelaskan sebagai satu

    nombor perpuluhan positif yang melingkungi sifar

    (0.00) hingga satu (1.00). Nilai 1.00 menunjukkan

    kebolehpercayaan yang sempurna. Manakla 0.00

    menunjukkan ketiadaan nilai kebolehpercayaan

    (Aiken, 1988).

    6. Anastasi (1982) menyatakan bahawa pekali

    kebolehpercayaan yang memuaskan dan tinggi adalah

    di antara 0.70 dan 0.90. Kaplan dan Succuzoo (2001)

    pula mencadangkan nilai kebolehpercayaan dalam

    lingkungan 0.70 hingga 0.80 adalah cukup baik untuk

    kebanyakan penyelidikan.

    7. Kerlingger (1973) berpendapat nilai kebolehpercayaan

    yang tinggi ialah 0.80.

    8. Terdapat pelbagai kaedah yang boleh digunakan untuk

    mengukur ketekalan dalaman seperti kaedah pekali alfa

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Cronbach, Split Half, dan analisis varians ukuran

    berulang Hoyt.

    1. Alfa Cronbach

    1. Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah satu

    teknik yang digunakan untuk menganggarkan kebolehpercayaan

    ketekalan dalaman.

    2. Ianya digunakan dalam situasi di mana format jawapan adalah lebih

    daripada alternatif misalnya pilihan jawapan betul atau salah.

    3. Alfa yang disarankan oleh Cronbach dan rakan-rakan (1955) boleh

    digunakan untuk melihat kebolehpercayaan ketekalan dalaman dan

    keseragaman item bagi sesuatu ujian.

    4. Anastasi (1982) menyatakan bahawa pekali Cronbach merupakan

    satu kaedah kebohpercayaan ketekalan dalaman sesuatu alat ukuran

    yang menggunakan jawapan tidak dikotomi. Kaedah ini sesuai

    digunakan bagi alat ukuran yang mempunyai skala jawapan lebih

    daripada dua seperti skala likert. Formula pekali alfa Cronbach

    adalah seperti berikut:

    1

    N Sa SiCr

    N Sa

    Di mana,

    Cr = pekali alfa

    N = jumlah item dalam ujian

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Sa = varians alat ukuran

    Si = varians item

    TUGASAN 8: Uji kebolehpercayaan ketekalan dalaman Cronbach

    alfa IKSOKU-F.

    2. Berbahagi-Dua (Split-Half)

    1. Menurut Anastasi (1982) kaedah split-half merupakan kaedah yang

    digunakan untuk melihat kebolehpercayaan dengan membahagikan

    item-item kepada dua bahagian dan mengkorelasikan item-item di

    antara kedua-dua bahagian masing-masing dengan menggunakan

    kaedah indeks ketekalan dalaman.

    2. Kaedah bahagi dua dilakukan dengan menggunakan statistik pekali

    korelasi Pearson dan diperbaiki dengan menggunakan formula

    Spearman Brown (Anastasi, 1982).

    3. Pembahagian juga boleh dibahagikan dengan dua cara. Pertama

    ialah apabila ujian adalah panjang maka ujian tersebut dibahagikan

    kepada dua bahagian. Cara pertama ini mungkin akan

    menimbulkan masalah akibat kesukaran membezakan item antara

    dua bahagian.

    4. Bagi mengatasi masalah ini, cara kedua perlu diaplikasikan iaitu

    dengan membahagikan ujian kepada dua berdasarkan nombor ganjil

    dan nombor genap soal selidik (Kaplan & Saccuzzo, 1993; Murphy

    & Davidshofer, 1991). Formula split half adalah sperti berikut:

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    2

    1

    RR

    r

    Di mana,

    R = kebolehpercayaan keseluruhan item dalam ujian

    r = korelasi antara item bernombor ganjil dan genap

    5. Jika diteliti split half ini hanya merupakan sebahagian daripada

    keseluruhan ujian. Jadi, keseluruhan kebolehpercayaan sesuatu alat

    ujian itu perlu diubahsuai dengan formula Spearman-Brown (1910)

    seperti di bawah:

    '

    '1 1

    llll

    ll

    nrr

    n r

    Di mana,

    rII = estimate coefficient

    nrII = korelasi yang telah diperolehi daripada dua split-half

    n = berapa kali item-item itu telah dibahagikan daripada jumlah item-item

    secara keseluruhannya.

    6. Korelasi antara dua bahagian itu dinamakan correlation between forms.

    Pekali yang dinamakan equal length Spearman-Brown memberi anggaran kebolehpercayaan skel lapan item

    seandainya skel tersebut terbina daripada dua bahagian sama

    panjang.

    Satu cara lagi untuk mengukur kebolehpercayaan ialah dengan mengira pekali Guttman split-half yang kebetulannya boleh

    dilakukan serentak dalam satu prosedur.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    7. TUGASAN 9: Uji kebolehpercayaan ketekalan dalaman Split-

    Half IKSOKU-F.

    Kuder-Richardson (KR)

    1. Kaedah ini berasaskan sisihan piawai alat ukur dan sisihan piawai item-item yang berlainan.

    2. Pekali kebolehpercayaan melalui kaedah ini juga dikenali sebagai alfa Cronbach.

    3. Menurut Sidek Mohd Noah (1990) dan Tuckman (1978), apabila item-item ujian yang dibina mempunyai skor sama ada A atau B,

    Salah atau Betul, Ya atau Tidak pada suatu ujian, kaedah ini sesuai

    digunakan.

    Menggunakan kaedah ini, skor yang diperolehi dari setiap item akan dikorelasikan dengan skor keseluruhan item.

    C2.3 Kebolehpercayaan interrater/interscorer

    1. Sesuatu kajian kadangkala perlukan rater atau pakar bagi membuat penilaian ke atas sesuatu fenomena. Oleh kerana data yang

    diperoleh mungkin melibatkan pemerhatian, pengkategorian

    ataupun temubual, maka pengkaji perlu memastikan sejauh mana

    tekalnya jawapan atau maklum balas yang mereka berikan.

    2. Sebagai contoh, adakah ketekalan dalam ujian memastikan sama ada 10 jenis air yang diminum itu panas, suam ataupun biasa.

    Mungkin 5 orang akan diminta menilai. Sejauhmana tekal dan

    sama jawpan yang diberikan merupakan kebolehpercayaan

    interrater.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    D. ANALISIS ITEM

    D1. Pengenalan

    1. Analisis item ialah satu kaedah yang digunakan bagi menilai kualiti

    item-item alat ujian dengan menggunakan beberapa cara

    berdasarkan sifat yang ingin dikaji.

    2. Analisis item bertujuan untuk memperbaiki sesuatu ujian dengan

    menyemak dan menggugurkan item-item yang tidak berkenaan

    (Aiken 1988).

    3. Alat pengukuran yang baik adalah alat pengukuran berkualiti yang

    didakwa sesuai bagi mengukur perkara yang ingin diuji. Bagi

    menghasilkan item yang baik dalam alat ujian, ahli psikometrik

    biasanya akan menjalankan proses pemilihan item bagi memastikan

    item-item yang berjaya menjadi ujian yang terakhir adalah item-item

    yang dianggap berkualiti untuk mengukur sesuatu trait yang hendak

    diukur.

    4. Menurut Aiken (1988), analisis item yang baik dapat memberi

    maklumat mengapa sesuatu alat ukuran itu tidak boleh dipercayai

    atau gagal menunjukkan tahap kesahan yang dijangkakan.

    5. Analisis item juga dapat menunjukkan mengapa ukuran itu boleh

    dipercayai dan dapat digunakan sebagai peramal kepada sesuatu

    kriteria tetapi tidak kepada kriteria pengukuran (Murphy &

    Davidshofer, 1988).

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    6. Hasil dari analisis item dapat memberi satu petunjuk apakah ukuran

    itu dapat difahami oleh sampel kajian (Iran Herman, 1988).

    7. Murphy dan Davidshofer (1988) menyatakan bahawa sesuatu

    kriteria dapat diramal dan dijangka oleh analisis item tetapi

    sesetengah pula tidak dapat diramal.

    8. Allen dan Yen (1982) menyatakan bahawa sesuatu alat yang baik

    dan sesuai harus mengalami satu proses analisis item bagi

    memastikan hanya item-item yang baik sahaja yang dapat dijadikan

    edisi ujian. Ini adalah penting untuk membuat kesimpulan

    keputusan dalam menentukan sama ada ukuran itu sah atau tidak

    sah.

    9. Anastasi (1982) menyatakan bahawa analisis item dapat

    memendekkan ujian dan pada masa yang sama meningkatkan

    kebolehpercayaan dan kesahan alat ujian tersebut.

    10. Wolman (1973) berpendapat bahawa analisis item adalah

    sesuatu penentu kepayahan, kemampuan mendiskriminasi,

    ketekalan dalaman dan kebolehpercayaan item-item di dalam ujian.

    Ia juga merupakan penentu kesahan item.

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    D2. Indeks Kepayahan Item

    1. Kepayahan item didefinisikan sebagai kebolehan individu menjawab

    betul sesuatu item (Anastasi, 1982). Sesuatu item yang senang akan

    menghasilkan peratus jawapan yang tinggi. Item yang terlalu susah

    pula akan menunjukkan nilai peratus jawapan betul yang rendah.

    2. Kedua-dua keadaan tersebut sama ada item yang terlalu senang dan

    terlalu susah adalah bentuk item yang kurang baik untuk dijadikan

    ujian terhadap sesuatu tret.

    3. Sesuatu item ujian yang baik dan ideal diperolehi sekiranya jawapan

    dapat menunjukkan 50% jawapan betul dan 50% jawapan salah.

    D3. Indeks Kebolehpercayaan Item

    1. Indeks Kebolehpercayaan item melihat fungsi keperbezaan dan

    serakan markat item dan juga korelasi di antara markat item dengan

    keseluruhan ujian. Secara formula indeks ini ialah hasil darab di

    antara item dengan markat keseluruhan. Jumlah keseluruhan

    markat dianggap sebagai kriteria dalam sesuatu item. Formulanya

    adalah berikut:

    kl i itI SP r

  • 2014 Dr. Ferlis bin Bullare @ Bahari

    Di mana,

    Iki = indeks kebolehpercayaan item

    spi = sisihan piawai item.

    rit = korelasi item dengan keseluruhan item.

    D4. Indeks Kesahan Item

    1. Indeks kesahan item diperolehi dengan mengkorelasikan markat

    item dengan markat pembolehubah kriterium (ric). Indeks kesahan

    item adalah hasil darab sisihan piawai item sebagai petunjuk

    keperbezaan dan serakan dengan korelasi item dengan kriterium.

    Formulanya adalah seperti berikut:

    icISi SP r

    Di mana

    Isi = Indeks Kesahan item

    Spi = Sisihan piawai item

    ric = Korelasi item dengan kriterium.