Post on 31-Oct-2015
description
STATISTIK PARAMETRIK DAN NONPARAMETRIK
1. Statistik Parametrik
Parametrik adalah ujian statistik yang melibatkan data normal, sebagaimana data dalam
populasi untuk menganggar parameter. Oleh itu, operasi yang melibatkan data normal
dinamakan statistik parametrik. Sebaliknya jika data tidak normal, dinamakan bukan
parametrik (nonparametric). Sebab itu ujian parametrik perlukan beberapa andaian
(assumption) dipenuni supaya dapat menjadi penganggar kepada parameter / populasi,
khususnya syarat kernormalan. Contoh kaedah statistik parametrik diantaranya adalah uji-z
(1atau 2 sampel ), uji-t (1 atau 2 sampel), korelasi pearson,perancang percubaan (2-way
ANOVA), dan lain-lain.
2. Statistik Non Parametrik
Statistik non parametrik disebut juga statistic bebas sebaran. Statistik non parametrik tidak
mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik boleh digunakan
pada data yang mempunyai sebaran normal atau tidak. Statistik nonparametrik biasanya
digunakan untuk melakukan analisis pada data muka atau ordinal. Contoh kaedah statistik
nonparametrik diantaranya adalah Chi-square test, Median test, Friedman test, dan lain-lain
3. Langkah-Langkah Pemilihan Kaedah Statistik
Bilakah kaedah statistik nonparametrik digunakan? Kaedah ujian ini digunakan apabila salah
satu syarat dalam statistik parametrik tidak dipenuhi. Syarat-syarat yang perlu diperhatikan
untuk menentukan statistik apa yang akan digunakan dalam analisis, iaitu:
1. Apakah pengedaran data diketahui? Jika pengedaran data tidak diketahui maka statistik
yang sesuai adalah statistik nonparametrik. Jika pengedaran data diketahui ,maka kita
harus melihat jenis pengedaran data tersebut.
2. Apakah data berdistribusi normal? Jika data tidak berdistribusi normal, maka statistik
yang sesuai adalah statistik nonparametrik. Jika data berdistribusi normal,maka statistik
yang sesuai adalah statistik parametric
3. Apakah sampel ditarik secara random? Jika sampel tidak ditarik secara random, maka
statistik yang sesuai adalah statistik nonparametrik. Jika sampel ditarik secara random,
maka statistik yang sesuai adalah statistik parametrik.
4. Apakah varians kumpulan sama? Jika varians kumpulan tidak sama, maka statistik yang
sesuai adalah statistik nonparametrik. Jika varians kumpulan sama,maka statistik yang
sesuai adalah statistik parametric
5. Bagaimana jenis skala pengukuran data? Jika skala pengukuran data nominal dan
ordinal, maka statistik yang sesuai adalah statistik nonparametrik. Jika skala pengukuran
data selang dan nisbah, maka statistik yang sesuai adalah statistik parametrik. Langkah-
langkah pemilihan kaedah statistik dapat dilihat pada Gambar 1
Rajah 1: Carta alir langkah-langkah pemilihan kaedah statistic
DataDistribusi populasi
diketahui??
Tidak
Tidak
Tidak
Tidak
Ya
Ya
Ya
Ya
Distribusi populasi normal??
Sampel ditarik secara
random???
Varians kelompok sama??
Skala
pengukuran??
Selang dan Nisbah
STATISTIK
Parametrik
Muka dan Ordinal
STATISTIK
BUKAN PARAMETRIK
Selain sebaran, salah satu penunjuk penggunaan kaedah statistik parametrik atau
nonparametrik adalah jenis data. Pengedaran normal merupakan sebahagian daripada
pengedaran kebarangkalian yang berterusan (continuous probability distribution). Oleh itu
skala pengukurannya pun haruslah berterusan. Jenis data yang mempunya iskala ukuran yang
berterusan adalah data nisbah dan selang .Kerana dalam pemilihan kaedah statistik jenis data
merupakan salah satu penunjuk, maka perlu dijelaskan kembali pengertian dan jenis-jenis data.
JENIS JENIS DATA:
JENIS JENIS DATA Umumnya data dibahagikan kepada 2 jenis iaitu Data Kuantitatif dan Data
Kualitatif Data Kuantitatif - data yang diukur dengan nilai numerik seperti tinggi, berat, halaju,
pendapatan dll Data ini dapat dipecahkan kepada dua- data diskrit dan data selenjar. Data
diskrit hanya mengambil nilai tertentu berbentuk angka bulat seperti bilangan anak, kereta dll
Bil. anak = 3 orang Pelajar = 56 orang
Data selenjar boleh mengambil apa-apa nilai di dalam sesuatu selang (perpuluhan atau
pecahan) seperti jumlah pendapatan, tinggi, berat dll. Tinggi = 1.67 m Pendapatan = RM
1575.35 CGPA = 3.75 Data Kualitatif – data yang merujuk kepada jenis, sifat atau pangkat
sesuatu perkara seperti jantina, bangsa, jenama pakaian dan sebagainya. Data ini tidak diukur
atau dinyatakan di dalam bentuk angka/nombor Bangsa = Melayu Jantina = lelaki
JENIS SKALA UKURAN DATA:
Data dikumpul atau dicerap di dalam pelbagai skala ukuran. Teknik menganalisis dan
memaparkan sesuatu data bergantung kepada skala ukuran data tersebut. Kesilapan memilih
teknik analisis dan memaparkan data terhadap jenis data yang tidak sesuai akan membawa
kepada ralat yang tidak disedari. Skala ukuran data boleh dibahagikan kepada 4 jenis ukuran
iaitu Skala Norminal , Skala Ordinal , Skala Intervel (Selang) dan Skala Ratio (Nisbah)
Skala Norminal:
Data norminal ialah data yang dikelaskan kepada kumpulan tertentu atau kategori nilai.
Contohnya jantina responden dikelaskan kepada 2 kategori iaitu lelaki dan perempuan. Pada
kebiasaanya, data jantina ini diberi kod angka atau label iaitu 1 bagi lelaki dan 2 bagi
perempuan. Kod 1 dan 2 ini hanyalah sebagai label semata-mata dan tidak memiliki apa-apa
erti. Oleh itu operasi- operasi matematik tertentu seperti min, sisihan piawai dan sebaianya
tidak boleh digunakan terhadap data jenis ini
Skala Ordinal:
Skala Ordinal Skala ordinal tidak hanya mengkelaskan data kedalam kumpulan, tetapi juga
meletakan pangkat terhadap kumpulan tersebut. Contohnya: Kumpulan kereta Pangkat (1
paling disukai) SUV 1 Pancuan 4 roda 2 Sedan 3 Mini 4 Kumpulan kereta SUV lebih disukai
daripada Pacuan 4 roda dan kumpulan kereta Sedan lebih disukai daripada Mini (perbezaan
satu pangkat).
Walaupun perbezaan antara MPV dengan Pancuan 4 roda dan Sedan dengan Mini adalah sama
(perbezaan satu pangkat sahaja), kita dapat mengatakan bahawa nilai atau tahap perbezaan
tersebut adalah sama. Kategori nilai pangkat tidak menggambarkan perbezaan yang sama
(equal differences) dari segi ukuran atribut. Variabel atau pemboleh ubah yang diukur dengan
skala Norminal dan Ordinal biasanya dikenali bukan metrik ( non-metrik/non-parametrik).
Skala Interval/Selang:
Nilai yang dicerap/kumpul di dalam nilai asal sebenar Contohnya umur – perbezaan umur
antara 90 tahun dengan 89 tahun dan antara 14 tahun dengan 13 tahun adalah sama (iaitu
setahun). Tiap-tiap satu unit perbezaan membawa makna yang sama tanpa mengira di mana
ukuran tersebut berada Dalam ukuran selang, kita dapat menerangkan bukan sahaja siapa yang
lebih tinggi kedudukannya, malah dapat menunjukkan sejauh manakah perbezaan kedudukan
tersebut (berapa unit).
Skala Ratio:
Nilai yang dikumpul/cerap di dalam nilai asal sebenar Apa yang membezakan dengan ukuran
Intervel ialah ukuran Ratio mempunyai nilai dasar atau nilai sifar dan kebiasaanya tidak
mempunyai nilai negatif. Seseorang tidak boleh menyatakan bahawa beratnya ialah kurang dari
sifar (negatif) atau pendapatnya adalah negatif (kalau berhutang macam mana ???) Skala
Interval dan Ratio sering menimbulkan kekeliruan (contohnya umur) dan terdapat pengkaji
yang mengandaikan ukuran Intervel dan Ratio sebagai satu satu kumpulan ukuran data sahaja.
Statistik Deskriptif:
Satu kaedah yang digunakan untuk memerihalkan taburan sesuatu data Terdapat 2 ukuran
yang digunakan untuk memerihalkan taburan sesuatu data iaitu Ukuran Kecenderungan
Memusat dan Ukuran Sukatan Ubahan Ukuran Kecenderungan Memusat yang selalu digunakan
ialah min, mod dan median Ukuran Sukatan Ubahan yang selalu diguna ialah varians, sisihan
piawai dan julat
MIN/PURATA:
Nilai yang diperolehi daripada hasil bahagi jumlah semua nilai dengan bilangan kes Ianya bukan
suatu angka mutlak tapi anggaran semata-mata. Kebiasaanya terdapat dua jenis min iaitu min
bagi populasi dan min bagi sampel. Min sampel boleh dinyatakan seperti berikut : min sampel =
∑x n Di mana ∑x = jumlah semua nilai-nilai n = ialah bilangan sampel X
Data Menurut Sumbernya
Berdasarkan sumbernya, data dapat digolongkan menjadi:
a. Data dalaman dan data luaran.
Data dalaman iaitu data yang berpunca dari dalam organisasi. Data luaran yaitu data yang
berpunca dari luar organisasi.
b. Data primer dan data sekunder
Data primer adalah data yang diperoleh melalui survey lapangan dengan menggunakan kaedah
pengumpulan data tertentu. Data sekunder adalah data yang telah dikumpulkan oleh lembaga
pengumpul data dan diterbitkan kepada masyarakat pengguna data. Data sekunder akan lebih
mempermudah dan mempercepat jalannya penyelidikan. Namun kerana umumnya data
sekunder dimaksudkan untuk pengguna penyelidik dalam jumlah yang besar, seringkali data
yang tersedia tidak sesuai dengan keinginan penyelidik. Hal yang sering dikeluhkan apabila kita
menggunakan data sekunder adalah:
(1) ragam data statistik yang tersedia semakin banyak tetapi kelompok data yang diperlukan
bagi suatu kajian sering tidak cukup;
(2) Data runtut waktu tidak konsisten dan tidak selalu dapat dipertahankan;
(3) angka-angka mengenai masalah tertentu yang dikeluarkan oleh pelbagai sumber rasmi
tidak konsisten satu sama lain. Uji keboleh percayaan data, penyederhanaan, agregasi, dan
penyesuaian mutlak diperlukan agar diperoleh hasil yang dapat dipertanggungjawabkan
KLASIFIKASI DATA DAPAT DIPERHATIKAN DALAM RAJAH DI BAWAH:
Statistik Parametrik
Parametrik bermakna parameter. Parameter adalah penunjuk dari suatu pengedaran hasil
pengukuran. Indikator dari pengedaran pengukuran berdasarkan statistik parametrik digunakan
untuk parameter dari pengedaran normal. Apa yang dimaksudkan dengan pengedaran
normal? Bagaimana mengetahui sebuah data berdistribusi normal atau tidak? Hal ini penting
sekali untuk diketahui kerana berdasarkan normal atau tidaknya pengedaran ini baru dapat
ditentukan apakah uji statistik parametrik atau nonparametrik yangdigunakan. Distribusi
normal dikenal juga dengan istilah Gaussian Distribution. Pengedaran normal mengandung dua
parameter, iaitu rata-rata (mean = M, varians= S2). Parameter-parameter ini memberikan ciri-
ciri yang unik pada suatu pengedaran berdasarkan "Lokasi"-Nya (central tendency). Pelbagai
kaedah statistik bergantung kepada kedua parameter tersebut. Penggunaan kaedah statistik
parametrik mengikuti prinsip-prinsip pengedaran normal. Prinsip-prinsip dari pengedaran
normal adalah:
a.Pengedaran dari suatu sampel yang dijadikan objek pengukuranberasal dari pengedaran
penduduk yang diandaikan terdistribusisecara normal.
b.Sampel diperoleh secara random, dengan jumlah sampel yangdianggap dapat mewakili
populasi.
c.Pengedaran normal merupakan sebahagian daripada pengedaran kebarangkalianyang
berterusan (continuous probability distribution). Impilkasinya, skala pengukuran pun harus
berterusan. Skala ukuran yang berterusan adalah skala nisbah dan selang. Kedua skala ini
memenuhi syarat untuk menggunakan uji statistik parametric. Bila syarat-syarat ini semua
dipenuhi, maka kaedah statistik parametrik boleh digunakan
Statistik nonparametrik
Istilah nonparametrik pertama kali digunakan olehWolfowitz, pada tahun 1942. Kaedah statistik
nonparametrik merupakan kaedah statistik yang boleh digunakan dengan mengabaikan
andaian-andaian yang melandasi penggunaan kaedah statistik parametrik, terutama yang
berkaitan dengan pengedaran normal. Istilah lain yang sering digunakan untuk
statistik nonparametrik adalah statistik bebas pengedaran (distribution-free statistics) Dan uji
bebas andaian (assumption-free test). Statistik nonparametrik banyak digunakan pada
penelitian-penelitian sosial. Data yang diperolehi dalam kajian sosial pada umumnya berbentuk
kategori atau berbentuk rangking. Uji statistik nonparametrik ialah suatu uji statistik yang tidak
memerlukan adanya andaian-andaian mengenai sebaran datapenduduk. Uji statistik ini disebut
juga sebagai statistik bebas sebaran (distribution free). Statistik nonparametrik
tidak mensyaratkan bentuk sebaran parameter populasi berdistribusi normal. Statistik
nonparametrik boleh digunakan untuk menganalisis data yang berskala muka atau ordinal
kerana pada umumnya data berjenis muka dan ordinal tidak merebak normal. Dari segi jumlah
data, pada umumnya statistic nonparametrik digunakan untuk data berjumlah kecil (n <30).
Kelebihan Statistik Nonparametrik
Kelebihan statistik nonparametrik diantaranya:
1) Andaian dalam uji-uji statistik nonparametrik relatif lebih longgar. Jika ujian data
menunjukkan bahawa salah satu atau beberapa andaian yang mendasari uji statistik
parametric (Misalnya mengenai sifat pengedaran data) tidak dipenuhi, maka statistik
nonparametrik lebih sesuai diterapkan dibandingkan statistik parametrik.
2) Perhitungan-perhitungannya dapat dilaksanakan dengan cepat dan mudah, sehingga
hasil penelitian segera dapat disampaikan.
3) Untuk memahami konsep-konsep dan kaedah-kaedah tidak memerlukan asas
matematik serta statistic yang mendalam.
4) Ujian pada statistik nonparametrik dapat diterapkan jika kita menghadapi keterbatasan
data yang tersedia, misalnya jika data telah diukur menggunakan skala ukuran yang
lemah (muka atau ordinal).
5) Kecekapan statistik nonparametrik lebih tinggi berbanding dengan kaedah parametrik
untuk jumlah sampel yang sedikit.
Kelemahan Statistik Nonparametrik
Disamping kelebihan, statistik nonparametrik juga mempunyai kelemahan. Beberapa
kelemahan statistik nonparametrik antara lain:
1) Jika andaian uji statistik parametrik dipenuhi, penggunaan ujian nonparametrik akan
menyebabkan pembaziran maklumat walaupun lebih cepat dan mudah.
2) Jika jumlah sampel besar, tahap kecekapan nonparametrik relative lebih rendah
berbanding dengan kaedah parametrik.
3) Statistik nonparametrik tidak dapat dipergunakan untuk membuat ramalan (peramalan).