8. Uji Korelasi Pearson Dan Regresi Linier

download 8. Uji Korelasi Pearson Dan Regresi Linier

of 14

Transcript of 8. Uji Korelasi Pearson Dan Regresi Linier

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    1/14

    R A 1

    KuliahOleh Ir. Rahayu Astuti, M.Kes

    UJI KORELASI PEARSON DAN REGRESI LINIER

    PENDAHULUAN

    Dalam suatu penelitian kadang kita ingin mengetahui hubungan antara dua

    variabel yang numerik atau continuous misalnya ingin mengetahui apakah ada

    hubungan antara berat badan dengan tekanan darah sistole, apakah ada hubungan

    antara umur dengan kadar Hb, apakah ada hubungan antara umur pasien dengan lama

    hari rawat, apakah ada hubungan antara indeks masa tubuh (IMT) dengan kadar

    kholesterol dan sebagainya. Metode statistik yang paling umum digunakan untuk

    menggambarkan hubungan antara dua variabel yang numerik atau kuantitative ( X dan

    Y ) adalah korelasi linier dan regresi linier.

    Misalnya hubungan antara berat badan sekelompok ibu hamil dengan berat

    badan lahir bayinya. Untuk menilai seberapa kuat/ erat hubungan antara berat badan

    ibu dengan berat lahir bayi, maka digunakan koefisien korelasi untuk mengukur

    kekuatan hubungan antara dua variable tersebut. Namun jika ingin memprediksi berat

    lahir bayi jika berat badan ibu hamil diketahui maka digunakan analisis regresi linier.

    KORELASI PEARSON

    Korelasi Pearson digunakan untuk menguji hubungan dua variabel kuantitatif

    (interval, rasio) dan berdistribusi normal. Sedangkan korelasi Spearman atau Kendall

    tau-b mengukur hubungan antara dua variabel kualitatif atau kuantitatif yang tidak

    berdistribusi normal.Korelasi Pearson disamping dapat untuk mengetahui kekuatan/ keeratan

    hubungan, juga dapat untuk mengetahui arah hubungan dua variabel numerik.

    Misalnya apakah hubungan antara berat badan ibu dengan berat lahir bayi mempunyai

    hubungan yang kuat atau lemah, juga apakah hubungan tersebut berpola positif atau

    negatif.

    Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari

    diagram tebar/ pencar (scatter plot). Diagram tebar adalah grafik yang menunjukkan

    titik-titik perpotongan nilai data dari dua variabel ( X dan Y ). Pada umumnya dalam

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    2/14

    R A 2

    grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel

    dependen (Y) pada garis vertikal.

    Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua

    variabel X dan Y. Selain memberi informasi pola hubungan dari kedua variabel,

    diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel

    tersebut.

    . . . . . .. . . . . . . . . . . . . . .

    . . . . . .. . . . . . . . . . .. . . . . . . . . . . . .. . . .

    .. . . . . .. . .. . . . . . . .. . . . .. .. . . . . . . .

    ________________ __________________ __________________

    linier positif linier negatif tidak ada hubungan inier

    Derajat hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya,

    semakin rapat tebaran datanya semakin kuat hubungannya dan sebaliknya semakin

    melebar tebarannya menunjukkan hubungannya semakin lemah.

    Untuk mengetahui lebih tepat kekuatan hubungan digunakan Koefisien Korelasi

    Pearson. Koefisien Korelasi disimbulkan dengan r (huruf r kecil)

    Koefisien Korelasi Pearsons Disimbulkan dengan r , dapat diperoleh dari formula berikut :

    ( XY ) [( X ) ( Y ) / n ]r =

    [( X2 ) ( X ) 2 /n ] [( Y2 ) ( Y ) 2 / n ]

    atau

    n ( XY ) ( X Y )r =

    [ n X2 (X)2 ] [ n Y2 (Y)2 ]

    Dari nilai r kita dapat menentukan :

    a. Kekuatan hubungan ( nilai 0 s/d 1 )

    b. Arah hubungan ( + atau - )

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    3/14

    R A 3

    Kisaran nilai r antara 0 s/d 1 :

    0 : tidak ada hubungan linier

    + 1 : ada hubungan linier positip sempurna

    - 1 : ada hubungan linier negatif sempurna

    Arah hubungan :

    + : hubungan positif : semakin besar nilai X semakin besar nilai Y

    - : hubungan negatif : semakin besar nilai X semakin kecil nilai Y

    Hubungan dua variabel dapat berpola positip atau negatip. Hubungan positip

    terjadi bila kenaikan satu variabel diikuti kenaikan variabel lain ,misalnya semakin

    bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.

    Sedangkan hubungan negatip dapat terjadi bila kenaikan satu variabel diikuti

    penurunan variable yang lain, misalnya semakin bertambah umurnya (semakin tua)

    semakin rendah kadar Hb nya.

    Asumsi :

    Koefisien Korelasi Pearson hanya valid jika asumsi berikut dipenuhi :

    1. Untuk setiap nilai X, nilai Y terdistribusi secara normal

    2. Untuk setiap nilai Y, nilai X terdistribusi secara normal

    3. Perkalian antara X dan Y terdistribusi secara normal (bivariat normal distr.)

    (Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam, 1998)

    Uji hipotesis :

    Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk

    menjelaskan derajat hubungan linier antara dua variabel. Selanjutnya perlu dilakukan

    uji hipotesis untuk mengetahui apakah hubungan antara dua variabel terjadi secara

    signifikan atau hanya karena faktor kebetulan dari random sampel (by chance). Uji

    hipotesis dapat dilakukan dengan dua cara, yaitu pertama, membandingkan nilai r

    hitung dengan r tabel; kedua, menggunakan pengujian dengan pendekatan distribusi t.

    Formula uji t :

    n 2 rt = r atau t =

    1 r2 ( 1 r2 ) / ( n 2 )

    df = n 2 n = jumlah sampel

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    4/14

    R A 4

    Ho : = 0

    Ha : 0 Uji statistik : uji t (rumus diatas)

    Keputusan : Ho ditolak jika | t hitung | t ( tabel : /2, df = n-2 )Jika keputusan Ho ditolak maka kesimpulannya koefisien korelasi populasi ( ) tidak

    sama dengan nol dengan kata lain koefisien tersebut benar eksis/ada

    Jika menggunakan program SPSS sudah langsung didapatkan nilai r dan nilai

    signifikansinya ( p value).

    Pengambilan keputusan : Ho ditolak jika p value r tabel maka tolak Ho

    Kesimpulannya: ada hubungan yang signifikan antara BB ibu dengan BB bayi

    dengan r positif artinya semakin besar BB ibu semakin besar pula BB bayi

    b) Jika menggunakan tabel t

    n 2t = r

    1 r2

    10 2t = 0,8045 = 3,83

    1 (0,8045) 2

    Keputusan : Ho ditolak jika | t hitung | t ( tabel : /2, df = n-2 )Nilai t tabel dengan /2 = 0,05/2 = 0,025 , df = 10-2 = 8 diperoleh 2,306

    Karena t hitung ( 3,83 ) > t tabel ( 2,306 ) maka tolak Ho

    Kesimpulannya: ada hubungan yang signifikan antara BB ibu dengan BB bayi dengan

    r positif artinya semakin besar BB ibu semakin besar pula BB bayi.

    Jika digunakan program SPSS maka diperoleh:

    1. Uji kenormalan:Tests of Normality

    ,243 10 ,097 ,901 10 ,222,138 10 ,200* ,959 10 ,773

    bb bumil (kg)bb bayi (gram)

    Statistic df Sig. Statistic df Sig.Kolmogorov-Smirnov a Shapiro-Wilk

    This is a lower bound of the true significance.*.

    Lilliefors Significance Correctiona.

    Terlihat bahwa pada uji Kolmogorov-Smirnov, p-value bb bumil = 0,097 dan bb bayi

    = 0,200. Variabel bb ibu hamil dan bb bayi berdistribusi normal karena p-value >

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    7/14

    R A 7

    (0,05). Begitu pula dengan uji Shapiro-Wilk dimana p-value bb ibu hamil = 0,222 dan

    p-value bb bayi = 0,773.

    2. Uji Korelasi Pearson:

    Correlations

    1.000 .805**. .005

    10 10.805** 1.000.005 .

    10 10

    Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

    bb bumil (kg)

    bb bayi (gram)

    bb bumil (kg)bb bayi(gram)

    Correlation is significant at the 0.01 level (2-tailed).**.Terlihat hasil analisis korelasi Pearson diperoleh koefisien korelasi ( r ) = 0,805

    Dilihat dari besaran r mendekati nilai 1 sehingga korelasi kuat dan arahnya positif

    artinya semakin meningkat berat badan bumil semakin meningkat pula berat lahir bayi.

    Pada hasil analisis dengan komputer diperoleh p-value = 0,005. Karena p-value

    < tolak Ho sehingga kesimpulannya : Ada hubungan yang signifikan antara berat

    badan ibu hamil dengan berat badan bayi lahir

    REGRESI LINIER SEDERHANA

    Analisis regresi dapat digunakan untuk menggambarkan hubungan linier antara

    dua variable numerik. Tujuan analisis regresi adalah untuk membuat perkiraan /

    memprediksi nilai suatu variabel (variabel dependen) melalui variabel yang lain

    (variabel independen).

    Sebagai contoh dalam hubungan antara Pemberian Makanan Tambahan (PMT)

    dalam satuan Kalori dengan pertambahan berat badan dalam satuan kg, ingindiprediksi berapa besarnya pertambahan berat badan bila diketahui banyaknya Kalori

    pada PMT.

    Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh

    dengan berbagai cara/ metode. Salah satu cara yang sering digunakan oleh peneliti

    adalah dengan menggunakan metode kuadrat terkecil (least square).

    Metode least square merupakan metode pembuatan garis regresi dengan cara

    meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan nilai Y yang

    diramalkan oleh garis regresi .

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    8/14

    R A 8

    PERSAMAAN GARIS

    Secara matematis model persamaan garis regresi sebagai berikut :

    = a + b X

    Dimana : : nilai Y yang diprediksi X : variabel independen = variabel bebas = prediktora : intercept = nilai bila X=0

    atau intercept/perpotongan garis regresi dengan sumbu Yb : slope = kemiringan garis regresi = koefisien regresi

    = nilai Y meningkat sebesar b unit untuk setiap kenaikan nilai X sebesar satu

    Sedangkan a dan b diperoleh dengan persamaan sebagai berikut:

    [ XY ] [( X ) ( Y ) / n]b = [ X2] [(X)2 / n ]

    a = Y b X

    dimana Y = mean Y dan X = mean X

    Perbedaan p enting antara (nilai prediksi) dimana semua akan jatuh pada garisregresi sedangkan Y (nilai observasi) biasanya tidak semua jatuh pada pada garis

    regresi. Konstanta a dan b adalah estimasi dari dua parameter pada persamaan regresiyang sesungguhnya dimana dianggap pada lokasi garis.

    Gambar 1 : Persamaan garis lurusY

    = a + bX

    Y

    Y : X : b = = slope: : X

    a= Y intercept :: :

    X X+ X

    Pada gambar terlihat:

    Konstanta a titik dimana garis lurus/garis regresi berpotongan dengan sumbu y.

    Sedangkan b slope atau gradien dari garis.

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    9/14

    R A 9

    Slope didefinisikan jumlah perubahan ( Y) pada variabel dependen dibagi dengan

    jumlah perubahan ( X) pada variabel independen. Slope disebut juga koefisien regresi

    Contoh:

    Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat badanbayi yang dilahirkannya. Datanya sebagai berikut:

    Ibu BB ibu (kg) BB bayi (gram)1 49,4 35152 63,5 37423 68,0 36294 52,5 28805 54,4 30086 70,3 40687 50,8 3373

    8 73,9 41249 65,8 357210 54,4 3359

    Pada analisis korelasi diperoleh koefisien korelasi sebesar r = 0,805. Sehingga ada

    hubungan yang kuat antara BB ibu hamil dengan BB lahir bayi dengan r berpola linier

    positif artinya semakin besar BB ibu hamil semakin besar pula BB lahir bayi

    Pada contoh diatas dapat dilihat bagaimana BB lahir bayi tergantung dari BB

    ibu hamil. Untuk itu dapat dilakukan analisis regresi linier. Pada analisis ini dapat

    diprediksi berapa BB lahir bayi jika diketahui BB ibu hamil.

    Persamaan :

    = a + bXBB lahir bayi = a + b BB ibu hamil

    Pada soal diatas diperoleh:

    XY = 2151860,8 X = 602,7 X = 60,27

    X2 = 37053,75 Y = 35270 Y = 3527Y2 = 125845088

    Sehingga:

    [ XY ] [( X ) ( Y ) / n]b =

    [ X2] [(X)2 / n ]

    [2151860,8] [(602,7) (35270) / 10] 26137,9b = = = 35,853

    [37053,75] [(602,7)2 / 10 ] 729,021

    a = 3527 ( 35,853 ) ( 60,27 ) = 1366,139

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    10/14

    R A 10

    Jadi persamaannya adalah : = 1366,139 + 35,853X

    KOEFISIEN REGRESI

    Yaitu dilihat slope dari garis regresi atau dilihat nilai bMisalnya : b = 35,853 , artinya tiap kenaikan pada X sebesar 1 satuan X akan

    meningkatkan Y sebesar 35,853 satu satuan Y.

    Tiap kenaikan BB ibu hamil sebesar 1 kg maka meningkatkan BB lahir bayi sebesar

    35,853 gram.

    KOEFISIEN DETERMINASI ( R 2 ) = R-Square

    Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X.

    r = 0,805 sehingga R 2 = 0,648 = 64,8 %. Jadi variabel berat lahir bayi dapat

    diterangkan oleh berat badan ibu hamil sebesar 64,8 %

    Jadi jika diketahu BB ibu hamil 50 kg maka berat lahir bayi :

    = 1366,139 + 35,853X= 1366,139 + 35,853 ( 50 ) = 3158,789 gram

    Hasil analisis regresi linier menggunakan program SPSS:

    Coefficients a

    1366.114 569.599 2.398 .04335.853 9.357 .805 3.832 .005

    (Constant)bb bumil (kg)

    Model1

    B Std. Error

    UnstandardizedCoefficients

    Beta

    Standardized

    Coefficients

    t Sig.

    Dependent Variable: bb bayi (gram)a.

    Diperoleh nilai a = 1366,114nilai b = 35,853sehingga persamaan garis regresinya adalah: = 1366,139 + 35,853 X

    KETERBATASAN ANALISIS REGRESI LINIER

    Analisis regresi linier sangat banyak kegunaannya. Namun dalam

    menerapkannya perlu diperhatikan keterbatasannya. Hal ini untuk mencegah

    penafsiran yang keliru, karena saat ini penghitungan analisis regresi linier tersebut

    telah sedemikian mudahnya dilakukan oleh komputer.

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    11/14

    R A 11

    Keterbatasannya adalah sebagai berikut:

    1. Analisis regresi linier dihitung dengan asumsi khusus, sehingga asumsi ini harus

    diteliti apakah dipenuhi atau tidak. Pemeriksaan asumsi ini memerlukan

    perhitungan lebih lanjut yang tidak akan dijelaskan disini. Salah satu asumsi adalah

    sebaran residu yang mengikuti sebaran Gauss. Dengan demikian analisis regresi

    linier ini dilakukan dengan prosedur statistik parametric.

    2. Penyimpulan hasil hendaknya memperhatikan rentang data yang diamati. Bila akan

    melakukan ekstrapolasi atau proyeksi, diperlukan berbagai asumsi agar linieritas

    garis dapat dipertahankan.

    3. Hubungan yang digambarkan pada analisis regresi linier tidak dapat diartikan

    sebagai hubungan kausal atau sebab akibat. Dapat diingat bahwa simpulan

    hubungan sebab akibat harus didukung oleh beberapa hasil lain seperti yang

    diutarakan oleh Bradford Hill (1971).

    SOAL:

    1. Seorang peneliti ingin mengetahui hubungan antara umur dengan tekanan darahsistole. Datanya adalah sebagai berikut:

    Sampel Umur Tekanan darah sistole

    123456789

    101112

    252931354255384827574337

    105110112115120130118125106140125115

    Pertanyaan :a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung

    koefisien korelasinya)b). Apakah ada hubungan antara umur dengan tekanan darah sistole?c). Buatlah persamaan garis regresinya.d). Jika diketahui seseorang yang umurnya 45 tahun maka berapa prediksi tekanan

    darah sistoliknya?

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    12/14

    R A 12

    2. Pada data berikut:

    Sampel Jumlah anggotakeluarga

    Status gizi(Z skor)

    123456789

    10

    4936767654

    -1.00-2.81-1.93-1.97-2.18-2.63-2.82-1.69-1.61.19

    Pertanyaan :

    a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung koefisienkorelasinya).

    b). Apakah ada hubungan antara jumlah anggota keluarga dengan status gizi padabalita?

    c). Buatlah persamaan garis regresinya.

    Daftar Pustaka

    1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.

    20022. Chandra, B. Pengantar Statistik Kesehatan. Penerbit Buku Kedokteran EGC.

    Jakarta.1995.3. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-Hill

    International Editions. Lange Medical Books, The McGraw-Hill Companies. 2001.4. Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam. Applied Regression Analysis

    and Other Multivariate Methods. 3 rd.Ed.. Duxbury Press, California. 1998.5. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company.

    19846. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.7. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury Press.1993.8. Prasetyo, SB. Aplikasi Analisis Regresi Linier. Program Studi Magister Kesehatan

    Masyarakat, FKM, UI. 2002.9. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.10. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures.

    Third Edition. Chapman & Hall/CRC. Florida. 2004.

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    13/14

    R A 13

    TABEL NILAI KRITIS r PEARSON

    df =n-2Tingkat signifikansi (one- tailed)

    0,05 0,025 0,01 0,005Tingkat signifikansi (two- tailed)

    0,1 0,05 0,02 0,01

    12345678

    910

    1112131415161718

    1920

    21222324252627282930

    3540455060708090

    100

    0.9880.9000.8050.7290.6690.6220.5820.549

    0.5210.497

    0.4760.4580.4410.4260.4120.4000.3890.378

    0.3690.360

    0.3520.3440.3370.3300.3230.3170.3110.3060.3010.296

    0.2750.2570.2430.2310.2110.1950.1830.1730.164

    0.9970.9500.8780.8110.7540.7070.6660.632

    0.6020.576

    0.5530.5320.5140.4970.4820.4680.4560.444

    0.4330.423

    0.4130.4040.3960.3880.3810.3740.3670.3610.3550.349

    0.3250.3040.2880.2730.2500.2320.2170.2050.195

    0.9950.9000.9340.8820.8330.7890.7500.716

    0.6850.658

    0.6340.6120.5920.5740.5580.5420.5280.516

    0.5030.492

    0.4820.4720.4620.4530.4450.4370.4300.4230.4160.409

    0.3810.3580.3380.3220.2950.2740.2560.2420.230

    0.9990.9900.9590.9170.8740.8340.7980.765

    0.7350.708

    0.6840.6610.6410.6230.6060.5900.5750.561

    0.5490.537

    0.5260.5150.5050.4960.4870.4790.4710.4630.4560.449

    0.4180.3930.3720.3540.3250.3020.2830.2670.254

  • 8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier

    14/14

    R A 14