Post on 06-Jan-2016
description
STATISTIK TERAPANSTATISTIK TERAPAN
Oleh :Oleh :
Dr. dr. Buraerah. H. Abd. Hakim, MScDr. dr. Buraerah. H. Abd. Hakim, MSc( Jurusan : Biostatistik / KKB FKM – UH )( Jurusan : Biostatistik / KKB FKM – UH )
PROGRAM PASCASARJANA UNIVERSITAS HASANUDDIN
Program Magister Epidemiologi Non Reguler
REGRESSI LINIER BERGANDA LOGISTIK
REGRESSI LINIER BERGANDA LOGISTIK
REGRESSI LINIER BERGANDA LOGISTICREGRESSI LINIER BERGANDA LOGISTIC
MODEL UMUM
p = a + b1x1 + b2x2 + ………………. .. bn xn
Model tersebut baru dapat dipakai apabila “p” ditransformasikan dalam bentuk “ logodds “
“ Logodds “ = logit ialah logaritme natural dari odds.
Odds sendiri adalah rasio antara probabilitas suatu “ peristiwa “ untuk terjadi (sukses) dan probabilitas peristiwa untuk tidak terjadi (gagal).
p = a + b1x1 + b2x2 + ………………. .. bn xn
KETERANGAN:
Ruas kanan terdiri dari :
►(a) = Konstanta, sejmlah koef regressi (bi), dan variabel prediktor
►Ruas kanan bisa bernilai < 0 apabila konstanta (a) – (bi) x var prediktor
►Ruas kanan bisa juga bernilai > 1 apabila konstanta (a) + (bi) x var prediktor
►ruas kiri adalah (p) atau probability terjadinya peristiwa dan tidak terjadinya peristiwa :
(p) ------------ nilai selalu berkisar antara 0 - 1 (1-p)
►Ketidak cocokan tersebut adalah petunjuk bahwa persamaan tidak dapat
digunakan
Apabila probabilitas suatu peristiwa untuk terjadi disebut ( p ) maka dengan sendirinya probabilitas suatu peristiwa untuk tidak terjadi adalah (1 – p )
Dengan demikian “ log odds “ untuk (p) adalah sebagai berikut :
p Log odds (p) = ------------
(1- p)
Nilai ini nanti dapat digunakan apabila ditransformasi kedalam bentuk nilai logarithma naturalnya.
Dengen demikian rumus umum dari regressi berganda logistik adalah :
pLn ( -------- ) = a + b1x1 + b2x2 + ………… bn xn
1- p
Keterangan :
a = konstanta (interceps)
b1, b2 … = koefisien korelasi variabel prediktor atau idependen) yang dikenal dengan “slope “.(koefisien korelasi variabel indep)
x1, x2, ….xk = variabel prediktor yang akan dilihat pengaruhnya.
p = probabilitas untuk terjadinya peristiwa dari variabel respons ( dependen) Y yang berskala biner (binary) dan berdistribusi normal
Y = a + b(x)
Slope
Intercept
b
Var. X
Var. Y = (p) / (1- p)
a
PERSAMAAN GARIS REGRESSIPERSAMAAN GARIS REGRESSI
Y = a + bx
Var. prediktor (xi)
CONTOH PENGGUNAANCONTOH PENGGUNAAN Seorang dokter ingin memperkirakan kemungkinan untuk
bertahan hidup dari seorang bayi baru lahir dengan kesulitan bernapas karena IRDS (Irregular Respiratory Distress Sindrome) dengan kondisi bayi sbb :
►Nilai APGAR = adalah antara 0 – 10
►Pertolongan yang akan diberikan adalah bantuan pernapasan dengan nilai :
1 = bila diberikan dan 0 bila tidak diberikan. Kode (RESP)
►Untuk kepentingan tersebut diambil sampel sebanyak 30 bayi dengan hasil sebagai berikut : VARIABELVARIABEL BB SESE WaldWald DFDF SigSig RR Exp(B)Exp(B)
RESPRESP
APGARAPGAR
ConstantConstant
- 2.94682.9468
2.25392.2539
- 16.2095- 16.2095
1.18041.1804
0.39070.3907
7.13797.1379
6.23206.2320
5.86525.8652
5.15705.1570
11
11
11
0.01250.0125
0.01540.0154
0.02320.0232
- 0.31900.3190
0.30940.3094
0.05250.0525
9.52479.5247
Y = - 16.2095 – 2.9469 (RESP) + 2.2539 (APGAR)
Dengan model persamaan :
NOTASI HASIL UJINOTASI HASIL UJI
B = Koefisien, yang mirip dengan regresi biasa, namun disini berarti “ ln rasio odds ”. Artinya setiap kenaikan 1unit variabel APGAR , maka ln rasio odds akan bertambah (+ 2.2539) Demikian juga dengan var. RESP maka “ ln rasio oddsnya akan berkurang ( - 2.9468 )
Wald = adalah kuadrat dari (B) dibagi dengan standar errornya. penilaiannya didasarkan atas Degree of Freedom, dan memberi arti apakan variabel independen bermakna atau tidak ( acuan ini sifatnya tidak mutlak).
( B )2 ------------- = 6.2320 untuk DF 1 = 0.0125
(signif.) SE
NOTASI HASIL UJINOTASI HASIL UJI
R = Besarnya kontribusi variabel variabel independen (RESP) = - 0.3190 dan (APGAR) = 0.3049, bila dimasukkan kedalam model. Mirip dengan korelasi partiel dari regressi liner berganda.
Exp(B) atau eB. adalah rasio odds dari variabel tersebut setelah dikontrol dengan variabel lainnya.
Artinya setiap kenaikan 1 unit variabel independen (RESP) maka rasio odds pernapasan buatan adalah 0.0525. Oleh karena exp(B) adalah inversi dari ln rasio odds, maka kemungkinan hidup bayi bila diberi pernapasan batan adalah : 1/ 0.0525 = 1/19 kalinya.
Sebaliknya setiap nilai APGAR naik 1 unit, maka rasio oddsnya adalah: 9.5247. artinya kemungkinan hidupnya = 9.5247 kali.
► Apabila bayi yang lahir dengan APGAR = 9 dan tidak diberi pertolongan pernapasan, maka ln rasio odds nya adalah :
Y = - 16.2095 – 2.9468 (0) + 2.2539 (9) = 4.0756
sedangkan rasio odd nya menjadi e4.0756 = 58.89 atau sekitar 59 kali. Atau kemungkinannya untuk mati adalah 59 kali lipat
TESTING MODEL REGRESSI LINIER
BERGANDA LOGISTIK
TESTING MODEL REGRESSI LINIER
BERGANDA LOGISTIK
1313 22
33 1212
Jenis IndeksChi-
Square DF Signif.
-2 log-likelihood model tanpa variabel bebas (1) 41.59 29
-2 log-likelihood model (2) 21.27 27 0.7735
Model Chi-Square = (1) - (2) 20.32 2 0.0000
Improvement 20.32 2 0.0000
Goodness of Fit 21.04 27 0.7842
Baris Keterangan Hasil Sign.
1 Tanpa variabel bebas, maka nilai Chi-Square adalah 41,59
2 Nilai Chi-Square hasil perhitungan dibandingkan dengan model sempurna, (bila semua variabel independen penting untuk memprediksi variabel dependen dimasukkan ke dalam model.
21,27 0.7735
3 Perbedaan hasil sebelum dimasukkan variabel independen dengan setelah dimasukkan variabel independen (baris 1 - baris ke 2) dan hasilnya signif.
20,32 0.0000
4 Perbaikan antara 2 model (Improvement) 20,320 0.0000
5 Hasil dari model sempurna dibandingkan dengan dengan model terakhir
21.04 0.7842
Keistimewaan :Mampu mengkomversi koefisien regressi (bi) menjadi Rasio odds sebagai berikut :
OR = Exp (bi) dengan :
Keterangan :
OR = Rasio Odds variabel prediktor (xi) atau (independen) terhadap variabel dependennya
bi = Koefisien regressi variabel prediktor (independen) xi
Exp = Exponensial, atau inversi dari logaritma natural ( ln).
HASIL UJI REGRESSI LINIER BERGANDA
LOGISTIK
HASIL UJI REGRESSI LINIER BERGANDA
LOGISTIK
Case Processing Summary
174 100,0
0 ,0
174 100,0
0 ,0
174 100,0
Unweighted Casesa
Included in Analysis
Missing Cases
Total
Selected Cases
Unselected Cases
Total
N Percent
If weight is in effect, see classification table for the totalnumber of cases.
a.
Block 0: Beginning Block
Iteration Historya,b,c
240,847 ,092
240,847 ,092
Iteration1
2
Step0
-2 Loglikelihood Constant
Coefficients
Constant is included in the model.a.
Initial -2 Log Likelihood: 240,847b.
Estimation terminated at iteration number 2 becauseparameter estimates changed by less than ,001.
c.
Classification Tablea,b
0 83 ,0
0 91 100,0
52,3
Observed,00
1,00
MAMPUY
Overall Percentage
Step 0,00 1,00
MAMPUY PercentageCorrect
Predicted
Constant is included in the model.a.
The cut value is ,500b.
Variables in the Equation
,092 ,152 ,368 1 ,544 1,096ConstantStep 0B S.E. Wald df Sig. Exp(B)
Variables not in the Equationa
74,768 1 ,000
74,768 1 ,000
83,581 1 ,000
93,030 1 ,000
110,026 1 ,000
91,141 1 ,000
101,877 1 ,000
KREDIBY
KREDIY
MANFAY
CONTEY
CLARIY
KONTINUY
CHANELY
VariablesStep0
Score df Sig.
Residual Chi-Squares are not computed because of redundancies.a.
Block 1: Method = Forward Stepwise (Likelihood Ratio)
Omnibus Tests of Model Coefficients
127,110 1 ,000
127,110 1 ,000
127,110 1 ,000
22,586 1 ,000
149,696 2 ,000
149,696 2 ,000
3,522 1 ,061
153,219 3 ,000
153,219 3 ,000
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step 1
Step 2
Step 3
Chi-square df Sig.
Model Summary
113,737 ,518 ,692
91,151 ,577 ,770
87,629 ,585 ,781
Step1
2
3
-2 Loglikelihood
Cox & SnellR Square
NagelkerkeR Square
Variables in the Equation
4,528 ,550 67,716 1 ,000 92,615
-2,639 ,463 32,502 1 ,000 ,071
3,266 ,612 28,462 1 ,000 26,210
3,006 ,663 20,551 1 ,000 20,208
-3,901 ,683 32,602 1 ,000 ,020
2,990 ,633 22,292 1 ,000 19,894
1,296 ,667 3,775 1 ,052 3,656
2,359 ,750 9,889 1 ,002 10,578
-4,090 ,731 31,288 1 ,000 ,017
CLARIY
Constant
Step1
a
CLARIY
CHANELY
Constant
Step2
b
CLARIY
KONTINUY
CHANELY
Constant
Step3
c
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: CLARIY.a.
Variable(s) entered on step 2: CHANELY.b.
Variable(s) entered on step 3: KONTINUY.c.
Correlation Matrix
1,000 -,841
-,841 1,000
1,000 -,538 -,669
-,538 1,000 -,116
-,669 -,116 1,000
1,000 -,494 -,518 -,220
-,494 1,000 -,058 -,117
-,220 -,117 -,399 1,000
-,518 -,058 1,000 -,399
Constant
CLARIY
Step1
Constant
CLARIY
CHANELY
Step2
Constant
CLARIY
KONTINUY
CHANELY
Step3
Constant CLARIY CHANELY KONTINUY
Model if Term Removed
-120,424 127,110 1 ,000
-61,650 32,150 1 ,000
-56,868 22,586 1 ,000
-55,807 23,986 1 ,000
-45,575 3,522 1 ,061
-48,862 10,096 1 ,001
VariableCLARIYStep 1
CLARIY
CHANELY
Step 2
CLARIY
KONTINUY
CHANELY
Step 3
Model LogLikelihood
Change in-2 Log
Likelihood dfSig. of the
Change
Variables not in the Equationa
12,738 1 ,000
12,738 1 ,000
9,513 1 ,002
19,272 1 ,000
22,081 1 ,000
33,278 1 ,000
2,935 1 ,087
2,935 1 ,087
,478 1 ,489
1,551 1 ,213
3,915 1 ,048
3,256 1 ,071
3,256 1 ,071
,138 1 ,710
1,553 1 ,213
KREDIBY
KREDIY
MANFAY
CONTEY
KONTINUY
CHANELY
VariablesStep1
KREDIBY
KREDIY
MANFAY
CONTEY
KONTINUY
VariablesStep2
KREDIBY
KREDIY
MANFAY
CONTEY
VariablesStep3
Score df Sig.
Residual Chi-Squares are not computed because of redundancies.a.
Terima kasih “ Wassalamu
Alaikum Wr Wb “