TUTORIAL REGRESI LOGISTIK - AGUS TRI BASUKI · 2020. 6. 28. · pada regresi linear (OLS) lebih...
Transcript of TUTORIAL REGRESI LOGISTIK - AGUS TRI BASUKI · 2020. 6. 28. · pada regresi linear (OLS) lebih...
1 | Panduan Regresi Logistik
TUTORIAL REGRESI LOGISTIK AGUS TRI BASUKI, SE., M.SI.
Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara
satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang
berupa kategori; biasanya 0 dan 1.
Persamaan Regresi Logistik sebagai berikut:
B0 merupakan konstanta, B1 merupakan koefisien masing- masing variabel. Nilai p atau
peluang (Y=1) dapat dicari dengan persamaan
Persamaan tersebut dapat digunakan untuk menghitung peluang responden yang memiliki
nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p berkisar antara 0
– 1.
2 | Panduan Regresi Logistik
Berikut ini hasil wawancara dengan 150 orang tentang faktor-faktor yang mempengaruhi
seseorang menjadi anggota koperasi (Y). Dimana X1 penghasilan responden dan X2
pendidikan responden.
Tabel 1 Data Penelitian
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
1 1 0 0 76 1 1 1
2 1 1 1 77 1 1 1
3 1 1 1 78 0 0 0
4 1 1 1 79 1 1 1
5 1 1 1 80 0 0 0
6 0 0 0 81 0 0 0
7 0 0 0 82 0 0 0
8 1 1 1 83 0 0 0
9 0 0 0 84 1 0 0
10 1 1 1 85 1 0 0
11 1 1 1 86 0 0 0
12 1 1 1 87 1 1 1
13 0 0 0 88 0 0 1
14 1 0 1 89 1 1 1
15 0 0 0 90 0 0 0
16 1 1 1 91 1 1 1
17 1 1 0 92 1 0 0
18 0 1 1 93 1 1 1
19 0 0 0 94 1 0 0
20 1 1 1 95 0 0 0
21 0 0 0 96 1 1 1
22 0 0 1 97 0 0 0
23 0 1 0 98 1 1 1
24 1 1 1 99 0 1 0
25 0 1 1 100 1 1 1
26 0 0 0 101 0 0 0
27 0 0 0 102 0 0 1
3 | Panduan Regresi Logistik
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
28 1 1 1 103 0 1 0
29 1 0 0 104 1 1 1
30 0 0 1 105 0 1 1
31 1 0 0 106 0 0 0
32 0 1 1 107 0 0 0
33 0 0 0 108 1 0 0
34 0 1 1 109 1 1 1
35 0 1 0 110 1 0 0
36 0 1 1 111 1 1 1
37 0 1 1 112 1 1 1
38 1 1 1 113 0 0 1
39 0 0 1 114 1 1 1
40 0 1 1 115 1 1 0
41 0 0 0 116 1 1 1
42 0 0 0 117 0 0 0
43 0 0 0 118 0 0 1
44 1 0 0 119 0 1 0
45 1 0 0 120 1 1 1
46 0 0 0 121 0 1 1
47 1 1 1 122 0 0 0
48 1 0 0 123 0 0 0
49 1 1 1 124 1 1 1
50 0 0 0 125 1 1 1
51 1 1 1 126 1 1 1
52 1 1 1 127 1 1 1
53 1 1 1 128 0 0 0
54 0 0 0 129 0 0 0
55 0 0 1 130 1 1 1
56 1 0 0 131 0 0 0
57 1 0 0 132 1 1 1
58 0 1 0 133 1 1 1
59 1 0 0 134 1 1 1
60 0 0 0 135 0 0 0
61 0 0 0 136 1 0 1
62 0 0 0 137 0 0 0
63 1 1 1 138 1 1 1
4 | Panduan Regresi Logistik
RESPONDEN Y X1 X2 RESPONDEN Y X1 X2
64 1 1 1 139 1 1 0
65 0 0 0 140 0 1 1
66 0 0 0 141 0 0 0
67 0 0 0 142 1 1 1
68 1 1 1 143 0 0 0
69 0 0 0 144 1 0 0
70 1 1 1 145 1 0 0
71 1 1 1 146 0 0 0
72 0 0 0 147 1 1 1
73 0 0 1 148 1 0 0
74 1 1 1 149 1 1 1
75 1 1 1 150 0 0 0 Sumber : Data Hipotesis
Keterangan :
VARIABEL
Y ANGGOTA KOPERASI X1 PENGHASILAN RESPONDEN X2 PENDIDIKAN RESPONDEN
0 Bukan Anggota
Y
1 Anggota Koperasi
0 Rendah
X1
1 Tinggi
0 Bukan Sarjana
X2
1 Sarjana
5 | Panduan Regresi Logistik
Tahapan Analisis Regresi Logistik
6 | Panduan Regresi Logistik
LANGKAH-LANGKAH PENYELESAIAN DENGAN SPSS
Langkah pertama masukan Tabel 1 dalam SPSS Data View
Variable View
7 | Panduan Regresi Logistik
Klik Label pada X1, Y Dan X2 dan tulis PENGHASILAN, ANGGOTA KOPERASI DAN
PENDIDIKAN
Klik Value pada X1 dan klik …. pada None Akan muncul tampilan
Ketik pada Value 0 dan Label Penghasilan Rendah lalu tekan Add
8 | Panduan Regresi Logistik
Ketik kembali Value 1 dan Label Penghasilan Tinggi Klik Add
9 | Panduan Regresi Logistik
Klik OK Lakukan hal yang sama untuk variabel Y dan X2 Klik Value pada Y ketik 0 untuk Bukan Anggota Koperasi dan ketik 1 untuk anggota Koperasi
Klik OK
10 | Panduan Regresi Logistik
Klik Value pada X1 ketik 0 untuk Bukan Pendidikan Sarjana dan ketik 1 untuk Pendidikan Sarjana
Klik Ok Setelan Value semua terisi akan muncul pada Variable View
11 | Panduan Regresi Logistik
Setelah Semua Terisi lakukan analisis dengan cara Pilih Analyze Regression
Binary Logistic
Masukan Anggota Koperasi (Y) ke dependent, kemudian masukan Penghasilan (X1) dan
Pendidikan (X2) ke Covariates
12 | Panduan Regresi Logistik
Kemudian klik Save, kemudian klik probabilities, Group membership, Unstandardized
dan Standardized. Serta Klik Include the covariance matrix
klik Continue, setelah itu klik Option …..
13 | Panduan Regresi Logistik
Klik Classification plots, Hosmer-Lemeshow goodness-of-fit, Casewise Listing of
residual, Correlations of estimates, iteration history, Cl for exp(B) dan Include
constan in model
Akan muncul output seperti dalam
14 | Panduan Regresi Logistik
15 | Panduan Regresi Logistik
INTERPRETASI HASIL REGRESI LOGISTIK DENGAN SPSS Case Processing Summary
Case Processing Summary
Unweighted Casesa N Percent
Selected Cases
Included in Analysis
150 100.0
Missing Cases 0 .0
Total 150 100.0
Unselected Cases 0 .0
Total 150 100.0
a. If weight is in effect, see classification table for the total number of cases.
Pada tabel Case Processing Summary adalah ringkasan jumlah sampel, yaitu sebanyak
150 sampel.
Dependent Variable Encoding
Original Value Internal Value
Bukan Anggota Koperasisi
0
Anggota Koperasi 1
Tabel diatas adalah kode variabel dependen. Yaitu kategori “Bukan anggota Koperasi”
dengan kode 0 dan “Anggota Koperasi” dengan kode 1. Oleh karena yang diberi kode 1
adalah “Anggota Koperasi”, maka “Anggota Koperasi” menjadi referensi atau efek dari
sebab. Sebab yang dimaksud adalah kejadian yang dihipotesiskan sebagai penyebab
munculnya efek atau masalah. Dalam hal ini, penghasilan tinggi (kode 1) dan pendidikan
sarjana (kode 1) menjadi sebab yang dapat meningkatkan menjadi anggota koperasi (kode
1).
16 | Panduan Regresi Logistik
Block 0: Beginning Block
Tabel Iteration History
Iteration Historya,b,c
Iteration -2 Log
likelihood
Coefficients
Constant
Step 0 1 207.837 -.053
2 207.837 -.053
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 207.837
c. Estimation terminated at iteration number 2 because parameter estimates changed by less than .001.
Pada tabel Iteration History pada block 0 atau saat variabel independen tidak dimasukkan
dalam model: N=150 mendapatkan Nilai -2 Log Likelihood: 207,837. Degree of Freedom
(DF) = N – 1 = 150-1=149. Chi-Square (X2) Tabel Pada DF 149 dan Probabilitas 0.05
=178,485. Nilai -2 Log Likelihood (207,837) > X2 tabel (178,485) sehingga menolak H0,
maka menunjukkan bahwa model sebelum memasukkan variabel independen adalah
TIDAK FIT dengan data.
17 | Panduan Regresi Logistik
Classification Table
Classification Tablea,b
Observed
Predicted
Anggota Koperasi
Percentage Correct
Bukan Anggota
Koperasisi Anggota Koperasi
Step 0 Anggota Koperasi
Bukan Anggota Koperasisi
77 0 100.0
Anggota Koperasi 73 0 .0
Overall Percentage 51.3
a. Constant is included in the model.
b. The cut value is .500
Pada tabel Classifacation Table: Merupakan tabel kontingensi 2 x 2 yang seharusnya terjadi
atau disebut juga frekuensi harapan berdasarkan data empiris variabel dependen, di mana
jumlah sampel yang memiliki kategori variabel dependen referensi (kode 1) yaitu “Menjadi
Anggota Koperasi” sebanyak 73. Sedangkan yang “Tidak Menjadi Anggota Koperasi”
sebanyak 77 orang. Jumlah sampel sebanyak 150 orang. Sehingga nilai overall percentage
sebelum variabel independen dimasukkan ke dalam model sebesar: 73/150 = 1-52,0% =
48%.
18 | Panduan Regresi Logistik
Variabel Dalam Persamaan Tahap Beginning
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constant -.053 .163 .107 1 .744 .948
Pada tabel Variables in The Equation: Saat sebelum var independen di masukkan ke dalam
model, maka belum ada variabel independen di dalam model. Nilai Slope atau Koefisien
Beta (B) dari Konstanta adalah sebesar -0,053 dengan Odds Ratio atau Exp(B) sebesar
0,948. Nilai Signifikansi atau p value dari uji Wald sebesar 0,744.
Perlu diingat bahwa nilai B identik dengan koefisien beta pada Ordinary Least Square
(OLS) atau regresi linear. Sedangkan Uji Wald identik dengan t parsial pada OLS.
Sedangkan Exp(B) adalah nilai eksponen dari B, maka Exp(-0,053) = 0,948.
Variabel Tidak Dalam Persamaan Tahap Beginning
Variables not in the Equation
Score df Sig.
Step 0 Variables X1 40.729 1 .000
X2 80.724 1 .000
Overall Statistics 86.843 2 .000
Pada tabel Variables not in the Equation: Menunjukkan variabel yang belum dimasukkan ke
dalam model regresi, yaitu variabel X1 dan X2. Di mana X1 adalah variabel penghasilan
dan X2 adalah variabel pendidikan.
19 | Panduan Regresi Logistik
Tahap Entry Variabel
Hasil Omnibus Test
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 102.010 2 .000
Block 102.010 2 .000
Model 102.010 2 .000
Nilai X2 102.010 > X2 tabel pada DF 2 (jumlah variabel independen 2) yaitu 5,991
atau dengan signifikansi sebesar 0,000 (< 0,05) sehingga menolak H0, yang menunjukkan
bahwa penambahan variabel independen DAPAT memberikan pengaruh nyata terhadap
model, atau dengan kata lain model dinyatakan FIT.
Jika pendekatan OLS untuk menguji signifikansi simultan menggunakan uji F,
sedangkan pada regresi logistik menggunakan nilai Chi-Square dari selisih antara -2 Log
likelihood sebelum variabel independen masuk model dan -2 Log likelihood setelah variabel
independen masuk model. Pengujian ini disebut juga dengan pengujian Maximum
likelihood.
Sehingga jawaban terhadap hipotesis pengaruh simultan variabel independen
terhadap variabel dependen adalah menerima H1 dan menolak H0 atau yang berarti ada
pengaruh signifikan secara simultan penghasilan dan pendidikan terhadap seseorang
menjadi anggota koperasi oleh karena nilai p value Chi-Square sebesar 0,000 di mana <
Alpha 0,05 atau nilai Chi-Square Hitung 102.010 > Chi-Square tabel 5,991.
20 | Panduan Regresi Logistik
Pseudo R Square
Model Summary
Step -2 Log
likelihood Cox & Snell R Square
Nagelkerke R Square
1 105.827a .493 .658
a. Estimation terminated at iteration number 5 because parameter estimates changed by less than .001.
Di atas pada tabel Model Summary: Untuk melihat kemampuan variabel independen
dalam menjelaskan variabel dependen, digunakan nilai Cox & Snell R Square dan
Nagelkerke R Square. Nilai-nilai tersebut disebut juga dengan Pseudo R-Square atau jika
pada regresi linear (OLS) lebih dikenal dengan istilah R-Square.
Nilai Nagelkerke R Square sebesar 0,493 dan Cox & Snell R Square 0,658, yang
menunjukkan bahwa kemampuan variabel independen dalam menjelaskan
variabel dependen adalah sebesar 0,658 atau 65,8% dan terdapat 100% – 65,8% = 34,2%
faktor lain di luar model yang menjelaskan variabel dependen.
Hosmer and Lemeshow Test
Hosmer and Lemeshow Test adalah uji Goodness of fit test, yaitu uji untuk
menentukan apakah model yang dibentuk sudah tepat atau tidak. Dikatakan tepat apabila
tidak ada perbedaan signifikan antara model dengan nilai observasinya.
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 7.222 2 .027
21 | Panduan Regresi Logistik
Nilai Chi Square tabel untuk DF 1 (Jumlah variabel independen – 1) pada taraf
signifikansi 0,05 adalah sebesar 3,841. Karena nilai Chi Square Hosmer and Lemeshow
hitung 7,222 > Chi Square table 3,841 atau nilai signifikansi sebesar 0,000 (< 0,05)
sehingga menolak H0, yang menunjukkan bahwa model TIDAK dapat diterima dan
pengujian hipotesis TIDAK dapat dilakukan sebab ada perbedaan signifikan antara model
dengan nilai observasinya. usahakan nilai ini harus tidak signifikan Caranya
adalah dengan mengubah model persamaan regresi logistik dengan menambahkan
variabel interaksi antar variabel independen. Misal pada kasus di sini, dengan
menambahkan variabel interaksi antara X1 dan X2.
Variabel interaksi adalah variabel yang merupakan hasil interaksi antar
variabel independen. Variabel ini ada kalanya diperlukan untuk dimasukkan ke dalam model
regresi logistik dengan alasan karena secara substantif memang ada hubungan antar
variabel independen atau untuk mengatasi masalah Goodness of Fit Test di mana menolak
H0.
Setelah Diperbaiki
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 .000 2 1.000
Karena nilai Chi Square Hosmer and Lemeshow hitung 0,0000 < Chi Square table 3,841
atau nilai signifikansi sebesar 1,000 (> 0,05) sehingga menerima H0, yang menunjukkan
bahwa model DAPAT diterima dan pengujian hipotesis DAPAT dilakukan sebab tidak ada
perbedaan signifikan antara model dengan nilai observasinya.
22 | Panduan Regresi Logistik
Pendugaan Parameter
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
95.0% C.I.for EXP(B)
Lower Upper
Step 1a
X1 .288 .759 .144 1 .705 1.333 .301 5.904
X2 2.185 .631 11.975 1 .001 8.889 2.579 30.638
X1X2 2.903 1.143 6.452 1 .011 18.225 1.940 171.171
Constant -2.079 .433 23.062 1 .000 .125
a. Variable(s) entered on step 1: X1, X2, X1X2.
Lihat tabel Variabel in the equation di atas: semua variabel independen nilai P value uji wald
(Sig) < 0,05, artinya masing-masing variabel mempunyai pengaruh parsial yang signifikan
terhadap Y di dalam model. X1 atau penghasilan mempunyai nilai Sig Wald 0,705 > 0,05
sehingga menerima H0 atau yang berarti penghasilan tidak memberikan pengaruh parsial
yang signifikan terhadap kejadian anggota koperasi. X2 atau pendidikan mempunyai nilai
Sig Wald 0,001 < 0,05 sehingga menolak H0 atau yang berarti pendidikan memberikan
pengaruh parsial yang signifikan terhadap kejadian anggota koperasi. X1X2 atau iteraksi
antara penghasilan dan pendidikan mempunyai nilai Sig Wald 0,011 < 0,05 sehingga
menolak H0 atau yang berarti interaksi penghasilan dan pendidikan memberikan pengaruh
parsial yang signifikan terhadap kejadian anggota koperasi
23 | Panduan Regresi Logistik
Odds Ratio
Besarnya pengaruh ditunjukkan dengan nilai EXP (B) atau disebut juga ODDS RATIO (OR).
Variabel Penghasilan dengan OR 8.889 maka orang yang berpendidikan (kode 1 variabel
independen), memiliki peluang untuk menjadi anggota koperasi (kode 1 variabel dependen)
sebanyak 8,889 kali lipat di bandingkan orang yang tidak berpendidikan sarjana (kode 0
variabel independen). Nilai B = Logaritma Natural dari 8,889 = 2.185. Oleh karena nilai B
bernilai positif, maka pendidikan sarjana mempunyai hubungan positif dengan kejadian
menjadi anggota koperasi.
Variabel interaksi penghasilan dan pendidikan dengan OR 18.225 maka orang yang
berpenghasilan tinggi (kode 1 variabel independen X1) dan berpendidikan sarjana (kode 1
variabel independen X2), lebih berpeluang menjadi anggota koperasi (kode 1 variabel
dependen) sebanyak 18,225 kali lipat di bandingkan orang yang berpenghasilan rendah
dan bependidikan bukan sarjana (kode 0 variabel independen X1 dan X2). Nilai B =
Logaritma Natural dari 18,225 = 2,903. Oleh karena nilai B bernilai positif, maka orang yang
berpenghasilan tinggi dan berpendidikan sarjana mempunyai hubungan positif dengan
kejadian memilih menjadi anggota koperasi.
Persamaan Regresi Logistik
Berdasarkan nilai-nilai B pada perhitungan di atas, maka model persamaan yang dibentuk
adalah sebagai berikut:
Ln P/(1-P) = -2.079 + 0.288Penghsl + 2.185Pendidk +2.903 Penghsl*Pendidk
Atau bisa menggunakan rumus turunan dari persamaan di atas, yaitu:
24 | Panduan Regresi Logistik
Probabilitas = Exp(-2.079 + 0.288 Penghasilan + 2.185 Pendidikan + 2.903
Penghasilan*Pendidikan)/(1 + Exp(-2.079 + 0.288 Penghasilan +
2.185 Pendidikan + 2.903 Penghasilan*Pendidikan))
Penggunaan Persamaan Regresi Logistik
Misalkan sampel yang penghasilan dan pendidikan, maka penghasilan tinggi =1 dan
pendidikan sarjana=1. Jika dimasukkan ke dalam model persamaan di atas, maka sebagai
berikut:
Probabilitas = Exp(-2.079 + (2.185 x 1) + 2.903 (1X1)/(1 + Exp(-2.079 + (2.185 x
1) + 2.903 (1X1))
Probabilitas atau Predicted = 0.7505.
Nilai Predicted Regresi Logistik
Oleh karena Predicted: 0,7505 > 0,5 maka nilai Predicted Group Membership dari sampel di
atas adalah 1. Di mana 1 adalah kode menjadi anggota kopersai. Jadi jika sampel
penghasilan tinggi (kode 1) dan pendidikan sarjana (kode 1) maka prediksinya adalah
menjadi anggota koperasi (kode 1). Jika seandainya sampel yang bersangkutan ternyata
faktanya tidak menjadi anggota koperasi (kode 0) maka sampel tersebut keluar dari nilai
prediksi.
Besarnya perbedaan atau yang disebut dengan Residual = Predicted Group Membership –
Predicted. Pada kasus di atas di mana orang yang penghasilan tinggi dan pendidikan
sarjana namun faktanya tidak mengalami kanker, maka Residual = 0 – 0,7505 = -0,7505.
25 | Panduan Regresi Logistik
Step number: 1
Observed Groups and Predicted Probabilities
80 ┼ ┼
│ │
│ │
F │ │
R 60 ┼ ┼
E │ A A │
Q │ B A │
U │ B A │
E 40 ┼ B A ┼
N │ B A │
C │ B A │
Y │ B A │
20 ┼ B B A A ┼
│ B B A A │
│ B B B A │
│ B B B A │
Predicted ─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼──────────
Prob: 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
Group: BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Predicted Probability is of Membership for Anggota Koperasi
The Cut Value is .50
Symbols: B - Bukan Anggota Koperasisi
A - Anggota Koperasi
Each Symbol Represents 5 Cases.
26 | Panduan Regresi Logistik
Grafik diatas adalah Grafik klasifikasi dari observed group dan predicted group
membership.
Referensi :
Ghozali. 2001. Aplikasi Analisis Multivariate dengan Program SPSS. Semarang: Badan Penerbit Universitas Diponegoro.
Santoso, S. 2009. Menguasai Statistik dengan SPSS 16. Jakarta: PT Elex Media Komputindo, Kompas Gramedia.
Gujarati, D. N. (2009). Basic econometrics. Tata McGraw-Hill Education.