Post on 23-Oct-2015
description
Analisis Regresi
Dr. Ir. Tatang Sopandi., MP
• Analisis regresi digunakan untuk:– Memprediksi nilai variabel dependen
berdasarkan pada nilai variabel independent
– Menjelaskan akibat (impact) perubahan suatu variabel independen terhadao vriabal dependen
Variabel dependen: variabel tidak bebas
Variabel independen: variabel bebas yang digunakan untuk menjelaskan variabel dependen
ILUSTRASI
Perbedaan mendasar antara korelasi dan regresi ?
• Korelasi hanya menunjukkan sekedar hubungan.
• Dalam korelasi variabel tidak ada istilah tergantung dan variabel bebas.
• Regresi menunjukkan hubungan pengaruh.
• Dalam regresi terdapat istilah tergantung dan variabel bebas.
Istilah dan notasi variabel dalam regresi ?
Y• Varaibel tergantung
(Dependent Variable)• Variabel yang dijelaskan
(Explained Variable)• Variabel yang diramalkan
(Predictand)• Variabel yang diregresi
(Regressand)• Variabel Tanggapan
(Response)
X• Varaibel bebas (Independent
Variable)• Variabel yang menjelaskan
(Explanatory Variable)• Variabel peramal (Predictor)• Variabel yang meregresi
(Regressor)• Variabel perangsang atau
kendali (Stimulus or control variable)
Model Regresi linear sederhana
• Hanya satu variabel independen (x)
• Hubungan antara variabel (x) dan (y) digambarkan dengan fungsi linear
• Perubahan dalam variabel (y) diasumsikan disebabkan oleh perubahan variabel (x)
Jenis model regresi
Hubungan linear positif
Hubungan Linear negatif
Hubungan bukan Linear
Tidak berhubungan
εxββy 10 Komponen Linear
Regresi linear populasi
Model regresi populasi:
Intersep population y
Koefisien kemiringan populasi
Galat acak atau sisaVariabel
Dependen
Variabel independen
Komponen galat acak
Asumsi regresi linear • Nilai galat (ε) secara statistik independen
• Nilai galat terdistribusi normal untuk setiap nilai x
• Distribusi probabilitas dari galat adalah normal
• Distrobusi probabilitas dari galat mempunyai variasi konstan
• Hubungan antara variabel x dan y adalah linear
Regresi Linear Populasi
Galat acak untuk nilai x
y
x
Nilai pengamatan y
pada xi
Nilai prediksi y pada xi
εxββy 10
xi
Slope = β1
Intercept = β0
εi
xbby 10i
Estimasi Model Regresi
Estimasi intercep regresi
Estimasi slope regresi
Nilai estimasi y
Variabel Independen
Galat acak individual ei mempunyai nilai rata-rata 0
Persamaan Regresi
Persamaan Regresi linier Sederhana:
Y = a + bX + Y = Nilai yang diramalkan
a = Konstansta
b = Koefesien regresi
X = Variabel bebas
= Nilai Residu
22 )()(
))(()(
XXn
YXXYnb
n
XbYa
)(
Kriteria kuadrat terkecil (Least Squares)
• b0 dan b1 diperoleh dengan mendapatkan nilai b0 dan b1 yang meminimalkan jumlah kuadart sisa
210
22
x))b(b(y
)y(ye
Persamaan kuadrat terkecil
• Formulai untuk b1 dan b0 adalah :
Persamaan aljabar:
n
xx
n
yxxy
b 22
1 )(
21 )(
))((
xx
yyxxb
xbyb 10
dan
• b0 diestimasi dari nilai rata-rata y
ketika nilai x sama dengan nol
• b1 diestimasi dari perubahan rata-
rata nilai y karena perubahan satu unit x
Interpretasi Slop dan Intersep
Contoh Persamaan Regresi
Y X XY X2 Y2
64 20 1280 400 4096
61 16 976 256 3721
84 34 2856 1156 7056
70 23 1610 529 4900
88 27 2376 729 7744
92 32 2944 1024 8464
72 18 1296 324 5184
77 22 1694 484 5929
608 192 15032 4902 47094
22 )()(
))(()(
XXn
YXXYnb
497,1)192()4902(8
)609)(192()15032(82
b
082,408
)192(497,1)608(
a
n
XbYa
)(
Y= 40,082 + 1,497X+e
Koefesien DeterminasiKoefesien determinasi:
2
22
)(
)ˆ(1
YY
YYR 743,0
)886(
)497,227(12 R
Koefesien Determinasi Disesuaikan (adjusted)
1
)1( 22
PN
RPRRadj 70,0
118
)743,01(1743,0
adjR
Kesalahan Baku Estimasi
Digunakan untuk mengukur tingkat kesalahan dari model regresi yang dibentuk.
kn
YYSe
2)ˆ(1576,6
28
)467,227(
Se
Koefisien galat baku Regresi
Digunakan untuk mengukur besarnya tingkat kesalahan dari koefesien regresi:
n
XX
SeSb
2
2 )(359,0
8)192(
)4902(
1576,621
Sb
Uji FUji F digunakan untuk uji ketepatan model, apakah nilai prediksi mampu menggambarkan kondisi sesungguhnya:
Ho: Diterima jika F hitung F tabel
Ha: Diterima jika F hitung > F tabel
)/(1
)1/(2
2
knR
kRF
367,17)28/(743,01
)12/(743,0
F
Karena F hitung (17,367) > dari F tabel (5,99) maka persamaan regresi dinyatakan Baik (good of fit).
Uji tDigunakan untuk mengatahui pengaruh variabel bebas terhadap variabel tergantung.Ho: Diterima jika t hitung t tabel
Ha: Diterima jika t hitung > t tabel
Sbj
bjThitung 167,4
359,0
497,1hitungt
Karena t hitung (4,167) > dari t tabel (1,943) maka Ha diterima ada pengaruh iklan terhadap penjualan.
Contoh data
Harga rumah $1000s(y)
Luas (x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Regression Using Excel
• Tools / Data Analysis / Regression
Excel Output
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA df SS MS F
Significance F
Regression 1 18934.934818934.934
811.084
8 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficien
ts Standard Error t StatP-
value Lower 95%Upper 95%
Intercept 98.24833 58.03348 1.692960.1289
2 -35.57720232.0738
6
Square Feet 0.10977 0.03297 3.329380.0103
9 0.03374 0.18580
The regression equation is:
feet) (square 0.10977 98.24833 price house
0
50
100
150
200
250
300
350
400
450
0 500 1000 1500 2000 2500 3000
Square Feet
Ho
use
Pri
ce (
$100
0s)
Presentasi grafik
(luas) 0.10977 98.24833rumah harga
Slope = 0.10977
Intercept = 98.248
Koefisien Determinasi, R2
kuadratjumlah 2
total
ratregresiJumlahkuad
SST
SSRR
R2 = koefisien determinasi r = koefiseien korelasi sederhana
22 rR
Estimasi Galat baku
1 kn
SSEs
WhereSSE = jumlah kuadrat galat baku n = ukuran (jumlah) sampel
k = jumlah variabel independen
Excel Printout for House Prices:
At 95% level of confidence, the confidence interval for the slope is (0.0337, 0.1858)
1b/21 stb
Coefficient
sStandard
Error t Stat P-value Lower 95%Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
d.f. = n - 2