BAB 15
ANALISIS
REGRESI DAN
KORELASI
LINIER
1
PENGERTIAN ANALISIS KORELASI
Analisis Korelasi
• Suatu teknik statistika yang digunakan untuk mengukurkeeratan hubungan ataukorelasi antara dua variabel.
2
HUBUNGAN POSITIF DAN NEGATIF
3
Hubungan Produksi danHarga Minyak Goreng
(Korelasi Positif)
0
100
200
300
400
500
600
700
637 740 722 781 849 881
Harga Minyak Goreng
Hubungan Inflasi dan SukuBunga (Korelasi Negatif)
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33
Inflasi
Gambar pertama menunjukkan hubungan antaravariabel inflasi dan suku bunga. Apabila dilihat padagambar saat inflasi rendah, maka suku bunga tinggidan pada saat inflasi tinggi, suku bunga rendah. Gambar tersebut menunjukkan adanya hubunganantara inflasi dan suku bunga yang bersifat negatif.
Gambar kedua memperlihatkan hubungan yang positif antara variabel produksi dan harga minyakgoreng yaitu apabila harga meningkat, makaproduksi juga meningkat.
RUMUS KOEFISIEN KORELASI
4
Rumus di atas adalah rumus koefiseien regresi, di mana:
r : Nilai koefisien korelasi
ΣX : Jumlah pengamatan variabel X
ΣY : Jumlah pengamatan variabel Y
ΣXY : Jumlah hasil perkalian variabel X dan Y
(ΣX2) : Jumlah kuadrat dari pengamatan variabel X
(ΣX)2 : Jumlah kuadrat dari jumlah pengamatan variabel X
(ΣY2) : Jumlah kuadrat dari pengamatan variabel Y
(ΣY)2 : Jumlah kuadrat dari jumlah pengamatan variabel Y
n : Jumlah pasangan pengamatan Y dan X
2 22 2
n XY X Yr
n X X n Y Y
HUBUNGAN KUAT DAN LEMAHNYA SUATU
KORELASI
5
0,0 0,5 1,0
Skala rKorelasi negatif Korelasi positif
Korelasi negatif
sempurnaKorelasi negatif
sedang
Korelasi negatifkuat
Korelasi negatiflemah
Korelasi positiflemah
Korelasi positifkuat
Korelasi positif
sedang
Korelasi positif
sempurnaTidak adaKorelasi
-0,5-1,0
Contoh Regresi LinierM.S.Hidayat selaku ketua kamar dagang Indonesia (Kadin)
dalam acara rakornas kadin 2008 yang dibuka presiden SBY,
mengharapkan agar pemerintah segera menurunkan tingkat
suku bunga kredit. Hal tersebut didasarkan bahwa selama
suku bunga tinggi, maka investasi akan menurun sehingga
akan berdampak pada peningkatan pengangguran.
Bagaimana sebenarnya hubungan antara suku bunga kredit
dengan besarnya investasi? Berikut adalah data besarnya
suku bunga dan nilai kredit di Indonesia pada agustus sampai
desember 2007, carilah koefisien korelasinya dan apa
kesimpulannya ?
6
Kredit (dalam triliun ) Bunga (%/tahun)
Agustus 129 15
September 134 14
Oktober 152 13
November 178 13
desember 186 12
7
Kredit (X) Bunga (Y) Y2 X2 XY
Agustus 129 15 225 16.641 1.935
September 134 14 196 17.956 1.876
Oktober 152 13 169 23.104 1.976
November 178 13 169 31.684 2.314
Desember 186 12 144 34.596 2.232
Jumlah 779 67 903 123.981 10.333
Rumus koefisien korelasi
Untuk menghitung koefisien korelasi diperlukan perhitungan sebagai berikut :
2 22 2
n XY X Yr
n X X n Y Y
𝑟 =𝑛 ∑𝑋𝑌 − ∑𝑋 (∑𝑌)
𝑛 ∑𝑋2 − ∑𝑋 2 [𝑛 ∑𝑌2 −(∑𝑌)2]
=5 10.333 − 779 (67)
5 123981 − 779 2 [5 903 −(67)2]= -0,91
8
PENGERTIAN KOEFISIEN DETERMINASI
Koefisien determinasi
Bagian dari keragaman total variabel tak bebas Y (variabel
yang dipengaruhi atau dependent) yang dapat diterangkan
atau diperhitungkan oleh keragaman variabel bebas X
(variabel yang mempengaruhi atau independent).
Koefisien determinasi r2
12
2
2
2 22 2
n XY X Yr
n X X n Y Y
RUMUS UJI t UNTUK UJI KORELASI
2
2
1
r nt
r
di mana:
t : Nilai t-hitung
r : Nilai koefisien korelasi
n : Jumlah data pengamatan
13
2-n
r-1
rt
2
atau
CONTOH UJI t UNTUK UJI KORELASI SOAL A
14
Ujilah apakah (a) nilai r = - 0,412 pada hubungan antara suku bunga dan investasi dan (b) r
= 0,86 pada hubungan antara harga minyak dan produksi kelapa sawit sama dengan nol
pada taraf nyata 5%?
1. Perumusan hipotesis:
hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi
dilambangkan dengan sedang pada sampel r.
H0 : r = 0
H1 : r ¹ 0
2. Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df) = n-k = 9 - 2 =
7. Nilai taraf nyata a/2= 0,025 dan df =7 adalah = 2,36. Ingat bahwa n adalah jumlah data
pengamatan yaitu = 9, sedangkan k adalah jumlah variabel yaitu Y dan X, jadi k=2.
3. Menentukan nilai uji t
21,1
2-9
(,041)-1
0,41-
2-n
r-1
rt
22
CONTOH UJI t UNTUK UJI KORELASI
15
4. Menentukan daerah keputusan dengan nilai kritis 2,36
Daerah menolak Ho Daerah menolak Ho
–2,36 t = –1,21 2,36
Daerah tidak menolak Ho
5. Menentukan keputusan. Nilai t-hitung ternyata terletak pada daerah tidak menolak H0.
Ini menunjukkan bahwa tidak terdapat cukup bukti untuk menolak H0, sehingga dapat
disimpulkan bahwa korelasi dalam populasi sama dengan nol, hubungan antara tingkat
suku bunga dengan investasi lemah dan tidak nyata.
CONTOH UJI T UNTUK UJI KORELASI SOAL B
16
1.Perumusan hipotesis:
hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi
dilambangkan dengansedang pada sampel r.
H0 : r = 0
H1 : r 0
2.Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df) = n-k =
12 - 2 = 10. Nilai taraf nyata a/2=0,025 dan df =10 adalah = 2,23.
3. Menentukan nilai uji t
33,5
2-12
(0,86)-1
0,86
2-n
r-1
rt
22
RUMUS KOEFISIEN DETERMINASI
17
4. Menentukan daerah keputusan dengan nilai kritis 2,23
Daerah menolak HoDaerah tidak menolak Ho
Daerah menolak Ho
–2,23 t= 5,332,23
5. Menentukan keputusan. Nilai t-hitung berada di daerah menolak H0, yang berarti bahwa
H0 di tolak dan menerima H1. Ini menunjukkan bahwa koefisien korelasi pada populasi
tidak sama dengan nol, dan ini membuktikan bahwa terdapat hubungan yang kuat dan
nyata antara harga minyak dan produksi kelapa sawit.
REGRESI LINIER
• Regresi merupakan metode untuk memprediksi
sesuatu yang belum diketahui berdasarkan
sesuatu yang sudah diketahui dan mempengaruhi
variabel yang akan diprediksi itu
• Garis regresi adalah garis lurus yang terdapat
dalam diagram pencar (scatter diagram), yang
memperlihatkan adanya hubungan diantara kedua
variabel.
Next……..
• Regresi adalah suatu teknik yang digunakan untuk membangun suatu persamaan yang menghubungkan antara variabel tidak bebas (Y) dengan variabel bebas (X) dan sekaligus untuk menentukan nilai ramalan dan dugaannya.
• Regresi: suatu persamaan matematika yang mendifinisikan hubungan antara dua variabel
• Untuk mengetahui pola hubungan di antara variabel atau pengaruh variabel yg satu terhadap yang lain.
Analisis Regresi
• Variabel yg akan diduga dinamakan variabel terikat (dependent
variable), yang biasanya digambarkan pada sumbu vertikal dari
suatu diagram
• Variabel yang menerangkan variabel terikat dinamakan variabelbebas (explanatory variable atau indepandent variable), yangbiasanya digambarkan pada sumbu horizontal
• Dengan kata lain, analisis regresi menjawab bagaimana polahubungan (pengaruh) variabel-variabel
FORMULASI
Y =
X =
a =
b =
Y = a + bX^
baca Y cap adalah variabel terikat,
yaitu variabel yg besarnya dipengaruhi
oleh variabel X
variabel bebas, yaitu variabel yg
mempengaruhi variabel yg lain
konstanta/intercept, yg merupakan titik
potong dgn sumbu vertikal jika X = 0
slope, yaitu koefisien kecondongan
garis regresi
Lanjutan….Untuk menentukan hasil peramalan, maka kita harusmencari nilai a dan b dengan metode kuadrat terkecil:
Rumus 1:
Y = n a + b X
XY = a X + b X2
Next…..Rumus 2
(Y) - b (∑X)
a =
n n
n. XY- (∑X) (∑Y)
b =
n. (X2 ) - (X)2
Lanjutan …..Semakin besar nilai a berarti semakin besar pula
nilai Y (variabel terikat) meskipun nilai X=0.
Begitu pula sebaliknya.
Semakin besar nilai a sedangkan nilai b konstan,
maka titik potong persamaan
Y = a + bX semakin tinggi, garis regresi bergeser
ke atas secara sejajar.
Semakin tinggi nilai b, maka garis regresi
semakin tegak, berarti semakin besar pengaruh
nilai variabel X terhadap variabel Y. Begitu pula
sebaliknya.
RUMUS PERSAMAAN REGRESI
Persamaan regresi
Suatu persamaan matematika yang
mendefinisikan hubungan antara dua variabel.
25
SCATTER DIAGRAM UNTUK MEMBANTU
MENARIK GARIS REGRESI
26
Hubungan Inflasi dan Suku Bunga
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33Inflasi
Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:
Gambar A
SCATTER DIAGRAM UNTUK MEMBANTU
MENARIK GARIS REGRESI
27
Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:
Gambar B
Hubungan Inflasi dan Suku Bunga
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33Inflasi
a
bd
c
CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL LEBIH
KECIL
28
Gambar A: selisih antara dugaan dan aktual lebih kecil
e1
Y1e2
Y2 e3
Y3
Y4
e4Y5
e5
Yne
n
Hubungan Inflasi dan Suku Bunga
0
10
20
30
40
2.01 9.35 12.55 10.33Inflasi
Suku B
unga
e1
Y1e2
Y2 e3
Y3
Y4
e4
Yne
n
CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL
LEBIH BESAR
29
e3
Y3
Hubungan Inflasi dan Suku Bunga
0
5
10
15
20
25
30
35
2.01 9.35 12.55 10.33Inf lasi
Suku
Bun
ga
e1
Y1
Y2e2
Y4e4
e5
Y5
Ynen
GAMBAR PERSAMAAN REGRESI
30
-b+b
X
Y
a
XGambar A: = a + b X Gambar B: = a - b XY Y
RUMUS MENCARI KOEFISIEN a DAN b
31
22 )X()X(n
)X)(X()XYna
b
)X(b
n
)Y(b
Y : Nilai variabel bebas Y
a : Intersep yaitu titik potong garis dengan sumbu Y
b : Slope atau kemiringan garis yaitu perubahan rata-rata pada untuk setiap unit
perubahan pada variabel X
X : Nilai variabel bebas X
n : Jumlah sampel
Y
CONTOH HUBUNGAN ANTARA PRODUKSI DENGAN
HARGA MINYAK KELAPA SAWIT
32
= a + b XY
33
n Y X Y2 XY X2
1997 4,54 271 20,61 1230,34 73441
1998 4,53 319 20,52 1445,07 101761
1999 5,03 411 25,30 2067,33 168921
2000 6,05 348 36,60 2105,40 121104
2001 6,09 287 37,09 1747,83 82369
2002 6,14 330 37,70 2026,20 108900
2003 6,37 383 40,58 2439,71 146689
2004 7,40 384 54,76 2841,60 147456
2005 7,22 472 52,13 3407,84 222784
Maka nilai b dan a diperoleh sebagai berikut :
b=𝑛 ∑𝑋𝑌 − ∑𝑋 (∑𝑌)
𝑛 ∑𝑋2 −(∑𝑋)2]=
11 29509 − 4455 (69,67)
11 1955125 −(4455)2= 0,0086
a = (𝟔𝟗,𝟔𝟕)
𝟏𝟏=
𝟎,𝟎𝟏 ( 𝟒𝟒𝟓𝟓 )
𝟏𝟏= 2,8631
Jadi, persamaan dugaan menjadi
34
Persamaan = 2,8631 + 0,0086 X.
DEFINISI STANDAR ERROR
Standar error atau kesalahan baku
Pendugaan
Suatu ukuran yang mengukur
ketidakakuratan pencaran atau persebaran
nilai-nilai pengamatan (Y) terhadap garis
regresinya (Ŷ).
35
Y
RUMUS STANDAR ERROR
36
22
22
n
)YY(
n
eSyx
Di mana:
Sy.xC : Standar error variabel Y berdasarkan variabel X yang diketahui
Y : Nilai pengamatan dari Y
: Nilai dugaan dari Y
n : Jumlah sampel, derajat bebas n-2 karena terdapat dua parameter yang akan
digunakan yaitu a dan b.
Y
Contoh Soal Hitunglah standar error antara X dengan Y dan standar error
untuk penduga a dan b dari diketahui bahwa Ŷ = 2,8631 +0,0086x
Jawab :
Untuk mengetahui SY.X, ada 2 rumus yang dapat dipakai, yaitu :
1. Sy,x =∑𝑒²
n−2=
∑ 𝑦−Ў ²
n−2
2. Sy,x =∑𝑦²−𝑎 ∑𝑦−𝑏∑𝑥𝑦
n−2
N Y X X2 Y2 XY
1 4.54 271 73441 20.61 1230
2 4.53 319 101761 20.52 1445
3 5.03 411 168921 25.30 2067
4 6.05 348 121104 36.60 2105
5 6.09 287 82369 37.09 1748
6 6.14 330 108900 37.70 2026
7 6.37 383 146689 40.58 2440
8 7.4 384 147456 54.76 2842
9 7.22 472 222784 52.13 3408
10 7.81 610 372100 61.00 4764
11 8.49 640 409600 72.08 5434
38
Untuk mengetahui nilai sy,x’ maka diperlukan tabel seperti di bawahini:
n Y Y-Y (Y-Y)2
1 5.1853 -0.6453 0.4164
2 5.5966 -1.0666 1.1376
3 6.3850 -1.3550 1.8359
4 5.8451 0.2049 0.0420
5 5.3224 0.7676 0.5892
6 5.6909 0.4491 0.2017
7 6.1450 0.2250 0.0506
8 6.1536 1.2464 1.5535
9 6.9077 0.3123 0.0976
10 8.0902 -0.2802 0.0785
11 8.3473 0.1427 0.0204
Jumlah 69.6689 0.0011 6.0235
39
Sy,x =
∑𝑒²
n−2=
∑ 𝑦−Ў ²
n−2=
∑ 6,0235 ²
11−2= 0,815
Sy,x =
∑𝑦2−𝑎 ∑𝑦−𝑏∑𝑥𝑦
n−2
-458,37−2,8631.69,67−0,0086.29609
11−2 = 0,818
Jadi menggunakan rumus 1 dan 2 hasilnya sama. Standar error sebesar
0,818 menunjukkan bahwa nilai pengamatan Y menyebar dari persamaan
regresi sebesar 0,818.
Standar error untuk koefisien regresi b:
sb = Sᵪᵧ
[ ∑𝑋2− ∑𝑋 2/𝑛]
= O,818
[ 1955125− 4455 2/11]= 0,0021
standar error untuk koefisien regresi a:
sa =
∑𝑥²𝑠ᵪᵧ
n∑x2−(∑x)²
=( 1955125.0,818)
11.1955125−(4455)²= 0,98
40
YGaris regresi
Satu deviasistandar
Nilai tengah terletakpada garis regresi
X1 X2 X3 X
41
Beberapa asumsi penting metode kuadrat terkecil adalah sebagai berikut:
1. Nilai rata-rata dari error term atau expected value untuk setiap nilai X sama dengan nol. Asumsi ini
dinyatakan E(ei/Xi) = 0.
2. Nilai error dari Ei dan Ej atau biasa disebut dengan kovarian saling tidak berhubungan
atau berkorelasi. Asumsi ini biasa dilambangkan sebagai berikut, Cov (Ei, Ej) = 0, di mana
i ¹ j. Berdasarkan pada asumsi nomor 1, pada setiap nilai Xi akan terdapat Ei, dan untuk
Xj akan ada Ej, yang dimaksud dengan nilai kovarian = 0 adalah nilai Ei dari Xi tidak ada
hubungan dengan nilai Ej dari Xj.
.
ASUMSI METODE KUADRAT TERKECIL
42
3. Varian dari error bersifat konstan. Ingat bahwa varian dilambangkan dengan s2, sehingga
asumsi ini dilambangkan dengan Var (Ei/Ej) = E(ei – ej)2 = s2. Anda perhatikan pada
gambar di atas bahwa nilai Ei (yang dilambangkan dengan tanda titik) untuk setiap X yaitu
X1, X2 dan X3 tersebar secara konstan sebesar variannya yaitu s2. Pada gambar tersebut
nilai E tersebar 1 standar deviasi di bawah garis regresi dan 1 standar deviasi di atas garis
regresi. Seluruh sebaran nilai Ei untuk Xi dan Ej untuk Xj, di mana i ¹ j terlihat sama dengan
ditunjukkan kurva yang berbentuk simetris dengan ukuran yang sama, hal inilah yang
dikenal dengan varians dari error bersifat konstan.
4. Variabel bebas X tidak berkorelasi dengan error term E, ini biasa dilambangkan dengan Cov
(Ei, Xi) = 0. Pada garis regresi Y=a + bxi + ei maka nilai Xi dan Ei tidak saling
mempengaruhi, sebab apabila saling mempengaruhi maka pengaruh masing-masing yaitu
X dan E tidak saling dapat dipisahkan. Ingat bahwa yang mempengaruhi Y selain X adalah
pasti E yaitu faktor diluar X. Oleh sebab itu varians dari E dan X saling terpisah atau tidak
berkorelasi.
ASUMSI METODE KUADRAT TERKECIL
n/)X(X
)XX(
n)S(tY yx 22
21
43
: Nilai dugaan dari Y untuk nilai X tertentu
t : Nilai t-tabel untuk taraf nyata tertentu
Sy.x : Standar error variabel Y berdasarkan variabel X yang diketahui
X : Nilai data pengamatan variabel bebas
X : Nilai rata-rata data pengamatan variabel bebas
Y
RUMUS
44
Dengan menggunakan asumsi bahwa nilai Ei bersifat normal, maka hasil dugaan a
dan b juga mengikuti distribusi normal. Sehingga nilai t = (b – B)/b, juga merupakan
variabel normal. Dalam praktiknya nilai standar deviasi populasi b sulit diketahui,
maka standar deviasi populasi biasa diduga dengan standar deviasi sampel yaitu Sb,
sehingga nilai t menjadi t = (b – B)/Sb. Selanjutnya probabilitasnya dinyatakan
sebagai berikut:P(-ta/2 (b – B)/Sb ta/2 ) = 1 - a
P(-ta/2. Sb (b – B) ta/2 . Sb) = 1 - a
Sehingga interval B adalah:
(b -ta/2. Sb B b + ta/2 . Sb)
sedangkan dengan cara yang sama interval A adalah:
(a -ta/2. Sa A a + ta/2 . Sa)
di mana Sa dan Sb adalah sebagai berikut:
Sb = Sy.x / [ X2 – (X)2/n]
Sa = (X2.Sy.x)/ (nX2 – (X)2)
PENDUGAAN INTERVAL NILAI KOEFISIEN REGRESI A DAN B
45
Di mana:
Y adalah nilai sebenarnya,
adalah nilai regresi
e adalah error atau kesalahan
Analisis varians atau ANOVA merupakan alat atau peranti yang dapat menggambarkan
hubungan antara koefisien korelasi, koefisien determinasi dan kesalahan baku
pendugaan. Untuk mengukur kesalahan baku kita menghitung error yaitu selisih Y
dengan atau dapat dinyatakan dalam bentuk persamaan:
e = Y –
atau dalam bentuk lain yaitu
Y = + e
Y
Y
Y
ANALISIS VARIANS ATAU ANOVA
46
TERIMA KASIH
Top Related