Bab 15 regresi

43
BAB 15 ANALISIS REGRESI DAN KORELASI LINIER 1

Transcript of Bab 15 regresi

Page 1: Bab 15 regresi

BAB 15

ANALISIS

REGRESI DAN

KORELASI

LINIER

1

Page 2: Bab 15 regresi

PENGERTIAN ANALISIS KORELASI

Analisis Korelasi

• Suatu teknik statistika yang digunakan untuk mengukurkeeratan hubungan ataukorelasi antara dua variabel.

2

Page 3: Bab 15 regresi

HUBUNGAN POSITIF DAN NEGATIF

3

Hubungan Produksi danHarga Minyak Goreng

(Korelasi Positif)

0

100

200

300

400

500

600

700

637 740 722 781 849 881

Harga Minyak Goreng

Hubungan Inflasi dan SukuBunga (Korelasi Negatif)

0

5

10

15

20

25

30

35

2,01 9,35 12,55 10,33

Inflasi

Gambar pertama menunjukkan hubungan antaravariabel inflasi dan suku bunga. Apabila dilihat padagambar saat inflasi rendah, maka suku bunga tinggidan pada saat inflasi tinggi, suku bunga rendah. Gambar tersebut menunjukkan adanya hubunganantara inflasi dan suku bunga yang bersifat negatif.

Gambar kedua memperlihatkan hubungan yang positif antara variabel produksi dan harga minyakgoreng yaitu apabila harga meningkat, makaproduksi juga meningkat.

Page 4: Bab 15 regresi

RUMUS KOEFISIEN KORELASI

4

Rumus di atas adalah rumus koefiseien regresi, di mana:

r : Nilai koefisien korelasi

ΣX : Jumlah pengamatan variabel X

ΣY : Jumlah pengamatan variabel Y

ΣXY : Jumlah hasil perkalian variabel X dan Y

(ΣX2) : Jumlah kuadrat dari pengamatan variabel X

(ΣX)2 : Jumlah kuadrat dari jumlah pengamatan variabel X

(ΣY2) : Jumlah kuadrat dari pengamatan variabel Y

(ΣY)2 : Jumlah kuadrat dari jumlah pengamatan variabel Y

n : Jumlah pasangan pengamatan Y dan X

2 22 2

n XY X Yr

n X X n Y Y

Page 5: Bab 15 regresi

HUBUNGAN KUAT DAN LEMAHNYA SUATU

KORELASI

5

0,0 0,5 1,0

Skala rKorelasi negatif Korelasi positif

Korelasi negatif

sempurnaKorelasi negatif

sedang

Korelasi negatifkuat

Korelasi negatiflemah

Korelasi positiflemah

Korelasi positifkuat

Korelasi positif

sedang

Korelasi positif

sempurnaTidak adaKorelasi

-0,5-1,0

Page 6: Bab 15 regresi

Contoh Regresi LinierM.S.Hidayat selaku ketua kamar dagang Indonesia (Kadin)

dalam acara rakornas kadin 2008 yang dibuka presiden SBY,

mengharapkan agar pemerintah segera menurunkan tingkat

suku bunga kredit. Hal tersebut didasarkan bahwa selama

suku bunga tinggi, maka investasi akan menurun sehingga

akan berdampak pada peningkatan pengangguran.

Bagaimana sebenarnya hubungan antara suku bunga kredit

dengan besarnya investasi? Berikut adalah data besarnya

suku bunga dan nilai kredit di Indonesia pada agustus sampai

desember 2007, carilah koefisien korelasinya dan apa

kesimpulannya ?

6

Page 7: Bab 15 regresi

Kredit (dalam triliun ) Bunga (%/tahun)

Agustus 129 15

September 134 14

Oktober 152 13

November 178 13

desember 186 12

7

Kredit (X) Bunga (Y) Y2 X2 XY

Agustus 129 15 225 16.641 1.935

September 134 14 196 17.956 1.876

Oktober 152 13 169 23.104 1.976

November 178 13 169 31.684 2.314

Desember 186 12 144 34.596 2.232

Jumlah 779 67 903 123.981 10.333

Rumus koefisien korelasi

Untuk menghitung koefisien korelasi diperlukan perhitungan sebagai berikut :

2 22 2

n XY X Yr

n X X n Y Y

Page 8: Bab 15 regresi

𝑟 =𝑛 ∑𝑋𝑌 − ∑𝑋 (∑𝑌)

𝑛 ∑𝑋2 − ∑𝑋 2 [𝑛 ∑𝑌2 −(∑𝑌)2]

=5 10.333 − 779 (67)

5 123981 − 779 2 [5 903 −(67)2]= -0,91

8

Page 9: Bab 15 regresi

PENGERTIAN KOEFISIEN DETERMINASI

Koefisien determinasi

Bagian dari keragaman total variabel tak bebas Y (variabel

yang dipengaruhi atau dependent) yang dapat diterangkan

atau diperhitungkan oleh keragaman variabel bebas X

(variabel yang mempengaruhi atau independent).

Koefisien determinasi r2

12

2

2

2 22 2

n XY X Yr

n X X n Y Y

Page 10: Bab 15 regresi

RUMUS UJI t UNTUK UJI KORELASI

2

2

1

r nt

r

di mana:

t : Nilai t-hitung

r : Nilai koefisien korelasi

n : Jumlah data pengamatan

13

2-n

r-1

rt

2

atau

Page 11: Bab 15 regresi

CONTOH UJI t UNTUK UJI KORELASI SOAL A

14

Ujilah apakah (a) nilai r = - 0,412 pada hubungan antara suku bunga dan investasi dan (b) r

= 0,86 pada hubungan antara harga minyak dan produksi kelapa sawit sama dengan nol

pada taraf nyata 5%?

1. Perumusan hipotesis:

hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi

dilambangkan dengan sedang pada sampel r.

H0 : r = 0

H1 : r ¹ 0

2. Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df) = n-k = 9 - 2 =

7. Nilai taraf nyata a/2= 0,025 dan df =7 adalah = 2,36. Ingat bahwa n adalah jumlah data

pengamatan yaitu = 9, sedangkan k adalah jumlah variabel yaitu Y dan X, jadi k=2.

3. Menentukan nilai uji t

21,1

2-9

(,041)-1

0,41-

2-n

r-1

rt

22

Page 12: Bab 15 regresi

CONTOH UJI t UNTUK UJI KORELASI

15

4. Menentukan daerah keputusan dengan nilai kritis 2,36

Daerah menolak Ho Daerah menolak Ho

–2,36 t = –1,21 2,36

Daerah tidak menolak Ho

5. Menentukan keputusan. Nilai t-hitung ternyata terletak pada daerah tidak menolak H0.

Ini menunjukkan bahwa tidak terdapat cukup bukti untuk menolak H0, sehingga dapat

disimpulkan bahwa korelasi dalam populasi sama dengan nol, hubungan antara tingkat

suku bunga dengan investasi lemah dan tidak nyata.

Page 13: Bab 15 regresi

CONTOH UJI T UNTUK UJI KORELASI SOAL B

16

1.Perumusan hipotesis:

hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi

dilambangkan dengansedang pada sampel r.

H0 : r = 0

H1 : r 0

2.Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df) = n-k =

12 - 2 = 10. Nilai taraf nyata a/2=0,025 dan df =10 adalah = 2,23.

3. Menentukan nilai uji t

33,5

2-12

(0,86)-1

0,86

2-n

r-1

rt

22

Page 14: Bab 15 regresi

RUMUS KOEFISIEN DETERMINASI

17

4. Menentukan daerah keputusan dengan nilai kritis 2,23

Daerah menolak HoDaerah tidak menolak Ho

Daerah menolak Ho

–2,23 t= 5,332,23

5. Menentukan keputusan. Nilai t-hitung berada di daerah menolak H0, yang berarti bahwa

H0 di tolak dan menerima H1. Ini menunjukkan bahwa koefisien korelasi pada populasi

tidak sama dengan nol, dan ini membuktikan bahwa terdapat hubungan yang kuat dan

nyata antara harga minyak dan produksi kelapa sawit.

Page 15: Bab 15 regresi

REGRESI LINIER

• Regresi merupakan metode untuk memprediksi

sesuatu yang belum diketahui berdasarkan

sesuatu yang sudah diketahui dan mempengaruhi

variabel yang akan diprediksi itu

• Garis regresi adalah garis lurus yang terdapat

dalam diagram pencar (scatter diagram), yang

memperlihatkan adanya hubungan diantara kedua

variabel.

Page 16: Bab 15 regresi

Next……..

• Regresi adalah suatu teknik yang digunakan untuk membangun suatu persamaan yang menghubungkan antara variabel tidak bebas (Y) dengan variabel bebas (X) dan sekaligus untuk menentukan nilai ramalan dan dugaannya.

• Regresi: suatu persamaan matematika yang mendifinisikan hubungan antara dua variabel

• Untuk mengetahui pola hubungan di antara variabel atau pengaruh variabel yg satu terhadap yang lain.

Page 17: Bab 15 regresi

Analisis Regresi

• Variabel yg akan diduga dinamakan variabel terikat (dependent

variable), yang biasanya digambarkan pada sumbu vertikal dari

suatu diagram

• Variabel yang menerangkan variabel terikat dinamakan variabelbebas (explanatory variable atau indepandent variable), yangbiasanya digambarkan pada sumbu horizontal

• Dengan kata lain, analisis regresi menjawab bagaimana polahubungan (pengaruh) variabel-variabel

Page 18: Bab 15 regresi

FORMULASI

Y =

X =

a =

b =

Y = a + bX^

baca Y cap adalah variabel terikat,

yaitu variabel yg besarnya dipengaruhi

oleh variabel X

variabel bebas, yaitu variabel yg

mempengaruhi variabel yg lain

konstanta/intercept, yg merupakan titik

potong dgn sumbu vertikal jika X = 0

slope, yaitu koefisien kecondongan

garis regresi

Page 19: Bab 15 regresi

Lanjutan….Untuk menentukan hasil peramalan, maka kita harusmencari nilai a dan b dengan metode kuadrat terkecil:

Rumus 1:

Y = n a + b X

XY = a X + b X2

Page 20: Bab 15 regresi

Next…..Rumus 2

(Y) - b (∑X)

a =

n n

n. XY- (∑X) (∑Y)

b =

n. (X2 ) - (X)2

Page 21: Bab 15 regresi

Lanjutan …..Semakin besar nilai a berarti semakin besar pula

nilai Y (variabel terikat) meskipun nilai X=0.

Begitu pula sebaliknya.

Semakin besar nilai a sedangkan nilai b konstan,

maka titik potong persamaan

Y = a + bX semakin tinggi, garis regresi bergeser

ke atas secara sejajar.

Semakin tinggi nilai b, maka garis regresi

semakin tegak, berarti semakin besar pengaruh

nilai variabel X terhadap variabel Y. Begitu pula

sebaliknya.

Page 22: Bab 15 regresi

RUMUS PERSAMAAN REGRESI

Persamaan regresi

Suatu persamaan matematika yang

mendefinisikan hubungan antara dua variabel.

25

Page 23: Bab 15 regresi

SCATTER DIAGRAM UNTUK MEMBANTU

MENARIK GARIS REGRESI

26

Hubungan Inflasi dan Suku Bunga

0

5

10

15

20

25

30

35

2,01 9,35 12,55 10,33Inflasi

Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:

Gambar A

Page 24: Bab 15 regresi

SCATTER DIAGRAM UNTUK MEMBANTU

MENARIK GARIS REGRESI

27

Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:

Gambar B

Hubungan Inflasi dan Suku Bunga

0

5

10

15

20

25

30

35

2,01 9,35 12,55 10,33Inflasi

a

bd

c

Page 25: Bab 15 regresi

CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL LEBIH

KECIL

28

Gambar A: selisih antara dugaan dan aktual lebih kecil

e1

Y1e2

Y2 e3

Y3

Y4

e4Y5

e5

Yne

n

Hubungan Inflasi dan Suku Bunga

0

10

20

30

40

2.01 9.35 12.55 10.33Inflasi

Suku B

unga

e1

Y1e2

Y2 e3

Y3

Y4

e4

Yne

n

Page 26: Bab 15 regresi

CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL

LEBIH BESAR

29

e3

Y3

Hubungan Inflasi dan Suku Bunga

0

5

10

15

20

25

30

35

2.01 9.35 12.55 10.33Inf lasi

Suku

Bun

ga

e1

Y1

Y2e2

Y4e4

e5

Y5

Ynen

Page 27: Bab 15 regresi

GAMBAR PERSAMAAN REGRESI

30

-b+b

X

Y

a

XGambar A: = a + b X Gambar B: = a - b XY Y

Page 28: Bab 15 regresi

RUMUS MENCARI KOEFISIEN a DAN b

31

22 )X()X(n

)X)(X()XYna

b

)X(b

n

)Y(b

Y : Nilai variabel bebas Y

a : Intersep yaitu titik potong garis dengan sumbu Y

b : Slope atau kemiringan garis yaitu perubahan rata-rata pada untuk setiap unit

perubahan pada variabel X

X : Nilai variabel bebas X

n : Jumlah sampel

Y

Page 29: Bab 15 regresi

CONTOH HUBUNGAN ANTARA PRODUKSI DENGAN

HARGA MINYAK KELAPA SAWIT

32

= a + b XY

Page 30: Bab 15 regresi

33

n Y X Y2 XY X2

1997 4,54 271 20,61 1230,34 73441

1998 4,53 319 20,52 1445,07 101761

1999 5,03 411 25,30 2067,33 168921

2000 6,05 348 36,60 2105,40 121104

2001 6,09 287 37,09 1747,83 82369

2002 6,14 330 37,70 2026,20 108900

2003 6,37 383 40,58 2439,71 146689

2004 7,40 384 54,76 2841,60 147456

2005 7,22 472 52,13 3407,84 222784

Page 31: Bab 15 regresi

Maka nilai b dan a diperoleh sebagai berikut :

b=𝑛 ∑𝑋𝑌 − ∑𝑋 (∑𝑌)

𝑛 ∑𝑋2 −(∑𝑋)2]=

11 29509 − 4455 (69,67)

11 1955125 −(4455)2= 0,0086

a = (𝟔𝟗,𝟔𝟕)

𝟏𝟏=

𝟎,𝟎𝟏 ( 𝟒𝟒𝟓𝟓 )

𝟏𝟏= 2,8631

Jadi, persamaan dugaan menjadi

34

Persamaan = 2,8631 + 0,0086 X.

Page 32: Bab 15 regresi

DEFINISI STANDAR ERROR

Standar error atau kesalahan baku

Pendugaan

Suatu ukuran yang mengukur

ketidakakuratan pencaran atau persebaran

nilai-nilai pengamatan (Y) terhadap garis

regresinya (Ŷ).

35

Y

Page 33: Bab 15 regresi

RUMUS STANDAR ERROR

36

22

22

n

)YY(

n

eSyx

Di mana:

Sy.xC : Standar error variabel Y berdasarkan variabel X yang diketahui

Y : Nilai pengamatan dari Y

: Nilai dugaan dari Y

n : Jumlah sampel, derajat bebas n-2 karena terdapat dua parameter yang akan

digunakan yaitu a dan b.

Y

Page 34: Bab 15 regresi

Contoh Soal Hitunglah standar error antara X dengan Y dan standar error

untuk penduga a dan b dari diketahui bahwa Ŷ = 2,8631 +0,0086x

Jawab :

Untuk mengetahui SY.X, ada 2 rumus yang dapat dipakai, yaitu :

1. Sy,x =∑𝑒²

n−2=

∑ 𝑦−Ў ²

n−2

2. Sy,x =∑𝑦²−𝑎 ∑𝑦−𝑏∑𝑥𝑦

n−2

Page 35: Bab 15 regresi

N Y X X2 Y2 XY

1 4.54 271 73441 20.61 1230

2 4.53 319 101761 20.52 1445

3 5.03 411 168921 25.30 2067

4 6.05 348 121104 36.60 2105

5 6.09 287 82369 37.09 1748

6 6.14 330 108900 37.70 2026

7 6.37 383 146689 40.58 2440

8 7.4 384 147456 54.76 2842

9 7.22 472 222784 52.13 3408

10 7.81 610 372100 61.00 4764

11 8.49 640 409600 72.08 5434

38

Untuk mengetahui nilai sy,x’ maka diperlukan tabel seperti di bawahini:

Page 36: Bab 15 regresi

n Y Y-Y (Y-Y)2

1 5.1853 -0.6453 0.4164

2 5.5966 -1.0666 1.1376

3 6.3850 -1.3550 1.8359

4 5.8451 0.2049 0.0420

5 5.3224 0.7676 0.5892

6 5.6909 0.4491 0.2017

7 6.1450 0.2250 0.0506

8 6.1536 1.2464 1.5535

9 6.9077 0.3123 0.0976

10 8.0902 -0.2802 0.0785

11 8.3473 0.1427 0.0204

Jumlah 69.6689 0.0011 6.0235

39

Sy,x =

∑𝑒²

n−2=

∑ 𝑦−Ў ²

n−2=

∑ 6,0235 ²

11−2= 0,815

Sy,x =

∑𝑦2−𝑎 ∑𝑦−𝑏∑𝑥𝑦

n−2

-458,37−2,8631.69,67−0,0086.29609

11−2 = 0,818

Page 37: Bab 15 regresi

Jadi menggunakan rumus 1 dan 2 hasilnya sama. Standar error sebesar

0,818 menunjukkan bahwa nilai pengamatan Y menyebar dari persamaan

regresi sebesar 0,818.

Standar error untuk koefisien regresi b:

sb = Sᵪᵧ

[ ∑𝑋2− ∑𝑋 2/𝑛]

= O,818

[ 1955125− 4455 2/11]= 0,0021

standar error untuk koefisien regresi a:

sa =

∑𝑥²𝑠ᵪᵧ

n∑x2−(∑x)²

=( 1955125.0,818)

11.1955125−(4455)²= 0,98

40

Page 38: Bab 15 regresi

YGaris regresi

Satu deviasistandar

Nilai tengah terletakpada garis regresi

X1 X2 X3 X

41

Beberapa asumsi penting metode kuadrat terkecil adalah sebagai berikut:

1. Nilai rata-rata dari error term atau expected value untuk setiap nilai X sama dengan nol. Asumsi ini

dinyatakan E(ei/Xi) = 0.

2. Nilai error dari Ei dan Ej atau biasa disebut dengan kovarian saling tidak berhubungan

atau berkorelasi. Asumsi ini biasa dilambangkan sebagai berikut, Cov (Ei, Ej) = 0, di mana

i ¹ j. Berdasarkan pada asumsi nomor 1, pada setiap nilai Xi akan terdapat Ei, dan untuk

Xj akan ada Ej, yang dimaksud dengan nilai kovarian = 0 adalah nilai Ei dari Xi tidak ada

hubungan dengan nilai Ej dari Xj.

.

ASUMSI METODE KUADRAT TERKECIL

Page 39: Bab 15 regresi

42

3. Varian dari error bersifat konstan. Ingat bahwa varian dilambangkan dengan s2, sehingga

asumsi ini dilambangkan dengan Var (Ei/Ej) = E(ei – ej)2 = s2. Anda perhatikan pada

gambar di atas bahwa nilai Ei (yang dilambangkan dengan tanda titik) untuk setiap X yaitu

X1, X2 dan X3 tersebar secara konstan sebesar variannya yaitu s2. Pada gambar tersebut

nilai E tersebar 1 standar deviasi di bawah garis regresi dan 1 standar deviasi di atas garis

regresi. Seluruh sebaran nilai Ei untuk Xi dan Ej untuk Xj, di mana i ¹ j terlihat sama dengan

ditunjukkan kurva yang berbentuk simetris dengan ukuran yang sama, hal inilah yang

dikenal dengan varians dari error bersifat konstan.

4. Variabel bebas X tidak berkorelasi dengan error term E, ini biasa dilambangkan dengan Cov

(Ei, Xi) = 0. Pada garis regresi Y=a + bxi + ei maka nilai Xi dan Ei tidak saling

mempengaruhi, sebab apabila saling mempengaruhi maka pengaruh masing-masing yaitu

X dan E tidak saling dapat dipisahkan. Ingat bahwa yang mempengaruhi Y selain X adalah

pasti E yaitu faktor diluar X. Oleh sebab itu varians dari E dan X saling terpisah atau tidak

berkorelasi.

ASUMSI METODE KUADRAT TERKECIL

Page 40: Bab 15 regresi

n/)X(X

)XX(

n)S(tY yx 22

21

43

: Nilai dugaan dari Y untuk nilai X tertentu

t : Nilai t-tabel untuk taraf nyata tertentu

Sy.x : Standar error variabel Y berdasarkan variabel X yang diketahui

X : Nilai data pengamatan variabel bebas

X : Nilai rata-rata data pengamatan variabel bebas

Y

RUMUS

Page 41: Bab 15 regresi

44

Dengan menggunakan asumsi bahwa nilai Ei bersifat normal, maka hasil dugaan a

dan b juga mengikuti distribusi normal. Sehingga nilai t = (b – B)/b, juga merupakan

variabel normal. Dalam praktiknya nilai standar deviasi populasi b sulit diketahui,

maka standar deviasi populasi biasa diduga dengan standar deviasi sampel yaitu Sb,

sehingga nilai t menjadi t = (b – B)/Sb. Selanjutnya probabilitasnya dinyatakan

sebagai berikut:P(-ta/2 (b – B)/Sb ta/2 ) = 1 - a

P(-ta/2. Sb (b – B) ta/2 . Sb) = 1 - a

Sehingga interval B adalah:

(b -ta/2. Sb B b + ta/2 . Sb)

sedangkan dengan cara yang sama interval A adalah:

(a -ta/2. Sa A a + ta/2 . Sa)

di mana Sa dan Sb adalah sebagai berikut:

Sb = Sy.x / [ X2 – (X)2/n]

Sa = (X2.Sy.x)/ (nX2 – (X)2)

PENDUGAAN INTERVAL NILAI KOEFISIEN REGRESI A DAN B

Page 42: Bab 15 regresi

45

Di mana:

Y adalah nilai sebenarnya,

adalah nilai regresi

e adalah error atau kesalahan

Analisis varians atau ANOVA merupakan alat atau peranti yang dapat menggambarkan

hubungan antara koefisien korelasi, koefisien determinasi dan kesalahan baku

pendugaan. Untuk mengukur kesalahan baku kita menghitung error yaitu selisih Y

dengan atau dapat dinyatakan dalam bentuk persamaan:

e = Y –

atau dalam bentuk lain yaitu

Y = + e

Y

Y

Y

ANALISIS VARIANS ATAU ANOVA

Page 43: Bab 15 regresi

46

TERIMA KASIH