Post on 26-Apr-2018
Metode Statistika (STK211)
Statistika Deskriptif (1)
Dr. Ir. Kusman Sadik
Dept. Statistika IPB, 2015
1
Statistika Deskripsi dan Eksplorasi
• Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.
Peringkasan Data
Ukuran Pemusatan : Rata-rata, median, dsb.
Ukuran Penyebaran : Ragam (variance),
jangkauan (range)
Tehnik Penyajian
Tabel
Grafik
6
Penyajian Data
• Tabel
Data Kualitatif
Data Kuantitatif
• Gambar/Grafik
Data Kualitatif
• Pie Chart
• Bar Chart
Data Kuantitatif
• Histogram
• Diagram Dahan Daun
• Diagram Kotak Garis
• Plot Garis
• Scatter Plot
• Survival Plot
8
• Menyajikan statistik menurut group
sesuai keperluan penelitian
• Tampilan tabel jelas dan ringkas
Kunci dalam membuat Tabel
Tabel harus memberikan informasi yang dapat
dimengerti oleh pembaca
10
No Sex Tinggi Berat Agama
1 1 167 63 Islam
2 1 172 74 Islam
3 0 161 53 Kristen
4 0 157 47 Hindu
5 1 165 58 Islam
6 0 167 60 Islam
7 1 162 52 Budha
8 0 151 45 Katholik
9 0 158 54 Kristen
10 1 162 63 Islam
11 1 176 82 Islam
12 1 167 69 Islam
13 0 163 57 Kristen
14 0 158 60 Islam
15 1 164 58 Katholik
16 0 161 50 Islam
17 1 159 61 Kristen
18 1 163 65 Islam
19 1 165 62 Islam
20 0 169 59 Islam
21 1 173 70 Islam
Data yang digunakan (Data 1)
12
Tabel Frekuensi
• Sajikan data kualitatif (kategorik) dalam bentuk
FREKUENSI
• Jika jumlah data mencukupi tampilkan pula percentase-
nya
Rekapitulasi menurut Agama
Agama Frekuensi Persen
Islam 13 61.90
Kristen 4 19.05
Katholik 2 9.52
Hindu 1 4.76
Budha 1 4.76
Rekapitulasi menurut Sex
Sex
Frek
.
Perse
n
Laki-laki 12 57.14
Perempuan 9 42.86
13
Tabel Kontingensi
• Digunakan untuk melihat distribusi dari dua data kategorik
atau lebih
• Bisa dalam bentuk %baris, % kolom, % total, sesuai
dengan kebutuhan
Agama
Sex Budha Hindu Islam Katholik Kristen Total
Laki-laki 1 9 1 1 12
Perempuan 1 4 1 3 9
Total 1 1 13 2 4 21
14
Tabel Sebaran Frekuensi Kelompok
• Digunakan untuk membuat pengelompokkan data kuantitatif
• Isi tabel terdiri dari selang kelas, frekuensi masing-masing
kelas, frekuensi relatif masing-masing kelas
• Cara membuat tabel distribusi frekuensi kelompok
Tentukan jumlah kelas (Sturges' rule ): k =3.3 log (n)+1
Tentukan lebar kelas : l = (Xmax- Xmin)/k
Tentukan batas atas dan batas bawah dari masing-
masing kelas
Tentukan tepi batas kelas
List jumlah pengamatan pada masing-masing kelas
Frekuensi Relatif : cari proporsi dari masing-masing
kelas
16
Ilustrasi Data- Berat Badan
Data 2
58 57 50 56 44 59 43 52 55 49
43 43 49 55 58 48 46 42 44 48
40 40 42
Data 3
58 57 50 56 44 59 43 52 55 49
43 43 49 55 58 48 46 42 44 48
40 40 42 69 69 79 80 75 70 68
69 70 67 65 77 69 67 76 73 65
17
Ilustrasi Data 2
• Jumlah kelas: k = 1+ 3.3 log (23) =5.49 6
• Lebar kelas: l = (59-40)/6 = 3.16 4
Selang
kelas
Tengah
Kelas
Tepi Batas
kelasTurus Frekuensi
Frekuensi
RelatifPresentase
38-41 39.5 37.5 - 41.5 || 2 0.09 8.70%
42-45 43.541.5 - 45.5 |||| || 7 0.30 30.43%
46-49 47.545.5 - 49.5 |||I 5 0.22 21.74%
50-53 51.5 49.5 - 53.5 || 2 0.09 8.70%
54-57 55.553.5 - 57.5 |||| 4 0.17 17.39%
58-61 59.5
57.5 - 61.5 ||| 3 0.13
138-41
3.04%
Total23 1 100.00%
18
Tabel Ringkasan
• Sajikan RINGKASAN STATISTIK jika
memungkinkan. Ringkasan statistik yang
digunakan adalah jumlah data, rataan, median,
standar deviasi, minimum, dan maksimum.
Hindarkan pemberian banyak informasi dalam
kapasitas yang terbatas
Peubah Jenis Kelamin N Rataan StDev Minimum Median Maximum
Tinggi Perempuan 9 160.56 5.43 151 161 169
Laki-laki 12 166.25 5.07 159 165 176
Berat Perempuan 9 53.89 5.62 45 54 60
Laki-laki 12 64.75 8.04 52 63 82
19
• Grafik mengungkapkan banyak informasi
dibandingkan dengan seribu kata-kata
• Grafik yang disajikan harus dapat dimengerti
oleh pembaca
• Jika pembaca mempertanyakan apa
maksudnya maka grafik yang disajikan “belum
baik”
• Gunakan “nalar” dalam membuat grafik.
21
Pie Chart (Diagram Kue)
• Digunakan untuk menampilkan data kategorik khususnya
data nominal
• Menunjukkan distribusi data dalam group (total 100%)
• Disajikan dalam bentuk %, terkadang perlu menyajikan pula
jumlah data
12; 57%
9; 43%
Laki-laki
Perempuan
13; 61%4; 19%
2; 10%
1; 5% 1; 5%
Islam Kristen Katholik Hindu Budha
23
Bar Chart (Diagram Batang)• Berguna untuk menampilkan data kategorik
• Dapat pula digunakan untuk menyajikan data dari tabel
kontingensi / tabel ringkasan data
0
2
4
6
8
10
12
Ju
mla
h
Laki-laki Perempuan
Jenis Kelamin
0.00
50.00
100.00
150.00
200.00
Rata
-rata
Tinggi Berat
Laki-laki
Perempuan
8.3%
11.1%
75.0%
44.4%
8.3%
11.1%
8.3%
33.3%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
La
ki-
lak
iP
ere
mp
ua
n
Budha Hindu Islam Katholik Kristen
24
Histogram
Sebuah grafik dari suatu sebaran frekuensi
Bisa distribusi dari frekuensi-nya atau frekuensirelatif-nya
Digunakan untuk melihat distribusi dari data:
Melihat ukuran penyebaran dan ukuranpemusatan data
Melihat adanya data outlier (pencilan)
Mendeteksi ada bimodus/tidak
27
Teknik Menginterpretasikan Grafik
First, check the horizontal and vertical scales, so that you
are clear about what is being measured.
Examine the location of the data distribution. Where on
the horizontal axis is the center of the distribution? If you
are comparing two distributions, are they both centered in
the same place?
Examine the shape of the distribution. Does the
distribution have one “peak,” a point that is higher than
any other? If so, this is the most frequently occurring
measurement or category. Is there more than one peak?
Are there an approximately equal number of
measurements to the left and right of the peak?
Look for any unusual measurements or outliers. That is,
are any measurements much bigger or smaller than all of
the others? These outliers may not be representative of
the other values in the set. (Lihat: Mendenhal, hal. 22)28
Fre
qu
en
cy
420-2-4-6
40
30
20
10
0
420-2-4-6
20
15
10
5
0
data1 data2
Histogram of data1, data2
Fre
qu
en
cy
43210-1-2
25
20
15
10
5
0
43210-1-2
20
15
10
5
0
data1 data3
Histogram of data1, data3
Ukuran Pemusatan relatif sama namun
ukuran penyebaran relatif berbeda
Ukuran Pemusatan relatif berbeda
namun ukuran penyebaran relatif sama
?C14
Fre
qu
en
cy
543210-1-2
30
25
20
15
10
5
0
Histogram of C14
bimodus
outlier
29
Bentuk (shape) Grafik
A distribution is symmetric if the left
and right sides of the distribution, when
divided at the middle value, form mirror
images.
A distribution is skewed to the right
(menjulur ke kanan, right tail) if a
greater proportion of the
measurements lie to the right of the
peak value. Distributions that are
skewed right contain a few unusually
large measurements.30
Bentuk (shape) Grafik
A distribution is skewed to the left
(menjulur ke kiri, left tail) if a greater
proportion of the measurements lie to the
left of the peak value. Distributions that are
skewed left contain a few unusually small
measurements.
A distribution is unimodal if it has one peak;
a bimodal distribution has two peaks.
Bimodal distributions often represent a
mixture of two different populations in the
data set. (Lihat: Mendenhal, hal. 22)31
Histogram – Mengukur bentuk sebaran
FR
EQ
UE
NC
Y
Skewed to Right
FR
EQ
UE
NC
Y
Symmetric
FR
EQ
UE
NC
Y
WEIGHT WEIGHT WEIGHT
Skewed to Left
32
Kembali ke Ilustrasi—Data 2
• Berdasasarkan tabel sebaran frekuensi tersebut maka
tampilan histogramnya sebagai berikut:
Sebagain besar berusia kurang dari 50 tahun, sedangkan
frekuensi paling banyak berada pada usia 44 tahun.
Bentuk sebaran tidak simetrik, terdapat dua kelompok
usia (kurag dari 50 tahun dan lebih dari 50 tahun)
bimodus
Fre
qu
en
cy
605652484440
7
6
5
4
3
2
1
0
34
Variasi berbagai bentuk histogram dari Data 2
Fre
qu
en
cy
605652484440
7
6
5
4
3
2
1
0
Fre
qu
en
cy
6055504540
7
6
5
4
3
2
1
0
Bentuk histogram tidak
unik pemilihan
tergantung informasi
yang diperlukan
Fre
qu
en
cy
6055504540
7
6
5
4
3
2
1
0
35
Frekuensi Relatif Histogram vs Pemulusan
Pe
rce
nt
3.62.41.20.0-1.2-2.4-3.6
9
8
7
6
5
4
3
2
1
0
Pe
rce
nt
3.62.41.20.0-1.2-2.4-3.6
9
8
7
6
5
4
3
2
1
0
Histogram of C1
C1
Pe
rce
nt
3.62.41.20.0-1.2-2.4-3.6
9
8
7
6
5
4
3
2
1
0
Histogram of C1
36
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Histogram of C4
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Shape 4.886
Scale 3.073
N 10000
Histogram of C4Gamma
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Shape 4.886
Scale 3.073
N 10000
Histogram of C4Gamma
37
Diagram Dahan Daun (Stem and Leaf)
• Sebuah diagram yang menampilkan distribusi dari
data kuantitatif yang sudah terurut dari terkecil dan
terbesar
• Sesuai dengan namanya diagram dahan daun
terdiri dari bagian dahan dan bagian daun. Bagian
daun selalu terdiri dari satu digit. Bagian dahan
terletak di sebelah kiri dan bersesuaian dengan
bagian daun (jika ada) di sebelah kanan
• Secara visual,diagram dahan daun hampir sama
dengan bar chart dimana kategori-kategorinya
didefinisikan dengan struktur desimal dari bilangan
yang ada
38
Cara Membuat Diagram Dahan Daun
Proses pembuatan diagram dahan daun dan
interpretasinya Lihat : Mendenhal (Example
1.8), hal. 21
39
Manfaat diagram dahan daun
• Melihat distribusi dari data
Melihat ukuran penyebaran dan ukuran
pemusatan data
Melihat adanya data outlier
Mendeteksi ada bimodus/tidakStem-and-leaf of Contoh1 N = 20
Leaf Unit = 1.0
1 2 5
4 3 579
7 4 138
(4) 5 0445
9 6 5569
5 7 36
3 8 12
1 9 3
pusat
Terlihat distribusi
dari data aslinya
40
Ilustrasi
Stem-and-leaf of Contoh1 N = 20
Leaf Unit = 1.0
1 2 5
4 3 579
7 4 138
(4) 5 0445
9 6 5569
5 7 36
3 8 12
1 9 3
Informasi satuan
dari daun
satuan
Bagian daun
Bagian dahan
Frekuensi kumulatif
dari jumlah daun pada
masing-masing dahan.
Dihitung dari atas dan
bawah sampai ketemu
di posisi median
Output MINITAB
41
Membuat diagram dahan daun
• Pisahkan bagian dahan dan daun. Untuk
contoh diatas misalkan dahan berupa puluhan
dan daunnya berupa satuan
• Bagian dahan urutkan dari terkecil sampai
terbesar
2
3
4
5
6
7
8
9
43
• Plot daun sesuai dengan dahan yang tersedia. Sebagai
langkah awal untuk memudahkan pekerjaan identifikasi
secara berurutan dari data yang ada
2 5
3 795
4 183
5 4405
6 5569
7 63
8 21
9 3
• Urutkan bagian daun dari terkecil
sampai yang terbesar
2 5
3 579
4 138
5 0445
6 5569
7 36
8 12
9 344
Stem-and-leaf of Contoh3 N = 23
Leaf Unit = 1.0
1 0 3
3 0 45
5 0 77
8 0 899
(4) 1 0011
11 1 223
8 1 4455
4 1 67
2 1 8
1 2
1 2
1 2
1 2 7
0 t 3
f 45
s 77
. 899
1 * 0011
t 223
f 4455
s 67
. 8
2 *
t
f
s 7
Output MINITAB
Aturan banyaknya
dahan yang
digunakan :
antara 4-12 dahan
Sesuaikan dengan
informasi yang
diperoleh berkaitan
dengan bentuk
sebaran, ukuran
pemusatan dan
penyebaran data
45
Latihan untuk Responsi/Praktikum
• Mendenhall (Exercise : 1.18), hlm. 30
• Mendenhall (Exercise : 1.19), hlm. 30
• Mendenhall (Exercise : 1.37), hlm. 33
47