opisna_statistika_01
Transcript of opisna_statistika_01
-
7/23/2019 opisna_statistika_01
1/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
1
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna:
OSNOVE STATISTIKE NA PROSOJNICAH
tudijsko gradivo pri predmetu Statistika. Fakulteta za drubene vede, Univerza v Ljubljani
Ljubljana, 2010
2 OPISNA STATISTIKA
2.1 KORAKI STATISTINE ANALIZE ............................................................................... 22.2 UREJANJE IN PRIKAZOVANJE PODATKOV ............................................................ 2
2.2.1 Frekvenne tabele in grafi za nominalne in ordinalne spremenljivke ........................... 22.2.2 Frekvenne tabele in grafi za intervalne in razmernostne spremenljivke ..................... 4
2.3 OSNOVNI STATISTINI IZRAUNI ......................................................................... 112.3.1 Kvantili ........................................................................................................................ 112.3.2 Srednje vrednosti ......................................................................................................... 14
2.3.2.1 Mediana ..................................................................................................... 142.3.2.2 Modus ................................................................................................................... 152.3.2.3 Arimetina sredina ............................................................................................... 182.3.2.4 Odnos med Me in . ............................................................................................. 192.3.2.5 Katero srednjo vrednost izbrati? .......................................................................... 20
2.3.3 Mere variabilnosti ....................................................................................................... 212.3.3.1 Absolutne mere variabilnosti ............................................................................... 212.3.3.2 Relativne mere variabilnosti ................................................................................. 242.3.3.3 Variabilnost pri normalni porazdelitvi ................................................................. 25
2.3.4 Mere asimetrije in sploenosti ................................................................................... 252.3.4.1 Koeficient asimetrije (angl. skewness) ................................................................. 272.3.4.2 Koeficient sploenosti (angl. kurtosis) ............................................................... 28
2.3.5 Standardizacija ............................................................................................................ 29
2.4 VAJE ............................................................................................................................... 312.4.1 Urejanje in prikazovanje podatkov ............................................................................. 31
2.4.2 Kvantili ........................................................................................................................ 352.4.3 Srednje vrednosti ......................................................................................................... 352.4.4 Mere variabilnosti, asimetrije, sploenosti, standardizacija ...................................... 37
-
7/23/2019 opisna_statistika_01
2/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
2
2.1 KORAKI STATISTINE ANALIZE
1. Doloitev vsebine in namenastatistinega prouevanja; opredelitev predmeta opazovanja
(enote in populacije) in vsebine opazovanja (spremenljivk).
2. Statistino opazovanje; vrste opazovanj:
- opazovanje cele populacije (npr. popisi, tekoe registracije),
- opazovanje vzorca (npr. ankete).
3. Enostavna obdelava: urejanje, razvranje podatkov ter izraun osnovnih statistinih
karakteristik.
4. Analitina obdelava.
2.2 UREJANJE IN PRIKAZOVANJE PODATKOV
Z namenom preglednosti podatke uredimo v frekvenno porazdelitev.
Frekvenna porazdelitevspremenljivke je tabela, ki jo doloajo vrednosti ali skupine
vrednosti in njihove frekvence.
Skupine vrednosti (razrede) oblikujemo, e gre za intervalno ali razmernostno
spremenljivko, ki ima veliko (nepregledno) tevilo razlinih vrednosti.
e je spremenljivka vsaj ordinalnega znaaja, vrednosti (ali skupine vrednosti) uredimood najmanje do najveje.
Frekvenno porazdelitev lahko tudi grafino predstavimo.
2.2.1 Frekvenne tabele in grafi za nominalne in ordinalne spremenljivke
PRIMER
Enote:tudenti
Spremenljivka:X Brez esa bi
najlae iveli? z odgovori brez
TV, brez mobilnika, brez
interneta
tevilo enot:N= 300
Frekvenna porazdelitev
Vrednosti spremenljivke (absolutne) frekvence relativne frekvence
(anketni odgovori) (t. tudentov) strukturni odstotki
(% tudentov)
tevilo vseh enot
-
7/23/2019 opisna_statistika_01
3/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
3
Osnovni pojmi
Podatki so urejeni v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana
ena izmed monih vrednosti spremenljivke (x1, x2, ... xm), poleg pa njena frekvenca.
Frekvencaje tevilo enot, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi frekvenca za i-to vrednost spremenljivke.
Smiselno je izraunati relativne frekvence, im. strukturni odstotki. Relativna frekvenca
je % enot med vsemi enotami, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih
zfi% - relativna frekvenca za i-to vrednost spremenljivke. Izraunamo jih po naslednjem
obrazcu:
Grafina predstavitev
Frekvenno porazdelitev za nominalne in ordinalne spremenljivke grafino prikazujemo z
liki, npr. strukturnimi stolpci(angl. barchart) ali strukturnimi krogi(angl.pie).
Ploine likov naj bodo sorazmerne frekvencam.
Legenda naj bo primerno urejena.
Vsaka grafina predstavitev naj ima naslov.
Grafina predstavitev naj bo samozadostna.
Brez esa bi najlaje iveli?
brez TVbrez mobilnikabrez interneta
Strukturni stolpec
(absolutne frekvence)
t.tudnetov
(f
i)
0
50
100
150
200
250
300
90
180
30
Brez esa bi najlaje iveli? (n = 300)
brez TVbrez mobilnikabrez interneta
Strukturni stolpec
(relativne frekvence)
Odstotektudnetov(f
i%)
0 %10 %20 %30 %40 %50 %60 %70 %80 %90 %
100 %
30 %
60 %
10 %
brez interneta brez mobilnika brez TV
Strukturni stolpci
Brez esa bi najlaje iveli?
t.tudnetov
(fi)
0
50
100
150
90
180
30
brez interneta 30 %
brez mobilnika 60 %
brez TV 10 %
Strukturni krog
Brez esa bi najlaje iveli? (n = 300)
% 100iif
f =
-
7/23/2019 opisna_statistika_01
4/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
4
2.2.2 Frekvenne tabele in grafi za intervalne in razmernostne spremenljivke
PRIMER
Enota:gospodinjstvo
Spremenljivka:X tevilo lanov gospodinjstva
tevilo enot:N = 50
Podatki so: 1 3 4 3 5 6 2 3 10 4 3 6 4 7 3 7 6 8 2 6
2 4 5 4 4 4 3 2 3 4 4 4 1 4 8 3 2 1 4 5
9 6 4 6 8 7 5 5 5 9
Frekvenna porazdelitev
Osnovni pojmi
Podatke uredimo v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana
ena izmed monih vrednosti spremenljivke (x1, x2, ... xm), poleg pa njena frekvenca.
Frekvencaje tevilo enot, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi
frekvenca za i-to vrednost spremenljivke.
Smiselno je izraunati relativne frekvence. Relativna frekvenca je % enot med vsemi
enotami, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi% - relativnafrekvenca za i-to vrednost spremenljivke. Izraunamo jih po naslednjem obrazcu:
% 100iif
f =
-
7/23/2019 opisna_statistika_01
5/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
5
V primeru ordinalnih, intervalnih in razmernostnih spremenljivk je smiselno raunati tudi
kumulativne frekvence (kumulative). Kumulativna frekvenca za neko vrednost
spremenljivke, vkljuujo to vrednost, je setevek frekvenc za vrednosti pred njo ter to
frekvenco. Oznaimo jo zFi- kumulativna frekvenca za i-to vrednost. Pove nam, kolikoenot ima vrednosti manje ali enake od doloene vrednosti. Izraunamo jo po naslednjem
obrazcu:
Izraunamo lahko tudi relativno kumulativno frekvenco, ki nam pove, koliken % enot
ima vrednosti manje ali enake od doloene vrednosti. Izraunamo jo po naslednjem
obrazcu:
Grupiranje razvranje v razrede
e je tevilo monih vrednosti spremenljivke veliko, je preglednost podatkov majhna.
Zato sorodne vrednosti razvrstimo v skupine razrede.
Skupine vrednosti morajo biti doloene enolino: vsaka enota s svojo vrednostjo je lahko
uvrena v eno in samo eno skupino vrednosti.
Obiajno so skupine vrednosti (razredi) enako iroki.
Podatke uredimo v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana
ena izmed skupin vrednosti (en razred), poleg pa njena frekvenca.
Nezvezna ureditev - e so vrednosti spremenljivke diskretne
iiii ffffFF +++=+= ...211
% 100iiF
F =
9.5
7.5
5.5
3.5
1.5
xi
100
94
82
58
16
Fi%
8.5
6.5
4.5
2.5
0.5
ximin
10.5
8.5
6.5
4.5
2.5
ximax
2
2
2
2
2
di
10050Skupaj N
50639-10
471267-8
4124125-6
2942213-4
81681-2
Fifi%fiRazredi
9.5
7.5
5.5
3.5
1.5
xi
100
94
82
58
16
Fi%
8.5
6.5
4.5
2.5
0.5
ximin
10.5
8.5
6.5
4.5
2.5
ximax
2
2
2
2
2
di
10050Skupaj N
50639-10
471267-8
4124125-6
2942213-4
81681-2
Fifi%fiRazredi
-
7/23/2019 opisna_statistika_01
6/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
6
Zvezna ureditev - e so vrednosti spremenljivke zvezne (ali diskretne)
Frekvencaje v tem primeru tevilo enot, ki imajo vrednost v doloeni skupini vrednosti
(razredu). Oznaujemo jih zfi frekvenca za i-ti razred.
Tudi v tem primeru je smiselno izraunati relativne frekvence. Relativna frekvenca je %
enot med vsemi enotami, ki imajo vrednost v doloenem razredu. Oznaujemo jih zfi% -
relativna frekvenca za i-ti razred. Izraunamo jih po naslednjem obrazcu:
Kumulativna frekvencaza neko skupino vrednosti in vkljuujo to skupino (razred) je
setevek frekvenc za skupine vrednosti (razrede) pred njo ter frekvenco te skupine.Oznaimo jo zFi- kumulativna frekvenca za i-ti razred. Pove nam, koliko enot ima
vrednosti manje ali enake od te skupine vrednosti, natanneje manje od zgornje meje
tega razreda. Izraunamo jo po naslednjem obrazcu:
Relativna kumulativna frekvenca za nek razred pa pove, koliken % enot ima vrednosti
manje od zgornje meje razreda. Izraunamo jo po naslednjem obrazcu:
% 100iif
fN
=
iiii ffffFF +++=+= ...211
% 100iiF
FN
=
10
8
64
2
xi
100
94
8258
16
Fi%
9
7
53
1
ximin
11
9
75
3
ximax
2
2
22
2
di
10050Skupaj N
50639 pod 11
471267 pod 9
4124125 pod 72942213 pod 5
81681 pod 3
Fifi%fiRazredi
10
8
64
2
xi
100
94
8258
16
Fi%
9
7
53
1
ximin
11
9
75
3
ximax
2
2
22
2
di
10050Skupaj N
50639 pod 11
471267 pod 9
4124125 pod 72942213 pod 5
81681 pod 3
Fifi%fiRazredi
9
7
5
3
1
xi
2
2
2
2
2
di
100
94
82
58
16
Fi%
8
6
4
2
0
ximin
10
8
6
4
2
ximax
10050Skupaj N
5063nad 8 - 10
47126nad 6 - 8
412412nad 4 - 6
294221nad 2 - 4
8168nad 0- 2
Fifi%fiRazredi
9
7
5
3
1
xi
2
2
2
2
2
di
100
94
82
58
16
Fi%
8
6
4
2
0
ximin
10
8
6
4
2
ximax
10050Skupaj N
5063nad 8 - 10
47126nad 6 - 8
412412nad 4 - 6
294221nad 2 - 4
8168nad 0- 2
Fifi%fiRazredi
-
7/23/2019 opisna_statistika_01
7/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
7
Grafina predstavitev
Predpostavimo, da so razredi enako iroki.
HISTOGRAM: drug poleg drugega riemo stolpce pravokotnike, katerih viina je
sorazmerna frekvenci v razredu. irina pravokotnikov je enaka, ker so razredi enakoiroki.
POLIGON: v koordinatnem sistemu zaznamujemo toke (xi, fi), kjer jexisredina i-tega
razreda infinjegova frekvenca. K tem tokam dodamo e toki (xo, 0) in (xk+1, 0), e je v
frekvenni porazdelitvi krazredov. Toke zveemo z daljicami.
OGIVA: grafina predstavitev kumulativne frekvenne porazdelitve s poligonom, kjer v
koordinatni sistem nanaamo toke (xi,max,Fi). Dodamo tudi toko (x1,min, 0).
Histogram
tevilo lanov gospodinjstva
tevilogospodinjstev
0 2 4 6 8 10
0
5
10
15
20
25
-
7/23/2019 opisna_statistika_01
8/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
8
0
5
10
15
20
Poligon
tevilo lanov gospodinjstva
tevilogospodinjste
v
-1 1 3 5 7 9 11
0 2 4 6 8 10
0
10
20
30
40
50
Ogiva
tevilo lanov gospodinjstva
te
vilogospodinjstev
Oblike frekvennih porazdelitev
Frekvenna porazdelitev prikazuje variiranje ali razprenost vrednosti spremenljivke.
Razprenost je rezultat individualnih, posaminih faktorjev, ki vplivajo na posamezne enote.
Ti vplivi so najrazlineji in njihova posledica so razline oblike frekvenne porazdelitve.
Nekatere oblike frekvennih porazdelitev se vekrat pojavljajo in te porazdelitve so dobile
svoja imena: normalna, unimodalna, bimodalna, polimodalna, asimetrina v levo, asimetrina
v desno, sploena, koniasta, J oblike, U oblike.
-
7/23/2019 opisna_statistika_01
9/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
9
Frekvenna porazdelitev, s katero obiajno primerjamo doloeno frekvenno porazdelitev, je
normalna porazdelitev, ki je unimodalna (ima en vrh), simetrina in zvonaste oblike.
Oblika porazdelitev se lahko od normalne bolj ali manj razlikuje zaradi nehomogenostipopulacije, okrnjenega delovanja doloenih faktorjev itd. Zato je oblika porazdelitve lahko:
bimodalna, e ima dva vrha; polimodalnaz ve vrhovi;
asimetrina v levo, e se rep vlee
na levo;
asimetrina v desno, e se rep vlee
v desno;
-
7/23/2019 opisna_statistika_01
10/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
10
bolj koniastaali sploenaod normalne porazdelitve;
koniastanormalnasploena
Jali Uoblike.
Zavajajoi grafi
Grafi morajo biti narisani tako, da realno prikaejo osnovne znailnosti podatkov.
Vasih so grafi nepravilno narisani, tako da celo zavajajo bralca. Npr. potrebna je posebna
pozornost pri izbiri velikosti merske enote v koordinatnem sistemu.
-
7/23/2019 opisna_statistika_01
11/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
11
2.3 OSNOVNI STATISTINI IZRAUNI
2.3.1 KvantiliKvantili so statistini izrauni, ki nam pomagajo doloiti, kje se nahaja posamezna enota v
primerjavi z drugimi enotami in njihovimi vrednostmi. Raunamo jih lahko le za intervalne in
razmernostne spremenljivke.
Primer
Enota: tudent 1. letnika FDV
Spremenljivka: tevilo doseenih tok na izpitu
S kvantili lahko odgovorimo npr. na naslednji dve vpraanji:
1. Kolikno je tevilo doseenih tok na izpitu za 10 % najboljih tudentov?
2. Koliken del tudentov je doseglo 55 tok ali ve?
Osnovni pojmi:
Ranirna vrsta:enote z ustreznimi vrednostmi spremenljivke uredimo od tiste z
najmanjo vrednostjo do tiste z najvejo vrednostjo. Im. tudi ranirni razmik.
RangR: vsaki enot v ranirni vrsti priredimo zaporedno mesto.Primer:
Izpitne ocene (0-100) 10 tudentov so: 82, 78, 58, 68, 86, 59, 46, 45, 17, 92
Ranirna vrsta je:
xi 17 45 46 58 59 68 78 82 86 92 vrednosti
Ri 1 2 3 4 5 6 7 8 9 10 rangi
Kvantilni rangP: pove, na katerem delu celotne ranirne vrste / ranirnega razmika lei
doloena enota oz. koliki del celotne ranirne vrste / ranirnega razmika ima manje
vrednosti od dane vrednost. Izraunamo ga po naslednjem obrazcu:
Kvantil:vrednost spremenljivke, ki pripada doloenemu kvantilnemu rangu.
RP
5,0=
-
7/23/2019 opisna_statistika_01
12/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
12
Obiajni kvantili:
Mediana Me (P=0.5)
= kvantil, ki razdeli ranirno vrsto na dva dela.
= kvantil, ki pripada kvantilnemu ranguP=0.5.= vrednost, od katere ima enot manjo, pa vejo vrednost.
Kvartili Q1(P=0.25), Q2(P=0.5), Q3(P=0.75)
= kvantili, ki razdelijo ranirno vrsto na etrtine.
= npr. prvi kvartil je vrednost, ki pripada kvantilnemu ranguP=0.25.
= npr. prvi kvartil je vrednost, od katere ima 1/4 enot manjo, 3/4 pa vejo vrednost.
Decili D1(P=0.1), D2(P=0.2), ..., D9(P=0.9),
= kvantili, ki razdelijo ranirno vrsto na desetine.= npr. prvi decil je vrednost, ki pripada kvantilnemu rangu P=0.1.
= npr. prvi decil je vrednost, od katere ima 1/10 enot manjo, 9/10 enot pa vejo vrednost.
Centili C1(P=0.01), C2(P=0.02), ..., C99(P=0.99),
= kvantili, ki razdelijo ranirno vrsto na stotine.
= npr. prvi centil je vrednost, ki pripada kvantilnemu rangu P=0.01.
= npr. prvi centil je vrednost, od katere ima 1/100 enot manjo, 99/100 enot pa vejo
vrednost.Me=Q2=D5=C50
D1=C10
Q1=C25
Raunanje kvantilov
Koliko tok je dosegla polovica tudentov z najmanjim oz. najvejim tevilom tok? Iemo
vrednost, ki se nahaja tono na polovici med 5. in 6. enoto v ranirni vrsti. To je vrednost, ki
je tono na polovici med 59 in 68, torej 63.5.
-
7/23/2019 opisna_statistika_01
13/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
13
Takno vrednost natanno doloimo z linearno interpolacijo, ki upoteva razmerja med
rangi ter vrednostmi, ki rangom pripadajo. e jeRmed rangomaR0inR1, je ustreznixmed
vrednostimax0inx1.
Linearna interpolacija je seveda mogoa le pri intervanih in razmernostnih spremenljivkah.
Primer
1. Kakno oceno ima polovica tudentov, ki ima najnijo oceno? (Izraunajmo za navedene
ocene tudentov mediano, t.j. kvantil, ki pripada kvantilnemu ranguP=0.5.)
Rang lei med rangomaR0= 5 inR1= 6 in ustrezna vrednost (mediana) lei med vrednostimax0=
59 inx1= 68. Uporabimo linearno interpolacijo:
Ocena, ki razdeli ranirno vrsto na polovico oz. lei tono na polovici ranirne vrste, torej
mediana, je 63.5.
Polovica tudentov je dosegla manj kot 63.5 tok, polovica tudentov pa ve kot 63.5 tok.
2. Koliken del tudentov ima manj kot 50 tok? (Izraunajmo kvantilni rang za vrednost
50 (x=50).)
Vrednostx=50 lei med sosednjima vrednostimax0=46 inx1=58, ki mu pripadata rangaR0=3 in
R1=4. Uporabimo linearno interpolacijo:
Vrednost x=50 bi bila 3.33 enota v ranirni vrsti. Izraunajmo kvantilni rang (kaj to pomeni v
relativnem smislu):
Vrednost 50 je vrednost, za katero velja, da ima 28.3% enot manjo vrednost.28% tudentov ima manj kot 50 tok.
0 0
1 0 1 0
R R x x
R R x x
=
5.55.05.0105.0 =+=+= PNR
5635968
59
56
555
50
1
0
1
0
.xMex
x.
xx
xx
RR
RR
.
oo
===
=
=
33.34658
4650
34
31
0
1
0
=
=
=
R
R
xx xxRR RR oo
283.010
5.03.35.0=
=
=
N
RP
-
7/23/2019 opisna_statistika_01
14/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
14
Raunamo torej lahko:
1) Vrednost, ki pripada doloenemu kvantilnemu rangu - katera vrednost lei na
doloenem mestu v ranirni vrsti.
xp= ?Pje podan; izPinNizraunamoR; z linearno interpolacijo doloimox, ki pripadaR.
2) Kvantilni rang za doloeno vrednost - na katerem mestu v ranirni vrsti lei doloena
vrednost.
P = ?
xje podan; z linearno interpolacijo doloimoRza x, iz R in N izraunamoP.
2.3.2 Srednje vrednosti
Pregled vrednosti spremenljivke dobimo z ranirno vrsto ali - v primeru vejega tevila enot -
s frekvenno porazdelitvijo. Pri tem nas zanima, ali iz podatkov lahko razberemo neko
reprezentativno vrednost spremenljivke in jo im. srednja vrednost. Ta vrednost naj bila
najbolj tipina, obiajna, reprezentativna, normalna, priakovana, pogosta ...
Ostale vrednosti se od srednje vrednosti nekoliko odklanjajo, variirajo. Bolj kot se posamezne
vrednosti odklanjajo od srednje vrednosti, tem slabe ta srednja vrednost predstavlja
spremenljivko.
Obstaja ve vrst srednjih vrednosti. Mi bomo spoznali naslednje: medianaMe
modusMo
aritmetina sredina
2.3.2.1Mediana
Mediana je tista vrednost spremenljivke, od katere je ravno toliko manjih vrednosti od nje,
kolikor jih je vejih od nje. Torej tista vrednosti, ki razdeli ranirno vrsto na polovico, t.j.
kvantil, ki pripada kvantilnemu ranguP=0.5.
Mediana je primerna srednja vrednost za ordinalne spremenljivke.
Raunamo jo iz ranirne vrste.
-
7/23/2019 opisna_statistika_01
15/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
15
V ranirni vrsti z lihim tevilomenotN = 2m + 1je medianaxm+1vrednost v ranirni
vrsti.
Primer: 3, 6, 7, 8, 10, 13, 14
Ker je N=7, je mediana na 4. mestu (Me=x3+1), torej Me = 8. V ranirni vrsti s sodim tevilom enotN = 2mje mediana vrednost, ki je na sredini med
srednjima dvema vrednostima, torejMe= (xm+xm+1)/2.
Primer: 3, 3, 8, 10, 11, 14
Ker je N=6, je mediana med 3. in 4. vrednostjo, torej Me=(8+10)/2=9.
2.3.2.2 Modus
Modus je edina srednja vrednost, ki je primerna za nominalne spremenljivke.
Spremenljivka z diskretnimi vrednostmi
Modus = Vrednost spremenljivke, ki se najpogosteje pojavlja.
Primeri:
2, 3, 4, 4, 4, 5, 7, 9 Mo=4
2, 2, 5, 5, 5, 6, 7, 7, 7, 8, 12 Mo1=5 Mo2=7 Modusov je lahko ve2, 3, 7, 9, 12 Modusa ni.
Spremenljivka z zveznimi vrednostmi
Modus = Vrednost spremenljivke, okoli katere se ostale vrednosti najbolj gostijo.
Mo
Globalni in lokalni modusi
-
7/23/2019 opisna_statistika_01
16/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
16
Globalni modus
Pravi modus je globalni, to je tista vrednost spremenljivke, ki se najpogostejepojavlja oz.okoli katere se ostale vrednosti najboljgostijo.
Lokalni modusLokalni modus je tista vrednost spremenljivke, ki se pojavlja pogosteje kot njej blinjevrednosti oz. okoli katere se ostale vrednosti gostijo. To ni pravi modus.
Primeri:2, 2, 3, 4, 4, 4, 5, 7, 7, 9 Globalni modus: 4
Lokalna modusa: 2 in 72, 2, 5, 5, 5, 6, 7, 7, 7, 8, 12 Dva globalna modusa: 5 in 72, 3, 4, 4, 4, 5, 5, 7, 9 Globalni modus: 4
Lokalnega modusa ni
Primer: ve lokalnihmodusov in en globalni modus pri spremenljivki z zveznimi vrednostmi
Bimodalna porazdelitev
Mo1 Mo2
Polimodalna porazdelitev
Mo1 Mo2 Mo3 Mo4
Primer: ve globalnihmodusov pri spremenljivki z zveznimi vrednostmi
Mo1 Mo2
-
7/23/2019 opisna_statistika_01
17/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
17
Izraun modusa iz frekvenne porazdelitve
e modus razumemo kot vrednost spremenljivke, okoli katere se vrednosti najbolj gostijo, ga
lahko najlaje doloamo iz frekvenne porazdelitve. Razred z najvejo frekvenco vsebuje
modus, zato ga imenujemo modalni razred.
Prvi pribliek modusu je lahko sredina modalnega razreda.
Natanneje modus doloimo s pomojo naslednjega obrazca:
xo,min ... spodnja meja modalnega razreda
d... irina razreda
fo... frekvenca modalnega razreda
f+1... frekvenca razreda za modalnim razredom
f-1... frekvenca razreda pred modalnim razredom
Primer: Frekvenna porazdelitev prikazuje tevilo lanov 50 gospodinjstev:
Iz frekvenne porazdelitve razberemo potrebne podatke za izraun modusa:
x0,min= 2.5, d = 2,f0= 21, f-1= 8, f+1= 12
Najve gospodinjstev ima 3.68 lanov.
Grafino pa si modus ponazorimo takole:
tevilo lanov gospodinjstva
tevilogospodinjstev
0
5
10
15
20
25
0.5 2.5 4.5 6.5 8.5 10.5Mo
0 10,
0 1 12min
+
f fMo = x +d
f f f
68.3128212
82125.2
2 11
1min,0 =
+=
+=+
Mofff
ffdxMo
o
o
-
7/23/2019 opisna_statistika_01
18/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
18
2.3.2.3 Arimetina sredina
Aritmetina sredina ali povpreje je vsota vseh vrednosti, deljena s tevilom enot v populaciji.
Primerna je za intervalne in razmernostne, priblino normalno porazdeljene spremenljivke.
... aritmetina sredina
xi... vrednost spremenljivkeXna i-ti enoti
N... tevilo vseh enot
... sumacijski znak Setej vrednosti spremenljivkeX,
ko itee od 1doN, torej za vse enote.
Primer:
Aritmetino sredino lahko definiramo kot vrednost, za katero velja:
Zgornji obrazec za izraun aritmetine sredine velja, kadar imamo podatke, ki niso urejeni v
frekvenno porazdelitev.
e pa imamo podatke, ki so urejeni v frekvenno porazdelitev, uporabljamo naslednji
obrazec:
... aritmetina sredina
xi... reprezentativna vrednost (obiajno sredina) i-tega razreda spremenljivkeX
fi... frekvenca za i-ti razred spremenljivkeX(t. enot, ki so v tem razredu)
k... tevilo vseh razredov v frekvenni porazdelitviN... tevilo vseh enot
... sumacijski znak Setej produkt reprezentativne vrednosti razreda
spremenljivkeX in frekvence, ko itee od 1do k, torej za vse vrednosti.
Pozor:V primeru, da uporabimo kot reprezentativno vrednost sredino razreda in ne
aritmetine sredine vrednosti v razredu (ki obiajno ni na voljo, razen e je v vsakem razredu
le ena vrednost), z zgornjim izraunom dobimo le pribliek aritmetine sredine vseh
vrednosti.
1 21
1 1( ... )
N
i Ni
x x x xN N
=
= = + + +
35
54321
5,4,3,2,1
=++++
=
=
=N
iix
1
0)(
1 1 2 21
1 1( ... )
k
i i k k i
f x f x f x f xN N
=
= = + + +
-
7/23/2019 opisna_statistika_01
19/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
19
Primer: frekvenna porazdelitev, ki prikazuje tevilo lanov gospodinjstva.
2.3.2.4 Odnos med Me in .
Za unimodalne, simetrine porazdelitve velja: = Me = Mo.
Za unimodalne porazdelitve, asimetrine v levo, velja: < Me.
Za unimodalne porazdelitve, asimetrine v desno, velja: > Me.
Me Mo Mo Me
=
===k
iiixf
N 156.4228
50
11
Gospodinjstva imajo v povpreju 4.56
lanov gospodinjstva.
-
7/23/2019 opisna_statistika_01
20/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
20
2.3.2.5 Katero srednjo vrednost izbrati?
Drugi kriteriji:
Modus:
- e imamo spremenljivko, ki je samo nominalna.
- e je porazdelitev bimodalna ali polimodalna.
Mediana:
- e imamo spremenljivko, ki je samo ordinalna.
- e kakna enota mono izstopa od ostalih enot oz. je porazdelitev izrazito asimetrina (Pri
izraunu mediane ekstremnih vrednosti namre ne upotevamo.)
Aritmetina sredina:
- e je spremenljivka tevilska in priblino normalno porazdeljena.
- e bomo srednjo vrednost potrebovali kot osnovo za nadaljnje izraune.
Modus Mediana Aritmetinasredina
Nominalna + - -Ordinalna + + -Intervalna + + +Razmernostna + + +
-
7/23/2019 opisna_statistika_01
21/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
21
2.3.3 Mere variabilnosti
Primer: IK za 2 razreda uencev
0
2
4
6
8
10
Intelegneni kvocient
80 90 100 110 120 130 140
Letonji razredLanski razred
1 = 2= 110
Im. tudi mere razprenosti.
Variabilnost (razprenost, variacija) govori o tem:
koliko so podatki variabilni (koliko so vrednosti razline med seboj),
koliko se vrednosti odklanjajo od srednje vrednosti,
koliko se vrednosti razlikujejo od srednje vrednosti.
2.3.3.1 Absolutne mere variabilnosti
Variacijski razmik xmax... najveja vrednost
xmin... najmanja vrednost
Razlika med najvejo in najmanjo vrednostjo.
Veja kot je variabilnost, veji je variacijski razmik.
Kvartilni odklon , kjer sta Q3in Q1kvartila.
Polovica razdalje med prvim in tretjim kvartilom.
Meri variabilnost okoli mediane. Veja kot je variabilnost, veji je kvartilni odklon.
max min
R x x=
3 1
2
Q QQ
=
-
7/23/2019 opisna_statistika_01
22/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
22
Povpreni absolutni odklon odMein
xi... vrednost i-te enoteN ... tevilo enot
e so podatki urejeni v frekvenno porazdelitev ...xi... reprezentativna vrednost (obiajno sredina) i-tega
razreda spremenljivkeXk... tevilo vseh razredov v frekvenni porazdelitvi
fi... frekvenca za i-ti razred
Pozor:V primeru, ko vse vrednosti v razredu nisoenake reprezentativni vrednosti razreda (kar se zgodi le,e je v vsakem razredu le ena vrednost, ki je enakareprezentativni), z zgornjim izraunom dobimo le
pribliek absolutnega odklona od mediane oz.
aritmetine sredine.
Povpreni odklon vrednosti od srednje vrednosti (Meoz. ). Meri variabilnost okoli aritmetine sredine () oz. mediane (Me). Veja kot je variabilnost, veji je povpreni absolutni odklon bolj se posamezne
vrednosti odklanjajo od srednje vrednosti.
Varianca in standardni odklon
2 ... varianca ... standardni odklon ... aritmetina sredina
N ... t. enotxi ... vrednost sprem.Xza i-to enoto(xi-) ... odklon od aritmetine sredine za i-to enoto
Standarden (tipien, obiajen) odklon vrednosti od aritmetine sredine. Meri variabilnost okoli aritmetine sredine. Veja kot je variabilnost, veji je standardni odklon bolj se posamezne vrednosti
odklanjajo (razlikujejo) od aritmetine sredine.
Varianca in standardni odklon e so podatki urejeni v frekvenno porazdelitev
2... varianca
... standardni odklon... aritmetina sredinaN ... t. enotxi ... reprezentativna vrednost (obiajno sredina) i-tega razreda
spremenljivkeXk ...tevilo razredovfi ... frekvenca i-tega razreda
(xi-) ... odklon od aritmetine sredine
Pozor:V primeru, ko vse vrednosti v razredu niso enake reprezentativni vrednosti razreda
(kar se zgodi le, e je v vsakem razredu le ena vrednost, ki je enaka reprezentativni), zzgornjim izraunom dobimo le pribliek variance oz. standardnega odklona.
1
1
1
1
N
ii
N
Me ii
AD xN
AD x MeN
=
=
=
=
=
=
=
=
k
iiiiMe
i
k
iii
fMexNAD
fxN
AD
1
1
2 2 2 2
1 1
1 1( )
N N
i ii i
x xN N
= =
= =
2 =
i
k
ii fx
N==
1
22 )(1
2 =
-
7/23/2019 opisna_statistika_01
23/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
23
Primer 1SpremenljivkaX:tevilo ur gledanja TV na teden.Enota: oseba.
Opazovane osebe v povpreju gledajo TV 15 ur na teden. Standardni odklon pa je 3,69 ure, karpomeni, da se tevilo ur gledanja TV pri posameznikih od povpreja standardno odklanja zaslabe 4 ure.
Primer 2SpremenljivkaX: tevilolanov gospodinjstva.Enota: 1 gospodinjstvo.
Gospodinjstva imajo v povpreju 4.56 lanov
gospodinjstva. tevilo lanov posameznihgospodinjstev pa se od povpreja standardnoodklanja za 2,15 lana.
69,36,13
6,135
68)(
1
155
751
2
1
22
1
===
===
===
=
=
N
ii
N
i i
xN
xN
15,261,4
61,450
32,230)(
1
56.4228
50
11
2
1
22
1
===
===
===
=
=
N
iii
k
i
ii
fxN
xf
N
-
7/23/2019 opisna_statistika_01
24/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
24
2.3.3.2 Relativne mere variabilnosti
Absolutne mere variabilnosti lahko le redko primerjamo med seboj. Zato raunamo relativnemere variabilnosti, ki so absolutne mere, deljene z ustrezno srednjo vrednostjo.POZOR: Relativne mere variabilnosti lahko uporabljamo le pri razmernostnihspremenljivkah
vrednostsrednja
meraabsolutnamerarelativna =
Kdaj jih uporabljamo?- e elimo primerjati dve porazdelitvi z zelo razlinima srednjima vrednostima.- e elimo primerjati dve spremenljivki, kjer so uporabljene razline merske enote.
Relativni variacijski razmik:
Relativni kvartilni odklon:
Relativni povpreni absolutni odklon od mediane oz. aritm. sredine:
Relativni standardni odklon koeficient variacije:
Primer 1V neki raziskavi so ocenili, da je povpreno tevilo ur gledanje televizije na teden za enske
Z=10in za moke M=13. Standardna odklona pa sta bila enaka, in sicer Z= M= 6. Vkaterem primeru so relativno gledano razlike med osebami veje? Kdo se bolj razlikuje medseboj, moki ali enske?
46,013
66,0
10
6======
M
MM
Z
ZZ KVKV
Podatki kaejo, da v povpreju moki gledajo za 3 ure ve televizijo na teden kot enske.Razlike v gledanju pa so med enskami veje kot med mokimi, ker je relativna razprenost prienskah veja.
Primer 2Na izpitu iz Osnov programiranja je bilo povpreno tevilo tok (od 100 monih) 50, standardniodklon pa 10. Pri izpitu iz Statistike pa je bilo povpreno tevilo tok 16 (od 30 monih),standardni odklon pa 4.V katerem primeru so razlike med tokami veje?
25,016
42,0
50
10======
S
SS
OP
OPOP KVKV
Razlike med doseenimi tokami so veje pri izpitu iz Statistike.
minmax
minmax 2)(
xx
xx
+
e
QQ
213
AD
Me
ADMe
=KV
-
7/23/2019 opisna_statistika_01
25/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
25
2.3.3.3 Variabilnost pri normalni porazdelitvi
Denimo, da se spremenljivkaXporazdeljuje normalnoz aritmetino sredino in standardnimodklonom . Tedaj velja, da v razmiku:
[- ; + ]lei 68.3% enot, [- 2; + 2]lei 95,4% enot, [- 3; + 3]lei 99,7% enot.
-3 -2 -1 +1 +2 +3
68,3%
95,4%
99,7%
PrimerDenimo, da se inteligenni kvocient na populaciji tudentov porazdeljuje priblino normalno z
aritmetino sredino =105in standardnim odklonom =15.Potem vemo, da ima 95,4% tudentov inteligenni kvocient v intervalu [75; 135].[- 2; + 2]=[105 - 215; 105 + 215]=[75; 135]
-3 -2 -1 +1 +2 +360 75 90 105 120 135 150
68,3%
95,4%
99,7%
2.3.4 Mere asimetrije in sploenosti
e je spremenljivka priblino normalno porazdeljena, potem jo statistini karakteristikiaritmetina sredina in standardni odklon zelo dobro opisujeta. V primeru unimodalne
-
7/23/2019 opisna_statistika_01
26/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
26
porazdelitve spremenljivke, ki pa je bolj ali manj asimetrina in bolj ali manj sploena(koniasta), pa je potrebno izraunati e stopnjo asimetrije in sploenosti (koniavosti). Tolahko na ve nainov merimo s koeficienti asimetrije in sploenosti.
0
5
10
15
20
Poligon
tevilo lanov gospodinjstva
tevilogospodinjstev
-0.5 1.5 3.5 5.5 7.5 9.5 11.5
0
5
10
15
20
Poligon
tevilo lanov gospodinjstva
tevilogospodinjstev
-0.5 1.5 3.5 5.5 7.5 9.5
Na katerem poligonu in na kateri krivulji (modri-polni ali zeleni-rtkani) je sploenost veja?
-
7/23/2019 opisna_statistika_01
27/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
27
Koeficienta asimetrije in sploenosti s centralnimi momenti
Ve razlinih mer, npr. koeficient asimetrijeg1in koeficient sploenostig2(razvil ju je KarlPearson), izraunana s pomojo t. im. centralnih momentov.
l-ti centralni moment je:
Gre za razlike med posameznimi vrednostmi in aritmetino sredino na l-to potenco. Meriasimetrije in sploenosti torej upotevata odklone vrednosti od srednje vrednosti.
m1=0 ... ker je setevek vseh odklonov (na 1. potenco) enak 0.m2=
2 ... ker odklone kvadriramo, je to ravno varianca.
2.3.4.1 Koeficient asimetrije (angl. skewness)
Porazdelitev spremenljivke je lahko simetrina ali asimetrina.
Simetrina p.- vrednosti se enako odklanjajo od srednje vrednosti navzdol in navzgor.
Asimetrina p. v levo e se rep porazdelitve vlee v levo stran, v negativno smer. Veinaenot ima visoke vrednosti in malo enot ima (ekstremno) nizke vrednosti. Aritm. sredina jemanja od mediane, ker nizke vrednosti zmanjujejo aritmetino sredino.
Asimetrina p. v desno- e se rep porazdelitve vlee v desno stran, v pozitivno smer. Veinaenot ima majhne vrednosti in malo enot ima (ekstremno) visoke vrednosti. Aritm. sredina je
veja od mediane, ker visoke vrednosti poveujejo aritmetino sredino.
g1 > 0... asimetrija v desnog1 = 0... simetrinag1 < 0... asimetrina v levo
Mo Me
g1 > 0
Me Mo
g1< 0
11 ( )
N
ll i
im x
N ==
( )
3 3 3
3 1 1 11 3 3 3 3
22 2
1
1 1 1( ) ( ) ( )
1( )
N N N
i i ii i i
N
ii
x x xm N N N
gm
xN
= = =
=
= = = =
-
7/23/2019 opisna_statistika_01
28/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
28
2.3.4.2 Koeficient sploenosti (angl. kurtosis)
Porazdelitev spremenljivke je koniasta, sploena ali normalno sploena/koniasta.
Koniasta p. bolj koniasta od normalne porazdelitve. Za porazdelitev sta znailna daljarepa in oji osrednji del. Z naraanjem vrednosti frekvenca zelo poasi naraa do doloenevrednosti, ko zane naenkrat hitro naraati in hitro dosee vrh. Z nadaljnjimi vrednostmi pafrekvenca najprej hitro upade in nato poasi upada do ekstremno visokih vrednosti.
Sploena p. bolj sploena od normalne porazdelitve. Za porazdelitev sta znailna krajarepa ter debeleji osrednji del. Frekvenca zane naraati e pri nijih vrednostih in z vijimivrednostmi enakomerno naraa, dokler ne dosee vrha. Nato pa z vijimi vrednostmi poasienakomerno upada.
Zelo ekstremne vrednosti in/ali vrednosti isto na sredini se pojavljajo pri koniastiporazdelitvi pogosteje kot pri sploeni. Vrednosti med sredino in ekstremnimi vrednostmi pase pogosteje pojavljajo pri sploeni porazdelitvi.
Lahko tudi reemo, da je variabilnost pri sploeni porazdelitvi predvsem posledica velikegatevila srednje-velikih razlik (med vrednostmi), pri koniasti pa manjega tevila zelo velikihrazlik.
g2 > 0koniastag2 = 0normalnag2 < 0sploena
4 4 4
1 1 142 2 2 2 4
2 22
1
1 1 1( ) ( ) ( )
3 3 3 31 ( )( ( ) )
N N N
i i ii i i
N
ii
x x xm N N N
gm
xN
= = =
=
= = = =
-
7/23/2019 opisna_statistika_01
29/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
29
Primer: anketa med tudenti FDV (2002)
Koef. asimetrije 2.95 ... asimetrija v desnoKoef. sploenosti 5.97 ... koniasto
Koef. asimetrije 0.21 ... simetrinaKoef. sploenosti -0.74 ... normalnosploena
2.3.5 Standardizacija
Postopek standardizacije
Vsaki vrednostixispremenljivkeXodtejemo njeno aritmetino sredino xin delimo z njenimstandardnim odklonom x:
Vrednostizi imenujemo standardizirane vrednosti. SpremenljivkoZ, ki ima vrednostizi, paimenujemo standardizirana spremenljivkaZ.
Standardizirana vrednostziza vrednostxipredstavlja relativni odklon od aritmetine sredine.
Vrednosti razlinih spremenljivk v splonem niso primerljive. e pa spremenljivkistandardiziramo, lahko primerjamo njihove standardizirane vrednosti.
Znailnosti standardizirane spremenljivke in njenih vrednosti1. Standardizirana spremenljivkaZima aritmetino sredino enako 0 (Z=0) in standardni
odklon enak 1 (Z=1).
Dokaz (izpeljava):
i Xi
X
xz
=
1 1 1
22 2 2 2 2 2
2 21 1 1 1 1
1 1 1 1 1 1( ) 0 0
1 1 1 1 1 1 1( ) ( 0) ( ) ( ) 1
N N Ni X
Z i i Xi i iX X X
N N N N Ni X
Z i Z i i i X Xi i i i iX X X
xz x
N N N N
xz z z x
N N N N N
= = =
= = = = =
= = = = =
= = = = = = =
-
7/23/2019 opisna_statistika_01
30/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
30
2. e je spremenljivkaXporazdeljena priblino normalno, standardizirana vrednost doloamesto enote v populaciji:
Predznak pove, ali je enota nad (+) ali pod (-) povprejem. Absolutna vrednost pove, za koliko se vrednost odklanja od aritmetine sredine v
relativnem smislu za koliko standardnih odklonov se odklanja
Primer:Tea in viina dojenkov, starih 9 mesecev
Lucija: 68 cm, 8 kg Matev: 74 cm, 10.2 kg
Kateri dojenek je veji glede na ostale otroke istega spola in starosti?Deklice Deki
Povprena viina = 70 cm = 72 cmStandardni odklon = 2.5 cm = 2.5 cm
Povprena tea = 8.6 kg = 9.4 kgStandardni odklon = 0.8 kg = 0.8 kg
Standardizirana viina
Standardizirana tea
Lucija je manja in laja v primerjavi z ostalimi deklicami svoje starosti, medtem ko je Matevveji in teji v primerjavi z ostalimi deki svoje starosti. Vendar ne odstopata ekstremno. Npr.Lucija je manja za 0.8 standardnega odklona, torej spada med 68.3% deklic svoje starosti, ki sonajblije povpreju (ob predpostavki, da se spremenljivka tea deklicporazdeljuje normalno).
18,0
4,92,1075,0
8,0
6,88
8,05,2
72748,0
5,2
7068
=
=
==
=
=
=
=
==
=
=
MM
LL
MM
LL
xz
xz
xz
xz
-
7/23/2019 opisna_statistika_01
31/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
31
2.4 VAJE
2.4.1 Urejanje in prikazovanje podatkov
1. Ferligoj (1994): Naloge iz statistike, naloge: 3.1 3.6.
2. Opiite naslednja dva grafa:- razberite, kaj je enota in kaj je spremenljivka,- doloite mersko lestvico spremenljivke,- opiite obliko porazdelitev (asimetrija, sploenost/koniavost, modalnost).
10,00 12,00 14,00 16,00 18,00 20,00 22,00
tevilo ucencev O na enega ucitelja
0
2
4
6
8
Frekvenca
-tevilo
drav
Mean = 15,1958Std. Dev. = 3,48231N = 24
Izobraevalni kadri v osnovnem olstvu
0 20 40 60 80 100
% 18-letnikov, ki so vkljuceni v olanje
0
2
4
6
8
10
Frekvenca
-tevilo
drav
Mean = 73,084
Std. Dev. = 14,01317N = 25
Vkljucenost mladih v olanje v EU dravah
-
7/23/2019 opisna_statistika_01
32/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
32
3. V nadaljevanju so grafino predstavljene porazdelitve dveh razmernostnih spremenljivk. Za vsakospremenljivko je narisan histogram za ve nainov zdruevanja vrednosti v razrede. Za vsakospremenljivko odgovorite na naslednja vpraanja:
- Kaj je spremenljivka?- Kaj je enota in kolikno je tevilo enot?
- Kako se spreminja oblika porazdelitve, e spreminjamo tevilo (in posledino irino) razredov?Primer 1: Kadri v osnovnoolskem izobraevanju Povpreno tevilo uencev na enega uitelja v O za25 drav lanic EU
Primer 2: tevilo avtomobilov na 1000 prebivalcev za25 drav lanic EU
tevilo osebnih avtomobilov na 1000 prebivalcev
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,01 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
25 100,0
247
259
265
287
295
331
340
351
357
371
405
422
424
447
453459
460
463
490
495
508
541
558
590
643
Frekvenca(tevilodrav)
Relativnafrekvenca
tevilo uencev O na 1 uitelja
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,0
2 8,0
1 4,0
1 4,0
1 4,0
1 4,0
1 4,01 4,0
1 4,0
1 4,0
2 8,0
1 4,0
2 8,0
1 4,0
1 4,0
1 4,0
25 100,0
10,60
10,80
10,90
11,00
11,20
11,60
12,40
12,50
12,60
12,80
13,10
14,40
14,6015,80
16,90
17,00
18,90
19,10
19,40
19,50
19,90
20,10
Frekvenca(tevilodrav)
Relativnafrekvenca
-
7/23/2019 opisna_statistika_01
33/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
33
0 5 10 15 20 25
tevilo ucencev O na 1 ucitelja
0
2
4
6
8
10
12
Frekvenca
Histogram: Kadri v osnovnoolskem izobraevanju
0 5 10 15 20 25
tevilo ucencev O na 1 ucitelja
0
2
4
6
8
Frekvenca
Histogram: Kadri v osnovnoolskem izobraevanju
0 5 10 15 20 25
tevilo ucencev O na 1 ucitelja
0
1
2
3
4
5
6
Frekvenca
Histogram: Kadri v osnovnoolskem izobraevanju
0 5 10 15 20 25
tevilo ucencev O na 1 ucitelja
0
1
2
3
4
5
Frekvenca
Histogram: Kadri v osnovnoolskem izobraevanju
-
7/23/2019 opisna_statistika_01
34/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
34
200 300 400 500 600 700
tevilo osebnih avtomobilov na 1000prebivalcev
0
1
2
3
4
Frekvenca
-tevilo
drav
Histogram: tevilo osebnih avtomobilov v dravah EU
200 300 400 500 600 700tevilo osebnih avtomobilov na 1000
prebivalcev
0
1
2
3
4
5
Frekvenca
-tevilo
drav
Histogram: tevilo osebnih avtomobilov v dravah EU
100 200 300 400 500 600 700tevilo osebnih avtomobilov na 1000
prebivalcev
0
2
4
6
8
10
12
14
Frekvenca
-tevilo
drav
Histogram: tevilo osebnih avtomobilov v dravah EU
200 300 400 500 600 700
tevilo osebnih avtomobilov na 1000prebivalcev
0
2
4
6
8
10
Frekvenca
-tevilo
drav
Histogram: tevilo osebnih avtomobilov v dravah EU
-
7/23/2019 opisna_statistika_01
35/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
35
2.4.2 Kvantili
1. Ferligoj (1994): Naloge iz statistike, naloge: 4.1, 4.4.
2. Primer izpitnega vpraanja.Podane so starosti 7 tudentov: 22, 19, 21, 24, 19, 18, 23. Pr vi kvartil ima vrednost:
a) 18.5b) 19c) 19.5d) 25%
2.4.3 Srednje vrednosti
1. Ferligoj (1994): Naloge iz statistike, naloge: 4.6, 4.7, 4.8, 4.9 (samo modus), 4.10, 4.11, 4.12(samo modus), 4.13 (a, b samo frekvenna porazdelitev), 4.17, 4.20.
2. Neka multinacionalna tovarna avtomobilov na leto proizvede naslednje tevilo avtomobilov (v10.000) v svojih obratih v sedmih dravah:
6, 8, 6, 9, 11, 5, 60a) Kaj je spremenljivka in kaj so enote?
b) Kakna je merska lestvica spremenljivke?c) Nariite histogram, poligon in ogivo.d) Kolikno je celotno tevilo proizvedenih avtomobilov v tej tovarni?e) Kolikni so arimetina sredina, mediana, modus? Oznaite te tri sredine naf) histogramu.g) Kaj lahko na osnovi grafov reete o asimetriji te porazdelitve?h) Za neko drugo tovarno, ki izdeluje avtomobile v 10-ih dravah, so podatki za letno tevilo proizvedenih
avtomobilov (v 10.000 naslednji): 7.8 v povpreju na dravo, mediana je 6.5 in modus 5.0. Kakno je
skupno tevilo proizvedenih avtomobilov v 10-ih dravah?
3. Da bi videli, ali so upraviene izjave o vzdrljivosti baterij, so na Zvezi potronikovtestirali vzorec 20-ih baterij. Zabeleeni so podatki o ivljenjski dobi (v minutah) tehbaterij:
a) Kaj je spremenljivka in kaj so enote?b) Kakna je merska lestvica spremenljivke?c) Vrednosti razporedite v frekvenno porazdelitev z razredi, irokimi 5 minutd) Relativno frekvenno porazdelitev grafino predstavite.
e) Na osnovi frekvenne porazdelitve izraunajte modus porazdelitve.f) Vrednosti razporedite v frekvenno porazdelitev s tremi razredi, pri emer naj bodo srednje vrednosti
razredov 60, 70 in 80 minut. Ponovno grafino predstavite porazdelitev in izraunajte modus. Primerjajterezultat dveh razlinih grupiranj.
4. V manjem podjetju je prejnji mesec 5 zaposlenih na najnijem delovnem mestu dobilo 2.500 EURbruto, dve zaposleni osebi na vijem delovnem mestu 6.000 EUR bruto ter direktor podjetja 25.500EUR bruto.a) Kaj je spremenljivka in kaj so enote?
b) Kakna je merska lestvica spremenljivke?c) Kolikna je bila povprena bruto plaa v tem podjetju?d) Koliko zaposlenih zaslui manj od povpreja?e) Kolikna je mediana za bruto plao?f) Koliken je modus za bruto plao?g) Katera srednja vrednost je najprimerneja za ponazoritev viine bruto plae v tem podjetju?
58 58,4 59,4 64,2 64,9 65,1 65,4 67,8 68 73,3 74,7 74,9 75,1 75,4 76 76 76,6 76,7 77,6 81,3
-
7/23/2019 opisna_statistika_01
36/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
36
5. Predstavljene so tiri frekvenne porazdelitve neke spremenljivke (negrupirana porazdelitev,porazdelitev z razredi irine 2 enoti, z razredi irine 3 enote ter razredi irine 4 enote). Za vsakoporazdelitev izraunajte modus in jih primerjajte. Kaj se dogaja, ko vrednosti zdruujemo v razrede?
6. Izraunajte aritmetino sredino za naslednjih pet vrednosti: 3, 7, 8, 12, 15.a) Za vsako vrednost izraunajte (pozitiven ali negativen) odklon od aritmetine sredine, t.j.xi-. Izraunajte
povpreje teh odklonov.b) Zamislite si nek poljuben niz tevil. Izraunajte njihovo aritmetino sredino in nato povpreni odklon od
aritmetine sredine.c) Dokaite, da je za vsak moen niz n-tih vrednosti povpreni odklon od aritmetine sredine enak ni.
7. kotski vic: e se kot preseli iz kotske v Anglijo, se v obeh regijah zvia povpreni inteligennikvocient. V katerem primeru je to mogoe (ali je nemogoe)? (Kakno mora biti povpreje v vsakiregiji in kakna mora biti vrednost kota v primerjavi s povprejem?)
x i fi x i fi x i fi x i fi
22 123 124 025 126 327 1328 1229 830 831 632 433 234 135 136 037 0
Negrupirani
podatki
Grupirani
podatki d=2
Grupirani
podatki d=3
Grupirani
podatki d=3
34-37 2
30-33 20
26-29 36
22-25 3
34-36
2
17
28
12
2
22-24
25-27
28-30
31-3314
6
2
0
2
1
16
20
30-31
32-33
34-35
36-37
22-23
24-25
26-27
28-29
-
7/23/2019 opisna_statistika_01
37/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
37
2.4.4 Mere variabilnosti, asimetrije, sploenosti, standardizacija
1. Ferligoj (1994): Naloge iz statistike: 5.1, 5.2, 5.7, 5.9, 5.14.
2. Podani so podatki o viini inteligennega kvocienta za nek olski razred. Odgovorite na spodnjavpraanja:
a) Kaj je enota analize in kaj spremenljivka? Kakna je merska lestvica spremenljivke?b) Za dane podatke izraunajte vse absolutne in relativne mere variabilnosti?c) Interpretirajte izraunani standardni odklon.d) Podatke uredite v frekvenno porazdelitev s 5 razredi in jo grafino predstavite s histogramom in
poligonom. Ocenite oblike porazdelitve iz grafine predstavitve.e) Izraunajte koeficienta asimetrije in sploenosti s pomojo centralnih momentov in ju interpretirajte.
Ali se rezultat ujema z ugotovitvijo v toki d)?f) Kaken inteligenni kvocient bi imelo 95.4% vseh uencev, e bi bila porazdelitev popolnoma
normalna?
3. Za skupino starejih oseb, obolelih s Parkinsovo boleznijo, je podan podatek o starosti ob nastopubolezni:
67 68 60 64 68 6368 70 63 70 68 6970 69 69 69 69 6862 70 70 64 66 6666 69 67 67 70 67
a) Izraunajte koeficient asimetrije za to porazdelitev in ga interpretirajte.b) Izraunajte koeficient sploenosti za to porazdelitev in ga interpretirajte.c) Nariite histogram. Ali grafina predstavitev vrednosti potrjuje zgornje ugotovitve?d) Gospod X je imel ob nastopu bolezni 64.2 leti. S pomojo standardizacije ugotovite, ali je v
primerjavi s povprejem za to boleznijo zbolel mlad ali star.
77 87 92 97 97 97 102 102 102 102 102 107 107 107 107 107 112
112 112 112 112 112 117 117 117 117 122 122 122 127 127 132 132 142
-
7/23/2019 opisna_statistika_01
38/38
Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010
4. Primeri izpitnih vpraanj
Dane so vrednosti: 10, 8, 14, 14, 16, 10. Aritmetina sredina danih vrednosti je 12. Varianca je:a) 2,83
b) 3,27c) 0d) 8
68.3% vseh vrednosti standardizirane normalno porazdeljene sluajne spremenljivkea) lei na intervalu od -1 do +1
b) lei na intervalu od -3 do +3c) je samo pozitivnihd) lei na intervalu od minus do plus neskonno
e je koeficient asimetrije, izraunan s centralnimi momenti, enak 2.05, je porazdelitev spremenljivkea) sploena
b) asimetrina v levoc) koniasta
d) asimetrina v desno
e elimo primerjati variabilnost ocen pri dveh predmetih, moramo primerjatia) normalizirane vrednost
b) koeficienta variacijec) najmanji vrednostid) asimetrini sredini
e ima enota standardizirano vrednost 1.3, pomeni, da imaa) vrednost, ki je veja od aritmetine sredine,
b) vrednost, ki je manja od aritmetine sredine,c) vrednost, ki je 1.3-krat veja od aritmetine sredine,d) koniasto porazdelitev