opisna_statistika_01

download opisna_statistika_01

of 38

Transcript of opisna_statistika_01

  • 7/23/2019 opisna_statistika_01

    1/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    1

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna:

    OSNOVE STATISTIKE NA PROSOJNICAH

    tudijsko gradivo pri predmetu Statistika. Fakulteta za drubene vede, Univerza v Ljubljani

    Ljubljana, 2010

    2 OPISNA STATISTIKA

    2.1 KORAKI STATISTINE ANALIZE ............................................................................... 22.2 UREJANJE IN PRIKAZOVANJE PODATKOV ............................................................ 2

    2.2.1 Frekvenne tabele in grafi za nominalne in ordinalne spremenljivke ........................... 22.2.2 Frekvenne tabele in grafi za intervalne in razmernostne spremenljivke ..................... 4

    2.3 OSNOVNI STATISTINI IZRAUNI ......................................................................... 112.3.1 Kvantili ........................................................................................................................ 112.3.2 Srednje vrednosti ......................................................................................................... 14

    2.3.2.1 Mediana ..................................................................................................... 142.3.2.2 Modus ................................................................................................................... 152.3.2.3 Arimetina sredina ............................................................................................... 182.3.2.4 Odnos med Me in . ............................................................................................. 192.3.2.5 Katero srednjo vrednost izbrati? .......................................................................... 20

    2.3.3 Mere variabilnosti ....................................................................................................... 212.3.3.1 Absolutne mere variabilnosti ............................................................................... 212.3.3.2 Relativne mere variabilnosti ................................................................................. 242.3.3.3 Variabilnost pri normalni porazdelitvi ................................................................. 25

    2.3.4 Mere asimetrije in sploenosti ................................................................................... 252.3.4.1 Koeficient asimetrije (angl. skewness) ................................................................. 272.3.4.2 Koeficient sploenosti (angl. kurtosis) ............................................................... 28

    2.3.5 Standardizacija ............................................................................................................ 29

    2.4 VAJE ............................................................................................................................... 312.4.1 Urejanje in prikazovanje podatkov ............................................................................. 31

    2.4.2 Kvantili ........................................................................................................................ 352.4.3 Srednje vrednosti ......................................................................................................... 352.4.4 Mere variabilnosti, asimetrije, sploenosti, standardizacija ...................................... 37

  • 7/23/2019 opisna_statistika_01

    2/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    2

    2.1 KORAKI STATISTINE ANALIZE

    1. Doloitev vsebine in namenastatistinega prouevanja; opredelitev predmeta opazovanja

    (enote in populacije) in vsebine opazovanja (spremenljivk).

    2. Statistino opazovanje; vrste opazovanj:

    - opazovanje cele populacije (npr. popisi, tekoe registracije),

    - opazovanje vzorca (npr. ankete).

    3. Enostavna obdelava: urejanje, razvranje podatkov ter izraun osnovnih statistinih

    karakteristik.

    4. Analitina obdelava.

    2.2 UREJANJE IN PRIKAZOVANJE PODATKOV

    Z namenom preglednosti podatke uredimo v frekvenno porazdelitev.

    Frekvenna porazdelitevspremenljivke je tabela, ki jo doloajo vrednosti ali skupine

    vrednosti in njihove frekvence.

    Skupine vrednosti (razrede) oblikujemo, e gre za intervalno ali razmernostno

    spremenljivko, ki ima veliko (nepregledno) tevilo razlinih vrednosti.

    e je spremenljivka vsaj ordinalnega znaaja, vrednosti (ali skupine vrednosti) uredimood najmanje do najveje.

    Frekvenno porazdelitev lahko tudi grafino predstavimo.

    2.2.1 Frekvenne tabele in grafi za nominalne in ordinalne spremenljivke

    PRIMER

    Enote:tudenti

    Spremenljivka:X Brez esa bi

    najlae iveli? z odgovori brez

    TV, brez mobilnika, brez

    interneta

    tevilo enot:N= 300

    Frekvenna porazdelitev

    Vrednosti spremenljivke (absolutne) frekvence relativne frekvence

    (anketni odgovori) (t. tudentov) strukturni odstotki

    (% tudentov)

    tevilo vseh enot

  • 7/23/2019 opisna_statistika_01

    3/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    3

    Osnovni pojmi

    Podatki so urejeni v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana

    ena izmed monih vrednosti spremenljivke (x1, x2, ... xm), poleg pa njena frekvenca.

    Frekvencaje tevilo enot, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi frekvenca za i-to vrednost spremenljivke.

    Smiselno je izraunati relativne frekvence, im. strukturni odstotki. Relativna frekvenca

    je % enot med vsemi enotami, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih

    zfi% - relativna frekvenca za i-to vrednost spremenljivke. Izraunamo jih po naslednjem

    obrazcu:

    Grafina predstavitev

    Frekvenno porazdelitev za nominalne in ordinalne spremenljivke grafino prikazujemo z

    liki, npr. strukturnimi stolpci(angl. barchart) ali strukturnimi krogi(angl.pie).

    Ploine likov naj bodo sorazmerne frekvencam.

    Legenda naj bo primerno urejena.

    Vsaka grafina predstavitev naj ima naslov.

    Grafina predstavitev naj bo samozadostna.

    Brez esa bi najlaje iveli?

    brez TVbrez mobilnikabrez interneta

    Strukturni stolpec

    (absolutne frekvence)

    t.tudnetov

    (f

    i)

    0

    50

    100

    150

    200

    250

    300

    90

    180

    30

    Brez esa bi najlaje iveli? (n = 300)

    brez TVbrez mobilnikabrez interneta

    Strukturni stolpec

    (relativne frekvence)

    Odstotektudnetov(f

    i%)

    0 %10 %20 %30 %40 %50 %60 %70 %80 %90 %

    100 %

    30 %

    60 %

    10 %

    brez interneta brez mobilnika brez TV

    Strukturni stolpci

    Brez esa bi najlaje iveli?

    t.tudnetov

    (fi)

    0

    50

    100

    150

    90

    180

    30

    brez interneta 30 %

    brez mobilnika 60 %

    brez TV 10 %

    Strukturni krog

    Brez esa bi najlaje iveli? (n = 300)

    % 100iif

    f =

  • 7/23/2019 opisna_statistika_01

    4/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    4

    2.2.2 Frekvenne tabele in grafi za intervalne in razmernostne spremenljivke

    PRIMER

    Enota:gospodinjstvo

    Spremenljivka:X tevilo lanov gospodinjstva

    tevilo enot:N = 50

    Podatki so: 1 3 4 3 5 6 2 3 10 4 3 6 4 7 3 7 6 8 2 6

    2 4 5 4 4 4 3 2 3 4 4 4 1 4 8 3 2 1 4 5

    9 6 4 6 8 7 5 5 5 9

    Frekvenna porazdelitev

    Osnovni pojmi

    Podatke uredimo v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana

    ena izmed monih vrednosti spremenljivke (x1, x2, ... xm), poleg pa njena frekvenca.

    Frekvencaje tevilo enot, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi

    frekvenca za i-to vrednost spremenljivke.

    Smiselno je izraunati relativne frekvence. Relativna frekvenca je % enot med vsemi

    enotami, ki imajo doloeno vrednost spremenljivke. Oznaujemo jih zfi% - relativnafrekvenca za i-to vrednost spremenljivke. Izraunamo jih po naslednjem obrazcu:

    % 100iif

    f =

  • 7/23/2019 opisna_statistika_01

    5/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    5

    V primeru ordinalnih, intervalnih in razmernostnih spremenljivk je smiselno raunati tudi

    kumulativne frekvence (kumulative). Kumulativna frekvenca za neko vrednost

    spremenljivke, vkljuujo to vrednost, je setevek frekvenc za vrednosti pred njo ter to

    frekvenco. Oznaimo jo zFi- kumulativna frekvenca za i-to vrednost. Pove nam, kolikoenot ima vrednosti manje ali enake od doloene vrednosti. Izraunamo jo po naslednjem

    obrazcu:

    Izraunamo lahko tudi relativno kumulativno frekvenco, ki nam pove, koliken % enot

    ima vrednosti manje ali enake od doloene vrednosti. Izraunamo jo po naslednjem

    obrazcu:

    Grupiranje razvranje v razrede

    e je tevilo monih vrednosti spremenljivke veliko, je preglednost podatkov majhna.

    Zato sorodne vrednosti razvrstimo v skupine razrede.

    Skupine vrednosti morajo biti doloene enolino: vsaka enota s svojo vrednostjo je lahko

    uvrena v eno in samo eno skupino vrednosti.

    Obiajno so skupine vrednosti (razredi) enako iroki.

    Podatke uredimo v frekvenno porazdelitev, t.j. tabelo, kjer je v vsaki vrstici zapisana

    ena izmed skupin vrednosti (en razred), poleg pa njena frekvenca.

    Nezvezna ureditev - e so vrednosti spremenljivke diskretne

    iiii ffffFF +++=+= ...211

    % 100iiF

    F =

    9.5

    7.5

    5.5

    3.5

    1.5

    xi

    100

    94

    82

    58

    16

    Fi%

    8.5

    6.5

    4.5

    2.5

    0.5

    ximin

    10.5

    8.5

    6.5

    4.5

    2.5

    ximax

    2

    2

    2

    2

    2

    di

    10050Skupaj N

    50639-10

    471267-8

    4124125-6

    2942213-4

    81681-2

    Fifi%fiRazredi

    9.5

    7.5

    5.5

    3.5

    1.5

    xi

    100

    94

    82

    58

    16

    Fi%

    8.5

    6.5

    4.5

    2.5

    0.5

    ximin

    10.5

    8.5

    6.5

    4.5

    2.5

    ximax

    2

    2

    2

    2

    2

    di

    10050Skupaj N

    50639-10

    471267-8

    4124125-6

    2942213-4

    81681-2

    Fifi%fiRazredi

  • 7/23/2019 opisna_statistika_01

    6/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    6

    Zvezna ureditev - e so vrednosti spremenljivke zvezne (ali diskretne)

    Frekvencaje v tem primeru tevilo enot, ki imajo vrednost v doloeni skupini vrednosti

    (razredu). Oznaujemo jih zfi frekvenca za i-ti razred.

    Tudi v tem primeru je smiselno izraunati relativne frekvence. Relativna frekvenca je %

    enot med vsemi enotami, ki imajo vrednost v doloenem razredu. Oznaujemo jih zfi% -

    relativna frekvenca za i-ti razred. Izraunamo jih po naslednjem obrazcu:

    Kumulativna frekvencaza neko skupino vrednosti in vkljuujo to skupino (razred) je

    setevek frekvenc za skupine vrednosti (razrede) pred njo ter frekvenco te skupine.Oznaimo jo zFi- kumulativna frekvenca za i-ti razred. Pove nam, koliko enot ima

    vrednosti manje ali enake od te skupine vrednosti, natanneje manje od zgornje meje

    tega razreda. Izraunamo jo po naslednjem obrazcu:

    Relativna kumulativna frekvenca za nek razred pa pove, koliken % enot ima vrednosti

    manje od zgornje meje razreda. Izraunamo jo po naslednjem obrazcu:

    % 100iif

    fN

    =

    iiii ffffFF +++=+= ...211

    % 100iiF

    FN

    =

    10

    8

    64

    2

    xi

    100

    94

    8258

    16

    Fi%

    9

    7

    53

    1

    ximin

    11

    9

    75

    3

    ximax

    2

    2

    22

    2

    di

    10050Skupaj N

    50639 pod 11

    471267 pod 9

    4124125 pod 72942213 pod 5

    81681 pod 3

    Fifi%fiRazredi

    10

    8

    64

    2

    xi

    100

    94

    8258

    16

    Fi%

    9

    7

    53

    1

    ximin

    11

    9

    75

    3

    ximax

    2

    2

    22

    2

    di

    10050Skupaj N

    50639 pod 11

    471267 pod 9

    4124125 pod 72942213 pod 5

    81681 pod 3

    Fifi%fiRazredi

    9

    7

    5

    3

    1

    xi

    2

    2

    2

    2

    2

    di

    100

    94

    82

    58

    16

    Fi%

    8

    6

    4

    2

    0

    ximin

    10

    8

    6

    4

    2

    ximax

    10050Skupaj N

    5063nad 8 - 10

    47126nad 6 - 8

    412412nad 4 - 6

    294221nad 2 - 4

    8168nad 0- 2

    Fifi%fiRazredi

    9

    7

    5

    3

    1

    xi

    2

    2

    2

    2

    2

    di

    100

    94

    82

    58

    16

    Fi%

    8

    6

    4

    2

    0

    ximin

    10

    8

    6

    4

    2

    ximax

    10050Skupaj N

    5063nad 8 - 10

    47126nad 6 - 8

    412412nad 4 - 6

    294221nad 2 - 4

    8168nad 0- 2

    Fifi%fiRazredi

  • 7/23/2019 opisna_statistika_01

    7/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    7

    Grafina predstavitev

    Predpostavimo, da so razredi enako iroki.

    HISTOGRAM: drug poleg drugega riemo stolpce pravokotnike, katerih viina je

    sorazmerna frekvenci v razredu. irina pravokotnikov je enaka, ker so razredi enakoiroki.

    POLIGON: v koordinatnem sistemu zaznamujemo toke (xi, fi), kjer jexisredina i-tega

    razreda infinjegova frekvenca. K tem tokam dodamo e toki (xo, 0) in (xk+1, 0), e je v

    frekvenni porazdelitvi krazredov. Toke zveemo z daljicami.

    OGIVA: grafina predstavitev kumulativne frekvenne porazdelitve s poligonom, kjer v

    koordinatni sistem nanaamo toke (xi,max,Fi). Dodamo tudi toko (x1,min, 0).

    Histogram

    tevilo lanov gospodinjstva

    tevilogospodinjstev

    0 2 4 6 8 10

    0

    5

    10

    15

    20

    25

  • 7/23/2019 opisna_statistika_01

    8/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    8

    0

    5

    10

    15

    20

    Poligon

    tevilo lanov gospodinjstva

    tevilogospodinjste

    v

    -1 1 3 5 7 9 11

    0 2 4 6 8 10

    0

    10

    20

    30

    40

    50

    Ogiva

    tevilo lanov gospodinjstva

    te

    vilogospodinjstev

    Oblike frekvennih porazdelitev

    Frekvenna porazdelitev prikazuje variiranje ali razprenost vrednosti spremenljivke.

    Razprenost je rezultat individualnih, posaminih faktorjev, ki vplivajo na posamezne enote.

    Ti vplivi so najrazlineji in njihova posledica so razline oblike frekvenne porazdelitve.

    Nekatere oblike frekvennih porazdelitev se vekrat pojavljajo in te porazdelitve so dobile

    svoja imena: normalna, unimodalna, bimodalna, polimodalna, asimetrina v levo, asimetrina

    v desno, sploena, koniasta, J oblike, U oblike.

  • 7/23/2019 opisna_statistika_01

    9/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    9

    Frekvenna porazdelitev, s katero obiajno primerjamo doloeno frekvenno porazdelitev, je

    normalna porazdelitev, ki je unimodalna (ima en vrh), simetrina in zvonaste oblike.

    Oblika porazdelitev se lahko od normalne bolj ali manj razlikuje zaradi nehomogenostipopulacije, okrnjenega delovanja doloenih faktorjev itd. Zato je oblika porazdelitve lahko:

    bimodalna, e ima dva vrha; polimodalnaz ve vrhovi;

    asimetrina v levo, e se rep vlee

    na levo;

    asimetrina v desno, e se rep vlee

    v desno;

  • 7/23/2019 opisna_statistika_01

    10/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    10

    bolj koniastaali sploenaod normalne porazdelitve;

    koniastanormalnasploena

    Jali Uoblike.

    Zavajajoi grafi

    Grafi morajo biti narisani tako, da realno prikaejo osnovne znailnosti podatkov.

    Vasih so grafi nepravilno narisani, tako da celo zavajajo bralca. Npr. potrebna je posebna

    pozornost pri izbiri velikosti merske enote v koordinatnem sistemu.

  • 7/23/2019 opisna_statistika_01

    11/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    11

    2.3 OSNOVNI STATISTINI IZRAUNI

    2.3.1 KvantiliKvantili so statistini izrauni, ki nam pomagajo doloiti, kje se nahaja posamezna enota v

    primerjavi z drugimi enotami in njihovimi vrednostmi. Raunamo jih lahko le za intervalne in

    razmernostne spremenljivke.

    Primer

    Enota: tudent 1. letnika FDV

    Spremenljivka: tevilo doseenih tok na izpitu

    S kvantili lahko odgovorimo npr. na naslednji dve vpraanji:

    1. Kolikno je tevilo doseenih tok na izpitu za 10 % najboljih tudentov?

    2. Koliken del tudentov je doseglo 55 tok ali ve?

    Osnovni pojmi:

    Ranirna vrsta:enote z ustreznimi vrednostmi spremenljivke uredimo od tiste z

    najmanjo vrednostjo do tiste z najvejo vrednostjo. Im. tudi ranirni razmik.

    RangR: vsaki enot v ranirni vrsti priredimo zaporedno mesto.Primer:

    Izpitne ocene (0-100) 10 tudentov so: 82, 78, 58, 68, 86, 59, 46, 45, 17, 92

    Ranirna vrsta je:

    xi 17 45 46 58 59 68 78 82 86 92 vrednosti

    Ri 1 2 3 4 5 6 7 8 9 10 rangi

    Kvantilni rangP: pove, na katerem delu celotne ranirne vrste / ranirnega razmika lei

    doloena enota oz. koliki del celotne ranirne vrste / ranirnega razmika ima manje

    vrednosti od dane vrednost. Izraunamo ga po naslednjem obrazcu:

    Kvantil:vrednost spremenljivke, ki pripada doloenemu kvantilnemu rangu.

    RP

    5,0=

  • 7/23/2019 opisna_statistika_01

    12/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    12

    Obiajni kvantili:

    Mediana Me (P=0.5)

    = kvantil, ki razdeli ranirno vrsto na dva dela.

    = kvantil, ki pripada kvantilnemu ranguP=0.5.= vrednost, od katere ima enot manjo, pa vejo vrednost.

    Kvartili Q1(P=0.25), Q2(P=0.5), Q3(P=0.75)

    = kvantili, ki razdelijo ranirno vrsto na etrtine.

    = npr. prvi kvartil je vrednost, ki pripada kvantilnemu ranguP=0.25.

    = npr. prvi kvartil je vrednost, od katere ima 1/4 enot manjo, 3/4 pa vejo vrednost.

    Decili D1(P=0.1), D2(P=0.2), ..., D9(P=0.9),

    = kvantili, ki razdelijo ranirno vrsto na desetine.= npr. prvi decil je vrednost, ki pripada kvantilnemu rangu P=0.1.

    = npr. prvi decil je vrednost, od katere ima 1/10 enot manjo, 9/10 enot pa vejo vrednost.

    Centili C1(P=0.01), C2(P=0.02), ..., C99(P=0.99),

    = kvantili, ki razdelijo ranirno vrsto na stotine.

    = npr. prvi centil je vrednost, ki pripada kvantilnemu rangu P=0.01.

    = npr. prvi centil je vrednost, od katere ima 1/100 enot manjo, 99/100 enot pa vejo

    vrednost.Me=Q2=D5=C50

    D1=C10

    Q1=C25

    Raunanje kvantilov

    Koliko tok je dosegla polovica tudentov z najmanjim oz. najvejim tevilom tok? Iemo

    vrednost, ki se nahaja tono na polovici med 5. in 6. enoto v ranirni vrsti. To je vrednost, ki

    je tono na polovici med 59 in 68, torej 63.5.

  • 7/23/2019 opisna_statistika_01

    13/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    13

    Takno vrednost natanno doloimo z linearno interpolacijo, ki upoteva razmerja med

    rangi ter vrednostmi, ki rangom pripadajo. e jeRmed rangomaR0inR1, je ustreznixmed

    vrednostimax0inx1.

    Linearna interpolacija je seveda mogoa le pri intervanih in razmernostnih spremenljivkah.

    Primer

    1. Kakno oceno ima polovica tudentov, ki ima najnijo oceno? (Izraunajmo za navedene

    ocene tudentov mediano, t.j. kvantil, ki pripada kvantilnemu ranguP=0.5.)

    Rang lei med rangomaR0= 5 inR1= 6 in ustrezna vrednost (mediana) lei med vrednostimax0=

    59 inx1= 68. Uporabimo linearno interpolacijo:

    Ocena, ki razdeli ranirno vrsto na polovico oz. lei tono na polovici ranirne vrste, torej

    mediana, je 63.5.

    Polovica tudentov je dosegla manj kot 63.5 tok, polovica tudentov pa ve kot 63.5 tok.

    2. Koliken del tudentov ima manj kot 50 tok? (Izraunajmo kvantilni rang za vrednost

    50 (x=50).)

    Vrednostx=50 lei med sosednjima vrednostimax0=46 inx1=58, ki mu pripadata rangaR0=3 in

    R1=4. Uporabimo linearno interpolacijo:

    Vrednost x=50 bi bila 3.33 enota v ranirni vrsti. Izraunajmo kvantilni rang (kaj to pomeni v

    relativnem smislu):

    Vrednost 50 je vrednost, za katero velja, da ima 28.3% enot manjo vrednost.28% tudentov ima manj kot 50 tok.

    0 0

    1 0 1 0

    R R x x

    R R x x

    =

    5.55.05.0105.0 =+=+= PNR

    5635968

    59

    56

    555

    50

    1

    0

    1

    0

    .xMex

    x.

    xx

    xx

    RR

    RR

    .

    oo

    ===

    =

    =

    33.34658

    4650

    34

    31

    0

    1

    0

    =

    =

    =

    R

    R

    xx xxRR RR oo

    283.010

    5.03.35.0=

    =

    =

    N

    RP

  • 7/23/2019 opisna_statistika_01

    14/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    14

    Raunamo torej lahko:

    1) Vrednost, ki pripada doloenemu kvantilnemu rangu - katera vrednost lei na

    doloenem mestu v ranirni vrsti.

    xp= ?Pje podan; izPinNizraunamoR; z linearno interpolacijo doloimox, ki pripadaR.

    2) Kvantilni rang za doloeno vrednost - na katerem mestu v ranirni vrsti lei doloena

    vrednost.

    P = ?

    xje podan; z linearno interpolacijo doloimoRza x, iz R in N izraunamoP.

    2.3.2 Srednje vrednosti

    Pregled vrednosti spremenljivke dobimo z ranirno vrsto ali - v primeru vejega tevila enot -

    s frekvenno porazdelitvijo. Pri tem nas zanima, ali iz podatkov lahko razberemo neko

    reprezentativno vrednost spremenljivke in jo im. srednja vrednost. Ta vrednost naj bila

    najbolj tipina, obiajna, reprezentativna, normalna, priakovana, pogosta ...

    Ostale vrednosti se od srednje vrednosti nekoliko odklanjajo, variirajo. Bolj kot se posamezne

    vrednosti odklanjajo od srednje vrednosti, tem slabe ta srednja vrednost predstavlja

    spremenljivko.

    Obstaja ve vrst srednjih vrednosti. Mi bomo spoznali naslednje: medianaMe

    modusMo

    aritmetina sredina

    2.3.2.1Mediana

    Mediana je tista vrednost spremenljivke, od katere je ravno toliko manjih vrednosti od nje,

    kolikor jih je vejih od nje. Torej tista vrednosti, ki razdeli ranirno vrsto na polovico, t.j.

    kvantil, ki pripada kvantilnemu ranguP=0.5.

    Mediana je primerna srednja vrednost za ordinalne spremenljivke.

    Raunamo jo iz ranirne vrste.

  • 7/23/2019 opisna_statistika_01

    15/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    15

    V ranirni vrsti z lihim tevilomenotN = 2m + 1je medianaxm+1vrednost v ranirni

    vrsti.

    Primer: 3, 6, 7, 8, 10, 13, 14

    Ker je N=7, je mediana na 4. mestu (Me=x3+1), torej Me = 8. V ranirni vrsti s sodim tevilom enotN = 2mje mediana vrednost, ki je na sredini med

    srednjima dvema vrednostima, torejMe= (xm+xm+1)/2.

    Primer: 3, 3, 8, 10, 11, 14

    Ker je N=6, je mediana med 3. in 4. vrednostjo, torej Me=(8+10)/2=9.

    2.3.2.2 Modus

    Modus je edina srednja vrednost, ki je primerna za nominalne spremenljivke.

    Spremenljivka z diskretnimi vrednostmi

    Modus = Vrednost spremenljivke, ki se najpogosteje pojavlja.

    Primeri:

    2, 3, 4, 4, 4, 5, 7, 9 Mo=4

    2, 2, 5, 5, 5, 6, 7, 7, 7, 8, 12 Mo1=5 Mo2=7 Modusov je lahko ve2, 3, 7, 9, 12 Modusa ni.

    Spremenljivka z zveznimi vrednostmi

    Modus = Vrednost spremenljivke, okoli katere se ostale vrednosti najbolj gostijo.

    Mo

    Globalni in lokalni modusi

  • 7/23/2019 opisna_statistika_01

    16/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    16

    Globalni modus

    Pravi modus je globalni, to je tista vrednost spremenljivke, ki se najpogostejepojavlja oz.okoli katere se ostale vrednosti najboljgostijo.

    Lokalni modusLokalni modus je tista vrednost spremenljivke, ki se pojavlja pogosteje kot njej blinjevrednosti oz. okoli katere se ostale vrednosti gostijo. To ni pravi modus.

    Primeri:2, 2, 3, 4, 4, 4, 5, 7, 7, 9 Globalni modus: 4

    Lokalna modusa: 2 in 72, 2, 5, 5, 5, 6, 7, 7, 7, 8, 12 Dva globalna modusa: 5 in 72, 3, 4, 4, 4, 5, 5, 7, 9 Globalni modus: 4

    Lokalnega modusa ni

    Primer: ve lokalnihmodusov in en globalni modus pri spremenljivki z zveznimi vrednostmi

    Bimodalna porazdelitev

    Mo1 Mo2

    Polimodalna porazdelitev

    Mo1 Mo2 Mo3 Mo4

    Primer: ve globalnihmodusov pri spremenljivki z zveznimi vrednostmi

    Mo1 Mo2

  • 7/23/2019 opisna_statistika_01

    17/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    17

    Izraun modusa iz frekvenne porazdelitve

    e modus razumemo kot vrednost spremenljivke, okoli katere se vrednosti najbolj gostijo, ga

    lahko najlaje doloamo iz frekvenne porazdelitve. Razred z najvejo frekvenco vsebuje

    modus, zato ga imenujemo modalni razred.

    Prvi pribliek modusu je lahko sredina modalnega razreda.

    Natanneje modus doloimo s pomojo naslednjega obrazca:

    xo,min ... spodnja meja modalnega razreda

    d... irina razreda

    fo... frekvenca modalnega razreda

    f+1... frekvenca razreda za modalnim razredom

    f-1... frekvenca razreda pred modalnim razredom

    Primer: Frekvenna porazdelitev prikazuje tevilo lanov 50 gospodinjstev:

    Iz frekvenne porazdelitve razberemo potrebne podatke za izraun modusa:

    x0,min= 2.5, d = 2,f0= 21, f-1= 8, f+1= 12

    Najve gospodinjstev ima 3.68 lanov.

    Grafino pa si modus ponazorimo takole:

    tevilo lanov gospodinjstva

    tevilogospodinjstev

    0

    5

    10

    15

    20

    25

    0.5 2.5 4.5 6.5 8.5 10.5Mo

    0 10,

    0 1 12min

    +

    f fMo = x +d

    f f f

    68.3128212

    82125.2

    2 11

    1min,0 =

    +=

    +=+

    Mofff

    ffdxMo

    o

    o

  • 7/23/2019 opisna_statistika_01

    18/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    18

    2.3.2.3 Arimetina sredina

    Aritmetina sredina ali povpreje je vsota vseh vrednosti, deljena s tevilom enot v populaciji.

    Primerna je za intervalne in razmernostne, priblino normalno porazdeljene spremenljivke.

    ... aritmetina sredina

    xi... vrednost spremenljivkeXna i-ti enoti

    N... tevilo vseh enot

    ... sumacijski znak Setej vrednosti spremenljivkeX,

    ko itee od 1doN, torej za vse enote.

    Primer:

    Aritmetino sredino lahko definiramo kot vrednost, za katero velja:

    Zgornji obrazec za izraun aritmetine sredine velja, kadar imamo podatke, ki niso urejeni v

    frekvenno porazdelitev.

    e pa imamo podatke, ki so urejeni v frekvenno porazdelitev, uporabljamo naslednji

    obrazec:

    ... aritmetina sredina

    xi... reprezentativna vrednost (obiajno sredina) i-tega razreda spremenljivkeX

    fi... frekvenca za i-ti razred spremenljivkeX(t. enot, ki so v tem razredu)

    k... tevilo vseh razredov v frekvenni porazdelitviN... tevilo vseh enot

    ... sumacijski znak Setej produkt reprezentativne vrednosti razreda

    spremenljivkeX in frekvence, ko itee od 1do k, torej za vse vrednosti.

    Pozor:V primeru, da uporabimo kot reprezentativno vrednost sredino razreda in ne

    aritmetine sredine vrednosti v razredu (ki obiajno ni na voljo, razen e je v vsakem razredu

    le ena vrednost), z zgornjim izraunom dobimo le pribliek aritmetine sredine vseh

    vrednosti.

    1 21

    1 1( ... )

    N

    i Ni

    x x x xN N

    =

    = = + + +

    35

    54321

    5,4,3,2,1

    =++++

    =

    =

    =N

    iix

    1

    0)(

    1 1 2 21

    1 1( ... )

    k

    i i k k i

    f x f x f x f xN N

    =

    = = + + +

  • 7/23/2019 opisna_statistika_01

    19/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    19

    Primer: frekvenna porazdelitev, ki prikazuje tevilo lanov gospodinjstva.

    2.3.2.4 Odnos med Me in .

    Za unimodalne, simetrine porazdelitve velja: = Me = Mo.

    Za unimodalne porazdelitve, asimetrine v levo, velja: < Me.

    Za unimodalne porazdelitve, asimetrine v desno, velja: > Me.

    Me Mo Mo Me

    =

    ===k

    iiixf

    N 156.4228

    50

    11

    Gospodinjstva imajo v povpreju 4.56

    lanov gospodinjstva.

  • 7/23/2019 opisna_statistika_01

    20/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    20

    2.3.2.5 Katero srednjo vrednost izbrati?

    Drugi kriteriji:

    Modus:

    - e imamo spremenljivko, ki je samo nominalna.

    - e je porazdelitev bimodalna ali polimodalna.

    Mediana:

    - e imamo spremenljivko, ki je samo ordinalna.

    - e kakna enota mono izstopa od ostalih enot oz. je porazdelitev izrazito asimetrina (Pri

    izraunu mediane ekstremnih vrednosti namre ne upotevamo.)

    Aritmetina sredina:

    - e je spremenljivka tevilska in priblino normalno porazdeljena.

    - e bomo srednjo vrednost potrebovali kot osnovo za nadaljnje izraune.

    Modus Mediana Aritmetinasredina

    Nominalna + - -Ordinalna + + -Intervalna + + +Razmernostna + + +

  • 7/23/2019 opisna_statistika_01

    21/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    21

    2.3.3 Mere variabilnosti

    Primer: IK za 2 razreda uencev

    0

    2

    4

    6

    8

    10

    Intelegneni kvocient

    80 90 100 110 120 130 140

    Letonji razredLanski razred

    1 = 2= 110

    Im. tudi mere razprenosti.

    Variabilnost (razprenost, variacija) govori o tem:

    koliko so podatki variabilni (koliko so vrednosti razline med seboj),

    koliko se vrednosti odklanjajo od srednje vrednosti,

    koliko se vrednosti razlikujejo od srednje vrednosti.

    2.3.3.1 Absolutne mere variabilnosti

    Variacijski razmik xmax... najveja vrednost

    xmin... najmanja vrednost

    Razlika med najvejo in najmanjo vrednostjo.

    Veja kot je variabilnost, veji je variacijski razmik.

    Kvartilni odklon , kjer sta Q3in Q1kvartila.

    Polovica razdalje med prvim in tretjim kvartilom.

    Meri variabilnost okoli mediane. Veja kot je variabilnost, veji je kvartilni odklon.

    max min

    R x x=

    3 1

    2

    Q QQ

    =

  • 7/23/2019 opisna_statistika_01

    22/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    22

    Povpreni absolutni odklon odMein

    xi... vrednost i-te enoteN ... tevilo enot

    e so podatki urejeni v frekvenno porazdelitev ...xi... reprezentativna vrednost (obiajno sredina) i-tega

    razreda spremenljivkeXk... tevilo vseh razredov v frekvenni porazdelitvi

    fi... frekvenca za i-ti razred

    Pozor:V primeru, ko vse vrednosti v razredu nisoenake reprezentativni vrednosti razreda (kar se zgodi le,e je v vsakem razredu le ena vrednost, ki je enakareprezentativni), z zgornjim izraunom dobimo le

    pribliek absolutnega odklona od mediane oz.

    aritmetine sredine.

    Povpreni odklon vrednosti od srednje vrednosti (Meoz. ). Meri variabilnost okoli aritmetine sredine () oz. mediane (Me). Veja kot je variabilnost, veji je povpreni absolutni odklon bolj se posamezne

    vrednosti odklanjajo od srednje vrednosti.

    Varianca in standardni odklon

    2 ... varianca ... standardni odklon ... aritmetina sredina

    N ... t. enotxi ... vrednost sprem.Xza i-to enoto(xi-) ... odklon od aritmetine sredine za i-to enoto

    Standarden (tipien, obiajen) odklon vrednosti od aritmetine sredine. Meri variabilnost okoli aritmetine sredine. Veja kot je variabilnost, veji je standardni odklon bolj se posamezne vrednosti

    odklanjajo (razlikujejo) od aritmetine sredine.

    Varianca in standardni odklon e so podatki urejeni v frekvenno porazdelitev

    2... varianca

    ... standardni odklon... aritmetina sredinaN ... t. enotxi ... reprezentativna vrednost (obiajno sredina) i-tega razreda

    spremenljivkeXk ...tevilo razredovfi ... frekvenca i-tega razreda

    (xi-) ... odklon od aritmetine sredine

    Pozor:V primeru, ko vse vrednosti v razredu niso enake reprezentativni vrednosti razreda

    (kar se zgodi le, e je v vsakem razredu le ena vrednost, ki je enaka reprezentativni), zzgornjim izraunom dobimo le pribliek variance oz. standardnega odklona.

    1

    1

    1

    1

    N

    ii

    N

    Me ii

    AD xN

    AD x MeN

    =

    =

    =

    =

    =

    =

    =

    =

    k

    iiiiMe

    i

    k

    iii

    fMexNAD

    fxN

    AD

    1

    1

    2 2 2 2

    1 1

    1 1( )

    N N

    i ii i

    x xN N

    = =

    = =

    2 =

    i

    k

    ii fx

    N==

    1

    22 )(1

    2 =

  • 7/23/2019 opisna_statistika_01

    23/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    23

    Primer 1SpremenljivkaX:tevilo ur gledanja TV na teden.Enota: oseba.

    Opazovane osebe v povpreju gledajo TV 15 ur na teden. Standardni odklon pa je 3,69 ure, karpomeni, da se tevilo ur gledanja TV pri posameznikih od povpreja standardno odklanja zaslabe 4 ure.

    Primer 2SpremenljivkaX: tevilolanov gospodinjstva.Enota: 1 gospodinjstvo.

    Gospodinjstva imajo v povpreju 4.56 lanov

    gospodinjstva. tevilo lanov posameznihgospodinjstev pa se od povpreja standardnoodklanja za 2,15 lana.

    69,36,13

    6,135

    68)(

    1

    155

    751

    2

    1

    22

    1

    ===

    ===

    ===

    =

    =

    N

    ii

    N

    i i

    xN

    xN

    15,261,4

    61,450

    32,230)(

    1

    56.4228

    50

    11

    2

    1

    22

    1

    ===

    ===

    ===

    =

    =

    N

    iii

    k

    i

    ii

    fxN

    xf

    N

  • 7/23/2019 opisna_statistika_01

    24/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    24

    2.3.3.2 Relativne mere variabilnosti

    Absolutne mere variabilnosti lahko le redko primerjamo med seboj. Zato raunamo relativnemere variabilnosti, ki so absolutne mere, deljene z ustrezno srednjo vrednostjo.POZOR: Relativne mere variabilnosti lahko uporabljamo le pri razmernostnihspremenljivkah

    vrednostsrednja

    meraabsolutnamerarelativna =

    Kdaj jih uporabljamo?- e elimo primerjati dve porazdelitvi z zelo razlinima srednjima vrednostima.- e elimo primerjati dve spremenljivki, kjer so uporabljene razline merske enote.

    Relativni variacijski razmik:

    Relativni kvartilni odklon:

    Relativni povpreni absolutni odklon od mediane oz. aritm. sredine:

    Relativni standardni odklon koeficient variacije:

    Primer 1V neki raziskavi so ocenili, da je povpreno tevilo ur gledanje televizije na teden za enske

    Z=10in za moke M=13. Standardna odklona pa sta bila enaka, in sicer Z= M= 6. Vkaterem primeru so relativno gledano razlike med osebami veje? Kdo se bolj razlikuje medseboj, moki ali enske?

    46,013

    66,0

    10

    6======

    M

    MM

    Z

    ZZ KVKV

    Podatki kaejo, da v povpreju moki gledajo za 3 ure ve televizijo na teden kot enske.Razlike v gledanju pa so med enskami veje kot med mokimi, ker je relativna razprenost prienskah veja.

    Primer 2Na izpitu iz Osnov programiranja je bilo povpreno tevilo tok (od 100 monih) 50, standardniodklon pa 10. Pri izpitu iz Statistike pa je bilo povpreno tevilo tok 16 (od 30 monih),standardni odklon pa 4.V katerem primeru so razlike med tokami veje?

    25,016

    42,0

    50

    10======

    S

    SS

    OP

    OPOP KVKV

    Razlike med doseenimi tokami so veje pri izpitu iz Statistike.

    minmax

    minmax 2)(

    xx

    xx

    +

    e

    QQ

    213

    AD

    Me

    ADMe

    =KV

  • 7/23/2019 opisna_statistika_01

    25/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    25

    2.3.3.3 Variabilnost pri normalni porazdelitvi

    Denimo, da se spremenljivkaXporazdeljuje normalnoz aritmetino sredino in standardnimodklonom . Tedaj velja, da v razmiku:

    [- ; + ]lei 68.3% enot, [- 2; + 2]lei 95,4% enot, [- 3; + 3]lei 99,7% enot.

    -3 -2 -1 +1 +2 +3

    68,3%

    95,4%

    99,7%

    PrimerDenimo, da se inteligenni kvocient na populaciji tudentov porazdeljuje priblino normalno z

    aritmetino sredino =105in standardnim odklonom =15.Potem vemo, da ima 95,4% tudentov inteligenni kvocient v intervalu [75; 135].[- 2; + 2]=[105 - 215; 105 + 215]=[75; 135]

    -3 -2 -1 +1 +2 +360 75 90 105 120 135 150

    68,3%

    95,4%

    99,7%

    2.3.4 Mere asimetrije in sploenosti

    e je spremenljivka priblino normalno porazdeljena, potem jo statistini karakteristikiaritmetina sredina in standardni odklon zelo dobro opisujeta. V primeru unimodalne

  • 7/23/2019 opisna_statistika_01

    26/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    26

    porazdelitve spremenljivke, ki pa je bolj ali manj asimetrina in bolj ali manj sploena(koniasta), pa je potrebno izraunati e stopnjo asimetrije in sploenosti (koniavosti). Tolahko na ve nainov merimo s koeficienti asimetrije in sploenosti.

    0

    5

    10

    15

    20

    Poligon

    tevilo lanov gospodinjstva

    tevilogospodinjstev

    -0.5 1.5 3.5 5.5 7.5 9.5 11.5

    0

    5

    10

    15

    20

    Poligon

    tevilo lanov gospodinjstva

    tevilogospodinjstev

    -0.5 1.5 3.5 5.5 7.5 9.5

    Na katerem poligonu in na kateri krivulji (modri-polni ali zeleni-rtkani) je sploenost veja?

  • 7/23/2019 opisna_statistika_01

    27/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    27

    Koeficienta asimetrije in sploenosti s centralnimi momenti

    Ve razlinih mer, npr. koeficient asimetrijeg1in koeficient sploenostig2(razvil ju je KarlPearson), izraunana s pomojo t. im. centralnih momentov.

    l-ti centralni moment je:

    Gre za razlike med posameznimi vrednostmi in aritmetino sredino na l-to potenco. Meriasimetrije in sploenosti torej upotevata odklone vrednosti od srednje vrednosti.

    m1=0 ... ker je setevek vseh odklonov (na 1. potenco) enak 0.m2=

    2 ... ker odklone kvadriramo, je to ravno varianca.

    2.3.4.1 Koeficient asimetrije (angl. skewness)

    Porazdelitev spremenljivke je lahko simetrina ali asimetrina.

    Simetrina p.- vrednosti se enako odklanjajo od srednje vrednosti navzdol in navzgor.

    Asimetrina p. v levo e se rep porazdelitve vlee v levo stran, v negativno smer. Veinaenot ima visoke vrednosti in malo enot ima (ekstremno) nizke vrednosti. Aritm. sredina jemanja od mediane, ker nizke vrednosti zmanjujejo aritmetino sredino.

    Asimetrina p. v desno- e se rep porazdelitve vlee v desno stran, v pozitivno smer. Veinaenot ima majhne vrednosti in malo enot ima (ekstremno) visoke vrednosti. Aritm. sredina je

    veja od mediane, ker visoke vrednosti poveujejo aritmetino sredino.

    g1 > 0... asimetrija v desnog1 = 0... simetrinag1 < 0... asimetrina v levo

    Mo Me

    g1 > 0

    Me Mo

    g1< 0

    11 ( )

    N

    ll i

    im x

    N ==

    ( )

    3 3 3

    3 1 1 11 3 3 3 3

    22 2

    1

    1 1 1( ) ( ) ( )

    1( )

    N N N

    i i ii i i

    N

    ii

    x x xm N N N

    gm

    xN

    = = =

    =

    = = = =

  • 7/23/2019 opisna_statistika_01

    28/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    28

    2.3.4.2 Koeficient sploenosti (angl. kurtosis)

    Porazdelitev spremenljivke je koniasta, sploena ali normalno sploena/koniasta.

    Koniasta p. bolj koniasta od normalne porazdelitve. Za porazdelitev sta znailna daljarepa in oji osrednji del. Z naraanjem vrednosti frekvenca zelo poasi naraa do doloenevrednosti, ko zane naenkrat hitro naraati in hitro dosee vrh. Z nadaljnjimi vrednostmi pafrekvenca najprej hitro upade in nato poasi upada do ekstremno visokih vrednosti.

    Sploena p. bolj sploena od normalne porazdelitve. Za porazdelitev sta znailna krajarepa ter debeleji osrednji del. Frekvenca zane naraati e pri nijih vrednostih in z vijimivrednostmi enakomerno naraa, dokler ne dosee vrha. Nato pa z vijimi vrednostmi poasienakomerno upada.

    Zelo ekstremne vrednosti in/ali vrednosti isto na sredini se pojavljajo pri koniastiporazdelitvi pogosteje kot pri sploeni. Vrednosti med sredino in ekstremnimi vrednostmi pase pogosteje pojavljajo pri sploeni porazdelitvi.

    Lahko tudi reemo, da je variabilnost pri sploeni porazdelitvi predvsem posledica velikegatevila srednje-velikih razlik (med vrednostmi), pri koniasti pa manjega tevila zelo velikihrazlik.

    g2 > 0koniastag2 = 0normalnag2 < 0sploena

    4 4 4

    1 1 142 2 2 2 4

    2 22

    1

    1 1 1( ) ( ) ( )

    3 3 3 31 ( )( ( ) )

    N N N

    i i ii i i

    N

    ii

    x x xm N N N

    gm

    xN

    = = =

    =

    = = = =

  • 7/23/2019 opisna_statistika_01

    29/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    29

    Primer: anketa med tudenti FDV (2002)

    Koef. asimetrije 2.95 ... asimetrija v desnoKoef. sploenosti 5.97 ... koniasto

    Koef. asimetrije 0.21 ... simetrinaKoef. sploenosti -0.74 ... normalnosploena

    2.3.5 Standardizacija

    Postopek standardizacije

    Vsaki vrednostixispremenljivkeXodtejemo njeno aritmetino sredino xin delimo z njenimstandardnim odklonom x:

    Vrednostizi imenujemo standardizirane vrednosti. SpremenljivkoZ, ki ima vrednostizi, paimenujemo standardizirana spremenljivkaZ.

    Standardizirana vrednostziza vrednostxipredstavlja relativni odklon od aritmetine sredine.

    Vrednosti razlinih spremenljivk v splonem niso primerljive. e pa spremenljivkistandardiziramo, lahko primerjamo njihove standardizirane vrednosti.

    Znailnosti standardizirane spremenljivke in njenih vrednosti1. Standardizirana spremenljivkaZima aritmetino sredino enako 0 (Z=0) in standardni

    odklon enak 1 (Z=1).

    Dokaz (izpeljava):

    i Xi

    X

    xz

    =

    1 1 1

    22 2 2 2 2 2

    2 21 1 1 1 1

    1 1 1 1 1 1( ) 0 0

    1 1 1 1 1 1 1( ) ( 0) ( ) ( ) 1

    N N Ni X

    Z i i Xi i iX X X

    N N N N Ni X

    Z i Z i i i X Xi i i i iX X X

    xz x

    N N N N

    xz z z x

    N N N N N

    = = =

    = = = = =

    = = = = =

    = = = = = = =

  • 7/23/2019 opisna_statistika_01

    30/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    30

    2. e je spremenljivkaXporazdeljena priblino normalno, standardizirana vrednost doloamesto enote v populaciji:

    Predznak pove, ali je enota nad (+) ali pod (-) povprejem. Absolutna vrednost pove, za koliko se vrednost odklanja od aritmetine sredine v

    relativnem smislu za koliko standardnih odklonov se odklanja

    Primer:Tea in viina dojenkov, starih 9 mesecev

    Lucija: 68 cm, 8 kg Matev: 74 cm, 10.2 kg

    Kateri dojenek je veji glede na ostale otroke istega spola in starosti?Deklice Deki

    Povprena viina = 70 cm = 72 cmStandardni odklon = 2.5 cm = 2.5 cm

    Povprena tea = 8.6 kg = 9.4 kgStandardni odklon = 0.8 kg = 0.8 kg

    Standardizirana viina

    Standardizirana tea

    Lucija je manja in laja v primerjavi z ostalimi deklicami svoje starosti, medtem ko je Matevveji in teji v primerjavi z ostalimi deki svoje starosti. Vendar ne odstopata ekstremno. Npr.Lucija je manja za 0.8 standardnega odklona, torej spada med 68.3% deklic svoje starosti, ki sonajblije povpreju (ob predpostavki, da se spremenljivka tea deklicporazdeljuje normalno).

    18,0

    4,92,1075,0

    8,0

    6,88

    8,05,2

    72748,0

    5,2

    7068

    =

    =

    ==

    =

    =

    =

    =

    ==

    =

    =

    MM

    LL

    MM

    LL

    xz

    xz

    xz

    xz

  • 7/23/2019 opisna_statistika_01

    31/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    31

    2.4 VAJE

    2.4.1 Urejanje in prikazovanje podatkov

    1. Ferligoj (1994): Naloge iz statistike, naloge: 3.1 3.6.

    2. Opiite naslednja dva grafa:- razberite, kaj je enota in kaj je spremenljivka,- doloite mersko lestvico spremenljivke,- opiite obliko porazdelitev (asimetrija, sploenost/koniavost, modalnost).

    10,00 12,00 14,00 16,00 18,00 20,00 22,00

    tevilo ucencev O na enega ucitelja

    0

    2

    4

    6

    8

    Frekvenca

    -tevilo

    drav

    Mean = 15,1958Std. Dev. = 3,48231N = 24

    Izobraevalni kadri v osnovnem olstvu

    0 20 40 60 80 100

    % 18-letnikov, ki so vkljuceni v olanje

    0

    2

    4

    6

    8

    10

    Frekvenca

    -tevilo

    drav

    Mean = 73,084

    Std. Dev. = 14,01317N = 25

    Vkljucenost mladih v olanje v EU dravah

  • 7/23/2019 opisna_statistika_01

    32/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    32

    3. V nadaljevanju so grafino predstavljene porazdelitve dveh razmernostnih spremenljivk. Za vsakospremenljivko je narisan histogram za ve nainov zdruevanja vrednosti v razrede. Za vsakospremenljivko odgovorite na naslednja vpraanja:

    - Kaj je spremenljivka?- Kaj je enota in kolikno je tevilo enot?

    - Kako se spreminja oblika porazdelitve, e spreminjamo tevilo (in posledino irino) razredov?Primer 1: Kadri v osnovnoolskem izobraevanju Povpreno tevilo uencev na enega uitelja v O za25 drav lanic EU

    Primer 2: tevilo avtomobilov na 1000 prebivalcev za25 drav lanic EU

    tevilo osebnih avtomobilov na 1000 prebivalcev

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,01 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    25 100,0

    247

    259

    265

    287

    295

    331

    340

    351

    357

    371

    405

    422

    424

    447

    453459

    460

    463

    490

    495

    508

    541

    558

    590

    643

    Frekvenca(tevilodrav)

    Relativnafrekvenca

    tevilo uencev O na 1 uitelja

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    2 8,0

    1 4,0

    1 4,0

    1 4,0

    1 4,0

    1 4,01 4,0

    1 4,0

    1 4,0

    2 8,0

    1 4,0

    2 8,0

    1 4,0

    1 4,0

    1 4,0

    25 100,0

    10,60

    10,80

    10,90

    11,00

    11,20

    11,60

    12,40

    12,50

    12,60

    12,80

    13,10

    14,40

    14,6015,80

    16,90

    17,00

    18,90

    19,10

    19,40

    19,50

    19,90

    20,10

    Frekvenca(tevilodrav)

    Relativnafrekvenca

  • 7/23/2019 opisna_statistika_01

    33/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    33

    0 5 10 15 20 25

    tevilo ucencev O na 1 ucitelja

    0

    2

    4

    6

    8

    10

    12

    Frekvenca

    Histogram: Kadri v osnovnoolskem izobraevanju

    0 5 10 15 20 25

    tevilo ucencev O na 1 ucitelja

    0

    2

    4

    6

    8

    Frekvenca

    Histogram: Kadri v osnovnoolskem izobraevanju

    0 5 10 15 20 25

    tevilo ucencev O na 1 ucitelja

    0

    1

    2

    3

    4

    5

    6

    Frekvenca

    Histogram: Kadri v osnovnoolskem izobraevanju

    0 5 10 15 20 25

    tevilo ucencev O na 1 ucitelja

    0

    1

    2

    3

    4

    5

    Frekvenca

    Histogram: Kadri v osnovnoolskem izobraevanju

  • 7/23/2019 opisna_statistika_01

    34/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    34

    200 300 400 500 600 700

    tevilo osebnih avtomobilov na 1000prebivalcev

    0

    1

    2

    3

    4

    Frekvenca

    -tevilo

    drav

    Histogram: tevilo osebnih avtomobilov v dravah EU

    200 300 400 500 600 700tevilo osebnih avtomobilov na 1000

    prebivalcev

    0

    1

    2

    3

    4

    5

    Frekvenca

    -tevilo

    drav

    Histogram: tevilo osebnih avtomobilov v dravah EU

    100 200 300 400 500 600 700tevilo osebnih avtomobilov na 1000

    prebivalcev

    0

    2

    4

    6

    8

    10

    12

    14

    Frekvenca

    -tevilo

    drav

    Histogram: tevilo osebnih avtomobilov v dravah EU

    200 300 400 500 600 700

    tevilo osebnih avtomobilov na 1000prebivalcev

    0

    2

    4

    6

    8

    10

    Frekvenca

    -tevilo

    drav

    Histogram: tevilo osebnih avtomobilov v dravah EU

  • 7/23/2019 opisna_statistika_01

    35/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    35

    2.4.2 Kvantili

    1. Ferligoj (1994): Naloge iz statistike, naloge: 4.1, 4.4.

    2. Primer izpitnega vpraanja.Podane so starosti 7 tudentov: 22, 19, 21, 24, 19, 18, 23. Pr vi kvartil ima vrednost:

    a) 18.5b) 19c) 19.5d) 25%

    2.4.3 Srednje vrednosti

    1. Ferligoj (1994): Naloge iz statistike, naloge: 4.6, 4.7, 4.8, 4.9 (samo modus), 4.10, 4.11, 4.12(samo modus), 4.13 (a, b samo frekvenna porazdelitev), 4.17, 4.20.

    2. Neka multinacionalna tovarna avtomobilov na leto proizvede naslednje tevilo avtomobilov (v10.000) v svojih obratih v sedmih dravah:

    6, 8, 6, 9, 11, 5, 60a) Kaj je spremenljivka in kaj so enote?

    b) Kakna je merska lestvica spremenljivke?c) Nariite histogram, poligon in ogivo.d) Kolikno je celotno tevilo proizvedenih avtomobilov v tej tovarni?e) Kolikni so arimetina sredina, mediana, modus? Oznaite te tri sredine naf) histogramu.g) Kaj lahko na osnovi grafov reete o asimetriji te porazdelitve?h) Za neko drugo tovarno, ki izdeluje avtomobile v 10-ih dravah, so podatki za letno tevilo proizvedenih

    avtomobilov (v 10.000 naslednji): 7.8 v povpreju na dravo, mediana je 6.5 in modus 5.0. Kakno je

    skupno tevilo proizvedenih avtomobilov v 10-ih dravah?

    3. Da bi videli, ali so upraviene izjave o vzdrljivosti baterij, so na Zvezi potronikovtestirali vzorec 20-ih baterij. Zabeleeni so podatki o ivljenjski dobi (v minutah) tehbaterij:

    a) Kaj je spremenljivka in kaj so enote?b) Kakna je merska lestvica spremenljivke?c) Vrednosti razporedite v frekvenno porazdelitev z razredi, irokimi 5 minutd) Relativno frekvenno porazdelitev grafino predstavite.

    e) Na osnovi frekvenne porazdelitve izraunajte modus porazdelitve.f) Vrednosti razporedite v frekvenno porazdelitev s tremi razredi, pri emer naj bodo srednje vrednosti

    razredov 60, 70 in 80 minut. Ponovno grafino predstavite porazdelitev in izraunajte modus. Primerjajterezultat dveh razlinih grupiranj.

    4. V manjem podjetju je prejnji mesec 5 zaposlenih na najnijem delovnem mestu dobilo 2.500 EURbruto, dve zaposleni osebi na vijem delovnem mestu 6.000 EUR bruto ter direktor podjetja 25.500EUR bruto.a) Kaj je spremenljivka in kaj so enote?

    b) Kakna je merska lestvica spremenljivke?c) Kolikna je bila povprena bruto plaa v tem podjetju?d) Koliko zaposlenih zaslui manj od povpreja?e) Kolikna je mediana za bruto plao?f) Koliken je modus za bruto plao?g) Katera srednja vrednost je najprimerneja za ponazoritev viine bruto plae v tem podjetju?

    58 58,4 59,4 64,2 64,9 65,1 65,4 67,8 68 73,3 74,7 74,9 75,1 75,4 76 76 76,6 76,7 77,6 81,3

  • 7/23/2019 opisna_statistika_01

    36/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    36

    5. Predstavljene so tiri frekvenne porazdelitve neke spremenljivke (negrupirana porazdelitev,porazdelitev z razredi irine 2 enoti, z razredi irine 3 enote ter razredi irine 4 enote). Za vsakoporazdelitev izraunajte modus in jih primerjajte. Kaj se dogaja, ko vrednosti zdruujemo v razrede?

    6. Izraunajte aritmetino sredino za naslednjih pet vrednosti: 3, 7, 8, 12, 15.a) Za vsako vrednost izraunajte (pozitiven ali negativen) odklon od aritmetine sredine, t.j.xi-. Izraunajte

    povpreje teh odklonov.b) Zamislite si nek poljuben niz tevil. Izraunajte njihovo aritmetino sredino in nato povpreni odklon od

    aritmetine sredine.c) Dokaite, da je za vsak moen niz n-tih vrednosti povpreni odklon od aritmetine sredine enak ni.

    7. kotski vic: e se kot preseli iz kotske v Anglijo, se v obeh regijah zvia povpreni inteligennikvocient. V katerem primeru je to mogoe (ali je nemogoe)? (Kakno mora biti povpreje v vsakiregiji in kakna mora biti vrednost kota v primerjavi s povprejem?)

    x i fi x i fi x i fi x i fi

    22 123 124 025 126 327 1328 1229 830 831 632 433 234 135 136 037 0

    Negrupirani

    podatki

    Grupirani

    podatki d=2

    Grupirani

    podatki d=3

    Grupirani

    podatki d=3

    34-37 2

    30-33 20

    26-29 36

    22-25 3

    34-36

    2

    17

    28

    12

    2

    22-24

    25-27

    28-30

    31-3314

    6

    2

    0

    2

    1

    16

    20

    30-31

    32-33

    34-35

    36-37

    22-23

    24-25

    26-27

    28-29

  • 7/23/2019 opisna_statistika_01

    37/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    37

    2.4.4 Mere variabilnosti, asimetrije, sploenosti, standardizacija

    1. Ferligoj (1994): Naloge iz statistike: 5.1, 5.2, 5.7, 5.9, 5.14.

    2. Podani so podatki o viini inteligennega kvocienta za nek olski razred. Odgovorite na spodnjavpraanja:

    a) Kaj je enota analize in kaj spremenljivka? Kakna je merska lestvica spremenljivke?b) Za dane podatke izraunajte vse absolutne in relativne mere variabilnosti?c) Interpretirajte izraunani standardni odklon.d) Podatke uredite v frekvenno porazdelitev s 5 razredi in jo grafino predstavite s histogramom in

    poligonom. Ocenite oblike porazdelitve iz grafine predstavitve.e) Izraunajte koeficienta asimetrije in sploenosti s pomojo centralnih momentov in ju interpretirajte.

    Ali se rezultat ujema z ugotovitvijo v toki d)?f) Kaken inteligenni kvocient bi imelo 95.4% vseh uencev, e bi bila porazdelitev popolnoma

    normalna?

    3. Za skupino starejih oseb, obolelih s Parkinsovo boleznijo, je podan podatek o starosti ob nastopubolezni:

    67 68 60 64 68 6368 70 63 70 68 6970 69 69 69 69 6862 70 70 64 66 6666 69 67 67 70 67

    a) Izraunajte koeficient asimetrije za to porazdelitev in ga interpretirajte.b) Izraunajte koeficient sploenosti za to porazdelitev in ga interpretirajte.c) Nariite histogram. Ali grafina predstavitev vrednosti potrjuje zgornje ugotovitve?d) Gospod X je imel ob nastopu bolezni 64.2 leti. S pomojo standardizacije ugotovite, ali je v

    primerjavi s povprejem za to boleznijo zbolel mlad ali star.

    77 87 92 97 97 97 102 102 102 102 102 107 107 107 107 107 112

    112 112 112 112 112 117 117 117 117 122 122 122 127 127 132 132 142

  • 7/23/2019 opisna_statistika_01

    38/38

    Anuka Ferligoj, Katja Lozar Manfreda, Ale iberna: Osnove statistike na prosojnicahLjubljana, FDV, 2010

    4. Primeri izpitnih vpraanj

    Dane so vrednosti: 10, 8, 14, 14, 16, 10. Aritmetina sredina danih vrednosti je 12. Varianca je:a) 2,83

    b) 3,27c) 0d) 8

    68.3% vseh vrednosti standardizirane normalno porazdeljene sluajne spremenljivkea) lei na intervalu od -1 do +1

    b) lei na intervalu od -3 do +3c) je samo pozitivnihd) lei na intervalu od minus do plus neskonno

    e je koeficient asimetrije, izraunan s centralnimi momenti, enak 2.05, je porazdelitev spremenljivkea) sploena

    b) asimetrina v levoc) koniasta

    d) asimetrina v desno

    e elimo primerjati variabilnost ocen pri dveh predmetih, moramo primerjatia) normalizirane vrednost

    b) koeficienta variacijec) najmanji vrednostid) asimetrini sredini

    e ima enota standardizirano vrednost 1.3, pomeni, da imaa) vrednost, ki je veja od aritmetine sredine,

    b) vrednost, ki je manja od aritmetine sredine,c) vrednost, ki je 1.3-krat veja od aritmetine sredine,d) koniasto porazdelitev