Numerike deskriptivne veliine 20092009 1 Osobine numerikih podataka
Numeričke deskriptivne veličine 2009/2009 1
Osobine numeričkih podataka- mere Numeričko opisivanje podataka Centralna tendencija Kvartili Varijacija Asimetrija raspon zakrivljenost aritmetička srednja vrednost interkvartilini raspon zašiljenost medijana varijansa modus geometrijska srednja vrednost 2009/2009 standardna devijacija koeficijent varijacije 2
Osobine numeričkih podataka Centralna tendencija (lokacija centra) Varijacija (Rasipanje) Asimetrija 2009/2009 3
Odbacivanje ekstremnih vrednosti v Ekstremno visoka vrednost se odbacuje ako je: v Ekstremno niska vrednost se odbacuje ako je: 2009/2009 4
Mere centralne tendencije Centralna tendencija Aritmetička srednja vrednost Medijana sredina rangiranih vrednosti 2009/2009 Modus Geometrijska srednja vrednost najfrekventnija vrednost 5
Aritmetička srednja vrednost (average, mean) Ø Ø Ø Najčešće korišćena mera Ponaša se kao ”ravnotežna tačka” Na njenu vrednost utiču ekstremne vrednosti (”outliers”) Izražava se u istim jedinicama kao i osnovni podaci Izraz za izračunavanje: broj podataka 2009/2009 dobijena vrednost 6
Aritmetička srednja vrednost Uticaj ekstremnih vrednosti 0 1 2 3 4 5 6 7 8 9 10 srednja vrednost = 3 2009/2009 0 1 2 3 4 5 6 7 8 9 10 srednja vrednost = 4 7
Prosta srednja vrednost vs. ponderisana – težinska srednja vrednost Ø Ponderisana aritmetička srednja vrednost izračunava se kada su podaci prikazani kao frekvence: Ø Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se izračunava: 2009/2009 8
Geometrijska srednja vrednost Ø Ø n-ti koren proizvoda svih članova skupa Primer: 1, 2, 3, 10 G x = 4 -ti koren iz 60 = 2. 78 II način izračunavanja G x: 1. logaritmovanje svakog broja u skupu 2. računanje aritmetičke sredine tih logaritama 3. dizanje osnove logaritma (ln-2. 718 ili log-10) na izračunatu aritmetičku sredinu logaritama (korak 2) 2009/2009 9
Skraćena srednja vrednost Ø Ø Računa se tako što se iz skupa izbace ekstremne vrednosti sa oba kraja raspodele (najniže i najviše vrednosti 5 -25% vrednosti je uobičajeno da se odbaci i onda se računa srednja vrednost Eliminiše se uticaj ekstremnih vrednosti Primena – sport da bi se eliminisali efekti ekstremnih ocena dobijenih pogrešnom procenom sudija 2009/2009 10
Medijana (Me) Ø Ø Ø Medijana je centralna vrednost u nizu podataka v 50% vrednosti je iznad, 50% ispod medijane Pre određivanje medijane podaci se urede po veličini Na Me ne utiču ekstremne vrednosti 0 1 2 3 4 5 6 7 8 9 10 medijana = 3 2009/2009 0 1 2 3 4 5 6 7 8 9 10 medijana = 3 11
Određivanje medijane Ø Pozicija medijane (u uređenim podacima): Ø Ø Ako je broj podataka neparan, medijana je vrednost u sredini niza Ako je broj podataka paran, medijana je srednja vrednost dve vrednosti u sredini niza (između N/2 i (N+2)/2) Ø Napomena: v izraz nije vrednost medijane, već redni broj vrednosti koja predstavlja medijanu 2009/2009 12
Modus (Mo) Ø Vrednost koja se pojavljuje najčešće Ø Na Mo ne utiču ekstremne vrednosti Ø U skupu može biti jedan ili više modusa Ø Skup može biti bez modusa Ø Mo može da se odredi i za numeričke i kategoričke podatke 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 modus = 9 2009/2009 0 1 2 3 4 5 6 nema modusa 13
2009/2009 14
v Broj osoba v 7 0 v 6 0 v 5 0 v 4 0 v antimode v v 3 0 v 2 0 v 1 0 KG 0 v v 1 , 5 v 2009/2009 KV 2 v Log PO-aze v v 2 , 5 v 3 , 5 v 4 Log DZO-aze Aktivnost enzima PON 1 v 4 , 5 v 5 15
Skale merenja- mere centralne tendencije Ø Ø Ø intervalna/skala odnosa - x, Me, Mo ordinalna – Me, Mo nominalna – samo Mo!!! 2009/2009 16
Kvartili dele skup uređenih podataka na četiri jednaka dela Pozicione veličine Ø Ø 25% Q 1 Ø Ø 25%25% Q 2 25% Q 3 Prvi kvartil, Q 1 – 25% vrednosti su manje od Q 1 Drugi kvartil, Q 2 = medijana Treći kvartil, Q 3 = 25% vrednosti su veće od Q 1 i Q 3 nisu mere centralne tendencije 2009/2009 17
Određivanje kvartila Ø Ø Ø Pozicija (redni broj vrednosti) prvog kvartila: Q 1 = (N+1)/4 Pozicija (redni broj vrednosti) drugog kvartila: Q 2 = (N+1)/2 Pozicija (redni broj vrednosti) trećeg kvartila: Q 3 = 3(N+1)/4 gde je N ukupan broj podataka 2009/2009 18
Percentili Pozicija percentila: Ø Ø Prvi percentil P 1: odvaja 1% vrednosti Q 1 = P 25 Q 2 = Me = P 50 Q 3 = P 75 2009/2009 19
Mere varijacija raspon Ø interkvartilni raspon varijansa standardna devijacija koeficijent varijacije Mere varijacije daju informaciju o rasipanju ili varijabilnosti podataka isti centar, različita varijacija 2009/2009 20
Raspon Ø Ø Najjednostavnija mera varijacije Raspon – razlika između najveže i najmanje vrednosti u skupu raspon = xmax – xmin primer: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 raspon = 14 - 1 = 13 2009/2009 21
Nedostatak raspona Ø Ignoriše oblik raspodele podataka 7 8 9 10 11 12 7 raspon = 12 - 7 = 5 Ø 8 9 10 11 12 raspon = 12 - 7 = 5 Osetljiv na ekstremne vrednosti 1, 1, 1, 2, 2, 3, 3, 4, 5 raspon = 5 - 1 = 4 1, 1, 1, 2, 2, 3, 3, 4, 120 raspon = 120 - 1 = 119 2009/2009 22
Interkvartilni raspon Ø Ø Rasipanje unutar srednjih 50%: Q 3 – Q 1 Nema uticaja ekstremnih vrednosti primer: Xmin Q 1 25% 12 medijana (Q 2) 25% 30 Q 3 25% 45 Xmax 25% 57 70 interkvartilni raspon = 57 – 30 = 27 2009/2009 23
Srednje apsolutno odstupanje - So Srednje apsolutno odstupanje (obeležava se sa So) određuje se tako što se zbir apsolutnih vrednosti pojedinačnih odstupanja svakog člana niza od srednje vrednosti podeli ukupnim brojem članova niza: 2009/2009 24
Varijansa Ø Prosečno (približno) kvadratno odstupanje vrednosti od srednje vrednosti v Izraz za izračunavanje: v N – 1 – broj stepena slobode 2009/2009 25
Standardna devijacija Ø Ø Najčešće korišćena mera varijacije Pokazuje varijaciju oko srednje vrednosti Kvadratni koren iz varijanse Izražava se u istim jedinicama kao i osnovni podaci 2009/2009 26
Broj stepena slobode - df, θ, φ Ø Ø Ø φ=N-1 φ - broj nezavisnih poredjenja x 1 i x 2 nezavisne vrednosti, φ = 2 2009/2009 27
Standardna devijacija - Sd Podaci: 2009/2009 4, 9 6, 3 7, 7 8, 9 10, 3 11, 7 28
Sd - grupisani podaci 2009/2009 29
Standardna devijacija iz razlike parova U 12 uzoraka seruma određena glukoza u duplikatu 2009/2009 30
Značenje standardne devijacije mala standardna devijacija velika standardna devijacija 2009/2009 31
Poređenje standardnih devijacija grupa A sr. vrednost = 15. 5 SD = 3, 338 11 12 13 14 15 16 17 18 19 20 21 grupa B 11 12 13 14 15 16 17 18 19 20 21 sr. vrednost = 15. 5 Sd = 0, 926 grupa C 11 2009/2009 12 13 14 15 16 17 18 19 20 21 sr. vrednost = 15. 5 Sd = 4, 567 32
Osobine varijanse i standardne devijacije Ø Svaka vrednost se koristi u izračunavanju v razlika u odnosu na raspon i interkvartilni raspon Ø Veliki uticaj ekstremnih vrednosti v izračunava se kvadrat odstupanja od srednje vrednosti 2009/2009 33
Koeficijent varijacije - Kv Ø Ø Ø Mera relativne varijacije (u odnosu na srednju vrednost) Uvek se izražava u % Omogućava poredjenje više grupa podataka, čak i kada su izraženi u različitim jedinicama 2009/2009 34
Poređenje koeficijenata varijacije Ø Grupa A: v srednja vrednost = 50 v standardna devilacija = 5 Ø Grupa B: v srednja vrednost = 100 v standardna devilacija = 5 2009/2009 35
Asimetrija raspodele Ø Pokazuju kako su podaci distribuirani v zakrivljenost i zašiljenost levostrana Me 2009/2009 Mo simetrična = Me = Mo desnostrana Mo Me 36
Numeričke mere za populaciju i uzorak Ø Ø Ø 2009/2009 Statistički parametri koji se izračunavaju iz populacije opisuju osobine populacije Statistički parametri koji se izračunavaju iz uzorka opisuju osobine uzorka Srednja vrednost populacije – μ Srednja vrednost uzorka – Standardna devijacija populacije – σ Standardna devijacija uzorka – Sd 37
Z-score –Standardni skor Ø Odstupanje posmatrane vrednosti od x izraženo u broju Sd Ø Z=(x - x)/Sd Ø Mera relativnog odstupanja Z pozitivan – veći od većine vrednosti u skupu Z negativan – manji od većine vrednosti u skupu Ø Ø 2009/2009 38
Z-score 2009/2009 39
Z-score primer Ø Kontrolom kvaliteta težine tableta dobijeno je 120 vrednosti iz kojih su izračunate srednja vrednost 500. 5 mg i Sd 3 mg. Koliki je Z-score za tablete težine 496 mg? Ø Rešenje (496 -500. 5)/3=-1. 5 2009/2009 40
Z-score primer 2 Ø Devojka je visoka 160 cm i ima z-score 0. 7 u odnosu na x visinu grupe koja iznosi 168 cm. Kolika je Sd? 2009/2009 41
- Slides: 41