Univerzitet u Beogradu Filozofski fakultet STATISTIKA U PSIHOLOGIJI
Univerzitet u Beogradu Filozofski fakultet STATISTIKA U PSIHOLOGIJI 1 STATISTIKA U ISTRAŽIVANJU OBRAZOVANJA OPIS UZORKA U POGLEDU JEDNE KVANTITATIVNE VARIJABLE GRAFIČKO PREDSTAVLJANJE PODATAKA NA KVANTITATIVNOJ VARIJABLI Lazar Tenjović i Oliver Tošković
PODACI SA JEDNE KVANTITATIVNE VARIJABLE • Da bismo podatke sa jedne kvantitativne varijable upotrebili za statistički opis uzorka u pogledu te varijable potrebno ih je organizovato na određeni način; • Ponekad je potrebno rezultate sortirati (urediti po veličini) ponekad ih je potrebno rangovati, a ponekad grupisati. • Grupisanje: pravljenje raspodele učestalosti (jedinične ili sa grupnim intervalima razreda).
STATISTIČKI OPIS UZORKA u pogledu jedne KVANTITATIVNE VARIJABLE • Treba da pruži pregledne i jasne informacije: • o rasponu u kojem se rezultati kreću (podrazumeva određivanje najmanjeg i najvećeg rezultata); • o učestalosti (frekvenciji) pojedinih rezultata ili grupe rezultata (podrazumeva pravljenje jedinične ili grupisane raspodele učestalosti); • o vrednosti oko koje se grupišu rezultati (podrazumeva računanje mera lokacije/mere centralne tendencije i percentili/ • o tome koliko se rezultati međusobno razlikuju (podrazumeva računanje mera skale/varijabilnosti ili raspršenja) i • o obliku raspodele rezultata (podrazumeva računanje mera oblika distribucije /pokazatelja simetričnosti i “kurtotičnosti” distribucije/.
Sortiranje i rangovanje
Jedinična distribucija frekvencija
Grupisana distribucija frekvencija
Jedinična distribucija frekvencija: SPSS Uspeh na testu znanja biologije Frequency Valid Percent Cumulative Percent 0 1 3. 3 1 1 3. 3 6. 7 2 2 6. 7 13. 3 4 3 10. 0 23. 3 5 9 30. 0 53. 3 6 7 23. 3 76. 7 7 3 10. 0 86. 7 8 2 6. 7 93. 3 9 1 3. 3 96. 7 10 1 3. 3 100. 0 30 100. 0 Total
Grupisana distribucija frekvencija: SPSS Rezultat na upitniku depresivnosti CES_D grupisano 2 Frequency Valid Total Valid Percent Cumulative Percent 0 -4 36 14. 3 14. 5 5 -9 38 15. 1 15. 3 29. 7 10 -14 66 26. 2 26. 5 56. 2 15 -19 40 15. 9 16. 1 72. 3 20 -24 28 11. 1 11. 2 83. 5 25 -29 20 7. 9 8. 0 91. 6 30 -34 8 3. 2 94. 8 35 -39 8 3. 2 98. 0 40 -44 3 1. 2 99. 2 45 -49 2 . 8 100. 0 249 98. 8 100. 0 3 1. 2 252 100. 0 Total Missing Percent System
Centralna tendencija i varijabilitet Razlika između ljudi centar
MERE CENTRALNE TENDENCIJE • Mod – Najučestalija mera – Neosetljiv na ekstremne mere 1 4 3 4 1 4 5 mod 1 4 3 mod 1 4 1 mod 2 1
MERE CENTRALNE TENDENCIJE • Medijana (Mdn) – Vrednost ispod koje se nalazi 50% rezultata – Blago osetljiva na ektremne mere 50% medijana
MERE CENTRALNE TENDENCIJE • Određivanje medijane (Mdn) na osnovu redoslednih statistika. • Redosledni statistici: rezultati uređeni po veličini od najmanjeg do najvećeg - označavaju se oznakom X(m) pri čemu je m oznaka mesta po redu na kojem je rezultat. zagrade [ ] znače da se uzima samo celobrojni deo vrednosti koja se izračuna
MERE CENTRALNE TENDENCIJE • Aritmetička sredina (M ili AS): – Suma (zbir) pojedinačnih mera podeljena ukupnim brojem mera – Osetljiva na ekstremne mere
MERE CENTRALNE TENDENCIJE • Geometrijska sredina (G): • Harmonijska sredina (H)
PROCENAT ISPITANIKA ISPOD NEKE VREDNOSTI 50% -2 50% -1 0 1 2
PERCENTILI • Percentil – P 25 – vrednost ispod koje se nalazi 25% rezultata – P 50 – vrednost ispod koje se nalazi 50% rezultata • Kvartili – – Q 1= P 25 Q 2= P 50 OVO JE OČIGLEDNO MEDIJANA! Q 3= P 75 Q 4= P 100 • Percentilni rang – PR(x) – % rezultata koji se nalaze ispod vrednosti X – PR(100) – % rezultata koji se nalaze ispod vrednosti 100
PERCENTILI 50% 84. 13% Percentilni rang 97. 72% 15. 87% 2. 28% -2 -1 P 2. 28 P 15. 87 0 1 2 P 50 P 84. 13 P 97. 72 Percentil
MERE VARIJABILNOSTI • Kvartilna devijacija ili poluinterkvartilni raspon 50% 25 % P 25 Q 1 P 75 Q 3
MERE VARIJABILNOSTI • Standardna devijacija (S, Sd, σ) – pozitivni kvadratni koren iz prosečnog kvadriranog odstupanja mera od njihove aritmetičke sredine; – često se umesto n u imeniocu nalazi n – 1, ali o tome drugom prilikom; – mera individualnih razlika; – ne može biti negativna vrednost!
MERE VARIJABILNOSTI • Varijansa (S 2, Sd 2, V, σ2) – često se umesto n u imeniocu nalazi n – 1, ali o tome drugom prilikom. – izraz u brojiocu, veoma važan u statistici: SUMA KVADRATA – prosečno kvadrirano odstupanje mera od aritmetičke sredine – mera individualnih razlika – moguće razlaganje na delove, za razliku od S
RELATIVNE MERE VARIJABILNOSTI • Za razliku od apsolutnih (S, Q. . . ) relativne mere varijabilnosti se mogu koristiti za direktno poređenje različitih uzoraka na istoj varijabli istog uzorka na različitim varijablama. • Koeficijent varijacije (CV) – Odnos standardne devijacije i aritmetičke sredine; – Može se pomnožiti sa 100 i tada prikazuje procenat individualnih razlika u odnosu na prosek
RELATIVNE MERE VARIJABILNOSTI • Koeficijent interkvartilne varijacije (VQ) – Odnos razlike i zbira prvog i trećeg kvartila; – Kreće se u segmentu od 0 do 1 (ako se pomnoži sa 100 od 0% do 100%).
MERE OBLIKA RASPODELE • Koeficijent asimetrije-Skjunis (Sk): • Kurtozis (Ku)
Normalna distribucija: skjunis i kurtozis jednaki 0
Pozitivno asimetrična distribucija (Koeficijent asimetrije/skjunis veći od nule) Mod Mdn M Negativno asimetrična distribucija (Koeficijent asimetrije/skjunis manji od nule) M Mdn Mod
Orijentaciona pravila za tumačenje skjunisa • Sk jednak 0: raspodela simetrična; • Sk od -0. 5 do skoro 0: blago negativno asimetrična; • Sk od -0. 5 do -1: umereno negativno asimetrična; • Sk manji od -1: znatno negativno asimetrična; • Sk od skoro 0 do 0. 5: blago pozitivno asimetrična raspodela; • Sk od 0. 5 do 1: umereno pozitivno asimetrična raspodela; • Sk veći od 1: znatno pozitivno asimetrična raspodela.
Orijentaciona pravila za tumačenje kurtozisa (samo za unimodalne relativno simetrične raspodele) • Ku = 0: raspodela normalna; • Ku > 0: distribucija ima razvučenije i(li) izdignutije krajeve od normalne raspodele, tj. nagomilane rezultate na krajevima; • Ku < 0: distribucija ima manje razvučene i(li) izdignute krajeve od normalne raspodele, tj. nagomilane rezultate u sredini raspodele.
GRAFIČKI PRIKAZ PODATAKA SA KVANTITATIVNE VARIJABLE • • Poligon frekvencija (učestalosti) Histogram – poligon stubaca Grafik kumulativnih frekvencija Grafik kumulativnih procenata
POLIGON FREKVENCIJA intervali razreda frekvencija srednje mesto intervala 37 -40 30 38. 5 33 -36 23 34. 5 29 -32 55 30. 5 25 -28 61 26. 5 21 -24 50 22. 5
POLIGON FREKVENCIJA 70 60 frekvencija 50 40 30 20 10 0 22. 5 26. 5 30. 5 sredina razreda 34. 5 38. 5
HISTOGRAM • Stupci iznad donje i gornje egzaktne granice razrednog intervala: frekvencije predstavljene površinom stupca.
GRAFIK KUMULATIVNIH FREKVENCIJA srednje gornja intervali mesto kumulativna egzaktna razreda frekvencija intervala frekvencija granica 37 -40 30 38. 5 219 40. 5 33 -36 23 34. 5 189 36. 5 29 -32 55 30. 5 166 32. 5 25 -28 61 26. 5 111 28. 5 21 -24 50 22. 5 50 24. 5
GRAFIK KUMULATIVNIH FREKVENCIJA • Kumulativne frekvencije predstavljene tačkama iznad gornje egzaktne granice intervala razreda. Tačke se povezuju linijom. 250 frekvencija 200 150 100 50 0 24. 5 28. 5 32. 5 gornja egz granica 36. 5 40. 5
GRAFIK KUMULATIVNIH RELATIVNIH FREKVENCIJA OGIVA srednje kumulativ gornja intervali mesto kumulativ na rel. egzaktna razreda frekvencija intervala na frekv. granica 37 -40 30 38. 5 219 1. 00 40. 5 33 -36 23 34. 5 189 0. 86 36. 5 0. 76 29 -32 55 30. 5 166 32. 5 25 -28 61 26. 5 111 0. 51 28. 5 21 -24 50 22. 5 50 0. 23 24. 5
GRAFIK KUMULATIVNIH RELATIVNIH FREKVENCIJA OGIVA 1. 2 1 proporcija 0. 8 0. 6 0. 4 0. 2 0 24. 5 28. 5 32. 5 gornja egz granica 36. 5 40. 5
KUTIJASTI DIJAGRAM (BOX & WHISKER PLOT) autlajer donja okolinska medijana prvi kvartil ili iznimak (engl. gornja outlier okolinska treći kvartil okolinske vrednosti – kvartili +/- 1. 5*interkvartilni raspon
Opšta uputstva za grafike • Grafike treba koristiti samo onda kada pojednostavljuju razumevanje strukture i značenja podataka: onda kada je podatke sasvim lako moguće razumeti iz tabela i brojčanih prikaza nema mesta graficima; • Ose jasno označene (imena varijabli i jedinice); • Prekidi skala ucrtani na osi // kada distribucija prirodno ne počinje od nule; • Povezani dijagrami treba da imaju identične skale merenja; • Legenda treba da učini grafik jasnim bez konsultovanja okolnog teksta; • Grafici ne služe da se “zaseni prostota” već da pruže informaciju o podacima: “ukrasima” koji ne nose nikakvu informaciju nije mesto na graficima (npr. treća dimenzija).
KRAJ PREZENTACIJE. . . I DANAŠNJEG PREDAVANJA (:
- Slides: 38