ANALIZA PRIKUPLJENIH PODATAKA Merenje uzorkovanje i deskriptivna statistika
- Slides: 31
ANALIZA PRIKUPLJENIH PODATAKA Merenje, uzorkovanje i deskriptivna statistika Vežbe 2
Donošenje zaključaka na osnovu rezultata istraživanja • Populacija: ma koja grupa pojedinaca koji poseduje zajedničku karakteristiku (ono što se istražuje) • Npr. Svi učenici trećeg razreda u R. Srbiji • Npr. Svi punoletni muškarci • Npr. Svi vaspitači u specijalnim školama • Uzorak: deo/podskup populacije za koji se utvrđuje stepen prisutnosti te karakteristike – Grupa ispitanika na kojima se vrši merenje/istraživanje • Npr: 58 učenika trećeg razreda OŠ “A” i OŠ “B” u Somboru • Npr: 150 slučajno odabranih punoletnih muškaraca sa prebivalištem u Novom Sadu • Npr. 14 vaspitača zaposlenih u SŠ “Vuk Karadžić” u Somboru • ZAKLJUČCI – Se donose na osnovu merenja na uzorku – Ali treba da se odnose na celu populaciju!!!
Donošenje zaključaka na osnovu rezultata istraživanja Populacija Uzorak Uzorkovanje ZAKLJUČIVANJE
Odabir uzorka • Slučajni uzorak – Svaki član populacije ima jednake šanse da bude izabran
Odabir uzorka • Sistematiski uzorak – Svaki n-ti član populacije biva biran za uzorak
Odabir uzorka • Stratifikovani uzorak – Populacija se prvo deli na određene grupe („stratume“) – A zatim se vrši slučajno uzorkovanje iz svakog stratuma
Odabir uzorka • Klasterski uzorak – Populacija se podeli na grupe (klastere) – Zatim se slučajno odabere određeni broj grupa – A onda se ispitaju svi članovi tih grupa
Odabir uzorka • CILJ: REPREZENTATIVNI UZORAK – onaj koji odražava svojstva cele populacije
Odabir uzorka Ukupan broj studenata Uzorak (%) 1000 50 5 I godina III godina IV godina Broj studenata po godinama 400 250 200 150 Uzorak 20 13 10 8
Zaključivanje • Parametar – osobina čitave populacije – Npr. Prosečna težina ljudi na planeti Zemlji? • Statistik – osobina uzorka – Npr. Prosečna težina ljudi koji su odabrani za učešće u istraživanju i izmereni • Svaka procena parametra na osnovu statistika podrazumeva izvesno odstupanje – „grešku“ • Vrednost/veličina „greške“ se nikada ne zna pouzdano, ali se može proceniti na osnovu veličine i varijabiliteta uzorka
Vrste statističke obrade • Deskriptivna statistika – Koliki je bio prosečan nivo agresivnosti dečaka i devojčica u uzorku? • Eksplanatorna statistika (statistika zaključivanja) – Da li se populacije dečaka i devojčica razlikuju u pogledu agresivnosti?
DESKRIPTIVNA STATISTIKA • Koji je razred pametniji? Razred A: IQ 102 115 96 114 128 109 102 106 131 89 89 98 98 106 IQ: 104 93 Prosečan 110. 54 140 119 107 101 93 97 93 88 110 101 99 112 92 95 Razred B: IQ 111 103 79 101 95 103 132 115 84 129 91 89 114 IQ: 101 94 Prosečan 110. 27 112 109 88 112 94 87 99 87 83 109 103 100 99 104
DESKRIPTIVNA STATISTIKA • Kako sažeto opisati prikupljene podatke? • Mere centralne tendencije – Aritmetička sredina (prosek) – Medijana – Mod • Mere varijabilnosti – – – Opseg/raspon Kvartili Srednje odstupanje Varijansa Standardna devijacija
MERE CENTRALNE TENDENCIJE
Aritmetička sredina • Prosek • Zbir svih podataka podeljen brojem podataka
Aritmetička sredina • Najčešće korišćena • ALI: VISINA PLATE Svi mi • • Bill Gates Outlier Ar. sredinu mogu veoma poremetiti “autlajeri” (ekstremne vrednosti) Autlajeri mogu učiniti ar. sredinu lošom merom centralne tendencije (zajedničkog iskustva)
Medijana • Srednji broj u nizu brojeva koji je poređan po rastućoj/opadajućoj vrednosti • Neparni nizovi: broj u sredini – 5, 7, 4, 5, 20, 6, 2 – 2, 4, 5, 5, 6, 7, 20 • Parni nizovi: prosek srednja dva broja – 4, 5, 5, 6, 7, 20 • M = (5+6)/2 = 5. 5 Autlajeri je ne remete kao ar. sredinu Svi mi Bill Gates outlier
Mod • Najčešća vrednost u skupu brojeva • Skup: 3, 4, 6, 1, 8, 8, 9, 3, 4, 6, 8, 2, 3, 8, 8, 0, 9, 8, 4, 5, 6, 8, 3, 3, 4, 7, 8, 9, 8, 0, 8, 5, 8 • Mod = 8
Mere centralne tendencije: razlike Simetrična distribucija Medijan Zakrivljena distribucija Ar. sredina Mod Medijan Ar. sredina
MERE VARIJABILNOSTI
Mere varijabilnosti • Mere raspršenja • Čemu one služe? • Precizniji/detaljniji/potpuni opis podataka Grupa A Grupa B % IQ = 100 98, 101, 102, 99 (98 + 101 +102 + 99) / 4 = 100 72, 84, 128, 116 (72 + 84 +128 + 116) / 4 = 100 M = 100
Opseg • Raspon • Razlika između najveće i najmanje vrednosti u nizu Razred A: IQ 102 115 96 114 128 109 102 106 131 89 89 98 = 5293 98 R = 140 106 – 88 104 140 119 107 101 93 97 93 88 110 101 99 112 92 95 Razred B: IQ 111 103 79 101 95 103 132 115 84 129 91 = 4994 89 R = 132 114 – 83 101 112 109 88 112 94 87 99 87 83 109 103 100 99 104
Varijansa • Mera odstupanja skupa brojeva od proseka tog skupa • Izračunavanje? Razred A: IQ 102 115 128 109 131 89 98 106 140 119 93 97 110 101 112 92 96 114 102 106 89 98 104 93 107 101 93 88 99 95 Koliko su vrednosti u nekom skupu udaljene od proseka? M = 110. 54 102 – 110. 54 = 8. 54 128 – 110. 54 = 17. 46 Itd. Σ=0
Varijansa • Način da izbegnemo da nam suma devijacija (odstupanja) od proseka bude nula je da svaku devijaciju kvadriramo, pa da ih tek nakon toga sumiramo (tj. saberemo) • Devijacija: xi – x • Suma kvadrata: • Varijansa:
Varijansa Ar. sredina
Standardna devijacija • • Najčešće korišćena mera varijabilnosti Kvadratni koren varijanse Daje lakše razumljiv podatak o odstupanju nego varijansa Primer sa IQ-om u razredu: – – M = 110. 54 S 2 = 235. 45 S = 15. 43 Tumačenje: prosečan IQ u razredu je 110. 54, a odstupanje prosečne osobe od tog njega iznosi 15. 43 IQ poena – Što je veća SD to je veće raspršenje/odstupanje od proseka Ar. sredina
Standardna devijacija • Tumačenje: – Ukoliko je distribucija normalna – Oko 68% vrednosti/ispitanika biće obuhvaćeno +/- 1 SD – Oko 95% vrednosti/ispitanika biće obuhvaćeno +/- 2 SD – Oko 99, 7% vrednosti/ispitanika biće obuhvaćeno +/- 3 SD
Standardna devijacija • Primeri: – Ako je prosečna plata u Srbiji 300 EUR, a SD iznosi 130 EUR, to znači da oko 68% zaposlenih ima platu između 170 i 430 EUR, a oko 95% popuacije između 40 i 560 EUR – Da li je zaista tako? – Zbog čega nije?
Standardna devijacija • Primeri: – Ako prosečan građanin provede tri sata dnevno pred televizorom, uz SD koja iznosi 1 h, to znači da oko 68% populacije proodi ispred televizora između 2 i 4 sata, a 95% populacije gleda TV između jedan i pet sati.
Pitanja?
HVALA na pažnji
- Deskriptivna statistika
- Statistika mod
- Deskriptivna statistika primjer
- Najmanja jedinica za kolicinu informacija
- Statistika unos podataka
- Statistika unos podataka
- Stopnik priamky
- Deskriptívna geometria postupy
- Mosna znanost
- Konštrukcia elipsy
- Eksplorativna istrazivanja
- Dubinska analiza podataka
- Stupčasti dijagram
- Analiza finansijskih izveštaja ekof
- Prikazivanje i analiza podataka
- Temperaturna krivulja
- Merenje mase tela vagom
- Merenje zracenja u stanu
- Osnovne i izvedene fizičke veličine
- Aparat za merenje dubine mora
- Medijalni retinakulum
- Merenje sile
- Merenje otpornosti
- Merenje mase
- Fizika međudjelovanje tijela zadaci
- Elektroenergetski sistemi ftn
- Merenje mase vagom
- Intelektualne sposobnosti
- Projektovanje baza podataka
- Poligon frekvencija
- Relacioni operatori
- Plošna baza podataka