ANALIZA PRIKUPLJENIH PODATAKA Merenje uzorkovanje i deskriptivna statistika

  • Slides: 31
Download presentation
ANALIZA PRIKUPLJENIH PODATAKA Merenje, uzorkovanje i deskriptivna statistika Vežbe 2

ANALIZA PRIKUPLJENIH PODATAKA Merenje, uzorkovanje i deskriptivna statistika Vežbe 2

Donošenje zaključaka na osnovu rezultata istraživanja • Populacija: ma koja grupa pojedinaca koji poseduje

Donošenje zaključaka na osnovu rezultata istraživanja • Populacija: ma koja grupa pojedinaca koji poseduje zajedničku karakteristiku (ono što se istražuje) • Npr. Svi učenici trećeg razreda u R. Srbiji • Npr. Svi punoletni muškarci • Npr. Svi vaspitači u specijalnim školama • Uzorak: deo/podskup populacije za koji se utvrđuje stepen prisutnosti te karakteristike – Grupa ispitanika na kojima se vrši merenje/istraživanje • Npr: 58 učenika trećeg razreda OŠ “A” i OŠ “B” u Somboru • Npr: 150 slučajno odabranih punoletnih muškaraca sa prebivalištem u Novom Sadu • Npr. 14 vaspitača zaposlenih u SŠ “Vuk Karadžić” u Somboru • ZAKLJUČCI – Se donose na osnovu merenja na uzorku – Ali treba da se odnose na celu populaciju!!!

Donošenje zaključaka na osnovu rezultata istraživanja Populacija Uzorak Uzorkovanje ZAKLJUČIVANJE

Donošenje zaključaka na osnovu rezultata istraživanja Populacija Uzorak Uzorkovanje ZAKLJUČIVANJE

Odabir uzorka • Slučajni uzorak – Svaki član populacije ima jednake šanse da bude

Odabir uzorka • Slučajni uzorak – Svaki član populacije ima jednake šanse da bude izabran

Odabir uzorka • Sistematiski uzorak – Svaki n-ti član populacije biva biran za uzorak

Odabir uzorka • Sistematiski uzorak – Svaki n-ti član populacije biva biran za uzorak

Odabir uzorka • Stratifikovani uzorak – Populacija se prvo deli na određene grupe („stratume“)

Odabir uzorka • Stratifikovani uzorak – Populacija se prvo deli na određene grupe („stratume“) – A zatim se vrši slučajno uzorkovanje iz svakog stratuma

Odabir uzorka • Klasterski uzorak – Populacija se podeli na grupe (klastere) – Zatim

Odabir uzorka • Klasterski uzorak – Populacija se podeli na grupe (klastere) – Zatim se slučajno odabere određeni broj grupa – A onda se ispitaju svi članovi tih grupa

Odabir uzorka • CILJ: REPREZENTATIVNI UZORAK – onaj koji odražava svojstva cele populacije

Odabir uzorka • CILJ: REPREZENTATIVNI UZORAK – onaj koji odražava svojstva cele populacije

Odabir uzorka Ukupan broj studenata Uzorak (%) 1000 50 5 I godina III godina

Odabir uzorka Ukupan broj studenata Uzorak (%) 1000 50 5 I godina III godina IV godina Broj studenata po godinama 400 250 200 150 Uzorak 20 13 10 8

Zaključivanje • Parametar – osobina čitave populacije – Npr. Prosečna težina ljudi na planeti

Zaključivanje • Parametar – osobina čitave populacije – Npr. Prosečna težina ljudi na planeti Zemlji? • Statistik – osobina uzorka – Npr. Prosečna težina ljudi koji su odabrani za učešće u istraživanju i izmereni • Svaka procena parametra na osnovu statistika podrazumeva izvesno odstupanje – „grešku“ • Vrednost/veličina „greške“ se nikada ne zna pouzdano, ali se može proceniti na osnovu veličine i varijabiliteta uzorka

Vrste statističke obrade • Deskriptivna statistika – Koliki je bio prosečan nivo agresivnosti dečaka

Vrste statističke obrade • Deskriptivna statistika – Koliki je bio prosečan nivo agresivnosti dečaka i devojčica u uzorku? • Eksplanatorna statistika (statistika zaključivanja) – Da li se populacije dečaka i devojčica razlikuju u pogledu agresivnosti?

DESKRIPTIVNA STATISTIKA • Koji je razred pametniji? Razred A: IQ 102 115 96 114

DESKRIPTIVNA STATISTIKA • Koji je razred pametniji? Razred A: IQ 102 115 96 114 128 109 102 106 131 89 89 98 98 106 IQ: 104 93 Prosečan 110. 54 140 119 107 101 93 97 93 88 110 101 99 112 92 95 Razred B: IQ 111 103 79 101 95 103 132 115 84 129 91 89 114 IQ: 101 94 Prosečan 110. 27 112 109 88 112 94 87 99 87 83 109 103 100 99 104

DESKRIPTIVNA STATISTIKA • Kako sažeto opisati prikupljene podatke? • Mere centralne tendencije – Aritmetička

DESKRIPTIVNA STATISTIKA • Kako sažeto opisati prikupljene podatke? • Mere centralne tendencije – Aritmetička sredina (prosek) – Medijana – Mod • Mere varijabilnosti – – – Opseg/raspon Kvartili Srednje odstupanje Varijansa Standardna devijacija

MERE CENTRALNE TENDENCIJE

MERE CENTRALNE TENDENCIJE

Aritmetička sredina • Prosek • Zbir svih podataka podeljen brojem podataka

Aritmetička sredina • Prosek • Zbir svih podataka podeljen brojem podataka

Aritmetička sredina • Najčešće korišćena • ALI: VISINA PLATE Svi mi • • Bill

Aritmetička sredina • Najčešće korišćena • ALI: VISINA PLATE Svi mi • • Bill Gates Outlier Ar. sredinu mogu veoma poremetiti “autlajeri” (ekstremne vrednosti) Autlajeri mogu učiniti ar. sredinu lošom merom centralne tendencije (zajedničkog iskustva)

Medijana • Srednji broj u nizu brojeva koji je poređan po rastućoj/opadajućoj vrednosti •

Medijana • Srednji broj u nizu brojeva koji je poređan po rastućoj/opadajućoj vrednosti • Neparni nizovi: broj u sredini – 5, 7, 4, 5, 20, 6, 2 – 2, 4, 5, 5, 6, 7, 20 • Parni nizovi: prosek srednja dva broja – 4, 5, 5, 6, 7, 20 • M = (5+6)/2 = 5. 5 Autlajeri je ne remete kao ar. sredinu Svi mi Bill Gates outlier

Mod • Najčešća vrednost u skupu brojeva • Skup: 3, 4, 6, 1, 8,

Mod • Najčešća vrednost u skupu brojeva • Skup: 3, 4, 6, 1, 8, 8, 9, 3, 4, 6, 8, 2, 3, 8, 8, 0, 9, 8, 4, 5, 6, 8, 3, 3, 4, 7, 8, 9, 8, 0, 8, 5, 8 • Mod = 8

Mere centralne tendencije: razlike Simetrična distribucija Medijan Zakrivljena distribucija Ar. sredina Mod Medijan Ar.

Mere centralne tendencije: razlike Simetrična distribucija Medijan Zakrivljena distribucija Ar. sredina Mod Medijan Ar. sredina

MERE VARIJABILNOSTI

MERE VARIJABILNOSTI

Mere varijabilnosti • Mere raspršenja • Čemu one služe? • Precizniji/detaljniji/potpuni opis podataka Grupa

Mere varijabilnosti • Mere raspršenja • Čemu one služe? • Precizniji/detaljniji/potpuni opis podataka Grupa A Grupa B % IQ = 100 98, 101, 102, 99 (98 + 101 +102 + 99) / 4 = 100 72, 84, 128, 116 (72 + 84 +128 + 116) / 4 = 100 M = 100

Opseg • Raspon • Razlika između najveće i najmanje vrednosti u nizu Razred A:

Opseg • Raspon • Razlika između najveće i najmanje vrednosti u nizu Razred A: IQ 102 115 96 114 128 109 102 106 131 89 89 98 = 5293 98 R = 140 106 – 88 104 140 119 107 101 93 97 93 88 110 101 99 112 92 95 Razred B: IQ 111 103 79 101 95 103 132 115 84 129 91 = 4994 89 R = 132 114 – 83 101 112 109 88 112 94 87 99 87 83 109 103 100 99 104

Varijansa • Mera odstupanja skupa brojeva od proseka tog skupa • Izračunavanje? Razred A:

Varijansa • Mera odstupanja skupa brojeva od proseka tog skupa • Izračunavanje? Razred A: IQ 102 115 128 109 131 89 98 106 140 119 93 97 110 101 112 92 96 114 102 106 89 98 104 93 107 101 93 88 99 95 Koliko su vrednosti u nekom skupu udaljene od proseka? M = 110. 54 102 – 110. 54 = 8. 54 128 – 110. 54 = 17. 46 Itd. Σ=0

Varijansa • Način da izbegnemo da nam suma devijacija (odstupanja) od proseka bude nula

Varijansa • Način da izbegnemo da nam suma devijacija (odstupanja) od proseka bude nula je da svaku devijaciju kvadriramo, pa da ih tek nakon toga sumiramo (tj. saberemo) • Devijacija: xi – x • Suma kvadrata: • Varijansa:

Varijansa Ar. sredina

Varijansa Ar. sredina

Standardna devijacija • • Najčešće korišćena mera varijabilnosti Kvadratni koren varijanse Daje lakše razumljiv

Standardna devijacija • • Najčešće korišćena mera varijabilnosti Kvadratni koren varijanse Daje lakše razumljiv podatak o odstupanju nego varijansa Primer sa IQ-om u razredu: – – M = 110. 54 S 2 = 235. 45 S = 15. 43 Tumačenje: prosečan IQ u razredu je 110. 54, a odstupanje prosečne osobe od tog njega iznosi 15. 43 IQ poena – Što je veća SD to je veće raspršenje/odstupanje od proseka Ar. sredina

Standardna devijacija • Tumačenje: – Ukoliko je distribucija normalna – Oko 68% vrednosti/ispitanika biće

Standardna devijacija • Tumačenje: – Ukoliko je distribucija normalna – Oko 68% vrednosti/ispitanika biće obuhvaćeno +/- 1 SD – Oko 95% vrednosti/ispitanika biće obuhvaćeno +/- 2 SD – Oko 99, 7% vrednosti/ispitanika biće obuhvaćeno +/- 3 SD

Standardna devijacija • Primeri: – Ako je prosečna plata u Srbiji 300 EUR, a

Standardna devijacija • Primeri: – Ako je prosečna plata u Srbiji 300 EUR, a SD iznosi 130 EUR, to znači da oko 68% zaposlenih ima platu između 170 i 430 EUR, a oko 95% popuacije između 40 i 560 EUR – Da li je zaista tako? – Zbog čega nije?

Standardna devijacija • Primeri: – Ako prosečan građanin provede tri sata dnevno pred televizorom,

Standardna devijacija • Primeri: – Ako prosečan građanin provede tri sata dnevno pred televizorom, uz SD koja iznosi 1 h, to znači da oko 68% populacije proodi ispred televizora između 2 i 4 sata, a 95% populacije gleda TV između jedan i pet sati.

Pitanja?

Pitanja?

HVALA na pažnji

HVALA na pažnji