Statistika Akademska 2019 2020 Predavanje 4 Uzorak i

  • Slides: 44
Download presentation
Statistika Akademska 2019 – 2020. Predavanje 4 Uzorak i statistike uzorka Statistika _ SPi.

Statistika Akademska 2019 – 2020. Predavanje 4 Uzorak i statistike uzorka Statistika _ SPi. SR 12. i 19. 03. 2020.

Fokus predavanja § Različiti metodi određivanja uzoraka § Koncept distribucije uzoraka § Računanje vjerovatnoća

Fokus predavanja § Različiti metodi određivanja uzoraka § Koncept distribucije uzoraka § Računanje vjerovatnoća vezanih za sredine uzoraka i proporcije uzoraka § Značaj centralne granične teoreme Statistika _ SPi. SR 12. 03. 2020.

Statistika uzorka § Parametar je deskriptivna mjera izračunata na osnovu vrijednosti svih jedinica osnovnog

Statistika uzorka § Parametar je deskriptivna mjera izračunata na osnovu vrijednosti svih jedinica osnovnog skupa. Parametri skupa su konstante. § Statistika je deskriptivna mjera izračunata na osnovu vrijednosti elemenata uzorka. Statistika uzorka je slučajna promjenljiva. § Svaka statistika uzorka ima svoj raspored vjerovatnoće – raspored statistike uzorka. Statistika _ SPi. SR 12. 03. 2020.

Rasporedi statistika uzoraka Rasporedi uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR Raspored

Rasporedi statistika uzoraka Rasporedi uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR Raspored proporcija uzoraka 12. 03. 2020.

Distribucije uzoraka § Distribucija uzoraka je raspored svih mogućih vrijednosti statistike za datu veličinu

Distribucije uzoraka § Distribucija uzoraka je raspored svih mogućih vrijednosti statistike za datu veličinu uzorka koji je odabran iz osnovnog skupa Statistika _ SPi. SR 12. 03. 2020.

Distribucija uzoraka § Pretpostavimo da postoji populacija … § Veličina populacije N=4 A B

Distribucija uzoraka § Pretpostavimo da postoji populacija … § Veličina populacije N=4 A B C D § Slučajna varijabla, X, je starost pojedinaca § Vrijednosti X: 18, 20, 22, 24 (u godinama) Statistika _ SPi. SR 12. 03. 2020.

Distribucija uzoraka (nastavak) Sumarne mjere distribucije populacije: P(x). 3. 2. 1 0 18 20

Distribucija uzoraka (nastavak) Sumarne mjere distribucije populacije: P(x). 3. 2. 1 0 18 20 22 24 A B C D x Uniformna distribucija Statistika _ SPi. SR 12. 03. 2020.

Distribucija uzoraka (nastavak) Razmotrimo sve uzorke veličine n=2 1 va Ops 2 ga Opservacija

Distribucija uzoraka (nastavak) Razmotrimo sve uzorke veličine n=2 1 va Ops 2 ga Opservacija 18 20 22 24 18 18, 20 18, 22 18, 24 20 20, 18 20, 20 20, 22 20, 24 22 22, 18 22, 20 22, 22 22, 24 24 24, 18 24, 20 24, 22 24, 24 16 aritmetičkih sredina iz uzoraka 16 mogućih uzoraka (uzorak sa ponavljanjem) Statistika _ SPi. SR 12. 03. 2020.

Distribucija uzoraka (nastavak) Raspored svih aritmetičkih sredina iz uzoraka Raspored aritmetičkih sredina 16 sredina

Distribucija uzoraka (nastavak) Raspored svih aritmetičkih sredina iz uzoraka Raspored aritmetičkih sredina 16 sredina iz uzoraka _ P(X). 3. 2. 1 0 18 19 20 21 22 23 24 (nije uniformna distr. ) Statistika _ SPi. SR _ X 12. 03. 2020.

Distribucija uzoraka (nastavak) Deskriptivne mjere rasporeda: Statistika _ SPi. SR 12. 03. 2020.

Distribucija uzoraka (nastavak) Deskriptivne mjere rasporeda: Statistika _ SPi. SR 12. 03. 2020.

Upoređivanje populacije sa distribucijom njenih uzoraka Raspored aritmetičkih sredina uzoraka n = 2 Populacija

Upoređivanje populacije sa distribucijom njenih uzoraka Raspored aritmetičkih sredina uzoraka n = 2 Populacija N=4 _ P(X). 3 . 2 . 1 0 18 20 22 24 A B C D Statistika _ SPi. SR X 0 18 19 20 21 22 23 24 _ X 12. 03. 2020.

Raspored aritmetičkih sredina uzoraka Rasporedi uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR

Raspored aritmetičkih sredina uzoraka Rasporedi uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR Raspored proporcija uzoraka 12. 03. 2020.

Standardna greška aritmetičke sredine § Različiti uzorci iste veličine i iz istog osnovnog skupa

Standardna greška aritmetičke sredine § Različiti uzorci iste veličine i iz istog osnovnog skupa imaće različite aritmetičke sredine § Mjera varijabilnosti aritmetičkih sredina iz uzorka u uzorak data je standardnom greškom aritmetičke sredine: (Podrazumijeva se da je uzorak bio sa ponavljanjem iz konačne populacije, odnosno bez ponavljanja iz beskonačne populacije) § Zapazite da se standardna greška aritmetmičke sredine smanjuje sa poveđanjem uzorka Statistika _ SPi. SR 12. 03. 2020.

Populacija ima normalan raspored § Ako populacija ima normalan raspored sa aritmetičkom sredinom μ

Populacija ima normalan raspored § Ako populacija ima normalan raspored sa aritmetičkom sredinom μ i standardnom devijacijom σ, i distribucija uzoraka je takođe normalna sa i Statistika _ SPi. SR 12. 03. 2020.

Z-vrijednost za raspored aritmetičkih sredina uzoraka § Z-vrijednost raspored gdje: Statistika _ SPi. SR

Z-vrijednost za raspored aritmetičkih sredina uzoraka § Z-vrijednost raspored gdje: Statistika _ SPi. SR uzoraka: = aritmetička sredina uzorka = aritmetička sredina populacije = standardna devijacija populacije n = veličina uzorka 12. 03. 2020.

Osobine distribucije iz uzoraka Normalan raspored populacije § (tj. Statistika _ SPi. SR je

Osobine distribucije iz uzoraka Normalan raspored populacije § (tj. Statistika _ SPi. SR je nepristrasna ) Normalan raspored iz uzoraka (ima istu sredinu) 12. 03. 2020.

Osobine distribucije uzoraka (nastavak) Sa porastom n, Veći uzorak opada Manji uzorak Statistika _

Osobine distribucije uzoraka (nastavak) Sa porastom n, Veći uzorak opada Manji uzorak Statistika _ SPi. SR 12. 03. 2020.

Populacija nema normalan raspored § Primjenjuje se centralna granična teorema: § Čak i kad

Populacija nema normalan raspored § Primjenjuje se centralna granična teorema: § Čak i kad populacija nema normalan raspored, § …aritmetičke sredine uzoraka te populacije imaće raspored koji se može aproksimirati normalnom sve dok je veličina uzorka dovoljno velika. Osobine rasporeda aritmetičke sredine uzorka: i Statistika _ SPi. SR 12. 03. 2020.

Centralna granična teorema Sa povećavanjem veličine uzorka… Statistika _ SPi. SR n↑ Distribucija iz

Centralna granična teorema Sa povećavanjem veličine uzorka… Statistika _ SPi. SR n↑ Distribucija iz uzoraka postaje skoro normalna bez obzira na raspored populacije 12. 03. 2020.

Populacija nema normalan raspored (nastavak) Osobine distribucije uzoraka: Distribucija populacije Centralna tendencija Varijansa Statistika

Populacija nema normalan raspored (nastavak) Osobine distribucije uzoraka: Distribucija populacije Centralna tendencija Varijansa Statistika _ SPi. SR Distribucija uzorka (postaje normalna kad se n povećava) Veći Manji uzorak 12. 03. 2020.

Koliko veliki da bude uzorak? § Za najveći broj distribucija, n > 30 daće

Koliko veliki da bude uzorak? § Za najveći broj distribucija, n > 30 daće distribuciju uzorka koja je približno normalna § Za prilično simetrične distribucije, n > 15 § Za populaciju sa normalnim rasporedom, aritmetičke sredine uzorka uvijek imaju normalan raspored Statistika _ SPi. SR 12. 03. 2020.

Primjer § Pretpostavimo da populacija ima aritmetičku sredinu μ = 8 i standardnu devijaciju

Primjer § Pretpostavimo da populacija ima aritmetičku sredinu μ = 8 i standardnu devijaciju σ = 3. Odabran je slučajan uzorak veličine n = 36. § Kolika je vjerovatnoća da je aritmetička sredina između 7. 8 i 8. 2? Statistika _ SPi. SR 19. 03. 2020.

Primjer (nastavak) Rešenje: § I kad populacija nema normalan raspored, centralna granična teorema se

Primjer (nastavak) Rešenje: § I kad populacija nema normalan raspored, centralna granična teorema se može koristiti (n > 30) § … pa je distribucija normalna uzoraka približno § … sa aritmetičkom sredinom = 8 § …i standardnom devijacijom Statistika _ SPi. SR 19. 03. 2020.

Primjer (nastavak) Rešenje (nastavak): Distribucija populacije ? ? ? ? ? ? ? Distribucija

Primjer (nastavak) Rešenje (nastavak): Distribucija populacije ? ? ? ? ? ? ? Distribucija uzorka ? ? ? ? Uzorak ? X Statistika _ SPi. SR Standardizovan normalan raspored . 1554 +. 1554 Standardizovati 7. 8 8. 2 -0. 4 Z 19. 03. 2020.

Raspored proporcija uzoraka Distribucije uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR Raspored

Raspored proporcija uzoraka Distribucije uzoraka Raspored aritmetičkih sredina uzoraka Statistika _ SPi. SR Raspored proporcija uzoraka 19. 03. 2020.

Proporcije populacije π = proporcija populacije § Proporcija uzorka ( p ) daje ocjenu

Proporcije populacije π = proporcija populacije § Proporcija uzorka ( p ) daje ocjenu za π: § 0≤ p≤ 1 § p ima binomni raspored (pretpostavlja se uzorak sa ponavljanjem iz konačne populacije ili bez ponavljanja iz beskonačne populacije) Statistika _ SPi. SR 19. 03. 2020.

Raspored proporcija uzoraka § Aproksimira se normalnim rasporedom ako: P( p ) s. 3

Raspored proporcija uzoraka § Aproksimira se normalnim rasporedom ako: P( p ) s. 3 §. 2. 1 0 0 Distribucija uzoraka . 2 . 4 . 6 8 1 p gdje i (gdje π = proporcija populacije) Statistika _ SPi. SR 19. 03. 2020.

Z-vrijednosti za proporcije Standardizovati p u Z vrijednost pomoću formule: Statistika _ SPi. SR

Z-vrijednosti za proporcije Standardizovati p u Z vrijednost pomoću formule: Statistika _ SPi. SR 19. 03. 2020.

Primjer § Ako je prava proporcija glasača koji podržavaju Predlog A π = 0.

Primjer § Ako je prava proporcija glasača koji podržavaju Predlog A π = 0. 4, koja je vjerovatnoća da će u uzorku od 200 glasača, odgovarajuća proporcija u uzorku biti između 0. 40 i 0. 45? § tj. : ako π = 0. 4 i n = 200, koliko je P(0. 40 ≤ p ≤ 0. 45) ? Statistika _ SPi. SR 19. 03. 2020.

Primjer (nastavak) § Naći ako π = 0. 4 i n = 200, koliko

Primjer (nastavak) § Naći ako π = 0. 4 i n = 200, koliko je P(0. 40 ≤ p ≤ 0. 45) ? : Pretvoriti u standardizovani normalan: Statistika _ SPi. SR 19. 03. 2020.

Primjer (nastavak) § ako π = 0. 4 i n = 200, koliko je

Primjer (nastavak) § ako π = 0. 4 i n = 200, koliko je P(0. 40 ≤ p ≤ 0. 45) ? koristiti tablicu st. normal dist. : P(0 ≤ Z ≤ 1. 44) = 0. 4251 Standardizovani normalni raspored Distribucija uzoraka 0. 4251 Standardizovati 0. 40 Statistika _ SPi. SR 0. 45 p 0 1. 44 Z 19. 03. 2020.

Razlozi za korišćenje uzoraka § Potrebno kraće vrijeme nego za popis § Potrebno manje

Razlozi za korišćenje uzoraka § Potrebno kraće vrijeme nego za popis § Potrebno manje troškova nego za popis § Manje komplikovano i lakše za sprovođenje nego popis Statistika _ SPi. SR 19. 03. 2020.

Tipovi uzoraka § Ne-slučajni ili namjerni uzorak § Elementi su odabrani ne uzimajući u

Tipovi uzoraka § Ne-slučajni ili namjerni uzorak § Elementi su odabrani ne uzimajući u obzir vjerovatnoću njihovog pojavljivanja. Izbor elemenata u uzorak se vrši na osnovu suda istraživača § Slučajan uzorak § Elementi uzorka su odabrani na osnovu unaprijed poznatih vjerovatnoća Statistika _ SPi. SR 19. 03. 2020.

Tipovi uzoraka (nastavak) Uzorci Neprobabilistički (namjerni) uzorci Prost slučajan Subjektivni Kvota Statistika _ SPi.

Tipovi uzoraka (nastavak) Uzorci Neprobabilistički (namjerni) uzorci Prost slučajan Subjektivni Kvota Statistika _ SPi. SR Slučajni uzorci Pogodni Stratifikovan Sistematski Klaster 19. 03. 2020.

Slučajni uzorak § Elementi uzorka su odabrani na osnovu unaprijed poznatih vjerovatnoća Slučajni uzorci

Slučajni uzorak § Elementi uzorka su odabrani na osnovu unaprijed poznatih vjerovatnoća Slučajni uzorci Prost slučajan Statistika _ SPi. SR Sistematski Stratifikovan Klaster 19. 03. 2020.

Prost slučajan uzorak § Svaki pojedinačni uzorak od n elemenata iz osnovnog skupa ima

Prost slučajan uzorak § Svaki pojedinačni uzorak od n elemenata iz osnovnog skupa ima jednaku šansu da bude odabran § Odabiranje može biti sa ponavljanjem ili bez ponavljanja § Uzorci dobijeni pomoću tablice slučajnih brojeva ili pomoću kompjuterskog generatora slučajnih brojeva Statistika _ SPi. SR 19. 03. 2020.

Sistematski uzorak § Odluka o veličini uzorka: n § Populaciju veličine N podijeliti u

Sistematski uzorak § Odluka o veličini uzorka: n § Populaciju veličine N podijeliti u grupe od k elemenata: k=N/n § Slučajno odabrati elemenat iz 1 ve grupe § Odabrati svaki kti elemenat nakon 1 vog elementa N = 64 n=8 Prva grupa k=8 Statistika _ SPi. SR 19. 03. 2020.

Stratifikovani uzorak § Podijeliti populaciju u dvije ili više podgrupa (stratumi) prema nekoj zajedničkoj

Stratifikovani uzorak § Podijeliti populaciju u dvije ili više podgrupa (stratumi) prema nekoj zajedničkoj karakteristici § Iz svakog stratuma odabere se prost slučajan uzorak, pri čemu je njihova veličina proporcionalna veličini stratuma § Uzorci iz podgrupa kombinuju se u jedan uzorak Populacija podijeljena u 4 stratuma Uzorak Statistika _ SPi. SR 19. 03. 2020.

Klaster uzorak § Populacija se podijeli u nekoliko “klastera”, od kojih svaki reprezentuje populaciju

Klaster uzorak § Populacija se podijeli u nekoliko “klastera”, od kojih svaki reprezentuje populaciju § Selektuje se prost slučajan uzorak klastera § Svi elementi u odabranim klasterima mogu se koristiti, ili se elementi mogu birati iz klastera koristeći neku drugu tehniku slučajnog izbora Populacija podijeljena u 16 klastera. Statistika _ SPi. SR Slučajno odabrani klasteri za uzorak 19. 03. 2020.

Prednosti i nedostaci § Prost slučajan uzorak i sistematski uzorak § Jednostavni § Mogu

Prednosti i nedostaci § Prost slučajan uzorak i sistematski uzorak § Jednostavni § Mogu da ne budu reprezentativni § Stratifikovani uzorak § Osigurava reprezentativnost § Klaster uzorak § Mali troškovi § Manje efikasan (potreban veći uzorak za postizanje istog nivoa preciznosti) Statistika _ SPi. SR 19. 03. 2020.

Evaluacija korisnosti ankete § § § Šta je svrha ankete? Da li se anketa

Evaluacija korisnosti ankete § § § Šta je svrha ankete? Da li se anketa zasniva na slučajnom uzorku? Greška obuhvata – odgovarajući okvir? Greška usled odsustva odgovora Greška mjerenja – neprecizan upitnik - dobra pitanja vode dobrim odgovorima § Greška uzorka – uvijek postoji Statistika _ SPi. SR 19. 03. 2020.

Tipovi grešaka § Pristrasnost pri izboru § Postoji ako su neke grupe elemenata isključene

Tipovi grešaka § Pristrasnost pri izboru § Postoji ako su neke grupe elemenata isključene iz okvira za izbor pa nemaju šansu da budu odabrane § Pristrasnost usled odsustva odgovora § Ljudi koji nijesu odgovorili možda bi dali različite odgovore od onih koji su odgovorili § Greška uzorka § Varijacije među uzorcima uvijek postoje § Greška mjerenja § Usled loše postavljenih pitanja, greška u bilježenju odgovora, uticaj istraživača i sl. Statistika _ SPi. SR 19. 03. 2020.

Tipovi grešaka (nastavak) § Greška u obuhvatu § Ne-odgovaranje § Greška uzorka Isključeni iz

Tipovi grešaka (nastavak) § Greška u obuhvatu § Ne-odgovaranje § Greška uzorka Isključeni iz izbora Ispitanici ne odgovaraju Slučajne razlike među uzorcima § Greška mjerenja Loše ili pitanje koje navodi Statistika _ SPi. SR 19. 03. 2020.

Rezime § Distribucije iz uzoraka § Distribucija aritmetičkih sredina iz uzoraka § Za populaciju

Rezime § Distribucije iz uzoraka § Distribucija aritmetičkih sredina iz uzoraka § Za populaciju sa normalnim rasporedom § Centralna granična teorema § Distribucija proporcija iz uzoraka § Kalkulacija vjerovatnoća na osnovu rasporeda iz uzoraka § Različiti tipovi uzoraka i tehnike uzorkovanja § Korisnost anketa i tipovi grešaka Statistika _ SPi. SR 19. 03. 2020.