OSNOVE TEORIJE UZORAKA N aki H Cajner OSNOVE

  • Slides: 28
Download presentation
OSNOVE TEORIJE UZORAKA N. Šakić, H. Cajner

OSNOVE TEORIJE UZORAKA N. Šakić, H. Cajner

OSNOVE TEORIJE UZORAKA UZORAK: slučajni, reprezentativni dio osnovnog skupa – populacije Uzorci: N. Šakić,

OSNOVE TEORIJE UZORAKA UZORAK: slučajni, reprezentativni dio osnovnog skupa – populacije Uzorci: N. Šakić, H. Cajner

f ( x) RAZDIOBA ARITMETIČKE SREDINE UZORKA razdioba aritmetičke sredine uzorka osnovni skup: osnovni

f ( x) RAZDIOBA ARITMETIČKE SREDINE UZORKA razdioba aritmetičke sredine uzorka osnovni skup: osnovni skup m x, x aritm. sredina uzorka: x 1 x 2 x 3 x 6 x 4 x 5 Raspon osnovnog skupa N. Šakić, H. Cajner

NEPRISTRANE PROCJENE PARAMETARA OSNOVNOG SKUPA Pojam nepristrane procjene: neka varijabla nepristrano procjenjuje parametar osnovnog

NEPRISTRANE PROCJENE PARAMETARA OSNOVNOG SKUPA Pojam nepristrane procjene: neka varijabla nepristrano procjenjuje parametar osnovnog skupa Θ ako vrijedi: dakle: uzorka nepristrano procjenjuje očekivanja osn. skupa dakle: varijanca uzorka nije nepristrana procjena varijance osnovnog skupa dakle: varijabla nepristrano procjenjuje varijancu osnovnog skupa N. Šakić, H. Cajner

STANDARDNA POGREŠKA ARITMETIČKE SREDINE UZORKA • Pomoću varijable s 2 određuje se standardna pogreška

STANDARDNA POGREŠKA ARITMETIČKE SREDINE UZORKA • Pomoću varijable s 2 određuje se standardna pogreška ar. sredine • VAŽNO: k = (n – 1). . . broj stupnjeva slobode uzorka od n podataka N. Šakić, H. Cajner

INTERVALNA PROCJENA OČEKIVANJA OSNOVNOG SKUPA interval povjerenja (vjerodostojnosti) varijabla standardizirane normalne razdiobe N. Šakić,

INTERVALNA PROCJENA OČEKIVANJA OSNOVNOG SKUPA interval povjerenja (vjerodostojnosti) varijabla standardizirane normalne razdiobe N. Šakić, H. Cajner

VAŽNO: • Veliki uzorci: n > 30 elemenata, podataka – vrijednost varijable z →

VAŽNO: • Veliki uzorci: n > 30 elemenata, podataka – vrijednost varijable z → iz standardizirane normalne razdiobe • Mali uzorci: n ≤ 30 elemenata, podataka – koristiti Studentovu t-razdiobu Studentova t-razdioba • simetrična • za velike uzorke se ne razlikuje od normalne razdiobe N. Šakić, H. Cajner

KONAČNO: • Za velike uzorke • Za male uzorke Koristiti standardiziranu (jediničnu) normalnu razdiobu

KONAČNO: • Za velike uzorke • Za male uzorke Koristiti standardiziranu (jediničnu) normalnu razdiobu Koristiti Studentovu t-razdiobu s parametrom k = n – 1 N. Šakić, H. Cajner

PRIMJER: • Podaci utvrđeni u nekom procesu: 52. 1, 49. 0, 51. 4, 50.

PRIMJER: • Podaci utvrđeni u nekom procesu: 52. 1, 49. 0, 51. 4, 50. 0, 50. 3, 49. 6, 50. 8, 51. 0, 51. 7 Intervalno procijeniti očekivanje osnovnog skupa iz kojeg potječe uzorak, uz interval vjerodostojnosti 1 – = 0, 95 (95%) • Rezultati dobijeni računanjem, iz uzorka: n = 10; = 50, 65; s = 0. 96 N. Šakić, H. Cajner

OPASKA • U slučaju kada je poznata standardna devijacija osnovnog skupa, nije nužno korištenje

OPASKA • U slučaju kada je poznata standardna devijacija osnovnog skupa, nije nužno korištenje Studentove t-razdiobe kao ni nepristrane procjene standardne pogreške • U tom je slučaju: • Za prethodni primjer: ako prihvatimo da je standardna devijacija osnovnog skupa , slijedi: N. Šakić, H. Cajner

INTERVALNA PROCJENA PROPORCIJA • Uzorkovanje nekog dvoslojnog osnovnog skupa (populacije) u kojem neki događaj

INTERVALNA PROCJENA PROPORCIJA • Uzorkovanje nekog dvoslojnog osnovnog skupa (populacije) u kojem neki događaj ima proporciju P rezultiralo bi slučajnom varijablom p, tj. proporcijom istog događaja ali u uzorku: Vrijedi: uz povjerenje (vjerodostojnost) procjene (1 – ) N. Šakić, H. Cajner

 • Važne pretpostavke: – proporcija uzorka – sp. . . nepristrana procjena standardne

• Važne pretpostavke: – proporcija uzorka – sp. . . nepristrana procjena standardne pogreške proporcije uzorka: – n. . . veličina uzorka – VRIJEDI SAMO ZA VELIKE UZORKE (n → 100) N. Šakić, H. Cajner

INTERVALNA PROCJENA VARIJANCE • Varijance (osobito malih) uzoraka ne rasipaju se normalno oko varijance

INTERVALNA PROCJENA VARIJANCE • Varijance (osobito malih) uzoraka ne rasipaju se normalno oko varijance osnovnog skupa • Vrijedi (K. Pearson, 1857. – 1936. ) – varijabla rasipa se prema c 2 razdiobi s k = n – 1 stupanj slobode uz vjerojatnost (1 – ) N. Šakić, H. Cajner

KONAČNO: uz razinu povjerenja (1 – ) N. Šakić, H. Cajner

KONAČNO: uz razinu povjerenja (1 – ) N. Šakić, H. Cajner

TESTIRANJE STATISTIČKIH HIPOTEZA • T. S. H. predstavlja postupak donošenja odluke na bazi uzorka

TESTIRANJE STATISTIČKIH HIPOTEZA • T. S. H. predstavlja postupak donošenja odluke na bazi uzorka • uzorak, n podataka: x 1, x 2, . . . , xn • rezultati se uzorka mogu shvatiti kao točka u n-dimenzionalnom prostoru • prostor se može podijeliti na dva međusobno disjunktna dijela (koji se isključuju), dio A i dio B U praksi: umjesto n-dimenzionalnog modela služimo se jednodimenzionalnim varijablama (uglavnom). N. Šakić, H. Cajner

 • Postavimo dvije hipoteze H 0: nulta hipoteza H 1: alternativna hipoteza –

• Postavimo dvije hipoteze H 0: nulta hipoteza H 1: alternativna hipoteza – Ako se točka T kao realizacija uzorka nađe u dijelu A, smatramo hipotezu H 0 ispravnom i prihvaćamo je – Ako se točka T kao realizacija uzorka nađe u dijelu B, smatramo hipotezu H 0 neispravnom i odbacujemo je N. Šakić, H. Cajner

POGREŠKE PRI TESTIRANJU HIPOTEZA Očito: pri uporabi opisanog modela moguće su pogreške • •

POGREŠKE PRI TESTIRANJU HIPOTEZA Očito: pri uporabi opisanog modela moguće su pogreške • • Uzrok pogrešaka: slučajnost odabira elemenata uzorka! • Vrste pogrešaka: – Pogreška 1. vrste nastaje odbacivanjem nulte hipoteze H 0 (i prihvaćanjem alternativne hipoteze H 1) iako je hipoteza H 0 ispravna: • Vjerojatnost pogreške 1. vrste: – Pogreška 2. vrste nastaje prihvaćanjem hipoteze H 0 u uvjetima ispravnosti alternativne hipoteze H 1 • Vjerojatnost pogreške 2. vrste: N. Šakić, H. Cajner

JAKOST TESTA • Jakost (moć) testa predstavlja vjerojatnost odbacivanja nulte hipoteze kada je uistinu

JAKOST TESTA • Jakost (moć) testa predstavlja vjerojatnost odbacivanja nulte hipoteze kada je uistinu neispravna: • očito: + p = 1 – ISPRAVNO ODBACIVANJE Ho N. Šakić, H. Cajner

Stanje Hipoteza Ho O D L U K A Odbaciti Prihvatiti ISTINITA NEISTINITA Pogreška

Stanje Hipoteza Ho O D L U K A Odbaciti Prihvatiti ISTINITA NEISTINITA Pogreška 1. vrste ISPRAVNO Pogreška 2. vrste b N. Šakić, H. Cajner

TESTIRANJE HIPOTEZA ZA OČEKIVANJE Hipoteze: • Uzorak – osnovni skup, hipoteze • Razdioba aritmetičke

TESTIRANJE HIPOTEZA ZA OČEKIVANJE Hipoteze: • Uzorak – osnovni skup, hipoteze • Razdioba aritmetičke sredine uzorka – Studentova razdioba s k = n – 1 st. slob. Pogodna jednodimenzionalna varijabla: . . . varijabla Studentove t-razdiobe, k = n – 1 stup. slobode Ako je odbaciti Ho, uz vjerojatnost pogreške 1. vrste N. Šakić, H. Cajner

PRIMJER: • Podaci iz primjera za intervalnu procjenu očekivanja n = 10; = 50.

PRIMJER: • Podaci iz primjera za intervalnu procjenu očekivanja n = 10; = 50. 65; s = 0. 96; • Provjeriti hipotezu da je riječ o podacima skupa čije je očekivanje 51. 5 jedinica, naprama alternativnoj hipotezi • Vjerojatnost pogreške 1. vrste neka iznosi 0. 05 ( = 0. 05) Zaključak: N. Šakić, H. Cajner

PROVJERA HIPOTEZA UZORAK – UZORAK • 1. skup: očekivanje m 1, varijanca s 201

PROVJERA HIPOTEZA UZORAK – UZORAK • 1. skup: očekivanje m 1, varijanca s 201 1. uzorak: n 1 podataka, • 2. skup: očekivanje m 2, varijanca s 202 2. uzorak: n 2 podataka, Hipoteze: N. Šakić, H. Cajner

 • aritmetička sredina svakog od uzoraka rasipat će se oko očekivanja skupa iz

• aritmetička sredina svakog od uzoraka rasipat će se oko očekivanja skupa iz kojeg uzorak potječe • njihova razlika rasipat će se oko veličine • pretpostavimo li da je hipoteza Ho istinita, , varijabla d će se rasipati oko 0. N. Šakić, H. Cajner

 • pri tome je standardna pogreška varijable d: . . . za uzorke

• pri tome je standardna pogreška varijable d: . . . za uzorke s n 1 + n 2 – 2 ≤ 30. . . za uzorke s n 1 + n 2 – 2 > 30, i ako se n 1 i n 2 znatno razlikuju • varijabla pogodna za testiranje nulte hipoteze: . . . varijabla Studentove t-razdiobe s k = n 1 + n 2 – 2 s. s. Ako odbaciti Ho, uz vjerojatnost pogreške 1. vrste . N. Šakić, H. Cajner

TESTIRANJE HIPOTEZA ZA PROPORCIJE (ATRIBUTIVNE PODATKE) • slučaj: uzorak – osn. skup • slučaj:

TESTIRANJE HIPOTEZA ZA PROPORCIJE (ATRIBUTIVNE PODATKE) • slučaj: uzorak – osn. skup • slučaj: uzorak – osnovni dvoslojni skup s – osnovni skupovi proporcijom P elementa sa 1. skup, proporcije P 2. skup, proporcije P 1 2 svojstvom A. n 1 pod. , proporcija p 1 – uzorak n elemenata s – uzorci n 2 pod. , proporcija p 2 proporcijom p – važno: E(p) = P – nulta hipoteza: – rasipanje proporcije p oko – alternativna hip. : proporcije P ima standardnu pogrešku: N. Šakić, H. Cajner

– varijabla za testiranje hipoteze Ho : P – razlika d = p 1

– varijabla za testiranje hipoteze Ho : P – razlika d = p 1 – p 2 rasipa se oko E(d) = 0, ako pretpostavimo istinitost nulte hipoteze – varijabla pogodna za testiranje nulte hipoteze: Vrijedi samo za VELIKE uzorke tj. n 100 Zaključak: Ako N. Šakić, H. Cajner

USPOREDBA (TESTIRANJE) VARIJANCI • 1. Osnovni skup: očekivanje m 1, varijanca s 201 nepristrana

USPOREDBA (TESTIRANJE) VARIJANCI • 1. Osnovni skup: očekivanje m 1, varijanca s 201 nepristrana procjena varijance • 2. Osnovni skup: očekivanje m 2, varijanca s 202 nepristrana procjena varijance • Nulta hipoteza: naprama alternativnoj • Varijabla . . . varijabla F-razdiobe s kb = n 1 – 1 s. s. i kn = n 2 – 1 s. s. N. Šakić, H. Cajner

Ako: Frač. > F 0 odbaciti Ho Konvencija: Tipično: = 0. 05; 0. 01

Ako: Frač. > F 0 odbaciti Ho Konvencija: Tipično: = 0. 05; 0. 01 • F-razdioba: utemeljio G. Snedecor (1881. – 1934. ) • Naziv F-razdioba u čast R. Fishera (1890. – 1962. ) VAŽNO: Svakom testu aritmetičkih sredina mora prethoditi provjera značajnosti razlika među varijancama N. Šakić, H. Cajner