Inenjerska statistika Raspodjele podataka Raspodjele podataka za diskretna

  • Slides: 46
Download presentation
Inženjerska statistika Raspodjele podataka • Raspodjele podataka za diskretna obilježja • Raspodjele podataka za

Inženjerska statistika Raspodjele podataka • Raspodjele podataka za diskretna obilježja • Raspodjele podataka za kontinuirana obilježja • Teorijske raspodjele podataka Raspodjele podataka

Inženjerska statistika Raspodjele podataka

Inženjerska statistika Raspodjele podataka

Inženjerska statistika Raspodjele (diskretna obilježja) • Hipergeometrijska (složene kombinacije) • Binomna (Bernoulli-jev događaj) •

Inženjerska statistika Raspodjele (diskretna obilježja) • Hipergeometrijska (složene kombinacije) • Binomna (Bernoulli-jev događaj) • Poisson-ova (zakon rijetkih događaja, potok događaja) Raspodjele podataka

Inženjerska statistika Hipergeometrijska raspodjela • proizlazi iz dvoslojnog skupa - složene kombinacije – skup

Inženjerska statistika Hipergeometrijska raspodjela • proizlazi iz dvoslojnog skupa - složene kombinacije – skup od N elemenata sadrži podskup elemenata sa svojstvom A i podskup elemenata sa svojstvom Ā N SKUP M (A) N-M (Ā) UZORAK n x el A (n-x) el Ā

Inženjerska statistika • funkcija vjerojatnosti hipergeometrijske raspodjele: parametri: M, N i n - n

Inženjerska statistika • funkcija vjerojatnosti hipergeometrijske raspodjele: parametri: M, N i n - n – veličina uzorka • očekivana vrijednost: • varijanca: Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik hipergeometrijske raspodjele: Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik hipergeometrijske raspodjele: Raspodjele podataka

Inženjerska statistika Binomna raspodjela • broj N (elementi skupa) teži u beskonačnost – podvrsta

Inženjerska statistika Binomna raspodjela • broj N (elementi skupa) teži u beskonačnost – podvrsta hipergeometrijske • Bernoulli-jev događaj – samo dva ishoda - vjerojatnost događaja se ne mijenja i iznosi p - vjerojatnost q=1 -p - nezavisni pokušaji (slučajno uzorkovanje) - broj pokušaja (veličina uzorka), n A Ā UZORAK n - elemenata p Raspodjele podataka (1 -p)=q

Inženjerska statistika • funkcija vjerojatnosti binomne raspodjele B (n, p): parametri: n, p •

Inženjerska statistika • funkcija vjerojatnosti binomne raspodjele B (n, p): parametri: n, p • očekivana vrijednost (aritmetička sredina): • varijanca: • koeficijent asimetrije: - distribucija će biti uvijek asimetrična ako nije p=q=0, 5 • koeficijent zaobljenosti: Raspodjele podataka

Inženjerska statistika • utjecaj parametara n i p na oblik binomne raspodjele: Raspodjele podataka

Inženjerska statistika • utjecaj parametara n i p na oblik binomne raspodjele: Raspodjele podataka

Inženjerska statistika • ‘Galtonova’ daska – binomni eksperiment – kuglicu spuštamo na čavliće koji

Inženjerska statistika • ‘Galtonova’ daska – binomni eksperiment – kuglicu spuštamo na čavliće koji su složeni u pravilnu trokutastu rešetku – padom na čavlić kuglica može skrenuti na lijevo ili desno (Bernouli-jev događaj) – daska je pravilna te su ishodi jednako vjerojatni p=0. 5 – n – broj redova čavlića Link Raspodjele podataka

Inženjerska statistika – primjer ‘Galtonove’ daske sa n=4 reda čavlića: - slučajna varijabla poprima

Inženjerska statistika – primjer ‘Galtonove’ daske sa n=4 reda čavlića: - slučajna varijabla poprima vrijednost: 0 - za jedan ishod 1 - za 4 ishoda 2 – za 6 ishoda 3 – za 4 ishoda 4 – za 1 ishod - općenito: Raspodjele podataka

Inženjerska statistika • primjer 1. binomne raspodjele: Primjer: Svaki izuzeti uzorak vode ima vjerojatnost

Inženjerska statistika • primjer 1. binomne raspodjele: Primjer: Svaki izuzeti uzorak vode ima vjerojatnost da je kontaminiran otpadnom tvari u iznosu od 10%. Pretpostavimo da se uzroci uzimaju nezavisno s obzirom na prisustvo otpadnih tvari. Potrebno je pronaći: a) Vjerojatnost da će u 18 izuzetih uzoraka biti točno 2 uzorka kontaminirana? vjerojatnost da će biti točno 2 kontaminirana uzorka b) Vjerojatnost da će od 18 uzoraka biti barem 4 kontaminirana? Raspodjele podataka

Inženjerska statistika - grafički prikaz (binomna raspodjela): a) Raspodjele podataka b)

Inženjerska statistika - grafički prikaz (binomna raspodjela): a) Raspodjele podataka b)

Inženjerska statistika • primjer 2. primjene binomne raspodjele: Primjer: Rad jednog automata kontrolira se

Inženjerska statistika • primjer 2. primjene binomne raspodjele: Primjer: Rad jednog automata kontrolira se uzorcima od 15 proizvoda. U svakom uzorku se ustanovljuje broj defektnih proizvoda. Budući da je uzeto 200 uzoraka, dobiveni rezultati su dani kroz tablicu. Potrebno je pronaći adekvatnu raspodjelu po kojoj se ponašaju podaci te vjerojatnost pojave najviše 2 defektna u uzorku. x 0 1 fi 77 81 2 3 4 5 6 31 7 2 1 1 - radi se o Binomnoj raspodjeli (n konačan): pr ila Raspodjele podataka go db a

Inženjerska statistika - tablica vjerojatnosti za primjer 2. Raspodjele podataka x px q(n-x) P(x)

Inženjerska statistika - tablica vjerojatnosti za primjer 2. Raspodjele podataka x px q(n-x) P(x) 0 1 1 0, 389031 1 15 0, 061 0, 414303 0, 379087 0, 768118 2 105 0, 003721 0, 441217 0, 172386 0, 940504 3 455 0, 000227 0, 46988 0, 048528 0, 989032 4 1365 1, 38 E-05 0, 500405 0, 009457 0, 998489 5 3003 8, 45 E-07 0, 532913 0, 001352 0, 999841 6 5005 5, 15 E-08 0, 567532 0, 000146 0, 999987 7 6435 3, 14 E-09 0, 6044 1, 22 E-05 0, 999999 8 6435 1, 92 E-10 0, 643664 7, 94 E-07 1 9 5005 1, 17 E-11 0, 685478 4, 01 E-08 1 10 3003 7, 13 E-13 0, 730009 1, 56 E-09 1 11 1365 4, 35 E-14 0, 777432 4, 62 E-11 1 12 455 2, 65 E-15 0, 827936 1 E-12 1 13 105 1, 62 E-16 0, 881721 1, 5 E-14 15 9, 88 E-18 0, 939 1, 39 E-16 1 15 1 6, 02 E-19 1

Inženjerska statistika Poisson-ova raspodjela • proizlazi iz binomne r. uz određene uvjete: • opisuje

Inženjerska statistika Poisson-ova raspodjela • proizlazi iz binomne r. uz određene uvjete: • opisuje rijetke događaje (oni koji se javljaju s malom vjerojatnošću) • potok događaja – vjerojatnost promatranog događaja u vremenskom periodu (valovi, naleti. . . ) – odabir vremenskog perioda je bitan • funkcija vjerojatnosti Poisson-ove raspodjele P(x): parametar: m=E(x) (u literaturi se spominje i λ = parametar m) Raspodjele podataka

Inženjerska statistika • očekivana vrijednost: • varijanca: • koeficijent asimetrije: • koeficijent zaobljenosti: •

Inženjerska statistika • očekivana vrijednost: • varijanca: • koeficijent asimetrije: • koeficijent zaobljenosti: • rekurzivna formula za Poisson-ovu raspodjelu: Raspodjele podataka

Inženjerska statistika • utjecaj parametra m na Poisson-ovu raspodjelu : - nakon vjerojatnosti -

Inženjerska statistika • utjecaj parametra m na Poisson-ovu raspodjelu : - nakon vjerojatnosti - kada simetričnoj Raspodjele podataka pokazuje se mod – da su dvije susjedne vrijednosti istih gubi se asimetričnost i Poisson-ova raspodjela teži

Inženjerska statistika • primjer 1. primjene Poisson-ove raspodjele: Primjer: U slučaju tanke bakrene žice,

Inženjerska statistika • primjer 1. primjene Poisson-ove raspodjele: Primjer: U slučaju tanke bakrene žice, pretpostavlja se da broj pukotina slijedi zakon Poisson-ove raspodjele sa očekivanjem od 2. 3 mikropukotine po milimetru. Potrebno je odrediti: a) vjerojatnost da se dogodi baš 2 mikropukotine po jednom milimetru žice. - varijabla x – broj mikropukotina po mm žice Raspodjele podataka

Inženjerska statistika b) Vjerojatnost da se pojavi barem jedna mikropukotina u 2 mm žice.

Inženjerska statistika b) Vjerojatnost da se pojavi barem jedna mikropukotina u 2 mm žice. - varijabla x – broj mikropukotina na 2 mm žice Raspodjele podataka

Inženjerska statistika • primjer 2. primjene Poisson-ove raspodjele: Primjer: Tijekom drugog svjetskog rata London

Inženjerska statistika • primjer 2. primjene Poisson-ove raspodjele: Primjer: Tijekom drugog svjetskog rata London je gađan projektilima V 1. Britance je zanimalo kako iz podataka o padanju projektila zaključiti da li je riječ o gađanju nasumce ili se cilja neka točka u južnom Londonu. - južni London je podijeljen na 576 sektora - u vremenskom periodu promatranja palo je 537 projektila Poisson mean for x = 0, 928819 Poisson Contribution x Observed Probability Expected 0 229 0, 395020 226, 74 1 211 0, 366902 211, 39 2 93 0, 170393 98, 54 3 35 0, 052755 30, 62 4 7 0, 014931 7, 14 5 (6, 7. . ) 1 1, 57 Chi-Sq 0, 009479 0, 000533 0, 269846 0, 700380 0, 041860 TEST: N N* DF Chi-Sq P-Value 576 0 3 1, 02210 0, 796 - podaci se ponašaju po Poisson-ovoj razdiobi! - zaključak - V 1 nije imao navođenje Raspodjele podataka

Inženjerska statistika Raspodjele (kontinuirana obilježja) • • Normalna Jedinična normalna Lognormalna Weibullova Raspodjele podataka

Inženjerska statistika Raspodjele (kontinuirana obilježja) • • Normalna Jedinična normalna Lognormalna Weibullova Raspodjele podataka

Inženjerska statistika Normalna raspodjela • prvi definirao Abraham de Moivre • upotrijebio Gauss (Gauss-ova

Inženjerska statistika Normalna raspodjela • prvi definirao Abraham de Moivre • upotrijebio Gauss (Gauss-ova raspodjela) • najčešće korištena raspodjela – čak 33% procesa u prirodi slijedi zakon normalne raspodjele • funkcija gustoće vjerojatnosti f(x) – zbog kontinuiranog obilježja • nastanak normalne r. - binomni poučak (razvijanje binoma u red , A. de Moivre) binomna r. funkcija gustoće vjerojatnosti normalne r. Raspodjele podataka

Inženjerska statistika • funkcija gustoće vjerojatnosti normalne raspodjele f(x): parametri: μ i σ2(x) •

Inženjerska statistika • funkcija gustoće vjerojatnosti normalne raspodjele f(x): parametri: μ i σ2(x) • očekivana vrijednost: E(x)= μ • varijanca: σ2(x) • koeficijent asimetrije: α 3= 0 - simetrična razdioba • koeficijent zaobljenosti: α 4= 3 (α’ 4= 0) – normalno zaobljena • svojstva funkcije gustoće vjerojatnosti f(x): 1. 2. 3. Raspodjele podataka

Inženjerska statistika • veza funkcije gustoće vjerojatnosti f(x) i funkcija distribucije F(x) normalne raspodjele:

Inženjerska statistika • veza funkcije gustoće vjerojatnosti f(x) i funkcija distribucije F(x) normalne raspodjele: Raspodjele podataka

Inženjerska statistika • vjerojatnosti ispod normalne raspodjele N{μ, σ2}: • utjecaj parametara μ i

Inženjerska statistika • vjerojatnosti ispod normalne raspodjele N{μ, σ2}: • utjecaj parametara μ i σ2 na oblik normalne raspodjele: Raspodjele podataka

Inženjerska statistika Jedinična normalna raspodjela N{0, 1} • standardizirana normalna raspodjela sa parametrima μ=0

Inženjerska statistika Jedinična normalna raspodjela N{0, 1} • standardizirana normalna raspodjela sa parametrima μ=0 i σ2=1 • sve druge normalne raspodjele svodimo (z-transformacija) na jediničnu normalnu raspodjelu • bilo koja vrijednost u x domeni se može prikazati kao μ ± k·σ • transformacija: Raspodjele podataka

Inženjerska statistika • funkcija gustoće vjerojatnosti jedinične normalne raspodjele f(z): • upotrebom jedinične normalne

Inženjerska statistika • funkcija gustoće vjerojatnosti jedinične normalne raspodjele f(z): • upotrebom jedinične normalne razdiobe standardiziramo odstupanja preko parametra z: 1. 2. 3. 4. |z|=1 → P(z)=0, 6827 |z|=1, 96 → P(z)=0, 9500 |z|=2, 0 → P(z)=0, 9545 |z|=3 → P(z)=0, 9973 • područje ± 3σ koje se koristi u konstrukcijama naziva se tolerancija • danas procesi u području ± 3σ više nisu dovoljno dobri pa se prelazi na sustav od ± 6σ • područje od ± 6σ ima vjerojatnost pojave od 99, 9999998 % Raspodjele podataka

Inženjerska statistika • ostale vjerojatnosti kod normalne razdiobe: Raspodjele podataka

Inženjerska statistika • ostale vjerojatnosti kod normalne razdiobe: Raspodjele podataka

Inženjerska statistika • primjer 1. primjene normalne raspodjele: Primjer: Pretpostavimo da se izmjerena jakost

Inženjerska statistika • primjer 1. primjene normalne raspodjele: Primjer: Pretpostavimo da se izmjerena jakost struje u vodiču pokorava zakonu normalne raspodjele sa očekivanjem μ=10 m. A i varijancom σ2=4 m. A 2. Kolika je vjerojatnost da će jakost struje premašiti 13 m. A? tra ns fo rm ac ija Raspodjele podataka

Inženjerska statistika Lognormalna raspodjela • raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje, plaće

Inženjerska statistika Lognormalna raspodjela • raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje, plaće zaposlenika. . . • slučaj kada je logaritam varijable x ( ln(x) ) normalno distribuiran • vjerojatnosti pojave varijable x se dobivaju transformacijom varijable y sa naznakom da je • ako y ima normalnu distribuciju sa očekivanjem α i varijancom β 2 tada možemo napisati x=ey što je lognormalna varijabla sa funkcijom gustoće vjerojatnosti: parametri: α i β 2 Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik lognormalne raspodjele: Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik lognormalne raspodjele: Raspodjele podataka

Inženjerska statistika • primjer primjene lognormalne raspodjele: Primjer: Životni vijek poluvodičkog lasera je lognormalno

Inženjerska statistika • primjer primjene lognormalne raspodjele: Primjer: Životni vijek poluvodičkog lasera je lognormalno distribuiran sa očekivanjem od a=10 h i standardnom devijacijom b=1, 5 h. Kolika je vjerojatnost da životni vijek premaši 10 000 sati? Raspodjele podataka

Inženjerska statistika Weibull-ova raspodjela • definira vjekove trajanja tehničkih sustava – krivulja kade •

Inženjerska statistika Weibull-ova raspodjela • definira vjekove trajanja tehničkih sustava – krivulja kade • parametri ove raspodjele daju veliku fleksibilnost prilikom opisivanja različitih slučajeva kada broj otkaza raste sa vremenom (trošenje ležaja), ostaje konstantan ili pada s vremenom (neki poluvodiči) • funkcija gustoće vjerojatnosti Weibull-ove raspodjele: parametri: α, β Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik Weibull-ove raspodjele: Raspodjele podataka

Inženjerska statistika • utjecaj parametara na oblik Weibull-ove raspodjele: Raspodjele podataka

Inženjerska statistika • krivulja kade (krivulja mortaliteta): I. period – ‘dječje bolesti’ – 1.

Inženjerska statistika • krivulja kade (krivulja mortaliteta): I. period – ‘dječje bolesti’ – 1. raspodjela e-lt II. period – ‘normalne eksploatacije’, slučajni kvarovi – 2. raspodjela uniformna III. period – zbog ‘trošenja dijelova’, vremenski kvarovi – 3. raspodjela normalna Raspodjele podataka

Inženjerska statistika Teorijske raspodjele • Studentova ‘t’ raspodjela • c 2 - raspodjela •

Inženjerska statistika Teorijske raspodjele • Studentova ‘t’ raspodjela • c 2 - raspodjela • F - raspodjela Raspodjele podataka

Inženjerska statistika Studentova t-raspodjela • • • definirao ju W. S. Gosset kao razdiobu

Inženjerska statistika Studentova t-raspodjela • • • definirao ju W. S. Gosset kao razdiobu varijable t proizašla iz raspodjele aritmetičkih sredina za k>30, varijabla t se aproksimira varijablom z Raspodjele podataka

Inženjerska statistika • tablica Studentove ras. za određenu vrijednost površine (vjerojatnosti) i stupnja slobode

Inženjerska statistika • tablica Studentove ras. za određenu vrijednost površine (vjerojatnosti) i stupnja slobode daje vrijednosti parametra t Primjer: Za a=0, 01 u uzorku veličine 10 elemenata (k=101=9 stupnjeva slobode) t=2, 821 • treba s oprezom primjenjivati tablice zbog različitog korištenja termina a – površina samo jednog ‘repa’ ili oba? ! Raspodjele podataka

Inženjerska statistika c 2 (hi-kvadrat) raspodjela • varijance se ne pokoravaju normalnoj raspodjeli •

Inženjerska statistika c 2 (hi-kvadrat) raspodjela • varijance se ne pokoravaju normalnoj raspodjeli • poseban slučaj G razdiobe definira raspodjelu varijable c 2 • varijabla c 2 sa samo jednim parametrom k=n-1 → stupanj slobode - očekivana vrijednost Raspodjele podataka

Inženjerska statistika • tablica c 2 ras. - za određenu vrijednost površine (vjerojatnosti) i

Inženjerska statistika • tablica c 2 ras. - za određenu vrijednost površine (vjerojatnosti) i stupnja slobode daje vrijednosti parametra c 2 • kod čitanja vrijednosti c 2 P treba imati na umu da se to odnosi na ‘unutrašnju’ površinu. Primjer: Pronaći vrijednosti c 2 a/2 i c 21 -a/2 za vjerojatnost pogreške 5% i k=9. c 2 a/2= c 20, 025=2, 70 c 21 -a/2= c 20, 975=19, 02 Raspodjele podataka

Inženjerska statistika F - raspodjela • definirao G. Snedecor , R. Fisher • to

Inženjerska statistika F - raspodjela • definirao G. Snedecor , R. Fisher • to je raspodjela varijable F koja je definirana kao omjer procijenjenih varijanci • raspodjela ima samo dva parametra: – stupanj slobode brojnika kbrojnika – stupanj slobode nazivnika knazivnika -parametri: kbrojnika=n 1 -1; knazivnika=n 2 -1 - preduvjet: (s 1>s 2) Raspodjele podataka

Inženjerska statistika • Tablica F-raspodjele daje vrijednosti varijable F za vjerojatnost (površinu desnog repa),

Inženjerska statistika • Tablica F-raspodjele daje vrijednosti varijable F za vjerojatnost (površinu desnog repa), stupanj slobode brojnika i nazivnika. Primjer: Pronaći vrijednost varijable F za a=0. 25, kb=9 i kn=11. F=1, 53 vrijednosti parametra F

Inženjerska statistika Papir vjerojatnosti • još jedna od grafičkih metoda analize podataka (iz uzorka)

Inženjerska statistika Papir vjerojatnosti • još jedna od grafičkih metoda analize podataka (iz uzorka) kontinuiranog obilježja • utvrđuje se da li se podaci ponašaju po jednoj od promatranih raspodjela i koliko koji elementi odstupaju • za svaku raspodjelu posebno konstruira se papir vjerojatnosti: – – papir vjerojatnosti normalne raspodjele (najčešće) papir vjerojatnosti Weibull-ove raspodjele papir vjerojatnosti lognormalne raspodjele. . . • uzima se funkcija distribucije određene raspodjele i promjenom mjerila dobiva se funkcija distribucije u obliku pravca (Henry-jev pravac)

Inženjerska statistika • konstruiranje papira vjerojatnosti normalne raspodjele ~84% m • m m+s Henry-jev

Inženjerska statistika • konstruiranje papira vjerojatnosti normalne raspodjele ~84% m • m m+s Henry-jev pravac se ucrtava tako da se odrede dvije čvrste točke: – 1. točka : (x=m, y=50%) – 2. točka : (x=m+s, y=84%) Raspodjele podataka

Inženjerska statistika • primjena papira vjerojatnosti Primjer: Provjeriti da li se podaci iz uzorka

Inženjerska statistika • primjena papira vjerojatnosti Primjer: Provjeriti da li se podaci iz uzorka rasipaju po normalnoj raspodjeli. - promatranjem podataka može se utvrditi da li se podaci rasipaju po normalnoj raspodjeli. - uzeta je raspodjela sa parametrima Raspodjele podataka