tatistick indukcia Testovanie tatistickch hypotz Testovanie tatistickch hypotz
- Slides: 41
Štatistická indukcia Testovanie štatistických hypotéz
Testovanie štatistických hypotéz 4 - obžalovaný je nevinný - obžalovaný je vinný 4 definovanie akceptovateľnosti dôkazov 4 hľadanie dôkazov 4 rozhodnutie o vine na základe dôkazov - dostatočné - nedostatočné
Testovanie štatistických hypotéz Rozhodnutie S k u t o č n o s ť nevinný správne nesprávne vinný nesprávne
Štatistická hypotéza Číselný predpoklad o parametroch základného súboru, ktorý vznikol na základe iných zdrojov informácii (nie náhodného výberu).
Testovanie štatistických hypotéz 4 odhad parametra ZS est Q = un D = un - Q 0 4 D = (un - Q ) + (Q - Q 0 ) Náhodná chyba Systematická chyba
Testovanie štatistických hypotéz Overovanie platnosti štatistických hypotéz, na základe údajov zistených vo výberovom súbore
Testovanie štatistických hypotéz - vyslovenie predpokladov ß - formulácia hypotéz ß - overenie – testovanie hypotéz
Testovanie štatistických hypotéz 4 východisková – nulová hypotéza H 0 : Q = Q 0 resp. H 0 : Q 1 = Q 2 4 alternatívna hypotéza H 1 : Q ≠ Q 0 resp. H 1 : Q 1 ≠ Q 2 H 1 : Q > Q 0 (pravostranný test) H 1 : Q < Q 0 (ľavostranný test)
Testovanie štatistických hypotéz 4 Formulácia hypotéz 4 Výber testovacieho kritéria 4 Stanovenie hladiny významnosti 4 Určenie kritickej hodnoty 4 Výpočet hodnoty testovacej charakteristiky 4 Rozhodnutie o zamietnutí resp. nezamietnutí H 0
Testovanie štatistických hypotéz Rozhodnutie S k u t o č n o s ť platí H 0 nezamietnutie H 0 správne 1 -a chyba I. druhu a chyba II. druhu b hladina významnosti správne 1–b sila testu
Testovanie štatistických hypotéz 4 testy hypotéz o strednej hodnote 4 testy hypotéz o variabilite 4 testy hypotéz o podiele 4 neparametrické testy vtest dobrej zhody vtesty extrémnych hodnôt
Testy hypotéz o strednej hodnote 4 test zhody strednej hodnoty so známou konštantou 4 test zhody dvoch stredných hodnôt 4 test zhody viacerých stredných hodnôt
Testy hypotéz o strednej hodnote 4 test strednej hodnoty so známou konštantou 4 východisková – nulová hypotéza H 0 : m = m 0 4 alternatívna hypotéza H 1 : m ≠ m 0 resp. H 1 : m > m 0 (pravostranný test) H 1 : m < m 0 (ľavostranný test)
Testy hypotéz o strednej hodnote 4 test zhody strednej hodnoty so známou konštantou – poznáme rozptyl ZS – nepoznáme rozptyl ZS a n > 30 – nepoznáme rozptyl ZS a n ≤ 30
Testy hypotéz o strednej hodnote 4
Testy hypotéz o strednej hodnote 4
Testy hypotéz o strednej hodnote
Príklad 1 Na základe bleskového prieskumu, ktorého sa zúčastnilo 25 zamestnancov z celej SR bola zistená priemerná mzda 748, 65 € so smerodajnou odchýlkou 91, 05 €. ŠÚ SR udáva, že priemerná mzda v SR bola v sledovanom období 778, 57 € so smerodajnou odchýlkou 112, 73 €. Možno považovať výsledky bleskového prieskumu za totožné s údajmi ŠÚ SR?
Príklad 2 Na základe výsledkov výberového zisťovania, ktorého sa zúčastnilo 289 zamestnancov z celej SR bola zistená priemerná mzda 987 € so smerodajnou odchýlkou 290 €. ŠÚ SR udáva, že priemerná mzda v SR pre 2 Q roku 2019 nadobudla hodnotu 1101 €. Existuje rozdiel v uvedených hodnotách?
Príklad 3 Výrobca sladených nápojov chcel zistiť, či zmena technológie výroby sa prejaví v predajnosti jeho výrobkov. V 14 náhodne vybraných dňoch pred zavedením nových výrobkov zistil, že priemerné tržby boli 396 p. j. so smerodajnou odchýlkou 50, 6 p. j. Po zavedení nových nápojov opätovne zisťoval v 11 náhodne vybraných dňoch tržby, ktoré boli 412 p. j. so smerodajnou odchýlkou 43, 1 p. j. Rozhodnite, či nastala zmena v tržbách za výrobky
Testy zhody dvoch stredných hodnôt 4 test zhody strednej hodnoty so známou konštantou – poznáme rozptyly ZS – nepoznáme rozptyly ZS a n > 30 – nepoznáme rozptyly ZS a n ≤ 30
Testy zhody dvoch stredných hodnôt poznáme variabilitu ZS
Testy zhody dvoch stredných hodnôt nepoznáme variabilitu ZS; n 1, 2 > 30
Testy zhody dvoch stredných hodnôt nepoznáme variabilitu ZS; n 1, 2 ≤ 30
Príklad 4 U študentov predmetu štatistika bola vykonaná písomná previerka vedomostí z uvedeného predmetu za účelom porovnať úroveň ich znalostí. Testovaní boli študenti dvoch rôznych fakúlt, ktorí spoločne absolvovali výučbu. Na hladine významnosti 0, 05, overte, či môžeme tvrdiť, že existuje rozdiel v ovládaní štatistiky medzi študentmi FEM a FEŠRR?
Príklad 5 Z predmetu Štatistika bol vypracovaný test v dvoch variantoch (skupina A, B). Bol stanovený predpoklad, že obidva varianty sú rovnako obtiažne. Pokusná skupina študentov absolvovala obidva testy s nasledujúcimi výsledkami. Platnosť uvedeného predpokladu overte na hladine významnosti 0, 05!
4 vynakladajú obyvatelia SR v priemere rôzne množstvo peňažných prostriedkov na poistenie v závislosti od stupňa vzdelania 4 ovplyvňuje región priemerné výdavky obyvateľov na poistenie 4 závisí priemerná výška poistného plnenia od značky auta 4 závisí priemerný počet poistných udalostí od ročného obdobia 4 závisí priemerný počet poistných udalostí od toho, či sa budova nachádza v meste alebo na vidieku 4 závisí priemerná výška poistného plnenia od likvidátora poistnej udalosti
Testy zhody viacerých stredných hodnôt 4 ANOVA ANalysis Of VAriance - analýza rozptylu metóda na porovnávanie stredných hodnôt niekoľkých ZS hľadanie rozdielov medzi priemermi sa zakladá na analýze rôznych foriem rozptylu
ANOVA
ANOVA Model pre výslednú pozorovanú hodnotu: kde i = 1, 2, …, m j = 1, 2, …, n kde - očakávaná hodnota pre všetky úrovne faktora a napozorované hodnoty, i - efekt i-tej úrovne faktora A eij - náhodná chyba, ktorým je každé meranie zaťažené, resp. výsledok vplyvu náhodných činiteľov 30
ANOVA alebo Nulovú hypotézu potom môžme formulovať aj nasledovne: Ho : 1 = 2 =… i = m = 0 t. j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H 1: i 0 pre aspoň jedno i (i = 1, 2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly 31
ANOVA Príjem na člena domácnosti v SR Bratislavský kraj BA 443 453 469 487 509 554 Trnavský kraj TT 373 377 385 388 420 440 Trenčiansky kraj TN 355 365 371 376 403 441 Nitriansky kraj NR 344 362 354 385 412 Žilinský kraj ZA 338 356 367 362 372 395 Banskobystrický kraj BB 335 350 353 356 369 421 Prešovský kraj PO 305 327 328 344 359 Košický kraj KE 322 330 334 337 351 393 32
ANOVAPríjem na člena domácnosti v SR 600 550 500 450 400 350 300 BA TT TN NR ZA BB PO KE 33
34
35
Príklad 6 Časopis X porovnáva výšku nájomného za nebytové priestory butikov v mestách A, B, C, D, E (na mesiac/m 2). V každom meste náhodne vybral niekoľko obchodov. Na hladine významnosti a = 0. 05 otestujete, či štatisticky významné rozdiely vo výške nájomného vo vybraných mestách.
Príklad 7 Predstavenstvo A. S. a. s. zvažuje predaj časti akcií zamestnancom tejto spoločnosti. Odhaduje, že záujem o nákup by mohlo prejaviť 20% z nich. Bol vykonaný prieskum, kde bolo oslovených náhodne 400 zamestnancov. Záujem o nákup akcií prejavilo 66 z nich. Je úvaha predstavenstva o predaji akcií reálna?
Testy hypotéz o podiele 4 východisková – nulová hypotéza H 0 : p = p 0 4 alternatívna hypotéza H 1 : p ≠ p 0 resp. H 1 : p > p 0 (pravostranný test) H 1 : p < p 0 (ľavostranný test)
Testy hypotéz o podiele 4
Príklad 8 Testovali sme výrobky dvoch firiem – SONIE a PHILL. Firma SONIE tvrdí, že ich výrobky majú nižšie percento reklamácií. Na overenie tohoto tvrdenia bolo oslovených niekoľko predajcov ich produktov a bolo zistené, že z 300 predaných produktov firmy SONIE bolo v priebehu záručnej doby reklamovaných 10 výrobkov a z 440 predaných výrobkov firmy PHILL bolo v záručnej dobe reklamovaných 18 výrobkov. Otestujte pravdivosť tvrdenia firmy.
Testy hypotéz o podiele