TESTOVANIE TATISTICKCH HYPOTZ 1 PREDNKA 5 p testovanie

  • Slides: 34
Download presentation
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ 1

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ 1

PREDNÁŠKA 5 p testovanie štatistických hypotéz: p p p základná terminológia chyba I. a

PREDNÁŠKA 5 p testovanie štatistických hypotéz: p p p základná terminológia chyba I. a II. druhu všeobecný postup testovania p testy hypotéz o strednej hodnote n n n p testy hypotéz o rozptyle n n p test zhody strednej hodnoty so známou konštantou test zhody dvoch stredných hodnôt – nezávislé výbery test zhody dvoch stredných hodnôt – závislé výbery test zhody rozptylu so známou konštantou test zhody dvoch rozptylov testy hypotéz o podiele n n test zhody podielu so známou konštantou test zhody dvoch podielov 2

Testovanie štatistických hypotéz n n vychádzame z toho, že parametre ZS nie sú známe

Testovanie štatistických hypotéz n n vychádzame z toho, že parametre ZS nie sú známe môžeme však o nich vysloviť určité predpoklady overujeme štatistickými metódami, ktoré nazývame štatistické hypotézy postup = testovanie štatistických hypotéz 3

Testovanie štatistických hypotéz n n vychádzame zo základnej hypotézy = H 0 hypotéza oproti

Testovanie štatistických hypotéz n n vychádzame zo základnej hypotézy = H 0 hypotéza oproti nej je postavená alternatívna hypotéza H 1 cieľom testovanie hypotéz je rozhodnutie o prijatí alebo zamietnutí základnej hypotézy ak zamietame základnú hypotézu, potom prijímame alternatívnu hypotézu 4

Príklady: n n 5 Chceme overiť, či sa priemerné výdavky na potraviny v r.

Príklady: n n 5 Chceme overiť, či sa priemerné výdavky na potraviny v r. 2014 významne zvýšili oproti r. 2013, pričom na základe výberového skúmania predstavovali v r. 2013 34% a 36% v r. 2014 Výrobca reflektorov uvádza, že ich životnosť je 70 hodín. Za tým účelom sa uskutočnilo výberové skúmanie a na vzorke 20 reflektorov sa zistila priemerná životnosť 67 hodín a výberová smerodajná odchýlka 2 hodiny. Má výrobca pravdu ? ? ?

Testovanie štatistických hypotéz štatistická hypotéza môže vyjadrovať predpoklad o rovnosti parametra ZS s ľubovoľnou

Testovanie štatistických hypotéz štatistická hypotéza môže vyjadrovať predpoklad o rovnosti parametra ZS s ľubovoľnou známou konštantou alebo parametrom iného základného súboru n v tomto prípade hovoríme o H 0 hypotéze H 0: Q=Q 0 H 0: Q-Q 0=0 n také hypotézy, pri ktorých sa predpokladá nerovnosť parametra ZS, sa nazývajú H 1 hypotézy n 6

Testovanie štatistických hypotéz n H 1 hypotézy môžu byť v rôznych tvaroch: H 1:

Testovanie štatistických hypotéz n H 1 hypotézy môžu byť v rôznych tvaroch: H 1: Q ¹ Q 0 ¨ jednostranné: ¨ obojstranná n n pravostranná H 1: Q Q 0 ľavostranná H 1: Q<Q 0 7

Testovanie štatistických hypotéz parameter Q, o ktorom máme určitú hypotézu, nepoznáme n odhadujeme ho

Testovanie štatistických hypotéz parameter Q, o ktorom máme určitú hypotézu, nepoznáme n odhadujeme ho pomocou výberovej charakteristiky un n un je náhodná premenná, pričom predpokladáme, že poznáme jej rozdelenie n 8

Testovanie štatistických hypotéz n n n rozhodnutie o zamietnutí, resp. nezamietnutí H 0 uskutočňujeme

Testovanie štatistických hypotéz n n n rozhodnutie o zamietnutí, resp. nezamietnutí H 0 uskutočňujeme na základe náhodného výberu nemôžeme ho urobiť s absolútnou presnosťou existuje určité riziko odhadu za predpokladu, že platí H 0, rovná sa parameter Q predpokladanej veličine Q 0 keďže est Q=un, potom rozdiel =un-Q 0 je len náhodnou chybou spôsobenou náhodným výberom 9

Testovanie štatistických hypotéz n ak však H 0 neplatí, t. j. Q¹Q 0, potom

Testovanie štatistických hypotéz n ak však H 0 neplatí, t. j. Q¹Q 0, potom sa rozdiel môže skladať z náhodnej chyby a systematickej chyby, chyby ktorá odráža skutočný rozdiel medzi parametrom ZS Q a jeho predpokladanou veľkosťou Q 0 = un-Q 0=(un-Q)+(Q-Q 0) náhodná chyba systematická chyba - rozdiel 10

Testovanie štatistických hypotéz v praxi nemožno zistiť, či rozdiel obsahuje iba náhodnú chybu alebo

Testovanie štatistických hypotéz v praxi nemožno zistiť, či rozdiel obsahuje iba náhodnú chybu alebo aj systematickú n ak je však malé, pripisujeme ho iba náhodnosti výberu n ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel n 11

Testovanie štatistických hypotéz n rozhodnutie o zamietnutí, resp. nezamietnutí H 0 predpokladá znalosť kritickej

Testovanie štatistických hypotéz n rozhodnutie o zamietnutí, resp. nezamietnutí H 0 predpokladá znalosť kritickej hodnoty, hodnoty ktorá rozdiel rozdelí na dve časti : ¨ ¨ n pri rozdieloch < ako kritická hodnota, H 0 nezamietame pri rozdieloch ako kritická hodnota, H 0 zamietame veľkosť v konkrétnych prípadoch kolíše, je náhodnou veličinou, preto sa snažíme transformovať na veličinu G, ktorá má známe teoretické rozdelenie (napr. normované normálne, resp. Studentovo či iné rozdelenie) 12

Testovanie štatistických hypotéz n n n G = f(un, Q) G = f( )

Testovanie štatistických hypotéz n n n G = f(un, Q) G = f( ) pričom funkcia hustoty náhodnej premennej G je f(g) vychádzame z platnosti H 0: Q = Q 0 a vypočítame testovaciu charakteristiku g =f(un, Q 0) rozhodnutie o výsledku testu: ¨ môžeme potom nájsť také kritické hodnoty g 1 a g 2 náhodnej veličiny G, pre ktoré platí: P(g 1 G g 2) =1 - alebo P(g 1 G g 2) = 13

Testovanie štatistických hypotéz f(g) 1 - /2 g 1 kritický obor, obor zamietnutia H

Testovanie štatistických hypotéz f(g) 1 - /2 g 1 kritický obor, obor zamietnutia H 0 n n obor prijatia H 0 g 2 kritický obor, obor zamietnutia H 0 hladiny významnosti hladina významnosti rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H 0 14

Testovanie štatistických hypotéz n Závery testov je možné robiť dvomi spôsobmi: a) b) klasický

Testovanie štatistických hypotéz n Závery testov je možné robiť dvomi spôsobmi: a) b) klasický (na základe kritickej hodnoty) moderný prostredníctvom p hodnoty (p value) P hodnota predstavuje pravdepodobnosť, že výberová charakteristika nadobudne aspoň takú hodnotu ako je skutočne zistená hodnota (hodnota testovacej charakteristiky) p hodnota = P(U>u) p hodnota = vypočítaná hladina významnosti prakticky: ak p hodnota < hladina významnosti ( ), tak H 0 zamietame ak p hodnota < 0, 05 rozdiel je preukazný ak p hodnota < 0, 01 rozdiel je vysokopreukazný 15

Testovanie štatistických hypotéz n n CHYBY PRI TESTOVANÍ: popri správnom rozhodnutí o výsledku testu:

Testovanie štatistických hypotéz n n CHYBY PRI TESTOVANÍ: popri správnom rozhodnutí o výsledku testu: ¨ prijatí správnej hypotézy ¨ zamietnutí nesprávnej hypotézy n môže dôjsť k nesprávnemu rozhodnutiu: ¨ zamietnutí správnej hypotézy – chyby I. druhu ¨ prijatí nesprávnej hypotézy – chyby II. druhu 16

Testovanie štatistických hypotéz n n n 1 - – pravdepodobnosť prijatia správnej hypotézy –

Testovanie štatistických hypotéz n n n 1 - – pravdepodobnosť prijatia správnej hypotézy – riziko zamietnutia správnej hypotézy ak sa znižuje , znižuje sa vznik chyby I. druhu = rozšíri sa obor prijatia H 0 znižovaním však rastie riziko vzniku chyby II. druhu – označuje sa ako b potom 1 -b udáva silu testu = pravdepodobnosť zamietnutia H 0 v prípade, ak je skutočne nesprávna v praxi: =0, 05, =0, 05 resp. =0, 01 17

Schematicky môžeme možné výsledky rozhodovacieho procesu pri testovaní štatistických hypotéz znázorniť takto: Hypotéza Správna

Schematicky môžeme možné výsledky rozhodovacieho procesu pri testovaní štatistických hypotéz znázorniť takto: Hypotéza Správna Nesprávna Nezamietam Správne rozhodnutie Chyba 2. druhu Zamietam Chyba 1. druhu Správne rozhodnutie Rozhodnutie - chyba prvého druhu, ktorá vzniká pri zamietnutí správnej hypotézy - chyba druhého druhu, ktorá vzniká prijatí nesprávnej hypotézy 18

Testovanie štatistických hypotéz n všeobecný postup testovania: rovnosť rozdiely 1. Formulácia hypotéz hnulová hypotéza

Testovanie štatistických hypotéz n všeobecný postup testovania: rovnosť rozdiely 1. Formulácia hypotéz hnulová hypotéza H 0 - obsahuje definíciu rovnosti halternatíva hypotéza - je opakom k nulovej hypotéze zber údajov 3. Výberové skúmanie hvytvorenie výberového súboru hvýpočet výberových charakteristík záver testu definovanie 2. Definovanie hladiny významnosti hakú pravdepodobnosť sme ochotní akceptovať pre chybu I. typu hväčšinou 0, 05 alebo 0, 01 testovanie 4. Voľba testovacieho kritéria hna základe typu testu hjeho výpočet 5. Určenie kritických hodnôt 6. Rozhodnutie o výsledku testu hprijatie, resp. zamietnutie H 0 hinterpretácia 19

Test zhody strednej hodnoty so známou konštantou § § § poznáme 2 nepoznáme 2

Test zhody strednej hodnoty so známou konštantou § § § poznáme 2 nepoznáme 2 a n>30 nepoznáme 2 a n 30 20

Test zhody strednej hodnoty so známou konštantou ¨ ¨ ¨ nech štatistický znak X

Test zhody strednej hodnoty so známou konštantou ¨ ¨ ¨ nech štatistický znak X má v ZS približne normálne rozdelenie X. . N ( , 2) predpokladajme, že stredná hodnota sa rovná známej konštante 0 formulácia hypotéz: H 0: m = m 0 H 1: m ¹ m 0 strednú hodnotu základného súboru odhadujeme cez výberový priemer est = 21

Test zhody strednej hodnoty so známou konštantou a) predpokladáme, že poznáme 2 ZS (teoretický

Test zhody strednej hodnoty so známou konštantou a) predpokladáme, že poznáme 2 ZS (teoretický predpoklad) ¨ testovacia charakteristika ¨ u má N(0, 1) 22

Test zhody strednej hodnoty so známou konštantou b) nepoznáme 2 ZS a rozsah VS

Test zhody strednej hodnoty so známou konštantou b) nepoznáme 2 ZS a rozsah VS >30 est 2 = s 12 ¨ testovacia charakteristika ¨ ¨ u má N(0, 1) 23

Test zhody strednej hodnoty so známou konštantou c) nepoznáme 2 ZS a rozsah VS

Test zhody strednej hodnoty so známou konštantou c) nepoznáme 2 ZS a rozsah VS 30 est 2 = s 12 ¨ testovacia charakteristika ¨ ¨ t má t (n-1) rozdelenie (Studentove r. ) 24

Test zhody strednej hodnoty so známou konštantou n rozhodnutie o výsledku testu: f(u) 1

Test zhody strednej hodnoty so známou konštantou n rozhodnutie o výsledku testu: f(u) 1 - /2 -u 1 - /2 kritický obor, obor zamietnutia H 0 vak u 1 - /2 obor prijatia H 0 kritický obor, obor zamietnutia H 0 |uvyp, tvyp| < u 1 - /2, t , (n-1) H 0 nezamietame | uvyp, tvyp| u 1 - /2, t , (n-1) H 0 zamietame 25

Príklad Na základe výsledkov výberového zisťovania, ktorého sa zúčastnilo 289 zamestnancov z celej SR

Príklad Na základe výsledkov výberového zisťovania, ktorého sa zúčastnilo 289 zamestnancov z celej SR bola zistená priemerná mzda 987 € so smerodajnou odchýlkou 290 €. ŠÚ SR udáva, že priemerná mzda v SR pre 2 Q roku 2019 nadobudla hodnotu 1101 €. Existuje rozdiel v uvedených ukazovateľoch? 26

Test zhody rozptylu so známou konštantou nech štatistický znak X má v ZS približne

Test zhody rozptylu so známou konštantou nech štatistický znak X má v ZS približne normálne rozdelenie X. . N ( , 2) ¨ predpokladajme, že rozptyl 2 sa rovná známej konštante 02 ¨ formulácia hypotéz: H 0: s 2 = s 02 H 1: s 2 ¹ s 02 ¨ rozptyl základného súboru odhadujeme cez výberový rozptyl est 2 = s 12 ¨ 27

Test zhody rozptylu so známou konštantou n testovacia charakteristika n c 2 má c

Test zhody rozptylu so známou konštantou n testovacia charakteristika n c 2 má c 2(n-1) rozdelenie (chí kvadrát r. ) § Záver testu: testu f( 2) /2 OZ 21 - /2 1 - obor prijatia H 0 ak c 2>c 21 -a/2 Ù c 2<c 2 a/2 H 0 nezamietame v /2 OZ 2 /2 c 21 -a/2 Ú c 2 a/2 H 0 zamietame vak 28

Príklad n Obsah vitamínu C v mg. kg-1 29, 6 32, 4 30 31,

Príklad n Obsah vitamínu C v mg. kg-1 29, 6 32, 4 30 31, 6 28, 7 29, 2 35, 9 32, 9 34, 7 30, 2 29

30

30

Test zhody podielu so známou konštantou n Predpokladáme, že alternatívny znak s binomickým rozdelením

Test zhody podielu so známou konštantou n Predpokladáme, že alternatívny znak s binomickým rozdelením je možné aproximovať na normálne rozdelenia. Predpokladajme, že podiel π sa rovná známej konštante π0. n Formulácia hypotéz: n n n základná – nulová hypotéza H 0: π = π0 alternatívna hypotéza H 1: π ≠ π0 31

Test zhody podielu so známou konštantou 32

Test zhody podielu so známou konštantou 32

Príklad Predstavenstvo A. S. a. s. zvažuje predaj časti akcií zamestnancom tejto spoločnosti. Odhaduje,

Príklad Predstavenstvo A. S. a. s. zvažuje predaj časti akcií zamestnancom tejto spoločnosti. Odhaduje, že záujem o nákup by mohlo prejaviť 20% z nich. Bol vykonaný prieskum, kde bolo oslovených náhodne 400 zamestnancov. Záujem o nákup akcií prejavilo 66 z nich. Je úvaha predstavenstva o predaji akcií reálna? 33

ĎAKUJEM ZA POZORNOSŤ 34

ĎAKUJEM ZA POZORNOSŤ 34