Testovn statistickch hypotz Co je to statistick hypotza

  • Slides: 32
Download presentation
Testování statistických hypotéz

Testování statistických hypotéz

Co je to statistická hypotéza? Hypotéza o základním souboru (populaci).

Co je to statistická hypotéza? Hypotéza o základním souboru (populaci).

Typy stat. hypotéz • Parametrické hypotézy - hypotézy o parametrech populace a) Hypotézy o

Typy stat. hypotéz • Parametrické hypotézy - hypotézy o parametrech populace a) Hypotézy o parametru jedné populace (o střední hodnotě, mediánu, rozptylu, relativní četnosti…) b) Hypotézy o parametrech dvou populací (srovnávací testy) c) Hypotézy o parametrech více než dvou populací (ANOVA …) • Neparametrické hypotézy - hypotézy o jiných vlastnostech populace (tvar rozdělení, závislost proměnných…)

Zdroje hypotéz • Hypotéza je založena na předchozí zkušenosti • Hypotéza vychází z teorie,

Zdroje hypotéz • Hypotéza je založena na předchozí zkušenosti • Hypotéza vychází z teorie, kterou je třeba doložit • Hypotéza vychází z požadavku na kvalitu produktu • Hypotéza je pouhým dohadem založeným na náhodném pozorování

Co to je testování hypotéz? Egon Sharpe Pearson (1895 -1980) Jerzy Neymann (1894 -1981)

Co to je testování hypotéz? Egon Sharpe Pearson (1895 -1980) Jerzy Neymann (1894 -1981) Rozhodovací proces, v němž proti sobě stojí 2 tvrzení - nulová a alternativní hypotéza.

Nulová hypotéza - takové tvrzení o populaci, které je bráno jak předpoklad při testování

Nulová hypotéza - takové tvrzení o populaci, které je bráno jak předpoklad při testování - představuje určitý rovnovážný stav a bývá vyjádřena rovnosti „=“ např. μ = 100, μ 1 = μ 2 = μ 3 … Alternativní hypotéza - představuje porušení rovnovážného stavu a zapisujeme ji tedy jedním ze tří možných zápisů nerovnosti ( ≠ , <, >)

Výběr vhodné alternativní hypotézy • jednostranná vs. oboustranná alternativa • alternativní hypotéza musí být

Výběr vhodné alternativní hypotézy • jednostranná vs. oboustranná alternativa • alternativní hypotéza musí být v souladu s výběrovým souborem

Princip testování hypotéz

Princip testování hypotéz

Chyby při testování hypotéz jsou nevyhnutelnou součásti testování Rozhodnutí Skutečnost Platí H 0 Platí

Chyby při testování hypotéz jsou nevyhnutelnou součásti testování Rozhodnutí Skutečnost Platí H 0 Platí HA Nezamítáme H 0 Zamítáme H 0 Správné rozhodnutí Pravděpodobnost: 1 – α (spolehlivost) Chyba I. druhu Pravděpodobnost: α (hladina významnosti) Chyba II. druhu Pravděpodobnost: β Správné rozhodnutí Pravděpodobnost: 1 – β (síla testu)

 • Chyba I. druhu - nulová hypotéza platí, ale my ji zamítneme -

• Chyba I. druhu - nulová hypotéza platí, ale my ji zamítneme - maximální přípustná pravděpodobnost chyby I. druhu (hladina významnosti) se volí ještě před pořízením výběrového souboru) • Chyba II. druhu - nulová hypotéza neplatí, ale my ji nezamítneme (nepoznáme, že neplatí) - síla testu závisí na zvolené testové metodě (zejména na skutečném rozdělení dat)

Grafický zápis chyby II. druhu (pro konkrétní alternativu) Operativní charakteristika Křivka síly testu (Power

Grafický zápis chyby II. druhu (pro konkrétní alternativu) Operativní charakteristika Křivka síly testu (Power Curve)

Příklad Standardním výrobním způsobem lze vyrobit monitory se střední životnosti 1200 hodin a směrodatnou

Příklad Standardním výrobním způsobem lze vyrobit monitory se střední životnosti 1200 hodin a směrodatnou odchylkou 300 hodin. Novou technologií, kterou navrhuje vývojové centrum bylo zkušebně vyrobeno 100 obrazovek, jejichž průměrná životnost byla 1265 hodin. Předpokládejme, že výběr pocházel z normálního rozdělení. Jde o kvalitnější technologii, nejde pouze o náhodný rozdíl?

Nakolik průměr odpovídá nulové hypotéze?

Nakolik průměr odpovídá nulové hypotéze?

Skutečnost Výsledek testu Jestliže platí H 0 HA H 0 OK Chyba I. druhu

Skutečnost Výsledek testu Jestliže platí H 0 HA H 0 OK Chyba I. druhu HA Chyba II. druhu OK Jestliže platí konkrétní HA Nezamítáme H 0 β µ 0 =1200 Zamítáme H 0 α (volíme) μA = 1240

Jak snížit pravděpodobnost obou chyb?

Jak snížit pravděpodobnost obou chyb?

Vliv rostoucího rozsahu výběru na pravděpodobnost chyb I. a II. druhu Jestliže platí H

Vliv rostoucího rozsahu výběru na pravděpodobnost chyb I. a II. druhu Jestliže platí H 0 Jestliže platí konkrétní HA Nezamítáme H 0 β µ 0 =1200 Zamítáme H 0 α μA = 1240

Přístupy k testování hypotéz • Testování pomocí intervalových odhadů • Klasický test • Čistý

Přístupy k testování hypotéz • Testování pomocí intervalových odhadů • Klasický test • Čistý test významnosti (testování pomocí p-value (p-hodnoty))

Testování pomocí intervalových odhadů Lze použít pouze pro testování parametrických hypotéz 1. Formulace nulové

Testování pomocí intervalových odhadů Lze použít pouze pro testování parametrických hypotéz 1. Formulace nulové a alternativní hypotézy 2. Nalezení příslušného intervalového odhadu (POZOR! Umíme zatím nalézt pouze int. odhady parametrů normálního rozdělení!!!) 3. Ověření toho, zda testovaná hodnota parametru leží v nalezeném intervalovém odhadu 4. Formulace závěru testu

Klasický test 1. Formulace nulové a alternativní hypotézy 2. Volba testové statistiky (testového kritéria)

Klasický test 1. Formulace nulové a alternativní hypotézy 2. Volba testové statistiky (testového kritéria) T(X), musíme znát (nulové rozdělení) 3. Ověření předpokladů testu 4. Sestrojení kritického oboru a oboru přijetí 5. Výpočet pozorované hodnoty testové statistiky T(X) - x. OBS 6. Formulace závěru testu

Konstrukce kritického oboru - C 1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy

Konstrukce kritického oboru - C 1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky) C ≤ Tα 2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako: C ≥ T 1 -α 3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!! (C ≤ Tα/2) nebo (C ≥ T 1 -α/2)

Příklad 1. Formulace nulové a alternativní hypotézy: 2. Volba testového kritéria: 3. Ověření předpokladu

Příklad 1. Formulace nulové a alternativní hypotézy: 2. Volba testového kritéria: 3. Ověření předpokladu testu: Viz. předpoklad v zadání úlohy. 4. Výpočet pozorované hodnoty:

5. Konstrukce kritického oboru: Jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0

5. Konstrukce kritického oboru: Jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 α µ 0 =1200 T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 α µ =0 z 0, 95=1, 64 C

6. Rozhodnutí: T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 α

6. Rozhodnutí: T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 α µ =0 C 1, 64 x. OBS=2, 17 Zamítáme H 0 ve prospěch HA, tj. s 95% ní pravděpodobnosti lze tvrdit, že došlo ke zlepšení střední životnosti monitorů.

Vliv volby α na rozhodnutí T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme

Vliv volby α na rozhodnutí T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 α µ =0 1, 64 x. OBS=2, 17 C

Čistý test významnosti 1. Formulace nulové a alternativní hypotézy 2. Volba testové statistiky (testového

Čistý test významnosti 1. Formulace nulové a alternativní hypotézy 2. Volba testové statistiky (testového kritéria) T(X), musíme znát (nulové rozdělení) 3. Ověření předpokladů testu 4. Výpočet pozorované hodnoty testové statistiky T(X) – x. OBS 5. Určení p-value 6. Formulace závěru testu

Co je to p-value? T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H

Co je to p-value? T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 p-value α µ =0 C 1, 64 x. OBS=2, 17 p-value je pravděpodobnost, že testová statistika bude alespoň tak „extrémní“ jako pozorovaná hodnota.

Jak určujeme p-value? 1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké

Jak určujeme p-value? 1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky) p-value = F 0(x. OBS) 2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako: p-value = 1 -F 0(x. OBS) 3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!! p-value = 2. min{F 0(x. OBS) ; 1 -F 0(x. OBS)}

Jak rozhodujeme pomocí p-value? T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H

Jak rozhodujeme pomocí p-value? T(X), jestliže platí H 0 Nezamítáme H 0 Zamítáme H 0 p-value α µ =0 C 1, 64 x. OBS=2, 17 α>p-value α<p-value zamítáme H 0 nezamítáme H 0

α>p-value α<p-value zamítáme H 0 nezamítáme H 0 • P-value je nejvyšší hladina významnosti

α>p-value α<p-value zamítáme H 0 nezamítáme H 0 • P-value je nejvyšší hladina významnosti na níž nezamítáme nulovou hypotézu. • P-value je nejnižší hladina významnosti na níž zamítáme nulovou hypotézu.

Rozhodování na klasických hladinách významnosti (0, 05 a 0, 01) Zamítáme H 0 Nerozhodná

Rozhodování na klasických hladinách významnosti (0, 05 a 0, 01) Zamítáme H 0 Nerozhodná oblast 0, 01 Nezamítáme H 0 0, 05 p-value