Matematika 3 Statistika Kapitola 1 POPISN STATISTIKA JEDNOHO

  • Slides: 27
Download presentation
Matematika 3 – Statistika Kapitola 1: POPISNÁ STATISTIKA JEDNOHO SOUBORU

Matematika 3 – Statistika Kapitola 1: POPISNÁ STATISTIKA JEDNOHO SOUBORU

Co je matematická statistika? � Matematická statistika je věda, která se zabývá studiem dat

Co je matematická statistika? � Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání. � Je možno rozlišit dvě základní úrovně: § Popisnou statistiku, § Inferenční statistiku. � Popisná statistika zahrnuje metody pro získávání dat, jejich grafickou prezentaci a numerická vyhodnocení � Statistická inference (statistická indukce) zahrnuje metody pro odvozování závěrů o celé populaci na základě dostupných náhodných výběrů. Základním matematickým nástrojem je teorie pravděpodobnosti. Kapitola 1: Popisná statistika jednoho souboru 2

Grafická prezentace dat � � Co jsou data ve statistice? § Systematicky shromažďované informace,

Grafická prezentace dat � � Co jsou data ve statistice? § Systematicky shromažďované informace, § zpravidla (ale ne nutně) číselné povahy. § Pro jejich analýzu je nutná znalost celkového kontextu (co, proč, kdy a jak bylo měřeno, v případě číselných dat v jakých jednotkách. . . ). Ve stavebnictví se nejčastěji setkáváme se soubory číselných dat. Při grafické prezentaci jednoho datového souboru (tzv. jednorozměrného souboru) se nejčastěji používá § Histogram, § Krabičkový graf (Boxplot). Kapitola 1: Popisná statistika jednoho souboru 3

Příklad histogramu Pevnost betonu v tlaku (hodnoty v MPa zjištěné u 150 vzorků) 25

Příklad histogramu Pevnost betonu v tlaku (hodnoty v MPa zjištěné u 150 vzorků) 25 Četnost 20 15 10 5 0 22 -2323 -2424 -2525 -2626 -2727 -2828 -2929 -3030 -3131 -3232 -3333 -3434 -3535 -3636 -3737 -3838 -39 Kapitola 1: Popisná statistika jednoho souboru 4

Grafická prezentace dat (pokračování) � Další příklad použití histogramu: Příklad 1. 1, otázka a)

Grafická prezentace dat (pokračování) � Další příklad použití histogramu: Příklad 1. 1, otázka a) na osobní stránce. � Konstrukce krabičkového grafu bude vysvětlena později (vyžaduje výpočet některých popisných statistik). Kapitola 1: Popisná statistika jednoho souboru 5

Popisné statistiky jednoho číselného souboru � Kapitola 1: Popisná statistika jednoho souboru 6

Popisné statistiky jednoho číselného souboru � Kapitola 1: Popisná statistika jednoho souboru 6

Popisné statistiky jednoho číselného souboru (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 7

Popisné statistiky jednoho číselného souboru (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 7

Popisné statistiky jednoho číselného souboru (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 8

Popisné statistiky jednoho číselného souboru (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 8

Příklad 1. 2 � Kapitola 1: Popisná statistika jednoho souboru 9

Příklad 1. 2 � Kapitola 1: Popisná statistika jednoho souboru 9

Příklad 1. 2 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 10

Příklad 1. 2 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 10

Odlehlá pozorování, krabičkový graf � Kapitola 1: Popisná statistika jednoho souboru 11

Odlehlá pozorování, krabičkový graf � Kapitola 1: Popisná statistika jednoho souboru 11

Příklad 1. 3 � Kapitola 1: Popisná statistika jednoho souboru 12

Příklad 1. 3 � Kapitola 1: Popisná statistika jednoho souboru 12

Příklad 1. 3 (pokračování) Výsledný krabičkový graf: Kapitola 1: Popisná statistika jednoho souboru 13

Příklad 1. 3 (pokračování) Výsledný krabičkový graf: Kapitola 1: Popisná statistika jednoho souboru 13

Příklad 1. 4 Vraťme se k předchozím dvěma příkladům, ve kterých jsme analyzovali obsahy

Příklad 1. 4 Vraťme se k předchozím dvěma příkladům, ve kterých jsme analyzovali obsahy nežádoucí příměsi u 16 vzorků stavebního materiálu. Předpokládejme, že hodnota 28 g (která byla v Příkladu 1. 3 vyhodnocena jako odlehlé pozorování) byla zjištěna chybně a je proto třeba ji ze souboru vyloučit. a) Vypočtěme pro nový soubor 15 údajů základní statistiky, b) zkonstruujme krabičkový graf, c) porovnejme oba soubory pomocí zjištěných výsledků. Řešení je na osobní stránce. Kapitola 1: Popisná statistika jednoho souboru 14

Symetrické rozdělení dat � „Normální“ rozdělení dat: § Histogram lze velmi dobře proložit Gaussovou

Symetrické rozdělení dat � „Normální“ rozdělení dat: § Histogram lze velmi dobře proložit Gaussovou křivkou (bude zavedena v kapitole 5), je téměř symetrický. § Medián je téměř přesně roven výběrovému průměru. § Boxplot je téměř perfektně symetrický, zpravidla neobsahuje odlehlé pozorování. § Koeficienty šikmosti i špičatosti jsou blízké k nule. Kapitola 1: Popisná statistika jednoho souboru 15

Symetrické rozdělení dat (pokračování) � Příklady: § Viz histogram pevnosti betonu v tlaku na

Symetrické rozdělení dat (pokračování) � Příklady: § Viz histogram pevnosti betonu v tlaku na str. 4. § Viz Boxplot k Příkladu 1. 4 (obsah nežádoucí příměsi po vyloučení odlehlého pozorování). Poznámka: Koeficient šikmosti pro data z Příkladu 1. 4 je záporný a je roven přibližně -0. 416. Tato hodnota ukazuje mírné zešikmení dat doleva - viz dále. (Výpočet tohoto koeficientu nebude u zkoušky požadován. ) Kapitola 1: Popisná statistika jednoho souboru 16

Nesymetrické rozdělení dat Nejčastěji se setkáváme s rozdělením dat, které vykazuje buď kladné nebo

Nesymetrické rozdělení dat Nejčastěji se setkáváme s rozdělením dat, které vykazuje buď kladné nebo záporné zešikmení. � Alternativní terminologie: § kladná šikmost ~ zešikmení doprava § záporná šikmost ~ zešikmení doleva � Charakterizace typického kladného zešikmení: § Koeficient šikmosti je (výrazně) kladný. § Data jsou více koncentrovaná v levé části oboru hodnot, vpravo se zpravidla vyskytují odlehlá pozorování. § Křivka prokládající histogram (tj. matematický model pro teoretické rozdělení) má delší „chvost“ orientovaný doprava. § Výběrový průměr je výrazně větší než medián. Kapitola 1: Popisná statistika jednoho souboru 17

Nesymetrické rozdělení dat (pokračování) � Příklady kladného zešikmení: § Viz Příklad 1. 2 (obsahy

Nesymetrické rozdělení dat (pokračování) � Příklady kladného zešikmení: § Viz Příklad 1. 2 (obsahy nežádoucí příměsi u 16 vzorků stavebního materiálu) Poznámka: Koeficient šikmosti je pro tato data roven 2. 879. § Magnitudy zemětřesení: Kapitola 1: Popisná statistika jednoho souboru 18

Nesymetrické rozdělení dat (pokračování) � Příklad krabičkového grafu pro kladně zešikmená data: Kapitola 1:

Nesymetrické rozdělení dat (pokračování) � Příklad krabičkového grafu pro kladně zešikmená data: Kapitola 1: Popisná statistika jednoho souboru 19

Nesymetrické rozdělení dat (pokračování) � Charakterizace typického záporného zešikmení: § Koeficient šikmosti je (výrazně)

Nesymetrické rozdělení dat (pokračování) � Charakterizace typického záporného zešikmení: § Koeficient šikmosti je (výrazně) záporný. § Data jsou více koncentrovaná v pravé části oboru hodnot, vlevo se zpravidla vyskytují odlehlá pozorování. § Křivka prokládající histogram (tj. matematický model pro teoretické rozdělení) má delší „chvost“ orientovaný doleva. § Výběrový průměr je výrazně menší než medián. � Příklady záporného zešikmení: § Všechny tři proměnné v Příkladu 1. 1 (Excelovský soubor „Příklad 1. 1_data a řešení“ - viz histogramy a popisné statistiky těchto proměnných) Kapitola 1: Popisná statistika jednoho souboru 20

Nesymetrické rozdělení dat (pokračování) � Příklad krabičkového grafu pro záporně zešikmená data: Bodové hodnocení

Nesymetrické rozdělení dat (pokračování) � Příklad krabičkového grafu pro záporně zešikmená data: Bodové hodnocení skupiny 80 studentů ve zkoušce � Otázky ke grafu: § V jakých mezích se pohybovaly výsledky 20 nejlepších studentů? § Pod jakou hodnotou se pohybovaly výsledky 25% nejslabších studentů? § Jsou mezi daty odlehlá pozorování? Popište je. § Můžeme něco říci o průměrném výsledku? Kapitola 1: Popisná statistika jednoho souboru 21

Alternativní vzorce pro výpočet rozptylu � Kapitola 1: Popisná statistika jednoho souboru 22

Alternativní vzorce pro výpočet rozptylu � Kapitola 1: Popisná statistika jednoho souboru 22

Výpočet průměru a rozptylu z tabulky četností Příklad 1. 6 (data z Příkladu 68

Výpočet průměru a rozptylu z tabulky četností Příklad 1. 6 (data z Příkladu 68 skript Prof. Jaruškové) V tenké vrstvě roztoku zlata se registroval počet částic zlata, které se dostaly do zorného pole mikroskopu. Pozorování se prováděla pravidelně vždy po uplynutí stejně dlouhého časového intervalu. Výsledky jsou uvedeny v následující tabulce. Počet částic Četnost 0 112 1 168 2 130 3 68 4 32 5 5 6 1 7 1 Určeme modus, medián a kvartily. Vypočtěme též výběrový průměr a směrodatnou odchylku. Co můžeme říct o rozdělení dat? Kapitola 1: Popisná statistika jednoho souboru 23

Příklad 1. 6 (pokračování) � Počet částic Četnost Kumulativní četnost 0 112 1 168

Příklad 1. 6 (pokračování) � Počet částic Četnost Kumulativní četnost 0 112 1 168 280 2 130 410 3 68 478 4 32 510 Kapitola 1: Popisná statistika jednoho souboru 5 5 515 6 1 516 7 1 517 24

Příklad 1. 6 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 25

Příklad 1. 6 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 25

Příklad 1. 6 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 26

Příklad 1. 6 (pokračování) � Kapitola 1: Popisná statistika jednoho souboru 26

Přibližný výpočet základních statistik z tabulky skupinového rozdělení četností � Kapitola 1: Popisná statistika

Přibližný výpočet základních statistik z tabulky skupinového rozdělení četností � Kapitola 1: Popisná statistika jednoho souboru 27