POPISN STATISTIKA ZPRACOVN DAT Vpoet vbrovch charakteristik Histogram
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik Histogram Empirická distribuční funkce 1
A. výpočet výběrových charakteristik přímo z napozorovaných hodnot – rozsah výběru: n – napozorované hodnoty: x 1 , x 2 , . . . , xn Charakteristiky polohy : Výběrový průměr : tj. = ( x 1 + x 2 + x 3 + + xn) / n 2
Výběrový medián Me : – hodnoty uspořádané podle velikosti : x(1) x(2) x(3) . . . . x(n) a) pro n liché, prostřední hodnota ; b) pro n sudé, průměr dvou prostředních hodnot. V případě a): x(1) x(2) x(3) x(4) x(5) je medián x(3) . V případě b): x(1) x(2) x(3) x(4) je medián ( x(2) + x(3) ) / 2. 3
Výběrový modus Mo : nejčetnější hodnota. Uvažujme x(1) x(2) = x(3) = x(4) x(5) x(6) x(7) ; modus je x(2) ( = x(3) = x(4) ). 4
Charakteristiky variability : Výběrový rozptyl s 2 : Výběrová směrodatná odchylka s : tj. Po úpravě : 5
Poznámka: Rozptyl statistického (základního) souboru s 2 : Nejedná se o výběrový rozptyl vypočítaný z výběru několika náhodně vybraných jednotek z procesu nebo základního souboru, ale o rozptyl vypočítaný ze všech prvků konečného statistického souboru. 6
Výběrové rozpětí R : označíme xmin nejmenší x(1) hodnotu ve výběru xmax největší x(n) hodnotu ve výběru rozsahu n potom R = xmax - xmin 7
Schéma pro výpočet výběrových charakteristik : 8
Příklad: Uspořádané hodnoty: Me = 13, 40 = (1/7) 93, 93 = 13, 4186 R = 13, 53 - 13, 30 = 0, 23 s 2 = (1/6) (1260, 4439 - (1/7) 93, 932) = 0, 006248 s = = 0, 079042 9
B. výpočet výběrových charakteristik z hodnot seskupených do tříd – rozsah výběru: n – napozorované hodnoty: x 1 , x 2 , . . . , xn – počet tříd: k – šíře třídy: h Označíme pro j-tou třídu : – nj třídní četnost (absolutní) – fj = nj / n relativní třídní četnost – Nj = kumulovaná třídní četnost (absolutní) – Fj = Nj / n kumulovaná relativní třídní četnost – zj = třídní znak (obvykle střed j-té třídy) – zj + h/2 = horní mez j-té třídy 10
Schéma pro výpočet výběrových charakteristik : 11
Příklad: Výběr n = 44 Seskupíme do tříd šíře h = 0, 1 , zvolíme třídní intervaly 12
Výpočet výběrových charakteristik a s : = 340, 58 / 44 = 7, 740455 = (1/43)(2636, 9431 - 340, 582 / 44) = 0, 016258 0, 127507 13
Znázornění napozorovaných hodnot v pořadí jak byly měřeny 14
PŘÍKLADY : 1. 1 Po roce provozu se měřil na zkušebně výkon motorů pro malotraktory. Jmenovitý výkon motoru xi byl stanoven na 25 k. W. U sedmi zkoušených motorů byly naměřeny následující hodnoty v k. W: i xi 1 24, 8 2 26, 1 3 22, 7 4 24, 2 5 25, 6 6 24, 5 7 26, 0 Ze zjištěných hodnot jmenovitého výkonu motoru stanovte výběrové charakteristiky: největší a nejmenší naměřenou hodnotu, aritmetický průměr, medián, rozpětí, rozptyl a směrodatnou odchylku ze zjištěných hodnot jmenovitého výkonu motoru. 15
1. 2 Při zkoušení výrobků v klimatické komoře se měří relativní vlhkost. U šesti po sobě zkoušených stejných výrobků byly naměřeny následující hodnoty xi v procentech: i xi 1 89, 3 2 94, 1 3 96, 4 4 90, 8 5 92, 0 6 91, 4 Vypočtěte všechny základní výběrové charakteristiky polohy (výběrový průměr, výběrový medián) a variability (výběrové rozpětí, výběrový rozptyl a výběrovou směrodatnou odchylku). 16
1. 4 Ze souboru 5 000 ampulí jistého séra byl vzat náhodný výběr rozsahu n = 6 jednotek. Při destruktivní zkoušce byl zjišťován jejich obsah xi v cm 3 a zapsán do uvedené tabulky: i xi 1 1, 7 2 1, 4 3 1, 6 4 1, 1 5 1, 3 6 1, 3 Vypočtěte z uvedených hodnot běžné výběrové charakteristiky polohy (průměr, medián) a variability (rozpětí, rozptyl a směrodatnou odchylku). 17
1. 8 Ve výběru n = 200 složitých výrobků byla měřena rozteč dvou otvorů s jmenovitou hodnotou 168 mm. Výsledky měření prováděného s přesností na 0, 01 mm byly seskupeny do intervalů šíře 0, 05 mm a jsou uvedeny v tabulce: Doplňte uvedenou tabulku o relativní třídní četnosti, kumulované třídní četnosti a relativní kumulované třídní četnosti 18
19
Histogram grafické znázornění dat seskupených do tříd Napozorované hodnoty x 1, x 2, . . . , xn náhodný výběr rozsahu n. Konstrukce histogramu: počet tříd k stejné šíře h ; zjistí se absolutní třídní četnosti nj , případně relativní třídní četnosti fj ; na osu x se vynesou hranice třídních intervalů, případně třídní znaky zj ; na osu y se vynáší třídní četnosti nj (absolutní) nebo fj (relativní); nad třídními intervaly se sestrojí obdélníky. 20
Příklad : 21
Ukázky některých základních typů histogramů a) Symetrický histogram zvonovitého tvaru 22
b) Dvojvrcholové histogramy 23
c) Histogramy plochého a hřebenovitého tvaru 24
d) Histogramy asymetrického tvaru 25
e) Dvojvrcholové histogramy s výraznou četností v krajní třídě 26
Empirická distribuční funkce grafické znázornění dat uspořádaných podle velikosti Napozorované hodnoty x 1, x 2, . . . , xn náhodný výběr rozsahu n. Konstrukce empirické distribuční funkce: hodnoty uspořádáme podle velikosti x(1) x(2) … x(n) ; na osu x se vynesou hodnoty x(i), (i = 1, 2, …, n) ; na osu y se vynese ke každé hodnotě x(i) hodnota i / (n + 1) ; body [ x(i) ; i / (n + 1) ] tvoří graf empirické distribuční funkce. 27
Konstrukce empirické distribuční funkce v případě údajů seskupených do tříd: na osu x se vynesou horní meze třídních intervalů ; na osu y se vynesou proti nim kumulované relativní třídní četnosti zakreslené body [ zj + h/2 ; Fj ] tvoří graf empirické distribuční funkce. 28
POZNÁMKA: Je-li stupnice, na kterou vynášíme hodnoty Fj , resp. (i) / (n+1) pravděpodobnostní, potom v případě normálního rozdělení sledované náhodné veličiny jsou zakreslené body soustředěny v úzkém okolí přímky, která odpovídá teoretické distribuční funkci normálního rozdělení N( , 2) pro = a = s. Zakreslení přímky na pravděpodobnostní papír Z výběrových hodnot xi (i=1, 2, . . . , n) se vypočtou hodnoty výběrového průměru a výběrové směrodatné odchylky s , které jsou odhady parametrů a normálního rozdělení N( , 2). Na pravděpodobnostní papír se zakreslí body (x = ; y = 50) a (x = + s ; y = 84, 1) a těmito body se proloží přímka, která představuje průběh odhadu distribuční funkce rozdělení N( , 2). 29
Příklad : Uspořádáme naměřené délky podle velikosti a přiřadíme jim hodnoty i / (n+1). Pokud se některé hodnoty opakují, s četností n(i) , potom jim přísluší nárůst n(i)/(n+1) empirické distribuční funkce. Uspořádané hodnoty sestavíme do tabulky: 30
Uspořádané hodnoty zakreslíme do grafu: 31
Empirická distribuční funkce zakreslená do pravděpodobnostního papíru: 32
- Slides: 32