Zklady metodolgie vedy I 9 prednka Triedenie dt
- Slides: 19
Základy metodológie vedy I. 9. prednáška
Triedenie dát: § Triedny znak - xi § Absolútna početnosť – ni (súčet všetkých absolútnych početností sa rovná rozsahu súboru – n) § Relatívna početnosť – fi (relatívna početnosť sa udáva ako desatinné číslo, resp. v %. Súčet všetkých relatívnych početností sa vždy rovná 1, resp. 100 %)
Triedenie dát: § Kumulatívna absolútna početnosť – Ni § Kumulatívna relatívna početnosť - Fi
Úlohou deskriptívnej (opisnej) štatistiky je vytvorenie prehľadu o získaných údajoch, ktoré samé o sebe predstavujú neprehľadnú zmes čísel, prípadne aj písmen. Na splnenie tohto účelu slúžia: § tabuľky, § grafy, § opisné charakteristiky.
Prezentácia výsledkov: Neoddeliteľnou súčasťou štatistického spracovania zistených údajov je prehľadná a názorná prezentácia prostredníctvom tabuliek a grafov. § Kruhový (koláčový) graf Obr. 4 Úmrtnosť na Slovensku podľa príčin smrti v roku 1999
§ Bodový graf § Spojnicový graf
§ Stĺpcový graf
§ Stĺpcový graf
Opisné charakteristiky: Opisná charakteristika predstavuje číslo vypočítané podľa príslušného vzorca zo štatistického súboru. Cieľom opisných charakteristík je charakterizovať súbor. Opisné charakteristiky sa delia na tri skupiny: § miery polohy (stredné hodnoty), § miery variability, § miery tvaru.
Miery polohy (stredné hodnoty): - poskytujú základnú informáciu o súbore získaných údajov, charakterizujú nám typickú hodnotu údajov, určenie hodnoty, okolo ktorej sa hodnoty premennej (znaku) v skúmanom súbore nachádzajú, pohybujú § Aritmetický priemer – x (resp. M)
Miery polohy (stredné hodnoty): § Medián – x (resp. Me) medián predstavuje strednú hodnotu súboru, ktorý je zoradený od najmenšej po najväčšiu hodnotu. V prípade párneho počtu hodnôt je medián aritmetický priemer hodnôt na miestach n/2 a n/2+1. § Modus – x (resp. Mo) modus predstavuje najčastejšie sa vyskytujúcu hodnotu premennej. Rozdelenie: s jediným vrcholom – unimodálne, s dvomi (viacerými) vrcholmi – bimodálne (multimodálne).
Miery variability: § Variačné rozpätie – Vr (resp. R) Najjednoduchšou mierou variability je variačné rozpätie, ktoré sa vypočíta ako rozdiel medzi najväčšou a najmenšou hodnotou súboru: pracuje sa iba s dvomi údajmi z celého súboru
Miery variability: § Rozptyl – s 2 - najpoužívanejšou mierou variability je rozptyl, - pri výpočte sa používajú všetky údaje a vzťahuje sa k aritmetickému priemeru, - čím je rozptyl väčší, tým sa údaje viac odchyľujú od priemeru – sú viac rozptýlené.
Miery variability: § Smerodajná odchýlka – s - je odmocnina z rozptylu a tým sa vracia miera variability do mierky pôvodných dát:
Normálne (Gaussovo) rozdelenie - normálne rozdelenie pravdepodobnosti má v štatistických aplikáciách najväčší význam, - náhodná premenná x má normálne rozdelenie pravdepodobnosti s parametrami a 2 , ak jej funkcia hustoty pravdepodobnosti je daná vzťahom kde je stredná hodnota náhodnej premennej x, 2 je rozptyl náhodnej premennej x.
Krivka hustoty pravdepodobnosti normálneho rozdelenia
Krivka hustoty pravdepodobnosti normálneho rozdelenia - parametre normálneho rozdelenia sú stredná hodnota a rozptyl, - normálna krivka je symetrická podľa osy, ktorá prechádza vrchol krivky, - vrcholom (maximom) krivky je stredná hodnota, - normálna krivka má zvonovitý tvar a je vždy kladná a nenulová pre všetky hodnoty x - nikdy nepretína vodorovnú os, - plocha ohraničená grafom f(x) a osou x je rovná 1 (zodpovedá 100%), - smerodajná odchýlka určuje ako je krivka roztiahnutá do šírky,
Krivka hustoty pravdepodobnosti normálneho rozdelenia Tvar krivky normálneho rozdelenia pre rôzne smerodajné odchýlky
Krivka hustoty pravdepodobnosti normálneho rozdelenia - interval obsahuje 68, 3 % populácie, - interval 2 obsahuje 95, 5 % populácie, - interval 3 obsahuje 99, 7 % populácie.