TATISTIKA Zkladn pojmy l l l tatistick sbor
ŠTATISTIKA
Základné pojmy l l l Štatistický súbor Rozsah súboru Kvantitatívny znak Kvalitatívny znak ARITMETICKÝ PRIEMER MODUS MEDIÁN Grafy -Polygón početnosti a histogram SMERODAJNÁ ODCHÝLKA DISPERZIA-ROZPTYL Štatistická závislosť znakov-KOEFICIENT KORElÁCIE
Pr. 1 Vypočítajte priemerný prospech žiaka Janka Hraška na konci roka ak dosiahol takéto výsledky z jednotlivých predmetov Sj D Rj M F Bio Tv 2 1 3 2 1 x 2 x 3 x 4 x 5 x 6 x 7 OBSAH
Aritmetický priemer známok je: OBSAH
Def: Štatistickým súborom rozumieme danú konečnú neprázdnu množinu M. (napr. množina predmetov, resp. známok) Počet n všetkých prvkov množiny M sa nazýva rozsah súboru. l Kvantitatívnym znakom súboru M (počet predmetov-známok. . . n=7) nazývame ľubovoľnú funkciu f, ktorá zobrazuje množinu M do množiny R. (Jednotlivým predmetom priradí známku, teda reálne číslo) (Hodnoty tejto funkcie označme x 1, x 2, . . xn)
ARITMETICKÝ PRIEMER Ak hodnoty množiny M označíme x 1, x 2, x 3 …xn , tak aritmetickým priemerom znaku x je číslo OBSAH
Vážený priemer l Absolútna početnosť l Relatívna početnosť
Pr 2. V triede je 9 chlapcov, ktorých výšky sú uvedené v tabuľke: Chc ch 1 ch 2 ch 3 ch 4 ch 5 ch 6 ch 7 ch 8 Ch 9 výška 160 168 174 171 174 179 174 190 179 l l l Vypočítajte priemer (vážený) Modus Medián Smerodajnú odchýlku Zostrojte histogram OBSAH
Výška xi 160 168 171 174 174 179 190 X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 9 Tabuľky Výška 160 168 171 174 179 190 Xj Počet x 1 1 x 2 1 x 3 x 4 x 5 x 6 1 3 2 1 OBSAH Nj n 1 n 2 n 3 n 4 n 5 n 6
Priemer OBSAH
MODUS Je najčastejšie sa vyskytujúca hodnota spomedzi x 1, x 2, . . . xn. Označenie: mod(x)=xj 0, nj<nj 0 OBSAH
MEDIÁN Je prostredná hodnota medzi číslami x 1, x 2, x 3, . . . . xn ak ich usporiadame podľa veľkosti. Označenie: med(x) Poznámka: Ak rozsah súboru n je párne číslo, potom sú prostredné hodnoty dve a za medián sa berie ich aritmetický priemer. OBSAH
Rozptyl a smerodajná odchýlka Okrem charakteristiky polohy je dobré vedieť aj to, nakoľko sa jednotlivé hodnoty od tejto charakteristiky odchyľujú. Na to sa obvykle používa tzv. smerodajná odchýlka resp. rozptyl. OBSAH
Def. : Nech x 1, x 2, . . xn sú všetky hodnoty daného znaku x. Potom sa číslo s nazýva SMERODAJNÁ ODCHÝLKA, pričom: OBSAH
Resp.
Poznámka: Čím je číslo s menšie, tým sú menšie rozdiely a tým sú čísla xi rozmiestnené bližšie okolo aritmetického priemeru.
Veta: Interval obsahuje aspoň všetkých členov x 1, 2, x 3, . . . xn. OBSAH
Druhá mocnina čísla s sa nazýva DISPERZIA alebo ROZPTYL
resp. OBSAH
Poznámka: Rozptyl, podobne ako smerodajná odchýlka, poukazuje na to, nakoľko sa odchyľujú jednotlivé čísla ( hodnoty štatistického súboru) od priemeru. OBSAH
l Riešme príklad 2: V triede je 9 chlapcov, ktorých výšky sú uvedené v tabuľke: Chc ch 1 ch 2 ch 3 ch 4 ch 5 ch 6 ch 7 ch 8 Ch 9 výška 160 168 174 171 174 179 174 190 179 OBSAH
GRAFY
PRÍKLADY K 13, K 14, K 17 OBSAH
Štatistická závislosť znakov KOEFICIENT KORELÁCIE (korelačná odchýlka)
V mnohých prípadoch sa na prvkoch základného súboru sledujú dva znaky X, Y. Jednou z úloh matematickej štatistiky je kvantitatívne charakterizovať „mieru závislosti“ medzi týmito dvoma znakmi ( veličinami- napr. medzi výškou a hmotnosťou študentov)
V aplikáciach matematickej štatistiky obľúbenou charakteristikou závislosti je KOEFICIENT KORELÁCIE (korelačná odchýlka)
Def: Nech x 1, x 2, . . . xn sú hodnoty znaku X l Nech y 1, y 2, . . . yn sú hodnoty znaku Y vo výberovom súbore l Nech l sú aritmetické priemery, resp. disperzie(rozptyly), resp. smerodajné odchýlky týchto znakov vo výberovom súbore, tj.
Výraz : sa nazýva KONVARIANCIA znakov X, Y
Koeficientom korelácie r je potom hodnota: OBSAH
Poznámka: l Koeficient korelácie určuje, do akej miery lineárny vzťah y = ax+b aproximuje (približuje) hodnoty znaku Y hodnotami X. l Zaužívalo sa nasledujúce odstupňovanie tesnosti lineárnej závislosti medzi hodnotami znakov X, Y :
l Malá, ak l Mierna, l Silná, ak ak
l Dá sa ukázať, že pre koeficient korelácie platí pričom vtedy a len vtedy, keď závislosť medzi znakmi X, Y je lineárna, t. j keď existujú také čísla a, b že y =ax+b OBSAH
Riešme príklad: str. 31 -Pr. 1 l Vypočítajte koeficient korelácie a charakterizujte mieru väzby medzi výškou a hmotnosťou študentov.
Odpoveď Koeficient korelácie je 0, 79. Na základe tohto výsledku možno hovoriť o miernej až silnej lineárnej závislosti medzi výškou a hmotnosťou študentov vybraného gymnázia. Domáca úloha
Pr. (K 20) Osem žiakov z triedy vypočítalo koeficient korelácie medzi výškou a hmotnosťou členov svojej rodiny. V tabuľke sú uvedené ich výsledky. Koľko členov sa pri výpočte určite pomýlilo? Domáca úloha
žiak A B C D E Koeficient korelácie 0, 3 -0, 7 1, 2 -1, 7 0, 9 A) Štyria B) Traja C) Dvaja F G H 0, 5 1, 4 2, 3 D) Jeden
Správna odpoveď je: Pomýlili sa štyria, teda A) lebo pre koeficient korelácie platí
Pr. (K 22) V tabuľke sú uvedené výsledky piatich žiakov, testovaných z matematiky a z fyziky. Z každého z testov sa dalo získať maximálne 15 bodov. Z čiastočného spracovania týchto výsledkov vyplýva, že z matematiky získali študenti priemerne 11 bodov, z fyziky 9, 2 bodu. Smerodajná odchýlka pri teste z matematiky bola 2, 4 bodu, pri teste z fyziky 2, 2 bodu. Aký bol koeficient korelácie medzi obidvoma predmetmi? Domáca úloha
Z 1 Z 2 Z 3 Z 4 Z 5 Matematika 9 11 15 12 8 Fyzika 7 7 13 10 9 A) 0, 4 B) 0, 6 C) 0, 8 D) 1
Správna odpoveď je: Koeficient korelácie medzi dvoma predmetmi je 0, 8 teda C.
Domáca úloha: l Matematika-zošit 3. . . . Str. 32 - Pr. 2 l Matematika- zošit 3. . Str. 33 - cv. 1 l Zbierka. . . . str. 56 -pr. Zbierka. . . . str. 57 - pr. 8, 9 l Matematika strednej školy v testoch 2. časť. . . . str. 94/ K 20, K 22
Spracoval: Mgr. Róbert Janok Boli použité aj príspevky študentov: l. Michal Bošiak-oktáva v šk. roku 2005/06 (úlohy K 13, K 14, K 17 -spracované v exeli) Gymnázium Sečovce, Kollárova 17
- Slides: 44