TESTY 2 CHkvadrt l TEST DOBR SHODY TEST
TESTY א 2 (CHÍ-kvadrát) l TEST DOBRÉ SHODY TEST NEZÁVISLOSTI l Testy pro kategoriální veličiny l
TESTY א 2 (CHÍ-kvadrát) l TEST DOBRÉ SHODY TEST NEZÁVISLOSTI l Testy pro kategoriální veličiny l
TEST א 2 NEZÁVISLOSTI Sledujeme dvojici kategoriálních veličin X, Y např. u každého respondenta jeho pohlaví (M-Ž) a dosažené vzdělání (ZŠ-SŠ-VŠ); nebo u každého výrobku jeho kvalitu (I. jakost, II. jakost, zmetek) a to, během jaké směny vznikl (dopolední – odpolední noční směna);
TEST א 2 NEZÁVISLOSTI Chceme prokázat: l závisí nebo nezávisí vzdělání na pohlaví? (ve smyslu, zda jsou nebo nejsou mezi muži a ženami významné rozdíly v zastoupení jednotlivých vzdělanostních kategorií)
TEST א 2 NEZÁVISLOSTI Nebo chceme prokázat: l závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? (ve smyslu, zda jsou nebo nejsou mezi jednotlivými směnami významné rozdíly v zastoupení jednotlivých kvalitativních kategorií)
TEST א 2 NEZÁVISLOSTI Testovaná dvojice hypotéz: l H 0: nezávislost (mezi X a Y) H 1: non H 0 (tj. závislost mezi X a Y)
TEST א 2 NEZÁVISLOSTI Data:
TEST א 2 NEZÁVISLOSTI Data přehledně – kontingenční tabulka pozorovaných absolutních četností: r = počet „řádkových“ kategorií s = počet „sloupcových“ kategorií
TEST א 2 NEZÁVISLOSTI Kontingenční tabulka - příklad: např. n 12 = 15 n 1 • = 38 n 21= 7 n • 1 = 23
TEST א 2 NEZÁVISLOSTI Očekávané četnosti l Jaké by měly být hodnoty jednotlivých četností, kdyby platila nezávislost? l Rozložení pravděpodobností ve všech řádcích jednotlivých kategorií by mělo být stejné jako v součtovém řádku. l Co to znamená? l Poměr jednotlivých četností musí být konstantní.
TEST א 2 NEZÁVISLOSTI Očekávané četnosti d o p o l o d p n su o o m l c a I. j a k V 1. sloupci by měl být počet roven 23/80 z 38 (resp. 27, 15) o
TEST א 2 NEZÁVISLOSTI Očekávané četnosti d o o d su p p n m ol ol oc a I. j ak os t 38 Tedy o 11 = 23. 38/80 = 10, 925; o 21 = 23. 27/80 = 7, 7625; o II. j 31 = 23. 15/80 = 4, 3125
TEST א 2 NEZÁVISLOSTI Očekávané četnosti I. j ak os t d o p ol 1 0, 9 25 o d su p n m ol oc a 38
TEST א 2 NEZÁVISLOSTI Očekávané četnosti - zobecnění
TEST א 2 NEZÁVISLOSTI Vytvoříme tabulku očekávaných četností: oij = ni • ·n • j / n např. o 12 = n 1 • ·n • 2 / n
TEST א 2 NEZÁVISLOSTI Očekávané četnosti – příklad (pokrač. ): např. o 12 = n 1 • ·n • 2 / n = 38· 29 / 80 = 13, 8 ! součty stejné jako původně (až na zaokr. )!
TEST א 2 NEZÁVISLOSTI Podstata testové statistiky : i zde porovnání četností pozorovaných s očekávanými: T = ΣΣ (nij − oij )2 / oij (i=1…r, j=1…s) Př. (pokrač. ): T = (12− 10, 9)2/10, 9 + (15− 13, 8)2/13, 8 + (11− 13, 3)2/13, 3+ +(7 − 7, 8)2 / 7, 8 + (9 − 9, 8)2 / 9, 8 + (11 − 9, 5)2 /9, 5 + +(4 − 4, 3)2 / 4, 3 + (5 − 5, 4)2 / 5, 4 +(6− 5, 3)2 / 5, 3 = = 1, 14 (výsledek při nezaokrouhlených oij : 1, 17)
TEST א 2 NEZÁVISLOSTI Kritický obor : W = א 2 ; ∞), kde א 2 značí: (1−α)· 100% kvantil při (r − 1)·(s− 1) DF Př. (pokrač. ): hledáme 95% kvantil rozdělení א 2 při 4 DF; W = 9, 488; ∞)
TEST א 2 NEZÁVISLOSTI a) Co jsme právě zjistili v úloze s jakostí? T = 1, 14; W = 9, 488; ∞) T W nelze zamítnout H 0 průzkum neprokázal závislost kvality výroby na druhu směny b) Příslušná pasáž v přehledu vzorců:
TEST א 2 NEZÁVISLOSTI Řešení pomocí Excelu: p=0, 883 …shoda s „ručním“ postupem?
TEST א 2 NEZÁVISLOSTI Příklad 2. Je obdobná struktura dosaženého vzdělání (ZŠ-SŠ-VŠ) mezi muži a mezi ženami? H 0: nezávislost (tj. shodná struktura) H 1: non H 0
TEST א 2 NEZÁVISLOSTI ČETNOSTI l počet mužů – 18; l počet žen – 22; tj. celkem 40 l počet ZŠ – 10; l počet SŠ – 18; l počet VŠ – 12; tj. celkem 40
TEST א 2 NEZÁVISLOSTI l Kontingenční tabulka ZŠ SŠ VŠ CELKEM M 4 9 5 18 Ž 6 9 7 22 CELKEM 10 18 12 40
TEST א 2 NEZÁVISLOSTI M ZŠ SŠ VŠ CELKEM n 11 n 12 n 13 n 1. o 11 o 12 o 13 o 1. (n 11 -o 11)2/o 11 Ž n 21 n 22 n 23 n 2. o 21 o 22 o 23 o 2. (n 21 -o 21)2/o 21 CELKEM (n 12 -o 12)2/o 12 (n 13 -o 13)2/o 13 (n 22 -o 22)2/o 22 (n 23 -o 23)2/o 23 n. 1 n. 2 n. 3 n o. 1 o. 2 o. 3 o T
TEST א 2 NEZÁVISLOSTI ZŠ M Ž CELKEM SŠ VŠ 4 4, 5 0, 055556 9 8, 1 0, 1 6 5, 5 0, 045455 10 10 0, 10101 9 9, 9 0, 081818 18 18 0, 181818 CELKEM 5 18 5, 4 18 0, 02963 0, 185185 7 6, 6 0, 024242 12 12 0, 053872 22 22 0, 151515 40 40 0, 3367
TEST א 2 NEZÁVISLOSTI l l l T = 0, 3367; W = 20, 95(3 -1). (2 -1); ) = 20, 95(2); ) = = 5, 991; ) T W Nelze zamítnout H 0 Nepotvrdila se závislost vzdělání na pohlaví, tj. muži i ženy mají srovnatelnou strukturu vzdělání
TEST א 2 NEZÁVISLOSTI Použitelnost v praxi: pozor – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie
SÍLA ZÁVISLOSTI l l l Pomocí 2 testu nezávislosti rozhodujeme o závislosti, resp. nezávislosti veličin Někdy je nutno určit i sílu případné závislosti, tj. „jak moc spolu veličiny závisí“ K tomu se používají různé koeficienty míry závislosti Koeficienty míry závislosti většinou nabývají hodnot 0 až 1 Čím je hodnota koeficientu blíže 0, tím je závislost menší a naopak čím je blíže k 1, tím je závislost silnější
SÍLA ZÁVISLOSTI l 2 koeficient , kde 2 značí testovou charakteristiku 2 testu nezávislosti, n značí počet pozorování l Cohenova (kapa) l Pro ≤ 0, 4 není závislost, pro ≥ 0, 75 silná závislost
SÍLA ZÁVISLOSTI Příklad-pokračování: l 2 = 1. 14/80 = 0, 1194 → 0 není závislost l = ((12+9+6)–(10, 9+9, 8+5, 3))/(80 -(10, 9+9, 8+5, 3))= = (27 -26)/(80 -26) = 1/54 =0, 0185 ≤ ≤ 0, 4 není závislost l
- Slides: 31