Testy dobr shody Martina Litschmannov Obsah Litschmannov Martina
Testy dobré shody Martina Litschmannová
Obsah • Litschmannová Martina, 2020 Testy dobré shody 2 / 54
Jak ověřit, zda se empirické rozdělení shoduje s teoretickým? Srovnání histogramu s teoretickou hustotou pravděpodobností Srovnání kum. rel. četností (resp. empirické distr. f-ce) s teoret. distr. fcí Q-Q graf § Pomocí grafické analýzy můžeme metodou srovnání se stand. modely pouze odhadnout typ rozdělení! § Objektivní míru shody dat s teoretickým modelem poskytují tzv. testy dobré shody. Litschmannová Martina, 2020 Testy dobré shody 3 / 54
Testy dobré shody • Litschmannová Martina, 2020 Testy dobré shody 4 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav Litschmannová Martina, 2020 svobodná vdaná Testy dobré shody rozvedená ovdovělá celkem 5 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav Litschmannová Martina, 2020 svobodná 0, 248 vdaná 0, 490 Testy dobré shody rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 6 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav Litschmannová Martina, 2020 svobodná 0, 248 vdaná 0, 490 Testy dobré shody rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 7 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav Litschmannová Martina, 2020 svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 Testy dobré shody 8 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Litschmannová Martina, 2020 Testy dobré shody 9 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Litschmannová Martina, 2020 Testy dobré shody 10 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Náznak řešení Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Liší se pozorované a očekávané četnosti statisticky významně? Litschmannová Martina, 2020 Testy dobré shody 11 / 54
• Litschmannová Martina, 2020 Testy dobré shody 12 / 54
• Stav Litschmannová Martina, 2020 svobodná 0, 248 vdaná 0, 490 Testy dobré shody rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 13 / 54
Motivační příklad Bylo provedeno šetření mezi ženami staršími 15 let. Mezi 246 náhodně oslovenými ženami bylo 80 (32, 5 %) svobodných, 110 (44, 7 %) vdaných, 30 (12, 2 %) rozvedených a 26 (10, 6 %) ovdovělých. Je známo (viz Český statistický úřad), že v ČR je mezi ženami staršími 15 let cca 24, 8 % svobodných, 49, 0 % vdaných, 12, 6 % rozvedených a 13, 6 % ovdovělých. Lze provedený výběr označit za reprezentativní? Řešení Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 Ověření předpokladů: Litschmannová Martina, 2020 Testy dobré shody 14 / 54
• Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Litschmannová Martina, 2020 Testy dobré shody 15 / 54
• Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Litschmannová Martina, 2020 Testy dobré shody 16 / 54
• Stav svobodná 0, 248 vdaná 0, 490 rozvedená 0, 126 ovdovělá 0, 136 celkem 1, 000 80 110 30 26 256 --- Litschmannová Martina, 2020 Testy dobré shody 17 / 54
• Litschmannová Martina, 2020 Testy dobré shody 18 / 54
• Litschmannová Martina, 2020 Testy dobré shody 19 / 54
• Litschmannová Martina, 2020 Testy dobré shody 20 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 Testy dobré shody 21 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 Testy dobré shody 22 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi 0 1 2 3 4 a více celkem 52 48 36 10 4 150 1, 000 Litschmannová Martina, 2020 Testy dobré shody 23 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 Testy dobré shody 24 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 --- Litschmannová Martina, 2020 Testy dobré shody 25 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 26 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 27 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 28 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 29 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 30 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 31 / 54
• xi – počet poruch během dne Oi – počet dní, v nichž byl pozorován počet poruch xi Litschmannová Martina, 2020 0 1 2 3 4 a více celkem 52 48 36 10 4 150 0, 301 0, 361 0, 217 0, 087 0, 034 1, 000 45, 2 54, 2 32, 6 13, 1 5, 1 --- Testy dobré shody 32 / 54
• Litschmannová Martina, 2020 Testy dobré shody 33 / 54
• 2, 5 4, 3 1, 3 4, 6 6, 8 1, 2 11, 9 3, 1 Litschmannová Martina, 2020 6, 8 2, 6 6, 4 1, 6 5, 2 6, 2 9, 0 1, 6 10, 8 5, 0 13, 0 6, 5 1, 9 3, 0 4, 3 5, 6 4, 9 1, 6 9, 8 5, 4 5, 7 1, 5 8, 0 2, 6 4, 8 1, 8 2, 0 4, 0 8, 6 3, 6 11, 1 4, 0 2, 7 2, 8 3, 9 4, 9 2, 3 4, 2 4, 8 4, 3 4, 7 2, 0 2, 1 3, 4 11, 2 4, 2 2, 9 4, 0 5, 5 7, 3 0, 8 4, 3 1, 6 19 1, 5 7, 3 2, 1 2, 3 3, 7 1, 0 4, 5 2, 2 8, 7 1, 8 24, 9 2, 9 1, 9 6, 9 1, 6 5, 8 3, 8 Testy dobré shody 7, 7 1, 6 10, 6 3, 0 1, 9 2, 8 2, 5 6, 9 1, 1 5, 9 15, 0 3, 8 4, 6 4, 3 2, 2 1, 8 5, 3 8, 3 5, 3 1, 0 6, 4 4, 9 1, 3 2, 6 1, 4 8, 4 5, 2 4, 0 1, 5 5, 3 4, 1 1, 8 6, 8 3, 6 6, 9 3, 3 8, 6 3, 9 4, 5 1, 6 2, 5 9, 2 5, 1 6, 0 4, 4 2, 4 4, 4 3, 8 1, 9 34 / 54
• Pravděpodobnostní f-ce spojité NV je nulová. Pravděpodobnost výskytu spojité NV na určitém intervalu již nulová není! Proč musíme nyní pozorované hodnoty kategorizovat ? Litschmannová Martina, 2020 Testy dobré shody 35 / 54
Řešení: § Definiční obor náhodné veličiny rozdělíme například do 13 třídících intervalů, tj. náhodnou veličinu kategorizujeme. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 Testy dobré shody 36 / 54
Řešení: § Určíme očekávané pravděpodobnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 1, 000 Testy dobré shody 37 / 54
Řešení: § Určíme očekávané pravděpodobnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 38 / 54
Řešení: § Určíme očekávané pravděpodobnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 39 / 54
Řešení: § Určíme očekávané pravděpodobnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 40 / 54
Řešení: § Určíme očekávané pravděpodobnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 41 / 54
Řešení: § Určíme očekávané četnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 42 / 54
Řešení: § Určíme očekávané četnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 22, 9 3, 2 2, 3 6, 2 5, 4 10, 3 6, 2 6, 3 8, 0 14, 0 13, 9 19, 2 14, 1 43 / 54
Řešení: § Určíme očekávané četnosti. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 22, 9 3, 2 2, 3 6, 2 5, 4 10, 3 6, 2 6, 3 8, 0 14, 0 13, 9 19, 2 14, 1 44 / 54
Řešení: § Ověříme předpoklady testu. i 1 2 3 4 5 6 7 8 9 10 11 12 13 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 13 7 10 8 8 10 10 10 12 11 132 0, 174 0, 024 0, 017 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 22, 9 3, 2 2, 3 6, 2 5, 4 10, 3 6, 2 6, 3 8, 0 14, 0 13, 9 19, 2 14, 1 45 / 54
Řešení: § Ověříme předpoklady testu. i Třídící interval (s) 1 11 0, 174 22, 9 2 13 0, 024 3, 2 3 7 0, 017 2, 3 4 10 0, 047 6, 2 5 8 0, 041 5, 4 6 8 0, 078 10, 3 7 10 0, 047 6, 2 8 10 0, 048 6, 3 9 10 0, 060 8, 0 10 12 0, 106 14, 0 11 10 0, 106 13, 9 12 12 0, 145 19, 2 13 11 0, 107 14, 1 Celkem očekávané - četnosti jsou větší 132 1, 000 třídy 2 a 3, bude splněn - i silnější předpoklad – Všechny nebo rovny 2, sloučíme-li očekávané četnosti budou větší než 5. Litschmannová Martina, 2020 Testy dobré shody 46 / 54
• i 1 2 3 4 5 6 7 8 9 10 11 12 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 20 10 8 8 10 10 10 12 11 132 0, 174 0, 041 0, 047 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 22, 9 5, 5 6, 2 5, 4 10, 3 6, 2 6, 3 8, 0 14, 0 13, 9 19, 2 14, 1 - 47 / 54
• i 1 2 3 4 5 6 7 8 9 10 11 12 Celkem Třídící interval (s) - Litschmannová Martina, 2020 11 20 10 8 8 10 10 10 12 11 132 0, 174 0, 041 0, 047 0, 041 0, 078 0, 047 0, 048 0, 060 0, 106 0, 145 0, 107 1, 000 Testy dobré shody 22, 9 5, 5 6, 2 5, 4 10, 3 6, 2 6, 3 8, 0 14, 0 13, 9 19, 2 14, 1 - 48 / 54
• Litschmannová Martina, 2020 Testy dobré shody 49 / 54
Kolmogorovovův – Smirnovův test • Litschmannová Martina, 2020 Testy dobré shody 50 / 54
Kolmogorovovův – Smirnovův test • max. odchylka teoretické a empirické distribuční funkce Litschmannová Martina, 2020 Testy dobré shody 51 / 54
Kolmogorovovův – Smirnovův test • Litschmannová Martina, 2020 Testy dobré shody 52 / 54
Ověření normality • Litschmannová Martina, 2020 Testy dobré shody 53 / 54
Děkuji za pozornost! martina. litschmannova@vsb. cz
- Slides: 54