Skmanie zvislost 1 Skmanie zvislost medzi tatistickmi znakmi

  • Slides: 20
Download presentation
Skúmanie závislostí 1

Skúmanie závislostí 1

Skúmanie závislostí medzi štatistickými znakmi • Skúmanie závislostí medzi kvalitatívnymi znakmi, napr. A B

Skúmanie závislostí medzi štatistickými znakmi • Skúmanie závislostí medzi kvalitatívnymi znakmi, napr. A B , nazýme meranie asociácie • skúmanie závislostí medzi kvantitatívnymi štatistickými znakmi - korelačná analýza 2

Skúmanie závislostí medzi kvantitatívnymi premennými • Korelačná analýza -Súbor metód pre meranie závislostí medzi

Skúmanie závislostí medzi kvantitatívnymi premennými • Korelačná analýza -Súbor metód pre meranie závislostí medzi premennými • Grafické vyšetrenie korelácie pomocou grafu závislostí (xy scatter plot) • Vyjadrenie závislostí pomocou korelačných koeficientov • Vyjadrenie vzájomného vzťahu premenných pomocou kovariancii 3

Kovariancia • Vyjadruje ako sa súčasne menia hodnoty dvoch premenných • Kladná hodnota znamená

Kovariancia • Vyjadruje ako sa súčasne menia hodnoty dvoch premenných • Kladná hodnota znamená že sa menia rovnakým smerom, záporná hodnota znamená že sa menia opačným smerom, nula že sa menia nezávisle • Vyjadrenie vzájomných vzťahov viacerých premenných pomocou kovariačnej matice 4

Korelačný koeficent Meria silu závislosti medzi premennými Môže nadobúdať hodnoty z intervalu <-1, 1>

Korelačný koeficent Meria silu závislosti medzi premennými Môže nadobúdať hodnoty z intervalu <-1, 1> -1 silná negatívna korelácia 1 silná pozitívna korelácia 0 premenné sú nezávislé (žiadna korelácia) Vyjdrenie vzájomných vzťahov medzi viacerými premennými-korelačná matica • Pearsonov korelačný koeficient – najčastejšie používaný) štandardizovaná kovariancia (kovariancia podelená súčinom štandardných odchýlok) • • • 5

6

6

Pearsonov korelačný koeficient • Najčastejšie používaný • Používa sa ak sú premenné merané prinajmenšom

Pearsonov korelačný koeficient • Najčastejšie používaný • Používa sa ak sú premenné merané prinajmenšom na intervalovej škále • Nezávisí od mierky v ktorej boli premenné merané • Meria lineárnu závislost (víde najvyšší ak sa dajú namerané hodnoty preložiť priamkou) 7

Ďalšie často používané koeficienty • Spearmanov -Vypočítaný podobne ako Pearsonov ale pomocou poradí •

Ďalšie často používané koeficienty • Spearmanov -Vypočítaný podobne ako Pearsonov ale pomocou poradí • Menej senzitívny niekedy neprodukuje žiadny výsledok • Dokáže zachytiť aj nelineárne vzťahy • Kendallov – meria závislosť medzi dvomi poradovými premennými • Z interpretačného hľadiska lepší ako Spearmanov • Oba uvedené koeficienty sú neparametrické 8

doc. Ing. Zlata Sojková, CSc. 9

doc. Ing. Zlata Sojková, CSc. 9

Skúmanie asociácie • Podkladom sú asociačné, resp. kontingenčné tabuľky, • pre súhrnné testovanie existencie

Skúmanie asociácie • Podkladom sú asociačné, resp. kontingenčné tabuľky, • pre súhrnné testovanie existencie štatisticky významného vzťahu medzi kvalitatívnymi znakmi sa používa 2 - štvorcová kontingencia Ho: dva znaky A a B sú nezávislé (teoretické početnosti sa rovnajú empirickým) H 1: znaky A a B závisia (štatisticky významný rozdiel medzi teoretickými a empirickými početnosťami) A znak má m - úrovní, obmien B znak má k - úrovní , obmien 10

Formulovanie hypotéz • Závislosť znakov sa prejaví v rozdielnych početnostiach • napr. Skúmame či

Formulovanie hypotéz • Závislosť znakov sa prejaví v rozdielnych početnostiach • napr. Skúmame či veľkosť balenia určitého výrobku je ovplyvnená početnosťou rodiny • Ho : výber veľkosti balenia výrobku nezávisí od počtu členov v rodine • H 1 : výber veľkosti balenia je ovplyvnená počtom členov v rodine • test spočíva v porovnávaní empirických početností a teoretických, t, j, takých aké by mali empirické početnosti byť keby boli znaky A a B nezávislé 11

Simultánne početností, početnosti druhého stupňa (aibj) Veľkosť balenia 1 -2 (b 1) Veľkosť rodiny

Simultánne početností, početnosti druhého stupňa (aibj) Veľkosť balenia 1 -2 (b 1) Veľkosť rodiny 3 -4 (b 2) Marginálne početnosti (ai) resp. (bj) 5 a viac (b 3) Celkom do 100 g (a 1) 25 (a 1 b 1) 37 (a 1 b 2) 8 70 100 -150 g (a 2) 10 62 53 125 250 g a viac (a 3) 5 41 59 (a 3 b 3) 105 Spolu 40 140 Celkový 120 počet 300 respondentov 12 n

Určovanie teoretických početností Vychádza z vety o nezávislosti náhodných javov A a B: P(A

Určovanie teoretických početností Vychádza z vety o nezávislosti náhodných javov A a B: P(A B) = P(A). P(B), teda ak znaky A a B sú nezávislé potom platí: P(aibj) = P(ai). P(bj) odhad na základe relatívnych početností : (aibj)o = (ai). (bj) n n Teoretické početnoesti 13

Výpočet teoretických početností (a 1 b 1)o = 70. 40/300 = 9, 33 1

Výpočet teoretických početností (a 1 b 1)o = 70. 40/300 = 9, 33 1 -2 (b 1) Veľkosť rodiny 3 -4 (b 2) do 100 g (a 1) 25 9. 33 100 -150 g (a 2) 250 g a viac (a 3) Veľkosť balenia Spolu 5 a viac (b 3) Celkom 37 32, 67 8 28. 00 70 10 16. 67 62 58. 33 53 50 125 5 14. 00 41 49 59 42 105 140 Celkový 120 počet 300 respondentov 14 n 40

Výpočet testovacieho kritéria a rozhodnutie: Ak 2 vypočítané 2 pre hladinu významnosti pre stupne

Výpočet testovacieho kritéria a rozhodnutie: Ak 2 vypočítané 2 pre hladinu významnosti pre stupne voľnosti (m-1). (k-1) Ho zamietame, t. znaky A a B sú závislé 15

doc. Ing. Zlata Sojková, CSc. 16

doc. Ing. Zlata Sojková, CSc. 16

Predpoklady použitia chi-kvadrát testu štvorcovej kontingencie • Použitie chi-kvadrát testu štvorcovej kontingencie môže byť

Predpoklady použitia chi-kvadrát testu štvorcovej kontingencie • Použitie chi-kvadrát testu štvorcovej kontingencie môže byť problematické ak sa v kontingenčnej tabulke vyskytujú početnosti nižšie ako 5 • Výskyt takto nízkych početností môže má za následok vysokú hodnotu testovacej štatistiky • Pokiaľ je má tabulka rozmer 2 x 2 v každej bunke by mala byť početnosť vyššia ako 5 • Pri tabuľkách s vyšším rozmerom môže byť tento test použitý pokiaľ má aspon 20% buniek početnosti vyššiu ako 5 doc. Ing. Zlata Sojková, CSc. 17

Kontingenčný koeficient • Počítame ho podľa vzorca • Jeho hodnota sa pohybuje v intervale

Kontingenčný koeficient • Počítame ho podľa vzorca • Jeho hodnota sa pohybuje v intervale 0 až 1 • Hodnota 0 indikuje nulovú asociáciu, t. j. premenné nie sú závislé, avšak maximálna hodnota sa nedosiahne nikdy • Hodnota koeficientu závisí od veľkosti tabuľky (počte riadkov a počte stĺpcov) • Mal by byť použitý iba na porovnávanie tabuliek rovnakej veľkosti 18

Cramerov kontingenčný koeficient V • Je modifikovanou verziou korelačného koeficienta a používa sa v

Cramerov kontingenčný koeficient V • Je modifikovanou verziou korelačného koeficienta a používa sa v tabuľkách väčších ako 2 x 2 • Nadobúda hodnoty z intervalu 0 až 1 • Vysoká hodnota indikuje vysokú mieru asociácie, nevyjadruje však ako sú premenné asociované • Pre tabuľku s m riadkami a k stĺpcami je koeficient V vyjadrený nasledovne 19

Želám krásny deň doc. Ing. Zlata Sojková, CSc. 20

Želám krásny deň doc. Ing. Zlata Sojková, CSc. 20