MERANIE ASOCICI Skmanie vzahov medzi tatistickmi znakmi n

  • Slides: 24
Download presentation
MERANIE ASOCIÁCIÍ

MERANIE ASOCIÁCIÍ

Skúmanie vzťahov medzi štatistickými znakmi: n Skúmanie vzťahov medzi kvalitatívnymi znakmi, napr. A B

Skúmanie vzťahov medzi štatistickými znakmi: n Skúmanie vzťahov medzi kvalitatívnymi znakmi, napr. A B , nazýme meranie asociácie n skúmanie vzťahov medzi kvantitatívnymi štatistickými znakmi regresná a korelačná analýza n skúmanie vzťahov medzi výsledným kvalitatívnym znakom a kvantitatívnymi znakmi logistická regresia n skúmanie vzťahov medzi výsledným kvantitatívnym znakom a kvalitatívnymi znakmi AR-analýza rozptylu n skúmanie závislosti medzi výsledným kvantitatívnym znakom a znakmi kvantitatívnymi a kvalitatívnymi analýza kovariancie

PREDNÁŠKA 7 p Meranie asociácií – závislosť medzi kvalitatívnymi znakmi p Hypotézy pri 2

PREDNÁŠKA 7 p Meranie asociácií – závislosť medzi kvalitatívnymi znakmi p Hypotézy pri 2 teste štvorcovej kontingencie p Teoretické početnosti p Výpočet testovacej charakteristiky a rozhodnutia p Meranie tesnosti závislosti 3

Meranie asociácií závislosť medzi kvalitatívnymi znakmi n asociačné, resp. kontingenčné tabuľky n test: 2

Meranie asociácií závislosť medzi kvalitatívnymi znakmi n asociačné, resp. kontingenčné tabuľky n test: 2 - štvorcová kontingencia H 0: dva znaky A a B sú nezávislé H 1: znaky A a B sú závislé A znak má m - úrovní (obmien) B znak má k - úrovní (obmien) n 4

- vychádzame z asociačnej, resp. kontingenčnej tabuľky Formálny zápis asociačnej tabuľky Znak A /

- vychádzame z asociačnej, resp. kontingenčnej tabuľky Formálny zápis asociačnej tabuľky Znak A / Znak B a 1 a 2 Suma B b 1 a 1 b 1 a 2 b 1 (b 1) b 2 a 1 b 2 a 2 b 2 (b 2) Suma A (a 1) (a 2) n 5

DRUHY ASOCIÁCIE: n n n asociácia kladná – čím viac jednotiek má znak A,

DRUHY ASOCIÁCIE: n n n asociácia kladná – čím viac jednotiek má znak A, tým viac jednotiek má znak B asociácia záporná – čím viac jednotiek má znak A, tým menej jednotiek má znak B nezávislosť – znaky sú vzájomne nezávislé Závislosť znakov sa prejaví v rozdielnych početnostiach n O akú závislosť sa jedná určujeme pomocou empirických kritérií: 6

n 7

n 7

n 8

n 8

Určovanie teoretických početností Vychádza sa z vety o nezávislosti náhodných javov A a B:

Určovanie teoretických početností Vychádza sa z vety o nezávislosti náhodných javov A a B: P(A B) = P(A). P(B), teda, ak znaky A a B sú nezávislé potom platí: P(aibj) = P(ai). P(bj) P(A B) = P(A). P(B) – vyjadruje pravdepodobnosť, že štatistická jednotka bude mať i-ty variant znaku A a súčasne j-ty variant znaku B za predpokladu nezávislosti znakov A a B rovný súčinu pravdepodobností i-teho variantu znaku A a pravdepodobnosti nadobudnutia j-teho variantu znaku B. Odhadom pravdepodobnosti P(A=ai), P(B=bj) sú relatívne početnosti : (aibj)o/n = (ai)/n. (bj)/n (aibj)o = (ai). (bj)/n Teoretické početnosti 9

Postup p empirické početnosti, teoretické početnosti b 1 a 1 (a 1 b 1)

Postup p empirické početnosti, teoretické početnosti b 1 a 1 (a 1 b 1) (a 1 b 2) (a 1) a 2 (a 2 b 1) (a 2 b 2) (a 2) suma (b 1 ) b 2 suma A/B (b 2 ) n (a 1 b 1 )0 (a 1 b 2 )0 (a 2 b 1 )0 (a 2 b 2 )0 n 10

Príklad: Formulácia hypotéz Skúmame, či kúpa veľkosti balenia určitého výrobku je ovplyvnená početnosťou rodiny

Príklad: Formulácia hypotéz Skúmame, či kúpa veľkosti balenia určitého výrobku je ovplyvnená početnosťou rodiny Ho : výber veľkosti balenia výrobku nezávisí od počtu členov v rodine H 1 : výber veľkosti balenia je ovplyvnený počtom členov v rodine 11

Marginálne početnosti (1. stupňa) (ai) resp. (bj) Simultánne početnosti, (početnosti 2. stupňa) (aibj) Veľkosť

Marginálne početnosti (1. stupňa) (ai) resp. (bj) Simultánne početnosti, (početnosti 2. stupňa) (aibj) Veľkosť balenia 1 -2 (b 1) Veľkosť rodiny 3 -4 (b 2) 5 a viac (b 3) Celkom do 100 g (a 1) 25 (a 1 b 1) 37 (a 1 b 2) 8 70 100 -150 g (a 2) 10 62 53 125 250 g a viac (a 3) 5 41 59 (a 3 b 3) 105 Spolu 40 140 Celkový počet 120 (0. stupňa) 300 n

Výpočet teoretických početností (a 1 b 1)o = 70. 40/300 = 9, 33 1

Výpočet teoretických početností (a 1 b 1)o = 70. 40/300 = 9, 33 1 -2 (b 1) Veľkosť rodiny 3 -4 (b 2) do 100 g (a 1) 25 9. 33 100 -150 g (a 2) 250 g a viac (a 3) Veľkosť balenia Spolu 5 a viac (b 3) Celkom 37 32, 67 8 28. 00 70 10 16. 67 62 58. 33 53 50 125 5 14. 00 41 49 59 42 105 140 Celkový 120 počet 300 respondentov n 40

Príklad: Formulácia hypotéz Skúmame, či je rozdiel medzi mužmi a ženami z hľadiska frekvencie

Príklad: Formulácia hypotéz Skúmame, či je rozdiel medzi mužmi a ženami z hľadiska frekvencie pitia nealkoholických nápojov Ho : nie je rozdiel medzi mužmi a ženami podľa frekvencie pitia, t. j. frekvencia pitia nezávisí od pohlavia H 1 : frekvencia pitia nealkoholických nápojov závisí od pohlavia test spočíva v porovnávaní empirických početností empirických a teoretických, (hovoria, aké by mali byť empirické teoretických početnosti, aby znaky A a B boli nezávislé) n 14

Príklad p vychádzame z nasledovnej kontingenčnej tabuľky frekvencia muži ženy celkove 0 19 20

Príklad p vychádzame z nasledovnej kontingenčnej tabuľky frekvencia muži ženy celkove 0 19 20 39 1 -3 18 12 30 4 -7 celkove 23 60 8 40 31 100 15

Výpočet teoretických početností p teoretické početnosti frekvencia muži ženy celkove 0 (60. 39)/100= 23,

Výpočet teoretických početností p teoretické početnosti frekvencia muži ženy celkove 0 (60. 39)/100= 23, 4 (60. 30)/100= 18 (60. 31)/100= 18, 6 60 (40. 39)/100= 15, 6 (40. 30)/100= 12 (40. 31)/100= 12, 4 40 39 1 -3 4 -7 celkove 30 31 100 16

Testovacia charakteristika p testovacia charakteristika má 2 rozdelenie p stupne voľnosti = (m-1)*(k-1) n

Testovacia charakteristika p testovacia charakteristika má 2 rozdelenie p stupne voľnosti = (m-1)*(k-1) n Ak 2 vypočítané 2 pre hladinu významnosti pre a stupne voľnosti (m-1). (k-1), Ho zamietame, tzn. znaky A a B sú závislé 17

Výpočet + záver p testovacia charakteristika p tabuľková hodnota = 2( , (m-1). (k-1)

Výpočet + záver p testovacia charakteristika p tabuľková hodnota = 2( , (m-1). (k-1) 2(0, 05, (3 -1). (2 -1)) = 5, 99 4, 67 < 5, 99 H 0 nezamietame, pohlavie nevplýva na frekvenciu pitia nealkoholických nápojov 18

Miery asociácie v ak potvrdíme asociáciu (závislosť) medzi znakmi A a B, má význam

Miery asociácie v ak potvrdíme asociáciu (závislosť) medzi znakmi A a B, má význam merať jej intenzitu v pri alternatívnych znakoch používame: a) koeficient asociácie – Yullov koeficient b) koeficient korelácie kvalitatívnych znakov Ø Dané miery nadobúdajú hodnoty z intervalu <-1, 1>. 19

Miery asociácie n 20

Miery asociácie n 20

Miery asociácie n 21

Miery asociácie n 21

Miery asociácie pri množných znakoch používame: a) Pearsonov koeficient b) Čuprovov koeficient c) Cramerov

Miery asociácie pri množných znakoch používame: a) Pearsonov koeficient b) Čuprovov koeficient c) Cramerov V koeficient Ø Pearsonov koeficient nadobúda hodnota z intervalu <0, 1) Nedostatkom Pearsonovho koeficienta je, že na jeho veľkosť vplýva počet vytvorených skupín, je teda závislý od spôsobu triedenia. Ø Čuprovov a Cramerov koeficient nadobúdajú hodnoty z <0, 1>. 22

Miery asociácie - výpočet Príklad: pohlavie – frekvencia pitia a) Pearsonov koeficient b) Čuprovov

Miery asociácie - výpočet Príklad: pohlavie – frekvencia pitia a) Pearsonov koeficient b) Čuprovov koeficient c) Cramerov koeficient Ø závislosť je mierna, z hľadiska ZS štatisticky nevýznamná 23

ĎAKUJEM ZA POZORNOSŤ 24

ĎAKUJEM ZA POZORNOSŤ 24