STATISTIKA U FARMACIJI Analiza varijanse ANOVA 20082009 S

  • Slides: 46
Download presentation
STATISTIKA U FARMACIJI Analiza varijanse - ANOVA 2008/2009 S. Spasić 1

STATISTIKA U FARMACIJI Analiza varijanse - ANOVA 2008/2009 S. Spasić 1

Testovi za dve i više populacija srednja vrednost 2 broj uzoraka varijansa n F

Testovi za dve i više populacija srednja vrednost 2 broj uzoraka varijansa n F test z-test t-test 2008/2009 ANOVA S. Spasić 2

F-test za odnos dve varijanse Ø Parametarski test Ø Testira razliku izmedju dve nezavisne

F-test za odnos dve varijanse Ø Parametarski test Ø Testira razliku izmedju dve nezavisne populacione varijanse Ø Pretpostavka za test: v obe populacije su normalno distribuirane 2008/2009 S. Spasić 3

F-test - postavljanje hipoteze Ø Ø Hipoteze H 0 : 1 2 = 2

F-test - postavljanje hipoteze Ø Ø Hipoteze H 0 : 1 2 = 2 2 i H 1 : 1 2 ≠ 2 2 Izračunava se Dve grupe stepena slobode df 1 = N 1 - 1; df 2 = N 2 - 1 Sledi F distribuciju 2008/2009 S. Spasić 4

F-test - kritične vrednosti odbacuje se H 0 prihvata se H 0 α/2 0

F-test - kritične vrednosti odbacuje se H 0 prihvata se H 0 α/2 0 1, 0 F Flevo 2008/2009 α/2 Fdesno S. Spasić 5

F-test - Rešenje Sd 1 = 1, 30 Sd 2 = 1, 16 H

F-test - Rešenje Sd 1 = 1, 30 Sd 2 = 1, 16 H 0 : 1 2 = 2 2 H 1 : 1 2 2 2 α 0, 05 0, 025 df 1 22 df 2 24 2, 00 F H 0 se prihvata, nema značajne razlike izmedju Sd 12 i Sd 22 2008/2009 S. Spasić 6

F-test - Rešenje F 0, 05, 20, 24 = 2, 00 – 2, 05

F-test - Rešenje F 0, 05, 20, 24 = 2, 00 – 2, 05 Fizr = 1, 25 Fizr < F 0, 05 H 0 se prihvata, nema značajne razlike izmedju Sd 12 i Sd 22 2008/2009 S. Spasić 7

Testovi za dve i više populacija Analiza varijanse (ANOVA) Jednofaktorska ANOVA Dvofaktorska ANOVA Efekat

Testovi za dve i više populacija Analiza varijanse (ANOVA) Jednofaktorska ANOVA Dvofaktorska ANOVA Efekat interakcija F-test Tukey. Snedecor test 2008/2009 S. Spasić 8

Student t-test Ø Student t-test – testiranje razlike između srednjih vrednosti 2 grupe podataka

Student t-test Ø Student t-test – testiranje razlike između srednjih vrednosti 2 grupe podataka v H 0 : μ 1 = μ 2 H 1 : μ 1 ≠ μ 2 v α = 0, 05 (nivo značajnosti testa) v 0, 05 (5%) – verovatnoća da se odbaci ispravna nulta hipoteza v greška tip I – odbacivanje ispravne nulte hipoteze v greška tip II – prihvatanje neispravne nulte hipoteze 2008/2009 S. Spasić 9

Student t-test Ø Testiranje razlike između srednjih vrednosti više grupa podataka v potrebno izvođenje

Student t-test Ø Testiranje razlike između srednjih vrednosti više grupa podataka v potrebno izvođenje t-testa više puta Ø Koliko je potrebno t-testova? 3 grupe podataka: A, B i C – 3 t-testa v poređenja: A: B, A: C i B: C 4 grupe podataka: A, B, C i D – 6 t-testova v poređenja: A: B, A: C, A: D, B: C, B: D i C: D Ø Ø 2008/2009 S. Spasić 10

Istovremeno izvođenje više t-testova Ø Ø Ø Kod izvođenja više t-testova javlja se “Familywise

Istovremeno izvođenje više t-testova Ø Ø Ø Kod izvođenja više t-testova javlja se “Familywise error rate” problem (FWER) v FWER – verovatnoća da se neispravno odbaci najmanje jedna nulta hipoteza u grupi poređenja FWER = 1 – (1 – α)k v α – nivo značajnosti testa v k – broj t-testova Za 6 t-testova: v FWER = 1 – (1 – 0, 05)6 = 1 – 0, 735 = 0, 265 = 27% verovatnoće da napravimo najmanje jednu grešku tip I 2008/2009 S. Spasić 11

ANOVA Ø Analiza varijanse omogućava istovremeno testiranje razlika između više srednjih vrednosti Ø Ispituje

ANOVA Ø Analiza varijanse omogućava istovremeno testiranje razlika između više srednjih vrednosti Ø Ispituje se jedna ili više nezavisnih varijabli – faktora uticaja na zavisnu varijablu v Jedan faktor uticaja – jednofaktorska ANOVA v Više faktora uticaja – višefaktorska ANOVA (multipla ANOVA – MANOVA) Ø Svaki faktor uticaja ima više kategorija (grupa) 2008/2009 S. Spasić 12

Jednofaktorska ANOVA - hipoteze Ø H 0: 1 = 2 = 3 v Sve

Jednofaktorska ANOVA - hipoteze Ø H 0: 1 = 2 = 3 v Sve populacione srednje vrednosti su jednake v Faktor uticaja nema efekta Ø H 1: 1 2 3 H 1: 1 = 2 3 H 1: 1 2 = 3 H 1: 1 = 3 2 H 1: - nisu sve jednake v Najmanje 1 srednja vrednost je različita v Postoji efekat faktora uticaja 2008/2009 S. Spasić 13

Jednofaktorska ANOVA Sve srednje vrednosti su jednake: Nulta hipoteza je ispravna (nema efekta faktora

Jednofaktorska ANOVA Sve srednje vrednosti su jednake: Nulta hipoteza je ispravna (nema efekta faktora uticaja) 2008/2009 S. Spasić 14

Jednofaktorska ANOVA Najmanje jedna srednja vrednost je različita: Nulta hipoteza nije ispravna (postoji efekat

Jednofaktorska ANOVA Najmanje jedna srednja vrednost je različita: Nulta hipoteza nije ispravna (postoji efekat faktora uticaja) ili 2008/2009 S. Spasić 15

Logika Analize varijanse Ø Varijacija (varijansa) između grupa upoređuje se sa varijacijom (varijansom) unutar

Logika Analize varijanse Ø Varijacija (varijansa) između grupa upoređuje se sa varijacijom (varijansom) unutar grupa v Varijacija između grupa je varijacija (razlika) između srednjih vrednosti koja je posledica uticaja uzorka i uticaja faktora koji se ispituje (ako postoji) v Varijacija unutar grupa je varijacija koja je posledica uticaja uzorka v Ukupna varijacija je zbir varijacije između grupa i varijacije unutar grupa 2008/2009 S. Spasić 16

Jednofaktorska ANOVA - osnovna ideja Ø Uporedjivanje dva tipa varijacije da bi se ocenila

Jednofaktorska ANOVA - osnovna ideja Ø Uporedjivanje dva tipa varijacije da bi se ocenila razlika izmedju srednjih vrednosti Ø Baza za poredjenje je odnos varijansi Ø Zašto ANOVA? v Test baziran na varijansama je osetljiviji nego test baziran na srednjim vrednostima v ANOVA ima manji rizik za grešku tip II 2008/2009 S. Spasić 17

Jednofaktorska ANOVA Pretpostavke za test Ø Ø Eksperimentalne jedinice su slučajno odabrane Populacije su

Jednofaktorska ANOVA Pretpostavke za test Ø Ø Eksperimentalne jedinice su slučajno odabrane Populacije su normalno distribuirane Homogenost varijansi - Populacije imaju jednake varijanse Podaci su izraženi intervalnom ili skalom odnosa 2008/2009 S. Spasić 18

Varijansa Suma kvadrata odstupanja od srednje vrednosti (suma kvadrata, SK) Broj stepena slobode 2008/2009

Varijansa Suma kvadrata odstupanja od srednje vrednosti (suma kvadrata, SK) Broj stepena slobode 2008/2009 S. Spasić 19

Razdvajanje varijacije Ø Mere varijacije se dobijaju “razdvajanjem” ukupne varijacije varijansa između grupa varijansa

Razdvajanje varijacije Ø Mere varijacije se dobijaju “razdvajanjem” ukupne varijacije varijansa između grupa varijansa unutar grupa ukupna varijansa 2008/2009 S. Spasić 20

Jednofaktorska ANOVA – F test H 0 : μ 1 = μ 2 =

Jednofaktorska ANOVA – F test H 0 : μ 1 = μ 2 = … = μc H 1: μ – najmanje jedna srednja vrednost je različita Stepeni slobode v df 1 = m – 1 (m = broj grupa) v df 2 = N – m (N = ukupan broj podataka u svim grupama zajedno) 2008/2009 S. Spasić 21

Kritične vrednosti F Ako su srednje vrednosti jednake, F =Vig/Vug 1 Odbacuje se H

Kritične vrednosti F Ako su srednje vrednosti jednake, F =Vig/Vug 1 Odbacuje se H 0 samo za veliko F odbacuje se H 0 prihvata se H 0 F 0 Uvek jednostrani test! 2008/2009 S. Spasić 22

Razdvajanje varijacije Ø Ukupna varijacija (suma kvadrata odstupanja od srednje vrednosti) može da se

Razdvajanje varijacije Ø Ukupna varijacija (suma kvadrata odstupanja od srednje vrednosti) može da se razdvoji u dva dela: SKtot = SKig + SKug SKtot = ukupna suma kvadrata (ukupna varijacija) SKig = suma kvadrata između grupa (varijacija između grupa) SKug = suma kvadrata unutar grupa (varijacija unutar grupa) 2008/2009 S. Spasić 23

Ukupna varijacija grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 24

Ukupna varijacija grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 24

Varijacija izmedju grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 25

Varijacija izmedju grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 25

Varijacija unutar grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 26

Varijacija unutar grupa 1 2008/2009 grupa 2 S. Spasić grupa 3 26

Faktori koji utiču na zaključak Razlika između srednjih vrednosti + Veličina uzorka ANOVA +

Faktori koji utiču na zaključak Razlika između srednjih vrednosti + Veličina uzorka ANOVA + – F Varijacija unutar grupa 2008/2009 S. Spasić 27

Razlika između srednjih vrednosti mala razlika između grupa Nulta hipoteza se lako dokazuje 2008/2009

Razlika između srednjih vrednosti mala razlika između grupa Nulta hipoteza se lako dokazuje 2008/2009 velika razlika između grupa Nulta hipoteza se teško dokazuje S. Spasić 28

Veličina uzorka mali broj podataka u grupi Nulta hipoteza se lako dokazuje 2008/2009 veliki

Veličina uzorka mali broj podataka u grupi Nulta hipoteza se lako dokazuje 2008/2009 veliki broj podataka u grupi Nulta hipoteza se teško dokazuje S. Spasić 29

Varijacija unutar grupa velika varijacija unutar grupa Nulta hipoteza se lako dokazuje 2008/2009 mala

Varijacija unutar grupa velika varijacija unutar grupa Nulta hipoteza se lako dokazuje 2008/2009 mala varijacija unutar grupa Nulta hipoteza se teško dokazuje S. Spasić 30

ANOVA - izrazi za izračunavanje suma kvadrata odstupanja od srednje vrednosti - SK broj

ANOVA - izrazi za izračunavanje suma kvadrata odstupanja od srednje vrednosti - SK broj stepena slobode - df C 2008/2009 S. Spasić 31

ANOVA - izrazi za izračunavanje 2008/2009 S. Spasić 32

ANOVA - izrazi za izračunavanje 2008/2009 S. Spasić 32

ANOVA - sumarna tabela kritična vrednost Fα za df 1 = m-1 i df

ANOVA - sumarna tabela kritična vrednost Fα za df 1 = m-1 i df 2 = N-m 2008/2009 S. Spasić 33

Jednofaktorska ANOVA- primer Ispitivanje toksičnog delovanja leka na tri tipa ćelija Prikazano je vreme

Jednofaktorska ANOVA- primer Ispitivanje toksičnog delovanja leka na tri tipa ćelija Prikazano je vreme (u danima) posle koga je ostalo 50% ćelija ∑x tip A 1, 2 1, 5 1, 7 1, 8 1, 6 1, 4 9, 2 tip B 1, 5 1, 4 1, 3 1, 6 1, 8 1, 4 9, 0 tip C 2, 0 1, 8 1, 7 2, 2 1, 9 2, 1 11, 7 xsr 1, 53 1, 50 1, 95 ∑x 2 14, 34 13, 66 22, 99 vreme (dani) 2008/2009 S. Spasić 34

Jednofaktorska ANOVA- primer H 0: A = B = C H 1: - nisu

Jednofaktorska ANOVA- primer H 0: A = B = C H 1: - nisu sve jednake = 0, 05 df 1 = 2 i df 2 = 15 2008/2009 S. Spasić 35

ANOVA – primer 1 2008/2009 S. Spasić 36

ANOVA – primer 1 2008/2009 S. Spasić 36

ANOVA – primer 1 F 0, 05 = 3, 68 za df 1 =

ANOVA – primer 1 F 0, 05 = 3, 68 za df 1 = 2 i df 2 = 15 Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti ! 2008/2009 S. Spasić 0 3, 68 F 37

ANOVA – Tukey-Snedecor test 2008/2009 S. Spasić 38

ANOVA – Tukey-Snedecor test 2008/2009 S. Spasić 38

ANOVA – Tukey-Snedecor test f(x) μAμB 2008/2009 μ 3 S. Spasić x 39

ANOVA – Tukey-Snedecor test f(x) μAμB 2008/2009 μ 3 S. Spasić x 39

ANOVA – Tukey-Snedecor test 2008/2009 S. Spasić 40

ANOVA – Tukey-Snedecor test 2008/2009 S. Spasić 40

ANOVA – primer 2 H 0 : A = B = C = D

ANOVA – primer 2 H 0 : A = B = C = D H 1: - nisu sve jednake = 0, 05 df 1 = 3 i df 2 = 23 grupa A grupa B grupa C grupa D 2, 51 2, 49 2, 50 2, 49 2, 52 2, 53 2. 50 2, 48 2, 53 2, 51 2, 50 2, 53 2, 50 2, 52 2, 47 2, 48 2, 52 2, 53 2, 52 2008/2009 2, 52 n xsr 7 2, 516 6 2, 507 6 2, 483 8 2, 521 Σx Σx 2 17, 61 44, 3023 15, 04 37, 7014 14, 9 37, 0022 20, 17 50, 8539 S. Spasić 41

ANOVA - primer 2008/2009 S. Spasić 42

ANOVA - primer 2008/2009 S. Spasić 42

ANOVA - primer F 0, 05 = 3, 03 za df 1 = 3

ANOVA - primer F 0, 05 = 3, 03 za df 1 = 3 i df 2 = 23 Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti ! 2008/2009 S. Spasić 0 3. 03 F 43

ANOVA - Tukey-Snedecor test 2008/2009 S. Spasić 44

ANOVA - Tukey-Snedecor test 2008/2009 S. Spasić 44

ANOVA - Tukey-Snedecor test f(x) μA=μB=μD μC 2008/2009 S. Spasić x 45

ANOVA - Tukey-Snedecor test f(x) μA=μB=μD μC 2008/2009 S. Spasić x 45

ANOVA - Tukey-Snedecor test 2008/2009 S. Spasić 46

ANOVA - Tukey-Snedecor test 2008/2009 S. Spasić 46