STATISTIKI TESTOVI I RAZINA ZNAAJNOSTI dr sc Vesna

  • Slides: 28
Download presentation
STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI dr. sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku,

STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI dr. sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek PDDS MOLBIO 1

OSNOVNI POJMOVI STATISTIČKI TEST – postupak pomoću kojeg se dolazi do odluke o prihvaćanju

OSNOVNI POJMOVI STATISTIČKI TEST – postupak pomoću kojeg se dolazi do odluke o prihvaćanju ili odbacivanju statističke hipoteze uz određenu vjerojatnost STATISTIČKA HIPOTEZA – izjava (tvrdnja) o nekoj karakteristici populacije koju prihvaćamo ili odbacujemo na osnovu informacija dobivenih iz prikupljenih podataka NUL-HIPOTEZA (H 0)– polazna hipoteza koja se testira H 1 – alternativna hipoteza, negacija H 0 PDDS MOLBIO 2

POSTUPAK STATISTIČKOG TESTIRANJA 1. postavljanje nul-hipoteze npr. H 0. . . m 1 =

POSTUPAK STATISTIČKOG TESTIRANJA 1. postavljanje nul-hipoteze npr. H 0. . . m 1 = m 2 Þ parametri populacija iz kojih su uzorci uzeti su jednaki Þ uzorci pripadaju istoj populaciji PDDS MOLBIO 3

POSTUPAK STATISTIČKOG TESTIRANJA 2. testiranje izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su

POSTUPAK STATISTIČKOG TESTIRANJA 2. testiranje izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su razlike u ocjenama parametara (x 1 i x 2) slučajne (pvrijednost) PDDS MOLBIO 4

POSTUPAK STATISTIČKOG TESTIRANJA 3. donošenje odluke o odbacivanju H 0 (prihvaćanju H 1) ili

POSTUPAK STATISTIČKOG TESTIRANJA 3. donošenje odluke o odbacivanju H 0 (prihvaćanju H 1) ili prihvaćanju H 0 (odbacivanju H 1) na određenoj razini značajnosti PDDS MOLBIO 5

POGREŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZI STVARNO STANJE H 0 točna H 1 točna

POGREŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZI STVARNO STANJE H 0 točna H 1 točna PRIHVATI H 0 ISPRAVNO POGREŠKA TIPA 2 (b) ODBACI H 0 POGREŠKA TIPA 1 (a) ISPRAVNO ODLUKA PDDS MOLBIO 6

VJEROJATNOSTI POGREŠKE l najveća vjerojatnost pogreške tipa 1 (a) je razina značajnosti testa –

VJEROJATNOSTI POGREŠKE l najveća vjerojatnost pogreške tipa 1 (a) je razina značajnosti testa – najmanja vjerojatnost uz koju još prihvaćamo H 0 – kada je p < a , test sugerira odbacivanje H 0 (“statistički značajno”) – određuje ju istraživač na temelju modela pokusa – uobičajeno se stavlja a = 0. 05 PDDS MOLBIO 7

VJEROJATNOSTI POGREŠKE l najveća vjerojatnost pogreške tipa 2 (b) – djelomično je pod kontrolom

VJEROJATNOSTI POGREŠKE l najveća vjerojatnost pogreške tipa 2 (b) – djelomično je pod kontrolom – ovisi o: l stvarnom stanju u populaciji l razini značajnosti a l modelu pokusa – a i b su inverzno povezane (ali ne direktno) PDDS MOLBIO 8

ODABIR NIVOA ZNAČAJNOSTI l pitanje štetnih posljedica pogreške: 1. Odluka/zaključak da razlike postoje onda

ODABIR NIVOA ZNAČAJNOSTI l pitanje štetnih posljedica pogreške: 1. Odluka/zaključak da razlike postoje onda kada ih u stvarnosti nema može prouzročiti štetne posljedice => smanjiti vjerojatnost nastajanja pogreške tipa 1, tj. odabrati manji a 2. Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti štetne posljedice => smanjiti vjerojatnost pogreške tipa 2, tj. odabrati veći a PDDS MOLBIO 9

Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je

Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X? PDDS MOLBIO 10

STVARNO STANJE: Oba lijeka jednako su štetna. STVARNO STANJE: Lijek Y manje je štetan

STVARNO STANJE: Oba lijeka jednako su štetna. STVARNO STANJE: Lijek Y manje je štetan od lijeka X. ODLUKA: Lijek Y ima manje štetne posljedice od lijeka X. ODLUKA: Lijek Y ima jednako štetne posljedice kao i lijek X. a PDDS MOLBIO b 11

STVARNO a b O : E J N A ST u s o k

STVARNO a b O : E J N A ST u s o k a n d e j a lijek štetna. k e j i L : A K U L OD Y ima manje e c i d e j l s o p e n t e št od lijeka X. a PDDS MOLBIO STVARNO Y k e j i L : E J N STA d o n a t e t š e j manje lijeka X. jek i L : A K U L D O o Y ima jednak e c i d e j l s o p e n štet kao i lijek X. b 12

Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije

Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti pronađene razlike? PDDS MOLBIO 13

STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije. STVARNO STANJE: Alkohol produljuje vrijeme reakcije.

STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije. STVARNO STANJE: Alkohol produljuje vrijeme reakcije. ODLUKA: Alkohol produljuje vrijeme reakcije ODLUKA: Alkohol ne utječe na vrijeme reakcije. a PDDS MOLBIO b 14

STVARNO STANJE: Alkoho l ne utječe na vrijeme reakcije. ODLUKA: Alkohol produljuje vrijeme reakcije

STVARNO STANJE: Alkoho l ne utječe na vrijeme reakcije. ODLUKA: Alkohol produljuje vrijeme reakcije a PDDS MOLBIO STVARNO STANJE: Alkohol produljuje vrijem e reakcije. ODLUKA: Alkohol ne utječe na vrijeme reakcije. b 15

POSTAVKE DIZAJNA l općenito testove treba dizajnirati tako da imaju b a gdje je

POSTAVKE DIZAJNA l općenito testove treba dizajnirati tako da imaju b a gdje je odabrani b 0. 2 ili 0. 1 l za b = 0. 2 , to znači samo 80% šanse da se detektira određena alternativna hipoteza kada je stvarno točna l izraz 100(1 -b)% naziva se (statistička) SNAGA TESTA PDDS MOLBIO 16

JEDNOSMJERNO I DVOSMJERNO TESTIRANJE l jednosmjerno testiranje – interes istraživača usmjeren je na promjene

JEDNOSMJERNO I DVOSMJERNO TESTIRANJE l jednosmjerno testiranje – interes istraživača usmjeren je na promjene u jednom smjeru (npr. povećanje ili smanjenje) l H 0: l 16 ; H 1: > 16 dvosmjerno testiranje – interes istraživača usmjeren je na promjenu u bilo kojem smjeru l H 0: =0 ; H 1: 0 Testiranje bi trebalo biti dvosmjerno, osim ako istraživanje posebno ne zahtijeva da se promjene usmjere u određenom smjeru UNAPRIJED! PDDS MOLBIO 17

ŠTO JE P-VRIJEDNOST? l NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo slično) l JESTE

ŠTO JE P-VRIJEDNOST? l NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo slično) l JESTE vjerojatnost dobivanja istih ili ekstremnijih rezultata kada je nul-hipoteza istinita PDDS MOLBIO 18

l statistička značajnost NIJE isto što i klinička važnost l bolje je navesti točnu

l statistička značajnost NIJE isto što i klinička važnost l bolje je navesti točnu vrijednost p nego “NS” PDDS MOLBIO 19

VIŠESTRUKA TESTIRANJA l valjanost se smanjuje višestrukim testiranjem – pretpostavimo da uspoređujemo težinu triju

VIŠESTRUKA TESTIRANJA l valjanost se smanjuje višestrukim testiranjem – pretpostavimo da uspoređujemo težinu triju nezavisnih skupina ispitanika podvrgnutih različitim tretmanima; l H 0: 1 = 2 = 3 l H 1: 1 2 l H 2: 1 3 l H 3: 2 3 nul-hipoteza alternativne hipoteze (za k eksperimentalnih grupa moguće je izvršiti k(k-1)/2 ovakve usporedbe) PDDS MOLBIO 20

VIŠESTRUKA TESTIRANJA l razina značajnosti a može se izraziti kao vjerojatnost (odbacivanje H 0

VIŠESTRUKA TESTIRANJA l razina značajnosti a može se izraziti kao vjerojatnost (odbacivanje H 0 kada je H 0 točna) odnosno 1 – vjerojatnost(ne odbacivanje H 0 kada je H 0 točna) tj. 1 -(1 -a) l u slučaju višestrukih (r) testova to postaje 1 – vjerojatnost(ne odbacivanje svih H 0 kada su sve H 0 točne) odnosno PDDS MOLBIO 1 -(1 -a)r 21

VIŠESTRUKA TESTIRANJA l ako je a = 0. 05, tada je za r višestrukih

VIŠESTRUKA TESTIRANJA l ako je a = 0. 05, tada je za r višestrukih testova r 1 2 3 4 5 6 7 8 9 10 ar 0. 050 0. 098 0. 143 0. 185 0. 226 0. 265 0. 302 0. 337 0. 370 0. 401 r 11 12 13 14 15 16 17 18 19 20 ar 0. 431 0. 460 0. 487 0. 512 0. 537 0. 560 0. 582 0. 603 0. 623 0. 642 PDDS MOLBIO 22

Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze

Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze istinite uz a = 0. 05? U slučaju da su sve nul-hipoteze istinite, uz a=0. 05 očekujemo 5% značajnih rezultata slučajno => za 20 testova to je 1, tj. očekujemo 1 značajan rezultat kao posljedicu SLUČAJNOSTI ! PDDS MOLBIO 23

VIŠESTRUKA TESTIRANJA l rješenje: – prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti

VIŠESTRUKA TESTIRANJA l rješenje: – prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti (Bonferroni, Sidak, Hochberg. . . ) – primjena sofisticiranijih metoda analize (npr. ANOVA, multivarijatne metode) PDDS MOLBIO 24

VIŠESTRUKA TESTIRANJA l Bonferroni metoda – za r nezavisnih testova pcorr = p·r «npr.

VIŠESTRUKA TESTIRANJA l Bonferroni metoda – za r nezavisnih testova pcorr = p·r «npr. PDDS MOLBIO za tri nezavisna testa H 1: 1= 2 ; p = 0. 017; pcorr = 0. 051 H 2: 1 = 3 ; p = 0. 025 ; pcorr = 0. 075 H 3: 2 = 3 ; p = 0. 063 ; pcorr = 0. 189 25

VIŠESTRUKA TESTIRANJA AKO MUČITE PODATKE DOVOLJNO DUGO ONI ĆE NAPOSLIJETKU PRIZNATI !!! PDDS MOLBIO

VIŠESTRUKA TESTIRANJA AKO MUČITE PODATKE DOVOLJNO DUGO ONI ĆE NAPOSLIJETKU PRIZNATI !!! PDDS MOLBIO 26

IZBOR STATISTIČKOG TESTA Ne ovisi u velikoj mjeri o veličini uzorka nego: l prirodi

IZBOR STATISTIČKOG TESTA Ne ovisi u velikoj mjeri o veličini uzorka nego: l prirodi (tipu) varijabli l broju uzoraka (1, 2 ili više) l jesu li su uzorci zavisni ili ne PDDS MOLBIO 27

VARIJABLA BROJ UZORAKA NOMINALNA ORDINALNA ILI KONTINUIRANA KOJA NIJE NORMALNO DISTRIBUIRANA JEDAN 2 -test

VARIJABLA BROJ UZORAKA NOMINALNA ORDINALNA ILI KONTINUIRANA KOJA NIJE NORMALNO DISTRIBUIRANA JEDAN 2 -test Kolmogorov-Smirnov test DVA 2 -test Mann-Whitney U test NEZAVISNI Fisherov egzaktni Medijan test t-test Studentov t-test ZAVISNI Mc. Nemarov test Wilcoxonov test t-test diff. NEZAVISNI 2 -test Kruskall-Wallis test ANOVA ZAVISNI Cochran Q Stuart-Maxwell Friedmanov test ANOVA za ponavljana mjerenja Spermanov r Kendalov t Pearsonov r VIŠE OD 2 POVEZANOST DVIJU Koef. kontingencije VARIJABLI Kappa koef. PDDS MOLBIO KONTINUIRANA NORMALNO DISTRIBUIRANA 28