Biologija novotvorina Analiza medicinskih podataka Statistika obradba podataka
Biologija novotvorina Analiza medicinskih podataka Statistička obradba podataka – uvodna razmatranja Mladen Petrovečki 2006. /07.
http: //www. unidu. hr/novotvorine/
Nastava
Nastavnici prof. dr. sc. Mladen Petrovečki, dr. med. n n Katedra za medicinsku informatiku Medicinskog fakulteta Sveučilišta u Rijeci Klinički zavod za laboratorijsku dijagnostiku Kliničke bolnice Dubrava u Zagrebu mr. sc. Ivica Lukšić, dr. med. n n Katedra za maksilofacijalnu kirurgiju sa stomatologijom Medicinskog fakulteta Sveučilišta u Zagrebu Klinika za kirurgiju čeljusti i lica Kliničke bolnice Dubrava u Zagrebu
Raspored nastave Petak, 4. svibnja 16 -17: 30 h (2 P) (15 min. ) 17: 45 -18: 30 (1 S) Subota, 5. svibnja 9 -10: 30 (2 V) (30 min. ) 11 -12: 30 (2 V) (15 min. ) 12: 45 -14: 15 (2 V) Nedjelja, 6. svibnja 9 -10: 30 (2 S) (30 min. ) 11 -12: 30 (2 S) 12: 30 -13: 15 (1 S) Uvodna razmatranja o statističkoj obradi Baze podataka u kliničkoj medicini Temeljne spoznaje i usporedba uzoraka Analiza kvalitativnih podataka Korelacija, regresija, ROC-krivulje Analiza preživljenja Multivarijatni postupci obradbe podataka Rasprava
Ovo predavanje. . . mi. medri. hr (E-prilozi predavanja)
Program Med. Calc computer program for statistic in biomedicine Copyright, 1993 -2007 Medcalc Software Mariakerke, Belgija
Program www. medcalc. be
Literatura Dawson-Saunders B, Trapp RG. Basic & Clinical Biostatistics. Prentice. Hall Int. Inc. , London, 2001. Petrie A, Sabin C. Medical statistics at a glance. Blackwell Science, Oxford, 2000. Marušić M. Uvod u znanstveni rad u medicini. III. obnov. izd. Medicinska naklada, Zagreb, 2004. Petz B. Osnovne statističke metode za nematičare. III. dopunjeno izd. Naklada Slap, Jastrebarsko, 1997. Stat. Soft Inc. Electronic Statistics Textbook. Tulsa, OK: Stat. Soft, 2002. (http: //www. statsoft. com/textbook/stathome. html) Moher D, Schulz KF, Altman DG, for the CONSORT Group. The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomized trials. Lancet 2001; 357: 1191 -4. (http: //www. consort-statement. org/ revisedstatement. htm)
Literatura
Ispit kritička raščlamba statističkih postupaka objavljenog znanstvenog rada n n pismeno (elektronički) poslati desetak dana prije usmene obrane časopis – citiran u Current Contents rad: n n n cjelokupno istraživanje (ne osvrt na drugi objavljeni rad!) najmanje dva priloga (tablica, slika) jasan opis statističkih postupaka
Nastavak. . .
? u nesreća… u svaki sreća… puta… desetak puta… u nemoguće… nevjerojatno…
Pregled metodologija znanstvenog istraživanja postupci istraživanja neznanstveni i znanstveni postupci
Metodologija znanstvenog istraživanja znanost kao način razmišljanja znanstveno djelovanje n n n privremeno tumačenje hipoteza zaključak TVRDNJA OBRAZLOŽENJE provjerljivost postavke činjenice znanje PROVJERA
Neznanstveni postupci istraživanja ustrajnost (navika, stav, vjerovanje, inercija) autoritet intuicija (očiglednost)
Pokus pokus – istraživanje / dio istraživanja planiranje pokusa randomizacija maskiranje
Maskiranje jednostruko dvostruko trostruko četverostruko
Istraživačka logika deterministički model sustava probabilistički model sustava vjerojatnost događaja – p(D) 0 p(D) 1
Uzorak i populacija SPOZNAJA O POPULACIJI populacija mjereno obilježje UZORKOVANJE PROCJENA uzorak statistička obrada podataka SPOZNAJA O UZORKU
Mjerno obilježje Mjerne ljestvice n NOMINALNA n ORDINALNA n INTERVALNA n OMJERNA
Uzorak • reprezentativan • mjerljiv • slučajni (probabilistički) • jednostavni slučajni • sustavni slučajni • slojevit (stratificirani) slučajni • skupovni (klasterirani) slučajni
Uzorak – zavisnost ZAVISNI NEZAVISNI
Uzorak – odrednica dio populacije n n n pojmovna odrednica vremenska odrednica prostorna
Hipoteza znanstvena hipoteza statistička hipoteza
Statistička hipoteza elementarna tvrdnja točna (istinita) ili netočna (neistinita) provjera hipoteze = traženje istina – stvarno, objektivno stanje probabilistički sustav: istina vjerojatnost značajno – ono što se ostvaruje na svaki drugi način osim slučajno iskaz vjerojatnosti razina značajnosti
Dokazivanje statističke hipoteze CD Kontrolna Ispitanici s Statistika skupina PTSD H p CD 3 39, 0 (15, 1 – 61, 1) 44 (32, 3 – 57, 7) 0, 59 0, 442 CD 4 3, 5 (2, 1 – 5, 8) 10, 3 (6, 5 – 17, 4) 15, 9 0, 018 Razlikuje li se razina CD 4 u ispitanika u istraživanju? Škarpa I et al. Croat Med J 2001; 42: 551 -5.
1. postavljanje hipoteze nulta – H 0 -hipoteza: razlike nema! n “Nema razlike u razinama CD 4. ” suprotna – H 1 -hipoteza: razlike ima! n “Razine CD se razlikuju. ” samo jedna može biti istinita samo jedna može biti prihvaćena, dok će ona druga biti odbačena
2. Odabir testa testovi dokazivanja statističkih hipoteza ovisnost n n osobine obilježja - mjerne ljestvice osobine uzoraka veličina povezanost n osobine raspodjele parametrijski neparametrijski n broj obilježja - uni/bi/multivarijatni testovi
(nastavak) Ljestvica Nominalna Jedan uzorak binomni test hi-kvadrat Dva uzorka Tri i više uzoraka Ovisni Neovisni Mc. Nemara Cohran Fisher hi-kvadrat/ Ordinalna Kol/Smir. homologni Intervalna Omjerna . . . Wilcoxon Friedman MW p/medijan Moses KW
3. Određivanje razine značajnosti p a ako se p određuje prije izračunavanja a – vjerojatnost odbacivanja H 0 kad je ona stvarno točna i istinita tzv. a-pogrješka (pogrješka I. vrste) što manja! uobičajene vrijednosti, npr. p<0, 05
(nastavak) zašto upravo to: p<0, 05? u POKUS u bacanje novčića: pismo/glava u 2 x isto uzastopce = 0, 5 u 3 x = 0, 25 u 4 x = 0, 125 u 5 x = 0, 0625 u. . .
4. Izračunavanje matematički račun primjer. . . Med. Calc
5. Zaključivanje mala vrijednost “p” = mala vjerojatnost da ne prihvaćama ono što je istinito zaključivanje: n n n p<a vjerojatnost istinitosti H 0 je mala odbacujemo (ne prihvaćamo) nultu hipotezu prihvaćamo alternativnu, H 1 potvrdimo je, iskažemo, uz p=. . .
(nastavak – zaključak) CD Kontrolna Ispitanici s Statistika skupina PTSD H p CD 3 39, 0 (15, 1 – 61, 1) 44 (32, 3 – 57, 7) 0, 59 0, 442 CD 4 3, 5 (2, 1 – 5, 8) 10, 3 (6, 5 – 17, 4) 15, 9 0, 018 Razlikuje li se razina CD 4 u ispitanika u istraživanju? Škarpa I et al. Croat Med J 2001; 42: 551 -5.
Pogrješke testiranja hipoteze PRAVO STANJE ZAKLJUČENO RAZLIKA POSTOJI (H 1) RAZLIKA NE POSTOJI (H 0) ISPRAVAN ZAKLJUČAK a pogrješka (I. vrste) (H 0 odbac. ) RAZLIKA POSTOJI b pogrješka (II. vrste) ISPRAVAN ZAKLJUČAK (H 0 prihvat. ) RAZLIKE NEMA
WWW… http: //faculty. vassar. edu/lowry/Vassar. Stats. html http: //www. statserv. com/ http: //www. randomizer. org/ http: //www. bettycjung. net/Statsites. htm http: //shazam. econ. ubc. ca/flip/ http: //statpages. org/ http: //www. stat. psu. edu/~resources/index. htm
Na kraju…
Pogrješka temeljne prosudbe Kahneman D, Tversky A. On prediction and judgement. Oregon Res Inst Bull 1972; 371: 100.
Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan nalaz ISPRAVNO POZITIVNI (TP) LAŽNO POZITIVNI (FP) negativan nalaz LAŽNO NEGATIVNI (FN) ISPRAVNO NEGATIVNI (TN) Osjetljivost testa = TP / (TP + FN) Specifičnost testa = TN / (FP + TN) Pozitivna prediktivna vrijednost = TP / (TP + FP) Negativna prediktivna vrijednost = TN / (FN + TN)
15% 85% PROMETNA NEZGODA, NOĆ, VOZAČ POBJEGNE p(zeleni) = ? Osjetljivost testa = 80%, Specifičnost testa “ZELENI = 80% OČEVIDAC NEZGODE: p(zeleni) = ? p = 0, 15 (15%) TAXI” p = 1 (100%) OSPORAVA SE IZJAVA, TESTIRANJE NOĆNE VIDLJIVOSTI RAZLUČIVANJA BOJA: PREPOZNAVANJE 80%, GRIJEŠI 20% (OBJE) p = 0, 8 (80%) p(zeleni) = ?
Stvarna boja vozila Svjedok vidi zeleno 12 17 plavo 03 68 ukupno 15 85 Osjetljivost testa = 80%, Specifičnost testa = 80% Poz. PV = 12/(12+17) = 12/29 = 0, 41 p = 0, 41 (41%)
Mudrost zaključivanja! ZNANOST obradba podataka p = 0, 41 (41%)
Priopćavanje E-pošta: mladenp@medri. hr Klinička bolnica Dubrava Klinički zavod za laboratorijsku dijagnostiku Avenija G. Šuška 6, 10000 Zagreb 01 290 3379 Katedra za medicinsku informatiku Medicinski fakultet Sveučilišta u Rijeci Ulica braće Branchetta 20, 51000 Rijeka 051 651 255
- Slides: 47