Katedra za istraivanja u biomedicini i zdravstvu Istraivanja
Katedra za istraživanja u biomedicini i zdravstvu Istraživanja u biomedicini i zdravstvu 2. godina medicine doc. dr. sc. Ana Jerončić
Istraživanje Varijable
Ispitanici, varijable i vrijednosti varijabli VARIJABLE I S P I T A N I C I Osoba 1 Osoba 2 Osoba 3 * * Visina (cm) Težina (kg) Dob (dani) Spol (Kategorija) 176 171 182 * * 70 60 75 * * 33 38 62 * * Muški Ženski Muški * * PODATAK Mjerenje/Opažanje
Varijable � Koje vrste varijabli (vrste podataka) imate u istraživanju? � Koje su varijable ovisne a koje neovisne?
Ovisne i neovisne varijable ◦ Ovisna varijabla ili varijabla ishoda (engl. outcome) – ishod istraživanja koji nas zanima (% infekcija, % alergija, ukupni bodovi na skali koja procjenjuje bol) ◦ Neovisne varijable - varijable koje su neposredno ili posredno povezane s varijablom ishoda (npr. ako je ishod % infekcija i gledamo utjecaj dojenja na %infekcija: neposredno - je li dijete isključivo dojeno, posredno- socioekonomski status majke)
Vrste varijabli/vrste podataka � Da bi podatke istraživanja ispravno analizirali potrebno je ispravno odrediti vrstu varijable (tj. vrstu podataka)
Vrste varijabli / vrste podataka Vrsta varijable (oblik mjerenja) Kvalitativne ili kategorijske Kvantitativne ili numeričke ili metričke ili brojčane Obilježja varijable Primjer Nominalne Neuređene kategorije Spol, urbanizacija Ordinalne Uređene kategorije Ocjene, skale Intervalne Razlike između Nema brojčanih apsolutne 0, vrijednosti rijetke imaju značenje (2 kg, 2 cm, …), Apsolutna 0 Temperatura, p. H Omjerne Visina, težina
Intervalne i omjerne varijable Nema apsolutne 0 ? …. temperatura i p. H X 0 visina, težina, dob u danima, … X A X B intervalna X A X B omjerna
Vrsta podataka? � Visina � Starost u godinama � Razina inzulina u serumu � Težina � Koncentracija glukoze u krvi
Vrsta podataka? Koliko cigareta dnevno pušite? � 1 -5 � 6 -10 � 11 -15 � 16 -20 � 21 i više
Vrsta podataka? Jeste li ikada preboljeli srčani udar? � Da � Ne Imate li povišeni krvni tlak? � Da � Ne �?
Vrsta podataka? Spol � Muški � Ženski
Vrsta podataka? Obrazovanje � osnovna škola � srednja škola � viša škola � visoka škola �?
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 neovisne varijable Mc. Nemarov test 2 ovisne varijable Pearson r Kontinuirana varijabla Kvalitativni (kategorijski) Povezanost Regresija 1 prediktor Rangovi Više prediktora Višestruka regresija VRSTA PODATKA Spearman r t test neovisne 2 skupine Testiranje hipoteze Mann-Whitney t test za povezane uzorke ovisne Kvantitativni Wilcoxon Razlika One-way ANOVA Kruskal-Wallis neovisne Parametrijske Neparametrijske ANOVA za ponavljane uzorke Više skupina ovisne Friedman
Opis razdiobe kvantitativnih podataka
Opis razdiobe - numerički 1. 2. Mjere srednje vrijednosti (centralne tendencije) Mjere raspršenja
Mjere srednje vrijednosti (centralne tendencije) � Kojoj vrijednosti teže moji podatci?
Mjere raspršenja (varijabilnosti) � Koliko su moji podatci različiti?
Opis razdiobe podataka u literaturi Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy. � “Twelve donors were studied at baseline; eight retested at (mean±SD) 11± 3 days(T 1), 10 at 91± 9 days(T 2), and 10 at 185± 17 days(T 3) after donation. Regeneration rates (m. L liver per kg body weight per day) were 0. 60± 0. 22 from baseline to T 1, 0. 05± 0. 02 from T 1 to T 2, 0. 01± 0. 01 from T 2 to T 3 by CT, 0. 54± 0. 20, 0. 04± 0. 01 and 0. 01± 0. 02 by SPECT. At T 3, liver volume was 84± 7% of baseline by CT and 92± 13% by SPECT. “ 0. 60 ± 0. 22 => 0. 60 -0. 22= 0. 38 0. 60+0. 22= 0. 82 Brzine regeneracije jetre u T 1 za ~68% ispitanika nalaze se u rasponu od 0. 38 do 0. 82 ml jetre/kg tijela po danu
Mjere srednje vrijednosti (centralne tendencije) � Aritmetička � Medijan � Mod sredina (prosječna vrijednost)
Aritmetička sredina, � Koristi se isključivo za kvantitativne podatke (intervalne i omjerne varijable) � Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja. Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj 3+4+2+3+4= 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost)=15/5=3 kg
Aritmetička sredina, Ne koristi se: � ukoliko je razdioba varijable asimetrična ili � kada podatci sadrže vrijednosti koje jako odstupaju od ostalih podataka (tzv. outlier)
Medijan, Md 1. 2. Koristi se uvijek za ordinalne podatke, te za brojčane podatke kada su “asimetrično raspodijeljeni” Aritmetička sredina
Medijan, Md � � Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli donjih 50% podataka od gornjih 50%. Primjer: Broj prethodnih trudnoća je 3, 6, 2, 5, 7. Koliki je medijan? • Poredaj brojeve po veličini: 2, 3, 5, 6, 7 • Srednji broj je 5 • Medijan je 5
Medijan, Md � Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih trudnoća u slijedećih šest ispitanica: 2, 7, 1, 6, 6, 3 • Poredaj brojeve po veličini: 1, 2, 3, 6, 6, 7 • Srednji brojevi su: 3 i 6 • Medijan je
Mod, Mo � Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke � Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku Primjer: Podatci o 2, 2, 2, 4, 5, 6, 7, 7, 8 � 7 je broj koji se pojavljuje najučestalije (najveći broj puta) � Mod je 7
Mjere srednje vrijednosti na primjeru [godine]
Mjere raspršenja (varijabilnosti) � Standardna � Raspon devijacija � Interkvartilni raspon
Standardna devijacija, s (SD) �Standardna devijacija – uvijek uz aritmetičku sredinu! �Prosječno odstupanje podataka od aritmetičke sredine �Mjerne jedinice iste kao i u aritmetičke sredine: ng/m. L, g/danu
Raspon, R � Koristi se kao mjera raspršenja uz medijan ili mod � Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak � Greške pri mjerenju utječu na njega
Raspon, R u literaturi � � � RAD: Merewood A et al. Vitamin D status among 4 -month-old infants in New England: a prospective cohort study. J Hum Lact. 2012. 28: 159 -66 CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca i prethodno testiranih nakon poroda. RESULTS: At 4 months, 11. 9% of the 177 infants were vitamin D deficient compared to 37. 5% at birth (25(OH)D <20 ng/m. L). Median 25(OH)D was 35. 2 ng/m. L (range, 5 -100. 8). …
Interkvartilni raspon, IQR � Koristi se kao mjera raspršenja uz medijan ili mod u slučaju kada imamo veći broj podataka
Interkvartilni raspon, IQR � Koristi se kao mjera raspršenja uz medijan ili mod u slučaju kada imamo veći broj podataka
Mjere raspršenja vrijednosti na primjeru raspon IQR
Zašto se opisna statistika koristi? 1. ◦ 2. ◦ ◦ 3. Opis uzorka usporedba s populacijskim parametrima Opis uzorka u ograncima RCT usporedba s populacijskim parametrima kvaliteta randomizacije Procjena razdiobe podataka (odabir statističkog testa)
U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?
Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena? Varijable Dob [godine] BMI [kg/m 2] FSH [IU/L] LH [IU/L] Prosječna vrijednost ukupnog V [cm 3] Prosječna vrijednost AFC A [nmol/L] SHBG [nmol/L] Prolactin [µg/L] AMH [ng/ml] T [nmol/L] DHESO 4 [μmol/L] FAI Unilateralna N=49 Bilateralna N=47 Aritmetička sredina±SD /medijan (IQR) 29. 3± 3. 31 29. 3± 3. 05 25. 1± 1. 94 25. 0± 2. 10 5. 5± 1. 19 5. 1± 1. 15 13. 0± 2. 64 12. 3± 3. 50 MD (95% CI)* 0. 08 (-1. 23, 1. 38) 0. 02 (-0. 81, 0. 85) 0. 38 (-0. 09, 0. 86) 0. 68 (-0. 58, 1. 95) 11. 3± 1. 79 11. 4± 2. 74 -0. 13 (-1. 08, 0. 82) 15. 0± 2. 37 15. 2± 4. 62 35. 0± 9. 32 294. 0± 96. 27 5. 9 (2. 7) 2. 7 (0. 6) 7. 8 (4. 3) 7. 8 (1. 4) 14. 8± 3. 20 11. 9± 4. 18 39. 0± 10. 45 284. 4± 78. 08 6. 5 (3. 6) 3. 0 (1. 1) 7 (2. 7) 8. 0 (3. 3) 0. 21 (-0. 94, 1. 37) 3. 13 (1. 34, 4. 93) ǂ -4. 02 (-8. 07, 0. 03) 9. 78 (-26. 20, 45. 77) -0. 7 (-1. 6, 0. 1) -0. 2 (-0. 5, -0. 1) ǂ 0. 4 (-0. 6, 1. 5) -0. 4 (-1. 4, 0. 2)
Razdioba kvantitativnih podataka � Opis preko mjera srednje vrijednosti i raspršenja ili � Grafičkim prikazom (histogram)
Razdioba kvantitativnih podataka � Opis razdiobe preko mjera srednje vrijednosti i raspršenja ili � Grafičkim prikazom (histogram)
Grafički prikaz razdiobe brojčanih podataka - histogram � � � Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala 0 -1, 1 -2, … 8 -9 cm Pobrojeno je koliko ispitanika ima u pojedinoj kategoriji Broj ispitanika po kategoriji je prikazan grafički.
Histogram – Razdioba veličine tumora u 13 bolesnika � � Srednja vrijednost veličine tumora u ovoj skupini je 3 -4 cm (3 bolesnika) Veličina tumora je raspršena – od >0 do 9 cm Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika) Računanjem iz aritmetičke sredine i SD 3. 77 -2. 25=1. 52 3. 77+2. 25=6. 02
Oblik histograma Krivulja normalne (Gaussove) razdiobe
Oblik histograma
Laž s prosječnom plaćom
Opis razdiobe kvalitativnih podataka
Opis razdiobe kvalitativnih varijabli N (%)
Preciznost procjene
Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici
Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram). 68% novorođenčadi ima težinu od 3624 -464=3160 g do 3624+464=4088 g 95% novorođenčadi ima težinu od 3624 -2*464=2696 g do 3624+2*464=4552 g
Preciznost procjene aritmetičke sredine � Koliko je precizna naša procjena (izračun) aritmetičke sredine?
Preciznost procjene aritmetičke sredine � Koliko je precizan naš izračun u procjeni prave aritmetičke sredine (arit. sredina populacije)? � Mjerimo sa: ◦ Standardnom pogreškom aritmetičke sredine (engl. kratica SEM) ◦ 95% rasponom pouzdanosti (engl. kratica 95% CI)
Standardna pogreška aritmetičke sredine, SEM Standardna devijacija � SEM Broj ispitanika je manji (procjena je preciznija): ◦ Što je veći N (broj ispitanika) ◦ Što je manja SD (raspršenje podataka)
95% raspon pouzdanosti, 95% CI � Također � No, je mjera preciznosti procjene aritmetičke sredine 95% CI daje procjenu i za točnosti rezultata (95% je vjerojatno da izračunat raspon obuhvaća pravu aritmetičku sredinu)
95% raspon pouzdanosti, 95% CI Primjer dohrane starije dojenčadi s obzirom na absorbirani cink, Krebs NF, Westcott JE, Culbertson DL et. al. Comparison of complementary feeding strategies to meet zinc requirements of older breastfed infants. Am J Clin Nutr. 2012; 96: 30 -35 “Mean (±SEM) total absorbed zinc amounts were 0. 80 ± 0. 08, 0. 71 ± 0. 09, and 0. 52 ± 0. 05 mg/d for the: meat, iron-and-zinc-fortified infant cereal, and whole-grain, iron -only-fortified infant cereal groups of infants. ” Apsorbirani cink [mg/danu] � 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 meso Fe i Zn žitarice Dohrana Fe cjelovite žitarice
Razlikujte! � ±SD – mjera raspršenja npr. porođajne težine ispitivane novorođenčadi � ±SEM - mjera preciznosti procjene aritmetičke sredine porođajne težine novorođenčadi � 95% CI - mjera preciznosti i mjera točnosti (95%) procjene aritmetičke sredine porođajne težine novorođenčadi
Mjere raspršenja na primjeru
Muškarci Žene
Žene Muškarci
Hvala na pozornosti
- Slides: 61