Opis podataka Doc dr sc Ana Jeroni Katedra

  • Slides: 43
Download presentation
Opis podataka Doc. dr. sc. Ana Jerončić Katedra za istraživanja u biomedicini i zdravstvu

Opis podataka Doc. dr. sc. Ana Jerončić Katedra za istraživanja u biomedicini i zdravstvu

Opis kvantitativnih (brojčanih) podataka ? o Mjere srednje vrijednosti (centralne tendencije) o Mjere raspršenja

Opis kvantitativnih (brojčanih) podataka ? o Mjere srednje vrijednosti (centralne tendencije) o Mjere raspršenja

Mjere srednje vrijednosti (centralne tendencije) o Kojoj vrijednosti teže moji podatci?

Mjere srednje vrijednosti (centralne tendencije) o Kojoj vrijednosti teže moji podatci?

Mjere raspršenja (varijabilnosti) o Koliko su moji podatci različiti?

Mjere raspršenja (varijabilnosti) o Koliko su moji podatci različiti?

Mjere srednje vrijednosti (centralne tendencije) o Aritmetička sredina (prosječna vrijednost) o Medijan o Mod

Mjere srednje vrijednosti (centralne tendencije) o Aritmetička sredina (prosječna vrijednost) o Medijan o Mod

Aritmetička sredina, o Koristi se isključivo za kvantitativne (brojčane) podatke - intervalne i omjerne

Aritmetička sredina, o Koristi se isključivo za kvantitativne (brojčane) podatke - intervalne i omjerne varijable o Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja. Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj 3+4+2+3+4= 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost) = 15/ 5 = 3 kg

Medijan, Md 1. Koristi se uvijek za ordinalne podatke, te 2. za brojčane podatke

Medijan, Md 1. Koristi se uvijek za ordinalne podatke, te 2. za brojčane podatke kada su “asimetrično raspodijeljeni” Aritmetička sredina

Medijan, Md o Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po

Medijan, Md o Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan o Dijeli donjih 50% podataka od gornjih 50%. Primjer: Broj prethodnih trudnoća je 3, 6, 2, 5, 7. Koliki je medijan? • Poredaj brojeve po veličini: 2, 3, 5, 6, 7 • Srednji broj je 5 • Medijan je 5

Medijan, Md o Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih

Medijan, Md o Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih trudnoća u slijedećih šest ispitanica: 2, 7, 1, 6, 6, 3 • Poredaj brojeve po veličini: 1, 2, 3, 6, 6, 7 • Srednji brojevi su: 3 i 6 • Medijan je

Mod, Mo o Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane

Mod, Mo o Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke o Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku Primjer: Podatci o 2, 2, 2, 4, 5, 6, 7, 7, 8 o 7 je broj koji se pojavljuje najučestalije (najveći broj puta) o Mod je 7

Mjere srednje vrijednosti na primjeru

Mjere srednje vrijednosti na primjeru

Mjere raspršenja (varijabilnosti) o o Raspon Interkvartilni raspon Varijanca Standardna devijacija

Mjere raspršenja (varijabilnosti) o o Raspon Interkvartilni raspon Varijanca Standardna devijacija

Raspon, R o Koristi se kao mjera raspršenja uz medijan ili mod o Razlika

Raspon, R o Koristi se kao mjera raspršenja uz medijan ili mod o Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak o Greške pri mjerenju utječu na njega

Raspon, R u literaturi o RAD: Merewood A et al. Vitamin D status among

Raspon, R u literaturi o RAD: Merewood A et al. Vitamin D status among 4 -month-old infants in New England: a prospective cohort study. J Hum Lact. 2012. 28: 159 -66 o CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca, testiranih nakon poroda. o REZULTATI: At 4 months, 11. 9% of the 177 infants were vitamin D deficient compared to 37. 5% at birth (25(OH)D <20 ng/m. L). Median 25(OH)D was 35. 2 ng/m. L (range, 5. 0 -100. 8). …

Interkvartilni raspon – umjesto raspona kada imamo veliki uzorak

Interkvartilni raspon – umjesto raspona kada imamo veliki uzorak

podatci za n ispitanika Varijanca, s 2 o Koristi se kao mjera raspršenja uz

podatci za n ispitanika Varijanca, s 2 o Koristi se kao mjera raspršenja uz aritmetičku sredinu s 2 -1 o Prosječno kvadratno odstupanje podataka od aritmetičke sredine o Rijetko se koristi jer se izražava u mjernim jedinicama 2 pa je praktično tumačenje problematično o npr. ovisno o tome što mjerimo: ng 2/m. L 2, g 2/danu 2, …

Standardna devijacija, s (SD) o Standardna devijacija – uvijek uz aritmetičku sredinu! o Korijen

Standardna devijacija, s (SD) o Standardna devijacija – uvijek uz aritmetičku sredinu! o Korijen iz varijance => Prosječno odstupanje podataka od aritmetičke sredine o Mjerne jedinice iste kao i u aritmetičke sredine: ng/m. L, g/danu

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici Izmjerene su težine N=812

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram). 68% novorođenčadi ima težinu od 3624 -464=3160 g do 3624+464=4088 g 95% novorođenčadi ima težinu od 3624 -2*464=2696 g do 3624+2*464=4552 g

Mjere raspršenja vrijednosti na primjeru IQR

Mjere raspršenja vrijednosti na primjeru IQR

Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena

Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena T 1 i T 2? o Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy. o “Twelve donors were studied at baseline; eight retested at (mean±SD) 11± 3 days(T 1), 10 at 91± 9 days(T 2), and 10 at 185± 17 days(T 3) after donation. Regeneration rates (m. L liver per kg body weight per day) were 0. 60± 0. 22 from baseline to T 1, 0. 05± 0. 02 from T 1 to T 2, 0. 01± 0. 01 from T 2 to T 3 by CT, 0. 54± 0. 20, 0. 04± 0. 01 and 0. 01± 0. 02 by SPECT. At T 3, liver volume was 84± 7% of baseline by CT and 92± 13% by SPECT. “ 0. 60 ± 0. 22 => 0. 60 -0. 22= 0. 38 0. 60+0. 22= 0. 82 Najveći dio podataka u vremenu T 1 nalazi se u rasponu od 0. 38 do 0. 82 ml jetre/kg tijela po danu Najveći dio podataka u vremenu T 2 nalazi se u rasponu od 0. 03 do 0. 07 ml jetre/kg tijela po danu

Zašto se opisna statistika koristi? 1. Opis uzorka n usporedba s populacijskim parametrima 2.

Zašto se opisna statistika koristi? 1. Opis uzorka n usporedba s populacijskim parametrima 2. Opis uzorka u ograncima RCT n usporedba s populacijskim parametrima n kvaliteta randomizacije 3. Procjena razdiobe podataka (odabir statističkog testa)

U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se

U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?

Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena?

Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena? Varijable Dob [godine] BMI [kg/m 2] FSH [IU/L] LH [IU/L] Prosječna vrijednost ukupnog V [cm 3] Prosječna vrijednost AFC A [nmol/L] SHBG [nmol/L] Prolactin [µg/L] AMH [ng/ml] T [nmol/L] DHESO 4 [μmol/L] FAI Unilateralna N=49 Bilateralna N=47 Aritmetička sredina±SD /medijan (IQR) 29. 3± 3. 31 29. 3± 3. 05 25. 1± 1. 94 25. 0± 2. 10 5. 5± 1. 19 5. 1± 1. 15 13. 0± 2. 64 12. 3± 3. 50 MD (95% CI)* 0. 08 (-1. 23, 1. 38) 0. 02 (-0. 81, 0. 85) 0. 38 (-0. 09, 0. 86) 0. 68 (-0. 58, 1. 95) 11. 3± 1. 79 11. 4± 2. 74 -0. 13 (-1. 08, 0. 82) 15. 0± 2. 37 15. 2± 4. 62 35. 0± 9. 32 294. 0± 96. 27 5. 9 (2. 7) 2. 7 (0. 6) 7. 8 (4. 3) 7. 8 (1. 4) 14. 8± 3. 20 11. 9± 4. 18 39. 0± 10. 45 284. 4± 78. 08 6. 5 (3. 6) 3. 0 (1. 1) 7 (2. 7) 8. 0 (3. 3) 0. 21 (-0. 94, 1. 37) 3. 13 (1. 34, 4. 93) ǂ -4. 02 (-8. 07, 0. 03) 9. 78 (-26. 20, 45. 77) -0. 7 (-1. 6, 0. 1) Klinički neznačajno -0. 2 (-0. 5, -0. 1) ǂ 0. 4 (-0. 6, 1. 5) -0. 4 (-1. 4, 0. 2)

Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim

Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim prikazom (histogram)

Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim

Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim prikazom (histogram)

Grafički prikaz razdiobe brojčanih podataka - histogram o Ispitanici su podijeljeni prema veličini tumora

Grafički prikaz razdiobe brojčanih podataka - histogram o Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala 0 -1, 1 -2, … 8 -9 cm o Pobrojeno je koliko ispitanika ima u pojedinoj kategoriji o Broj ispitanika po kategoriji je prikazan grafički.

Histogram – Razdioba veličine tumora u 13 bolesnika Srednja vrijednost veličine tumora u ovoj

Histogram – Razdioba veličine tumora u 13 bolesnika Srednja vrijednost veličine tumora u ovoj skupini je 3 -4 cm (3 bolesnika) o Veličina tumora je raspršena – od >0 do 9 cm o Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika) o Računanjem iz aritmetičke sredine i SD 3. 77 -2. 25=1. 52 3. 77+2. 25=6. 02 o

Oblik histograma Krivulja normalne (Gaussove) razdiobe

Oblik histograma Krivulja normalne (Gaussove) razdiobe

Oblik histograma

Oblik histograma

Laž s prosječnom plaćom

Laž s prosječnom plaćom

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Opis kvalitativnih (nominalnih, ordinalnih) podataka o Kvalitativne varijable – vrijednost tih varijabli je kategorija:

Opis kvalitativnih (nominalnih, ordinalnih) podataka o Kvalitativne varijable – vrijednost tih varijabli je kategorija: n Spol (muško/žensko) n Stupanj tumora (mali/ srednji/ veliki) n Stupanj opeklina (1/ III) o Kvalitativne varijable pobrojavamo!

Opis kvalitativnih podataka Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka Što

Opis kvalitativnih podataka Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka Što možete reći o razdiobi spola u vašem ispitivanju? SPOL muško žensko žensko žensko muško EEG nalaz patološki uredan uredan patološki uredan apsolutna učestalost Nžena=12 Nmuškaraca=5 Je li vaše istraživanje dobro izbalansirano s obzirom na spol? relativna učestalost Postotak žena=12*100/17=71% Postotak mušk=5*100/17=29%

Zapamti! o Apsolutna učestalost ili apsolutna frekvencija n 3 bolesnika u uzorku od 10

Zapamti! o Apsolutna učestalost ili apsolutna frekvencija n 3 bolesnika u uzorku od 10 o Relativna učestalost ili relativna frekvencija n 3/10=30% bolesnika o Postotak 30% = Proporcija 0. 3

Dvije varijable? o Povezanost varijabli

Dvije varijable? o Povezanost varijabli

Opis kvalitativnih podataka - 2 varijable Tablica frekvencija (2 X 2) EKG nalaza prema

Opis kvalitativnih podataka - 2 varijable Tablica frekvencija (2 X 2) EKG nalaza prema spolu ispitanika SPOL EEG nalaz patološki uredan Ukupno muško 4 1 5 žensko 1 11 12 Ukupno 5 12 17 Tablice frekvencija (ili tablice kontigencija) s više varijabli služe: 1. prikazu odnosa između odabranih varijabli (SPOL i EKG nalaz) ili 2. kao podloga za primjenu statističkog testa koji ispituje postoji li povezanost između tih varijabli.

Opis kvalitativnih podataka - 2 varijable Tablica 1. Broj (%) ispitanika prema EKG nalazu

Opis kvalitativnih podataka - 2 varijable Tablica 1. Broj (%) ispitanika prema EKG nalazu u odnosu na spol Patološki (n=5) Uredan (n=12) Ukupno (n=17) muškarci 4 (80) 1 (8) 5 žene 1 (20) 11 (92) 12 Spol 100% 90% 80% 70% 60% 50% muškarci 40% žene 30% 20% 10% 0% patološki uredan Slika 1. Razdioba ispitanika prema EKG nalazu u odnosu na spol

Opis kvalitativnih podataka – 2 varijable Chart Title uredan muškarci žene Slika. Razdioba ispitanika

Opis kvalitativnih podataka – 2 varijable Chart Title uredan muškarci žene Slika. Razdioba ispitanika prema EKG nalazu u odnosu na spol

Opis kvantitativnih (brojčanih) podataka za 2 varijable? o npr. interesira nas povezanost duljine bubrega

Opis kvantitativnih (brojčanih) podataka za 2 varijable? o npr. interesira nas povezanost duljine bubrega s porastom životne dobi djece o Za svako dijete imamo podatke za dvije varijable (obilježja) n Dob djeteta [dani] n Duljina bubrega [mm]

TOČKASTI GRAF Duljina bubrega [mmi] Starost djeteta [dani] Na x osi je dob (dani)-

TOČKASTI GRAF Duljina bubrega [mmi] Starost djeteta [dani] Na x osi je dob (dani)- NEOVISNA VARIJABLA, a na y je duljina bubrega (mm)-OVISNA VARIJABLA.

Hvala na pozornosti! Pitanja?

Hvala na pozornosti! Pitanja?