Opis podataka Doc dr sc Ana Jeroni Katedra
- Slides: 43
Opis podataka Doc. dr. sc. Ana Jerončić Katedra za istraživanja u biomedicini i zdravstvu
Opis kvantitativnih (brojčanih) podataka ? o Mjere srednje vrijednosti (centralne tendencije) o Mjere raspršenja
Mjere srednje vrijednosti (centralne tendencije) o Kojoj vrijednosti teže moji podatci?
Mjere raspršenja (varijabilnosti) o Koliko su moji podatci različiti?
Mjere srednje vrijednosti (centralne tendencije) o Aritmetička sredina (prosječna vrijednost) o Medijan o Mod
Aritmetička sredina, o Koristi se isključivo za kvantitativne (brojčane) podatke - intervalne i omjerne varijable o Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja. Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj 3+4+2+3+4= 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost) = 15/ 5 = 3 kg
Medijan, Md 1. Koristi se uvijek za ordinalne podatke, te 2. za brojčane podatke kada su “asimetrično raspodijeljeni” Aritmetička sredina
Medijan, Md o Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan o Dijeli donjih 50% podataka od gornjih 50%. Primjer: Broj prethodnih trudnoća je 3, 6, 2, 5, 7. Koliki je medijan? • Poredaj brojeve po veličini: 2, 3, 5, 6, 7 • Srednji broj je 5 • Medijan je 5
Medijan, Md o Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih trudnoća u slijedećih šest ispitanica: 2, 7, 1, 6, 6, 3 • Poredaj brojeve po veličini: 1, 2, 3, 6, 6, 7 • Srednji brojevi su: 3 i 6 • Medijan je
Mod, Mo o Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke o Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku Primjer: Podatci o 2, 2, 2, 4, 5, 6, 7, 7, 8 o 7 je broj koji se pojavljuje najučestalije (najveći broj puta) o Mod je 7
Mjere srednje vrijednosti na primjeru
Mjere raspršenja (varijabilnosti) o o Raspon Interkvartilni raspon Varijanca Standardna devijacija
Raspon, R o Koristi se kao mjera raspršenja uz medijan ili mod o Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak o Greške pri mjerenju utječu na njega
Raspon, R u literaturi o RAD: Merewood A et al. Vitamin D status among 4 -month-old infants in New England: a prospective cohort study. J Hum Lact. 2012. 28: 159 -66 o CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca, testiranih nakon poroda. o REZULTATI: At 4 months, 11. 9% of the 177 infants were vitamin D deficient compared to 37. 5% at birth (25(OH)D <20 ng/m. L). Median 25(OH)D was 35. 2 ng/m. L (range, 5. 0 -100. 8). …
Interkvartilni raspon – umjesto raspona kada imamo veliki uzorak
podatci za n ispitanika Varijanca, s 2 o Koristi se kao mjera raspršenja uz aritmetičku sredinu s 2 -1 o Prosječno kvadratno odstupanje podataka od aritmetičke sredine o Rijetko se koristi jer se izražava u mjernim jedinicama 2 pa je praktično tumačenje problematično o npr. ovisno o tome što mjerimo: ng 2/m. L 2, g 2/danu 2, …
Standardna devijacija, s (SD) o Standardna devijacija – uvijek uz aritmetičku sredinu! o Korijen iz varijance => Prosječno odstupanje podataka od aritmetičke sredine o Mjerne jedinice iste kao i u aritmetičke sredine: ng/m. L, g/danu
Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici
Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram). 68% novorođenčadi ima težinu od 3624 -464=3160 g do 3624+464=4088 g 95% novorođenčadi ima težinu od 3624 -2*464=2696 g do 3624+2*464=4552 g
Mjere raspršenja vrijednosti na primjeru IQR
Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena T 1 i T 2? o Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy. o “Twelve donors were studied at baseline; eight retested at (mean±SD) 11± 3 days(T 1), 10 at 91± 9 days(T 2), and 10 at 185± 17 days(T 3) after donation. Regeneration rates (m. L liver per kg body weight per day) were 0. 60± 0. 22 from baseline to T 1, 0. 05± 0. 02 from T 1 to T 2, 0. 01± 0. 01 from T 2 to T 3 by CT, 0. 54± 0. 20, 0. 04± 0. 01 and 0. 01± 0. 02 by SPECT. At T 3, liver volume was 84± 7% of baseline by CT and 92± 13% by SPECT. “ 0. 60 ± 0. 22 => 0. 60 -0. 22= 0. 38 0. 60+0. 22= 0. 82 Najveći dio podataka u vremenu T 1 nalazi se u rasponu od 0. 38 do 0. 82 ml jetre/kg tijela po danu Najveći dio podataka u vremenu T 2 nalazi se u rasponu od 0. 03 do 0. 07 ml jetre/kg tijela po danu
Zašto se opisna statistika koristi? 1. Opis uzorka n usporedba s populacijskim parametrima 2. Opis uzorka u ograncima RCT n usporedba s populacijskim parametrima n kvaliteta randomizacije 3. Procjena razdiobe podataka (odabir statističkog testa)
U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?
Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena? Varijable Dob [godine] BMI [kg/m 2] FSH [IU/L] LH [IU/L] Prosječna vrijednost ukupnog V [cm 3] Prosječna vrijednost AFC A [nmol/L] SHBG [nmol/L] Prolactin [µg/L] AMH [ng/ml] T [nmol/L] DHESO 4 [μmol/L] FAI Unilateralna N=49 Bilateralna N=47 Aritmetička sredina±SD /medijan (IQR) 29. 3± 3. 31 29. 3± 3. 05 25. 1± 1. 94 25. 0± 2. 10 5. 5± 1. 19 5. 1± 1. 15 13. 0± 2. 64 12. 3± 3. 50 MD (95% CI)* 0. 08 (-1. 23, 1. 38) 0. 02 (-0. 81, 0. 85) 0. 38 (-0. 09, 0. 86) 0. 68 (-0. 58, 1. 95) 11. 3± 1. 79 11. 4± 2. 74 -0. 13 (-1. 08, 0. 82) 15. 0± 2. 37 15. 2± 4. 62 35. 0± 9. 32 294. 0± 96. 27 5. 9 (2. 7) 2. 7 (0. 6) 7. 8 (4. 3) 7. 8 (1. 4) 14. 8± 3. 20 11. 9± 4. 18 39. 0± 10. 45 284. 4± 78. 08 6. 5 (3. 6) 3. 0 (1. 1) 7 (2. 7) 8. 0 (3. 3) 0. 21 (-0. 94, 1. 37) 3. 13 (1. 34, 4. 93) ǂ -4. 02 (-8. 07, 0. 03) 9. 78 (-26. 20, 45. 77) -0. 7 (-1. 6, 0. 1) Klinički neznačajno -0. 2 (-0. 5, -0. 1) ǂ 0. 4 (-0. 6, 1. 5) -0. 4 (-1. 4, 0. 2)
Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim prikazom (histogram)
Razdioba brojčanih podataka o Opis preko mjera srednje vrijednosti i raspršenja ili o Grafičkim prikazom (histogram)
Grafički prikaz razdiobe brojčanih podataka - histogram o Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala 0 -1, 1 -2, … 8 -9 cm o Pobrojeno je koliko ispitanika ima u pojedinoj kategoriji o Broj ispitanika po kategoriji je prikazan grafički.
Histogram – Razdioba veličine tumora u 13 bolesnika Srednja vrijednost veličine tumora u ovoj skupini je 3 -4 cm (3 bolesnika) o Veličina tumora je raspršena – od >0 do 9 cm o Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika) o Računanjem iz aritmetičke sredine i SD 3. 77 -2. 25=1. 52 3. 77+2. 25=6. 02 o
Oblik histograma Krivulja normalne (Gaussove) razdiobe
Oblik histograma
Laž s prosječnom plaćom
Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici
Opis kvalitativnih (nominalnih, ordinalnih) podataka o Kvalitativne varijable – vrijednost tih varijabli je kategorija: n Spol (muško/žensko) n Stupanj tumora (mali/ srednji/ veliki) n Stupanj opeklina (1/ III) o Kvalitativne varijable pobrojavamo!
Opis kvalitativnih podataka Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka Što možete reći o razdiobi spola u vašem ispitivanju? SPOL muško žensko žensko žensko muško EEG nalaz patološki uredan uredan patološki uredan apsolutna učestalost Nžena=12 Nmuškaraca=5 Je li vaše istraživanje dobro izbalansirano s obzirom na spol? relativna učestalost Postotak žena=12*100/17=71% Postotak mušk=5*100/17=29%
Zapamti! o Apsolutna učestalost ili apsolutna frekvencija n 3 bolesnika u uzorku od 10 o Relativna učestalost ili relativna frekvencija n 3/10=30% bolesnika o Postotak 30% = Proporcija 0. 3
Dvije varijable? o Povezanost varijabli
Opis kvalitativnih podataka - 2 varijable Tablica frekvencija (2 X 2) EKG nalaza prema spolu ispitanika SPOL EEG nalaz patološki uredan Ukupno muško 4 1 5 žensko 1 11 12 Ukupno 5 12 17 Tablice frekvencija (ili tablice kontigencija) s više varijabli služe: 1. prikazu odnosa između odabranih varijabli (SPOL i EKG nalaz) ili 2. kao podloga za primjenu statističkog testa koji ispituje postoji li povezanost između tih varijabli.
Opis kvalitativnih podataka - 2 varijable Tablica 1. Broj (%) ispitanika prema EKG nalazu u odnosu na spol Patološki (n=5) Uredan (n=12) Ukupno (n=17) muškarci 4 (80) 1 (8) 5 žene 1 (20) 11 (92) 12 Spol 100% 90% 80% 70% 60% 50% muškarci 40% žene 30% 20% 10% 0% patološki uredan Slika 1. Razdioba ispitanika prema EKG nalazu u odnosu na spol
Opis kvalitativnih podataka – 2 varijable Chart Title uredan muškarci žene Slika. Razdioba ispitanika prema EKG nalazu u odnosu na spol
Opis kvantitativnih (brojčanih) podataka za 2 varijable? o npr. interesira nas povezanost duljine bubrega s porastom životne dobi djece o Za svako dijete imamo podatke za dvije varijable (obilježja) n Dob djeteta [dani] n Duljina bubrega [mm]
TOČKASTI GRAF Duljina bubrega [mmi] Starost djeteta [dani] Na x osi je dob (dani)- NEOVISNA VARIJABLA, a na y je duljina bubrega (mm)-OVISNA VARIJABLA.
Hvala na pozornosti! Pitanja?
- Escola jeroni de moragas
- Financijsko pravo i financijska znanost
- Mpp katedra
- Uvod u informacione sisteme fon
- Katedra optiky
- Katedra za pravnu informatiku
- Katedra zdrowia kobiety
- Katedra za astronomiju
- Superfiniš
- Katedra za elektroniku
- Turnusi
- Tinea capillitii
- Katedra elektroniki agh
- Katedra didaktiky prif uk
- Katedra didaktiky prif uk
- Katedra dróg kolei i inżynierii ruchu
- Gesta per aes et libram
- Katedra za elektroniku
- Katedra za elektroniku
- Katedra za mehanizaciju
- Biuro spraw studenckich uw
- Katarzyna korzeniowska ump
- Katedra fizyki prz
- Katedra za dermatovenerologiju
- Katedra elektroenergetyki pollub
- Katedra matematiky ujep
- Muzeum katedralne wawel
- Katedra elektroniki agh
- Katedra elektroniki agh
- Katedra za alatne strojeve
- Katedra za rimsko pravo
- Labirynt chartres
- Katedra psychologie ujep
- Katedra za mehanizaciju
- Katedra prawa finansowego umcs
- Katedra za srpski jezik
- Katedra biofizyki cmuj
- Katedra za dermatovenerologiju
- Zakon o mpp
- Katedra za srpsku knjizevnost
- Instytut nauk geologicznych pan
- Pollub katedra informatyki
- Ffzg kineziologija
- Katedra mechatroniki uwm