Statistika u organskoj poljoprivredi 20082009 1 Cilj predmeta

  • Slides: 61
Download presentation
Statistika u organskoj poljoprivredi 2008/2009 1

Statistika u organskoj poljoprivredi 2008/2009 1

Cilj predmeta Statistika je da student: Ø upozna statističku terminologiju Ø nauči kako se

Cilj predmeta Statistika je da student: Ø upozna statističku terminologiju Ø nauči kako se podaci prikupljaju, organizuju i obrađuju Ø razume jednostavne statističke metode i interpretaciju rezultata Ø primeni statističke testove na primerima iz agronomije 2008/2009 2

Šta je statistika ? Ø nauka koja se bavi v (1) sakupljanjem, organizacijom i

Šta je statistika ? Ø nauka koja se bavi v (1) sakupljanjem, organizacijom i kondenzacijom podataka i v (2) analizom u cilju izvodjenja zaključka o prirodi tih podataka kada se posmatra samo jedan njihov deo Statistika je skup procedura i principa za prikupljanje podataka i analiziranje informacija koje podaci nose, a u cilju donošenje odluke uprkos neizvesnosti koja postoji 2008/2009 3

Zašto učimo statistiku? Ø Ø Ø Čak i elementarno znanje statistike pomaže da se

Zašto učimo statistiku? Ø Ø Ø Čak i elementarno znanje statistike pomaže da se rešavaju problemi u poslu kojim se bavimo, ali i u svakodnevnom životu Poznavanje osnovnih statističkih metoda može da pomogne u boljem obavljanju posla i time napredovanju u karijeri Poznavanje statističke analize može biti korisno i za učenje drugih predmeta 2008/2009 4

Statističke metode Deskriptivna statistika 2008/2009 Inferencijalna statistika 5

Statističke metode Deskriptivna statistika 2008/2009 Inferencijalna statistika 5

Deskriptivna statistika Ø Obuhvata procedure za: v sakupljanje podataka v uređivanje podataka v tabelarno

Deskriptivna statistika Ø Obuhvata procedure za: v sakupljanje podataka v uređivanje podataka v tabelarno predstavljanje podataka v grafičko predstavljanje podataka v numeričku karakterizaciju podataka Ø Svrha: v opisivanje podataka 2008/2009 6

Inferencijalna statistika Ø Obuhvata metode za: v ocenjivanje nepoznatih veličina v testiranje hipoteza Ø

Inferencijalna statistika Ø Obuhvata metode za: v ocenjivanje nepoznatih veličina v testiranje hipoteza Ø Svrha: v izvođenje zaključka o većoj grupi na osnovu podataka dobijenih iz pripadajuće manje grupe 2008/2009 7

Statistička terminologija Ø Populacija Ø Uzorak Ø Promenljive veličine (varijable) Ø Podaci Statistički izrazi

Statistička terminologija Ø Populacija Ø Uzorak Ø Promenljive veličine (varijable) Ø Podaci Statistički izrazi imaju značenje koje može da se razlikuje od svakodnevnog korišćenja 2008/2009 8

Populacija Ø Sve vrednosti, ljudi ili stvari koje nas interesuju iz određenih razloga, odnosno

Populacija Ø Sve vrednosti, ljudi ili stvari koje nas interesuju iz određenih razloga, odnosno za određene studije Ø Definisanje populacije tek kada je poznata svrha sakupljanja podataka 2008/2009 9

Populacija pola Populacija godina starosti 2008/2009 Populacija nivoa obrazovanja 10

Populacija pola Populacija godina starosti 2008/2009 Populacija nivoa obrazovanja 10

Uzorak Ø Uzorak je deo populacije 2008/2009 11

Uzorak Ø Uzorak je deo populacije 2008/2009 11

Odabir uzoraka Bez verovatnoće Prema slobodnoj proceni Prema svrsi istraživanja Sa verovatnoćom (slučajni) Prost

Odabir uzoraka Bez verovatnoće Prema slobodnoj proceni Prema svrsi istraživanja Sa verovatnoćom (slučajni) Prost Sistematski Stratificirani Klaster (Cluster) 2008/2009 12

Prost slučajni uzorak Ø Uzorak čiji svaki član ima istu verovatnoću ili šansu da

Prost slučajni uzorak Ø Uzorak čiji svaki član ima istu verovatnoću ili šansu da bude izabran iz populacije Ø Izbor jednog objekta ne utiče na izbor ostalih Ø Izbor članova uzorka može biti sa ponavljanjem ili bez ponavljanja 2008/2009 13

Sistematski uzorak Ø Odredi se veličina uzorka: n Ø Populacija od N osoba podeli

Sistematski uzorak Ø Odredi se veličina uzorka: n Ø Populacija od N osoba podeli se u grupe od po k osoba k = N/n Ø Slučajnim izborom se izabere jedna osoba u prvoj grupi Ø Dalje se izabira svaka k-ta osoba Primer: N = 64, n = 8, k = 64/8 = 8 2008/2009 14

Stratificirani uzorak Ø Populacija se podeli u dve ili više grupa prema nekoj zajedničkoj

Stratificirani uzorak Ø Populacija se podeli u dve ili više grupa prema nekoj zajedničkoj osobini Ø Iz svake grupe se slučajnim izborom formira uzorak Ø Formirani uzorci se spoje u jedan 2008/2009 15

Klaster uzorak Ø Populacija se podeli u više grupa - “klastera”, svaki ima karakteristike

Klaster uzorak Ø Populacija se podeli u više grupa - “klastera”, svaki ima karakteristike populacije Ø Od ukupnog brojha klastera odabere se nekoliko Ø U odabranim klasterima se analizira svaka jedinka ili se iz svakog klastera izabere slučajni uzorak Ø Izabrani klasteri, odnosno uzorci iz klastera, kombinuju u jedan uzorak 2008/2009 16

Klaster uzorak klaster uzorak Kompanije (klasteri) klaster 1 klaster 2 klaster uzorak kombinovan sa

Klaster uzorak klaster uzorak Kompanije (klasteri) klaster 1 klaster 2 klaster uzorak kombinovan sa prostim slučajnim uzorkom 2008/2009 17

Greška zbog korišćenja uzorka populacija 2008/2009 dostupan deo populacije nalazi se u telefonskom imeniku

Greška zbog korišćenja uzorka populacija 2008/2009 dostupan deo populacije nalazi se u telefonskom imeniku odabran uzorak stvarni uzorak (odgovorili na anketu) 18

Prednosti i nedostaci Ø Prost slučajni uzorak i sistematski uzorak v Jednostavni za odabir

Prednosti i nedostaci Ø Prost slučajni uzorak i sistematski uzorak v Jednostavni za odabir v Ne predstavljaju uvek karakteristike populacije Ø Stratificirani uzorak v Obezbeđuje izbor članova kroz celu populaciju Ø Klaster uzorak v Skup v Zahteva veliki uzorak da bi se postigao isti nivo preciznosti 2008/2009 19

Promenljiva veličina (varijabla) Ø Promenljiva veličina je entitet koji može imati različite vrednosti (Sve

Promenljiva veličina (varijabla) Ø Promenljiva veličina je entitet koji može imati različite vrednosti (Sve ono što se menja može biti varijabla) Ø Promenljive nisu obavezno kvantitativne veličine Ø Promenljive mogu imati specifične atribute Ø Promenljive mogu biti zavisne i nezavisne Ø Statistički eksperiment - sakupljanje informacija 2008/2009 20

Podaci Ø Podaci su informacije kojima se izražavaju vrednosti promenljivih i koje statističari sakupljaju,

Podaci Ø Podaci su informacije kojima se izražavaju vrednosti promenljivih i koje statističari sakupljaju, obrađuju i analiziraju Podaci Kvantitativni (numerički) Diskretni 2008/2009 Kvalitativni (kategorički) Kontinuirani 21

Kako se podaci mere ? Ø Četiri nivoa (skale) merenja: 1. Nominalna skala 2.

Kako se podaci mere ? Ø Četiri nivoa (skale) merenja: 1. Nominalna skala 2. Ordinalna skala 3. Intervalna skala 4. Skala odnosa 2008/2009 22

Kategorički podaci Ø Objekti koji se proučavaju grupisani su u kategorije bazirane na nekoj

Kategorički podaci Ø Objekti koji se proučavaju grupisani su u kategorije bazirane na nekoj kvalitativnoj osobini Ø Primer: Boja kose Ø v plava, smeđa, crvena, crna itd. Ø Mišljenje studenata o nekom događaju v nezadovoljni, neutralni, zadovoljni Ø Status pušenja v pušač, nepušač 2008/2009 23

Kategorički podaci Nominalni Binarni 2008/2009 Ne-binarni Ordinalni Binarni Ne-binarni 24

Kategorički podaci Nominalni Binarni 2008/2009 Ne-binarni Ordinalni Binarni Ne-binarni 24

Nominalna skala Ø Ø Vrsta kategoričkih podataka koji se svrstavaju u neuređene kategorije Primer:

Nominalna skala Ø Ø Vrsta kategoričkih podataka koji se svrstavaju u neuređene kategorije Primer: v Boja kose: smeđa, plava, crna itd. v Rasa: bela, crna, žuta itd. v Pol: muški, ženski v Status pušenja: pušači, nepušači Ø Nijedna kategorija nema prioritet! 2008/2009 25

Ordinalna skala Ø Vrsta kategoričkih podataka koji su klasifikovani po određenom redosledu, pri čemu

Ordinalna skala Ø Vrsta kategoričkih podataka koji su klasifikovani po određenom redosledu, pri čemu rastojanje između kategorija nema tačno određeno značenje a. rating skala b. ranking skala 2008/2009 26

Ordinalna skala Ø Rating skala v težina bolesti: blaga, umerena, teška, vrlo teška v

Ordinalna skala Ø Rating skala v težina bolesti: blaga, umerena, teška, vrlo teška v mišljenje o kvalitetu hrane u restoranu: odlična, Ø Ø osrednja, loša v ocena kvaliteta nastave: na skali od 1 do 5 Rangiranje je izvršeno na osnovu subjektivnog doživljaja ispitanika Ranking skala v redosled sportista na takmičenju v redosled kandidata na prijemnom ispitu Ø Rangiranje je izvršeno na osnovu značaja, važnosti, interesovanja. . . 2008/2009 27

Binarni podaci Ø Ø Ø Vrsta kategoričkih podataka kod kojih postoje samo dve kategorije

Binarni podaci Ø Ø Ø Vrsta kategoričkih podataka kod kojih postoje samo dve kategorije Binarni podaci se izražavaju nominalnom ili ordinalnom skalom Primer: v Status pušenja: pušač, nepušač v Prisustvo na času: prisutan, odsutan v Rezultata ispita: položio, nije položio 2008/2009 28

Kvantitativni podaci Ø Kvantitativni podaci su rezultat “merenja” neke kvantitativne osobine objekata koji se

Kvantitativni podaci Ø Kvantitativni podaci su rezultat “merenja” neke kvantitativne osobine objekata koji se proučavaju Kvantitativni podaci Diskretni 2008/2009 Kontinuirani 29

Kvantitativni podaci Ø Ø Ø Diskretni podaci – moguće su samo neke vrednosti između

Kvantitativni podaci Ø Ø Ø Diskretni podaci – moguće su samo neke vrednosti između koji postoji određeno rastojanje Diskretni podaci se dobijaju prebrojavanjem Primer: v broj studenata na času v broj dece u porodici 0 2008/2009 1 2 3 4 5 6 7 30

Kvantitativni podaci Ø Kontinuirani podaci – moguće su sve vrednosti unutar nekog intervala i

Kvantitativni podaci Ø Kontinuirani podaci – moguće su sve vrednosti unutar nekog intervala i nema razmaka između vrednosti Kontinuirani podaci se dobijaju merenjem Ø Primer: Ø v visina, težina, sadržaj aktivne supstance u leku, koncentracija glukoze u krvi 0 2008/2009 1000 31

Kvantitativni podaci Ø Intervalna skala v Podaci su uređeni u kategorije po određenom redosledu

Kvantitativni podaci Ø Intervalna skala v Podaci su uređeni u kategorije po određenom redosledu v Rastojanje između kategorija ima određeno značenje Ø Početak skale (nula) i merne jedinice su proizvoljno određene Ø Primer: v temperatura, kalendar, sati, rezultati psiholoških testova 2008/2009 32

Kvantitativni podaci Ø Skala odnosa v Podaci su uređeni u kategorije po određenom redosledu

Kvantitativni podaci Ø Skala odnosa v Podaci su uređeni u kategorije po određenom redosledu v Rastojanje između kategorija ima određeno značenje Ø Uvek postoji apsolutna nula sa određenim značenjem Ø Primer: v visina, težina, broj pacijenata, fiziološka merenja 2008/2009 33

Uređivanje i prikazivanje podataka 2008/2009 34

Uređivanje i prikazivanje podataka 2008/2009 34

Uređivanje i prikazivanje podataka Ø Podaci u “sirovom” obliku nisu pogodni za analiziranje i

Uređivanje i prikazivanje podataka Ø Podaci u “sirovom” obliku nisu pogodni za analiziranje i donošenje odluke Ø Potrebno organizovanje podataka v uređivanje u tabele v grafičko prikazivanje 2008/2009 35

Podaci Numerički (kvantitativni) Diskretni 2008/2009 Kategorički (kvalitativni) Kontinuirani 36

Podaci Numerički (kvantitativni) Diskretni 2008/2009 Kategorički (kvalitativni) Kontinuirani 36

Uređivanje podataka Numerički podaci Uredjivanje po veličini Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih

Uređivanje podataka Numerički podaci Uredjivanje po veličini Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih frekvenci 2008/2009 37

Uređivanje numeričkih podataka Ø Razvrstavanje u klase, intervale, kategorije, grupe - klasne intervale Ø

Uređivanje numeričkih podataka Ø Razvrstavanje u klase, intervale, kategorije, grupe - klasne intervale Ø Broj klasnih intervala: N ili 1 + 3, 22 log. N Ø Širina klasnog intervala Ø Broj podataka u intervalu - frekvenca, f Ø Raspodela frekvenci 2008/2009 38

Sirovi podaci Ø PRIMER 1. Kod 120 osoba određen je bilirubin (vrednosti su date

Sirovi podaci Ø PRIMER 1. Kod 120 osoba određen je bilirubin (vrednosti su date u μmol/l). Dobijene vrednosti grupisati u klasne intervale. 2008/2009 39

Klasni intervali Sirovi podaci: 4, 1 … 22, 5 , N = 120 Broj

Klasni intervali Sirovi podaci: 4, 1 … 22, 5 , N = 120 Broj klasnih intervala: 120 11 Širina klasnog intervala: (22, 5 - 4, 1)/11 = 18, 9/11 = 1, 72 = 2 Granice intervala: 4 -6 6 -8 …. 22 - 24 2008/2009 40

Raspodela frekvenci širina donja granica gornja granica (donja granica+gornja granica)/2 2008/2009 41

Raspodela frekvenci širina donja granica gornja granica (donja granica+gornja granica)/2 2008/2009 41

Raspodela frekvenci Ki=2 μmol/L f fr fr (%) fk fkr (%) 4, 0 -

Raspodela frekvenci Ki=2 μmol/L f fr fr (%) fk fkr (%) 4, 0 - 5, 9 3 0, 025 2, 5 6, 0 - 7, 9 4 0, 033 3, 3 7 0, 058 5, 8 8, 0 - 9, 9 9 0, 075 7, 5 16 0, 133 13, 3 10, 0 - 11, 9 13 0, 108 10, 8 29 0, 241 24, 1 12, 0 - 13, 9 22 0, 183 18, 3 51 0, 424 42, 4 14, 0 - 15, 9 26 0, 217 21, 7 77 0, 641 64, 1 16, 0 - 17, 9 18 0, 150 15, 0 95 0, 791 79, 1 18, 0 - 19, 9 12 0, 100 10, 0 107 0, 891 89, 1 20, 0 - 21, 9 8 0, 067 6, 7 115 0, 958 95, 8 22, 0 - 23, 9 5 0, 042 4, 3 120 1, 000 100, 0 ukupno 120 1, 000 100, 0 - - - 2008/2009 42

Prikazivanje numeričkih podataka Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih frekvenci 2008/2009 43

Prikazivanje numeričkih podataka Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih frekvenci 2008/2009 43

Histogram 4 2008/2009 6 8 10 12 14 16 18 bilirubin, μmol/L 20 22

Histogram 4 2008/2009 6 8 10 12 14 16 18 bilirubin, μmol/L 20 22 24 44

Poligon frekvenci 2008/2009 45

Poligon frekvenci 2008/2009 45

v Broj osoba Poređenje više grupa podataka v 7 0 v 6 0 v

v Broj osoba Poređenje više grupa podataka v 7 0 v 6 0 v 5 0 v 4 0 KV v v 3 0 v 2 0 v 1 0 KG 0 v v 1 , 5 v 2008/2009 2 v Log PO-aze v v 2 , 5 v 3 , 5 v 4 Log DZO-aze Aktivnost enzima PON 1 v 4 , 5 v 5 46

Poligon kumuliranih frekvenci 2008/2009 47

Poligon kumuliranih frekvenci 2008/2009 47

Podaci Numerički (kvantitativni) Diskretni 2008/2009 Kategorički (kvalitativni) Kontinuirani 48

Podaci Numerički (kvantitativni) Diskretni 2008/2009 Kategorički (kvalitativni) Kontinuirani 48

Uređivanje kategoričkih podataka Kategorički podaci 1 promenljiva Sumarna tabela 2008/2009 2 promenljive Tablica kontingencije

Uređivanje kategoričkih podataka Kategorički podaci 1 promenljiva Sumarna tabela 2008/2009 2 promenljive Tablica kontingencije 49

Sumarna tabela l l Spisak kategorija Broj elemenata u kategoriji (frekvenca) kategorija 2008/2009 studenti

Sumarna tabela l l Spisak kategorija Broj elemenata u kategoriji (frekvenca) kategorija 2008/2009 studenti f frel (%) I godina 505 25, 4 II godina 430 21, 7 III godina 410 20, 7 IV godina 380 19, 1 V godina 260 13, 1 ukupno 1985 100 apsolutna frekvenca relativna frekvenca 50

Prikazivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Štapičasti dijagram 2008/2009

Prikazivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Štapičasti dijagram 2008/2009 Kružni dijagram Tablica kontingencije Pareto dijagram 51

Štapičasti dijagram 2008/2009 52

Štapičasti dijagram 2008/2009 52

Kružni dijagram 3600 x 20, 7/100 = 74, 50 2008/2009 53

Kružni dijagram 3600 x 20, 7/100 = 74, 50 2008/2009 53

Pareto dijagram Kumulativni poligon % Obavezno ! 2008/2009 Štapičasti dijagram 54

Pareto dijagram Kumulativni poligon % Obavezno ! 2008/2009 Štapičasti dijagram 54

Uredjivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Štapičasti dijagram 2008/2009

Uredjivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Štapičasti dijagram 2008/2009 Kružni dijagram Tablica kontingencije Pareto dijagram 55

Tablica kontingencije studenti 2008/2009 pol ukupno ženski muški I godina 305 200 505 II

Tablica kontingencije studenti 2008/2009 pol ukupno ženski muški I godina 305 200 505 II godina 230 200 430 III godina 240 170 410 IV godina 250 130 380 V godina 170 90 260 ukupno 1195 790 1985 56

Histogram 2008/2009 57

Histogram 2008/2009 57

Histogram 2008/2009 58

Histogram 2008/2009 58

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (15, 4) 200 (10,

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (15, 4) 200 (10, 1) 505 (25, 4) II godina 230 (11, 6) 200 (10, 1) 430 (21, 7) III godina 240 (12, 1) 170 (8, 6) 410 (20, 7) IV godina 250 (12, 6) 130 (6, 5) 380 (19, 1) V godina 170 (8, 6) 90 (4, 5) 260 (13, 1) ukupno 1195 (60, 2) 790 (39, 8) 1985 (100) f x 100 ukupna suma 2008/2009 170/1985 x 100 = 8, 6% 59

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (25, 5) 200 (25,

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (25, 5) 200 (25, 3) 505 (25, 4) II godina 230 (19, 2) 200 (25, 3) 430 (21, 7) III godina 240 (20, 1) 170 (21, 5) 410 (20, 7) IV godina 250 (20, 9) 130 (16, 5) 380 (19, 1) V godina 170 (14, 2) 90 (11, 4) 260 (13, 1) ukupno 1195 (100) 790 (100) 1985 (100) f x 100 suma u koloni 2008/2009 170/1195 x 100 = 14, 2% 60

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (60, 4) 200 (39,

Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (60, 4) 200 (39, 6) 505 (100) II godina 230 (53, 5) 200 (46, 5) 430 (100) III godina 240 (58, 5) 170 (41, 5) 410 (100) IV godina 250 (65, 8) 130 (34, 2) 380 (100) V godina 170 (65, 4) 90 (34, 6) 260 (100) ukupno 1195 (60, 2) 790 (39, 8) 1985 (100) f x 100 suma u redu 2008/2009 170/260 x 100 = 65, 4% 61