Darko Milunovi mr asistent darko milunovicef unibl org
Darko Milunović, mr, asistent darko. milunovic@ef. unibl. org STATISTIKA HI KVADRAT TEST
U ovom poglavlju naučićemo. . . Ø Kada se koristi ovaj metod Ø Test jednakosti (razlike) proporcija više uzoraka Ø Testiranje prilagođenosti Ø Analiza tebele kontingencije (kategorijalne varijable) Ø Shvatiti ograničenja i uslove primjene 2
Test jednakosti proporcija više uzoraka Zadatak br. 1 Iz 5 paketa proizvoda "R" slučajno je izabran po jedan uzorak i ustanovljen broj neispravnih proizvoda. Uz rizik greške 0. 05, ustanoviti da li je značajna razlika u učešću neispravnih proizvoda u ovih 5 isporuka. Uzorak Veličina Broj neispravnih I II IV V 110 126 147 131 120 19 21 20 16 14 3
U ovom slučaju, teorijske frekvencije se dobiju tako što se izračuna zajednička proporcija neispravnih proizvoda: (zbog različite veličine uzoraka) i primijeni na svaki od uzoraka, tako da je: n 110 126 147 131 120 634 fi 19 21 20 16 14 90 fi* 15. 7 17. 9 20. 0 19. 3 17. 1 90. 0 4 (fi - fi*)2/fi* 0. 69363 0. 53687 0. 00000 0. 56425 2. 35674
Tablična vrijednost određuje se iz Tablice 4 hi kvadrat rasporeda, uz rizik greške 0. 05 (koji je naveden u zadatku. . . ) i broj stepeni slobode: v = r – m – 1 = 9. 488 ZAKLJUČAK: S obzirom da je tablična vrijednost veća od izračunate, nema razloga da odbacimo nultu hipotezu, pa zaključujemo da se učešće neispravnih proizvoda u ovih 5 isporuka značajno ne razlikuje.
Zadatak br. 1 Test prilagođenosti U narednoj tabeli dat je prikaz broja poziva publike koja glasa za svoje favorite (po danima), u reality show-u “Big. Brother”. Ispitati uz 5% rizika postoji li razlika po danima (da li je raspodjela uniformna)? Dan Broj Ponedeljak Utorak Srijeda Četvrtak Petak Subota Nedelja 290 250 238 257 265 230 192 UKUPNO 1722 6
H 0: Distribucija poziva ima uniformnu raspodjelu H 1: Distribucija poziva nema uniformnu raspodjelu Gdje je: K = broj parova podataka (kategorija) Oi = empirijske ili opažene frekvencije za kategoriju i Ei = očekivane ili teorijske frekvencije za kategoriju i 7
Empirijske frekvencije Teorijske frekvencije Ponedeljak Utorak Srijeda Četvrtak Petak Subota Nedelja 290 250 238 257 265 230 192 246 246 UKUPNO 1722 Dan 8
Odbacujemo H 0 ako: Tablična vrijednost se određuje na osnovu rizika i k – 1 stepeni slobode. . . Statistika testa : Prihvata se H 0 Odbacuje se H 0 2. 05 = 12. 5916 9
Analiza tabela kontingencije Ispitujemo da li između 2 obilježja jednog skupa postoji veza i da li je ta veza statistički značajna. Posmatrana obilježja su mjerena na nominalnoj skali. Obilježje B Obilježje A 1 2 . . . C UKUPNO 1 2. . . r UKUPNO O 11 O 21. . . Or 1 C 1 O 12 O 22. . . Or 2 C 2 … … … … O 1 c O 2 c. . . Orc Cc R 1 R 2. . . Rr n 10
Analiza tabela kontingencije Hipoteze su: H 0: obilježja su nezavisna H 1 : obilježja su zavisna 11
Analiza tabela kontingencije Zadatak br. 1 U uzorku od 300 studenata želimo da provjerimo (uz rizik od 5%) da li postoji statistička zavisnost između naredna 2 obilježja (pol i glavna ruka): Glavna ruka 120 žena, 108 piše desnom rukom 180 muškaraca, 24 su ljevaci. . . Pol Lijeva Desna Ženski 12 108 120 Muški 24 156 180 36 264 300 12
H 0: dva obilježja su međusobno nezavisna, tj. da li je student(ica) ljevak ili dešnjak ne zavisi od pola. H 1: dva obilježja su zavisna. Da bi H 0 bila istinita udio žena koje pišu desnom rukom (npr) mora biti gotovo isti kao udio desnorukih momaka. . . Očekivane frekvencije dobijemo na sljedeći način: pa je prva npr: 13
Empirijske i teorijske frekvencije: Glavna ruka Pol Lijeva Desna Ženski Empirijski = 12 Teorijski = 14. 4 Empirijski = 108 Teorijski = 105. 6 120 Muški Empirijski = 24 Teorijski = 21. 6 Empirijski = 156 Teorijski = 158. 4 180 36 264 300 14
Pravilo odlučivanja: Ako je 2 > 3. 841, odbacujemo H 0 i obrnuto. . . = 0. 05 2 2. 05 = 3. 841 Prihvata se H 0 Odbacuje se H 0 15 Kako je 2 = 0. 6848 < 3. 841, mi ne odbacujemo H 0 zaključujemo da pol i glavna ruka nisu zavisna obilježja.
Zadaci za vježbanje 1. Prema prinosu pšenice, 200 parcela veličine 1 ha na jednom području bilo je raspoređeno kao što je dato u sljedećoj tabeli: Prinos pšenice Broj parcela Do. 5 3. 5 -4. 5 -5. 5 -6. 5 -7. 5 i više 4 17 76 59 40 4 Ispitati da li dati empirijski raspored značajno odstupa od normalnog rasporeda. Odgovoriti uz rizik greške = 0. 01. 16
Zadaci za vježbanje 2. Sa dva preparata djelovano je na uzorke od po 100 insekata i ustanovljen broj uginulih nakon 10 sekundi djelovanja u laboratorijskim uslovima. Dobijeni su sljedeći rezultati: Broj insekata Uginuli Nisu uginuli Ukupno Insekticid А 73 27 100 B 62 38 100 Ispitati da li su insekticidi podjednako efikasni na ovu vrstu insekata. Odgovor dati uz rizik greške = 0. 17 Ukupno 135 65 200
Hvala na pažnji! 18
- Slides: 18