Univerzitet u Beogradu Filozofski fakultet STATISTIKA U PSIHOLOGIJI

Univerzitet u Beogradu Filozofski fakultet STATISTIKA U PSIHOLOGIJI 1 STATISTIKA U ISTRAŽIVANJU OBRAZOVANJA STATISTIČKO ZAKLJUČIVANJE – TESTIRANJE STATISTIČKIH HIPOTEZA Oliver Tošković

Parametri i statistici • Parametar - statistička mera numeričke karakteristike populacije • Statistik - statistička mera numeričke karakteristike uzorka

AGRESIVNOST ZNAČAJNOST RAZLIKA M 1 -M 2 > 0 M 2 Da li su muškarci agresivniji? muški ženski POL

M 1 -M 2 > 0 IP (M 2) IP (M 1) AGRESIVNOST ZNAČAJNOST RAZLIKA Da li je razlika proseka veća od greške merenja? muški ženski POL

Statističke hipoteze Statističke i istraživačke hipoteze: • formalno iskazane pretpostavke o vrednosti određenih parametara populacije; • sadrže određene formalno iskazane tvrdnje o pravom stanju u populaciji. • Statističke hipoteze nisu isto što i istraživačke hipoteze mada su sa njima povezane! • Statističke hipoteze su iskazane formalnom statističkom terminologijom, • a istraživačke u terminima određene naučne discipline.

Statističke hipoteze Nulta hipoteza (H 0): uobičajeno pretpostavlja da je prava razlika među grupama u populaciji jednaka nuli ili da je povezanost među varijablama u populaciji jednaka nuli. Alternativna hipoteza (HA) : sadrži pretpostavku koja je komplementarna nultoj hipotezi i uzajamno isključiva sa nultom hipotezom. Primer nulte i alternativne hipoteze: H 0: µ 1 - µ 2 = 0 H A: µ 1 - µ 2 0 (µ 1 - µ 2 je razlika aritmetičkih sredina u populaciji)

Tri osnovna pristupa testiranju statističkih hipoteza (TSH) Tri osnovna pristupa TSH: 1. Fišerovski (TSH isključivo kao testiranje nulte hipoteze) 2. Nojman-Pirsonovski (TSH kao odlučivanje između nulte i alternativne statističke hipoteze) bavi se greškama u odlučivanju zavisno od toga da li je tačna nulta ili alternativna hipoteza, u skladu sa verovatnoćama grešaka definiše region za odbacivanje nulte hipoteze 3. Bejzovski - Bajesova teorema (TSH kao određivanje posteriorne verovatnoće statističke hipoteze na osnovu apriorne verovatnoće statističke hipoteze i informacija sadržanih u podacima) • Sva tri pristupa su tokom nastanka definisana kao uzajamno nepomirljiva; u psihologiji se najčešće koristi “hibrid” Fišerovskog i Nojman-Pirsonovskog pristupa.

Glavni tvorci teorije testiranja statističkih hipoteza: (prva polovina 20. veka) Ronald Fišer Egon Pirson Jerži Nojman Harold Džefri Fišer zasniva Fišerovski, Nojman i Pirson Nojman-Pirsonovski, a Harold Džefri zasniva Bejzovski (Bajesovski) pristup statist. testiranju hipoteza

Osnovni koraci u testiranju statističkih hipoteza 1. Formulisanje nulte i alternativne hipoteze (na osnovu istraživačkog problema i istraživačke hipoteze). Nulta hipoteza (H 0) uobičajeno sadrži tvrdnju formulisanu formalnim statističkim jezikom koja je suprotna istraživačkoj hipotezi. Alternativna hipoteza (HA) sadrži tvrdnju formulisanu formalnim statističkim jezikom koja je komplementarna tvrdnji sadržanoj u nultoj hipotezi i koja je u osnovi u skladu sa istraživačkom hipotezom. Primer: Istraživačka pretpostavka: između muškaraca i žena postoji razlika u prosečnoj agresivnosti (u populaciji). H 0 : µ 1 - µ 2 = 0 HA : µ 1 - µ 2 0 (µ 1 - µ 2 je razlika aritmetičkih sredina u populaciji)

Osnovni koraci u testiranju statističkih hipoteza 2. Prikupljanje podataka na slučajnom uzorku. 3. Odabir statističkog postupka, tj. statističkog testa za testiranje nulte hipoteze. Statistički test sadrži statistik za testiranje nulte hipoteze, koji je slučajna varijabla pa možemo odrediti njegovu distribuciju uzorkovanja. Nulta distribucija uzorkovanja statistika za testiranje nulte hipoteze, tj. distribucija uzorkovanja statistika za testiranje nulte hipoteze ako je ona tačna unapred je matematički definisana i predstavlja sastavni deo statističkog testa. • Primer: Za testiranje H 0: = 0 ( je koeficijent povezanosti između dveju varijabli u populaciji) uobičajeno se koristi statistički postupak, tj. statistički test koji se zove t test. Statistik za testiranje nulte hipoteze je statistik t. • Njegova nulta distribucija uzorkovanja je Studentova T funkcija gustine sa n – 2 stepeni slobode kao parametrom pri čemu je n veličina uzorka.

Osnovni koraci u testiranju statističkih hipoteza 4. Određivanje verovatnoće da, ako je nulta hipoteza tačna, statistik za testiranje nulte hipoteze uzme vrednost jednaku onoj koja je dobijena na slučajnom uzorku ili vrednosti veće od one koja je dobijena na slučajnom uzorku. Odnosno određivanje sledeće uslovne verovatnoće: P(ltl tdobijeno|H 0 tačna) = p (p je, dakle, verovatnoća da statistik bez obzira na njegov predznak uzme vrednost jednaku ili veću od vrednosti dobijene na uzorku ako je nulta hipoteza tačna) 5. Odbacivanje ili neodbacivanje nulte hipoteze: nultu hipotezu odbacujemo ako je p iz prethodnog koraka jako mala verovatnoća (obično jednaka 0. 05 ili manja od toga) • Ova verovatnoća se dobija na osnovu nulte distribucije uzorkovanja statistika koji služi za testiranje nulte hipoteze

Distribucija uzorkovanja Empirijske distribucije M 9 SD? M 7 M 3 M 4 M 5 M 1 M M 8 M 2 M 6

Distribucija uzorkovanja • Aritmetička sredina distribucije uzorkovanja nekog statistika – vrednost parametra • Standardna devijacija distribucije uzorkovanja nekog statistika je standardna greška tog statistika • Realno ne postoje podaci za distribuciju uzorkovanja • Standarda greška se procenjuje na osnovu SD empirijske distribucije

Standardna greška ocenitelja Standardna greška nepristrasnog statistika - koliko poverenja možemo imati u dobijenu ocenu parametra: što je standardna greška statistika manja utoliko više poverenja u dobijenu tačkastu ocenu parametra imamo. Primer standardne greške-standardna greška za aritmetičku sredinu, u oznaci M: ( je standardna devijacija populacije, n veličina uzorka) Ocena standardne greške za aritmetičku sredinu, u oznaci SEm: (S je standardna devijacija uzorka, n veličina uzorka)

Intervali poverenja populacija IP greška uzorkovanja M uzorak

Intervali poverenja 99% 95 % -2. 58 -1. 96 0 1. 96 2. 58 Z-skor

M 1 -M 2 > 0 IP (M 2) IP (M 1) AGRESIVNOST Osnovni koraci u statističkom testiranju hipoteza Da li je razlika proseka veća od greške merenja? muški ženski POL

Osnovni koraci u statističkom testiranju hipoteza Primer: Za testiranje H 0: µ 1 - µ 2 = 0 (µ 1 - µ 2 je razlika aritmetičkih sredina u populaciji) dobijena na uzorku od 90 ispitanika statistik t koji je jednak 3. 45. Na osnovu nulte distribucije uzorkovanja (Studentove T funkcije gustine sa 88 stepeni slobode kao parametrom: n-2) dobijamo da je verovatnoća da statistik t bude 3. 45 ili veći od 3. 45 ili jednak -3. 45 ili manji od -3. 45) p=0. 0009. Ova verovatnoća se računa preko integrala na distribuciji uzorkovanja U programu SPSSova verovatnoća se može dobiti komandom Compute korišćenjemfunkcije CDF. T Budući da je 0. 0009 jako mala verovatnoća (manja od 0. 05) odbacujemo nultu hipotezu.

Distribucija uzorkovanja t-testa Ukoliko nema razlika između dve grupe p Neka je u izvedenom istraživanju t=2. 3 • p – verovatnoća da se, ukoliko u populaciji ne postoje razlike između dve grupe, na uzorku dobiju vrednosti za t, jednake ili veće od 2. 3 • Ako je p malo, mala je verovatnoća da nema razlika u populaciji • Koja je verovatnoća dovoljno mala?

Osnovni koraci u testiranju statističkih hipoteza Verovatnoća p, p = P(ltl tdobijeno|H 0 tačna) ne predstavlja verovatnoću da je nulta hipoteza tačna. Verovatnoća p je verovatnoća da statistik za testiranje nulte hipoteze uzme vrednost jednaku ili veću od vrednosti dobijene na uzorku ako je nulta hipoteza tačna. Čak i ako je ova verovatnoća jako mala moguće je da je nulta hipoteza tačna. Verovatnoća P(ltl tdobijeno|H 0 tačna) = p ne predstavlja verovatnoću da je istraživačka hipoteza tačna. Korišćenjem ovog postupka nije moguće odrediti verovatnoću da je nulta hipoteza tačna već samo dovesti u sumnju njenu tačnost.

Osnovni koraci u testiranju statističkih hipoteza Pošto nulta hipoteza uobičajeno predstavlja formulaciju stanja u populaciji koje je suprotno od onoga koje opisuje istraživačka hipoteza - odbacivanjem nulte hipoteze daje se empirijska podrška istraživačkoj hipotezi. Neodbacivanje nulte hipoteze ne znači da je nulta hipoteza tačna, niti da je istraživačka hipoteza pogrešna! Statitičkim testom testiraju se statističke a ne istraživačke hipoteze. Odbacivanje statističke nulte hipoteze nije dokaz tačnosti istraživačke hipoteze. Odbacivanje nulte hipoteze daje istraživaču empirijski argument za opravdanost verovanja u to da je istraživačka hipoteza tačna.

GREŠKE ZAKLJUČIVANJA ODLUKA NA OSNOVU TESTA Statistička značajnost!! Ho odbačeno Ho nije odbačeno PRAVO STANJE U POPULACIJI Ho tačno Ho nije tačno Pogrešna odluka TIP 1 Verovatnoća (α) - p Tačna odluka Snaga statističkog testa Tačna odluka Pogrešna odluka TIP 2 Verovatnoća (β)

Tipovi grešaka u testiranju statističkih hipoteza Prvi tip greške: Odbacivanje tačne nulte hipoteze. Verovatnoća ovog tipa greške zavisi od nivoa značajnosti (tj. verovatnoće koja je odabrana pre istraživanja za odbacivanje nulte hipoteze). Drugi tip greške: Neodbacivanje pogrešne nulte hipoteze. Snaga statističkog testa: Verovatnoća da ćemo korišćenjem datog statističkog testa odbaciti nultu hipotezu kada je ona pogrešna Najčešće se koriste sledeći nivoi značajnosti: = 0. 05, = 0. 01 ili = 0. 001.

STATISTIČKA ZNAČAJNOST • Nivoi značajnosti: koja je veovatnoća mala? 0. 01 (1%) na nivou 0. 01 0. 05 (5%) na nivou 0. 05 odbacuje se Ho razlikuju se grupe ne odbacuje se Ho ne razlikuju se grupe? • Zašto baš 0. 05 i 0. 01? • Zavisi od posledica istraživanja • Koliku greško možemo da dozvolimo svojim rezultatima!

AGRESIVNOST ZNAČAJNOST RAZLIKA M 1 -M 2 > 0 M 2 Da li su muškarci agresivniji? muški ženski POL

M 1 -M 2 > 0 IP (M 2) IP (M 1) AGRESIVNOST ZNAČAJNOST RAZLIKA Da li je razlika proseka veća od greške merenja? muški ženski POL

Primer 1: Testiranje statističke značajnosti razlika aritmetičkih sredina 2 nezavisna uzorka: t-test • Ho: 1 - 2 = 0 ( 1 i 2 su aritmetičke sredine dveju subpopulacija na varijabli X) • Statistik za testiranje Ho, t: (M 1 i M 2 su aritmetičke sredine uzoraka na varijabli X, a SE je ocena standardne greške za razliku aritmetičkih sredina) • Ako je H 0 tačna statistik t ima Studentovu distribuciju uzorkovanja čiji su stepeni slobode n 1+n 2– 2 (n 1 i n 2 su veličine uzoraka). • Ako je verovatnoća da se dobije statistik t jednak onom koji smo dobili veći od onoga koji smo dobili manja od 0. 05 odbacujemo H 0 • zaključujemo da je statistik t statitički značajan, tj. da je razlika aritmetičkih sredina statistički značajna. • Statistik t zavisi od veličine razlike aritmetičkih sredina uzoraka i standardne greške za razliku između aritmetičkih sredina.

Stepeni slobode • Odgovara veličini uzorka • Veći uzorak, veća sloboda računanja i zaključivanja • Broj stepeni slobode - broj nezavisnih opservacija u uzorku, umanjen za broj parametara koji se moraju oceniti na osnovu uzorka • Nepristrasna ocena (N<30)

W. Gosset i njegova (Studentova) T funkcija gustine

Standardizovana normalna i Studentova t funkcija gustine za 4 stepena slobode Aritmetičke sredine obeju funkcija su jednake 0. Varijansa st. normalne je 1, a Studentove (df=4) je 4/(4 -2) = 2.

Primeri 2: Testiranje statističke značajnosti razlika aritmetičkih sredina za 2 zavisna uzorka: t-test pod modelom diferencija • • H 0: d = 0 ( d je aritmetička sredine diferencija parova rezultata na kvantitativnoj varijabli X u populaciji) Statistik za testiranje H 0, t: (Md i Sd su aritmetička sredina i standardna devijacija parova rezultata zavisnih uzoraka na varijabli X, n je broj parova rezultata, a SEMd je ocena standardne greške za aritmetičku sredinu razlika) • • • Ako je H 0 tačna statistik t ima Studentovu distribuciju uzorkovanja čiji parametar (stepeni slobode) je jednak n - 1 (n je broj parova rezultata). Ako je verovatnoća da se dobije statistik t jednak onom koji smo dobili veći od onoga koji smo dobili manja od 0. 05 odbacujemo H 0 i, zaključujemo da je statistik t statitički značajan, tj. da je aritmetička sredina razlika statistički značajno različita od 0. Statistik t zavisi od aritmetičke sredine diferencija i standardne greške za aritmetičku sredinu diferencija.

Primer 3: Testiranje hipoteze da uzorak pripada populaciji sa određenom aritmetičkom sredinom • H 0: = m ( je aritmetička sredina populacije na kvantitativnoj varijabli X, a m je određena vrednost) • Statistik za testiranje H 0, t: (M i S su aritmetička sredina i standardna devijacija uzorka veličine n na varijabli X, a SEM je ocena standardne greške za aritmetičku sredinu) • • • Ako je H 0 tačna statistik t ima Studentovu distribuciju uzorkovanja čiji parametar (stepeni slobode) je jednak n - 1 (n je veličina uzorka). Ako je verovatnoća da se dobije statistik t jednak onom koji smo dobili veći od onoga koji smo dobili manja od 0. 05 odbacujemo H 0 i zaključujemo da je statistik t statitički značajan, tj. da uzorak ne pripada populaciji čija je AS=m. Statistik t zavisi od veličine razlike aritmetičke sredine uzorka i pretpostavljene aritmetičke sredine populacije, kao i od standardne greške za aritmetičku sredinu.

Primer 4: Testiranje normalnosti raspodele varijable u populaciji: Kolmogorov-Smirnov test • H 0: Distribucija varijable X u populaciji je normalna sa parametrima koji odgovaraju ocenama AS i SD koje su dobijene na uzorku: X ~ N( = M, 2 = S 2 ) • Statistik za testiranje Ho, Dmax: Dmax = max{D-, D+} pri čemu je: D+ = maxi {Fe(xi) – F(xi)}, a D- = maxi { F(xi) - Fe(xi)} Fe(xi) je empirijska funkcija distribucije (dobijena na uzorku) F(xi) je funkcija distribucije za normalnu raspodelu • Dmax je, dakle, najveća apsolutna razlika između empirijske funkcije distribucije i funkcije distribucije za normalnu raspodelu. • Statistik Dmax ima veoma komplikovanu nultu distribuciju uzorkovanja. • Ako je uzorak veći od 50 značajnost se određuje Lilieforsovim postupkom a za uzorke manje od 50 Šapiro-Vilkovim postupkom. • Ako je dobijena verovatnoća manja od 0. 05 odbacujemo H 0 i sumnjamo u normalnost raspodele varijable X u populaciji.

STATISTIČKA ZNAČAJNOST • Dozvoljava uopštavanje sa uzorka na populaciju • Na osnovu statistika donosimo zaključke o parametrima • Testiramo različite hipoteze • Značajnost – verovatnoća da ćemo pogrešiti ukoliko odbacimo Ho, tj ukoliko pretpostavimo da neke razlike ili povezanosti postoje u populaciji • Što je manja, sa više sigurnosti možemo da tvrdimo da dobijene razlike postoje u populaciji