PSY 117 2017 Statistick analza dat v psychologii

  • Slides: 23
Download presentation
PSY 117 2017 Statistická analýza dat v psychologii Přednáška 3 Transformace skórů a kvantily

PSY 117 2017 Statistická analýza dat v psychologii Přednáška 3 Transformace skórů a kvantily normálního rozložení

Transformace skórů (dat) Pro usnadnění porozumění a možnost dalších analýz často přepočítáváme hodnoty proměnných,

Transformace skórů (dat) Pro usnadnění porozumění a možnost dalších analýz často přepočítáváme hodnoty proměnných, aby měla lepší vlastnosti o Usnadnění interpretace – lineární transformace n např. vynásobení 10 nebo 100 pro odstranění desetinných míst n tvar rozložení zůstává zachován n možnost sjednocení různých proměnných na stejnou škálu, měřítko. . . Standardizace o Změna tvaru rozložení – nelineární transformace n log/exp fce, (od)mocniny, Tukey: „ladder of powers“ n Též „normalizace“ rozložení – normalizované skóry Hendl kap. o EDA. o Změna úrovně měření – pořadová transformace (ranking)

Lineární transformace 1 o Např. počtu psychologů na tisíce n Tvar rozložení zachován n

Lineární transformace 1 o Např. počtu psychologů na tisíce n Tvar rozložení zachován n Popisné statistiky se předpověditelně změní n M, SD, Md, IQR, min, max jsou tisíckrát menší n s 2 (VAR)?

Počet psychologů v tisících 85 Da lší 80 75 70 65 60 55 50

Počet psychologů v tisících 85 Da lší 80 75 70 65 60 55 50 45 20 40 35 30 25 20 15 10 5 Četnost 0 10 0 00 15 0 00 20 0 00 25 0 00 30 0 00 35 0 00 40 0 00 45 0 00 50 0 00 55 0 00 60 0 00 65 0 00 70 0 00 75 0 00 80 0 00 85 0 00 0 Da lší 50 Četnost 20 15 10 5 0 Počet psychologů 15 10 5 0

Lineární transformace 2 o Deviační skóry xi - odečtení průměru n Tvar rozložení zůstává

Lineární transformace 2 o Deviační skóry xi - odečtení průměru n Tvar rozložení zůstává zachován n Popisné statistiky – CT jsou o průměr menší, variabilita beze změn n Snadnější interpretace jednotlivých skórů Četnost 20 15 10 5 lší 8 Da 39 8 67 39 8 62 39 8 57 39 8 52 39 8 47 39 8 42 39 8 37 39 8 32 39 8 27 39 8 22 39 8 17 12 39 98 73 98 2 23 60 2 -2 60 -7 -1 26 02 0 Rozdíl mezi odhadem a průměrem odhadu počtu psychologů

Lineární transformace - standardizace z-skóry, standardizované skóry o Nejobvyklejší lineární transformace - standardizace n

Lineární transformace - standardizace z-skóry, standardizované skóry o Nejobvyklejší lineární transformace - standardizace n transformace sady skórů, aby m = 0, s = 1 n jednotkou měření se stává s, možnost srovnávání různých škál (ale pozor rozdíly v rozložení zůstávají!) zi = (Xi – m) / s n s. je zajímavá zvláště u normálně rozložených dat, protože známe řadu jeho percentilů zpaměti o u přibližně normálně rozložených dat o lidech je většina (přes 90%) lidí mezi -3 a 3 AJ: data transformations, standard(ized) scores, z-scores, normalized scores

-0 , 4 6 -0 , 2 8 -0 , 0 9 0, 09

-0 , 4 6 -0 , 2 8 -0 , 0 9 0, 09 0, 27 0, 45 0, 63 0, 82 1, 00 1, 18 1, 36 1, 55 1, 73 1, 91 2, 09 2, 28 2, 46 Da lší Četnost 20 18 16 14 12 10 8 6 4 2 0 z-skóry odhadu počtu psychologů v ČR

Skóry odvozené ze z-skórů Používané primárně v psychodiagnostických metodách o IQ skóry (m=100, s=15)

Skóry odvozené ze z-skórů Používané primárně v psychodiagnostických metodách o IQ skóry (m=100, s=15) o T skóry (m=50, s= 10) o staniny, staninové skóry (standard nine) (m=5, s= 2) + kategorizace zaokrouhlením na celá čísla … od 1 do 9 o steny, stenové skóry (standard ten) (m=5, 5, s= 2) + kategorizace zaokrouhlením na celá čísla … od 1 do 10 Pořád je podmínkou správné interpretace normální rozložení měřené proměnné v dané populaci!

Nelineární transformace 1 o Změna rozložení (obv. směrem k normálnímu) n Pro smysluplnější využití

Nelineární transformace 1 o Změna rozložení (obv. směrem k normálnímu) n Pro smysluplnější využití momentových statistik n Pro možnost využití analytických technik, které nějakou podobu rozložení vyžadují Přirozený logaritmus odhadu počtu psychologů Da lší 24 13 ) ) 44 13 (= 26 83 37 ) 55 12 , 5 (= 16 27 6) 71 (= 98 12 (= , 5 11 = 59 87 4) 6) 31 36 11 ( 10 , 5 (= 22 02 6) 0) = 10 ( 5( = 13 36 03 81 9, = 9( = 5( 8, ) 15 ) 49 81 29 = = 5( 7, 8( 18 97 10 = 7( ) 08 ) 18 16 14 12 10 8 6 4 2 0 ) Četnost o Popisné statistiky se mění složitěji o Př. logaritmus počtu psychologů

Nelineární transformace 2 o Transformace na pořadí – ranking Četnost n Eliminace odlehlých hodnot,

Nelineární transformace 2 o Transformace na pořadí – ranking Četnost n Eliminace odlehlých hodnot, odhlédnutí od velikosti rozdílů mezi lidmi n Obvykle vzestupně (nejnižší hodnota má pořadí 1) n Stejné hodnoty dostávají průměrné pořadí (=RANK. AVG) n Výsledné rozložení je (přibližně) uniformní 18 16 14 12 10 8 6 4 2 0 10 20 30 40 Rozložení pořadí 50 Další

Transformace na percentily o Zvláštní (standardizovaná) podoba transformace na pořadí o Používá se při

Transformace na percentily o Zvláštní (standardizovaná) podoba transformace na pořadí o Používá se při tvorbě norem psychodiagnostických metod a ve výběrových testech

Psychodiagnostická kalkulačka o Převody různých skórů online. o Nástroj vyvíjí Hynek Cígler a Martin

Psychodiagnostická kalkulačka o Převody různých skórů online. o Nástroj vyvíjí Hynek Cígler a Martin Šmíra o http: //kalkulacka. testforum. cz/transformace -skoru

Normální rozložení Gaussovo, bell-curve o Rozložení… n …náhodných chyb n …jevů v přírodě ovlivněných

Normální rozložení Gaussovo, bell-curve o Rozložení… n …náhodných chyb n …jevů v přírodě ovlivněných mnoha nezávislými faktory o Dlouhá historie – od 17. stol. n De. Moivre – sázení n Laplace a Gauss – chyby v astronomických pozorováních n Quetelet – lidi, l'homme moyen, BMI

0. 5 0. 4 0. 3 0. 2 0. 1 -4 -3 -2 -1

0. 5 0. 4 0. 3 0. 2 0. 1 -4 -3 -2 -1 0. 0 0 1 2 3 4

K čemu/proč normální rozložení? o Mnoho proměnných je takto rozloženo n Můžeme pak hádat,

K čemu/proč normální rozložení? o Mnoho proměnných je takto rozloženo n Můžeme pak hádat, kolik jakých hodnot v populaci je o Mnoho statistických postupů s normálním rozložením pracuje n v různých modifikacích a rolích

Vlastnosti normálního rozložení https: //en. wikipedia. org/wiki/Normal_distribution o o o Symetrické, unimodální Průměr=medián=modus V

Vlastnosti normálního rozložení https: //en. wikipedia. org/wiki/Normal_distribution o o o Symetrické, unimodální Průměr=medián=modus V hodnotách M+-SD se mění prohnutí Je-li SD = 1, pak plocha pod křivkou je 1 Zešikmení (skewness) je 0 Strmost (kurtosis) je 3 n často se prezentuje hodnota K-3 o Forma, od níž odrážíme popis pozorovaných rozložení

Mnohost normálních rozložení o Jeden tvar, ale různé umístění na různých škálách (M) a

Mnohost normálních rozložení o Jeden tvar, ale různé umístění na různých škálách (M) a různé roztažení (SD) n http: //www. intmath. com/counting-probability/normal-distribution-graph-interactive. php o Standardizované rozložení N(0, 1) n tj. převedení normálně rozložené proměnné na z-skóry

Kvantily standardního normálního rozložení N(0; 1) alias oblasti pod křivkou normálního rozložení upraveno dle

Kvantily standardního normálního rozložení N(0; 1) alias oblasti pod křivkou normálního rozložení upraveno dle Glass, Hopkins, s. 88

Kvantily přesněji v MS Excel o NORM. S. DIST(z; 1) – udává percentil odpovídající

Kvantily přesněji v MS Excel o NORM. S. DIST(z; 1) – udává percentil odpovídající zadanému z-skóru, tj. kolik lidí má z-skór roven z nebo menší n Procento lidí v rozmezí z-skórů = NORM. S. DIST(vyšší z; 1) – NORM. S. DIST(nižší z; 1) o NORM. S. INV(p) – udává z-skór odpovídající zadanému percentilu Bez toho S. poskytují funkce tutéž informaci pro normální rozložení s jiným M a SD Starší a napříč tabulkovými kalkulátory kompatibilní funkce jsou NORMSDIST(z) a NORMSINV(p).

Kvantily přesněji postaru

Kvantily přesněji postaru

Statistické zkratky a značky o o o o různé systémy, je třeba dobře popisovat

Statistické zkratky a značky o o o o různé systémy, je třeba dobře popisovat N, n = velikost vzorku, podvzorku(skupiny) Xi = skór i-té osoby u proměnné X xi = deviační skór, odchylka od průměru M, m, x = průměr SD, s = směrodatná odchylka VAR, s 2 = rozptyl AJ: statistical notation, sample size, subsample, score, deviation score