Katseandmete anals kodut asub aadressil http www ut
Katseandmete analüüs kodutöö asub aadressil: http: //www. ut. ee/~tammarut/stat. htm Kui ei õnnestu arvutisse siseneda, siis uuendage oma parooli https: //passwd. ut. ee/ Juhendajaga praktikumid 2015 1. K 14. okt 10: 15 2. R 15. okt 10: 15 3. R 19. okt 12: 15 4. E 21. okt 10: 15 5. K 23. okt 10: 15 6. R 26. okt 12: 15 7. E 28. okt 10: 15 8. R 30. okt 10: 15 Vanemuise 46 -202
Alustamine File View Insert Statistics Data mining Graphs Tools Data Add variables Copy variables Add cases Copy cases Vars Cases Basic stat Histograms Multiple regression Scatterplots ANOVA Means Nonparametric Distribution fitting Advanced Linear/ Nonlinear Models > General Linear Models
Alustamine Väärtustele ridade lisamine ja kopeerimine
t-testid, parameetrilised korrelatsioonid mitteparameetrilised testid tunnuse jaotuse kontrollimine
Tunnuse väärtustest histogrammi koostamine Kahe pideva tunnuse omavahelise seose joonised faktortunnuse erinevate tasemete vahel
Andmete sisestamine File > New. . . Tunnusenimed: topeltklõps nimereale Sorteerimine Arvutamine: nt. logaritmimiseks: v 3=log(v 2) või eri tunnuste kombineerimiseks: v 5=„kaal“/“vanus“ Tunnuste selekteerimine: Tools >. . . Include cases: sugu=„isane“ and vanus=4 Sama teeb ka nupp: Kui selekteeritav tunnus on tabelis tekstina, siis tuleb selekteerimisel kasutada jutumärke (nagu eelnevas näites „isane“)
Kirjeldavad statistikud Statistics > Basic statistics and tables > Descriptive statistics > Advanced vali uuritav tunnus
Kirjeldavad statistikud Märgi ära huvipakkuvad statistikud, nt: keskväärtus (Mean) mediaan (Median) mood (Mode) standardhälve (Standard Deviation (SD)) dispersioon (Variance) standardviga (Std. err. of mean (SE)) usalduspiirid (Conf. Limits for mean) variatsioonikoefitsient (Coefficient of Variation; Stat. 7 puudub) kvartiilid (Lower and upper quartiles) Tulemused saad sellise tabelina:
Histogramm Graphs > Histograms > Advanced Variables: vali uuritav tunnus Graph type: regular / multiple / double-Y Fit type: Off / Normal /. . . Show percentages (% tulpade kohale) Statistics: Descriptive (Kirjeldavad statistikud joonisele) Intervals: Categories. . . (Tulpade arvu muutmine) SELECT CASES Sel Cond
T-test Statistics > Basic statistics and tables > t-test, independent, by groups Meid huvitavad statistikud: t-value df p 3. 59 18 0. 002
T-test Vali siit sõltuv (tunnus, mille erinevust tesitakse) ja sõltumatu tunnus (grupid, mida omavahel võrreldakse). Kui tunnused valitud, siis vajuta Summary Tulemus Meid huvitavad statistikud
Joonise koostamine Normaaljaotuse kontroll Levene-test: dispersioonide erinevuse testimine)
Ühesuunaline ANOVA (dispersioonanalüüs) Statistics > ANOVA > One-way ANOVA Variables: Vali sõltuv ja sõltumatu (grupeeriv) muutuja; Vajuta OK > All effects (tulemuste tabel) > More results > Summary > Whole model R (Adjusted R 2 - mudeli seletusvõime näitaja) Effect SS Intercept 194. 94 vanus Error MS F 1 194. 94 96. 62 <0. 0001 23. 7 2 11. 85 5. 87 0. 012 34. 3 17 2. 02 ndf (mudeli vabadusastmed) d. f. ddf (vea vabadusastmed) p Eelduste testimine: More results>Assumptions Plot means vs std deviations
Mitteparameetriline ANOVA § Mediaanitest § Kruskal-Wallise ANOVA Statistics > Nonparametrics > Comparing multiple independent samples Summary: Kruskal-Wallis ANOVA & Median Test Multiple comparisons of mean ranks (mis grupid erinesid? ) Tulemused (meid huvitavad H, N ja p): Kruskal-Wallis ANOVA by Ranks; kaal (Näidisandmed) Independent (grouping) variable: sugu Kruskal-Wallis test: H ( 1, N= 20) =7. 179669 p =0. 0276
Korrelatsioonid Pearson (parameetriline) r(X, Y) 0. 61 Statistics > Basic stat > Correlation matrices r 2 0. 37 t 3. 28 p 0. 0042 N 20 Options: Display detailed table of results Spearman (mitteparameetriline) Statistics > Nonparametrics > Correlations Compute: Detailed report Spearman R vanus & kaal N Spearman t(N-2) P-level R 20 0. 59 3. 12 0. 0059
Lineaarne regressioon Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Simple regression (1 sõltumatu muutuja) või Multiple regression (>1 sõltumatu muutuja) või Factorial regression (>1 sõltumatu muutuja + koosmõjud) Variables: vali sõltuv ja sõltumatu (predictor e ennustav) muutuja OK
Whole Model R (Mudeli üldise seletusvõime hindamiseks): Multiple F R 0, 89 Multiple Adjusted SS df MS p 2 R 2 148, 34 Model 38, 86 Model 0, 79 R 0, 75 3 49, 45 SS 16 d. f MS F MS Resid. 2, 43 20, 36 Resid. 0, 00010 All effects (Erinevate sõltumatute tunnuste mõju hindamiseks): SS df p Intercept 147, 7466 1 147, 7466 60, 82710 0, 000001 Vanus 45, 7470 18, 83399 0, 000507 Kaal 9, 6427 1 9, 6427 3, 96990 0, 063666 Vanus*kaal 7, 1408 1 7, 1408 2, 93988 0, 105718 Error 38, 8634 16 2, 4290
Eelduste paikapidavuse hindamine: Jääkide jaotus: Resids > Residuals Regressioonivõrrand: y = a + bx Report > Pred. equation Või: Graphs > Scatterplots > Advanced (linnuke Regression equation ette) Jääkide sõltuvus keskväärtustest: Või: Resids > Obs & Resids More results > Coefficients („Param. “ lahtrist saate algoordinaadi ja b)
Graafik regressiooni & korrelatsiooni illustreerimiseks Graphs > Scatterplots > Advanced Korrelatsiooni puhul vali statistikud (Statistics > Corr. and p), Regressiooni puhul regressioonivalem (Statistics > Regression (fit) equasion) ja regressioonisirge usalduspiiridega (Regression bands > Confidence)
Mitmesuunaline (Multiway) ANOVA Kaks (või rohkem) faktortunnust Statistics > ANOVA > Factorial ANOVA Variables > Vali 1 sõltuv muutuja ja vähemalt 2 sõltumatut faktorit OK > All effects SS d. f MS F p Intercept 768, 15 136, 85 sugu 0, 04 1 0, 04 0, 01 0, 94 vanus 0, 24 1 0, 24 0, 04 0, 84 sugu*vanus 97, 15 17, 3 0, 00074 Error 89, 81 16 5, 61 <0, 0001
Joonis 2 faktori interaktsiooni illustreerimiseks 1. ANOVA tulemusteaknas All effects/Graphs 2. Klõpsa interaktsiooni-rida aktiivseks > OK
ANCOVA e. Kovariatsioonanalüüs Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Analysis of covariance SS d. f. MS Variables > Vali sõltuv tunnus, huvialune faktortunnus ja pidev kovariaat OK > All effects F p Intercept 423, 20 115, 67 <0, 0001 kaal 125, 00 1 125, 00 34, 16 <0, 0001 sugu 52, 16 14, 25 0, 0015 62, 20 17 3, 66 Error
LS Means e. kovariaadi mõjust puhastatud keskmised: ANCOVA tulemusteaknas: Means > Least squares means sugu veresuhkur mean emane 7, 915385 isane 3, 684615
Graafiku toimetamine Double-click graafiku peal avab toimetamise akna Skaala muutmine: Axis scaling (X või Y) > Mode > Manual Edit step > Mode > Manual Tunnusenime muutmine: Axis title (X või Y) Tulpade muutmine: Plot Bars (tulpade värv ja muster) Plot Histogram (tulpade arv ja vahed) Graafikule kirjutamine: Menüüribast Insert > Text > joonisele ilmub kast „Custom text“, mida saab toimetada.
Graafiku toimetamine Soovitud väärtuste märkimiseks joonisel: graafiku toimetamise aknas: Axis: Scale values (“linnuke” custom labels ette) > Edit custom labels. . . Kirjuta lisatavad väärtused ja neile vastavad tekstid, “linnuke” Grid ette ja toimeta märkimisjoon silmatorkavamaks: Gridlines. . . Toimetatud graafiku Word-i saamiseks klõps parema hiireklahviga ja Copy graph (ja Paste Word-is) või Save graph (. wmf, . jpg formaadis ja Insert > Picture > From file Word-is) Tulemuste toortabeli Word-i saamiseks kopeeri ja kleebi Report aknast.
Andmete importimine ja eksportimine Kopeerimine ja kleepimine teisest programmist. Importimine Exelist: File > Open. . . > Import selected sheet to a workbook Eksportimine teistesse formaatidesse (tekstifail, SPSS, SAS, LOTUS, . pdf): File > Save as. . . > soovitavaks formaadiks kohandamise dialoogaken, nt. Exeli puhul. . .
Tulemuste haldamine File > Output Manager > … 1. Workbook – kõik analüüsid, joonised, jne paigutatakse ühte kausta, mida on lihtne sirvida 2. Report – kõik tulemid paigutatakse ühte tekstifaili, mida on vajadusel kerge toimetada ja kuhu saab lisada omapoolseid kommentaare, märkuseid, vms (Workbook seda ei võimalda)
Tulemused paigutatakse Workbook’i Tulemused paigutatakse Report’i
- Slides: 28