Az IBM SPSS Statistics programrendszer Gazdasginformatikus MSc A
Az IBM SPSS Statistics programrendszer Gazdaságinformatikus MSc
A termék nevének eredete Statistical Package for Social Scientics Statistical Product and Service Solutions SPSS PASW IBM SPSS Statistics 11/25/2020 Ketskeméty László IBM SPSS Statistics 2
11/25/2020 Ketskeméty László IBM SPSS Statistics 3
IBM SPSS Statistics SPSS Server Sample. Power Smart. Reader Smart. Viewer Web Server SPSS Web. App Framework Report Writer Sample. Power Data Entry Amos Víz Designer Core System Base Statistics Custom Tables Advanced Statistics Regression Exact Tests Bootstapping Categories Forecasting Conjoint Decision Trees Neural Networks Direct Marketing Missing Values Data Preparation Complex Samples Programmability Extension IBM SPSS Modeller 13 Text Mining for Clementine Web Mining for Clementine Predictive Claims Clementine Server Predictive Call Center Predictive Marketing IBM SPSS Deployment Predictive Enterprise Services • Enterprise Manager • Enterprise Repository IBM SPSS Data Collection mr. Interview mr. Paper mr. Studio mr. Dialer mr. Translate mr. Scan mr. Tables 11/25/2020 Copyright 2010, SPSS Hungary. Ketskeméty László IBM SPSS Statistics Desktop Author Desktop Reporter 4 4
Data View üzemmód 11/25/2020 Ketskeméty László IBM SPSS Statistics 5
Az adatmátrix 11/25/2020 Ketskeméty László IBM SPSS Statistics 6
A mátrix egy adott sora (esete) a többváltozós minta egy eleme 11/25/2020 Ketskeméty László IBM SPSS Statistics 7
A mátrix minden oszlopa (változója) statisztikai minta-realizáció, vagy egy idősor realizációja 11/25/2020 Ketskeméty László IBM SPSS Statistics 8
11/25/2020 Ketskeméty László IBM SPSS Statistics 9
A Variable View üzemmód 11/25/2020 Ketskeméty László IBM SPSS Statistics 10
A változó típusa (type) 11/25/2020 Ketskeméty László IBM SPSS Statistics 11
A változó címkéje (label) 11/25/2020 Ketskeméty László IBM SPSS Statistics 12
Értékcímkék megadása I. 11/25/2020 Ketskeméty László IBM SPSS Statistics 13
Értékcímkék megadása II. (value labels) 11/25/2020 Ketskeméty László IBM SPSS Statistics 14
Hiányzó adatok definiálása 11/25/2020 Ketskeméty László IBM SPSS Statistics 15
Hiányzó adatok definiálása 11/25/2020 Ketskeméty László IBM SPSS Statistics 16
A hiányzó adat I. 11/25/2020 Ketskeméty László IBM SPSS Statistics 17
A hiányzó adat II. 11/25/2020 Ketskeméty László IBM SPSS Statistics 18
11/25/2020 Ketskeméty László IBM SPSS Statistics 19
11/25/2020 Ketskeméty László IBM SPSS Statistics 20
A mérési szint I. 11/25/2020 Ketskeméty László IBM SPSS Statistics 21
Mérési szintek II. 11/25/2020 Ketskeméty László IBM SPSS Statistics 22
11/25/2020 Ketskeméty László IBM SPSS Statistics 23
11/25/2020 Ketskeméty László IBM SPSS Statistics 24
Adatok beolvasása: File/Open/Data 11/25/2020 Ketskeméty László IBM SPSS Statistics 25
Adatok beolvasása 11/25/2020 Ketskeméty László IBM SPSS Statistics 26
Adatok beolvasása 11/25/2020 Ketskeméty László IBM SPSS Statistics 27
Output szerkesztő ablak (Viewer) 11/25/2020 Ketskeméty László IBM SPSS Statistics 28
Pozícionáló fa 11/25/2020 Ketskeméty László IBM SPSS Statistics 29
Output elemek log 11/25/2020 Ketskeméty László IBM SPSS Statistics 30
Output elemek diagrammok, ábrák oszlopdiagramm 11/25/2020 tortadiagramm Ketskeméty László IBM SPSS Statistics boxplot-ábra 31
Output elemek diagrammok, ábrák szóródás ábra 11/25/2020 hisztogramm Ketskeméty László IBM SPSS Statistics P-P grafikon 32
Output elemek táblázatok Jelentés a feldolgozott változókról 11/25/2020 Ketskeméty László IBM SPSS Statistics 33
Output elemek táblázatok 11/25/2020 Ketskeméty László IBM SPSS Kereszt-gyakoriság táblázat Statistics 34
Output elemek táblázatok Statisztikák listája 11/25/2020 Ketskeméty László IBM SPSS Statistics 35
Output elemek táblázatok Gyakoriságtáblázat 11/25/2020 Ketskeméty László IBM SPSS Statistics 36
Az adatok rendezése 11/25/2020 Ketskeméty László IBM SPSS Statistics 37
Az adatok rendezése Rendezzük át az állományt a kor szerint növekvő sorrendbe! 11/25/2020 Ketskeméty László IBM SPSS Statistics 38
Az adatok rendezése Növekvő sorrendet állítunk be 11/25/2020 Ketskeméty László IBM SPSS Statistics 39
Az adatok rendezése A legfiatalabb esettel kezdődik a felsorolás. 11/25/2020 Ketskeméty László IBM SPSS Statistics 40
Új változók létrehozása • Új változó számítása (compute variable) • Átkódolás (recode into same variable) • Átkódolás más változóba (recode into different variable) • Automatikus átkódolás (automatic recode) • Kategorizálás (binning) • Rangszámképzés (rank cases) 11/25/2020 Ketskeméty László IBM SPSS Statistics 41
Új változók számítása 11/25/2020 Ketskeméty László IBM SPSS Statistics 42
Kiszámítjuk az egy főre eső jövedelmet, ami egy új változó lesz (target variable). income= a családi jövedelem (ezer dollár) reside= az egy családban élők száma 11/25/2020 Ketskeméty László IBM SPSS Statistics 43
A kifejezés képletének megadásakor használhatjuk a kalkulátort és a változó listát. „Direktben” is megadhatjuk a képletet a klaviatúráról. 11/25/2020 Ketskeméty László IBM SPSS Statistics 44
A képletekhez függvényeket is felhasználhatunk egy listából. 11/25/2020 Ketskeméty László IBM SPSS Statistics 45
A kiszámításhoz feltételeket is beállíthatunk: csak azoknál az eseteknél számol, aminél a beállított feltétel „igaz” értéket vesz fel. 11/25/2020 Ketskeméty László IBM SPSS Statistics 46
Függvény csoportok • Arithmetic Functions • Statistical Functions • String/Numeric Conversion Functions • Date and Time Functions • Random Variable and Distribution Functions • Missing Value Functions • Logical Functions • LAG Function • VALUELABEL Function • Scoring Expressions (PASW Statistics Server) 11/25/2020 Ketskeméty László IBM SPSS Statistics 47
Átkódolás (recode into same variable) 11/25/2020 Ketskeméty László IBM SPSS Statistics 48
Átkódolás (recode into same variable) 11/25/2020 Ketskeméty László IBM SPSS Statistics 49
Átkódolás (recode into same variable) 11/25/2020 Ketskeméty László IBM SPSS Statistics 50
Átkódolás más változóba 11/25/2020 Ketskeméty László IBM SPSS Statistics 51
Átkódolás más változóba 11/25/2020 Ketskeméty László IBM SPSS Statistics 52
Átkódolás más változóba 11/25/2020 Ketskeméty László IBM SPSS Statistics 53
Automatikus átkódolás 11/25/2020 Ketskeméty László IBM SPSS Statistics 54
Automatikus átkódolás Pl. 4 1 7 2 11 3 215 4 11/25/2020 Ketskeméty László IBM SPSS Statistics 55
Kategorizálás (binning) 11/25/2020 Ketskeméty László IBM SPSS Statistics 56
Kategorizálás (binning) 11/25/2020 Ketskeméty László IBM SPSS Statistics 57
Kategorizálás (binning) 11/25/2020 Ketskeméty László IBM SPSS Statistics 58
Kategorizálás (binning) 11/25/2020 Ketskeméty László IBM SPSS Statistics 59
Kategorizálás (binning) 11/25/2020 Ketskeméty László IBM SPSS Statistics 60
Rangszámképzés 11/25/2020 Ketskeméty László IBM SPSS Statistics 61
Rangszámképzés 11/25/2020 Ketskeméty László IBM SPSS Statistics 62
Rangszámképzés 11/25/2020 Ketskeméty László IBM SPSS Statistics 63
Rangszámképzés 11/25/2020 Ketskeméty László IBM SPSS Statistics 64
Az adatok szűrése
Az adatok szűrése Nincs szűrés, mindegyik esettel számolni akarunk
Az adatok szűrése Feltételtől függő szűrést aktivizálunk
Az adatok feltételes szűrése Csak a férfiak (m=male) eseteivel akarunk számolni
Az adatok szűrése Véletlentől függő szűrést aktivizálunk
Az adatok véletlenszerű szűrése Az esetek véletlenszerűen kiválasztott negyedével akarunk foglalkozni
Az adatok szűrése Az adatok csak egy kijelölt szeletét akarjuk vizsgálni
Az adatok egy részének kijelölése Csak az 50. esettől a 250. esetig számolunk
Az adatok szűrése Szűrőváltozót alkalmazunk. Azokat az eseteket hagyjuk el, ahol a szűrőváltozó 0 -s, vagy hiányzó adat.
Az adatok szűrése Alul is kapunk figyelmeztetést, hogy az állományt szűrtük!
Az adatok szűrése Csak szűrünk, de az adatok a mátrixban maradnak.
Az adatok szűrése A kiszűrt állományt elmenthetjük
Az adatok szűrése A kiszelektált eseteket törölhetjük az adatmátrixból. Ezek az adatok elvesznek.
Leíró statisztikák lehívása
Leíró statisztikák lehívása A diszkrét (kategória) változókat vegyük fel a listába! Gyakoriság táblázatot is kérünk. (Ez az alapértelmezett. )
Leíró statisztikák lehívása
A statisztikák táblázata
Gyakoriságtáblázat
Grafikonok kérése
Oszlopdiagramm
Tortadiagramm
A táblázatok beállítása
Folytonos változók esete Elmenthetjük új változókba a standardizáltakat
Folytonos változók esete
Folytonos változók esete
Két új változó keletkezett, a standardizált változók
Az EXPLORE parancsdoboz
Az EXPLORE parancsdoboz
EXPLORE táblázatok
EXPLORE táblázatok
EXPLORE táblázatok
EXPLORE táblázatok
EXPLORE táblázatok
EXPLORE grafikonok hisztogrammok
EXPLORE grafikonok P-P grafikonok
EXPLORE grafikonok dobozdiagramm
Kereszttáblázat
Kereszttáblázat
Kereszttáblázat
Kereszttáblázat
Kereszttáblázat
Kereszttáblázat
Aránystatisztikák
Aránystatisztikák
Az adatok centrális helyzetét leíró statisztikák mode a változó esetei közül a leggyakrabban előforduló érték. Ha több ilyen is van az adatban, azok közül a legkisebb. Ordinális és intervallum-skálás típusú adatoknál nem mindig van értelme. Tipikusan diszkrét változók centrumára jellemző statisztikáról van szó.
Az adatok centrális helyzetét leíró statisztikák
Az adatok centrális helyzetét leíró statisztikák
Az adatok centrális helyzetét leíró statisztikák
A szóródás mértékei
A szóródás mértékei
Ferdeség (skewness)
Csúcsosság (kurtosis)
Kvartilisek
Szár-és-levél ábra
Kontingencia-táblázat crosstabulation (kontingencia-táblázat, kereszttábla) Ez egy olyan táblázat, amelynek sorai egy változó (a sorváltozó) értékeihez, az oszlopai egy másik változó (az oszlopváltozó) értékeihez tartoznak. A táblázat egy eleme (cellája) a megfelelő sorváltozó érték és oszlopváltozó érték együttes előfordulási gyakoriságát jelenti az adott mintában. Tehát ha az rxs -es táblázat (i, j) cellájában k érték van, az azt jelenti, hogy a mintában éppen k db olyan eset van, ahol a sorváltozó az értékkészletének i-edik, az oszlopváltozó pedig j -edik elemét veszi fel.
Kontingencia-táblázat Két diszkrét (kategória) változó közötti összefüggés jellemzésére használt gyakoriság-táblázat: Az ij gyakiráság megmutatja, hogy az (yi, xj) párból hány van az adatmátrixban.
Kontingencia-táblázat 35 menedzser tanult 16 évig
Kontingencia-táblázat Ennyi lenne a gyakoriság, ha a változók függetlenek lennének!
Kontingencia-táblázat A sor % azt jelenti, hogy a tartalmazott gyakoriság a sor celláiban található össz-gyakoriság hány %-a. Az oszlop % a gyakoriságot a cellával egy oszlopban lévő gyakoriságösszeghez arányítja. A teljes % a cellagyakoriság és a mintanagyság hányadosa. A cellákban álló teljes %-ok összege a táblázatban 100%.
Kontingencia-táblázat A menedzserek a 16 évig tanuló dolgozók 59, 3%-át teszik ki (sor %) A menedzserek 41, 7%-a tanul 16 évig (oszlop %) A teljes állomány 7, 4 %-át teszik ki a 16 évig tanuló menedzserek teljes %)
Kontingencia-táblázat
Kontingencia-táblázat
Kontingencia-táblázat
2 -próba Pearson-féle 2 -statisztika a táblázat (i, j) cellájának gyakorisága,
2 -próba A sor és oszlopváltozók nem lehetnek függetlenek a kicsi szignifikancia szint miatt
Egyéb függetlenségi tesztek A többi teszt is elutasítja a függetlenséget!
Grafikus illeszkedésvizsgálat A lehetséges eloszlások: béta, Chi-négyzet , exponenciális, gamma, fél-normális, Laplace, Logisztikus, Lognormál, normális, pareto, Student-féle t, , Weibull, és egyenletes. A P-P ábrán az elméleti eloszlásfüggvény és az empirikus eloszlásfüggvény van összehasonlítva. A Q-Q ábrán látható pontok vízszintes tengelyhez tartozó koordinátái a változó tapasztalati kvantilisei, a függőleges tengelyen pedig a tesztelt eloszlás kvantilisei állnak. A jó illeszkedés esetén a pontok közel szóródnak az ábrán meghúzott egyenes körül!
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Illeszkedésvizsgálat próbával
Illeszkedésvizsgálat próbával Az illeszkedés nem fogadható el!
A táblázatok formázása Az eredeti, alapértelmezett formázású kereszttábla
Az egér jobb gombjával tehetjük szerkesztő módba a táblázatot.
A táblázatok formázása A „gyári” beállításokat itt érjük el.
A táblázatok formázása A listából kiválasztunk egy megfelelő formázatot.
A táblázatok formázása
A táblázatok formázása A táblázat feliratait átírhatjuk
A grafikonok típusai
Oszlopdiagrammok Az egyszerű oszlopdiagrammok három típusa: A: Summaries for groups of cases B: Summaries of separate variables C: Values of individual cases
A gépkocsi típusok gyakoriságai Háztartási eszközök gyakoriságainak összehasonlítása CD eladásai hetenként
Oszlopdiagrammok A csoportosított oszlopdiagrammoknak is három típusa van. A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases
Oszlopdiagrammok Gépkocsi típusok gyakoriságai az alkalmazás időtartama szerint A PC és PDA előfordulás összehasonlítása az alkalmazás időtartama szerint A CD reklámújságjainak heti száma és a webes letöltések heti száma
Oszlopdiagrammok A ragasztott oszlopdiagrammoknak is három típusa van. A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases
Oszlopdiagrammok Gépkocsi típusok az alkalmazás hosszának függvényében A PC-k és PDA-ák összehasonlítása Az alkalmazás hossza szerint A szórólapok száma és a webes letöltések száma hetenként
3 D oszlopdiagrammok
3 D oszlopdiagrammok B tipusú grafikon, var 1=salary, var 2=salbegin, var 3=jobcat szereposztásban
Vonaldiagrammok
Vonaldiagrammok A kilenc különböző vonalgrafikon típus, amit elő lehet állítani
Vonaldiagrammok A CD eladások hetenként
Terület diagrammok
Terület diagrammok A hat lehetséges terület grafikon tipus
Tortadiagrammok A három tortaábra tipus
Tortadiagrammok (pie charts) A gépkocsi típusok összehasonlítása tortadiagrammon
Terjedelem ábrák
Terjedelem ábrák High-Low grafikon a kezdőfizetés és a fizetés különbségének szemléltetésére beosztásonként Az átlag és medián különbségek grafikonja a fizetés és kezdőfizetés esetén, beosztások szerint
Terjedelem ábrák Terület-differencia ábrák három alaptípusa Egyszerű oszlop-differencia ábratípusok
Dobozábrák
Dobozábrák Dobozábra alaptipusok
A dobozábra értelmezése
A fizetés és kezdeti fizetés dobozábrái beosztásonként
Populáció piramis ábra Populáció-piramis grafikon Oszlopdiagrammok összekapcsolása Hisztogrammok összekapcsolása
Szóródás vagy pontfelhő ábrák
Szóródás vagy pontfelhő ábrák Szóródás- és pontábrák
Mátrix szóródás ábrák
3 D szóródás ábrák A gépkocsik súlya, fogyasztása és gyorsulása egy 3 D pontdiagrammon
Hisztogrammok Az emberek koreloszlása a normális sűrűségfüggvénnyel
Hisztogrammok A fizetések hisztogramja exponenciális sűrűségfüggvénnyel
Hisztogrammok A fizetések hisztogrammjai beosztásonként külön a nőknél és a férfiaknál haranggörbékkel
- Slides: 176