A szmtgpes elemzs alapjai Adatok fajti Mrhet adatok

  • Slides: 20
Download presentation
A számítógépes elemzés alapjai

A számítógépes elemzés alapjai

Adatok fajtái Mérhető adatok, Intervallumskála az adatok közti különbségek, intervallumok egyenlők Ordinális skálán elhelyezkedő

Adatok fajtái Mérhető adatok, Intervallumskála az adatok közti különbségek, intervallumok egyenlők Ordinális skálán elhelyezkedő adatok: rangsorolásból származó adatok kapcsolt rangpontszámok Nominális mérés: az adatokat számokkal helyettesítjük, melyek nem jelölnek sorrendiséget nem összeadhatók

Statisztikai eljárások Leíró statisztika Ha a tényleges személyeket elemezzük, azaz a Populáció=minta Statisztikai eljárások

Statisztikai eljárások Leíró statisztika Ha a tényleges személyeket elemezzük, azaz a Populáció=minta Statisztikai eljárások Gyakoriságok Középértékek Szóródások Korreláció

Statisztikai eljárások Matematikai statisztika Megadja, hogy a reprezentatív mintából vonható le következtetés az alapsokaságra.

Statisztikai eljárások Matematikai statisztika Megadja, hogy a reprezentatív mintából vonható le következtetés az alapsokaságra. Különbözőségvizsgálatok Adatfajták intervallum Minták száma ordinális nominális egymintás tpróba Wilcoxon-próba Kereszttábla elemzés, khi-négyzet próba kettő kétmintás tpróba F-próba Mann-Whitneypróba Kereszttábla elemzés, khi-négyzet próba három varianciaanalízi s Kruskall-Wallispróba Kereszttábla elemzés, khi-négyzet próba

Statisztikai eljárások Matematikai statisztika Összefüggésvizsgálatok Adatfajták intervallum Minták száma ordinális nominális kettő korrelációszámítás Spearmann-féle

Statisztikai eljárások Matematikai statisztika Összefüggésvizsgálatok Adatfajták intervallum Minták száma ordinális nominális kettő korrelációszámítás Spearmann-féle rangkorreláció Keresztábla elemzés, khi-négyzet próba Kettő vagy több, mint kettő regresszióanalízis Több mint kettő Parciális korrelációszámítás Faktoranalízis klaszteranalízis

Leíró statisztika

Leíró statisztika

Középértékek Átlag Módusz Medián

Középértékek Átlag Módusz Medián

Gyakorisági vizsgálatok 1. 2. A kategóriák számának meghatározása 10 és 20 közötti páratlan szám

Gyakorisági vizsgálatok 1. 2. A kategóriák számának meghatározása 10 és 20 közötti páratlan szám de alacsony számú (50 körüli elmeszámú) minta esetén kevesebb (7 -9 kategória) is lehet. A csoportintervallumok (lépésköz) meghatározása 1, 2, 3, 5, 10 a kategóriaszám alapján Diszjunktság: A csoportok meghatározásánál ügyelni kell arra, hogy a minta minden eleme pontosan egy kategóriába legyen besorolható, ezért a csoportok nem fedhetik át egymást.

Abszolút gyakoriság Def: Az egyes kategóriákba tartozó értékeket az adott csoport gyakoriságának nevezzük, a

Abszolút gyakoriság Def: Az egyes kategóriákba tartozó értékeket az adott csoport gyakoriságának nevezzük, a létrejövő értékeket együttesen pedig a minta abszolút gyakorisági eloszlásának.

További gyakorisági mutatók Relatív gyakoriság az abszolút gyakorisági értékek és az elemszám hányadosát, azaz

További gyakorisági mutatók Relatív gyakoriság az abszolút gyakorisági értékek és az elemszám hányadosát, azaz az egyes kategóriába tartozók összes kitöltőhöz viszonyított százalékos arányát. A kumulatív gyakoriság megmutatja, a minta hány eleme található a kategória felső határa alatt. Halmozott %-os gyakoriság, vagy más néven százalékos kumulált gyakoriság megmutatja a minta hány százaléka található a kategória felső határa alatt.

Szóródási mutatók Szóródási terjedelem: a minta értéktartománya: a minta legnagyobb és a legkisebb elemének

Szóródási mutatók Szóródási terjedelem: a minta értéktartománya: a minta legnagyobb és a legkisebb elemének a különbsége. R = Xmax - Xmin Átlagos eltérés: a minta elemeinek az átlagtól való átlagos távolsága. Négyzetes összeg: A minta elemeinek az átlagtól való eltéréseinek négyzete összegezve.

Variancia A variancia a négyzetes összeg osztva a minta szabadságfokával. Szabadságfoknak nevezzük a minta

Variancia A variancia a négyzetes összeg osztva a minta szabadságfokával. Szabadságfoknak nevezzük a minta független elemeinek számát.

Szórás A szórás a variancia pozitív előjelű négyzetgyöke.

Szórás A szórás a variancia pozitív előjelű négyzetgyöke.

Tétel A mintától 1 szórásnyi terjedelembe tartozik az adatok több mint 2/3 -a. A

Tétel A mintától 1 szórásnyi terjedelembe tartozik az adatok több mint 2/3 -a. A mintától 2 szórásnyi terjedelembe tartozik az adatok több mint 90%-a. A mintától 3 szórásnyi terjedelembe tartozik az adatok több mint 95 %-a.

Relatív szórás A relatív szórás a szórás átlaghoz viszonyított mérőszáma: a szórás és az

Relatív szórás A relatív szórás a szórás átlaghoz viszonyított mérőszáma: a szórás és az átlag hányadosának eredménye.

Kvartilisek A kvartilisek a minta negyedelő pontja. Interkvartilis félterjedelem a harmadik és az első

Kvartilisek A kvartilisek a minta negyedelő pontja. Interkvartilis félterjedelem a harmadik és az első kvartilis különbsége: Q 3 -Q 1

Összefüggések

Összefüggések

Gyakorisági poligon és a középérték-mutatók Balra ferdült: Módusz > Medián > Számtani közép Jobbra

Gyakorisági poligon és a középérték-mutatók Balra ferdült: Módusz > Medián > Számtani közép Jobbra ferdült: Módusz < Medián < Számtani közép Normális eloszlás (harang görbe) : Módusz = Medián = Számtani közép

Matematikai statisztika

Matematikai statisztika

Korreláció A korrelációs együttható két mennyiségi adatsor közti kapcsolat erősségét és irányát megadó együttható.

Korreláció A korrelációs együttható két mennyiségi adatsor közti kapcsolat erősségét és irányát megadó együttható.