Kzprtkek Dr Gunther Tibor Ph D II2 Statisztikai
Középértékek Dr Gunther Tibor Ph. D II/2.
Statisztikai fogalmak » statisztika « szó latin eredetű, a „status”ból származik, amelyet állapotnak és államnak is fordíthatunk; A statisztika tárgya mindig valamilyen állapot leírására szolgál. Az adatok - kísérlet, megfigyelés, vizsgálat eredményeként kapjuk A legtöbbször számként jelenik meg Az adatok mindig rögzítettek. (Ez számítástechnikai alapkövetelmény is. )
A mérhető adat • Amennyiben adatunk úgy keletkezik, hogy valamilyen mérés „terméke • A mérés - nem más, mint egy hozzárendelés, ami a való világ egy bizonyos objektuma (ill. annak része), és egy szám között áll fenn. • az esetek legnagyobb többségében valamilyen fizikai skálán történnek. (Pl. : hosszúság, tömeg, idő, VC, stb. )
A megállapítható adat • Ilyenkor az adatokat úgy nyerjük, hogy a mérés szerepét egy megállapítás veszi át. • A kategória megadásában nem szerepel számérték. Ilyen adat pl. egy kérdéses személy neme; ez csak szóban („férfi”, vagy „nő”), ill. a biológiai szimbólumok felhasználásával adható meg. • Ide tartoznak az „igen-nem”-mel megválaszolható kérdések is. Pl. : a „volt-e már valaha náthája? ”-kérdésre két válasz lehetséges: vagy „igen”, vagy „nem”. • A számokkal sokkal egyszerűbb számolni, mint megállapításokkal (kategóriákkal).
Az eloszlások típusai • Diszkrét • Folytonos
Diszkrét eloszlás/egyenletes eloszlás • Valamennyi értékhez ugyanakkora gyakoriság tartozik. • A relatív gyakoriság a különböző kategóriák, osztályok számának reciprokával egyenlő: a „férfi-nő”, ill. „fej, vagy írás” esetében két osztály van, s ezért egyketted, azaz 0, 5 (50%) a relatív gyakoriság; a dobókockánál egyhatod (0, 167 = 16, 7%),
A folytonos eloszlás • • Normális eloszlás Binomiális eloszlás Hipergeometrikus eloszlás Poisson-eloszlás Exponenciális eloszlás Student (t-) eloszlás Lognormális eloszlás
A folytonos eloszlás • Legfontosabb a normális eloszlás • Leírása legpontosabban azzal a matematikai egyenlettel lehetséges, amely egyben az eloszlás görbéjét is meghatározza. • Egy (kszí) folytonos valószínűségi változót normális eloszlásúnak nevezünk akkor, ha az egész számegyenesen értelmezve van ( -től -ig) • A függvénygörbe pedig - ún. „sűrűségfüggvény”
Binomiális eloszlás • A diszkrét eloszlások nagyon sok esetben megállapítható változók viselkedését írják. • Ha a változó csak két értéket vehet föl - hasonlóan a logikai értékekhez -, akkor az értékek eloszlása binomiális eloszlás (Ez - bizonyos esetekben jól közelíthető normális eloszlással).
Hipergeometrikus eloszlás • Egy dobozban van N golyó • Köztük M fekete van • Mi a valószínűsége annak, hogy n-et találomra kihúzva (n elemű mintát véve) éppen k feketét találunk azok között.
Poisson-eloszlás • Gyakran lép fel a természetben és jó közelítését adja a gyakorlatban előforduló véletlen változónak • Azt tapasztalhatjuk, hogy a pontok tér-, vagy időbeli elhelyezkedése akkor követ ilyen eloszlást, ha azok egymástól függetlenül és minden térrészben (időszakaszban) egyformán valószínűen oszolhatnak meg. • Ilyen eloszlást mutat - – a vérsejtek száma egy mikroszkóp látóterében [síkbeli eloszlások]; – egy folyadékban, ill. annak meghatározott részében levő kolloid részecskék száma; – a telefonközpontba (vagy szolgáltató egységbe) adott időszakban és időtartamban beérkezett telefonhívások – vásárlók száma;
Exponenciális eloszlás • Bizonyos gépi berendezések élettartamai
Student (t-) eloszlás • Ezt az eloszlást W. S. Gosset állította fel a XX. század elején, s mivel ebben az időben „Student” álnév alatt írt • Formálisan egy t statiszikai függvény eloszlásáról van szó. Statisztikai próbákban használatos a t-eloszlás táblázata
Lognormális eloszlás • Bizonyos törési-aprítási folyamatoknál az őrlemény szemcsedarabjainak nagyság szerinti megoszlása lognormális eloszlást mutat. • Ugyancsak jól közelíthető lognormális eloszlással egyes foglalkozási rétegek jövedelemeloszlása
A medián • Ez az elnevezés (latinul) önmagában is közepet jelent. • Úgy határozzuk meg, hogy a vízszintes tengelyen megkeressük azt a pontot, amelytől jobbra is és balra is ugyanannyi adat van.
A medián számszerű meghatározása • A minta elemeink száma páros, vagy páratlan • Növekvő sorba rendezzük a minta elemeit • Páros elem esetén a két középső elem számtani átlaga • Páratlan a középső elem
Kvantilis • „Kvantálni” annyit jelent, mint részekre osztani. • kvartilisek négy egyenlő rész – A K 1 első kvartilis a minta egynegyede – A K 2 masodik kvartilis a kétnegyede azaz fele – K 3 a harmadik kvartilis a háromnegyede • a decilis tíz egyenlő rész • a centilis száz egyenlő rész • medián két egyenlő rész
Módusz • „A leggyakrabban előforduló érték”
A szóródás mérőszámai Bármely középérték csak egy tulajdonságot jellemez az eloszlásgörbének a vízszintes tengelyen elfoglalt helyét, s ezt a helyet az eloszlás közepével adja meg (Gaus)
A variancia és a szórás • Az átlagtól való eltérések négyzetének átlaga a variancia, • Az ebből vont négyzetgyök után kapjuk a szórást. (Ne felejtsük el, hogy adatainknak – pl. fizikai – tartalma van. • A variancia (más néven szórásnégyzet): • A szórás
A szóródás mérőszámai • A szabadságfok az egymástól függetlenül választható tagok (mintaelemek) számával egyenlő.
KÖSZÖNÖM A FIGYELMET!
- Slides: 23