MIARY STATYSTYCZNE MIARY STATYSTYCZNE Charakterystyki liczbowe estymatory i
MIARY STATYSTYCZNE
MIARY STATYSTYCZNE Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
MIARY STATYSTYCZNE Podział ze względu na zakres danych użytych do wyznaczenia miary MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy MIARY POZYCYJNE Miary opisujące rozkład badanej cechy statystycznej, które obliczamy na podstawie tylko niektórych wartości cechy, zajmujących szczególną pozycję w szeregu statystycznym
MIARY STATYSTYCZNE Podział ze względu na opisywane cechy rozkładu MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji centralnej wskazujące położenie centralnych (przeciętnych) wartości cechy w rozkładzie MIARY ZRÓŻNICOWANIA (rozproszenia, rozrzutu, dyspersji) miary opisujące jak bardzo zróżnicowane są wartości cechy w zbiorowości MIARY ASYMETRII (skośności) miary opisujące asymetrię rozkładu cechy w zbiorowości
MIARY STATYSTYCZNE Miary klasyczne Miary tendencji centralnej średnia arytmetyczna średnia geometryczna średnia harmoniczna inne średnie Miary pozycyjne dominanta mediana kwantyle odchylnie przeciętne Miary zróżnicowania wariancja Rozstęp (max-min) odchylenie standardowe pozycyjny współczynnik zmienności klasyczny współczynnik zmienności Miary skośności klasyczny współczynnik asymetrii kurtoza pozycyjny współczynnik asymetrii Klasyczno-pozycyjny współczynnik skośności Pearsona
ŚREDNIA ARYTMETYCZNA x Suma wszystkich wartości cechy (zmiennej) podzielona przez liczbę wszystkich jednostek zbiorowości xi – i-ta wartość cechy (zmiennej) N – liczebność
ŚREDNIA WŁAŚCIWOŚCI • może być obliczona tylko dla zmiennych ilościowych • wielkość abstrakcyjna, tzn. jej wartość nie musi występować w szeregu statystycznym na podstawie którego była wyznaczana (badany o średnim wzroście nie istnieje ) • jest wielkością mianowaną wyrażoną w takich jednostkach miary jak badana cecha (średnia zarobków jest wyrażona np. w zł, tak jak wartości zmiennej płaca) • spełniona jest relacja minimum < średnia < maksimum • jest „wrażliwa” na wartości odstające 6 6 7 7 8 8 3 3 2 2 4 4 5 50 OGRANICZENIA Średniej arytmetycznej nie należy wyznaczać jeśli: • zbiorowość jest niejednorodna czyli nie wszystkie badane jednostki posiadają badaną cechę • występują wartości odstające, nietypowe (ekstremalne) Średnia 5, 0 11, 4
DOMINANTA (MODALNA, MODA) D 0 Wartość najczęściej występująca w zbiorze wartości cechy WŁAŚCIWOŚCI • charakteryzuje „typowe” jednostki w zbiorowości • jedyna miara położenia, którą można wyznaczyć dla zmiennych nominalnych • w zbiorze wartości może występować więcej niż jedna wartość dominanty • jeśli nie można wyznaczyć średniej (np. z powodu występowania wartości odstających) wyznacza się wartość dominanty
DOMINANTA (MODALNA, MODA) Liczba nb N 0 10 1 12 2 4 3 3 4 1 Studenci najczęściej opuścili jedne zajęcia (D 0=1). Wykształcenie N Wyniki sprawdzianu N Niedostateczny 5 Dopuszczający 4 Dostateczny 7 Dobry 10 Bardzo dobry 10 Zawodowe 7 Średnie 3 Wyższe 22 „Typowy” badany ma wykształcenie wyższe (D 0=„Wyższe”) Uczniowie najczęściej otrzymali ocenę dobrą lub bardzo dobrą (dwie wartości modalne) (D 0=„dobry”, D 0=„bardzo dobry”)
MEDIANA (WARTOŚĆ ŚRODKOWA) Me Taka wartość cechy (zmiennej), że co najmniej połowa jednostek zbiorowości ma wartości nie większe (czyli mniejsze lub równe) od tej wartości i równocześnie co najmniej połowa jednostek zbiorowości ma wartości nie mniejsze (większe lub równe) od tej wartości Wartość cechy (zmiennej) w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji
MEDIANA (WARTOŚĆ ŚRODKOWA) Egzamin PJ (9, 5): 3, 5, 6, 7, 11, 15 16, 17, 18 Me=11 Co najmniej połowa zdających uzyskała co najwyżej 11 punktów, co najmniej połowa zdających uzyskała przynajmniej 11 punktów Jeśli liczba obserwacji w próbie jest parzysta, wówczas mediana jest wyznaczana jako średnia z dwóch wartości leżących pośrodku Egzamin PJ (10, 5 -6): 1, 3, 5, 6, 7, 11, 15 16, 17, 18 Me=9 Połowa zdających uzyskała mniej niż 9 punktów, druga połowa zdających uzyskała więcej niż 9 punktów
MEDIANA (WARTOŚĆ ŚRODKOWA) Interpretacja mediany jako wartości, która dzieli zbiorowość na pół czyli dwie równoliczne części (mówimy, że połowa wartości jest mniejsza, połowa wartości większa od mediany) jest uproszczeniem! 1) nie da się podzielić zbiorowości o nieparzystej liczbie jednostek na pół 2) wartość mediany może występować w zbiorze wielokrotnie Me=11 Egzamin PJ (16, 8 -9): 1, 3, 4, 4, 5, 6, 7, 11, 11, 13, 15 16, 17, 18 W praktyce, kiedy zbiory danych są liczne dopuszcza się taką interpretację
KWANTYLE Wartości cechy (zmiennej), które dzielą zbiorowość na określone części pod względem liczby jednostek KWARTYLE dzielą zbiorowość na 4 części DECYLE dzielą zbiorowość na 10 części CENTYLE (PERCENTYLE) dzielą zbiorowość na 100 części
KWARTYLE Q Liczba jednostek Wartości jednostek Dzielą zbiorowość na 4 części: • Pierwszy kwartyl (Q 1), taka wartość jednostki, która dzieli zbiorowość, tak, że 25% jednostek jest od niej mniejszych, 75% większych • Drugi kwartyl (Q 2), wartość jednostki, że 50% jednostek jest od niej mniejszych, 50% większych (mediana!) • Trzeci kwartyl (Q 3), taka wartość jednostki, że 75% jednostek jest od niej mniejszych, 25% większych min Q 1 25% Q 2 Q 3 50% 75% Najbardziej typowe wartości zmiennej znajdują się między pierwszym a trzecim kwartylem max
SIATKI CENTYLOWE
SIATKI CENTYLOWE 18
ODCHYLENIE PRZECIĘTNE d Zarobki w zespole A 700 600 Odchylenie przeciętne (163 zł) 500 Średnia (405 zł) 400 300 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11 Zarobki w zespole B 700 600 Odchylenie przeciętne (56 zł) 500 Średnia (405 zł) 400 300 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11
ODCHYLENIE PRZECIĘTNE d 18 16 14 16 15 15 14 x=12 12 12 d=3 10 10 8 8 6 6 4 Res. 1 Res. 2 Res. 3 N=8 Res. 1 Res. 2 Res. 3 Res. 4 Res. 5 Res. 6 Res. 7 Res. 8 Suma Średnia Res. 4 xi 15 10 12 14 16 8 15 6 96 12 Res. 5 Res. 6 xi-x |xi-x| 3 -2 0 2 4 -4 3 -6 0 0 3 2 0 2 4 4 3 6 24 3 Res. 7 Res. 8
ODCHYLENIE PRZECIĘTNE d Średnia arytmetyczna wartości bezwzględnych odchyleń (różnic) poszczególnych wartości cechy od średniej Odchylenie przeciętne jest miarą rozrzutu. Mówi o tym, o jaką wartość różnią się przeciętnie wartości cechy (zmiennej) od średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej
WARIANCJA Średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej S 2
ODCHYLENIE STANDARDOWE S Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji
ODCHYLENIE STANDARDOWE S Zarobki w zespole A 700 Odchylenie standardowe (195 zł) 600 Odchylenie przeciętne (163 zł) 500 Średnia (405 zł) 400 300 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11 Zarobki w zespole B 700 Odchylenie standardowe (76 zł) 600 Odchylenie przeciętne (56 zł) 500 Średnia (405 zł) 400 300 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11
ODCHYLENIE STANDARDOWE S Odchylenie standardowe jest miarą rozrzutu. Mówi o tym, jak wartości cechy (zmiennej) są rozrzucone wokół średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej, im mniejsze odchylenie tym mniejsze zróżnicowanie Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej, im większa wartość odchylenia tym obserwacje są bardziej oddalone od średniej
100 zł średnia Odchylenie od średniej Odchylenie standardowe 0 zł 50 zł Odchylenie standardowe 26
KLASYCZNY WSPÓŁCZYNNIK ZMIENNOŚCI VS VS – klasyczny współczynnik zmienności S - odchylenie standardowe x - średnia Klasyczny współczynnik zmienności informuje jaki procent średniej arytmetycznej stanowi odchylenie standardowe Wartość KWZ 0 -20% 20 -40% 40 -60% Powyżej 60% Zróżnicowanie cechy Słabe Umiarkowane Silne Bardzo silne Silne lub bardzo silne zróżnicowanie cechy wskazuje, że zbiorowość jest niejednorodna, w takiej sytuacji średnia arytmetyczna jest niemiarodajną miarą – ma małą wartość poznawczą.
KLASYCZNY WSPÓŁCZYNNIK ZMIENNOŚCI Zarobki w zespole A 700 Odchylenie standardowe (195 zł) 600 Średnia (405 zł) 500 400 300 Klasyczny współczynnik zmienności 48% 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11 Zarobki w zespole B 700 Odchylenie standardowe (76 zł) 600 Średnia (405 zł) 500 400 300 Klasyczny współczynnik zmienności 19% 200 100 0 0 1 2 3 4 5 6 7 8 9 10 11
ROZKŁAD NORMALNY KRZYWA GAUSSA, KRZYWA DZWONOWA Zmienna losowa: przyjmuje wartości zależne od przypadku : ) Zmienne o rozkładzie normalnym: • poziom inteligencji, • wzrost • wyniki egzaminu Własności: • symetryczny, • średnia = dominanta = modalna 29
„miłosierdzie egzaminacyjne” ; -) 30
REGUŁA 3 SIGM Reguła trzech sigm (odchyleń standardowych) mówi, że dla rozkładu normalnego: • 68, 3% wartości cechy leży w odległości jednego odchylenia standardowego od średniej arytmetycznej • 95, 5% wartości cechy leży w odległości dwóch odchyleń od średniej • 99, 7% wartości cechy leży w odległości trzech odchyleń standardowych od średniej arytmetycznej
ILORAZ INTELIGENCJI średnia: µ= 100 odchylenie standardowe: =15 68, 3% populacji ma iloraz inteligencji mieszczący się w przedziale 85 -115 (100± 15) 95, 5% populacji ma iloraz inteligencji mieszczący się w przedziale 70 -130 (100± 2*15) 99, 7% populacji ma iloraz inteligencji mieszczący się w przedziale 55 -145 (100± 3*15)
ŚREDNIA Z SESJI średnia: µ= 4, 0 odchylenie standardowe: =0, 3 68, 3% studentów ma średnią z sesji mieszczącą się w przedziale 3, 7 -4, 3 95, 5% studentów ma średnią z sesji mieszczącą się w przedziale 3, 4 -4, 6 99, 7% studentów ma średnią z sesji mieszczącą się w przedziale 3, 1 -4, 9
- Slides: 33