Zmienne losowe Odpowiednik cechy statystycznej w statystyce opisowej

  • Slides: 31
Download presentation
Zmienne losowe Odpowiednik cechy statystycznej w statystyce opisowej Zmienna losowa – funkcja przyporządkowująca każdemu

Zmienne losowe Odpowiednik cechy statystycznej w statystyce opisowej Zmienna losowa – funkcja przyporządkowująca każdemu zdarzeniu elementarnemu dowolną liczbę rzeczywistą Inaczej: Zmienna losowa X to liczbowa prezentacja wyniku doświadczenia losowego Jeszcze inaczej: Zmienna losowa to funkcja, która w wyniku doświadczenia przybiera jedną wartość ze zbioru wszystkich wartości, jakie ta zmienna może przyjąć

Zmienne losowe Funkcja rozkładu prawdopodobieństwa Funkcja przyporządkowująca poszczególnym realizacjom zmiennej losowej określone prawdopodobieństwo Dlaczego?

Zmienne losowe Funkcja rozkładu prawdopodobieństwa Funkcja przyporządkowująca poszczególnym realizacjom zmiennej losowej określone prawdopodobieństwo Dlaczego? - ponieważ konkretne realizacje zmiennej losowej są zdarzeniami losowymi więc można określić ich prawdopodobieństwo)

Zmienne losowe Skokowe (dyskretne)- przyjmują tylko określone wartości; Np. l-ba oczek która wypadnie w

Zmienne losowe Skokowe (dyskretne)- przyjmują tylko określone wartości; Np. l-ba oczek która wypadnie w rzucie kostką do gry Ciągłe- przyjmują dowolne wartości.

Zmienne losowe Jeżeli mierzona wielkość jest związana ze zmienną losowąjest to jednowymiarowa zmienna losowa

Zmienne losowe Jeżeli mierzona wielkość jest związana ze zmienną losowąjest to jednowymiarowa zmienna losowa Jeżeli mierzona wielkość jest związana z 2 lub 3 zmiennymi losowymi- dwuwymiarowa / trójwymiarowa zmienna losowa

Rozkłady zmiennych losowych Dane zbierane podczas pomiarów zawsze układają się w pewien określony sposób.

Rozkłady zmiennych losowych Dane zbierane podczas pomiarów zawsze układają się w pewien określony sposób. To w jaki, zależy przede wszystkim od zjawiska, które jest obserwowane. Sposób, w jaki układają się dane- rozkład zmiennej losowej.

Model probabilistyczny Opisujemy rozkład empiryczny (doświadczalny) pewną krzywą ciągłą- sprawdzamy, czy nasze wyniki można

Model probabilistyczny Opisujemy rozkład empiryczny (doświadczalny) pewną krzywą ciągłą- sprawdzamy, czy nasze wyniki można opisać rozkładem teoretycznym. Nasze wyniki traktujemy jak zmienną losową.

Rozkłady zmiennych losowych -Bernoulliego - Beta - Dwumianowy - Chi-kwadrat - Wykładniczy - F

Rozkłady zmiennych losowych -Bernoulliego - Beta - Dwumianowy - Chi-kwadrat - Wykładniczy - F (Fischera-Snedeckora) - Gamma - Geometryczny - Gompertza - Logistyczny -Logarytmicznonormalny - Pareto -Poissona - Prostokątny - Rayleigha - Średniej - t-studenta - Weibulla - Normalny

Rozkład normalny Krzywa Gaussa: Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do

Rozkład normalny Krzywa Gaussa: Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej. m

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: -Występuje

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: -Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu; m

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: -

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: - Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne; m

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: -

Rozkład normalny Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: - Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości. m

Rozkład normalny Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują

Rozkład normalny Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej. m

Rozkład normalny Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka. Należy spodziewać

Rozkład normalny Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka. Należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

Rozkład normalny Najważniejszy rozkład zmiennej losowej ciągłej, ponieważ • przy nieograniczonym wzroście l-by niezależnych

Rozkład normalny Najważniejszy rozkład zmiennej losowej ciągłej, ponieważ • przy nieograniczonym wzroście l-by niezależnych doświadczeń statystycznych WSZYSTKIE znane teoretyczne rozkłady zmiennych losowych ciągłych i dyskretnych są SZYBKO ZBIEŻNE do rozkładu normalnego • w badaniu prób losowych popełniane są błędy przypadkowe, których rozkład jest normalny lub zbliżony do normalnego

Rozkład normalny Gęstość prawdopodobieństwa m i to parametry rozkładu (mając ich wartości uzyskamy gotową

Rozkład normalny Gęstość prawdopodobieństwa m i to parametry rozkładu (mając ich wartości uzyskamy gotową krzywą Gaussa) Rozkład ten jest określony w przedziale (- , + )

Rozkład normalny

Rozkład normalny

Rozkład normalny Zasada 3 : 68% wartości cechy leży w odległości od m; 95,

Rozkład normalny Zasada 3 : 68% wartości cechy leży w odległości od m; 95, 5% wartości cechy leży w odległości 2 od m; 99, 7% wartości cechy leży w odległości 3 od m;

Weryfikacja hipotez statystycznych za pomocą testów stat. Hipotezy nieparametryczne Badanie zgodności rozkładu empirycznego z

Weryfikacja hipotez statystycznych za pomocą testów stat. Hipotezy nieparametryczne Badanie zgodności rozkładu empirycznego z rozkładami teoretycznymi

Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Jakim rozkładem teoretycznym (konkretnym wzorem matematycznym)

Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Jakim rozkładem teoretycznym (konkretnym wzorem matematycznym) możemy opisać rozkład (histogram) naszych danych doświadczalnych ?

Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Nie satysfakcjonuje nas sama eksploracja danych?

Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Nie satysfakcjonuje nas sama eksploracja danych? Na podstawie dopasowanego modelu teoretycznego prognozujemy, jak np. zjawisko będzie wyglądało w przyszłym roku Chcemy użyć metody statystycznej wymagającej rozkładu normalnego? Sprawdzamy czy nasza zmienna/zmienne spełnia/spełniają rozkład normalny

Badanie zgodności rozkładu empirycznego z teoretycznym JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie

Badanie zgodności rozkładu empirycznego z teoretycznym JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy 2. analiza histogramu 3. analiza wykresów P-P 4. testy normalności

Badanie zgodności rozkładu empirycznego z teoretycznym 1. Porównanie skośności i kurtozy Skośność mierzy odchylenie

Badanie zgodności rozkładu empirycznego z teoretycznym 1. Porównanie skośności i kurtozy Skośność mierzy odchylenie rozkładu od symetrii. Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny. Rozkład normalny jest symetryczny!!!!!!

Badanie zgodności rozkładu empirycznego z teoretycznym 1. Porównanie skośności i kurtozy Kurtoza mierzy "spiczastość"

Badanie zgodności rozkładu empirycznego z teoretycznym 1. Porównanie skośności i kurtozy Kurtoza mierzy "spiczastość" rozkładu. Jeśli wartość kurtozy jest wyraźnie różna od zera, wówczas rozkład jest albo bardziej płaski albo bardziej spiczasty niż rozkład normalny. Wartość kurtozy dla rozkładu normalnego wynosi 0!

Badanie zgodności rozkładu empirycznego z teoretycznym 2. Analiza histogramu

Badanie zgodności rozkładu empirycznego z teoretycznym 2. Analiza histogramu

Badanie zgodności rozkładu empirycznego z teoretycznym 3. Analiza wykresów P-P Wykres prawdopodobieństwo-prawdopodobieństwo Dystrybuanta empiryczna

Badanie zgodności rozkładu empirycznego z teoretycznym 3. Analiza wykresów P-P Wykres prawdopodobieństwo-prawdopodobieństwo Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej. Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.

Badanie zgodności rozkładu empirycznego z teoretycznym 3. Analiza wykresów P-P

Badanie zgodności rozkładu empirycznego z teoretycznym 3. Analiza wykresów P-P

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności W celu zidentyfikowania rozkładu zazwyczaj

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności W celu zidentyfikowania rozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez: porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności częstości zaobserwowane w danych rzeczywistych

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności częstości zaobserwowane w danych rzeczywistych częstości oczekiwane rozkładu teoretycznego

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności -chi kwadrat -Kołmogorowa-Smirnowa -Lillieforsa -

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności -chi kwadrat -Kołmogorowa-Smirnowa -Lillieforsa - Shapiro-Wilka

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności 1. Hipoteza zerowa – rozkład

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności 1. Hipoteza zerowa – rozkład jest normalny H 0: F(x) = Fn(x) 2. Hipoteza alternatywna – rozkład jest różny od rozkładu normalnego H 1: F(x) Fn(x)

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności W Web. Statistica p <

Badanie zgodności rozkładu empirycznego z teoretycznym 4. Testy normalności W Web. Statistica p < 0, 05 p 0, 05 Odrzucamy H 0 Rozkład empiryczny nie jest rozkładem normalnym Przyjmujemy H 0 Rozkład empiryczny jest rozkładem normalnym