Statystyczna analiza danych za pomoc arkusza kalkulacyjnego EXCEL

  • Slides: 49
Download presentation
Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v.

Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4. 2 Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt 1

Rodzaje analiz • Statystyki opisowe zjawisk masowych (miary Statystyki opisowe zjawisk masowych średnie i

Rodzaje analiz • Statystyki opisowe zjawisk masowych (miary Statystyki opisowe zjawisk masowych średnie i pozycyjne, miary zmienności, miary asymetrii i koncentracji) • Estymacja przedziałowa • Testowanie hipotezy o równości dwóch wariancji • Testowanie hipotezy o równości dwóch średnich • Analiza wariancji • Analiza korelacji i regresji • Test chi kwadrat 2

Statystyki opisowe Jak obliczyć? • Klasyczne podejście – funkcje statystyczne • Dodatek – Analiza

Statystyki opisowe Jak obliczyć? • Klasyczne podejście – funkcje statystyczne • Dodatek – Analiza danych • Tabela przestawna 3

Funkcje są wstępnie zdefiniowanymi formułami wykonującymi obliczenia z wykorzystaniem określonych wartości nazywanych argumentami i

Funkcje są wstępnie zdefiniowanymi formułami wykonującymi obliczenia z wykorzystaniem określonych wartości nazywanych argumentami i w konkretnym porządku nazywanym składnią. Składnia funkcji: =nazwa. funkcji(argumenty) 4

Dane 5

Dane 5

Funkcje – tworzymy legendę 6

Funkcje – tworzymy legendę 6

Funkcje – kreator funkcji 7

Funkcje – kreator funkcji 7

Pomoc do funkcji 8

Pomoc do funkcji 8

Funkcje – obliczamy kolejne średnie 9

Funkcje – obliczamy kolejne średnie 9

Funkcje – przeciągnij Arkusze kalkulacyjne posiadają ceną własność, która polega na szybkim powielaniu przez

Funkcje – przeciągnij Arkusze kalkulacyjne posiadają ceną własność, która polega na szybkim powielaniu przez przeciąganie rozwiązań (obliczonych funkcji) z jednej kolumny na wszystkie następne 10

Funkcje – przeciągnij 11

Funkcje – przeciągnij 11

Funkcje – przykłady 12

Funkcje – przykłady 12

Wykaz funkcji statystycznych (83) 13

Wykaz funkcji statystycznych (83) 13

Dodatek Analiza danych 14

Dodatek Analiza danych 14

Jak włączyć Analiza danych Zaznaczyć pole wyboru Analysis Tool. Pak? 15

Jak włączyć Analiza danych Zaznaczyć pole wyboru Analysis Tool. Pak? 15

Analiza danych – obliczenia Zaznaczamy zmienne, które chcemy objąć obliczeniami – możemy podać zakres

Analiza danych – obliczenia Zaznaczamy zmienne, które chcemy objąć obliczeniami – możemy podać zakres z klawiatury Liczymy miary położenia, zmienności, asymetrii i skupienia rozkładu ! Te same dane – jagnięta. Zaznaczamy pole wyboru „Tytuły w pierwszym wierszu”, ponieważ wiersz ten zawiera nazwy zmiennych Zaznaczamy pole wyboru „Statystyki podsumowujące” 16

Analiza danych – wyniki 17

Analiza danych – wyniki 17

Tabela przestawna Zanim uruchomimy ten mechanizm! • Eliminujemy dublujące się nazwy zmiennych • Usuwamy

Tabela przestawna Zanim uruchomimy ten mechanizm! • Eliminujemy dublujące się nazwy zmiennych • Usuwamy puste kolumny i wiersze w istniejącym bloku danych 18

Sytuacja niedopuszczalna! 19

Sytuacja niedopuszczalna! 19

Liczymy za pomocą tabeli przestawnej • średnią arytmetyczną w odniesieniu do wybranych cech użytkowości

Liczymy za pomocą tabeli przestawnej • średnią arytmetyczną w odniesieniu do wybranych cech użytkowości rzeźnej z podziałem na grupy rasowe i z uwzględnieniem płci zwierzęcia 20

2. w zakładce Wstawianie klikamy na pole TABELA PRZESTAWNA, wybieramy z listy TABELA PRZESTAWNA

2. w zakładce Wstawianie klikamy na pole TABELA PRZESTAWNA, wybieramy z listy TABELA PRZESTAWNA a zatem. . . 1. Klikamy na dowolną komórkę należącą do listy danych! 21

Tabela, krok po kroku Sprawdźmy wzrokowo czy proponowany przez program zakres (obszar zaznaczony przerywaną

Tabela, krok po kroku Sprawdźmy wzrokowo czy proponowany przez program zakres (obszar zaznaczony przerywaną linią) pokrywa się z rzeczywistym obszarem naszych danych! 22

Tabela (kolejny krok), projektujemy układ! Element kolumn i wierszy – obszary na które przeciągamy

Tabela (kolejny krok), projektujemy układ! Element kolumn i wierszy – obszary na które przeciągamy z LISTY PÓL nazwy zmiennych utożsamianych z czynnikami doświadczalnymi, np. GEN, PLEC! Element danych – na ten obszar przeciągamy z LISTY PÓL nazwy tych zmiennych, dla których obliczamy średnią arytmetyczną, odchylenie standardowe, np. MCPOM, WYSKLAB! 23

Tabela – ustawiamy rodzaj obliczanej miary i format liczby Wskazujemy miarę, którą chcemy obliczyć

Tabela – ustawiamy rodzaj obliczanej miary i format liczby Wskazujemy miarę, którą chcemy obliczyć Określamy format liczby, np. ilość miejsc po przecinku 24

Tabela – różne układy 25

Tabela – różne układy 25

Estymacja przedziałowa – Analiza danych (Wyznaczamy przedział ufności dla średniej arytmetycznej) W celu wyznaczenia

Estymacja przedziałowa – Analiza danych (Wyznaczamy przedział ufności dla średniej arytmetycznej) W celu wyznaczenia przedziału ufności obliczone przez program wartości należy odjąć a następnie dodać do średniej arytmetycznej. W pierwszym przypadku obliczymy lewą, w drugim prawą stronę przedziału ufności. Przykład. Średnia wysokość w kłębie wyniosła 56, 5 cm. Zatem lewa strona przedziału ufności wynosi: 56, 5 cm – 0, 67 = 55, 83. Z kolei prawa strona przedziału wynosi 57, 17 cm (56, 5 cm + 0, 67 cm). 26

Testowanie hipotezy o równości dwóch wariancji (funkcja) • Hipoteza zerowa: zakładamy, że zmienność (wariancja)

Testowanie hipotezy o równości dwóch wariancji (funkcja) • Hipoteza zerowa: zakładamy, że zmienność (wariancja) populacji generalnej mieszańców i jagnią czystorasowych w zakresie wymiarów zoometrycznych oraz cech użytkowości rzeźnej jest podobna! • Wykonujemy test Fishera! Korzystamy z funkcji statystycznej test. f() 27

Test Fishera Jeżeli otrzymane prawdopodobieństwo jest większe niż 0, 05 to nie mamy podstaw

Test Fishera Jeżeli otrzymane prawdopodobieństwo jest większe niż 0, 05 to nie mamy podstaw do odrzucenia H 0! H 0: D 2(X 1) = D 2(X 2) H 0 odrzucamy w odniesieniu do obwodu klatki piersiowej! Wnioskujemy zatem, że zmienność obwodu klatki piersiowej w populacji mieszańców i zwierząt czystorasowych 28 jest statystycznie różna!

Test Fishera – Analiza danych W przypadku, gdy hipoteza alternatywna posiada następującą postać: H

Test Fishera – Analiza danych W przypadku, gdy hipoteza alternatywna posiada następującą postać: H 1: D 2(X 1) D 2(X 2), otrzymane prawdopodobieństwo (P(F <= f)) należy pomnożyć przez 2. 29

Testowanie hipotezy o równości dwóch średnich Wpisujemy liczbę „ 2”, gdy zmienność w porównywanych

Testowanie hipotezy o równości dwóch średnich Wpisujemy liczbę „ 2”, gdy zmienność w porównywanych grupach jest podobna! H 0: E(X 1) = E(X 2) Wpisujemy liczbę „ 3”, gdy zmienność w porównywanych grupach jest różna! 30

to samo za pomocą Analiza danych 31

to samo za pomocą Analiza danych 31

Analiza wariancji, jednoczynnikowa Zanim zaczniemy analizę wariancji musimy odpowiednio przygotować dane! Układamy wartości zmiennej

Analiza wariancji, jednoczynnikowa Zanim zaczniemy analizę wariancji musimy odpowiednio przygotować dane! Układamy wartości zmiennej „udział wyrębów wartościowych” w trzech kolumnach – reprezentują one trzy grupy rasowe! Następnie uruchamiamy moduł Analiza danych – Analiza wariancji jednoczynnikowa! 32

Analiza wariancji jednoczynnikowa – wyniki Pomiędzy grupami – międzygrupowa W obrębie grup – wewnątrzgrupowa

Analiza wariancji jednoczynnikowa – wyniki Pomiędzy grupami – międzygrupowa W obrębie grup – wewnątrzgrupowa Razem – ogólna SS – Suma kwadratów odchyleń df – liczba stopni swobody MS – średni kwadrat odchyleń F – F empiryczne Wartość p – prawdopodobieństwo otrzymania hipotezy zerowej 33 Test F – wartość krytyczna testy Fishera-Snedecora

Korelacja prostoliniowa 34

Korelacja prostoliniowa 34

Korelacje – Analiza danych Wskazujemy kolumny zawierające zmienne, które chcemy skorelować Zaznaczamy to pole,

Korelacje – Analiza danych Wskazujemy kolumny zawierające zmienne, które chcemy skorelować Zaznaczamy to pole, ponieważ pierwszy wiersz zawiera dane nienumeryczne – nazwy zmiennych 35

Korelacja, wyniki Mnóstwo liczb, tj. obliczonych współczynników korelacji Pearsona! Czy zależności są istotne? 36

Korelacja, wyniki Mnóstwo liczb, tj. obliczonych współczynników korelacji Pearsona! Czy zależności są istotne? 36

Wykres rozrzutu 1. Zaznaczamy zmienne (pierwsza niezależna, druga zależna) 2. W zakładce Wstawianie kilkamy

Wykres rozrzutu 1. Zaznaczamy zmienne (pierwsza niezależna, druga zależna) 2. W zakładce Wstawianie kilkamy na wykres Punktowy 37

Wykres po obróbce 38

Wykres po obróbce 38

Regresja, funkcje Współczynnik regresji • = NACHYLENIE(znane_y ; znane_x) – • Znane_y jest to

Regresja, funkcje Współczynnik regresji • = NACHYLENIE(znane_y ; znane_x) – • Znane_y jest to tablica lub zakres komórek liczbowych zależnych punktów danych. • Znane_x jest to zbiór niezależnych punktów danych 39

Regresja, funkcje 40

Regresja, funkcje 40

Współczynnik regresji, wynik 41

Współczynnik regresji, wynik 41

Regresja, Analiza danych 42

Regresja, Analiza danych 42

Regresja, wyniki 43

Regresja, wyniki 43

Test niezależności chi kwadrat fo – wartość otrzymana; fe – wartość oczekiwana 44

Test niezależności chi kwadrat fo – wartość otrzymana; fe – wartość oczekiwana 44

Dodatek Merlin v 2. 5. (Neil Millar) Merlin umożliwia przeprowadzenie szeregu testów nieparametrycznych, jak

Dodatek Merlin v 2. 5. (Neil Millar) Merlin umożliwia przeprowadzenie szeregu testów nieparametrycznych, jak np. : test U Mann-Whitney, Kruskal-Wallis, Wilcoxona, Friedmana. Pobrać ze strony: http: //www. heckgrammar. kirklees. sch. uk/index. php? p=10310 W celu aktywacji dodatku Merlina należy skopiować pobrany plik merlin. xla do folderu: C: Program FilesMicrosoft OfficeOFFICE 11Library (wersja OFFICE może być inna, np. OFFICE 10, 12) Dodatek uaktywniamy podobnie, jak moduł Analiza danych (W OFFICE 11 i niższych wersjach klikamy w pasku menu na Narzędzia, a następnie na Dodatki). 45

Merlin – funkcje 46

Merlin – funkcje 46

Merlin – test U Mann-Whitney 47

Merlin – test U Mann-Whitney 47

Merlin – Kruskal-Wallis 48

Merlin – Kruskal-Wallis 48

Merlin – Wilcoxon 49

Merlin – Wilcoxon 49