Statystyczna analiza danych za pomoc arkusza kalkulacyjnego EXCEL
- Slides: 49
Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4. 2 Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt 1
Rodzaje analiz • Statystyki opisowe zjawisk masowych (miary Statystyki opisowe zjawisk masowych średnie i pozycyjne, miary zmienności, miary asymetrii i koncentracji) • Estymacja przedziałowa • Testowanie hipotezy o równości dwóch wariancji • Testowanie hipotezy o równości dwóch średnich • Analiza wariancji • Analiza korelacji i regresji • Test chi kwadrat 2
Statystyki opisowe Jak obliczyć? • Klasyczne podejście – funkcje statystyczne • Dodatek – Analiza danych • Tabela przestawna 3
Funkcje są wstępnie zdefiniowanymi formułami wykonującymi obliczenia z wykorzystaniem określonych wartości nazywanych argumentami i w konkretnym porządku nazywanym składnią. Składnia funkcji: =nazwa. funkcji(argumenty) 4
Dane 5
Funkcje – tworzymy legendę 6
Funkcje – kreator funkcji 7
Pomoc do funkcji 8
Funkcje – obliczamy kolejne średnie 9
Funkcje – przeciągnij Arkusze kalkulacyjne posiadają ceną własność, która polega na szybkim powielaniu przez przeciąganie rozwiązań (obliczonych funkcji) z jednej kolumny na wszystkie następne 10
Funkcje – przeciągnij 11
Funkcje – przykłady 12
Wykaz funkcji statystycznych (83) 13
Dodatek Analiza danych 14
Jak włączyć Analiza danych Zaznaczyć pole wyboru Analysis Tool. Pak? 15
Analiza danych – obliczenia Zaznaczamy zmienne, które chcemy objąć obliczeniami – możemy podać zakres z klawiatury Liczymy miary położenia, zmienności, asymetrii i skupienia rozkładu ! Te same dane – jagnięta. Zaznaczamy pole wyboru „Tytuły w pierwszym wierszu”, ponieważ wiersz ten zawiera nazwy zmiennych Zaznaczamy pole wyboru „Statystyki podsumowujące” 16
Analiza danych – wyniki 17
Tabela przestawna Zanim uruchomimy ten mechanizm! • Eliminujemy dublujące się nazwy zmiennych • Usuwamy puste kolumny i wiersze w istniejącym bloku danych 18
Sytuacja niedopuszczalna! 19
Liczymy za pomocą tabeli przestawnej • średnią arytmetyczną w odniesieniu do wybranych cech użytkowości rzeźnej z podziałem na grupy rasowe i z uwzględnieniem płci zwierzęcia 20
2. w zakładce Wstawianie klikamy na pole TABELA PRZESTAWNA, wybieramy z listy TABELA PRZESTAWNA a zatem. . . 1. Klikamy na dowolną komórkę należącą do listy danych! 21
Tabela, krok po kroku Sprawdźmy wzrokowo czy proponowany przez program zakres (obszar zaznaczony przerywaną linią) pokrywa się z rzeczywistym obszarem naszych danych! 22
Tabela (kolejny krok), projektujemy układ! Element kolumn i wierszy – obszary na które przeciągamy z LISTY PÓL nazwy zmiennych utożsamianych z czynnikami doświadczalnymi, np. GEN, PLEC! Element danych – na ten obszar przeciągamy z LISTY PÓL nazwy tych zmiennych, dla których obliczamy średnią arytmetyczną, odchylenie standardowe, np. MCPOM, WYSKLAB! 23
Tabela – ustawiamy rodzaj obliczanej miary i format liczby Wskazujemy miarę, którą chcemy obliczyć Określamy format liczby, np. ilość miejsc po przecinku 24
Tabela – różne układy 25
Estymacja przedziałowa – Analiza danych (Wyznaczamy przedział ufności dla średniej arytmetycznej) W celu wyznaczenia przedziału ufności obliczone przez program wartości należy odjąć a następnie dodać do średniej arytmetycznej. W pierwszym przypadku obliczymy lewą, w drugim prawą stronę przedziału ufności. Przykład. Średnia wysokość w kłębie wyniosła 56, 5 cm. Zatem lewa strona przedziału ufności wynosi: 56, 5 cm – 0, 67 = 55, 83. Z kolei prawa strona przedziału wynosi 57, 17 cm (56, 5 cm + 0, 67 cm). 26
Testowanie hipotezy o równości dwóch wariancji (funkcja) • Hipoteza zerowa: zakładamy, że zmienność (wariancja) populacji generalnej mieszańców i jagnią czystorasowych w zakresie wymiarów zoometrycznych oraz cech użytkowości rzeźnej jest podobna! • Wykonujemy test Fishera! Korzystamy z funkcji statystycznej test. f() 27
Test Fishera Jeżeli otrzymane prawdopodobieństwo jest większe niż 0, 05 to nie mamy podstaw do odrzucenia H 0! H 0: D 2(X 1) = D 2(X 2) H 0 odrzucamy w odniesieniu do obwodu klatki piersiowej! Wnioskujemy zatem, że zmienność obwodu klatki piersiowej w populacji mieszańców i zwierząt czystorasowych 28 jest statystycznie różna!
Test Fishera – Analiza danych W przypadku, gdy hipoteza alternatywna posiada następującą postać: H 1: D 2(X 1) D 2(X 2), otrzymane prawdopodobieństwo (P(F <= f)) należy pomnożyć przez 2. 29
Testowanie hipotezy o równości dwóch średnich Wpisujemy liczbę „ 2”, gdy zmienność w porównywanych grupach jest podobna! H 0: E(X 1) = E(X 2) Wpisujemy liczbę „ 3”, gdy zmienność w porównywanych grupach jest różna! 30
to samo za pomocą Analiza danych 31
Analiza wariancji, jednoczynnikowa Zanim zaczniemy analizę wariancji musimy odpowiednio przygotować dane! Układamy wartości zmiennej „udział wyrębów wartościowych” w trzech kolumnach – reprezentują one trzy grupy rasowe! Następnie uruchamiamy moduł Analiza danych – Analiza wariancji jednoczynnikowa! 32
Analiza wariancji jednoczynnikowa – wyniki Pomiędzy grupami – międzygrupowa W obrębie grup – wewnątrzgrupowa Razem – ogólna SS – Suma kwadratów odchyleń df – liczba stopni swobody MS – średni kwadrat odchyleń F – F empiryczne Wartość p – prawdopodobieństwo otrzymania hipotezy zerowej 33 Test F – wartość krytyczna testy Fishera-Snedecora
Korelacja prostoliniowa 34
Korelacje – Analiza danych Wskazujemy kolumny zawierające zmienne, które chcemy skorelować Zaznaczamy to pole, ponieważ pierwszy wiersz zawiera dane nienumeryczne – nazwy zmiennych 35
Korelacja, wyniki Mnóstwo liczb, tj. obliczonych współczynników korelacji Pearsona! Czy zależności są istotne? 36
Wykres rozrzutu 1. Zaznaczamy zmienne (pierwsza niezależna, druga zależna) 2. W zakładce Wstawianie kilkamy na wykres Punktowy 37
Wykres po obróbce 38
Regresja, funkcje Współczynnik regresji • = NACHYLENIE(znane_y ; znane_x) – • Znane_y jest to tablica lub zakres komórek liczbowych zależnych punktów danych. • Znane_x jest to zbiór niezależnych punktów danych 39
Regresja, funkcje 40
Współczynnik regresji, wynik 41
Regresja, Analiza danych 42
Regresja, wyniki 43
Test niezależności chi kwadrat fo – wartość otrzymana; fe – wartość oczekiwana 44
Dodatek Merlin v 2. 5. (Neil Millar) Merlin umożliwia przeprowadzenie szeregu testów nieparametrycznych, jak np. : test U Mann-Whitney, Kruskal-Wallis, Wilcoxona, Friedmana. Pobrać ze strony: http: //www. heckgrammar. kirklees. sch. uk/index. php? p=10310 W celu aktywacji dodatku Merlina należy skopiować pobrany plik merlin. xla do folderu: C: Program FilesMicrosoft OfficeOFFICE 11Library (wersja OFFICE może być inna, np. OFFICE 10, 12) Dodatek uaktywniamy podobnie, jak moduł Analiza danych (W OFFICE 11 i niższych wersjach klikamy w pasku menu na Narzędzia, a następnie na Dodatki). 45
Merlin – funkcje 46
Merlin – test U Mann-Whitney 47
Merlin – Kruskal-Wallis 48
Merlin – Wilcoxon 49
- Budowa okna arkusza kalkulacyjnego
- 2 zasada termodynamiki
- Ekstrapolacja
- Statystyczna karta wypadku doc
- Typy danych excel
- Wniosek do kuratora o pomoc postpenitencjarna
- Jednokratna pomoc
- Skidanje kacige prva pomoc
- Pierwsza pomoc na wakacjach
- Prva pomoč sample
- Digitalna kompresija prva pomoc
- Zadławienie pierwsza pomoc
- Uhryznutie hadom
- Zapadnuty jazyk prva pomoc
- Trojhmat první pomoc
- Trostruki hvat prva pomoc
- Dijagonala pravokutnika
- "elektrody" "defibrylatora"
- Sociální pomoc
- Pomoc psychologiczno-pedagogiczna definicja
- První pomoc při úrazu elektrickým proudem wikipedie
- Pomoc
- Pomoc psychologiczno-pedagogiczna prezentacja
- Denarna socialna pomoč prihranki
- Cukiernik opis zawodu
- "pomoc dzieciom"
- Prva pomoc pri poraneni mozgu a miechy
- Avpu první pomoc
- Utonięcia pierwsza pomoc
- "pomoc dzieciom"
- Zadławienie pierwsza pomoc
- Kopiec struktura danych
- Porządkowanie i grupowanie danych statystycznych
- Dkms zmiana danych
- Ochrona danych osobowych studia podyplomowe
- Algorytmy i struktury danych
- Metody klasyfikacji danych
- światowy kościół twórcy
- Bazy danych podstawowe pojęcia
- Diagramy chena
- Gotowe bazy danych
- Podstawowe pojęcia baz danych
- Relacyjne bazy danych prezentacja
- Obiektowe bazy danych przykłady
- Wprowadzenie do systemów baz danych
- Nie podawaj swoich danych osobowych
- Baza danych o produktach i opakowaniach
- Zalety korzystania z komputerowych baz danych
- Hierarchia encji
- Rodzaje transmisji danych w sieciach