Nowy kod Statistica 6 1 HEN 6 EUEKH

  • Slides: 36
Download presentation
Nowy kod Statistica 6. 1 HEN 6 EUEKH 8

Nowy kod Statistica 6. 1 HEN 6 EUEKH 8

Plan na dziś Analiza wariancji 1. Podstawy i założenia 2. Kontrasty i analiza post-hoc

Plan na dziś Analiza wariancji 1. Podstawy i założenia 2. Kontrasty i analiza post-hoc 3. Przykład – szczury w labiryncie 4. Zadanie

ANOVA – analiza wariancji Bada hipotezę, że wiele grup ma taką samą średnią. Wyróżnia

ANOVA – analiza wariancji Bada hipotezę, że wiele grup ma taką samą średnią. Wyróżnia w całkowitej wariancji część, za którą jest odpowiedzialny czynnik grupujący i odnosi do reszty wariancji (test F).

Typowe zadanie • Czy środowisko (otwarte/ograniczone) ma wpływ na inteligencję? • Dwa środowiska: –

Typowe zadanie • Czy środowisko (otwarte/ograniczone) ma wpływ na inteligencję? • Dwa środowiska: – otwarte – zamknięte • Trzy rasy szczurów: – Inteligentne – Mieszane – Głupie

Błędy w labiryncie

Błędy w labiryncie

ANOVA i test t Jeżeli dwie grupy to ANOVA = test t. Po co

ANOVA i test t Jeżeli dwie grupy to ANOVA = test t. Po co więc ANOVA? Elastyczna – - wiele czynników - interakcje między nimi - powtarzane pomiary - wiele zmiennych zależnych (MANOVA) Więcej czynników – mniejszy błąd!

Wiele czynników Badany czynnik Inteligencja szczura = środowisko + RASA + reszta • Czynnik

Wiele czynników Badany czynnik Inteligencja szczura = środowisko + RASA + reszta • Czynnik RASA zmniejsza RESZTĘ! • Jeżeli czynnik nie ma znaczenia nie powinien być w modelu! • Błędy powinny mieć rozkład normalny!

Interakcje Gdy jeden czynnik jest modyfikowany przez drugi Np. efekt środowiska może być zależny

Interakcje Gdy jeden czynnik jest modyfikowany przez drugi Np. efekt środowiska może być zależny od rasy

Powtarzane pomiary. . . gdy obiekt obserwowany jest dwa lub więcej razy np. badamy

Powtarzane pomiary. . . gdy obiekt obserwowany jest dwa lub więcej razy np. badamy szczura przed i po skarmieniu paszy Dodatkowy czynnik różnicujący pomiary wewnątrz grup.

Wiele zmiennych zależnych MANOVA pozwala przetestować hipotezę typu: Środowisko wpływa na wyniki różnych testów

Wiele zmiennych zależnych MANOVA pozwala przetestować hipotezę typu: Środowisko wpływa na wyniki różnych testów inteligencji szczura.

Założenia - normalność Zmienna zależna ma rozkład normalny w grupach (normalność reszt) ANOVA jest

Założenia - normalność Zmienna zależna ma rozkład normalny w grupach (normalność reszt) ANOVA jest odporna, szczególnie przy dużej liczbie obserwacji.

Jednorodność wariancji We wszystkich grupach wariancja powinna być taka sama. Małe różnice nie są

Jednorodność wariancji We wszystkich grupach wariancja powinna być taka sama. Małe różnice nie są groźne, ale uwaga na obserwacje odstające!. . . i korelacje średnia-wariancja

Średnie 1. obserwowane brzegowe, nieważone 2. obserwowane brzegowe ważone 3. najmniejszych kwadratów

Średnie 1. obserwowane brzegowe, nieważone 2. obserwowane brzegowe ważone 3. najmniejszych kwadratów

Obserwowane średnie nieważone Inteligencja = środowisko + płeć + błąd Środowisko otwarte - samce:

Obserwowane średnie nieważone Inteligencja = środowisko + płeć + błąd Środowisko otwarte - samce: 6, 5, 4 (6+5+4)/3=5 - samice 6, 5 ( 6 + 5 ) / 2 = 5, 5 ( 5 + 5, 5 ) / 2 = 5, 25

Obserwowane średnie ważone Środowisko otwarte - samce: 6, 5, 4 - samice 6, 5

Obserwowane średnie ważone Środowisko otwarte - samce: 6, 5, 4 - samice 6, 5 ( 6 + 5 + 4 + 6 + 5 ) / 5 = 5, 20

Średnie najmniejszych kwadratów Najbardziej interesujące i te testujemy! Oczekiwane (przewidywane) średnie brzegowe Dla niektórych

Średnie najmniejszych kwadratów Najbardziej interesujące i te testujemy! Oczekiwane (przewidywane) średnie brzegowe Dla niektórych układów równe średnim obserwowanym nieważonym

Średnie najmniejszych kwadratów (błędów/reszt) Inteligencja = środowisko + rasa + błąd Błąd = Inteligencja

Średnie najmniejszych kwadratów (błędów/reszt) Inteligencja = środowisko + rasa + błąd Błąd = Inteligencja – środowisko - rasa Wyznaczamy średnie dla czynników środowiska i ras tak by suma wszystkich kwadratów błędów była jak najmniejsza!

Kontrasty Jeżeli hipoteza ‘wszystkie średnie są równe’ jest zbyt prosta Pozwalają testować złożoną hipotezę,

Kontrasty Jeżeli hipoteza ‘wszystkie średnie są równe’ jest zbyt prosta Pozwalają testować złożoną hipotezę, którą przewidujemy, np. Środowisko otwarte rozwija inteligencję, ale tylko w rasach „inteligentnych”, natomiast środowisko zamknięta obniża inteligencję we wszystkich rasach.

Kontrasty Np. hipotezę „Rasa inteligentna różni się od dwóch pozostałych” testujemy jako I =

Kontrasty Np. hipotezę „Rasa inteligentna różni się od dwóch pozostałych” testujemy jako I = μintelig. – 0. 5μmieszana – 0. 5μgłupia = 0

Porównania post-hoc Gdy hipotezę formułujemy ‘po’ analizie wariancji Whooh! Nie wiedziałem, że rasa „inteligentna”

Porównania post-hoc Gdy hipotezę formułujemy ‘po’ analizie wariancji Whooh! Nie wiedziałem, że rasa „inteligentna” tak bardzo się różni od „głupiej”. Czy istotnie? Wybieramy świadomie dwie ekstremalne grupy, a nie dwie losowe! Chroń się przed błędem I-go rodzaju! Błąd I – odrzucenie prawdziwej hipotezy H 0

Porównania post-hoc (po analizie wariancji) No tak! Rasa ma istotny wpływ na inteligencję. Które

Porównania post-hoc (po analizie wariancji) No tak! Rasa ma istotny wpływ na inteligencję. Które pary są istotnie różne? Wybieramy świadomie serię testów zamiast jednego! Szansa, że wykryjemy ‘niepodobne’ dwie rasy rośnie! Chroń się przed błędem I-go rodzaju! Błąd I – odrzucenie prawdziwej hipotezy H 0

Porównania wielokrotne post-hoc Testy, które próbują kontrolować błąd I-go rodzaju • najmniejsza istotna różnica

Porównania wielokrotne post-hoc Testy, które próbują kontrolować błąd I-go rodzaju • najmniejsza istotna różnica Fishera (po tym jak F jest istotne - dużo fałszywie pozytywnych!) • test Tukeya – zachowawczy • test Newmana-Keulsa – mocny i mniej zachowawczy niż Tukeya • test Duncana – bardzo mocny • test Sheffego (Porównujesz w parach? Zapomnij)

Oba czynniki - środowisko i rasa - są istotne, a interakcja nie!

Oba czynniki - środowisko i rasa - są istotne, a interakcja nie!

Szczury odchowane w ograniczonym środowisku wykonywały więcej błędów!

Szczury odchowane w ograniczonym środowisku wykonywały więcej błędów!

Wszystkie linie zyskują na stymulującym środowisku!

Wszystkie linie zyskują na stymulującym środowisku!

Post-hoc

Post-hoc

Założenia – w obrębie grupy cecha jest normalna

Założenia – w obrębie grupy cecha jest normalna

Jednorodność wariancji - cd

Jednorodność wariancji - cd

Jednorodność wariancji Bez wykresu byśmy nie znaleźli zagrożenia! Istnieje korelacja między średnią i odch.

Jednorodność wariancji Bez wykresu byśmy nie znaleźli zagrożenia! Istnieje korelacja między średnią i odch. standardowym – groźne! Może lepszy będzie test nieparametryczny?

Zadanie http: //lib. stat. cmu. edu/DAS L/Datafiles/Eggs. html Fat. 62. 55. 34. 24. 40.

Zadanie http: //lib. stat. cmu. edu/DAS L/Datafiles/Eggs. html Fat. 62. 55. 34. 24. 40. 33. 43. 39. 40. 29 Lab I I II II II Technician 1 G 1 H 2 G 2 H Sample Wyniki oznaczeń zawartości tłuszczu w jajach, wg różnych laboratoriów i techników • 6 laboratoriów I-VI • Dwóch techników 1, 2 • Po dwie próbki G, H

Jaja - zadanie 1. Czy wyniki oznaczeń zależą od laboratorium? 2. Które laboratoria, jeśli

Jaja - zadanie 1. Czy wyniki oznaczeń zależą od laboratorium? 2. Które laboratoria, jeśli w ogóle, różnią się od siebie? 3. Czy założenia analizy wariancji zostały spełnione?

Zadanie dla chętnych Piątek 13 -tego Czy przesądy wpływają na nasze zachowania (zakupy)? Czy

Zadanie dla chętnych Piątek 13 -tego Czy przesądy wpływają na nasze zachowania (zakupy)? Czy w piątki 13 -tego możemy się spodziewać więcej nieszczęśliwych wypadków? http: //lib. stat. cmu. edu/DASL/Dat afiles/Fridaythe 13 th. html