Gegevensverwerving en verwerking Staalname aantal stalenreplicaten grootte staal

  • Slides: 45
Download presentation
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup

Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliothe ek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie - ordinatie - classificatie

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van waarnemingen significant van elkaar verschillen Voorbeeld 1 Staalnameplaats = station herhaling staalname: minimum 3 repli Verschillende stations worden bemonsterd langs een gradient Veranderingen in : Saliniteit Waarnemingen : Tellingen/densiteiten Licht Biomassa Temperatuu Pigmentconcentraties Diepte Diversiteit ……. …. .

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van waarnemingen significant van elkaar verschillen Voorbeeld 2 Experiment - effect van verschillende behandelingen - effect op verschillende populaties Replicatie Waarnemingen : - concentraties - densiteiten ……….

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van waarnemingen significant van elkaar verschillen Doel : vergelijking van groepen van waarnemingen Groepen aanduiden dmv ‘groeperende variabele’ HO Nulhypothese “ groepen verschillen niet” Voorbeeld 1 : stalen afkomstig van dezelfde populatie geen verschillen over omgevingsgradient Voorbeeld 2 : geen effect van behandeling geen verschil in gevoeligheid van verschillende pop of organismen

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van

ANOVA (ANALYSIS OF VARIANCE) Statistische test gebruikt om na te gaan of groepen van waarnemingen significant van elkaar verschillen HO Nulhypothese “ groepen verschillen niet” Hoe testen ? Natuurlijke variatie Variatie t. g. v. gradient behandeling Variatie binnen groepen Aanvaard (P > 0. 05) === <<< O Verworpen H tussen groepen Significan verschil

2 mogelijke verklaringen voor het verschil tussen 2 gemid Beide groepen van 4 waarnemingen

2 mogelijke verklaringen voor het verschil tussen 2 gemid Beide groepen van 4 waarnemingen zijn afkomstig van 2 verschillende Beide groepen zijn afkomstig van de extreme zijden van dezelfde popu

Parametrisch of niet-parametrische testen 2 groepen t - test F - test > 2

Parametrisch of niet-parametrische testen 2 groepen t - test F - test > 2 groepen ANOVA Mann- Withney U test Wilcoxon test Kruskal-Wallis test Als een gekende distributie (normale of Poisson) als model voor data frequentie distributie kan gebruikt worden Voorwaarden- : willekeurige en onafhankelijke verzameling van gegevens (‘randomness and independence’ ingebouwd in staalname) - waarnemingen of data moeten normaal verdeeld zijn (eventueel na transformatie) -homogeniteit van de varianties (transformatie) Bartlett’s test, Fmax test (gevoelig voor afwijkingen van normaliteit) Levene’s test - variantie onafhankelijk van het gemiddelde (transformatie) BELANGRIJK

Als een gekende distributie (normale of Poisson) als model voor data frequentie distributie kan

Als een gekende distributie (normale of Poisson) als model voor data frequentie distributie kan gebruikt worden - waarnemingen of data moeten normaal verdeeld zijn (eventueel na transformatie)

Als een gekende distributie (normale of Poisson)- homogeniteit van de varianties als model voor

Als een gekende distributie (normale of Poisson)- homogeniteit van de varianties als model voor data frequentie distributie kan gebruikt - variantie onafhankelijk van het gemidde worden Relatie gemiddelde - variantie Voor transformatie Na transformatie

Parametrisch of niet-parametrische testen 2 groepen t - test F - test t-test :

Parametrisch of niet-parametrische testen 2 groepen t - test F - test t-test : vergelijking van gemiddelden van 2 stalen Nulhypothese : gemiddelde van beide groepen verschillen niet (2 zijdig) waarbij wordt uitgegaan van gelijke varianties t waarde vergelijken met getabelleerde waarde Van students T distributie voor bepaald aantal vrijheidsgraden Met s²p = SS 1 + SS 2 n 1 + n 2 ts = schatting – hypothese SD van verschil σ² = variantie _______ (xi- µ)2 N = variantie over beide groepen heen Indien groepen even groot zijn, is t-test ongevoelig voor heterogeniteit van va

Parametrisch of niet-parametrische testen 2 groepen t - test F - test t-test :

Parametrisch of niet-parametrische testen 2 groepen t - test F - test t-test : vergelijking van gemiddelden van 2 stalen waarbij niet wordt uitgegaan van gelijke varianties t waarde vergelijken met getabelleerde waarde F- test : vergelijking van varianties van 2 grote met stalen (n>50) waardevoor n -1 en n -1 F waarde vergelijken getabelleerde vrijheidsgraden (*grootste variantie in teller) zie ook ANOVA 1 2 *

Parametrisch of niet-parametrische testen > 2 groepen ANOVA Natuurlijke variatie Variatie binnen groepen Aanvaard

Parametrisch of niet-parametrische testen > 2 groepen ANOVA Natuurlijke variatie Variatie binnen groepen Aanvaard O Verworpen H Variatie t. g. v. gradient behandeling tussen groepen === <<< Significant verschil

ANOVA - tabel Voor k groepen en n waarnemingen in totaal Totale gemiddelde groepsgemiddelde

ANOVA - tabel Voor k groepen en n waarnemingen in totaal Totale gemiddelde groepsgemiddelde Totale variatie Som van de kwadraten (SS) = Variantie s² = MS = Variatie tussen groepen (effect) Variatie binnen groepen (error)

Totale gemiddelde groepsgemiddelde Totale variatie SS = Variantie s² = MS = SS /

Totale gemiddelde groepsgemiddelde Totale variatie SS = Variantie s² = MS = SS / df Bron variatie Vrijheidsgraden (df) Variatie tussen groepen (effect Variatie binnen groepen (error) ANOVA - tabel Som kwadraten SS Gemiddelde kwadraten MS = SS/df Totaal n-1 SS / n-1 Tussen k-1 SS / k-1 Binnen n-k SS / n-k

Bron variatie Vrijheidsgraden (df) Totaal n-1 Tussen k-1 Binnen n-k Som kwadraten SS Gemiddelde

Bron variatie Vrijheidsgraden (df) Totaal n-1 Tussen k-1 Binnen n-k Som kwadraten SS Gemiddelde kwadraten MS = SS/df SS / n-1 x n/k SS / k-1 SS / n-k Staalgrootte waarop gemiddelden zijn gebasee Totaal Tussen Binnen n-1 k-1 n-k totale variantie over n waarn variantie van groepsgemiddelde van de groepsva Getabelleerde F distributie met k-1 en n-k vrijheidsgr

Fratio -F ratio is dus ratio van gemiddelde kwadraten tussen groepen e de gemiddelde

Fratio -F ratio is dus ratio van gemiddelde kwadraten tussen groepen e de gemiddelde kwadraten binnen groepen. - De F-ratio volgt een verwachte distributie volgens een bepaalde functie met 2 types vrijheidsgraden. - De F-distributie is dus een theoretische waarschijnlijkheidsdistr - Er wordt steeds een F-distributie bekomen wanneer de varianti

Gebruikte voorbeelden steeds groepen met gelijk aantal waarnem Indien k groepen van verschillende grootte,

Gebruikte voorbeelden steeds groepen met gelijk aantal waarnem Indien k groepen van verschillende grootte, wordt MS tussen gro Tussen k-1 x n/k vervangen door: met Wi = aantal waarnemingen in gro df ipv Wi

Totaal Tussen Binnen n-1 totale variantie over n waarnemingen k-1 variantie van groepsgemiddelden (x

Totaal Tussen Binnen n-1 totale variantie over n waarnemingen k-1 variantie van groepsgemiddelden (x n/k) n-k gemiddelde van de groepsvarianties Voorbeeld 1 Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k), 9 waarnemingen (n) Totale variatie (df = 8) Variatie tussen pipetten (effect) (df = 2) Natuurlijke variatie binnen groepen (error) (df = 6)

Voorbeeld 1 Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k),

Voorbeeld 1 Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k), 9 waarnemingen (n) Totale variatie (df = 8) Bron variatie Variatie tussen pipetten (effect) (df = 2) Natuurlijke variatie binnen groepen (error) (df = 6) Vrijheidsgraden (df) Totaal n-1 Tussen k-1 Binnen n-k Som kwadraten SS Gemiddelde kwadraten MS = SS/df 95 x n/k 23. 55 x 3 = 70. 6 103. 1

Voorbeeld 1 Bron variatie Vergelijking van de inhoud van 3 pipetten (in ml) 3

Voorbeeld 1 Bron variatie Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k), 9 waarnemingen (n) Vrijheidsgraden (df) Som kwadraten SS Gemiddelde kwadraten MS = SS/df 95 Totaal n-1 Tussen k-1 x n/k 23. 55 x 3 = 70. 6 Binnen n-k 103. 1 = 70. 6 / 103. 1 = 0. 68 Getabelleerde F waarde voor 6 en 2 vrijheidsgraden = 19 => geen significant verschil tussen pipetten

Voorbeeld 1 Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k),

Voorbeeld 1 Vergelijking van de inhoud van 3 pipetten (in ml) 3 groepen (k), 9 waarnemingen (n) = 70. 6 / 103. 1 = 0. 68 Getabelleerde F waarde voor 2 en 6 vrijheidsgraden = 5. => geen significant verschil tussen pipetten Variatie binnen groepen HO HO = Variatie tussen groep aanvaard Stalen afkomstig van dezelfde populatie of verschillen tussen pipetten liggen binnen te verwachten f H 0 wordt aanvaard als de probabiliteit of waarschijnlijkheid groter is dan 5 % H 0 wordt verworpen als de probabiliteit of waarschijnlijkheid kleiner is dan 5

df teller df noemer Hypothese testen nulhypothese verwerpen of aanvaarden Type I error Nulhypothese

df teller df noemer Hypothese testen nulhypothese verwerpen of aanvaarden Type I error Nulhypothese verwerpen terwijl ze waar is kans zo klein mogelijk houden Beslissingsregel ingevoerd om de kans om een type I error te ma mogelijk te houden (kleiner dan 1% of 5 % ) = Significantie niveau

Totaal Tussen Binnen n-1 totale variantie over n waarnemingen k-1 variantie van groepsgemiddelden (x

Totaal Tussen Binnen n-1 totale variantie over n waarnemingen k-1 variantie van groepsgemiddelden (x n/k) n-k gemiddelde van de groepsvarianties Voorbeeld 2 Vergelijking van de glucose concentratie (mg/l) in serum van na 4 verschillende farmaceutische behandelingen (k); 6 muizen per behandeling => 24 waarnemingen(n) Totale variatie (df =23) Variatie tussen behandelingen (effect) (df = 3) Natuurlijke variatie binnen groepen (error) (df =20)

Voorbeeld 2 Bron variatie Totaal Tussen Binnen 349. 9 Vergelijking van de glucose concentratie

Voorbeeld 2 Bron variatie Totaal Tussen Binnen 349. 9 Vergelijking van de glucose concentratie (mg/l) in serum van na 4 verschillende farmaceutische behandelingen (k); 6 muizen per behandeling => 24 waarnemingen(n) Vrijheidsgraden (df) n-1 = 23 k-1 = 3 n-k = 20 = 99. 14 Som kwadraten SS Gemiddelde kwadraten MS = SS/df 111057. 9 104060. 45 6977. 5 5781. 14 X 6 = Getabelleerde F waarde (df =3 en 20 en p = 5% HO Verworpen => significante versc tussen behandelin

ANOVA (ANALYSIS OF VARIANCE) Parametrische testen one way ANOVA 1 effect of behandeling Totale

ANOVA (ANALYSIS OF VARIANCE) Parametrische testen one way ANOVA 1 effect of behandeling Totale variatie Variatie tussen groepen (effect) Variatie binnen groepen (error) two way ANOVA 2 effecten of behandelingen Variatie effect 1 Variatie tussen groepen (effect)Variatie effect 2 Var. effect 1 en Totale variatie Variatie binnen groepen (error)

Voorbeeld 1 en 2 : één groeperende variabele : 3 pipetten, 4 beh =

Voorbeeld 1 en 2 : één groeperende variabele : 3 pipetten, 4 beh = one way ANOVAslechts 1 effect two way ANOVA 2 groeperende variabelen om effect van twee variabelen (behandelingen, gradienten) tegelijk Voorbeeld 3 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met Bordetella pertussis bacterië Zelfde data als in voorbeeld 2 maar nu is groep A : controle (geen behandeling) groep B: infectie met pertussis groep C: toedienen van adrenaline groep D: beide behandelingen (adrenaline + pertussis)

Voorbeeld 3 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum

Voorbeeld 3 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met pertussis bacteriën groep A : controle (geen behandeling) groep B: infectie met pertussis groep C: toedienen van adrenaline groep D: beide behandelingen (adrenaline + pertussis) Totale variati e df = 23 Variatie tussen groepen (effect) Pertussis effect df = 1 Adrenaline effectdf = 1 tgv behandeling Adre + Pert df = 1 df = 3 Variatie binnen groepen (error) of natuurlijke variatie (residueel) df = 20

Voorbeeld 3 n = 24 k=4 totaal tussen Pertussis adrenaline Pert x Adre Binnen

Voorbeeld 3 n = 24 k=4 totaal tussen Pertussis adrenaline Pert x Adre Binnen Bron variatie (df) Totaal Tussen Pertus Adren In teractie Binnen 23 3 1 1 1 20 SS 111057. 9 104060. 45 77407. 04 22143. 4 4510. 04 6977. 5 MS = SS/df F ratio 4828. 6 34686. 8 77407. 04 * 22143. 4 * 4510. 04 349. 9 221 63 12 * variantie van groepsgemiddelden A+C en B+D x 1 * variantie van groepsgemiddelden A+B en C+D x 1

Voorbeeld 3 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum

Voorbeeld 3 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met pertussis bacteriën Drie nulhypothesen : (1) geen verschil in glucose tussen geinfecteerde en niet-geinfect (2) geen verschil in glucose met of zonder toevoeging van adrenali (3) er is geen interactie tussen beide types behandelingen Getabelleerde F-waarde voor 1 en 20 vrijheidsgraden voor p = 0. 05 is 4. 35 Alle. HO verworpen => significante verschillen tgv beide beh en interactie tussen beide

Niet- geinfecteerd Geinfecteerd met Pertussis

Niet- geinfecteerd Geinfecteerd met Pertussis

Besluit : - Met Pertussis geinfecteerde muizen hebben een significant lage glucose gehalte dan

Besluit : - Met Pertussis geinfecteerde muizen hebben een significant lage glucose gehalte dan niet geïnfecteerde muizen. - Toediening van adrenaline verhoogt significant de glucose spieg serum van alle muizen - Toediening van adrenaline verhoogt de glucose spiegel meer bi geïnfecteerde muizen dan bij met Pertussis geïnfecteerde muizen

Voorbeeld 4 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum

Voorbeeld 4 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met pertussis bacteriën Randomized blocks with nesting 3: blokken van 2 waarnemingen totaal tussen Binnen Pertussis adrenaline Pert x Adre

Voorbeeld 4 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum

Voorbeeld 4 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met pertussis bacteriën Randomized blocks with nesting 3: blokken van 2 waarnemingen totaal Blokken (2) Tussen (11) Behandelingen (3) blok x behand (6) Binnen (12) Pertussis adrenaline Pert x Adre

Voorbeeld 5 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum

Voorbeeld 5 n = 24 k=4 Vergelijking van de glucose concentratie (mg/l) in serum van na 2 types van behandelingen : behandeling 1 : toedienen van adrenaline op dag 14 behandeling 2 : infectie met pertussis bacteriën Blocks without nesting (lower order effect) : totaal Blokken (5) Tussen (23) Behandelingen (3) blok x behand (15) residuele Pertussis adrenaline Pert x Adre

Vergelijkingen van gemiddelden Stel H 0 wordt verworpen bij ANOVA => er zijn significante

Vergelijkingen van gemiddelden Stel H 0 wordt verworpen bij ANOVA => er zijn significante versc tussen groepen Tussen welke ? ? Vergelijking tussen paren en groepen van gemiddelden Welke paren of groepen men vergelijkt hangt af van wat men wil testen Indien onafhankelijk van het resultaat op voorhand is uitgemaakt welke groep elkaar worden vergeleken spreken we van GEPLANDE of A PRIORI vergeli Vb testen van controle tov gemiddelde van verschillende experimentele behandelingen Indien afhankelijk van het resultaat bepaalde groepen met elkaar worden ver spreken we van ONGEPLANDE of A POSTERIORI vergelijkingen. Deze testen omvatten de vergelijking van alle mogelijke paren van vergelijkingen a groepen => (a (a-1)/2 combinaties)

Voorbeeld 2 Tukey HSD test; Probabilities for Post Hoc Tests MAIN EFFECT: {1} {2}

Voorbeeld 2 Tukey HSD test; Probabilities for Post Hoc Tests MAIN EFFECT: {1} {2} A {1}. 000176 B {2}. 000176 C {3}. 000176. 000175 D {4}. 000615. 027491 {3}. 000176. 000175 {4}. 000615. 027491. 000175

Parametrisch of niet-parametrische testen 2 groepen t - test Man Withney U test F

Parametrisch of niet-parametrische testen 2 groepen t - test Man Withney U test F - test > 2 groepen ANOVA one way Kruskal Wallis test two way Friedman’s test In een parametrische test wordt er bij de nulhypothese uitgegaan van een bepaalde distributie en moeten de parameters (gemiddelde en variantie) van die Niet-parametrische testen die niet uitgaan van deze distributie zijn minder krachtig doordat ze niet alle hetzelfde zijn voorwaarden, voor elke groep (staal of experiment). aanwezige informatie gebruiken => RANKING In het geval van kleine stalen en geen normale distribu van de data zijn ze echter krachtiger dan parametrisch

Mann Withney U test Twee onafhankelijke willekeurige stalen komen van deze populatie met gelijke

Mann Withney U test Twee onafhankelijke willekeurige stalen komen van deze populatie met gelijke distributie en mediaan. O (geen assumpties over vorm van distributie) Werkwijze (voor kleine groepen) : H 1. Gooi alle waarnemingen van beide groepen samen en orden ze van laag naar 2. Vervang elke waarneming door zijn rankingsnummer 3. In het geval van gelijke waarnemingen wordt het gemiddelde berekend van de stemmende rankingsgetallen en dit aan de betreffende overlappende waarnemin 4. Beide groepen worden terug uit elkaar gehaald en de rankingsnummers per gr gesommeerd. 5. Vervolgens wordt per groep de U- coëfficient berekend. 6. De kleinste U coefficient wordt vergeleken met getabelleerde waarde voor welbepaalde n’s en p waarden. Indien kleinste U waarde kleiner dan U tabel bij een probaliteit groter dan 0. 05 => H 0 is verworpen

Voorbeeld 6 Staal 1 n 1 = 5 data 2 4 5 7 12

Voorbeeld 6 Staal 1 n 1 = 5 data 2 4 5 7 12 Twee ongelijke, onafhankelijke stalen van Mysida met grootte broed in marsupium of broedbuidel. Staal 2 n 2 = 10 rank 1 2. 5 4. 5 6 8 data 4 5 8 14 14 15 19 28 36 rank 2. 5 4. 5 7 9. 5 11. 5 13 14 15 U 1 = 7 U 2 = 43 U waarde bij 5 %en 5 en 10 vrijheidsgrade is gelijk aan 8 => H 0 verworpen

Parametrisch of niet-parametrische testen > 2 groepen ANOVA one way Kruskal Wallis test Kruskall

Parametrisch of niet-parametrische testen > 2 groepen ANOVA one way Kruskal Wallis test Kruskall Wallis test Voor meerdere groepen van ongelijke grootte i = aantal groepen Ri = som van ranks in staal i ni = aantal waarnemingen in staal i K is bij benadering verdeeld als een chi-kwadraat distributie met => H 0 wordt verworpen indien K > met i-1 df en bij p = 0. 05

Ook voor de niet-parametrische Kruskal Wallis test wordt er geen gegeven over welke stalen-groepen

Ook voor de niet-parametrische Kruskal Wallis test wordt er geen gegeven over welke stalen-groepen significant van elkaar verschi => methode om na te gaan welke paren significant van elkaar ver De groepen i en j verschillen van elkaar indien : Ri = som van ranks in staal I t = twaarde (distributie) voor N-k df en bepaalde probaliliteit Met R(Xij) het rankingsnummer van de waarneming Xij gesommeerd over alle ra

Parametrisch of niet-parametrische testen > 2 groepen ANOVA Friedman’s two way met randomized blocks

Parametrisch of niet-parametrische testen > 2 groepen ANOVA Friedman’s two way met randomized blocks test Friedman’s test - alleen voor n groepen met gelijk aantal waarnemingen Voorbeeld 5 - elke groep kan ingedeeld worden in aantal blokken(b) - bepalen van rangorde in elke blok (in geval van 4 behandelingen (a) ranking van 1 tot 4)

Friedman’s test Voorbeeld 5 Deze waarde wordt vergeleken met de chi kwa waarde voor

Friedman’s test Voorbeeld 5 Deze waarde wordt vergeleken met de chi kwa waarde voor a-1 of 3 vrijheidsgraden en p< 0. 0 = 7. 815 => Indien groter H 0 wordt verworpen Er is een significant verschil Niet parametrische test kan alleen verschillen tussen groepen aanton de test zegt niets over interacties tussen behandelingen.