ANOVA Analisi della varianza 1 ANOVA ad una

  • Slides: 25
Download presentation
ANOVA Analisi della varianza 1

ANOVA Analisi della varianza 1

ANOVA ad una via Analisi della varianza testa differenze fra le medie di due

ANOVA ad una via Analisi della varianza testa differenze fra le medie di due o più gruppi H 0: le medie sono uguali Ha: almeno due medie sono diverse Assunzioni: 1. Indipendenza dei casi 2. Normalità dei dati all’interno di ogni gruppo 3. Omogeneità della varianza

1. Indipendenza Le singole osservazioni nei gruppi DEVONO essere delle vere repliche Non deve

1. Indipendenza Le singole osservazioni nei gruppi DEVONO essere delle vere repliche Non deve esserci dipendenza: 1. Spaziale 2. Temporale 3. Biologica Il campionamento può essere sbilanciato

2 -3. Normalità e variabilità delle popolazioni a confronto I campioni devono provenire da

2 -3. Normalità e variabilità delle popolazioni a confronto I campioni devono provenire da popolazioni normali! Con varianza simile! 4

I passi da seguire (1. Verificare le assunzioni) 2. Eseguire l’ANOVA 3. Ottenere una

I passi da seguire (1. Verificare le assunzioni) 2. Eseguire l’ANOVA 3. Ottenere una probabilità per decidere se rifiutare o accettare H 0 4 a. Rifiuto H 0 Almeno una media è diversa 4 b. Accetto H 0 Le medie sono uguali STOP 5. Testo le differenze fra le singole coppie di medie (post-hoc test) STOP A ≠ B? B ≠ C? C ≠ A? …

ANOVA a una via Varietà A Varietà B Varietà C Varietà D Risposta: Produttività

ANOVA a una via Varietà A Varietà B Varietà C Varietà D Risposta: Produttività Fattore: Varietà (4 livelli: A, B, C, D) H 0: µ 1= µ 2= µ 3= µ 4 Ha: almeno due sono diverse C y B Modello ANOVA yi = a + bx 2 + cx 3 + dx 4 A D

ANOVA a una via ni µi Var A 6. 0 5. 7 6. 5

ANOVA a una via ni µi Var A 6. 0 5. 7 6. 5 5. 9 6. 2 5 6. 06 Var B 6. 9 6. 8 7. 4 6. 6 7. 0 5 6. 93 Var C 10. 3 10. 2 10. 0 9. 6 X 4 10. 03 Var D 8. 8 8. 4 8. 3 8. 6 9. 0 5 8. 62 Media generale= 7. 80 Numero di repliche (n)= 19 Numero di livelli (k)= 4 Ha senso testare le assunzioni?

ANOVA a una via SS TOTALE SS ENTRO Media generale SS FRA C Somma

ANOVA a una via SS TOTALE SS ENTRO Media generale SS FRA C Somma dei quadrati (SS)-Devianza D B A SSTOT= Σ(yi – media generale)2 SSFRA= Σnj(media gruppoi – media generale)2 SSENTRO= Σ(yi – media gruppoi)2

ANOVA: devianza (somma dei quadrati) Somma dei quadrati (SS)-Devianza SSTOTALE= Σ(yi – media generale)2

ANOVA: devianza (somma dei quadrati) Somma dei quadrati (SS)-Devianza SSTOTALE= Σ(yi – media generale)2 SSFRA= Σnj(media gruppoi – media generale)2 SSENTRO= Σ(yi – media gruppoi)2 La SS dipende dal numero di osservazioni nei gruppi Gradi di libertà (g. d. l. ) SSTOTALE: n – 1 SSFRA: k – 1 SSENTRO: n – k

ANOVA: dalla devianza alla varianza Devianza (SS) deve essere STANDARDIZZATA Varianza = Devianza (SS)

ANOVA: dalla devianza alla varianza Devianza (SS) deve essere STANDARDIZZATA Varianza = Devianza (SS) Gradi di libertà Varianza. FRA = SSFRA Varianza. ENTRO = k-1 C SSENTRO D B A SSENTRO n-k

ANOVA: dalla devianza alla varianza SS deve essere STANDARDIZZATA Varianza = Devianza (SS) Gradi

ANOVA: dalla devianza alla varianza SS deve essere STANDARDIZZATA Varianza = Devianza (SS) Gradi di libertà Varianza. FRA = SSFRA Varianza. ENTRO = k-1 SSENTRO n-k Mi serve un test per vedere se la varianza fra gruppi è maggiore della varianza entro in gruppi VARIANZA TOTALE FRA ENTRO

ANOVA: il test F FCALCOLATO= Varianza. FRA Varianza FRA sempre al numeratore Varianza. ENTRO

ANOVA: il test F FCALCOLATO= Varianza. FRA Varianza FRA sempre al numeratore Varianza. ENTRO FCRITICO si distribuisce secondo i seguenti gradi di libertà: Numeratore: k-1 Denominatore: n-k Il test F dell’ANOVA è a una coda: Varianza. FRA >Varianza. ENTRO

ANOVA: il test F • Tabella ANOVA Fonte variabilità FRA ENTRO TOTALE SS df

ANOVA: il test F • Tabella ANOVA Fonte variabilità FRA ENTRO TOTALE SS df Varianza F

ANOVA: il test F FCALCOLATO= Varianza. FRA Varianza. ENTRO Varianza. FRA>Varianza. ENTRO Varianza. FRA<Varianza.

ANOVA: il test F FCALCOLATO= Varianza. FRA Varianza. ENTRO Varianza. FRA>Varianza. ENTRO Varianza. FRA<Varianza. ENTRO Confronto con FCRITICO (alpha, k-1, n-k) SE FCALCOLATO< FCRITICO STOP: Accetto H 0 SE FCALCOLATO > FCRITICO Rifiuto H 0! Almeno due medie sono diverse: quali?

ANOVA: post-hoc test Mi permettono di dire quali medie sono diverse dopo aver rifutato

ANOVA: post-hoc test Mi permettono di dire quali medie sono diverse dopo aver rifutato H 0 In tali test, detti test post-hoc, per ogni coppia di medie l’ipotesi nulla è che la differenza tra queste sia pari a zero, mentre l’alternativa è che le due medie differiscano significativamente tra loro Correggono per il numero di test: devo modificare alpha! Esistono test più o meno conservativi Esistono molti tipi di test

ANOVA: Tukey (test ad intervallo fisso) Mi permette di dire quali medie sono diverse

ANOVA: Tukey (test ad intervallo fisso) Mi permette di dire quali medie sono diverse dopo aver rifutato H 0 TABELLA DELLE DIFFERENZE Varietà A Varietà B Varietà C Varietà D Varietà A - Varietà B A-B - Varietà C A-C B-C - Varietà D A-D B-D C-D A-B: differenza fra la media della varietà A e B A-C: differenza fra la media della varietà A e C … -

ANOVA: Tukey (test ad intervallo fisso) n 1 e n 2 numerosità gruppo 1

ANOVA: Tukey (test ad intervallo fisso) n 1 e n 2 numerosità gruppo 1 e 2 g. d. l. Varianza. ENTRO (n-k) “Q” deriva dalla tabella di Tukey (alpha, g. d. l. =n-k) Numero di livelli (k)

ANOVA: Tukey (test ad intervallo fisso) Q aumenta se riduciamo alpha Q aumenta all’aumentare

ANOVA: Tukey (test ad intervallo fisso) Q aumenta se riduciamo alpha Q aumenta all’aumentare del numero di livelli Q diminuisce all’aumentare del numero di repliche Se il campionamento è bilanciato il range critico è unico per tutte le coppie! Se il campionamento è sbilanciato devo calcolare diversi range

ANOVA: Tukey (test ad intervallo fisso) Per ogni coppia (alpha): Se |media 1 -media

ANOVA: Tukey (test ad intervallo fisso) Per ogni coppia (alpha): Se |media 1 -media 2|> range critico H 0: media 1=media 2 Ha: media 1≠media 2 Medie diverse! Se |media 1 -media 2|< range critico H 0: media 1=media 2 Ha: media 1≠media 2 Medie uguali!

Rappresentazione grafica dei risultati Boxplot con media Risposta media Istogramma delle medie con errore

Rappresentazione grafica dei risultati Boxplot con media Risposta media Istogramma delle medie con errore standard A B C Varietà D 20

Rappresentazione grafica dei risultati Risposta media b ab a A volte dopo un post-hoc

Rappresentazione grafica dei risultati Risposta media b ab a A volte dopo un post-hoc test si aggiungono delle lettere per dire quali medie sono differenti B C Varietà D 21

Analisi dei residui: Assunzioni I residui devono avere la stessa variabilità 0. 60 Residui

Analisi dei residui: Assunzioni I residui devono avere la stessa variabilità 0. 60 Residui 0. 40 0. 20 0. 00 -0. 20 -0. 40 -0. 60 0 A 1 B 2 C 3 D 4 22

Analisi dei residui: Assunzioni Residui Q-Q plot 0. 5 0. 4 0. 3 0.

Analisi dei residui: Assunzioni Residui Q-Q plot 0. 5 0. 4 0. 3 0. 2 0. 1 0 -0. 1 -0. 2 -0. 3 -0. 4 Come costruirlo? -2 0 Quantili normali 2 23

Analisi dei residui: Assunzioni P cumulata=1/(n+1) Posizione 1 2 3 4 5 6 7

Analisi dei residui: Assunzioni P cumulata=1/(n+1) Posizione 1 2 3 4 5 6 7 8 9 P 0. 1 0. 2 0. 3 0. 4 0. 5 0. 6 0. 7 0. 8 0. 9 Quantili teorici -1. 28 -0. 84 -0. 52 -0. 25 0. 52 0. 84 1. 28 Residui ordinati Più piccolo. . . Più grande Tabella Z 24

Analisi dei residui: Assunzioni 25

Analisi dei residui: Assunzioni 25