LAnalisi della Varianza ANOVA ANalysis Of VAriance 1

  • Slides: 21
Download presentation
L’Analisi della Varianza ANOVA (ANalysis Of VAriance) 1

L’Analisi della Varianza ANOVA (ANalysis Of VAriance) 1

Concetti generali (1/3): • Confronto simultaneo tra più di due popolazioni, esempi. . .

Concetti generali (1/3): • Confronto simultaneo tra più di due popolazioni, esempi. . . • La analisi della varianza estende il confronto a p gruppi con p>2. 2

Concetti generali (2/3) • Fattore: variabile utilizzata per differenziare un gruppo da un altro

Concetti generali (2/3) • Fattore: variabile utilizzata per differenziare un gruppo da un altro gruppo. • Livello (o trattamento): uno dei possibili valori/stati/caratteristiche il fattore può assumere • Variabile risposta: variabile quantitativa oggetto dello studio Esempio: Si vuole verificare se la razza dei vitelli (FATTORE) considerando tre razze (LIVELLI) influenza il peso (VARIABILE RISPOSTA) di 20 vitelli : bovini Razza 1 Razza 2 Razza 3 1 63, 3 72, 8 82, 3 2 . . . 20 . . . 3

Il disegno completamente randomizzato §E’ il disegno sperimentale più semplice §Si utilizza quando si

Il disegno completamente randomizzato §E’ il disegno sperimentale più semplice §Si utilizza quando si considera un solo fattore sperimentale a più livelli. §I trattamenti/livelli sono assegnati alle unità sperimentali in modo casuale (randomizzazione). §Se il numero di repliche è uguale per tutti i trattamenti il disegno è detto bilanciato (preferibile), altrimenti è detto sbilanciato. 4

Concetti generali (3/3) In genere i livelli o gruppi possono essere non solo numerici

Concetti generali (3/3) In genere i livelli o gruppi possono essere non solo numerici ma anche qualitativi. I fattori che definiscono i gruppi possono essere più di uno. Con un solo fattore analisi della varianza ad un fattore o ad una via Con due (o più) fattori analisi della varianza a due ( o più) fattori o a due vie (o più vie) 5

Predisposizione dei dati Fattore repliche 1 2 . . . i 1 y 11

Predisposizione dei dati Fattore repliche 1 2 . . . i 1 y 11 y 21 . . yi 1 yp 1 2 y 12 y 22 . . yi 2 yp 2 . . . y 1 j y 2 j . . yij ypj Yin(i) Ypn(i) J . . . ni Medie Y 1 n (i) . . p . . Y 2 n(i) . . . . 6

ESEMPIO: peso di 20 vitelli 7

ESEMPIO: peso di 20 vitelli 7

Il modello lineare: 8

Il modello lineare: 8

Il modello lineare Il modello può essere rappresentato in questa forma: Yij = +

Il modello lineare Il modello può essere rappresentato in questa forma: Yij = + αi + εij • con μ media di tutte le popolazioni rappresentate nell’esperimento • αi = μ − μi effetto dell’i-esimo trattamento/livello Generalmente si assume: • i = 1, . . . , p (p numero dei livelli) • j = 1, . . . , ni (ni numero di repliche all’interno di un livello) • nt= n. ro totale di osservazioni Se il disegno è bilanciato, n 1 = n 2 =. . . = np 9

IDEA DI FONDO: Scomposizione della variabilità totale Variabilità all’interno dei gruppi (SSE) errore sperimentale

IDEA DI FONDO: Scomposizione della variabilità totale Variabilità all’interno dei gruppi (SSE) errore sperimentale Variabilità tra i gruppi (SSA) effetti del trattamento/livello Si ha che: SST = SSA + SSE 10

Come fare inferenza Assumendo che i p gruppi (popolazioni) da cui vengono estratte casualmente

Come fare inferenza Assumendo che i p gruppi (popolazioni) da cui vengono estratte casualmente le osservazioni siano distribuiti normalmente e abbiano uguali varianze, l’ipotesi sottoposta a verifica è: H 0: 1 = 2 = … = p oppure H 0 : α i = 0 HA: non tutte le i sono uguali 11

Come costruire il test? Il test è basato sulle seguenti considerazioni: • Se è

Come costruire il test? Il test è basato sulle seguenti considerazioni: • Se è vera l’ipotesi nulla, i dati differiscono tra loro per il solo effetto della variabilità casuale. • Se invece è vera l’ipotesi alternativa (quindi rifiuto l’H 0), entrambe le fonti di variabilità contribuiscono a determinare la variabilità complessiva. • Il test è quindi basato sull’analisi della variabilità complessiva in funzione delle diverse cause (da cui il termine Analisi della Varianza). 12

Scomposizione della variabilità totale La VARIABILITA’ TOTALE è descritta dalla SST: Devianza totale: 13

Scomposizione della variabilità totale La VARIABILITA’ TOTALE è descritta dalla SST: Devianza totale: 13

Scomposizione della variabilità totale La VARIABILITA’ TRA I GRUPPI è descritta dalla SSA (devianza

Scomposizione della variabilità totale La VARIABILITA’ TRA I GRUPPI è descritta dalla SSA (devianza tra i gruppi) Devianza tra i gruppi: FORMULA CALCOLATORIA: 14

Scomposizione della variabilità totale La VARIABILITA’ NEI GRUPPI (o ENTRO I GRUPPI) è descritta

Scomposizione della variabilità totale La VARIABILITA’ NEI GRUPPI (o ENTRO I GRUPPI) è descritta dalla SSE: devianza entro i gruppi Devianza entro i gruppi: FORMULA CALCOLATORIA

Cosa ci aspettiamo? • Se l’ipotesi nulla è vera, ci possiamo attendere uno scarso

Cosa ci aspettiamo? • Se l’ipotesi nulla è vera, ci possiamo attendere uno scarso contributo della devianza tra gruppi alla devianza totale. • Sell’ipotesi nulla è falsa, ci possiamo attendere che entrambe le devianze contribuiscano a determinare la devianza totale. • A questo livello non è però possibile fare confronti, perchè le devianze hanno un numero di addendi diverso. • Dobbiamo quindi rendere confrontabili le devianze. . 16

I gradi di libertà Ad ognuna delle devianze sono associati i gradi di libertà:

I gradi di libertà Ad ognuna delle devianze sono associati i gradi di libertà: • la devianza totale ha nt − 1 gradi di libertà • la devianza tra gruppi ha p − 1 gradi di libertà • la devianza entro i gruppi ha nt - p gradi di libertà Dividendo ciascuna devianza per i rispettivi gradi di libertà si ottengono le VARIANZE, cioè le medie dei quadrati: Varianza tra i gruppi Varianza entro i gruppi 17

Test F per la ANOVA a un fattore Per verificare l’ipotesi di uguaglianza delle

Test F per la ANOVA a un fattore Per verificare l’ipotesi di uguaglianza delle medie utilizzo il test F che confronta MSA e MSE. Il test F segue una distribuzione F di Fisher con (p-1, nt-p) gradi di libertà. La regola decisionale è: Rifiuto H 0 se F>Fα 18

Test F per la ANOVA a un fattore Il valore critico della F viene

Test F per la ANOVA a un fattore Il valore critico della F viene determinato in funzione del livello di significatività a del test. I valori critici si individuano nelle tavole della distribuzione F in base ai gradi di libertà e al livello di significatività scelto Se H 0 è falsa ci aspettiamo che F assuma valori maggiori rispetto ai valori tabulati nella tavola della F la variabilità totale è dovuta soprattutto all’effetto del trattamento/fattore. Se H 0 è vera ci aspettiamo che il valore osservato di F sia minore al 19 valore tabulato.

Test F per la ANOVA a un fattore I risultati del test F per

Test F per la ANOVA a un fattore I risultati del test F per la ANOVA a un fattore vengono sintetizzati in una tabella come quella seguente: 20

Esempio: Peso dei vitelli di 3 razze diverse: Output di excel: 21

Esempio: Peso dei vitelli di 3 razze diverse: Output di excel: 21