Il metodo Difference in Difference Corso di Economia





























- Slides: 29
Il metodo Difference in Difference Corso di Economia e Finanza Pubblica Università di Ferrara
I dati panel • 2
Dati panel: un esempio 3
Vantaggi dell’utilizzo di dati panel • Nelle regressioni forniscono un numero più elevato di osservazioni, riducendo la collinearità tra le covariate. • Consentono di analizzare alcuni problemi che non possono essere esaminati con dati sezionali. • Consentono di isolare gli effetti di azioni specifiche, trattamenti o più in generale di politiche. • Consentono di risolvere il problema della variabili omesse. 4
La Differenza nelle differenze • Come funziona il metodo Differenza nelle differenze (Did) ? • confronta la variazione delle variabili risultato tra prima e dopo un programma (o una politica) rispetto a quelli che hanno partecipato a un programma (o una politica) con quelli che non lo hanno fatto. • Mette in relazione quindi una differenza (tra prima e dopo il trattamento) con una seconda differenza (tra trattati e non trattati). • La variazione per coloro che non partecipano al programma rappresenta il controfattuale per coloro che hanno partecipato al programma. 5
Differenza nelle differenze • La DID è un disegno quasi-sperimentale che utilizza dati panel dei gruppi di trattamento e di controllo per ottenere un controfattuale appropriato per stimare un effetto causale. • In un esperimento possiamo identificare 4 gruppi: 1. trattati - prima del trattamento 2. trattati - dopo il trattamento 3. Non trattati - prima del trattamento 4. Non trattati – dopo il trattamento 6
DID – il metodo • GRUPPO DEI TRATTATI (1) GRUPPO DI CONTROLLO (0) PRIMA (B) DOPO (A) 7
Ipotesi del modello DID • 1) La definizione dei trattati o dei non trattati non è determinato dalla variabile risultato; • 2) Non ci siano effetti spillover (cioè gli effetti positivi/negativi della politica non si diffondono tra i trattati e il gruppo di controllo); • 3) Il gruppo dei trattati e il gruppo di controllo devono essere molto stabili nel tempo; • 4) Ipotesi del common trend 8
Ipotesi del common trend • Ipotesi dell’identico trend prima del trattamento tratti e gruppo di controllo (common trend): La variabile di risultato del gruppo dei trattati e del gruppo di controllo si sposta in parallelo in assenza di trattamento e quindi ha lo stesso trend sia per il gruppo dei trattati e di quello del controllo prima del trattamento. 9
Esempio DID: la politica monetaria nella grande depressione 10
Esempio DID: la politica monetaria nella grande depressione 2 • Richardson e Troost (2009) hanno studiato l’effetto di diverse politiche monetarie sulla stabilità del Sistema bancario in un periodo di crisi (quello postumo della Grande Depressione del 1929) con un quasi-esperimento. • Negli USA ci sono 23 distretti della Banca centrale. • In particolare lo Stato del Mississippi (MP) contiene sia il 6° che Il’ 8° distretto. • Il confine tra questi due distretti fu determinate in base alla popolazione del 1913, quindi non legato alla crisi del 1929, e permette di definire questo caso un esperimento tra Stati quasi-naturale. Richardson, G. e Troost W. (2009), Monetary Intervention Mitigated Banking Panics during the Great Depression: Quasi-Experimental Evidence from a Federal Reserve District Border, 1929– 1933, Journal of Political Economy, 117, 6, 1031– 1073. 11
Esempio DID • 12
Esempio DID 2 1. Il numero medio di banche nel 6° distretto prima del 1931 era 138 (trattati – prima del trattamento) 2. Il numero medio di banche nel 6° distretto dopo il 1931 era 109, 5 (trattati – dopo il trattamento) 3. Il numero medio di banche nel 8° distretto prima del 1931 era 167 (non trattati – prima del trattamento) 4. Il numero medio di banche nel 8° distretto dopo il 1931 era 118 (non trattati - dopo il trattamento) Gruppo dei trattati Gruppo di controllo Prima 138 167 Dopo 109, 5 118 13
Esempio DID 3 • 14
Esempio DID 4 8° distretto 6° distretto • In questo grafico si può osservare che in entrambi i distretti le banche sono diminuite dopo la crisi, ma molto di più nel 8° distretto (gruppo di controllo) • La linea blu tratteggiata è il controfattuale, cioè quello che sarebbe successo nel distretto se la politica non sarebbe stata applicata 15
• Se si vuole fare una semplice analisi DID il comando in STATA è diff • Il comando diff permette di stimare l’effetto di un trattamento tramite DID su una data variabile risultato [var_y] • Il comando richiede di indicare: o Una variabile dummy che indica il periodo di trattamento (0: prima; 1: dopo) [period_var] o Una variabile dummy che indica unità trattate o quelle di controllo (0: controllo; 1: trattato) [treatment_var] • diff var_y, period(period_var) treated(treatment_var) Comando diff Esercizio: Utilizzando il dataset banks. dta, Creare una variabile che indica prima e dopo il trattamento (1931) Creare una variabile che indica I trattati (6° distretto) e il gruppo di controllo (8° distretto), Fare una semplice analisi DID 16
Risultati di STATA – comando diff 17
Modello OLS con variabile dummy • 18
Dimostrazione grafica • 19
Dimostrazione formale • 20
Modello econometrico DID - base • 21
Modello econometrico DID – base 2 • 22
• Per replicare il modello econometrico DID in STATA, occorre fare una regressione attraverso il comando: • reg var_y post T post_T • Dove: • var_y è la variabile di controllo • post è la dummy variabile = 1 dopo il periodo di trattamento • T è il variabile = 1 se i è stato trattato • post_T è l’interazione tra post e T Modello DID econometrico Esercizio: Utilizzando il dataset banks. dta, Creare una variabile interagita tra post e T Fare una regressione che replichi il modello DID-base 23
Risultati di STATA Ora è possibile confrontare I risultati di questa regressione con quelli nel commando diff 24
Problema delle variabili omesse • Il problema delle variabili omesse si ha quando un modello statistico tralascia in modo errato una o più variabili, attribuendo l’effetto delle variabili mancante erroneamente negli effetti stimati. • Inoltre omettere variabili nella regressione aumenta il selection bias. • Lo stimatore con Effetti Fissi permette di diminuire l’effetto delle variabili omesse, aggiungendo un set di variabili dummy a livello individuale, ogni dummy assorbe il particolare effetto di ciascun individuo. • In pratica: o Crea un set di n var. dummy, Dj , tali che Dj=1 if i = j o Effettua la regressione di Yit su Xit e su tutte le Dj 25
Lo stimatore ad effetti fissi in STATA • Prima di effettuare la regressione, è necessario specificare quali siano le variabili chiavi (unità statistica + variabile tempo) del panel con il commando xtset panelvar timevar • Gli effetti fissi (Fixed-effects - FE) si possono utilizzare in Stata con l’opzione fe del comando xtreg: xtreg y x 1 x 2, fe • Oppure per creare n variabili dummy che controllano per gli effetti fissi si può alternativamente usare questa specificazione del commando xtreg: xi: xtreg y x 1 x 2 i. panelvar 26
Modello econometrico DID – con effetti fissi • 27
Pregi e difetti del metodo DID • Pregi • Interpretazione intuitiva • E’ possibile descrivere un effetto causale utilizzato dati osservati se determinate assunzioni sono fatte. • E’ possibile utilizzare sia dati individuali che di gruppo. • Gruppi diversi possono essere analizzati insieme anche se partono da livelli diversi di outcome. • Tiene in considerazione possibili altri fattori oltre all’intervento studiato. 28
Pregi e difetti del metodo DID 2 • Limiti • Richiede una precisa definizione di inizio della policy e di un gruppo di soggetti che non hanno subito la policy. • Non può essere utilizzato se essere trattato o meno dipende dalla variabile risultato. • Non può essere utilizzato se i gruppi di controllo e il gruppo dei trattati non hanno lo stesso trend nella variabili di controllo prima dell’inizio del trattamento. • Non può essere utilizzato se la composizione del gruppo dei trattati/non trattati è molto instabile nel tempo. 29