Econometria e big data Patrick Gagliardini USI Facolt
Econometria e big data Patrick Gagliardini USI, Facoltà di scienze economiche 17 maggio 2014
Introduzione • Le scienze economiche studiano le relazioni tra variabili che descrivono scelte di consumo, produzione, investimento, … • Econometria: un approccio quantitativo ed empirico • Sviluppi recenti: disponibilità crescente di grandi basi dati (big data) • Nuove prospettive: Quali sfide e opportunità? • Il punto di vista di un econometrico
Introduzione Econometria
Introduzione Econometria Teoria economica Modello econometrico Dati (osservazioni della realtà) • Quantificazione delle relazioni tra variabili • Verifica empirica della teoria economica • Input ai decisori economici
Introduzione Big data • Un concetto con molteplici aspetti: a. Grandi dimensioni: ordine 1015 – 1021 byte b. Nuove tipologie di dati: interazioni tra individui • In finanza: da 1980 -90, con la diffusione di carte di credito e uso di sistemi elettronici nei mercati borsistici (dati ad alta frequenza) • Recentemente: informazioni dettagliate su dinamiche individuali e di gruppo grazie a nuove tecnologie e social networks
Introduzione Big data: impatto in diversi ambiti Source: Mc. Kinsey Global Institute (2011).
Big data nelle scienze economiche: nuove opportunità? • L’uso di big data non implica un primato dei dati sul modello • Il modello è centrale per l’economista per interpretare la realtà! • «Let the data speak … yes, but to the models!» (A. Monfort) • Quali domande strutturali possono trovare una (migliore) risposta tramite i big data? • Tema generale: le interdipendenze tra i comportamenti economici (rischi) individuali
Large panels di storie individuali • Grandi basi dati con serie storiche di rischi individuali: rendimenti di titoli finanziari, solvibilità di imprese e famiglie, … • Panel data: n individui × T istanti temporali (con n ~ 10, 000 -1, 000 e T ~ 10 -100, 000) • L’esposizione a fattori sistematici esogeni spiega i co-movimenti nelle dinamiche dei rischi individuali • Quanti e quali sono i fattori di rischio sistematici?
Large panels di storie individuali Analisi economica disaggregata • Un approccio classico: aggregazione dei dati tra individui per ridurre la dimensione cross-sezionale • Trend recente: estrazione di informazione sui fattori sistematici a partire da «big panel data» disaggregati • Vantaggio: evitare gli effetti distortivi associati ad un’aggregazione ad hoc! • Stima con big data = aggregazione basata sul modello
Large panels di storie individuali Esempio: il premio al rischio Extra rendimento atteso per unità di esposizione ad un rischio sistematico Stima con rendimenti mensili di 9, 936 imprese in CRSP Stima con rendimenti mensili di 25 portafogli di Fama & French Gagliardini, Ossola & Scaillet (2010).
Modelli con interazioni • Interazioni sociali: il comportamento di un individuo dipende dal comportamento di altri individui in un gruppo di riferimento (contesto) • Peer influences, neighbourhood effects, herd behaviour, social norms • Interazioni commerciali: legami acquirente-venditore • Fenomeni di contagio nei mercati finanziari: interconnessioni tra i bilanci degli istituti, tra portafogli di fondi, etc.
Modelli con interazioni Identificazione • È possibile distinguire empiricamente le interazioni endogene dall’effetto di fattori comuni esogeni? • Le interazioni (istantanee) sono osservazionalmente equivalenti all’effetto di fattori esogeni (reflection problem, Manski (RES, 1993)) • In assenza di informazione a priori sul contesto, il modello non è identificabile! • L’identificazione è possibile con big data contenenti informazione sulle interazioni (exclusion restrictions)
Modelli con interazioni Esempio: matrici di esposizioni bilaterali L’elemento in riga i e colonna j è la percentuale del capitale della banca j detenuto dalla banca i al 31. 12. 2010. BPCE CM SG BNPP CA … BPCE 0 0 0. 69 0. 41 0. 68 … CM 0 0 0. 23 0. 14 0. 23 … SG 0 0 1. 65 0. 21 0. 34 … BNPP 0 0 0. 31 0. 30 … CA 0 0 0. 71 0. 42 0. 39 … … … … Dimensione 3, 000 × 3, 000 Fonte: Gouriéroux, Heam, Monfort (2012), in relazione al Financial Report database sviluppato dalla European Banking Authority.
Networks Financial networks e rischio sistemico • La regolamentazione post-crisi 2008 -09 (Basilea III, Financial Stability Board) si focalizza sul rischio sistemico • Rischio di collasso o disfunzionamento maggiore del sistema finanziario • Solvibilità o liquidità? «Challenges in Identifying and Measuring Systemic Risk» (L. P. Hansen (2012)) • Quale ruolo ha la struttura del network finanziario nella creazione del rischio sistemico?
Networks Source: Borovkova & Lalaoui El Mouttalibi (2013). La letteratura teorica mostra che il grado e la tipologia di interconnessione del network hanno un influsso determinante e complesso sul rischio sistemico (Allen & Gale (JPE 2000), Acemoglu & al. (Etrica 2011))
Networks Quale struttura hanno i network finanziari reali? ? Source: Borovkova & Lalaoui El Mouttalibi (2013).
Networks endogeni • I big data sulle interazioni sono informativi sul tipo di struttura del network • Verso la specificazione di modelli econometrici esplicativi per network • Endogeneità del network: i legami sono il frutto di scelte individuali correlate con le variabili economiche di interesse (Goldsmith-Pinkham & Imbens (2011))
Conclusioni • L’econometria prevede un dialogo tra modelli e dati tramite metodi statistici • Big data: grandi, ma soprattutto nuovi tipi di dati • Nuove opportunità per l’analisi economica empirica delle interdipendenze tra comportamenti (rischi) individuali • Sfide dovute alla necessità di sviluppare IT avanzato e metodi econometrici appropriati • Modelli complessi, grandi basi di dati, metodi di inferenza numericamente efficienti
- Slides: 18