Kvantitative metoder 2 Instrumentvariabel estimation 14 maj 2007
Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007 KM 2: F 25 1
Plan for resten af gennemgangen • F 25: Instrumentvariabel (IV) estimation: – – • F 26: Kap. 15. 2 -3, 15. 5 og afsnit 4, 6 -7 i noten. – – – • Overidentificeret tilfælde 2 SLS (two-stage least squares) estimation og inferens. Test af overidentificerende restriktioner Målefejl F 28: Afslutningsforelæsning – – – • Flere endogene regressorer (eksakt identificeret): 15. 2 -3 2 SLS (two-stage least squares) i et eksakt identificeret tilfælde. Test af exogenitet F 27: Kap. 15. 4 -6, afsnit 5 -7 i noten – – • Introduktion til endogenitet og instrumentvariabler En regressor, et instrument: Kap. 15. 1 + afsnit 1 -4 i noten. Eksempel: Fødselsvægt og rygning Kap. 19 om empiriske projekter Information vedr. eksamen Ugeseddel 10 KM 2: F 25 2
Exogenitetsantagelsen KM 2: F 25 3
Exogenitetsantagelsen KM 2: F 25 4
Exogenitet: Korrelation er ikke kausalitet KM 2: F 25 5
Ex. Lønligningen • Opstiller regressionsmodel til forklaring af løn for n tilfældigt udvalgte lønmodtagere. • Inkluderer relevante og potentielt observerbare faktorer i vektor af forklarende variabler : køn, alder, uddannelse, branche, erfaring, … • Uobserverbar heterogenitet: ”evne”, ”intelligens”, ”arbejdsiver” • Ønsker at estimere afkastet af uddannelse. • Men: Uddannelseslængde er korreleret med ”evne” og ”evne” har rimeligvis en direkte effekt på lønnen. • Tredje faktor forårsager både løn og uddannelse. • Kan vi bruge OLS estimatet af koefficienten til uddannelse i lønligningen til noget? • I hvilken retning forventer vi bias? KM 2: F 25 6
Instrumentvariabler (1) • • • Simpel regressionsmodel: Ex. Lønligningen Uobserverbar heterogenitet i form af ”evner”: Positiv effekt på løn og (positivt) korreleret med uddannelse. • OLS er inkonsistent: • IV løsning: Find instrumentvariabel • Udfordringen er at finde gode instrumenter: Økonomisk teori spiller den afgørende rolle her. KM 2: F 25 som opfylder to betingelser: 7
Instrumentvariabler (2) De to betingelser for en gyldig instrumentvariabel har forskellig status: • Betingelse 1: – Instrumentvariablen skal være ukorreleret med de uobserverbare faktorer i – Løn-eksemplet: Instrumentet skal være ukorreleret med ”evner”. – Afhænger i sidste ende altid af en teoretisk baseret antagelse. • Betingelse 2: – Instrumentvariablen skal være korreleret med den endogene forklarende variabel. – Testbar antagelse på grundlag af data på og : Signifikant regressionskoefficient i regression af på. KM 2: F 25 8
Lønligningen: Overvej nogle mulige instrumenter • Sidste ciffer i personnummer: – US: Tilfældigt: Ukorreleret med ”evner”, men heller ikke korreleret med uddannelse. – DK: Hvad kan vi sige om cpr. nummeret? • IQ-score: Proxy-variabel for ”evner” i kap. 9. – Korreleret med ”evner”: Ikke godt for instrumentvariabel! • Familiebaggrundsvariabler: – Moderens uddannelse: Betingelse 2 OK; betingelse 1: ? ? Korreleret med børns ”evner”, måske via genetik og ”evne” for spædbørnspleje. – Antal søskende: Negativt korreleret med længde af uddannelse (betingelse 2 er OK (DK? )); betingelse 1 er OK pr. antagelse. KM 2: F 25 9
IV estimation i en simpel regressionsmodel: En endogen regressor, et instrument • Den simple regressionsmodel • Antag: – x er endogen – og z er et brugbart instrument for x, dvs: • IV estimatoren for kan udledes som en moment estimator (tavlegennemgang) KM 2: F 25 10
IV estimation: Identifikation af parametrene • Simpel regressionsmodel: • Gyldigt instrument: , • Givet identificeres parameteren som • IV estimatorerne findes ved at indsætte de analoge størrelser fra stikprøven: KM 2: F 25 11
IV estimatoren • IV estimatoren er konsistent: (tavlegennemgang) • IV estimatoren er asymptotisk normalfordelt. • Hvis faktisk er exogen kan den bruges som ”sit eget instrument”: OLS som specialtilfælde af IV. • IV estimatoren: Har gode asymptotiske egenskaber, dvs. vi ved at den virker i store datasæt. Men: – IV generelt ikke middelret – IV vil ofte have en relativt stor varians. • Hvis , men den ikke er ”ret stor”, så er z et ”svagt instrument”: t-test i hjælperegression af x på z KM 2: F 25 12
IV estimatoren: Inferens • Antag: Homoskedasticitet: • Den asymptotiske varians på er givet ved Variansen går mod nul som 1/n ligesom for OLS. • Estimeres konsistent ved • t-værdi er asymptotisk normalfordelt. • Eksempler: Ex. 15. 1 og 15. 2. KM 2: F 25 13
Andre bud på instrumenter til lønligningen • Angrist og Krueger: Dummy variabel som instrument: – Finder signifikant korrelation mellem uddannelseslængde og det kvartal, man er født i (for amerikanske data). – Argumenterer for at fødselskvartal er ukorreleret med ”evne”. • Angrist: ”Naturligt eksperiment”: – Ser på sammenhæng mellem løn og militærtjeneste i Vietnam. – Værnepligten var et lotteri: • Høj korrelation mellem at trække et lavt sessionsnummer og faktisk at aftjene værnepligt. • Tilfældigt udvalg, dvs. sessionsnummer ukorreleret med ”evne” og andre variabler. Sessionsnummer som instrument. KM 2: F 25 14
NB’er • Korrelation og kausalitet er ikke det samme. Data kan vise om der er korrelation mellem to variabler. Kausalitet må bero på et teoretisk argument. • Regressionsmodellen tolkes ofte som en kausal sammenhæng. • Endogene regressorer er forklarende variabler som er korrelerede med fejlleddet: OLS er inkonsistent • IV estimatoren bygger på at der kan findes en variabel (eller flere) som – Man kan argumentere for er ukorrelerede med fejlleddet, – Og kan vises at være korreleret med den endogene regressor. KM 2: F 25 15
Næste gang: • Onsdag • Flere endogene regressorer • 2 SLS (two-stage least squares) estimation og inferens. • Test af exogenitet KM 2: F 25 16
- Slides: 16