Likelihood ratio test twald fungerer fint for en

Likelihood funktion for en binomialfordelt variabel

Eksempel: n=10 y=3 Eksempel (likelihood ratio): L(0. 4)/L(0. 6)>1 dvs. p=0. 4 er mere

Likelihood ratio test • Antag vi har observeret x fra b(n, p) • Betragt

Likelihood-funktion for logistisk regression

Eksempel: bil og alder. NB: likelihood ratio test og Wald test giver ensartet resultat

Eksempel: bil og alder I overeenstemmelse med tidligere konklusioner er goodness of fit testet

Sammenligning af modeller • 2 modeller hvor en er indlejret (nested) i den anden:

Multipel regression • For lineær/multipel regression kaldes likelihood ratio testet for F-testet. Men ellers

Hierarkisk princip • Hvis to faktorer A og B indgår i en signifikant vekselvirkning

Eksempel: huspriser Tabel med F-tests for diverse kovariater, faktorer og vekselvirkninger. 3. ordens interaktion

Eksempel: bil og afstand, køn Dvs. interaktion ikke signifikant. Model med interaktion = mættet

Eksempel: bil og separate effekter af køn og afstand Køn ikke signifikant, men afstand

Aggregering • Multinomial logistic anvender pr. default gruppering med færrest mulige antal grupper: fordelagtigt

Slides: 18

Download presentation

Likelihood ratio test • t/wald fungerer fint for en parameter • Men hvis faktor har flere end 2 niveauer er der mere end 1 parameter ! • Løsning: likelihood ratio test. • Likelihood funktion: sandsynligheden for at observere det givne datasæt opfattet som en funktion af de ukendte parametre

Likelihood funktion for en binomialfordelt variabel

Eksempel: n=10 y=3 Eksempel (likelihood ratio): L(0. 4)/L(0. 6)>1 dvs. p=0. 4 er mere trolig (likely) end p=0. 6 NB: L(p) er maximal for p=3/10=0. 3= maximum likelihood estimatet.

Likelihood ratio test • Antag vi har observeret x fra b(n, p) • Betragt hypotesen H 0: p=0. 5 mod H 1: p<0. 5 eller p>0. 5. • Under H 1 estimeres p ved x/n • Jo mindre L(0. 5) er i forhold til L(x/n) des mere evidens mod H 0. Dvs. kritisk for H 0 hvis

Likelihood-funktion for logistisk regression

Likelihood ratio test for b=0

Eksempel: bil og alder. NB: likelihood ratio test og Wald test giver ensartet resultat når vi tester hypotese vedr. en parameter.

Goodness of fit (grupperede data)

Goodness of fit II (grupperede data)

Eksempel: bil og alder I overeenstemmelse med tidligere konklusioner er goodness of fit testet meget signifikant – dvs. model passer ikke til data – og vi kan ikke fæste lid til de beregnede tests for b=0. Dog skal vi også passe på med goodness of fit testet da en del observationer mindre end 5.

Sammenligning af modeller • 2 modeller hvor en er indlejret (nested) i den anden: -2 * log likelihood ratio test • 2 modeller der ikke er nestede: AIC (se opgave) • PAS PÅ: 2 log likelihoods er kun sammenlignelige hvis samme gruppering (aggregering) (multinomial logistic regression vælger som udgangspunkt at gruppere mest muligt)

Multipel regression • For lineær/multipel regression kaldes likelihood ratio testet for F-testet. Men ellers samme princip. • Navn skyldes, at man vurderer likelihood ratio test vha. den såkaldte F-fordeling.

Hierarkisk princip • Hvis to faktorer A og B indgår i en signifikant vekselvirkning giver det ikke mening at teste om de separate effekter af A og B er signifikante ! • Dvs. trinvis model selektion: start med at teste interaktioner. Ikke signifikante komponenter af modellen fjernes en for en idet at model tilpasses på ny hver gang en komponent er fjernet.

Eksempel: huspriser Tabel med F-tests for diverse kovariater, faktorer og vekselvirkninger. 3. ordens interaktion ikke signifikant – fjerner den og tilpasser model på ny. I slutmodel er bedrooms*zip signifikant hvorfor bedrooms og zip også skal være i modellen.

Eksempel: bil og afstand, køn Dvs. interaktion ikke signifikant. Model med interaktion = mættet model derfor er deviance og Pearson = 0.

Eksempel: bil og separate effekter af køn og afstand Køn ikke signifikant, men afstand er ! Goodness-of-fit stemmer overens med test for ingen interaktion !

Aggregering • Multinomial logistic anvender pr. default gruppering med færrest mulige antal grupper: fordelagtigt for goodness-of-fit test men pas på med sammenligning af -2 *loglikelihood for to modeller fittet med forskellige kald af multinomial logistic. • Kan selv styre aggrering vha. “subpopulations” • binary logistic grupperer/aggregerer ikke