Likelihood ratio test twald fungerer fint for en

  • Slides: 18
Download presentation
Likelihood ratio test • t/wald fungerer fint for en parameter • Men hvis faktor

Likelihood ratio test • t/wald fungerer fint for en parameter • Men hvis faktor har flere end 2 niveauer er der mere end 1 parameter ! • Løsning: likelihood ratio test. • Likelihood funktion: sandsynligheden for at observere det givne datasæt opfattet som en funktion af de ukendte parametre

Likelihood funktion for en binomialfordelt variabel

Likelihood funktion for en binomialfordelt variabel

Eksempel: n=10 y=3 Eksempel (likelihood ratio): L(0. 4)/L(0. 6)>1 dvs. p=0. 4 er mere

Eksempel: n=10 y=3 Eksempel (likelihood ratio): L(0. 4)/L(0. 6)>1 dvs. p=0. 4 er mere trolig (likely) end p=0. 6 NB: L(p) er maximal for p=3/10=0. 3= maximum likelihood estimatet.

Likelihood ratio test • Antag vi har observeret x fra b(n, p) • Betragt

Likelihood ratio test • Antag vi har observeret x fra b(n, p) • Betragt hypotesen H 0: p=0. 5 mod H 1: p<0. 5 eller p>0. 5. • Under H 1 estimeres p ved x/n • Jo mindre L(0. 5) er i forhold til L(x/n) des mere evidens mod H 0. Dvs. kritisk for H 0 hvis

Likelihood-funktion for logistisk regression

Likelihood-funktion for logistisk regression

Likelihood ratio test for b=0

Likelihood ratio test for b=0

Eksempel: bil og alder. NB: likelihood ratio test og Wald test giver ensartet resultat

Eksempel: bil og alder. NB: likelihood ratio test og Wald test giver ensartet resultat når vi tester hypotese vedr. en parameter.

Goodness of fit (grupperede data)

Goodness of fit (grupperede data)

Goodness of fit II (grupperede data)

Goodness of fit II (grupperede data)

Eksempel: bil og alder I overeenstemmelse med tidligere konklusioner er goodness of fit testet

Eksempel: bil og alder I overeenstemmelse med tidligere konklusioner er goodness of fit testet meget signifikant – dvs. model passer ikke til data – og vi kan ikke fæste lid til de beregnede tests for b=0. Dog skal vi også passe på med goodness of fit testet da en del observationer mindre end 5.

Sammenligning af modeller • 2 modeller hvor en er indlejret (nested) i den anden:

Sammenligning af modeller • 2 modeller hvor en er indlejret (nested) i den anden: -2 * log likelihood ratio test • 2 modeller der ikke er nestede: AIC (se opgave) • PAS PÅ: 2 log likelihoods er kun sammenlignelige hvis samme gruppering (aggregering) (multinomial logistic regression vælger som udgangspunkt at gruppere mest muligt)

Multipel regression • For lineær/multipel regression kaldes likelihood ratio testet for F-testet. Men ellers

Multipel regression • For lineær/multipel regression kaldes likelihood ratio testet for F-testet. Men ellers samme princip. • Navn skyldes, at man vurderer likelihood ratio test vha. den såkaldte F-fordeling.

Hierarkisk princip • Hvis to faktorer A og B indgår i en signifikant vekselvirkning

Hierarkisk princip • Hvis to faktorer A og B indgår i en signifikant vekselvirkning giver det ikke mening at teste om de separate effekter af A og B er signifikante ! • Dvs. trinvis model selektion: start med at teste interaktioner. Ikke signifikante komponenter af modellen fjernes en for en idet at model tilpasses på ny hver gang en komponent er fjernet.

Eksempel: huspriser Tabel med F-tests for diverse kovariater, faktorer og vekselvirkninger. 3. ordens interaktion

Eksempel: huspriser Tabel med F-tests for diverse kovariater, faktorer og vekselvirkninger. 3. ordens interaktion ikke signifikant – fjerner den og tilpasser model på ny. I slutmodel er bedrooms*zip signifikant hvorfor bedrooms og zip også skal være i modellen.

Eksempel: bil og afstand, køn Dvs. interaktion ikke signifikant. Model med interaktion = mættet

Eksempel: bil og afstand, køn Dvs. interaktion ikke signifikant. Model med interaktion = mættet model derfor er deviance og Pearson = 0.

Eksempel: bil og separate effekter af køn og afstand Køn ikke signifikant, men afstand

Eksempel: bil og separate effekter af køn og afstand Køn ikke signifikant, men afstand er ! Goodness-of-fit stemmer overens med test for ingen interaktion !

Aggregering • Multinomial logistic anvender pr. default gruppering med færrest mulige antal grupper: fordelagtigt

Aggregering • Multinomial logistic anvender pr. default gruppering med færrest mulige antal grupper: fordelagtigt for goodness-of-fit test men pas på med sammenligning af -2 *loglikelihood for to modeller fittet med forskellige kald af multinomial logistic. • Kan selv styre aggrering vha. “subpopulations” • binary logistic grupperer/aggregerer ikke