Rgression linaire STT2400 Section 3 Tests dhypothses et

  • Slides: 12
Download presentation
Régression linéaire (STT-2400) Section 3 Tests d’hypothèses et intervalles de confiance Version: 28 février

Régression linéaire (STT-2400) Section 3 Tests d’hypothèses et intervalles de confiance Version: 28 février 2008 STT-2400; Régression linéaire

Hypothèses concernant un préviseur particulier l L’obtention d’information sur un des préviseurs peut être

Hypothèses concernant un préviseur particulier l L’obtention d’information sur un des préviseurs peut être une considération pertinente. Formellement, on pourrait vouloir vérifier si le préviseur xi devrait être inclus dans la fonction moyenne: l Ceci revient à tester: l 2 STT-2400; Régression linéaire

Exemple: Données sur l’essence l La fonction moyenne est: l On pourrait vouloir tester:

Exemple: Données sur l’essence l La fonction moyenne est: l On pourrait vouloir tester: l Afin de voir si la variable « Tax » est importante, on va faire la régression: – – 3 (i) Incluant la variable « Tax » (modèle plein), (ii) Excluant la variable « Tax » (modèle réduit). STT-2400; Régression linéaire

Critère: réduction significative dans la somme des carrés résiduelle l l Notre critère repose

Critère: réduction significative dans la somme des carrés résiduelle l l Notre critère repose sur la somme des carrés RSS: On regarde si le fait d’inclure un préviseur de plus, « Tax » , occasionne une réduction significative dans RSS. Sortie informatique SAS: – – l l l 4 RSSMP: 193700 avec n - p - 1 = 51 - 4 - 1 = 46 degrés de liberté; RSSMR: 211964 avec n - p = 51 - 4 = 47 degrés de liberté. On trouve alors: RSSMR – RSSMP = 211964 - 193700 = 18264. Est-ce que cette différence est statistiquement significative? STT-2400; Régression linéaire

Statistique d’intérêt l La statistique d’intérêt est: l l Sous l’hypothèse nulle: L’estimateur est

Statistique d’intérêt l La statistique d’intérêt est: l l Sous l’hypothèse nulle: L’estimateur est l’estimateur de modèle plein. Dans l’exemple: l L’hypothèse nulle H 0 est rejetée de justesse. l 5 STT-2400; Régression linéaire dans le

Test-F partiel l Le test-F précédent est aussi appelé test-F partiel. Le test étroitement

Test-F partiel l Le test-F précédent est aussi appelé test-F partiel. Le test étroitement lié aux tests-t qui sont fournis dans les sorties informatiques de SAS. Exemple: l l l l 6 Variable Intercept log. Miles Revenu Dlic Tax DF 1 1 1 Parameter Estimate 154. 19284 18. 54527 -6. 13533 0. 47187 -4. 22798 Standard Error 194. 90616 6. 47217 2. 19363 0. 12851 2. 03012 t Value 0. 79 2. 87 -2. 80 3. 67 -2. 08 Pr > |t| 0. 4329 0. 0063 0. 0075 0. 0006 0. 0429 On note que la valeur-p est exactement la même. En fait, on note que la statistique-t est: -4. 22798/2. 03012 = -2. 0826 et (-2. 0826)2=4. 337. STT-2400; Régression linéaire

Équivalence du test-F partiel et du test-t l En fait, le test-t et le

Équivalence du test-F partiel et du test-t l En fait, le test-t et le test-F partiel sont équivalents dans ce cas-ci. Dans le cas d’une statistique-t, on compare à une tn-p-1 et on peut montrer que si t ~ tn-p-1, alors t 2 = F ~ F 1, n-p-1. Puisque on pourrait vouloir confronter: l Dans un tel cas tobs = -2. 0826 et la valeur-p est: l l 7 STT-2400; Régression linéaire

Intervalles de confiance 8 l Dans le modèle l De plus, on présume la

Intervalles de confiance 8 l Dans le modèle l De plus, on présume la normalité: l On désire construire un intervalle de confiance pour , avec: STT-2400; Régression linéaire , avec:

Intervalle de confiance pour un coefficient l Posons , un vecteur de dimension p

Intervalle de confiance pour un coefficient l Posons , un vecteur de dimension p + 1, où le un est en position j. Ainsi: Or impliquant Donc l On pose l l l 9 STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite) 10 l Donc l Or on ne

Intervalle de confiance pour un coefficient (suite) 10 l Donc l Or on ne connaît pas l De plus: . On a vu que: STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite) l l 11 Sous l’hypothèse ne normalité,

Intervalle de confiance pour un coefficient (suite) l l 11 Sous l’hypothèse ne normalité, il est possible de montrer que et sont indépendants. Ceci implique: STT-2400; Régression linéaire

Intervalle de confiance pour un coefficient (suite et fin) 12 l Ainsi: l Ainsi

Intervalle de confiance pour un coefficient (suite et fin) 12 l Ainsi: l Ainsi un intervalle de confiance pour STT-2400; Régression linéaire est: