Mthodes de prvision STT3220 Section 6 Modlisation de

  • Slides: 21
Download presentation
Méthodes de prévision (STT-3220) Section 6 Modélisation de séries chronologiques avec la méthodologie de

Méthodes de prévision (STT-3220) Section 6 Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins Version: 11 décembre 2008 STT-3220; Méthodes de prévision

Identification des modèles ARIMA 2 l On désire ajuster un modèle ARMA(p, q): l

Identification des modèles ARIMA 2 l On désire ajuster un modèle ARMA(p, q): l Un autre type de modèles est le modèle ARIMA(p, d, q): l Un modèle ARIMA est simplement un modèle dont la dième différence est ARMA. STT-3220; Méthodes de prévision

Méthode de Box et Jenkins l l Box et Jenkins ont popularisé l’utilisation des

Méthode de Box et Jenkins l l Box et Jenkins ont popularisé l’utilisation des modèles ARMA, en insistant sur les étapes nécessaires à la modélisation d’une série chronologique quelconque: Les trois étapes sont: – – – 3 Identification des modèles (choix des ordres p, d et q). Estimation des paramètres; moindres carrés conditionnels, inconditionnels, maximum de vraisemblance. Validation du modèle (statistiques portmanteau; prévisions). STT-3220; Méthodes de prévision

Étape 1: Identification l 1. Est-ce que la variance semble constante? – – On

Étape 1: Identification l 1. Est-ce que la variance semble constante? – – On veut s’assurer que le terme de variance dans le modèle est constant, par exemple comme fonction du temps. Transformations populaires: l l – 4 Transformation racine, transformation inverse, transformation logarithmique. Préférablement (mais de manière optionnelle dans le cours), méthodologie de Box-Cox pour trouver la transformation. On veut stabiliser la variance, et en plus, se rapprocher de la normalité des erreurs. STT-3220; Méthodes de prévision

Transformation de Box-Cox 5 l La transformation a la forme: l Le choix de

Transformation de Box-Cox 5 l La transformation a la forme: l Le choix de l se fait souvent en effectuant un graphique de la vraisemblance en fonction de l. STT-3220; Méthodes de prévision

Identification (suite) l l l 6 2. Choix du niveau de différentiation. Ici on

Identification (suite) l l l 6 2. Choix du niveau de différentiation. Ici on veut une série stationnaire. En particulier la moyenne ne doit pas dépendre du temps. Si la série est stationnaire: Si est ARMA(p, q), alors les autocorrélations r(k) sont en nombre infini et décroissent vers 0 plutôt rapidement. Un estimateur de r(k) est donné par r(k). STT-3220; Méthodes de prévision

Identification (suite) 7 l De plus, on devrait avoir que: l Cependant, la série

Identification (suite) 7 l De plus, on devrait avoir que: l Cependant, la série est non-stationnaire, que se passe-t-il? On sait que cov(Zt, Zt-k) va dépendre de k, mais aussi de t. Ainsi les autocorrélations r(k) ne sont pas définies. Mais que sera la comportement des statistiques r(k)? STT-3220; Méthodes de prévision

Théorème l l 8 Soit une série chronologique générée d’un processus ARIMA(p, d, q),

Théorème l l 8 Soit une série chronologique générée d’un processus ARIMA(p, d, q), où ; on présume que le terme d’erreur est un bruit blanc Gaussien. Alors pour chaque délai k fixé, on a que: STT-3220; Méthodes de prévision

Cas stationnaire versus cas nonstationnaire, comportement des r(k), k fixé, comme fonction de n.

Cas stationnaire versus cas nonstationnaire, comportement des r(k), k fixé, comme fonction de n. 9 l Cas stationnaire: l Cas non-stationnaire: STT-3220; Méthodes de prévision

Autres éléments d’information l l l 10 Cas stationnaire: Les r(k) comme fonction de

Autres éléments d’information l l l 10 Cas stationnaire: Les r(k) comme fonction de k décroissent à 0 de façon exponentielle (décroissance vers 0 très rapide). Cas non-saisonnier: à partir de k = 20, toutes les autocorrélations devraient être très près de 0. Cas non-stationnaire: Décroissance des r(k) de manière linéaire vers 0? Décroissante très lente? Les r(k) sont toutes de même signes? Ce sont tous des indices d’un problème de stationnarité. STT-3220; Méthodes de prévision

Identification: choix de p et de q l l Ayant identifié d, on a

Identification: choix de p et de q l l Ayant identifié d, on a maintenant comme modèle. Important éléments d’information: – – l 11 Pour un autorégressif, toutes les autocorrélations partielles s’annulent après un certain délai. Pour un moyenne-mobile, toutes les autocorrélations s’annulent après un certain délai. Que fait-on si les r(k) et les fkk semblent tous les deux en nombre infini? STT-3220; Méthodes de prévision

Modélisation des résidus 12 l Supposons que le processus est: l Cependant, le processus

Modélisation des résidus 12 l Supposons que le processus est: l Cependant, le processus bruit blanc mais un ARMA STT-3220; Méthodes de prévision n’est pas un. Donc:

Modélisation des résidus (suite) l Quelques manipulations donnent: l Ce modèle n’est rien d’autre

Modélisation des résidus (suite) l Quelques manipulations donnent: l Ce modèle n’est rien d’autre qu’un ARIMA 13 STT-3220; Méthodes de prévision

Modélisation des résidus: exemple l l 14 Supposons que vos disposez d’une série. Vous

Modélisation des résidus: exemple l l 14 Supposons que vos disposez d’une série. Vous la différenciez une fois pour la rendre stationnaire. Vous disposez à ce stade d’un ARIMA(p, 1, q). Vous trouvez que r(1) suggère une composante MA. Vous modéliser un ARIMA(0, 1, 1). Un examen des résidus suggère une composante AR(1). Vous tentez finalement un ARIMA(1, 1, 1) qui devrait faire l’affaire. En résumé: ce sont les résidus qui permettent de construire des modèles ARMA en pratique. STT-3220; Méthodes de prévision

Étape 2: Estimation l Dans le modèle: l On doit procéder à l’estimation de:

Étape 2: Estimation l Dans le modèle: l On doit procéder à l’estimation de: – – 15 Paramètres autorégressifs: Paramètres moyenne-mobiles: Paramètre STT-3220; Méthodes de prévision

Estimation de l Dans l Donc: l Or on a vu On rejette H

Estimation de l Dans l Donc: l Or on a vu On rejette H 0 si l 16 où STT-3220; Méthodes de prévision

Estimation des paramètres autorégressifs et moyenne-mobiles l Plusieurs techniques sont possibles: – – –

Estimation des paramètres autorégressifs et moyenne-mobiles l Plusieurs techniques sont possibles: – – – l 17 Méthode du maximum de vraisemblance, Méthode par moindres carrés conditionnels, Méthode par moindres carrés inconditionels, Ces techniques sont discutées dans Abraham & Ledolter (pp. 250 -258). STT-3220; Méthodes de prévision

Étape 3: Validation du modèle l l l 18 Quand on cherche à valider

Étape 3: Validation du modèle l l l 18 Quand on cherche à valider un modèle de régression, une étape consiste habituellement à analyser les résidus. La situation est similaire en séries chronologiques. Considérons le modèle: Les résidus sont: Les sont obtenus en estimant les divers paramètres. STT-3220; Méthodes de prévision

Test approximatif: test de bruit blanc sur les résidus 19 l On se rappelle

Test approximatif: test de bruit blanc sur les résidus 19 l On se rappelle que si est un bruit blanc, alors les sont asymptotiquement indépendants, admettant pour un k donné une loi normale: l Un test de l’hypothèse H 0 : r(k) = 0 peut reposer sur le test: et la règle de décision consiste à rejeter la nulle si: STT-3220; Méthodes de prévision

Introduction aux tests de type portemanteau 20 l Puisque les sont approximativement de lois

Introduction aux tests de type portemanteau 20 l Puisque les sont approximativement de lois N(0, 1), et utilisant l’indépendance, lorsque est bruit blanc fort, on trouve que: l Pour l’hypothèse nulle d’adéquation, on rejette pour de grandes valeurs, i. e. STT-3220; Méthodes de prévision

Test de Box-Pierce et de Ljung-Box l En suivant un raisonnement similaire au test

Test de Box-Pierce et de Ljung-Box l En suivant un raisonnement similaire au test de bruit blanc, mais tenant compte du fait que l’on construit une statistique de test basée sur des résidus, Box et Pierce, ainsi que Ljung et Box ont montré que pour tester l’adéquation d’un modèle ARMA(p, q): l La logique des tests est la même: on rejette pour de grandes valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si 21 STT-3220; Méthodes de prévision