Comment ajuster un modèle ARIMA avec XLSTAT-Time ?

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici. Les données proviennent de [Box, G.E.P. and Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco], et correspondent au trafic aérien international (en milliers de passagers) de Janvier 1949 à Décembre 1960. Le but de l'analyse est d'ajuster le modèle sur les données des 11 premières années puis de prédire le trafic de l'année 1960 avec le modèle.

hw1f.gif

On note sur ce graphique que le nombre de passagers a tendance à augmenter régulièrement, que l'on retrouve chaque année un cycle similaire, mais que les variations à l'intérieur d'une même année sont de plus en plus fortes. Afin de supprimer l'augmentation des variations intra-annuelles nous prenons le logarithme népérien des données. Nous pouvons vérifier sur le graphique ci-dessous que l'augmentation des variations intra-annuelles est nettement réduite.

arima1f.gif

On peut maintenant ajuster un modèle ARIMA(0,1, 1)(0,1,1)12 qui semble approprié pour tenir compte à la fois de la composante tendancielle et de la cyclicité annuelle observées.

Pour activer la boîte de dialogue des méthodes de lissage, lancez XLSTAT, puis sélectionnez la commande XLSTAT/XLSTAT-Time/ARIMA, ou cliquez sur le bouton équivalent de la barre d'outils XLSTAT-Time.

bararimaf.gif

Une fois le bouton cliqué, la boîte de dialogue des méthodes de lissage apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel. La "Série à analyser" correspond à la série étudiée, les données Log(Passagers). On laisse l'option "Centrer" activée afin de permettre à XLSTAT de centrer automatiquement la série. Après avoir sélectionner la colonne des données, définissez le type de modèle ARIMA à ajuster en entrant les ordres du modèle (p,d,q)(P,D,Q)s. La période de la série est fixée à 12 car le trafic semble connaître des cycles annuels (12 mois). Enfin, dans la case validation nous mettons la valeur 12 car nous voulons que les 12 dernièrs mois correspondant à l'année 1960 ne soient pas pris en compte pour l'ajustement du modèle, mais que les prévisions soient calculées pour cette période (validation du modèle). L'option "Libellés des colonnes" est activée car la première ligne de la série comprend le nom de la série.

arima2f.gif

Une fois que vous avez cliqué sur le bouton "OK", les calculs commencent puis les résultats sont affichés. Le premier tableau fournit des statistiques simples pour la série sélectionné. Un tableau permettant d'évaluer la qualité du modèle après optimisation est ensuite fourni. Ces différents indices permettent éventuellement de comparer différents modèles entre eux.

arima3f.gif

Dans le tableau suivant sont affichés les paramètres du modèle. On note que les paramètres MA(1) et SMA(1) parameters sont significativement différent de 0, leur intervalle de confiance à 95% ne compremant pas la valeur 0. Les intervalles de confiance sont calculés sur la base de la matrice hessienne après optimization, comme il est proposé par la plupart des logiciels. Le résultat asymptotique est aussi affiché afin de donner une idée de l'éloignement de la série par rapport à un cas idéal. La constante du modèle est fixée, et est une fonction de la moyenne de la série.

arima4f.gif

Le modèle ARIMA s'écrit alors :

Y(t+1) = 0.001+Z(t-1)-0.333.Z(t-1)-0.544.Z(t-12)+0.181*Z(t-13)
avec
Z(t) est un bruit blanc N(0, 0.001)
Y(t)=(1-B)(1-B12)X(t),
et X(t) est la série de départ.

L'équation permettant de calculer des prévisions pour la série X(t) est :
X(t+1) = Y(t+1)+X(t-1)+X(t-12)-X(t-13)

Après le tableau donnant les valeurs des paramètres du modèle, un tableau fournit les résultats de l'ajustement, avec la série originale et la série correspondant au modèle. En raison de contraintes liées au modèle, nous ne disposons pas de prévisions pour les treize premières valeurs. Elles sont arbitrairement fixées à la valeur de la série observée. Pour les douze dernières observations, les prévisions (Validation) du modèle sont affichées avec un intervalle de confiance.

arima5.gif

Sur le graphique ci-dessous, on peut visuellement confirmer que les prévisions sont bien ajustées aux données.

arima6f.gif

Cliquez ici pour accéder à d'autres tutoriels.