Comment faire une analyse descriptive et des transformations de séries temporelles ?
Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici. Les données proviennent de [Box, G.E.P. and Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco], et correspondent au trafic aérien international (en milliers de passagers) de Janvier 1949 à Décembre 1960. Le but est ici d'analyser la série chronologique avant de l'utiliser en mode prédictif dans un autre tutoriel.

On note sur ce graphique que le nombre de passagers a tendance à augmenter régulièrement, que l'on retrouve chaque année un cycle similaire, mais que les variations à l'intérieur d'une même année sont de plus en plus fortes. Afin de confirmer ces éléments nous allons analyser la série, puis la transformer pour valider nos hypothèses.
Pour activer la boîte de dialogue de l'analyse descriptive des séries chronologiques, lancez XLSTAT, puis sélectionnez la commande XLSTAT/XLSTAT-Time/Analyse descriptive, ou cliquez sur le bouton équivalent de la barre d'outils XLSTAT-Time.

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'analyse descriptive apparaît. Sélectionner alors les données sur la feuille Excel. La "Variable à analyser" correspond ici à la série Passagers. Cliquez sur le bouton "Plus" pour faire apparaître la partie inférieure de la boîte de dialogue et activez alors l'option "Autocorrélations partielles". L'option "Libellés des colonnes" est activée parce que la première ligne des données sélectionnées correspond au nom de la variable.

Les calculs commencent lorsque l'on a appuyé sur OK. Les résultats sont ensuite affichés. Dans les premiers tableau sont affichées des statistiques générales. Ensuite, un tableau donne les résultats des tests de normalité et de bruit blanc. Le test de Jarque-Bera test est un test de normalité fondé sur les propriétés de symétrie et d'applatissement de la loi normale. Plus la valeur du Khi² est importante, moins l'hypothèse nulle de normalité des données est vraisemblable. Ici, la probabilité fournie, qui correspond à la probabilité de se tromper en rejetant l'hypothèse nulle, est proche de 0.01. Avec un seuil de signification alpha=0.05, on doit donc rejeter l'hypothèse nulle.
Les trois autres tests (Box-Pierce, Ljung-Box, McLeod-Li) sont calculés à différents pas de temps. Ils permettent de tester si les données pourraient provenir d'un bruit blanc ou non. Ces tests s'appuie aussi sur la distribution du Khi². Les résultats sont concordants, et indiquent que les données ne peuvent pas être supposées provenir d'un bruit blanc. Alors qu'un tri n'a aucune influence sur le test de Jarque-Bera, il en aurait un sur les autres tests qui sont adaptés aux séries temporelles.

Dans le tableau ci-dessous sont affichées les fonctions descriptives de la série chronologique, et les deux digrammes en bâtons correspondent à la function d'autocorrélation (FAC) et à la fonction d'autocorrélation partielle (FACP). Les intervalles de confiance à 95% sont aussi affichés. Au niveau de l'autocorrélogramme, on identifie une autocorrélation d'ordre 1, ainsi qu'une saisonnalité de 12 mois.


Dans le but d'augmenter la "normalité" des données, nous allons procéder à deux transformations successives:
- Nous voulons d'abord stabiliser la variance de la série,
- Puis, retirer les autocorrélations significatives par une différenciation de la série.
Cela peut être fait avec l'outil de transformation de séries temporelles. Pour activer la boîte de dialogue correspondante, choisissez la commande XLSTAT/XLSTAT-Time/Transformation de séries, ou cliquez sur le bouton correspondant de la barre d'outils "XLSTAT-Time".

Sélectionnez les données sur la feuille Excel. La "Variable à transformer" correspond ici à la série Passagers. Après avoir sélectionné les données, activez l'option Box-Cox. Nous pourrions demander une transformation avec optimisation du paramètre lambda, mais nous décidons de fixer lambda à 0, ce qui revient à faire une transformation logarithmique de la série. Cette transformation est souvent efficace lorsque l'on veut supprimer une variabilité croissante. Ensuite, pour supprimer la tendance croissante et la composante saisonnière, nous décidons de faire une différenciation de la série. La valeur de d est fixée à 1 pour retirer la tendance, et D et s sont fixés à 1 et 12 pour retirer la saisonnalité de douze mois.

Les calculs commencent lorsque l'on a appuyé sur OK. Les premiers résultats correspondent à la transformation de Box-Cox. On peut observer l'effet de la transformation sur le graphique ci-dessous. It looks like the log transformation has removed the increasing variability.

Ensuite, les résultats de la différenciation sont afficichés dans un tableau et sur un graphique. Nous constatons que la tendance a bien été retirée mais qu'il n'est pas encore évident que l'on ait affaire à un bruit blanc.

Dans le but de vérifier si les transformations ont permis de rendre les séries semblables à un bruit blanc avec une distribution normale, nous devons réaliser une analyse descriptive de la série transformée.

Le test de Jarque-Bera confirme que les series sont plus proches d'une distribution normale, la probabilité étant remonté de 0.01 à 0.04. Mais les tests de bruit blanc semblent indiquer que les transformations n'ont pas été suffisantes. L'autocorrélogramme indique que nous avons retiré trop d'information pour les pas 1 et 12, car les coefficient sont maintenant négatifs. Par ailleurs, les pas de temps 3 et 9 semblent maintenant significatifs. Pour cette raison, il semble que des transformations additionnelles sont nécessaires.

Cliquez ici pour accéder à d'autres tutoriels.