Analyse descriptive et transformations de séries temporelles

Jeu de données pour Analyse descripitve des séries chronologiques XLS135 Ko

Vidéo du tutoriel
"Analyse descripitve des séries chronologiques" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Time Logiciel d'analyse des séries temporelles

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour l'analyse descriptive et transformations de séries temporelles

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données proviennent de [Box, G.E.P. and Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco], et correspondent au trafic aérien international (en milliers de passagers) de Janvier 1949 à Décembre 1960.

Le but est ici d'analyser la série chronologique avant de l'utiliser en mode prédictif dans un autre tutoriel.

hw1f.gif

On note sur ce graphique que le nombre de passagers a tendance à augmenter régulièrement, que l'on retrouve chaque année un cycle similaire, mais que les variations à l'intérieur d'une même année sont de plus en plus fortes. Afin de confirmer ces éléments nous allons analyser la série, puis la transformer pour valider nos hypothèses.

Paramétrer une analyse descriptive de séries temporelles

Pour activer la boîte de dialogue de l'analyse descriptive des séries chronologiques, lancez XLSTAT, puis sélectionnez la commande XLSTAT / XLSTAT-Time / Analyse descriptive, ou cliquez sur le bouton équivalent de la barre d'outils XLSTAT-Time.

bardescf.gif

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'analyse descriptive apparaît. Sélectionner alors les données sur la feuille Excel. La Séries à analyser correspond ici à la série "Passagers".

L'option Libellés des séries est activée parce que la première ligne des données sélectionnées correspond au nom de la variable.

desc1af.gif

Dans l'onglet options, sélectionnez le mode automatique.

desc1bf.gif

Dans les onglets sorties et graphiques, activez l'option Autocorrélations partielles.

desc1cf.gifdesc1df.gif

Les calculs commencent lorsque l'on a appuyé sur OK. Les résultats sont ensuite affichés.

Interprétation de l'analyse descriptives de séries chronologiques

Dans les premiers tableau sont affichées des statistiques générales.

Ensuite, un tableau donne les résultats des tests de normalité et de bruit blanc.

Le test de Jarque-Bera test est un test de normalité fondé sur les propriétés de symétrie et d’aplatissement de la loi normale. Plus la valeur du Khi’² est importante, moins l'hypothèse nulle de normalité des données est vraisemblable. Ici, la probabilité fournie, qui correspond à la probabilité de se tromper en rejetant l'hypothèse nulle, est proche de 0.01. Avec un seuil de signification alpha=0.05, on doit donc rejeter l'hypothèse nulle.

Les trois autres tests (Box-Pierce, Ljung-Box, McLeod-Li) sont calculés à différents pas de temps. Ils permettent de tester si les données pourraient provenir d'un bruit blanc ou non.

Ces tests s'appuie aussi sur la distribution du Khi’². Les résultats sont concordants, et indiquent que les données ne peuvent pas être supposées provenir d'un bruit blanc. Alors qu'un tri n'a aucune influence sur le test de Jarque-Bera, il en aurait un sur les autres tests qui sont adaptés aux séries temporelles.

desc2f.gif

Dans le tableau ci-dessous sont affichées les fonctions descriptives de la série chronologique, et les deux digrammes en bâtons correspondent à la fonction d'autocorrélation (FAC) et à la fonction d'autocorrélation partielle (FACP).

Les intervalles de confiance à 95% sont aussi affichés. Au niveau de l'autocorrélogramme, on identifie une autocorrélation d'ordre 1, ainsi qu'une saisonnalité de 12 mois.

desc3f.gifdesc4f.gif

Transformation d'une série chronologique

Dans le but d'augmenter la "normalité" des données, nous allons procéder à deux transformations successives:

  • Nous voulons d'abord stabiliser la variance de la série,
  • Puis, retirer les autocorrélations significatives par une différenciation de la série.

Cela peut être fait avec l'outil de transformation de séries temporelles.

Paramétrer la trransformation d'une série temporelle

Pour activer la boîte de dialogue correspondante, choisissez la commande XLSTAT / XLSTAT-Time / Transformation de séries, ou cliquez sur le bouton correspondant de la barre d'outils "XLSTAT-Time".

bartransf.gif

Sélectionnez les données sur la feuille Excel. La Variable à transformer correspond ici à la série "Passagers". Après avoir sélectionné les données, activez l'option Box-Cox dans l'onglet options. Nous pourrions demander une transformation avec optimisation du paramètre lambda, mais nous décidons de fixer lambda à 0, ce qui revient à faire une transformation logarithmique de la série. Cette transformation est souvent efficace lorsque l'on veut supprimer une variabilité croissante. Ensuite, pour supprimer la tendance croissante et la composante saisonnière, nous décidons de faire une différenciation de la série. La valeur de d est fixée à 1 pour retirer la tendance, et D et s sont fixés à 1 et 12 pour retirer la saisonnalité de douze mois.

desc5af.gifdesc5bf.gif

Les calculs commencent lorsque l'on a appuyé sur OK.

Interprétation des résultats de la transformation de données temporelles

Les premiers résultats correspondent à la transformation de Box-Cox. On peut observer l'effet de la transformation sur le graphique ci-dessous.

desc6f.gif

Ensuite, les résultats de la différenciation sont affichés dans un tableau et sur un graphique. Nous constatons que la tendance a bien été retirée mais qu'il n'est pas encore évident que l'on ait affaire à un bruit blanc.

desc7f.gif

Analyse descriptive des données chronologiques transformées

Dans le but de vérifier si les transformations ont permis de rendre les séries semblables à un bruit blanc avec une distribution normale, nous devons réaliser une analyse descriptive de la série transformée.

desc8f.gif

Assurez-vous d'avoir bien sélectionner l'option supprimer les observations dans l'onglet données manquantes.

desc8af.gif

Le test de Jarque-Bera confirme que les séries sont plus proches d'une distribution normale, la probabilité étant remonté de 0.01 à 0.04. Mais les tests de bruit blanc semblent indiquer que les transformations n'ont pas été suffisantes. L'autocorrélogramme indique que nous avons retiré trop d'information pour les pas 1 et 12, car les coefficient sont maintenant négatifs. Par ailleurs, les pas de temps 3 et 9 semblent maintenant significatifs. Pour cette raison, il semble que des transformations additionnelles sont nécessaires.

desc9f.gif

desc10f.gif