Analyse Canonique des Correspondances (ACC) avec XLSTAT-ADA

Jeu de données pour Analyse Canonique des Correspondances (ACC) XLS68.5 Ko

Vidéo du tutoriel
  • ADA Logiciel d'Analyse de Données Avancée sur tableaux multiples

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Analyse Canonique des Correspondances

L’Analyse Canonique des Correspondances ou ACC (Canonical Correspondence Analysis ou CCA en anglais) a été développée dans le but de permettre aux écologues de relier les abondances d’espèces à des variables environnementales (Ter Braak, 1986). Cependant on peut envisager d’utiliser cette méthode dans d’autres domaines comme le géomarketing.

Pour pouvoir utiliser une Analyse Canonique des Correspondances il est nécessaire de disposer,

  1. d’un tableau de contingence X qui contient les effectifs ou les fréquences d’une série d’objets (en écologie, des espèces) mesurés en plusieurs sites,
  2. un tableau Y de variables descriptives mesurées en ces mêmes sites
  3. optionnellement un tableau Z qui contient des variables descriptives dont on veut retirer l’effet avant d’expliquer la variabilité de X en utilisant Y. Dans ce cas on parle d’Analyse Canonique des Correspondances partielle.

A partir de ces tableaux, le but de la méthode est de produire une représentation graphique où sont à la fois affichés, les objets, les sites, et les variables.

Jeu de données pour l'Analyse Canonique des Correspondances et but de ce tutoriel

Une feuille Excel contenant à la fois les données et les résultats peut-être téléchargée en cliquant ici.

Les données correspondent aux comptages en 12 différents sites de 10 espèces d’insectes dans une région tropicale. Un second tableau (affiché en rouge) comprend 3 variables quantitatives décrivant les 12 sites (altitude, humidité, et distance au lac).

Notre but est de déterminer si les trois variables descriptives peuvent aider à expliquer les comptages observes pour les différentes espèces d’insectes.

Paramétrer une Analyse Canonique des Correspondances

Pour activer la boîte de dialogue de l’Analyse Canonique des Correspondances, lancez XLSTAT, puis cliquez sur la commande XLSTAT-ADA / Analyse Canonique des Correspondances du menu XLSTAT, ou cliquez sur le bouton correspondant de la barre d’outils XLSTAT-ADA (voir ci-dessous).

barccaf.gif

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue apparaît.

Sélectionnez les données sites/espèces (ici les objets correspondent aux espèces), puis les données sites/variables (affichées en rouge dans la feuille Excel).

Les libellés des sites sont aussi sélectionnés, et l’option libellés des variables est laissée activée car la première ligne comprend les noms des variables ou des espèces.

cca1f.gif

Dans l’onglet Options, l’option Test de permutation est active afin de nous permettre de tester si l’effet des trois variables sur les effectifs observés est significatif ou non.

1000 permutations seront effectuées.

Sur les deux images suivantes, vous pouvez voir quelles options ont été activées dans les onglets Sorties et Graphiques.

cca2f.gifcca3f.gif

Les calculs commencent lorsque vous cliquez sur le bouton OK, puis les résultats sont affichés dans une nouvelle feuille du classeur.

Interpréter les résultats d'une Analyse Canonique des Correspondances

Les premiers résultats affichés correspondent aux statistiques descriptives des différentes variables. Les profils des lignes et des colonnes du tableau de contingence sont ensuite affichés. Les "moyennes pondérées" correspondent aux moyennes des variables du second tableau, pondérées par les sommes marginales des lignes du tableau de contingence.

Sont ensuite affichés les résultats du test de permutation.

cca5f.gifcca6f.gif

Le test permet de conclure que les données sites/espèces ne sont pas liées linéairement aux données sites/variables avec niveau de signification de 5%. On remarque que la p-value est très proche du niveau de signification choisi (0.089 au lieu de 0.05). La conclusion n’est donc pas aussi tranchée. De plus, il serait intéressant de déterminer si cela est le cas pour toutes les variables, ou si certaines sont plus performantes que d’autres.

Le tableau suivant montre comment l’inertie est répartie entre l’Analyse Canonique des Correspondances contrainte (la partie de l’analyse impliquant les variables explicatives) et l’Analyse Canonique des Correspondances non-contrainte (l’Analyse Canonique des Correspondances non-contrainte est l’analyse factorielle des correspondances des résidus de l’Analyse Canonique des Correspondances contrainte).

cca7f.gif

Le tableau suivant permet de voir comment est répartie l’inertie entre l’Analyse Canonique des Correspondances contrainte et l’Analyse Canonique des Correspondances non contrainte. Nous voyons qu’ici l’Analyse Canonique des Correspondances contrainte correspond à 40% de l’inertie totale. Cela confirme que les variables explicatives n’expliquent qu’une faible partie de la variabilité à l’intérieur du tableau de contingence. Une analyse de la partie non contrainte aurait donc du sens, mais elle n’est pas exposée ici. Par ailleurs, les résultats de la partie contrainte (dont le titre est « Résultats de l’Analyse Canonique des Correspondances » pour simplifier) doivent être interprétés avec prudence.

L’analyse des valeurs propres de l’Analyse Canonique des Correspondances permet de voir que la majeure partie de l’inertie est représentée par le premier axe. Avec le second axe, on obtient 92.5% de l’inertie. Cela signifie que la représentation de l’Analyse Canonique des Correspondances en deux dimensions est suffisante pour analyser les relations entre les sites, les espèces et les variables.

cca8f.gif

La représentation graphique de l’Analyse Canonique des Correspondances (voir ci-dessous) permet de visualiser simultanément les objets (dans notre cas les insectes), les sites, et les variables.

cca9f.gif

On peut voir sur ce graphique que pour les espèces Insect4 et Insect5 les effectifs élevés sont associés à un taux d’humidité élevé et une faible altitude. L’espèce Insect7 semble plus sensible à la distance au lac. L’espèce Insect9 semble préférer une altitude élevée, et plus encore une humidité plus faible.

Remarque : si vous souhaitez changer le libellé “Objets” en “Espèces” sur le graphique de l’Analyse Canonique des Correspondances, il vous suffit de cliquer sur l’un des points de la série correspondante, puis de changer « Objets » en « Espèces » dans la barre de formule d’Excel.

cca10f.gif