Analyse en Coordonnées Principales

"Analyse en Coordonnées Principales" inclus dans :
  • ADA Logiciel d'Analyse de Données Avancée sur tableaux multiples

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Principe de l'Analyse en Coordonnées Principales

L'analyse en coordonnees principales (en anglais, Principal Coordinate Analysis ou PCoA) a pour but de representer graphiquement une matrice de ressemblance entre p elements (individus, variables, objets, etc.).

Si la matrice en entree est une matrice de similarite, XLSTAT la transformera en une matrice de dissimilarite avant de faire les calculs proposes par Gower (1966) avec d'eventuelles modifications proposes par divers auteurs dont on trouve la synthese dans le livre Numerical Ecology de Legendre et Legendre (1998).

Principe de l'Analyse en Coordonnées Principales

Soit D la matrice p x p symetrique contenant les distances entre p elements : on calcule alors une matrice A dont les elements a(ij) correspondant a la ieme ligne et a la jeme colonne sont definis par :

a(ij) = d²(ij) / 2

On centre alors la matrice A par ligne et par colonne pour obtenir la matrice ∆1 dont les elements ∂1(ij) sont donnes par :

∂1(ij) =­ a(ij) - ā(i) - ā( j) - ā

ou ā(i) est la moyenne des a(ij) pour la ligne i, ā( j) est la moyenne des a(ij) pour la colonne j et ā est la moyenne de tous les elements.

On calcule alors la decomposition en valeurs propres de la matrice ∆1. 

Les vecteurs propres sont tries par ordre decroissant de valeurs propres, et transformes de telle sorte que, si u(k) est le vecteur propre associe a la valeur propre λ(k), on ait :

u'(k)u(k) =­ λ(k)

Les vecteurs propres ainsi transformes sont les coordonnees principales, qui peuvent alors etre directement utilises pour representer les p objets dans un espace a 1, 2, ... p-1 dimensions.

Comme avec l'ACP (Analyse en Composantes Principales) les valeurs propres peuvent etre interpretees en terme de pourcentage de variabilite represente.

Remarque : parce que la matrice ∆1 est centree, on obtient au plus p-1 valeurs propres non nulles. Dans le cas ou la matrice de depart D est une matrice euclidienne, on comprend aisement que p-1 axes suffiront toujours a decrire p objets (par deux points passe une ligne, trois points sont toujours contenus dans un plan, etc.). Dans le cas ou des points sont confondus dans un sous-espace, on peut obtenir plusieurs valeurs propres nulles (par exemple, trois points peuvent etre alignes sur une meme ligne).

Cas de valeurs propres negatives

Lorsque la matrice D n'est pas une matrice de distances metriques (cas de distances semimetriques ou non metriques par exemple), ou si des valeurs manquantes etaient presentes dans les donnees ayant ete utilisees pour calculer les distances, la decomposition en valeurs propres peut engendrer les valeurs propres negatives. Ce probleme est decrit en detail dans l'article de Gower et Legendre (1986).

XLSTAT propose deux transformations pour remedier au probleme des valeurs propres. La premiere consiste simplement a prendre la racine carree des elements de la matrice D. La seconde, inspiree de Lingoes (1971), consiste a ajouter une constante a la matrice D (sauf la diagonale qui reste nulle), telle qu'il n'y ait plus de valeurs propres negatives. Cette constante est egale a la valeur propre negative la plus elevee en valeur absolue.

Lorsqu'il y des valeurs propres negatives, la representativite des axes est calculee en appliquant la modification proposee par Caillez et Pages (1976).

Analyse en Composantes Principales, Multidimensional scaling et Analyse en Coordonnées Principales

L'ACP et la PCoA sont assez proches en ce sens que l'ACP permet aussi de representer des individus dans un espace de faible dimension avec des axes optimaux en terme de variabilite representee. La PCoA appliquee a la matrice des distances euclidiennes entre les individus

(calculee apres normalisation des colonnes avec l'ecart-type non biaise) aboutit au meme resultat que l'ACP normee appliquee aux donnees brutes. Les valeurs propres issues de la PCoA sont egales a (p-1) fois celles obtenues a partir de l'ACP.

La PCoA est une methode dont le but est identique a celui du MDS (Multidimensional Scaling), a savoir representer des objets pour lesquels on dispose d'une matrice de proximite.

Le MDS presente deux desavantages par rapport a la PCoA :

Le MDS presente deux avantages par rapport a la PCoA :

Tutoriels

Aperçus