Running a Correspondence Analysis (CA) from a raw data table with XLSTAT and plot a 3D representation with XLSTAT-3D Plot

Jeu de données pour Analyse Factorielle des Correspondances (AFC), Visualisation en 3-D XLS374 Ko

Vidéo du tutoriel
"Analyse Factorielle des Correspondances (AFC), Visualisation en 3-D" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Dataset for running a Correspondence Analysis from a raw data table

An Excel sheet with both the data and the results can be downloaded by clicking here. The data correspond to the list of foreigner soccer players in premier league and their nationality. We want to study the distribution of the foreign players in the English clubs.

Setting up a Correspondence Analysis from a raw data table

Once XLSTAT is open, select the Analyzing data / Correspondence analysis command, or click on the corresponding button of the Analyzing Data toolbar (see below).

barca1.gifbarca2.gif

Once you have clicked on the button, the Correspondence analysis dialog box appears.

In the field Observations/variables table, select the columns Club and Region on the Excel sheet.

The data are in an Observations/variables format, tick the corresponding option.

As the names of the columns are included, the Variable labels option should be selected as well.

Choose the Sheet option for the output.

ca2_1.png

On the tab Options tick the Test of independence and leave the significance level to 5.

ca2_2.png

In the Outputs section, select the following options:

  • Contingency table
  • Eigenvalues
  • Principal coordinates
  • Standard coordinates
  • Contributions
  • Squared cosines

ca2_3.png

Go to the last tab Charts and enable the:

  • Symmetric plots
  • Asymmetric plots
  • Labels

ca2_4.png

Click on OK.

As the model needs more than two factors. Click first on Select to select the plot F1-F2. Then change the Abscissa to F2. It will change the Ordinates to F3. Click again on Select. This way we will have two plots: F1-F2 and F2-F3. Click on Done.

ca2_5.png

Interpreting the results of a a Correspondence Analysis

The first result is the contingency table and then the test of independence between the rows and columns.

The p-value of 0.008 is inferior to 5% thus the null hypothesis should be rejected. This means that the distribution of nationality is not random in the UK clubs.

ca2_6.png

Then you have the symmetric plots. From the first plot you can see that the clubs such as Aston Villa and Stoke City have more North-American players than the rest of the teams. In the same way, Burney have a lot of Northern European players.

ca2_7.png

Creating a 3-D plot for the a Correspondence Analysis results

We will now do a plot in 3-dimensions to have a better representation of the points.

First we will make a table containing both the first 3 principal coordinates for the clubs and geographic areas and the sum of the cosines for those 3 factors.

The sum of the cosines for the 3 factors give an idea of how well is represented the sample in the 3-D space.

Add a last column to have the information about the rows and columns. The rows are the clubs and the columns the regions. Make a category variable with R and C to describe each sample.

ca2_7b.png

Select the full table and go to the menu Visualizing data and select the option XLSTAT-3DPlot.

When prompt select the format of your data as Table.

ca2_8.png

You will need to specify the axes. Do so by a right click and select in the dropbox the appropriate variable to use. For the 3 axes we utilize: F1, F2 horizontally and F3 vertically. You also need to set the size of the axis so as to have an orthonormal plot. For example use for all the axes : -1.5 and 1.5 as limits.

ca2_9.png

For the color and size of the dot you can use the sum of cosines. Go to the tab Objects and modify the color and size sections.

ca2_10.png

Finally we can add the labels by going into the tab Annotations and selcting "Column1" as the label.

ca2_11.png

Here is your 3-D representation.

ca2_12.png