Running a Correspondence Analysis (CA) from a raw data table with XLSTAT and plot a 3D representation with XLSTAT-3D Plot

Datensatz für Korrespondenzanalyse, 3D visualization XLS374 KB

Videos für dieses Tutorial
Korrespondenzanalyse, 3D visualization ist enthalten in: Download Demoversion Mehr Details Kommentare ansehen
  • Pro Statistische Kernsoftware

  • Voraussetzungen

    • Windows:
      • Versionen: 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel: 97 oder höher
      • Prozessor: 32 oder 64 bit
      • Festplattenspeicher: 150 MB
    • Mac OS X:
      • OS: OS X
      • Excel: X, 2004 und 2011
      • Festplattenspeicher: 150 MB

Vorteile von XLSTAT

  • Praktisch und einfache Benutzung
    Praktisch und einfache Benutzung XLSTAT ist perfekt in Microsoft Excel integriert, das das am meisten benutzte Tabellenkalkulationsprogramm ist. Dank dieser Integration und der gleichen Philosophie wie Excel, ist die Benutzung von XLSTAT leicht. Die Software ist in einem speziellen Reiter verfügbar, der das Menu der XLSTAT-Module enthält. Die verfügbaren Analysen sind in Gruppen ähnlicher Funktion zusammengefasst. Die Dialogfenster sind einfach und Ihre Einstellungen verständlich.
  • Einfaches Mitteilen der Daten und Ergebnisse
    Einfaches Mitteilen der Daten und Ergebnisse Einer der größten Vorteile von XLSTAT ist die Tatsache, das die Daten und Ergebnisse ohne Einschränkung kommuniziert werden können. Denn die Daten und Ergebnisse werden in Microsoft Excel gespeichert und sind daher allen zugänglich. Eine XLSTAT Lizenz oder ein Programm zur Ansicht ist nicht erforderlich, um die Daten und Ergebnisse zu empfangen und anzusehen. Darüber hinaus sind die Ergebnisse leicht in andere Programme von Microsoft Office, wie PowerPoint kopierbar, was Ihnen das Erstellen von Präsentationen mit ausgezeichneten Diagrammen in wenigen Minuten erlaubt.
  • Modular
    Modular XLSTAT ist ein modulares Produkt um XLSTAT-Pro herum, das die Basissoftware von XLSTAT darstellt. XLSTAT-Pro schließt bereits alle verbreiteten statistischen Funktionen und multivariaten Datenanalysen ein. Die fortgeschrittenen Funktionen sind ebenfalls in zusätzlichen Modulen verfügbar, die speziellen Anforderungen gerecht werden. So können Sie Ihre Software an Ihre eigenen Anforderungen anpassen, was sie attraktiver werden lässt.
  • Didaktisch
    Didaktisch Die XLSTAT Ergebnisse sind nach Analysen aufgebaut und einfach durchzublättern. Darüber hinaus sind den Ergebnissen nützliche Informationen hinzugefügt, um die Interpretation zu erleichtern.
  • Preiswert
    Preiswert XLSTAT ist eine modulare, komplette Statistik- und Datenanalysesoftware, die sich an alle Ihre analytischen Anforderungen Ihrer Organisation anpasst. Der Preis ist sehr gering, was Ihnen eine quasi sofortige Amortisierung erlaubt. Alle XLSTAT Lizenzen schließen ein Support und eine Unterstützung hervorragender Qualität ein.
  • Zugänglich
    Zugänglich Wir setzen uns ein, XLSTAT so vielen Personen wie möglich durch eine Benutzerschnittstelle in vielen Sprachen darunter Deutsch, englisch, französisch, spanisch, italienisch, portugiesisch, polnisch, chinesisch und japanisch zugänglich zu machen.
  • Automatisierbar und personalisierbar
    Automatisierbar und personalisierbar Die Mehrzahl der in XLSTAT verfügbaren Funktionen können direkt aus Visual Basic for Applications von Microsoft Excel heraus aufgerufen werden. Sie können in Ihre Routinen integriert werden, um Ihren Anforderungen einer speziellen Anwendung gerecht zu werden. Das Hinzufügen von Ergebnistabellen, Diagrammen, oder das Verändern bereits existierender ist vereinfacht. Darüber hinaus schließt XLSTAT die Werkzeuge zur Erzeugen des VBA Kodes für die Dialogfenster ein, so dass Sie Ihre Analysen vom VBA Editor heraus einfach reproduzieren können, indem Sie die Einstellungen automatisch laden. Diese Automatisierung der Analysen wird Ihnen viel Zeit einsparen.

Dataset for running a Correspondence Analysis from a raw data table

An Excel sheet with both the data and the results can be downloaded by clicking here. The data correspond to the list of foreigner soccer players in premier league and their nationality. We want to study the distribution of the foreign players in the English clubs.

Setting up a Correspondence Analysis from a raw data table

Once XLSTAT is open, select the Analyzing data / Correspondence analysis command, or click on the corresponding button of the Analyzing Data toolbar (see below).

barca1.gifbarca2.gif

Once you have clicked on the button, the Correspondence analysis dialog box appears.

In the field Observations/variables table, select the columns Club and Region on the Excel sheet.

The data are in an Observations/variables format, tick the corresponding option.

As the names of the columns are included, the Variable labels option should be selected as well.

Choose the Sheet option for the output.

ca2_1.png

On the tab Options tick the Test of independence and leave the significance level to 5.

ca2_2.png

In the Outputs section, select the following options:

  • Contingency table
  • Eigenvalues
  • Principal coordinates
  • Standard coordinates
  • Contributions
  • Squared cosines

ca2_3.png

Go to the last tab Charts and enable the:

  • Symmetric plots
  • Asymmetric plots
  • Labels

ca2_4.png

Click on OK.

As the model needs more than two factors. Click first on Select to select the plot F1-F2. Then change the Abscissa to F2. It will change the Ordinates to F3. Click again on Select. This way we will have two plots: F1-F2 and F2-F3. Click on Done.

ca2_5.png

Interpreting the results of a a Correspondence Analysis

The first result is the contingency table and then the test of independence between the rows and columns.

The p-value of 0.008 is inferior to 5% thus the null hypothesis should be rejected. This means that the distribution of nationality is not random in the UK clubs.

ca2_6.png

Then you have the symmetric plots. From the first plot you can see that the clubs such as Aston Villa and Stoke City have more North-American players than the rest of the teams. In the same way, Burney have a lot of Northern European players.

ca2_7.png

Creating a 3-D plot for the a Correspondence Analysis results

We will now do a plot in 3-dimensions to have a better representation of the points.

First we will make a table containing both the first 3 principal coordinates for the clubs and geographic areas and the sum of the cosines for those 3 factors.

The sum of the cosines for the 3 factors give an idea of how well is represented the sample in the 3-D space.

Add a last column to have the information about the rows and columns. The rows are the clubs and the columns the regions. Make a category variable with R and C to describe each sample.

ca2_7b.png

Select the full table and go to the menu Visualizing data and select the option XLSTAT-3DPlot.

When prompt select the format of your data as Table.

ca2_8.png

You will need to specify the axes. Do so by a right click and select in the dropbox the appropriate variable to use. For the 3 axes we utilize: F1, F2 horizontally and F3 vertically. You also need to set the size of the axis so as to have an orthonormal plot. For example use for all the axes : -1.5 and 1.5 as limits.

ca2_9.png

For the color and size of the dot you can use the sum of cosines. Go to the tab Objects and modify the color and size sections.

ca2_10.png

Finally we can add the labels by going into the tab Annotations and selcting "Column1" as the label.

ca2_11.png

Here is your 3-D representation.

ca2_12.png