Running a canonical correlation analysis in XLSTAT

Datensatz für Kanonische Korrelationsanalyse XLS101 KB

Videos für dieses Tutorial
  • ADA Software zur fortgeschrittenen Analyse für mehrere Tabellen

  • Voraussetzungen

    • Windows:
      • Versionen: 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel: 97 oder höher
      • Prozessor: 32 oder 64 bit
      • Festplattenspeicher: 150 MB
    • Mac OS X:
      • OS: OS X
      • Excel: X, 2004 und 2011
      • Festplattenspeicher: 150 MB

Vorteile von XLSTAT

  • Praktisch und einfache Benutzung
    Praktisch und einfache Benutzung XLSTAT ist perfekt in Microsoft Excel integriert, das das am meisten benutzte Tabellenkalkulationsprogramm ist. Dank dieser Integration und der gleichen Philosophie wie Excel, ist die Benutzung von XLSTAT leicht. Die Software ist in einem speziellen Reiter verfügbar, der das Menu der XLSTAT-Module enthält. Die verfügbaren Analysen sind in Gruppen ähnlicher Funktion zusammengefasst. Die Dialogfenster sind einfach und Ihre Einstellungen verständlich.
  • Einfaches Mitteilen der Daten und Ergebnisse
    Einfaches Mitteilen der Daten und Ergebnisse Einer der größten Vorteile von XLSTAT ist die Tatsache, das die Daten und Ergebnisse ohne Einschränkung kommuniziert werden können. Denn die Daten und Ergebnisse werden in Microsoft Excel gespeichert und sind daher allen zugänglich. Eine XLSTAT Lizenz oder ein Programm zur Ansicht ist nicht erforderlich, um die Daten und Ergebnisse zu empfangen und anzusehen. Darüber hinaus sind die Ergebnisse leicht in andere Programme von Microsoft Office, wie PowerPoint kopierbar, was Ihnen das Erstellen von Präsentationen mit ausgezeichneten Diagrammen in wenigen Minuten erlaubt.
  • Modular
    Modular XLSTAT ist ein modulares Produkt um XLSTAT-Pro herum, das die Basissoftware von XLSTAT darstellt. XLSTAT-Pro schließt bereits alle verbreiteten statistischen Funktionen und multivariaten Datenanalysen ein. Die fortgeschrittenen Funktionen sind ebenfalls in zusätzlichen Modulen verfügbar, die speziellen Anforderungen gerecht werden. So können Sie Ihre Software an Ihre eigenen Anforderungen anpassen, was sie attraktiver werden lässt.
  • Didaktisch
    Didaktisch Die XLSTAT Ergebnisse sind nach Analysen aufgebaut und einfach durchzublättern. Darüber hinaus sind den Ergebnissen nützliche Informationen hinzugefügt, um die Interpretation zu erleichtern.
  • Preiswert
    Preiswert XLSTAT ist eine modulare, komplette Statistik- und Datenanalysesoftware, die sich an alle Ihre analytischen Anforderungen Ihrer Organisation anpasst. Der Preis ist sehr gering, was Ihnen eine quasi sofortige Amortisierung erlaubt. Alle XLSTAT Lizenzen schließen ein Support und eine Unterstützung hervorragender Qualität ein.
  • Zugänglich
    Zugänglich Wir setzen uns ein, XLSTAT so vielen Personen wie möglich durch eine Benutzerschnittstelle in vielen Sprachen darunter Deutsch, englisch, französisch, spanisch, italienisch, portugiesisch, polnisch, chinesisch und japanisch zugänglich zu machen.
  • Automatisierbar und personalisierbar
    Automatisierbar und personalisierbar Die Mehrzahl der in XLSTAT verfügbaren Funktionen können direkt aus Visual Basic for Applications von Microsoft Excel heraus aufgerufen werden. Sie können in Ihre Routinen integriert werden, um Ihren Anforderungen einer speziellen Anwendung gerecht zu werden. Das Hinzufügen von Ergebnistabellen, Diagrammen, oder das Verändern bereits existierender ist vereinfacht. Darüber hinaus schließt XLSTAT die Werkzeuge zur Erzeugen des VBA Kodes für die Dialogfenster ein, so dass Sie Ihre Analysen vom VBA Editor heraus einfach reproduzieren können, indem Sie die Einstellungen automatisch laden. Diese Automatisierung der Analysen wird Ihnen viel Zeit einsparen.

Data for canonical correlation analysis

An Excel sheet with both the data and the results can be downloaded by clicking here.

The data used in this tutorial are measurements done on middle-aged men in a health fitness club (Dr. A. C. Linnerud, NC State University).

There are two sets of data about the men:

    1. The physiological data:
    • Weight
    • Waist
    • Pulse
  1. The exercises the men did:
    • Chins
    • Situps
    • Jumps

Set up of the canonical correlation analysis

Go to the menu ADA, and select the function Canonical Correlation Analysis.

canonical correlation analysis package

In the General tab, determine the two datasets. Y1 corresponds to the physiological data stored in the columns B to D. Y2 corresponds to the exercise data which are in the columns E to G.

The columns have a label so leave the option Column labels ticked. You can add the Observation labels by ticking the corresponding option and selecting the column A.

canonical correlation analysis software

In the Options tab, verify that both datasets will be centered and reduced.

canonical correlation software package

For the Outputs select them all.

canonical correlation package

Choose as well to display the unique plot available in the Charts tab.

canonical correlation in excel

Press OK once these selections are done.

When prompted, opt for the display of the plot with Factor 1 and Factor 2.

Notice that the explained variance is 99.22%.

canonical correlation software

Results of the canonical correlation analysis

The first result after the descriptive statistics is the correlation matrix.

Note the strong correlation between the weight and the waist (0.870) in the first table, and sit-up’s and jumps (0.669) and sit-up’s and chins (0.696) in the second table. The correlations between both tables are rather small except Waist and sit-up’s (-0.646) and chins (-0.552).

canonical correlation

The Eigenvalues show that the first factor alone explains 93% of the variability.

canonical correlation eigenvalues

The Wilks’ lambda test allows to test whether the canonical variables are linked to the initial tables or not. We see here that while F1 is somehow linked although not significantly, F2 and F3 and poorly related to the initial tables.

canonical correlation wilks lambda

The canonical correlations on factor 1 show that the two tables Y1 and Y2 are correlated. Note that this value is greater than the correlations between the two tables.

The redundancy coefficients show that a small proportion of the variability of the input variables is predicted by the canonical variables.

canonical correlation redundancy

The correlations between input variables and canonical variables (also called Structure correlation coefficients, or Canonical factor loadings) allow understanding how the canonical variables are related to the input variables.

We can see that the variables waist and weight are correlated and correlated negatively with factor 1 and 2. They are also anti-correlated with the exercises sit-ups and chins. This means that people with a higher weight and a larger waist don’t do as many sit-up’s and chins as the other persons.

canonical correlation plot