Wie mache ich eine Diskriminanzanalyse mit XLSTAT?

Datensatz für Diskriminanzanalyse XLS168 KB

Videos für dieses Tutorial
Diskriminanzanalyse ist enthalten in: Download Demoversion Mehr Details Kommentare ansehen
  • Pro Statistische Kernsoftware

  • Voraussetzungen

    • Windows:
      • Versionen: 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel: 97 oder höher
      • Prozessor: 32 oder 64 bit
      • Festplattenspeicher: 150 MB
    • Mac OS X:
      • OS: OS X
      • Excel: X, 2004 und 2011
      • Festplattenspeicher: 150 MB

Vorteile von XLSTAT

  • Praktisch und einfache Benutzung
    Praktisch und einfache Benutzung XLSTAT ist perfekt in Microsoft Excel integriert, das das am meisten benutzte Tabellenkalkulationsprogramm ist. Dank dieser Integration und der gleichen Philosophie wie Excel, ist die Benutzung von XLSTAT leicht. Die Software ist in einem speziellen Reiter verfügbar, der das Menu der XLSTAT-Module enthält. Die verfügbaren Analysen sind in Gruppen ähnlicher Funktion zusammengefasst. Die Dialogfenster sind einfach und Ihre Einstellungen verständlich.
  • Einfaches Mitteilen der Daten und Ergebnisse
    Einfaches Mitteilen der Daten und Ergebnisse Einer der größten Vorteile von XLSTAT ist die Tatsache, das die Daten und Ergebnisse ohne Einschränkung kommuniziert werden können. Denn die Daten und Ergebnisse werden in Microsoft Excel gespeichert und sind daher allen zugänglich. Eine XLSTAT Lizenz oder ein Programm zur Ansicht ist nicht erforderlich, um die Daten und Ergebnisse zu empfangen und anzusehen. Darüber hinaus sind die Ergebnisse leicht in andere Programme von Microsoft Office, wie PowerPoint kopierbar, was Ihnen das Erstellen von Präsentationen mit ausgezeichneten Diagrammen in wenigen Minuten erlaubt.
  • Modular
    Modular XLSTAT ist ein modulares Produkt um XLSTAT-Pro herum, das die Basissoftware von XLSTAT darstellt. XLSTAT-Pro schließt bereits alle verbreiteten statistischen Funktionen und multivariaten Datenanalysen ein. Die fortgeschrittenen Funktionen sind ebenfalls in zusätzlichen Modulen verfügbar, die speziellen Anforderungen gerecht werden. So können Sie Ihre Software an Ihre eigenen Anforderungen anpassen, was sie attraktiver werden lässt.
  • Didaktisch
    Didaktisch Die XLSTAT Ergebnisse sind nach Analysen aufgebaut und einfach durchzublättern. Darüber hinaus sind den Ergebnissen nützliche Informationen hinzugefügt, um die Interpretation zu erleichtern.
  • Preiswert
    Preiswert XLSTAT ist eine modulare, komplette Statistik- und Datenanalysesoftware, die sich an alle Ihre analytischen Anforderungen Ihrer Organisation anpasst. Der Preis ist sehr gering, was Ihnen eine quasi sofortige Amortisierung erlaubt. Alle XLSTAT Lizenzen schließen ein Support und eine Unterstützung hervorragender Qualität ein.
  • Zugänglich
    Zugänglich Wir setzen uns ein, XLSTAT so vielen Personen wie möglich durch eine Benutzerschnittstelle in vielen Sprachen darunter Deutsch, englisch, französisch, spanisch, italienisch, portugiesisch, polnisch, chinesisch und japanisch zugänglich zu machen.
  • Automatisierbar und personalisierbar
    Automatisierbar und personalisierbar Die Mehrzahl der in XLSTAT verfügbaren Funktionen können direkt aus Visual Basic for Applications von Microsoft Excel heraus aufgerufen werden. Sie können in Ihre Routinen integriert werden, um Ihren Anforderungen einer speziellen Anwendung gerecht zu werden. Das Hinzufügen von Ergebnistabellen, Diagrammen, oder das Verändern bereits existierender ist vereinfacht. Darüber hinaus schließt XLSTAT die Werkzeuge zur Erzeugen des VBA Kodes für die Dialogfenster ein, so dass Sie Ihre Analysen vom VBA Editor heraus einfach reproduzieren können, indem Sie die Einstellungen automatisch laden. Diese Automatisierung der Analysen wird Ihnen viel Zeit einsparen.

Eine Excel-Mappe mit den Daten und den Ergebnissen, die in diesem Tutoriel behandelt werden, kann hier heruntergeladen werden. Die Daten stammen von [Fisher M. (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, pp 179 -188] und entsprechen 150 Schwerlilienblüten, beschrieben durch vier Variablen (Kelchblattlänge, Kelchblattbreite, Blütenblattlänge und Blütenblattbreite) und Ihrer Spezies. Drei verschiedene Spezies wurden in die Studie einbezogen: Setosa, Versicolor und Virginica. Das Ziel ist es, zu überprüfen, ob die vier Variablen das Diskrimieren der Spezies erlauben und die Beobachtungen in einer 2-dimensionalen Karte darzustellen, die so gut wie möglich die Unterscheidung der Gruppen anzeigt.

iris_setosa.jpgiris_versicolor.jpgiris_virginica.jpg

Iris Setosa, Versicolor und Virginica.

Nach dem Öffnen von XLSTAT, wählen Sie den Befehl XLSTAT/Analyse der Daten /Diskriminanzanalyse oder klicken Sie auf den entsprechenden Button der "Analyse der Daten" Toolbalkens (siehe unten).

bardad.gif

Nach dem Klicken des Buttons erscheint das Dialogfenster der Diskriminanzanalyse. Die „abhängige Variable“ entspricht in diesem Fall der Spezies-Variablen. Die “erklärenden Variablen” sind die vier beschreibenden Variablen. Die “Beobachtungsbeschriftungen” werden mit dem entsprechenden Feld ausgewählt. Im Reiter Optionen sind fortgeschrittene Optionen verfügbar. Im Beispiel wurde die Option „Gleichheit der Kovarianzmatrizen” deaktiviert, da anhand des Box-Test überprüft werden soll, ob diese Annahme gerechtfertigt wäre. da1d.gifda1bisd.gif

Die Berechnungen beginnen sobald Sie auf "OK" klicken. Nach der Auswahl der beiden anzuzeigenden Achsen, die einfach durch Klicken auf „Beenden“ ausgewählt werden, werden die Ergebnisse angezeigt. Zunächst werden die verschiedenen Matrizen, die während den Berechnungen benutzt werden, angezeigt. Die beiden Box-Test bestätigen die Annahme, dass die Hypothese gleicher Kovarianzmatrizen in den verschiedenen Gruppen zurückgewiesen werden muss. da2d.gif

Der Wilk's Lambda-Test erlaubt es, zu überprüfen of der Vector der Mittelwerte für die verschiedenen Gruppen gleich ist oder nicht (Dies kann als multidimensionelle Variante des Fisher's LSD oder des Tukey's HSD Tests angesehen werden.). Man erkennt, dass die Unterschiede zwischen den verschiedenen Mittelwertvektoren der Gruppen signifikant ist.

da3d.gif

Die folgende Tabelle zeigt die Diskriminanzfunktionen an. Wenn man die Gleichheit der Kovarianzmatrix unterstellt, so sind die zugehörigen Diskriminanzfunktionen linear. Wenn keine Gleichheit der Kovarianzmatrizen unterstellt wird, welches der Fall in diesem Tutoriel ist, so sind die Diskriminanzfunktionen quadratisch. Die Regel basierend auf diesen Funktionen ist die Zuordnung einer Beobachtung zu der Gruppe, deren entsprechende Diskriminanzfunktion den grössten Wert aufweist. Diese Funktionen können ebenfalls in einem Vorhersagemodus auf neue Beobachtungen angewandt werden. da4d.gif

Die nächste Tabelle zeigt die Eigenwerte und die zugehörigen Varianzprozentsätze an. Man kann sehen, dass 99% der Varianz durch den ersten Faktor erklärt wird. Es gibt nur zwei Faktoren: Die maximale Anzahl an Faktoren ist gleich k-1, mit n>p>k, wobei n die Anzahl der Beobachtungen, p die Anzahl der erklärenden Variablen und k die Anzahl der Gruppen ist.

da5d.gif

Die folgende Grafik stellt die Korrelation der Ausgangsvariablen zu den beiden Faktoren dar ( Diese Grafik entspricht der Faktorladungstabelle.). Man kann erkennen, dass der Faktor F1 mit der Kelchblattlänge, der Blütenblattlänge und der Blütenblattbreite korreliert. Der Faktor F2 ist mit der Kelchblattbreite korreliert.

da6d.gif

Die nächste Tabelle listet für jede Beobachtung die Faktorscores (die Koordinaten der Beobachtungen im neuen Faktorraum), die Wahrscheinlichkeit der Zugehörigkeit zu jeder der Gruppen und der quadratische Mahalanobisabstand vom Gruppenzentroid. Jede Beobachtung wird der Gruppe zugeordnet, deren Zugehörigkeitswahrscheinlichkeit am grössten ist. Die Wahrscheinlichkeiten sind ex post Werte, die die a priori Zugehörigkeitswahrscheinlichkeiten nach der Bayes Formel berücksichtigen. Man kann sehen, dass drei Beobachtungen (5,9 und 12) erneut klassifiziert wurden. Es verschiedene Interpretationsmöglichkeiten der Ergebnisse: Zum einen könnte die Person, die die Messungen vornahm Fehler bei der Aufzeichnung der Werte begangen haben oder die entsprechenden Schwertlilienblüten hatten einen ungewöhnlichen Wuchs oder die Kriterien des Spezialisten zur Bestimmung der Spezies sind nicht präzise genug oder noch notwendige Informationen zur Diskriminierung der Blumen sind in diesem Fall nicht verfügbar.

da7d.gif

Die folgenden Grafiken stellen die Beobachtungen auf den Faktorachsen dar. Dies erlaubt es zu überprüfen, ob alle Spezies gut diskriminiert auf den Faktorachsen extrahiert aus den Ausgangsvariablen wurden.

da8d.gif

Zuletzt fasst die Konfusionsmastrix die Klassifizierung der Beobachtungen zusammen und gibt die Einordnungsfehlerrate, die dem Quotienten aus der Anzahl der Beobachtungen, die falsch klassifiziert wurden, und der Gesamtzahl der Beobachtungen an.

da9d.gif