Wie stelle ich fest ob zwei Stichproben, die durch 2 oder mehr Variablen beschrieben werden, signifikant verschieden sind?
Eine Excel-Mappe mit den Daten und den Ergebnissen, die in diesem Tutorial behandelt werden, kann hier heruntergeladen werden. Dieses Tutorial benutzt erzeugte Daten, die mittels des Tools zur Stichprobenziehung nach einer Verteilung von XLSTAT erstellt wurden. Die ersten drei Spalten wurden aus einer Normalverteilung N(0,1) gezogen. Die folgenden Spalten wurden aus einer normalen Verteilung N(2, 5) für G1, einer normalen Verteilung N(2.2, 5.2) für G2 und einer normalen Verteilung N(8, 7) für G3.
Um die Benutzung dieses Tool besser zu verstehen und die Relevanz der Tests zu betrachten, wird zunächst ein multidimensionaler Test auf den ersten 3 Spalten und dann auf den folgenden 3 Spalten und schließlich auf den gesamten 6 Spalten zusammen durchgeführt.
1. Test auf den ersten drei Spalten
Sobald XLSTAT-Pro aktiviert ist, wählen Sie den Befehl XLSTAT/ Parametrische Tests / Multidimensionale Tests, oder klicken Sie auf den entsprechenden Button der Toolbar Parametrische Tests (siehe unten).

Nach dem Klicken auf den Button erscheint ein Dialogfenster. Wählen Sie die den ersten drei Spalten entsprechenden entsprechenden Daten auf den Excelblatt aus, dann die wählen Sie die Spalte B, die den Gruppenidentifikator enthält.

Die Ergebnisse zeigen für beide Mittelwerte (Wilks Test) und Kovarianzmatrizen (Box und Kullback Tests), das die drei Gruppen als identisch angesehen werden können und von der gleichen Population stammen. Man stellt mit den Fisher Abständen fest, dass der Abstand zwischen G1 einerseits und G2 oder G3 andererseits größer als die Abstände zwischen G2 und G3 sind, jedoch nicht signifikant..


2. Test auf den letzten drei Spalten
Dieses Mal wurden nur die letzten drei Spalten ausgewählt.

In diesem Fall decken die Tests der Mittelwerte den Unterschied auf: Der Wilks Lambda Test lässt den Schluss zu, dass ein signifikanter Unterschied zwischen den Gruppenmittelwerten besteht. Man erkennt, dass die Mahalanobis Abstände sinnvoll sind, falls Gruppe 3 betroffen ist. Es ist nicht überraschend, dass kleine Unterschiede zwischen den ersten beiden Gruppen nicht als signifikant erkannt wurden, da der Umfang der Stichprobe zu klein ist um solch eine kleine Differenz zu identifizieren.

Betrachtet man die Kovarianzmatrizen, so sind die Box Tests im Begriff fast einen Unterschied anzuzeigen, der p-value liegt bei 0.06. Jedoch schlägt der Kullback Test fehl und zeigt keine Differenz an. Die ist auf die kleine Gruppengrösse zurückzuführen, die nicht ausreichend ist um Gruppen mit Varianzen von 5² und 7² zu unterscheiden.

3. Test auf allen sechs Spalten
Dieses Mal wurden alle Spalten ausgewählt. Im Reiter "Ausgabe" wurden Korrelations- und Kovarianzmatrizen aktiviert.

Die Tests der Mittelwerte führen zu ähnlichen Ergebnissen wie im Fall 2 (siehe oben). Der Unterschied zwischen G1 und G2 basierend auf der Mahalanobis Distanz sind etwas kleiner.

Jedoch sind die Tests den Kovarianzmatrizen verschieden. Kleine Differenzen wurden zwischen den ersten drei Spalten beobachtet und die größeren Differenzen auf den letzten 3 Spalten häufen sich an. Es existieren nicht zu vernachlässigende Kovarianzen zwischen RV1 und RV4, zwischen RV2 und RV5 und zwischen RV3 und RV6. Schließlich erhält man deutlich unterschiedliche Ergebnisse, falls der Test auf den ganzen 6 Spalten durchgeführt wird.

Klicken Sie hier, um zu den übrigen Einführungen zu gelangen.