Wie führe ich eine nicht-lineare multiple Regression mit XLSTAT durch?
Eine Excel-Mappe mit den Daten und den Ergebnissen, die in diesem Tutorial behandelt werden, kann hier heruntergeladen werden. Die Absicht dieser Studie ist es, den Effekt der Konzentration zweier Komponenten, C1 und C2, auf die Viskosität von Joghurt auswirkt. Das Modell, das wir anpassen möchten, schreibt sich als:
F(C1, C2) = pr5 / (1+Exp(-pr1-pr2*C1-pr3*C2-pr4*C1*C2))
pr1, ..., pr5 sind die Parameter des Modells. Dieses logistisch-artige Modell erlaubt es sowohl die Konzentration der Komponenten als auch die Interaktion zwischen ihnen zu berücksichtigen.
Nach dem Öffnen von XLSTAT, wählen Sie den Befehl XLSTAT/Modellierung der Daten/Nicht-lineare Regression oder klicken Sie auf den entsprechenden Button in der Toolbar "Modellierung der Daten" (siehe unten).

Nach dem Klicken des Buttons erscheint das entsprechende Dialogfenster der nicht-linearen Regression. Sie können nun die Daten im Excel-Blatt auswählen. Es gibt mehrere Arten die Daten in den XLSTAT Dialogfenstern auszuwählen (siehe auch das Tutorial Datenauswahl zu diesem Thema). Im untersuchten Beispiel beginnen die Daten in der ersten Zeile; es ist daher schneller die Spaltenauswahl zu benutzen. Daher erscheinen im Dialogfenster unten die Auswahlen in Form von Spalten. Die Option „Variablenbeschriftungen“ ist aktiviert, da die erste Zeile der Daten die Namen der Variablen enthält. Die „Abhängige Variable“ (oder zu modellierende Variable oder Antwortvariable) entspricht der Spalte „Viskosität“. Die quantitativen erklärenden Variablen sind die beiden Komponenten C1 und C2. Die Option „Residuen“ ist aktiviert, weil die Vorhersagen und die Residuen analysiert werden sollen.

Im Reiter „Optionen“ wurden die folgenden Werte als Ausgangswerte für die fünf Parameter ausgewählt.

Im Reiter „Funktionen“ werden verschiedene Funktionen angezeigt. Da die von uns gewollte Funktion nicht in den „vorprogrammierten Funktionen“ enthalten ist (dagegen kann man sehen, dass die univariate Version der Funktion in der Liste verfügbar ist), so müssen wir diese hinzufügen: Um eine benutzerdefinierte Funktion hinzuzufügen, klicken Sie auf „Hinzufügen“ und geben Sie anschließend die Funktion im Fenster „Funktion: Y =" ein. Dann aktivieren Sie „Ableitungen“ und wählen Sie diese auf dem Excel-Blatt (es gibt eine Ableitung pro Parameter) aus. Um diese Funktion der Funktionsbibliothek hinzuzufügen, klicken Sie auf „Speichern“. Die Funktion wird dann automatisch hinzugefügt und ausgewählt.

Die Berechnungen beginnen, sobald der Button "OK" geklickt wird. Die Ergebnisse werden angezeigt. Die erste Tabelle enthält deskriptive Statistiken der abhängigen und der zu erklärenden Variablen.
Die zweite Tabelle (siehe unten) zeigt die Koeffizienten der Anpassungsgüte des Modells an einschließlich des R’² (Determinationskoeffizient) und der SSE (Summe der Fehlerquadrate), die später als Optimierungskriterium für das Modell benutzt wird. R’² gibt den reellen Eindruck über den Prozentsatz der Variabilität der abhängigen Variablen (hier die Viskosität) an, die durch die erklärenden Variablen beschrieben (hier die Komponenten) wird. Je näher R’² bei 1 liegt, desto besser ist die Anpassungsgüte.

In unserem Fall wird 99% der Variabilität durch die beiden Variablen und ihre Interaktion erklärt, was ein ausgezeichnetes Ergebnis ist, was das ausgewählte Modell bestätigt.
Die folgende Tabelle zeigt die Ergebnisse für die Modellparameter. Wie man sieht, sind die Verhältnisse (Parameter)/(Standardabweichung) größer für die Parameter pr5 und pr4. Da das gleiche Verhältnis am größten für den Parameter pr5 ist, kann man schließen, dass die Interaktion zwischen den beiden Komponenten einen größeren Effekt auf die Viskosität hat, als die einzelnen Komponenten allein.

Das folgende Diagramm (siehe unten) erlaubt die visuelle Analyse der Vorhersagen und den beobachteten Werten zu beurteilen.

Klicken Sie hier, um zu den übrigen Einführungen zu gelangen.
