Wie führe ich eine nichtlineare Regression mit XLSTAT durch?

Eine Excel-Mappe mit den Daten und den Ergebnissen, die in diesem Tutorial behandelt werden, kann hier heruntergeladen werden. Die Daten stammen aus [Ratkowsky D.A. (1983). Nonlinear Regression Modeling. New York, Marcel Dekker].

Wir setzen die nicht-lineare Regression ein, um zu untersuchen, ob das Trockengewicht von Zwiebeln ab Abhängigkeit von der Zeitspanne des Wachstums abhängt. Wenn auch eine logistische Regression mit 3 Parametern intuitiv erscheint, so ist das von Ratkowsky vorgeschlagene Modell komplexer.

Logistisches Modell mit 2 Parametern
eq1.gif

Logistisches Modell mit 3 Parametern
eq2.gif

Ratkowskys Modell mit 4 Parametern
eq3.gif

Um die Möglichkeiten von XLSTAT vorzustellen und obwohl ein logistisches Modell mit 3 Parametern direkt in XLSTAT verfügbar ist, so wird in diesem Beispiel die Verwendung von neuen vom Benutzer definierten Funktionen zu den schon verfügbaren Funktionen gezeigt.

Zunächst müssen, da die nicht-lineare Regression in XLSTAT das Modell von Ratkowsky nicht enthält, wir die Ableitungen des Modells für jede der 4 Parametern bilden. In den folgenden Tabellen zeigen wir die Ableitung und Ihre Schreibweise unter Benutzung der XLSTAT Konventionen: Excel-Syntax, mit "pri" für den Parameter i und "Xj" für die Variable j. Bemerkung: Falls eine Ableitung mit einem "-" beginnt, so muss ein Apostroph ' am Anfang hinzugefügt werden, um zu Vermeiden, dass Excel eine Fehlermeldung ausgibt.

Mathematische Schreibweise
deriv1.gif
XLSTAT-Syntax
(pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Mathematische Schreibweise
deriv2.gif
XLSTAT-Syntax
(pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Mathematische Schreibweise
deriv3.gif
XLSTAT-Syntax
1/(1+exp(-pr1-pr2*X1))^(1/pr4)

Mathematische Schreibweise
deriv4.gif
XLSTAT-Syntax
(pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)

Zuletzt sollten, im Fall einer komplexen Struktur, Startwerte definiert werden. In unserem Fall scheinen [0, 0, 725, 1] gute Werte zu sein. 725 entspricht dem Maximum der abhängigen Variablen (Trockengewicht). Der Startpunkt und die Ableitungen müssen vertikal in Excel eingegeben werden. Danach kann die Analyse beginnen.

Nach dem Öffnen von XLSTAT, wählen Sie den Befehl XLSTAT/Modellierung der Daten/Nicht-lineare Regression oder klicken Sie auf den entsprechenden Button in der Toolbar "Modellierung der Daten" (siehe unten).

barnlin.gif

Nach dem Klicken des Buttons erscheint das entsprechende Dialogfenster der nicht-linearen Regression. Sie können nun die Daten im Excel-Blatt auswählen. Es gibt mehrere Arten die Daten in den XLSTAT Dialogfenstern auszuwählen (siehe auch das Tutorial Datenauswahl zu diesem Thema). Im untersuchten Beispiel beginnen die Daten in der ersten Zeile; es ist daher schneller die Spaltenauswahl zu benutzen. Daher erscheinen im Dialogfenster unten die Auswahlen in Form von Spalten. Die Option „Variablenbeschriftungen“ ist aktiviert, da die erste Zeile der Daten die Namen der Variablen enthält. Die „Abhängige Variable“ (oder zu modellierende Variable oder Antwortvariable) entspricht der Spalte „Trockengewicht“. Die quantitative erklärende Variable ist die „Zeit“. Wir möchten die Variabilität des „Trockengewichts“ in Abhängigkeit der „Zeit“ erklären.

nlin1.gif

Im Reiter Optionen wählen Sie die Daten, die dem Startpunkt entsprechen, der die Ausgangswerte für jeden Parameter darstellt. Bemerkung: Hier darf keine Kopfzeile ausgewählt werden.

nlin21.gif

Im Reiter „Funktionen“ müssen Sie das Modell Ratkowsky hinzufügen, das Modell von Ratkowsky nicht in den „vorprogrammierten Funktionen“ enthalten ist (dagegen kann man sehen, dass die logistische Regression mit 3 Parametern verfügbar ist): Um eine benutzerdefinierte Funktion hinzuzufügen, klicken Sie auf „Hinzufügen“ und geben Sie anschließend die Funktion im Fenster „Funktion: Y =" ein. Dann wählen Sie die Ableitungen auf dem Excel-Blatt (es gibt eine Ableitung pro Parameter) aus. Um diese Funktion der Funktionsbibliothek hinzuzufügen, klicken Sie auf „Speichern“. Die Funktion wird dann automatisch hinzugefügt und ausgewählt.

nlin2.gif

Die Berechnungen beginnen, sobald der Button "OK" geklickt wird. Die Ergebnisse werden angezeigt. Die erste Tabelle enthält deskriptive Statistiken der abhängigen und der zu erklärenden Variablen. Die zweite Tabelle zeigt die Koeffizienten der Anpassungsgüte des Modells an einschließlich des R’² (Determinationskoeffizient) und der SSE (Summe der Fehlerquadrate), die später als Optimierungskriterium für das Modell benutzt wird. R’² gibt den reellen Eindruck über den Prozentsatz der Variabilität der abhängigen Variablen (hier das Trockengewicht) an, die durch die erklärenden Variablen beschrieben (hier die Wachstumszeit) wird. Je näher R’² bei 1 liegt, desto besser ist die Anpassungsgüte.

nlin3.gif

In unserem Fall wird 99% der Variabilität des Trockengewichts durch die Zeit erklärt, was ein ausgezeichnetes Ergebnis ist.

Die folgende Tabelle zeigt die Einzelergebnisse für die Modellparameter. Wie man sieht, hat der Parameter pr3, der zu Anfang den Wert 725 hatte, nun den Wert 699.64 nach der Anpassung. Die Standardabweichung gibt eine Idee über die Zuverlässig der für jeden Parameter erhaltenen Ergebnisse. Der Wert des Parameters pr4 liegt nahe bei 1, wodurch man sich vorstellen kann, dass eine logistische Regression mit 3 Parametern wohl sehr ähnlich gute Ergebnisse liefern würde, eine Hypothese, die Sie mit der verfügbaren, vorprogrammierten Funktion überprüfen können.

nlin4.gif

Die Modellgleichung wird angezeigt und kann einfach in Excel wiederverwendet werden.

nlin41.gif

Die nächste Tabelle (siehe das Excelblatt) zeigt die Analyse der Residuen. Man kann feststellen, dass das Modell die Beobachtungen 11 und 14 nicht gut anpasst.

Das erste Diagramm (siehe unten) erlaubt es, die Daten und die angepasste Kurve darzustellen. Die anderen Diagramme erlauben die visuelle Analyse der Residuen und sind nützlich, falls die Anzahl der Daten groß ist.

nlin5.gif

Als Fazit kann man in diesem Kontext der Analyse und dem ausgewählten Modell sagen, dass die Wachstumszeit sehr gut das Trockengewicht von Zwiebeln sehr gut erklärt.

Klicken Sie hier, um zu den übrigen Einführungen zu gelangen.