Comment faire une Régression non linéaire avec XLSTAT ?
Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici. Les données proviennent de [Ratkowsky D.A. (1983). Nonlinear Regression Modeling. Marcel Dekker New York].
En utilisant la régression non linéaire, notre but est d'étudier comment le Poids sec des oignons varie en fonction du Temps. S'il paraît intuitivement normal d'utiliser une régression logistique à trois paramètres, le modèle proposé par Ratkowsky est plus complexe.
Régression logistique à 2 paramètres
![]()
Régression logistique à 3 paramètres
![]()
Modèle de Ratkowsky à 4 paramètres
Afin de démontrer l'étendue des possibilités de XLSTAT, et bien que le modèle logistique à trois paramètres soit directement disponible sous XLSTAT, nous allons montrer dans cet exemple comment l'utilisateur peut lui-même créer et ajouter sa fonction à la liste des fonctions disponibles.
Dans un premier temps, comme la régression non linéaire de XLSTAT ne propose pas parmi les fonctions préprogrammées le modèle de Ratkowsky, et comme sa structure est complexe, nous devons calculer les dérivées de la fonction par rapport à chacun des 4 paramètres. Dans le tableau ci-dessous sont données les quatre dérivées, et leur transcription avec les conventions imposées par XLSTAT (syntaxe Excel, avec "pri" pour le paramètre i et "Xj" pour la variable j). Remarque : si une dérivée commence par un "-", il faut la faire précéder d'une cote ' pour éviter qu'Excel ne détecte une erreur.
Ecriture mathématique
![]()
Syntaxe XLSTAT
(pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)
Ecriture mathématique

Syntaxe XLSTAT
(pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)
Ecriture mathématique
![]()
Syntaxe XLSTAT
1/(1+exp(-pr1-pr2*X1))^(1/pr4)
Ecriture mathématique
![]()
Syntaxe XLSTAT
(pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)
Enfin, lorsque les fonctions ont une structure complexe, il est conseillé d'indiquer à XLSTAT un point de départ. Dans notre cas, il semble que [0, 0, 725, 1] soit raisonnable. 725 correspond au maximum de la variable dépendante. Le point de départ et les dérivées doivent être saisis en colonne sur une feuille Excel. On peut ensuite démarrer l'analyse.
Une fois XLSTAT lancé, choisissez la commande XLSTAT/Modélisation/Régression non linéaire ou cliquez sur le bouton "Régression non linéaire" de la barre d'outils "Modélisation".

Une fois le bouton cliqué, la boîte de dialogue correspondant à la régression non linéaire apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel. La "Variable dépendante" correspond à la variable réponse (ou variable à modéliser), qui est dans ce cas précis le Poids. La variable quantitative explicative est ici le temps. On veut ici expliquer la variabilité du Poids par celle du Temps. L'option "Libellés des variables" est laissée activée car la première ligne des colonnes comprend le nom des variables.

Dans l'onglet "Options" les données correspondant aux valeurs de départ des quatre paramètres du modèle sont sélectionnées. NB : un libellé ne doit pas être sélectionné ici.

Dans l'onglet "Fonctions", comme la fonction de Ratkowsky n'existe pas dans la liste des fonction préprogrammées (en revanche, la logistique à 3 paramètres s'y trouve), nous devons d'abord entrer la fonction de Ratkowsky, en cliquant sur "Ajouter". On peut alors saisir la fonction dans la case "Fonction : Y =". Il y a autant de dérivées que de paramètres, qu'il faut avoir préalablement entrer dans des cellules d'une feuille du classeur, les unes en-dessous des autres. Pour les sélectionner, il faut cliquer sur la case à cocher "Dérivées", puis sélectionner sur la feuille Excel les quatre dérivées. Afin d'ajouter cette fonction à la librairie des fonctions définies par l'utilisateur, et de pouvoir la réutiliser plus tard, nous cliquons sur "Enregistrer". Elle est alors ajoutée et automatiquement sélectionnée.

Une fois que vous avez cliqué sur le bouton "OK", les calculs commencent puis les résultats sont affichés. Le premier tableau de résultats fournit des statistiques simples sur les données sélectionnées. Le second tableau (ci-dessous) donne les coefficients d'ajustement du modèle parmi lesquels le R² (coefficient de détermination) qui donne une idée du % de variabilité de la variable dépendante, expliqué par la variable explicative. Plus ce coefficient est proche de 1, meilleur est le modèle. La somme des carrés des résidus (SCE) est le critère utilisé par XLSTAT pour ajuster le modèle.

Dans notre cas, 99% de la variabilité du Poids est expliquée par le Temps, ce qui constitue un excellent résultat.
Le tableau suivant fournit les détails sur les paramètres du modèle après ajustement. Nous voyons que le paramètre pr3, dont la valeur de départ était 725 vaut 699.64 après ajustement. L'écart-type donne une idée de la fiabilité du résultat obtenu. Le paramètre pr4 étant proche de 1, on peut imaginer que le modèle logistique à 3 paramètres donnerait un aussi bon résultat, hypothèse que vous pourrez facilement vérifier en utilisant la fonction préprogrammée de XLSTAT.

L'équation du modèle ajustée est fourni. La synthaxe est compatible avec Excel afin de rendre sa réutilisation aisée.

Le tabeau suivant (voir feuille Excel) présente l'analyse des résidus. On remarque que les observations pour lesquelles le modèle est le moins bien ajusté sont les observations 11 et 14.
Le premier graphique (voir ci-dessous) permet de visualiser les données et la courbe du module ajusté. Les autres graphiques permettent d'analyser les résidus, et sont particulièrement utiles lorsque le nombre de données est important.

En conclusion, dans le cadre de cette étude et du modèle choisi, le temps de culture de l'oignon, permet de modéliser très efficacement son Poids sec.
Cliquez ici pour accéder à d'autres tutoriels.