Régression non linéaire avec XLSTAT

Jeu de données pour Régression non-linéaire (Genfit) XLS37.5 Ko

Vidéo du tutoriel
"Régression non-linéaire (Genfit)" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour réaliser une régression non linéaire et but de ce tutoriel

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données proviennent de [Ratkowsky D.A. (1983). Nonlinear Regression Modeling. Marcel Dekker New York].

En utilisant la régression non linéaire, notre but est d'étudier comment le Poids sec des oignons varie en fonction du Temps. S'il paraît intuitivement normal d'utiliser une régression logistique à trois paramètres, le modèle proposé par Ratkowsky est plus complexe.

Régression non linéaire

Régression logistique à 2 paramètres eq1.gif

Régression logistique à 3 paramètres eq2.gif

Modèle de Ratkowsky à 4 paramètres eq3.gif

Afin de démontrer l'étendue des possibilités de XLSTAT, et bien que le modèle logistique à trois paramètres soit directement disponible sous XLSTAT, nous allons montrer dans cet exemple comment l'utilisateur peut lui-même créer et ajouter sa fonction à la liste des fonctions disponibles.

Calcul des dérivées de la fonction par apport aux paramètres

Dans un premier temps, comme la régression non linéaire de XLSTAT ne propose pas parmi les fonctions préprogrammées le modèle de Ratkowsky, et comme sa structure est complexe, nous devons calculer les dérivées de la fonction par rapport à chacun des 4 paramètres.

Dans le tableau ci-dessous sont données les quatre dérivées, et leur transcription avec les conventions imposées par XLSTAT (syntaxe Excel, avec "pri" pour le paramètre i et "Xj" pour la variable j). Remarque : si une dérivée commence par un "-", il faut la faire précéder d'une cote ' pour éviter qu'Excel ne détecte une erreur.

Ecriture mathématique deriv1.gif Syntaxe XLSTAT (pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Ecriture mathématique deriv2.gif Syntaxe XLSTAT (pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Ecriture mathématique deriv3.gif Syntaxe XLSTAT 1/(1+exp(-pr1-pr2*X1))^(1/pr4)

Ecriture mathématique deriv4.gif Syntaxe XLSTAT (pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)

Enfin, lorsque les fonctions ont une structure complexe, il est conseillé d'indiquer à XLSTAT un point de départ.

Dans notre cas, il semble que [0, 0, 725, 1] soit raisonnable. 725 correspond au maximum de la variable dépendante.

Le point de départ et les dérivées doivent être saisis en colonne sur une feuille Excel. On peut ensuite démarrer l'analyse.

Paramétrer une régression non linéaire

Une fois XLSTAT lancé, choisissez la commande XLSTAT / Modélisation / Régression non linéaire ou cliquez sur le bouton Régression non linéaire de la barre d'outils Modélisation.

barnlinf.gif

Une fois le bouton cliqué, la boîte de dialogue correspondant à la régression non linéaire apparaît.

Vous pouvez alors sélectionner les données sur la feuille Excel.

La Variable dépendante correspond à la variable réponse (ou variable à modéliser), qui est dans ce cas précis le "Poids".

La variable quantitative explicative est ici le "temps".

On veut ici expliquer la variabilité du "Poids" par celle du "Temps".

L'option Libellés des variables est laissée activée car la première ligne des colonnes comprend le nom des variables.

nlin1f.gif

Dans l'onglet Options les données correspondant aux valeurs de départ des quatre paramètres du modèle sont sélectionnées.

NB : un libellé ne doit pas être sélectionné ici.

nlin21f.gif

Dans l'onglet Fonctions, comme la fonction de Ratkowsky n'existe pas dans la liste des fonction préprogrammées (en revanche, la logistique à 3 paramètres s'y trouve), nous devons d'abord entrer la fonction de Ratkowsky, en cliquant sur Ajouter. On peut alors saisir la fonction dans la case Fonction : Y =.

Il y a autant de dérivées que de paramètres, qu'il faut avoir préalablement entrer dans des cellules d'une feuille du classeur, les unes en-dessous des autres.

Pour les sélectionner, il faut cliquer sur la case à cocher Dérivées, puis sélectionner sur la feuille Excel les quatre dérivées.

Afin d'ajouter cette fonction à la librairie des fonctions définies par l'utilisateur, et de pouvoir la réutiliser plus tard, nous cliquons sur Enregistrer. Elle est alors ajoutée et automatiquement sélectionnée.

nlin2f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.

Interprétation des résultats de la régression non linéaire

Le premier tableau de résultats fournit des statistiques simples sur les données sélectionnées. Le second tableau (ci-dessous) donne les coefficients d'ajustement du modèle parmi lesquels le R’² (coefficient de détermination) qui donne une idée du % de variabilité de la variable dépendante, expliqué par la variable explicative. Plus ce coefficient est proche de 1, meilleur est le modèle. La somme des carrés des résidus (SCE) est le critère utilisé par XLSTAT pour ajuster le modèle.

nlin3f.gif

Dans notre cas, 99% de la variabilité du Poids est expliquée par le Temps, ce qui constitue un excellent résultat.

Le tableau suivant fournit les détails sur les paramètres du modèle après ajustement. Nous voyons que le paramètre pr3, dont la valeur de départ était 725 vaut 699.64 après ajustement. L'écart-type donne une idée de la fiabilité du résultat obtenu. Le paramètre pr4 étant proche de 1, on peut imaginer que le modèle logistique à 3 paramètres donnerait un aussi bon résultat, hypothèse que vous pourrez facilement vérifier en utilisant la fonction préprogrammée de XLSTAT.

nlin4f.gif

L'équation du modèle ajustée est fourni. La syntaxe est compatible avec Excel afin de rendre sa réutilisation aisée.

nlin41f.gif

Le tableau suivant (voir feuille Excel) présente l'analyse des résidus. On remarque que les observations pour lesquelles le modèle est le moins bien ajusté sont les observations 11 et 14.

Le premier graphique (voir ci-dessous) permet de visualiser les données et la courbe du module ajusté. Les autres graphiques permettent d'analyser les résidus, et sont particulièrement utiles lorsque le nombre de données est important.

nlin5f.gif

En conclusion, dans le cadre de cette étude et du modèle choisi, le temps de culture de l'oignon, permet de modéliser très efficacement son Poids sec.