¿Cómo realizar una Regresión no lineal con XLSTAT?

Una hoja Excel que contiene los datos y resultados de este ejemplo puede ser descargada haciendo clic aquí. Los datos proceden de Ratkowsky D.A. (1983). Nonlinear Regression Modeling. New York, Marcel Dekker y fueron obtenidos en el sitio del NIST.

Utilizando la regresión no lineal, nuestro objetivo es estudiar como el Peso en seco de las cebollas varía en función del Tiempo. Si parece intuitivamente normal utilizar una regresión logística de tres parámetros, el modelo propuesto por Ratkowsky es más complejo.

Regresión logísticade 2 parámetros
eq1.gif

Regresión logísticade 3 parámetros
eq2.gif

Modelo de Ratkowskyde 4 parámetros
eq3.gif

Con el fin de demostrar la magnitud de las posibilidades de XLSTAT, y aunque el modelo logística de tres parámetros sea directamente disponible bajo XLSTAT, demostraremos en este ejemplo como el usuario mismo puede crear y añadir su función a la lista de las funciones disponibles.

En un primer lugar, como la regresión no lineal de XLSTAT no ofrece entre las funciones preprogramadas el modelo de Ratkowsky, y como su estructura es compleja, debemos calcular las derivadas de la función con respecto a cada uno de los 4 parámetros. Se proporcionan, en el cuadro a continuación, las cuatros derivadas, y su transcripción con las convenciones impuestas por XLSTAT (sintaxis Excel, con "pri" para el parámetro i y "Xj" para la variable j). Comentario : si una derivada empieza por un "-", debe precederla de una cuota ' para evitar que Excel no detecte un error.

Escritura matemática
deriv1.gif
Sintaxis XLSTAT
(pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Escritura matemática
deriv2.gif
Sintaxis XLSTAT
(pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Escritura matemática
deriv3.gif
Sintaxis XLSTAT
1/(1+exp(-pr1-pr2*X1))^(1/pr4)

Escritura matemática
deriv4.gif
Sintaxis XLSTAT
(pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)

Por último, cuando las funciones tienen una estructura compleja, se aconseja indicar a XLSTAT un punto de inicio. En nuestro caso, parece que [0, 0, 725, 1] sea razonable. 725 corresponde al máximo de la variable dependiente. El punto de inicio y las derivadas deben ser introducidos en columna en una hoja Excel. Luego se puede iniciar el análisis.

Una vez XLSTAT iniciado, elija el comando XLSTAT/Modelización/Regresión no lineal o haga clic en el botón "Regresión no lineal" de la barra de herramientas "Modelización".

barnlin.gif

Una vez el botón presionado, aparece el cuadro de diálogo que corresponde a la regresión no lineal. Puede entonces seleccionar los datos en la hoja Excel. La "Variable dependiente" corresponde a la variable explicada (o variable a modelizar), es decir en este caso preciso, el Peso. La variable cuantitativa explicativa es aquí el tiempo. Queremos explicar aquí la variabilidad del Peso por la del Tiempo. La opción " Referencias presentes " se deja activada ya que la primera línea de columnas incluye el nombre de las variables. Dejamos seleccionada la opción "Residuos" ya que analizaremos las predicciones y residuos. Haciendo clic en el botón "Más", aparece la parte del cuadro de diálogo que corresponde a las opciones avanzadas. Es en este nivel que se especifica el punto de inicio.

nlin1.gif

Un segundo cuadro de diálogo aparece cuando se haga clic en el botón "Siguiente". Este cuadro corresponde a los modelos. Como la función de Ratkowsky no existe en la lista de las funciones preprogramadas (la logística de 3 parámetros se encuentra en séptima posición), debemos en primer lugar introducir la función de Ratkowsky, haciendo clic en "Añadir", con la buena sintaxis, y luego seleccionar las derivadas en la hoja Excel. Con el fin de añadir esta función en la biblioteca de las funciones definidas por el usuario, y poder utilizarla de nuevo más tarde, hacemos clic en "Memorizar". Se añadirá entonces y automáticamente seleccionada.

nlin2.gif

Una vez que haga clic en el botón "OK", los cálculos empiezan y luego aparecen los resultados. El primer cuadro de resultados proporciona la ecuación del modelo antes y después el ajuste. El segundo cuadro (a continuación) proporciona los coeficientes de ajuste del modelo. El R² (coeficiente de determinación) ofrece una idea del % de variabilidad de la variable a modelizar, explicada por la variable explicativa. Mientras más cerca está de 1 este coeficiente, mejor es el modelo. La suma de los cuadrados de los residuos es el criterio utilizado por XLSTAT para ajustar el modelo.

nlin3.gif

En nuestro caso, 99% de la variabilidad del Peso está explicado por el Tiempo, lo que constituye un excelente resultado.

El siguiente cuadro proporciona los detalles sobre los parámetros del modelo tras ajuste. Notamos que el parámetro pr3, cuyo valor de inicio era de 725 vale ahora 699.64 tras ajuste. La desviación típica ofrece una idea de la fiabilidad del resultado obtenido. El parámetro pr4 siendo cerca de 1, se puede imaginar que el modelo logístico de 3 parámetros proporcionaría un resultado tan bueno, hipótesis que podrá fácilmente verificar utilizando la función preprogramada de XLSTAT.

nlin4.gif

El siguiente cuadro (ver hoja Excel) presenta el análisis de los residuos. Se nota que las observaciones por las cuales el modelo es el menos ajustado son las observaciones 11 y 14.

Le primer gráfico (ver a continuación) permite visualizar los datos y la curva del módulo ajustado. Los tres otros gráficos permiten analizar los residuos, y son en particular útiles cuando el número de datos es importante.

nlin5.gif

En conclusión, en el marco de este estudio y modelo elegido, el tiempo del cultivo de la cebolla, permite modelizar muy eficazmente su Peso en seco.

Haga clic aquí para acceder a otros tutoriales.