¿Cómo realizar una regresión logà­stica con XLSTAT?

Conjunto de datos para Modelos para variable de respuesta binaria (Logit, Probit) XLS69.0 KB

Vídeo de tutorial
Modelos para variable de respuesta binaria (Logit, Probit) es parte de : Descargar evaluación Más detalles Ver los comentarios del usuario

Ventajas

  • Sencillo y dirigido a los usuarios
    Sencillo y dirigido a los usuarios XLSTAT es un software que se integra de forma transparente con Microsoft Excel, que es la hoja de cálculo más difundida del mundo. Esta integración hace que sea una de las herramientas más sencillas para trabajar ya que utiliza la misma filosofía que Microsoft Excel. El programa está disponible en una ficha de XLSTAT. Los análisis se agrupan en menús funcionales. Los cuadros de diálogo están dirigidos a los usuarios, por lo que la preparación de los análisis es tarea sencilla.
  • Resultados y datos compartidos sin dificultad
    Resultados y datos compartidos sin dificultad Una de las mayores ventajas de XLSTAT es la forma transparente con la que se pueden compartir los datos y los resultados. Los resultados se almacenan en Microsoft Excel de modo que cualquier usuario puede acceder a ellos. No es necesario que el destinatario tenga una licencia de XLSTAT o cualquier visor adicional, lo que facilita y rentabiliza el trabajo en equipo. Del mismo modo, es fácil integrar los resultados en otras aplicaciones de Microsoft Office, como PowerPoint, por lo que se pueden crear estupendas presentaciones en cuestión de minutos.
  • Modular
    Modular XLSTAT es un producto modular. XLSTAT-Pro es un módulo principal de estadística de XLSTAT, que incluye todas las funcionalidades dominantes en el análisis estadístico y multivariado. Es posible añadir funciones más avanzadas por medio de módulos complementarios para aplicaciones específicas. De este modo es posible adaptar el software a sus necesidades, aumentando la rentabilidad.
  • Didáctico
    Didáctico Los resultados de XLSTAT están organizados por análisis y es fácil desplazarse por ellos. La información útil se proporciona junto con los resultados para ayudarle en su interpretación.
  • Asequible
    Asequible XLSTAT es una solución completa y modular que se puede ajustar a cualquier necesidad de análisis comercial. Tiene un precio muy razonable, por lo que el retorno de su inversión es casi inmediato. Todas las licencias de XLSTAT incluyen también un servicio de asistencia de la mayor calidad.
  • Accesible: disponible en muchos idiomas
    Accesible: disponible en muchos idiomas Nos hemos asegurado de que XLSTAT sea accesible para todos traduciendo el programa a muchos idiomas, incluyendo chino, inglés, alemán, italiano, japonés, polaco, portugués y español.
  • Automatizable y personalizable
    Automatizable y personalizable La mayoría de las funciones estadísticas disponibles en XLSTAT pueden llamarse directamente desde la ventana Visual Basic de Microsoft Excel. Pueden modificarse e integrarse en código fuente adicional para ajustarse a sus necesidades. Añadir tablas y trazados, así como modificar los resultados existentes se convierte en tarea sencilla. Además, XLSTAT incluye algunas herramientas especiales en los cuadros de diálogo para generar automáticamente el código fuente VBA para reproducir su análisis empleando el editor de VBA o simplemente cargar ajustes predeterminados. Esta automatización de análisis rutinarios sin esfuerzo le ahorrará gran cantidad de tiempo.

La regresión logà­stica, y los métodos asociados como el análisis Probit, son muy útiles cuando queremos comprender o prever el efecto de una o varias variables sobre una variable con respuesta binaria, es decir, que puede admitir únicamente dos valores, por ejemplo 0/1 o Sà­/No. Una regresión logà­stica será muy útil para modelizar el efecto de dosis de medicamento en la medicina, de dosis de componentes quà­micos en la agricultura, o para calcular la propensión de clientes a responder a un mailing, o para medir el riesgo para que un cliente no reembolsar su préstamo en un banco.

Con XLSTAT es posible efectuar una regresión logà­stica directamente con los datos brutos (la respuesta es 0 o 1) o con datos agregados (la respuesta es una suma de éxito - de 1 por ejemplo - y en este caso el número de repeticiones también debe ser disponible).

log1.gif Ejemplo de datos brutos - (efecto de la temperatura sobre la resistencia de un chip electrónico)

log2.gif Ejemplo de datos agregados - (efecto de un insecticida sobre una especie de insecto)

Addinsoft a desarrollado un módulo especà­fico para el análisis de los efectos de dosis. XLSTAT-Dose and puede ser pedido por separado.

La regresión logà­stica permite modelizar la probabilidad para que un evento suceda, dado los valores de un conjunto de variables descriptivas cuantitativas y/o cualitativas. El ejemplo que aplicaremos a continuación corresponde a un caso de marketing en el cual buscamos a prever la probabilidad para que un cliente renove su suscripción a un servicio de información en là­nea. Un archivo Excel que incluye a la vez los datos y los resultados puede ser descargado haciendo clic aquà­.

Los datos corresponden a una muestra de 60 "lectores", con la categorà­a de edad, la media de páginas vistas por semana en las 10 últimas semanas, y el número de páginas vistas durante la última semana. Fue propuesto a estos lectores de renovar su suscripción que debe expirar dentro de dos semanas. El objetivo es de comprender porque algunos han suscrito de nuevo y otros no.

El objetivo es usar la regresión logà­stica para explicar los resultados obtenidos y luego para aplicar el modelo en el conjunto de la populación con el fin de identificar las personas que no renovarà­an su suscripción. Con esta información, podremos proponerles una promoción o servicios suplementarios con el fin de estimular su interés por la oferta.

Para activar el cuadro de diálogo de la regresión logà­stica, inicie XLSTAT, luego elija XLSTAT/Modelización de los datos/modelos para respuestas binarias, o haga clic en el botón correspondiente de la barra de herramientas "Modelización de los datos" (ver a continuación).

barlog1.gif

Una vez que haya pulsado el botón, el cuadro de diálogo aparece. Elija los datos en la hoja Excel. La "Respuesta" corresponde a la columna en la cual se encuentra la variable binaria o cuantitativa (resultando entonces e una suma de binarios - en este caso la columna de los "Pesos" debe, luego, ser seleccionada). En nuestro caso, hay tres variables explicativas, una cualitativa - la clase de edad - y dos cuantitativas que corresponden al conteo de las páginas vistas. Como hemos seleccionado las referencias de las variables, debemos seleccionar la opción "Referencias presentes".

log3.gif

Una vez que haya pulsado el botón "OK", los cálculos son efectuados, y luego los resultados visualizados. El cuadro siguiente presenta los primeros detalles sobre el modelo y es útil para evaluar la contribución de las variables a la calidad del modelo.

log4.gif

Con utilizar este cuadro, observamos según la probabilidad asociada a las Pruebas del Chi2, que la variable que influye más la renovación es el número de páginas vistas en la semana anterior. La constante tiene también un papel significativo, asà­ como la pertenencia a la clase de edad 40-49 cuyo papel es fuertemente negativo. Este último punto deberá ser ampliado por los responsables marketing y editoriales, con el fin de estudiar el porqué de esta situación.

El siguiente cuadro proporciona varios indicadores de la calidad del modelo (o calidad del ajuste). Estos resultados son semejantes al R2 y al cuadro de análisis de la varianza de la regresión lineal y del Anova. El valor más importante es el Chi2 asociado al Log ratio (L.R.). Es el equivalente de la prueba F de Fisher del modelo lineal: intentamos de evaluar si las variables proporcionan una cantidad de información significativa para explicar la variabilidad de la variable binaria. En nuestro caso, como la probabilidad es inferior a 0.0001, se puede deducir que las variables proporcionan una cantidad significativa de información.

log5.gif

La última etapa reside en la aplicación del modelo sobre el conjunto de la populación. En nuestro caso el modelo se escribe: Y = Exp( L(x) ) / [ 1 + Exp( L(x) ], whereL(x) = -2.3567 + 0.0235.AvPage/Week + 0.0893.Page/Week + Factor donde Factor adquiere el valor del parámetro correspondiente a la clase de edad a la cual pertenece el cliente.

Cuando el modelo fue aplicado a los 600 clientes que debà­an renovar su suscripción, fue apreciado que solamente 40% eran capaz de suscribirse de nuevo. Gracias a una serie de acciones de marketing, el porcentaje finalmente obtenido fue de 85%, lo que constituye un excelente resultado.