Le modèle logit conditionnel avec XLSTAT-Conjoint

Jeu de données pour Modèle Logit conditionnel XLS224 Ko

Vidéo du tutoriel
  • Conjoint Logiciel pour l'analyse conjointe

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Modèle logistique conditionnel

Le modèle logit conditionnel est une méthode statistique proche de la régression logistique.

La régression logistique conditionnelle est une méthode surtout utilisée dans sa forme évoluée dans le cadre de l'analyse conjointe. Elle est néanmoins aussi utile lorsque l'on analyse un certain type de données. Ce modèle a été introduit par McFadden (1973). Au lieu d'avoir une ligne par individu, on aura une ligne par choix possible. Ainsi, ce ne sont plus les caractéristiques des individus qui sont modélisées, mais celles des différentes alternatives. Ainsi, si on cherche à étudier des habitudes de transport, comme dans ce tutoriel, on aura quatre types de transports (voiture / train / avion / vélo), chacun de ces types de transport a des caractéristiques (son prix, sa vitesse), mais un individu ne choisira qu'un seul des quatre moyens de transport.

Dans le cadre d'un modèle logit conditionnel, on aura pour N individus, N*4 lignes avec 4 lignes pour chaque individu associé à chacun des moyens de transport. La variable réponse binaire indiquera le choix de l'individu avec la valeur 1, et 0 correspondra aux choix non retenus par l'individu. Il faudra aussi sélectionner une colonne associée au nom des individus (avec 4 lignes par individu pour l'exemple des moyens de transport). Les variables explicatives devront aussi avoir N*4 lignes.

Jeu de données pour le modèle logit conditionnel

L'exemple que nous traitons ci-dessous correspond à un cas classique dans lequel on cherche à comparer des moyens de transport proposés pour partir en vacances à des individus. Il est issu de Greene, W.H. (2003). Econometric Analysis, 5th edition. Upper Saddle River, NJ: Prentice Hall.

Un fichier Excel comprenant à la fois les données et les résultats peut être téléchargé en cliquant ici.

Les données correspondent à un échantillon de 210 individus, avec pour chacun d'eux 4 possibles. On a demandé à chacun d'eux le moyen de transport qu'ils choisiraient pour partir en vacances parmi quatre possibilités. On aura donc 840 lignes dans le jeu de données. La première colonne permet d'identifier l'individu, la seconde est la variable binaire modélisant le moyen de transport choisi. On a ensuite deux variables quantitatives donnant respectivement le coût général et le temps d'attente lors du voyage associé à chaque moyen de transport pour chacun des individus. Finalement, la variable catégorielle associée au moyen de transport se trouve en dernier (avion, train bus ou voiture).

Paramétrer un modèle logit conditionnel

Pour activer la boîte de dialogue du modèle logit conditonnel, lancez XLSTAT, puis choisissez XLSTAT / XLSTAT-Conjoint / Logit conditionnel, ou cliquez sur le bouton correspondant de la barre d'outils XLSTAT-Conjoint (voir ci-dessous).

barre-menu-logit-cond.gif

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue apparaît.

Sélectionnez les données sur la feuille Excel.

Les données Réponses correspondent à la colonne dans laquelle se trouve la variable binaire. Les libellés des individus correspondent à la colonne sujet associé aux numéros des individus (on peut aussi avoir des noms d'individus à la place). Dans notre cas il y a trois variables explicatives, une qualitative - le moyen de transport - et deux quantitatives correspondant aux coût et temps d'attente (on remarquera qu'il est nul pour la voiture). Comme nous avons sélectionné les libellés des variables, nous devons sélectionner l'option Libellés des variables.

logit-cond-boite-dialogue-general.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués puis les résultats affichés.

Interpréter les résultats d'un modèle logit conditionnel

Le tableau suivant donne plusieurs indicateurs de la qualité du modèle (ou qualité de l'ajustement). Ces résultats sont équivalents au R² et au tableau d'analyse de la variance de la régression linéaire et de l'Anova. La valeur la plus importante est le Chi² associé au Log ratio (L.R.). C'est l'équivalent du test F de Fisher du modèle linéaire : on essaie d'évaluer si les variables apportent une quantité d'information significative pour expliquer la variabilité de la variable binaire. Dans notre cas, comme la probabilité est inférieure à 0.0001, on peut conclure que les variables apportent une quantité significative d'information.

logit-cond-resultats-ajustement.gif

Ces coefficients d'ajustement nous montrent que notre modèle est significativement meilleur que le modèle sans variable explicative. Le tableau suivant confirme ces premières impressions:

logit-cond-resultats-tests.gif

Les p-valeurs obtenues sont toutes très faibles ainsi l'impact des 3 variables explicatives est significatif.

logit-cond-resultats-type3.gif

Finalement les coefficients du modèle nous montrent que c'est l'avion qui est préféré et que le temps d'attente a un effet négatif significatif sur le choix du mode de transport.

logit-cond-resultats-coefficients.gif

logit-cond-graphique-coefficients.gif

L'analyse des résidus peut être aussi utile et apporter d'autres informations sur les choix des individus.