Régression linéaire - méthode des moindres carrés

"Régression linéaire - méthode des moindres carrés" inclus dans :
  • PLS Logiciel pour la régression par les moindres carrés partiels

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Equation du modèle de régression linéaire

Des trois méthodes, c'est la plus classique. La régression OLS (Ordinary Least Squares) est plus communément appelée régression linéaire (simple ou multiple). Dans le cas d'un modèle à p variables explicatives, le modèle statistique de la régression OLS s'écrit :

Y = β0 + Σj=1..p βjXj + ε

où Y désigne la variable dépendante, β0, est constante du modèle, X j désigne la jème variable explicative du modèle (j= 1 à p), et e une erreur aléatoire d'espérance 0 et de variance σ². Dans le cas où l'on dispose de n observations, l'estimation de la valeur de la variable Y pour l'observation i est donnée par l'équation suivante :

yi = β0 + Σj=1..p βjXij, (i= 1, … n)

La méthode OLS correspond à la minimisation de la somme des écarts quadratiques entre les valeurs observées et les valeurs prédites. On montre que cette minimisation conduit aux estimateurs des paramètres du modèle suivants :

[β = (X’DX)-1 X’ Dy σ² = 1/(W –p*) Σi=1..n wi(yi - yi)]

β désigne le vecteur des estimateurs des paramètres βi, X est la matrice des variables explicatives précédées d'un vecteur de 1, y est le vecteur des n valeurs observées pour la variable dépendante, p* est le nombre de variables explicatives auquel on additionne 1 si la constante n'est pas fixée, wi est le poids associé à l'observation i, et W est la somme des poids wi. D est la matrice diagonale des poids wi.

Le vecteur des valeurs prédites s'écrit finalement :

y = X (X’ DX)-1 X’Dy

Limitations du modèle de régression linéaire

Les limitations de la régression OLS viennent de la contrainte issue du calcul de l'inverse de la matrice X'X : il faut que la matrice soit de rang p+1. En outre, certains problèmes numériques peuvent être rencontrés. XLSTAT utilise des algorithmes notamment dus à Dempster (1969) qui permettent de contourner ces deux problèmes : dans le cas où la matrice est de rang q où q est strictement inférieur à p+1, certaines variables sont supprimées du modèle, soit parce qu'elles sont constantes, soit parce qu'elles font partie d'un bloc de variables colinéaires.

Sélection de variables

Par ailleurs, une sélection automatique des variables est effectuée dans le cas où l'utilisateur sélectionnerait un nombre de variables trop important pour le nombre d'observations (la limite théorique est n-1, car au-delà la matrice X'X est non inversible).

La suppression de certaines variables peut ne pas être optimale : dans certains cas, on n'ajoute pas une variable au modèle en raison de colinéarité avec une variable ou un bloc de variables déjà présentes, mais il se pourrait qu'il soit plus pertinent de retirer une variable déjà présente dans le modèle et d'ajouter cette nouvelle variable.

Prédiction

Le modèle linéaire peut servir à prédire des valeurs pour des échantillons dont les valeurs des variables explicatives sont connues ou non. Ainsi l'on peut mesurer la qualité de la prédiction et utiliser le modèle en s'assurant que sa qualité est bonne.

Aperçus