Régression non paramétrique (Kernel, LOWESS)

"Régression non paramétrique (Kernel, LOWESS)" inclus dans :
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Quand utiliser la régression non paramétrique ?

La régression paramétrique peut être utilisée lorsque les hypothèses des méthodes de régression plus classiques, telle que la régression linéaire, ne sont pas vérifiées, ou lorsque la structure du modèle n'a pas fondamentalement d'intérêt et lorsque seule la qualité prédictive du modèle est importante.

XLSTAT propose deux régressions non paramétriques:

Kernel regression

La Kernel regression est un outil de modélisation faisant partie de la famille des méthodes de lissage. Contrairement à la régression linéaire qui est utilisée dans un but explicatif et prédictif (comprendre un phénomène pour pouvoir le prévoir ensuite), la Kernel regression est classée parmi les méthodes de régression non paramétrique essentiellement utilisées dans un but prédictif. La structure du modèle est en effet variable et complexe, ce dernier fonctionnant comme un filtre ou une boîte noire. De nombreuses variantes de la Kernel regression existent.

Comme pour toute méthode de modélisation, un échantillon d'apprentissage de taille napp est utilisé pour estimer les paramètres du modèle. Un échantillon de validation de taille nvalid peut ensuite être utilisé pour évaluer la qualité du modèle. Enfin, le modèle peut être appliqué sur un échantillon de prédiction de taille npred, pour lequel les valeurs de la variable dépendante Y sont inconnues.

  1. La première caractéristique de la Kernel regression est l'utilisation d'une fonction noyau pour pondérer les observations de l'échantillon d'apprentissage, en fonction de leur « distance » à l'observation prédite. Plus les valeurs des variables explicatives d'une observation de l'échantillon d'apprentissage sont proches des valeurs observées pour l'observation en cours de prédiction, plus le plus poids de l'observation de l'échantillon d'apprentissage sera important. Les différentes fonctions noyau proposées par XLSTAT sont :
    • Uniforme
    • Triangle
    • Epanechnikov
    • Quartic
    • Triweight
    • Tricube
    • Gaussien
    • Cosinus
  2. La seconde caractéristique de la Kernel regression est la bande passante associée à chaque variable. Elle intervient dans le calcul et du noyau et du poids des observations, et permet de différencier ou d'homogénéiser le poids relatif des variables, tout en agissant sur l'impact d'une observation de l'échantillon d'apprentissage en fonction de sa distance à l'observation prédite.
  3. La troisième caractéristique est le degré du modèle polynomial utilisé pour ajuster le modèle aux observations de l'échantillon d'apprentissage.

La régression LOWESS

La régression LOWESS (Locally weighted regression and smoothing scatter plots) a été introduite dans le but de créer des courbes lissées passant au travers de nuages de points.

La régression LOWESS peut être considérée comme un cas particulier de la Kernel regression. La "robust LOWESS" est quant à légèrement différente, plus performante, mais plus coûteuse en temps de calcul.

Résultats pour les régressions non paramétriques dans XLSTAT

Entre autres XLSTAT proposent les résultats suivant :

Résultats graphiques pour la régression non paramétrique

Si une seule variable quantitative explicative a été sélectionnée, ou si une variable temporelle a été sélectionnée, le premier graphique représente les données et la courbe correspondant aux prédictions du modèle. Si l'option « en fonction de X1 » a été sélectionnée, le premier graphique correspond aux données observées et aux prédictions en fonction de la première variable explicative sélectionnée. Le second graphique affiché est le diagramme en bâtons des résidus.

Tutoriels

Aperçus