XLSTAT rejoint le groupe Lumivero - En savoir plus.

Formations & Webinars

Addinsoft organise des sessions publiques (inter-entreprises) ou privées (intra-entreprise) pour tous les niveaux. Vous pouvez consulter nos programmes disponibles ou nous contacter pour une formation sur mesure. Toutes nos formations sont disponibles en classe virtuelle.

Modèles prédictifs, régressions linéaires, logistiques, PLS et ANCOVA

Utiliser XLSTAT pour développer des modèles prédictifs et bien plus dans Excel.

durée

4 jours
28 H

Prix

VOIR PLAQUETTE

Documents

arrow down

Cette formation s'adresse à des personnes souhaitant mettre en œuvre des méthodes de modélisation. Différents types de modélisation seront traités : Régression linéaire multiple, Modèle linéaire général type ANCOVA, Régression logistique (réponse binaire ou multimodale), Régression PLS. L’objectif de cette formation est de transmettre aux participants un savoir-faire méthodologique sur ces analyses : contexte et objectifs, conditions d’utilisation, mesure de la qualité des modèles, mise en œuvre et interprétation des résultats, …

Thèmes principaux :

  • Contexte et objectifs des différentes méthodes
  • Qualité d’ajustement et qualité d’estimation des coefficients du modèle (qualité de prédictions)
  • Régression linéaire
  • Régression pas à pas
  • Modèles linéaires généraux (ANCOVA…)
  • Régression logistique
  • Régression PLS
  • Problématique des multicolinéarités
  • Conditions d’utilisation des différentes méthodes

Prérequis

Il est nécessaire que les participants possèdent :

  • De bonnes connaissances sur les outils statistiques de base : statistiques descriptives, intervalles de confiance, p-value, risque alpha, tests d'hypothèses…
  • Quelques connaissances sur la corrélation et la régression linéaire

Programme :

Rappels sur les notions de corrélation

  • Définition du coefficient de corrélation
  • Interprétation de la valeur du coefficient de corrélation
  • Les confusions : corrélation, causalité, pente…
  • Les différents coefficients de corrélation
  • Coefficient de Pearson
  • Coefficient de Spearman

Modélisation de type régression linéaire simple

  • Principes et concepts mathématiques inhérents à la régression linéaire simple
  • Tests d’hypothèse de significativité du modèle
  • Qualité du modèle
  • Coefficient de détermination R², R² ajusté, R² Prev
  • Utilisation du modèle :
    • Prédiction de valeurs individuelles
    • Intervalles de confiance des prédictions
  • Traitement graphique des résultats
  • Principes et concepts mathématiques inhérents à la régression linéaire multiple
  • Inférence du modèle, inférence des variables (statistique de Fisher)
  • Analyse des résidus :
    • Calculs des résidus
    • Sens physique et statistique
    • Homogénéité
    • Distribution, Normalité
    • Valeurs suspectes
    • Analyses graphiques
  • Valeurs suspectes et points influents :
    • Résidus : résidus studentisés
    • Effet levier
    • Distance de Cook
  • Qualité du modèle :
    • Qualité d’ajustement, coefficient de détermination R², R² ajusté
    • Qualité de prédiction, erreur d’estimation
  • Utilisation du modèle :
    • Prédiction (prévision) de valeurs individuelles
    • Intervalles de confiance des prédictions (prévisions)
  • Illustration graphique des résultats

Le modèle de régression multiple

  • Significativité des coefficients
  • Hiérarchie des coefficients
  • Problèmes liés à la multicolinéarité
  • Mesures des colinéarités : 
    • Coefficient de corrélation
    • Facteurs d'Inflation de la Variance (VIF)
  • Résolution des problèmes de multicolinéarité

Analyse des problèmes de multicolinéarité à travers la sélection des variables

  • Détection de la colinéarité :
    • Effets nocifs de la colinéarité entre variables explicatives
    • Outils de détection : corrélation, VIF, cohérence des signes
  • Les solutions proposées :
    • Expérimentation structurée
    • Sélection de variables
    • PLS
  • Traitement de la colinéarité – Sélection de variables :
    • Sélection par optimisation. Critère du R², du R² ajusté, de l'AIC et du BIC
    • Algorithmes de sélection « pas à pas » : Forward selection, Backward selection, Stepwise regression

Mise en œuvre et interprétation des résultats d'une régression PLS 

  • Contexte et objectifs
  • Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
  • Principes et concepts mathématiques inhérents à la PCR et la régression PLS
  • Présentation des différentes versions de la régression PLS
  • Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
  • Choix du nombre de composantes (validation croisée)
  • Composantes et coefficients de régression
  • Qualité d’ajustement, qualité de prédiction
  • Coefficients Q² et R²
  • Importance des variables explicatives pour la prédiction :
    • Coefficients normalisés
    • VIP
  • Sélection de variables

Mise en œuvre et interprétation des résultats d'une ANCOVA (modèles linéaires généraux)

  • Contexte et objectifs
  • Notion d’interaction entre les variables explicatives qualitatives et quantitatives
  • Modèle à droites confondues
  • Modèle additif
  • Modèle complet
  • Mise en œuvre et interprétation des résultats des différents modèles
  • Lecture et utilisation du modèle
  • Tests de significativité des différents termes (F de Fisher)
  • Epuration du modèle (sélection des termes et des variables influents)
  • Conditions d’utilisation de l’ANCOVA

Modélisation de type régression logistique

  • Contexte et objectifs
  • Différences entre la régression linéaire et la régression logistique
  • Définition du modèle Logit
  • Mise en œuvre et interprétation des résultats 
  • Découpage en classes des variables explicatives quantitatives
  • Estimation et interprétation des coefficients du modèle
  • Tests d’apport d’une variable (test de Wald, tests sur les rapports de vraisemblance)
  • Interprétation du Khi² de Wald
  • Odds-ratios
  • Parallèle odds ratios et risques relatifs
  • Analyse du tableau de classement :
    • Taux de réussite, taux d’échec
    • Vrais positifs, vrais négatifs, faux positifs, faux négatifs
  • Probabilités ajustées et utilisation du modèle à des fins de prédiction
  • Conditions d’utilisation
     

Profils des formateurs


Thierry Anthouard

Formateur en statistique

thierry-anthouard-xlstat-trainer.jpg

Responsable de la filière statistique du groupe Arkesys et formateur en statistique, Thierry Anthouard est passionné depuis toujours par le domaine de la statistique. C’est en 1992 qu’il a lancé le développement de la filière formation statistique du Groupe Arkesys. Son approche pédagogique “par l’exemple” lui permet de vulgariser la statistique et de la rendre accessible à tous les apprenants. Consultant dédié à l’accompagnement de clients grands comptes, il s’adapte à tout type de contexte et de problématique d’apprentissage.

Jérôme-Philippe Garsi

Formateur en statistique

jerome-philippe-garsi-xlstat-trainer.jpg

Formateur en statistique, Jérôme-Philippe Garsi bénéficie d’une expérience de 13 ans dans le domaine de la formation. Depuis son doctorat sur des questions cliniques, ses travaux visent principalement l'intérêt des populations, leur santé et leur bien-être. A l'aise quel que soit le public, il fait de la pédagogie et de la vulgarisation des connaissances scientifiques un impératif. Pour cela, il fait toujours preuve du plus grand soin de clarté aussi bien dans ses documents écrits que dans ses présentations orales.