Régression de Deming

Deming (1943) a développé une méthode de régression qui permet de comparer deux méthodes de mesure X et Y. La régression de Deming suppose que l'erreur de mesure soit présente aussi bien dans X et dans Y et s’affranchit des hypothèses lourdes et ici inappropriées de la régression linéaire simple classique. Pour rappel ces hypothèses sont :

  • la variable explicative, X dans le modèle y(i)=a+b.x(i)+e(i), est déterministe (pas d’erreur de mesure),la variable Y suit une loi normale de moyenne aX,
  • la variance de l’erreur est constante.
  • Par ailleurs, les valeurs extrêmes peuvent fortement pénaliser ou influencer le modèle.

Deming a proposé une méthode qui permet de s’affranchir de ces hypothèses : les deux variables sont supposées comme comportant une part d’aléatoire (représentant l’erreur de mesure). On pose alors :

  • y(i)=y(i)* + e(i)
  • x(i)=x(i)* + η(i)

On suppose que les variables (y(i), x(i)) sont des mesures non exactes des vraies valeurs (y(i)*, x(i)*) avec des termes d’erreur indépendants. On suppose néanmoins que le rapport des variances est connu :

  • d=s2(η)/s2(e)

XLSTAT vous permet de fixer les variances des erreurs de mesures sur X et Y.

On recherche alors la droite permettant le « meilleur ajustement » y* = a + b x*, de manière à ce que la somme des carrés des résidus du modèle soit minimisée.

La méthode de Deming permet de calculer les coefficients a et b, ainsi qu’un intervalle de confiance autour de ces valeurs. L’étude de ces valeurs permet de comparer les méthodes. Si elles sont très proches, on aura naturellement b proche de 1 et a proche de 0.

La régression de Deming peut prendre deux formes :

  • La régression simple de Deming : Les termes d’erreur sont constants et l’estimation des paramètres est très simple grâce à une formule directe (Deming, 1943).
  • La régression pondérée de Deming : Dans ce cas, on suppose que les erreurs sont proportionnelles. Cette option est moins contraignante que la précédente. L’estimation des coefficients est faite à l’aide d’un algorithme itératif (Linnet, 1990).

Les intervalles de confiance pour la constante et le coefficient de pente sont complexes à obtenir. XLSTAT utilise le jackknife afin de les calculer comme indiqué dans Linnet (1993).