Test d'équivalence (TOST)

Les tests d'équivalence servent à la différence des tests d'hypothèse à valider le fait qu'une différence se trouve dans un intervalle donné.

Ce type de test est surtout utilisé pour valider la bioéquivalence. Ainsi, lorsque qu'on veut montrer l'équivalence entre deux médicaments, les tests d'hypothèse classiques ne s'appliquent pas, on utilisera alors des tests d'équivalence qui permettront de valider l'équivalence entre les deux médicaments.
Dans le cadre d'un test d'hypothèse classique, on cherche à rejeter l'hypothèse nulle d'égalité. Dans le cadre d'un test d'équivalence, on cherche à valider l'équivalence entre deux échantillons. Le TOST (two one-sided test) est un test d'équivalence qui se base sur le test t classique utilisé pour tester l'hypothèse d'égalité entre deux moyennes.

On va donc avoir 2 échantillons, une différence théorique entre les moyennes ainsi qu'un intervalle dans lequel on pourra dire que les moyennes des échantillons sont équivalentes.
Le test TOST est dit paramétrique car il suppose que les échantillons sont distribués suivant des lois normales. Cette hypothèse pourra être testée à l'aide des tests de normalité.
Le test TOST utilise des tests de Student afin de vérifier l'équivalence entre les moyennes de deux échantillons. Une description détaillée de ces tests peut être trouvée dans le chapitre qui leur est consacré.

XLSTAT propose deux méthodes alternatives afin de tester l'équivalence à l'aide du test TOST.

  • Utilisation de l'intervalle confiance à 100*(1-2*alpha)% autour de la moyenne. En comparant cet intervalle à l'intervalle d'équivalence défini par l'utilisateur, on peut conclure à l'équivalence ou à la non-équivalence. Ainsi, si l'intervalle de confiance est compris dans l'intervalle défini par l'utilisateur, on conclut à l'équivalence entre les deux échantillons. Si l'une des bornes de l'intervalle de confiance se trouve à l'extérieur de l'intervalle défini par l'utilisateur, alors les deux échantillons ne sont pas équivalents.
  • Utilisation de deux tests unilatéraux à droite et à gauche. Ainsi on applique un test t unilatéral à droite sur la borne inférieure de l'intervalle défini par l'utilisateur et un test unilatéral à gauche sur la borne supérieure de l'intervalle défini par l'utilisateur. On obtient ainsi des p-valeurs pour les deux tests. On prendra la plus grande de ces p-valeurs comme p-valeur du test d'équivalence.

Ces deux tests sont similaires et doivent donner des résultats concordants. Ils ont été introduits par Schuirman's (1987).