Comment faire une analyse d’un modèle à risques proportionnels de Cox avec XLSTAT-Life ?
Le modèle de régression de Cox est une méthode utile lorsqu’on veut déterminer l’impact de variables explicatives sur le temps de survie d’un patient. Il s’applique à des données de survie, c’est-à-dire une variable temps, une variable de censure (variable binaire) et des variables explicatives. Ce modèle est basé sur une estimation par maximum de vraisemblance dite partielle développée par Cox (1972).
Nous illustrons l’application du modèle de Cox (aussi appelé modèle à risques proportionnels) sur des données provenant du livre de J.D. Kalbfleisch et R.L. Prentice (The Statistical Analysis of Failure Time Data, Wiley, 2002, p. 119) sur les cancers du poumon. La variable daysurv représente le temps de survie, la variable censoring est une variable binaire de censure (0 : données censurées, 1 : mort du patient). Les variables explicatives sont le niveau de performance du patient au début de l’étude (perfstatus), le nombre de mois depuis le diagnostic au début de l’étude, l’âge du patient au début de l’étude, le fait d’avoir suivi un traitement avant le traitement actuel.
Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.
Notre but est de déterminer l’impact d’un certain nombre de variables explicatives sur le temps de survie des patients.
Pour activer la boîte de dialogue du modèle de Cox, lancez XLSTAT, puis sélectionnez la commande XLSTAT/XLSTAT-Life/Modèle de Cox, ou cliquez sur le bouton équivalent de la barre d'outils XLSTAT-Life.

Sélectionner les données de dates (daysurv), l’indicateur d’état (censoring) et comme variables explicatives l’ensemble des autres variables :

Les autres onglets de la boîte dialogue permettent de paramétrer l’estimation et les sorties.
Ainsi, on peut choisir quelle méthode on désire utiliser afin de :
- prendre en compte les égalités (méthode de Breslow ou d’Efron),
- paramétrer les critères de convergence,
- faire de la sélection de variable (ascendante ou descendante),
- supprimer les données manquantes (il faut que les données de dates et de censure soient complètes).
Une fois que vous avez cliqué sur le bouton "OK", les calculs commencent puis les résultats sont affichés.
Des statistiques générales sont d’abord affichées :

Nous voyons que le nombre de temps distincts est différent du nombre d’observations. Il faut donc utiliser une méthode afin de prendre en charge les temps égaux. Nous utilisons la méthode de Breslow (il est possible d’utiliser aussi la méthode d’Efron).
Puis des statistiques descriptives sur les variables explicatives sont affichées :

Les deux tableaux suivant résument les indices de qualité du modèle, le premier en les comparant au modèle indépendant (c’est-à-dire sans impact des variables explicatives) et le second donne des statistiques importantes dans le cadre de l’analyse d’un modèle de Cox (la statistique du rapport de vraisemblance, la statistique de Wald et celle du score).

L’ensemble des statistiques sont significatives et nous pouvons donc conclure que le fait de prendre en compte des variables explicatives apporte une information supplémentaire significative.
Le tableau suivant est un tableau classique de modèle de régression avec en supplément le rapport de risque.

Nous voyons que la seule variable qui a un impact significatif est la variable perfstatus. C’est la seule variable qui permet d’expliquer la durée de survie des patients. Le coefficient classique est difficile à interpréter. C’est le rapport de risque qui nous intéressera (c’est l’exponentielle du coefficient).
Finalement la fonction de survie cumulée est affichée en prenant en compte les variables explicatives.

Cette petite étude nous amène donc à un certain nombre de conclusions. Nous avons vu que le niveau de performance du patient au début de l’étude est le seul facteur ayant un impact significatif sur le temps de survie. Le coefficient associé étant négatif, nous pourrons dire que plus un patient aura un niveau de performance faible, plus son temps de survie sera grand. Les autres facteurs n’ont pas un impact significatif sur le temps de survie.
D’autres fonctions sont présentes dans XLSTAT-Life tel que l’inclusion de strates, l’affichage de la fonction de risque à la moyenne des variables explicatives, ainsi que l’affichage et la représentation graphique des résidus de déviance, de martingale, de Schoenfeld et du score. Ces fonctions permettront d’effectuer des analyses plus poussées comme la vérification de l’hypothèse de risques proportionnels.
Cliquez ici pour accéder à d'autres tutoriels.