Mots clés |
Médecine pronostique, Oncologie, Analyse de survie, Modèles multi-états, Modèle illness-death, Analyse statistique, Intelligence artificielle, Apprentissage profond, Interprétabilité, Importance de variables |
Resumé |
Le pronostic des maladies en oncologie est d'une importance majeure pour la mise en place de stratégies thérapeutiques. Il nécessite l'utilisation d'algorithmes spécialisés pour l'estimation des risques d'évènements cliniques d'un patient sur la base de variables cliniques. Afin de modéliser ces derniers comme un processus d'évolution d'une maladie, les modèles multi-états considèrent chaque évènement clinique comme un "état" et le risque de survenue d'un évènement clinique comme une "transition" entre deux états. En particulier, le modèle à trois états illness-death est pertinent en oncologie car il prévoit de modéliser la progression d'une maladie vers un état intermédiaire de rechute et un état décès. Couramment appliqués à ces modèles, les modèles statistiques permettent d'obtenir des prédictions individualisées du pronostic d'un patient. Ils sont cependant soumis à des hypothèses statistiques qui ne sont pas toujours vérifiées. Les algorithmes d'apprentissage profond proposent plus de flexibilité et ont déjà démontré des résultats prometteurs en analyse de survie. Nous proposons la généralisation de ces approches pour les processus multi-états. Dans cette thèse, nous présentons une architecture d'apprentissage profond, IDNetwork (Illness-Death Network), permettant d'aborder la limitation des modèles statistiques dans le cadre d'un processus illness-death. Nous présentons également l'architecture MSnet (Multi-State network) pour la généralisation à tout processus multi-états progressif. Bien que ces algorithmes aient montré des résultats prometteurs sur des données cliniques, l'interprétation de leurs prédictions est difficile en raison de leur effet "boîte noire''. Cependant, l'acceptabilité par les médecins et les autorités de santé exigent une interprétatibilité de ces algorithmes pour leur utilisation en pratique. Nous proposons donc un nouvel algorithme, MS-CPFI (Multi-State Counterfactual Perturbation Feature Importance), permettant d'interpréter l'effet de chacune des variables sur les risques de transition. Les résultats obtenus sur des données de patientes avec un cancer du sein confirment les résultats prometteurs d'IDNetwork et de MS-CPFI pour évaluer le pronostic de patients en oncologie et identifier les facteurs de risques individuels. |