These Descartes

Revenir au résultat de la recherche

Développement et interprétation d'un algorithme d'apprentissage profond pour l'analyse d'un modèle multi-états : application à l'oncologie

Development and interpretation of a deep learning algorithm for multi-state models : application to oncology

par Aziliz COTTIN sous la direction de Sandrine KATSAHIAN et de Agathe GUILLOUX
Thèse de doctorat en Biostatistique et biomathématiques
ED 393 École doctorale Pierre Louis de santé publique : épidémiologie et sciences de l'information biomédicale

Soutenue le mardi 05 mars 2024 à Université Paris Cité

Sujets

Analyse de survie (biométrie)
Apprentissage profond
Cancérologie
Intelligence artificielle en médecine
Pronostic (médecine)

Le texte intégral n’est pas librement disponible sur le web

Vous pouvez accéder au texte intégral de la thèse en vous authentifiant à l’aide des identifiants ENT d’Université Paris Cité, si vous en êtes membre, ou en demandant un accès extérieur, si vous pouvez justifier de de votre appartenance à un établissement français chargé d’une mission d’enseignement supérieur ou de recherche

Se connecter ou demander un accès au texte intégral

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

Theses.fr

Description en anglais

Description en français

Mots clés	Médecine pronostique, Oncologie, Analyse de survie, Modèles multi-états, Modèle illness-death, Analyse statistique, Intelligence artificielle, Apprentissage profond, Interprétabilité, Importance de variables
Resumé	Le pronostic des maladies en oncologie est d'une importance majeure pour la mise en place de stratégies thérapeutiques. Il nécessite l'utilisation d'algorithmes spécialisés pour l'estimation des risques d'évènements cliniques d'un patient sur la base de variables cliniques. Afin de modéliser ces derniers comme un processus d'évolution d'une maladie, les modèles multi-états considèrent chaque évènement clinique comme un "état" et le risque de survenue d'un évènement clinique comme une "transition" entre deux états. En particulier, le modèle à trois états illness-death est pertinent en oncologie car il prévoit de modéliser la progression d'une maladie vers un état intermédiaire de rechute et un état décès. Couramment appliqués à ces modèles, les modèles statistiques permettent d'obtenir des prédictions individualisées du pronostic d'un patient. Ils sont cependant soumis à des hypothèses statistiques qui ne sont pas toujours vérifiées. Les algorithmes d'apprentissage profond proposent plus de flexibilité et ont déjà démontré des résultats prometteurs en analyse de survie. Nous proposons la généralisation de ces approches pour les processus multi-états. Dans cette thèse, nous présentons une architecture d'apprentissage profond, IDNetwork (Illness-Death Network), permettant d'aborder la limitation des modèles statistiques dans le cadre d'un processus illness-death. Nous présentons également l'architecture MSnet (Multi-State network) pour la généralisation à tout processus multi-états progressif. Bien que ces algorithmes aient montré des résultats prometteurs sur des données cliniques, l'interprétation de leurs prédictions est difficile en raison de leur effet "boîte noire''. Cependant, l'acceptabilité par les médecins et les autorités de santé exigent une interprétatibilité de ces algorithmes pour leur utilisation en pratique. Nous proposons donc un nouvel algorithme, MS-CPFI (Multi-State Counterfactual Perturbation Feature Importance), permettant d'interpréter l'effet de chacune des variables sur les risques de transition. Les résultats obtenus sur des données de patientes avec un cancer du sein confirment les résultats prometteurs d'IDNetwork et de MS-CPFI pour évaluer le pronostic de patients en oncologie et identifier les facteurs de risques individuels.

Mots clés

Médecine pronostique, Oncologie, Analyse de survie, Modèles multi-états, Modèle illness-death, Analyse statistique, Intelligence artificielle, Apprentissage profond, Interprétabilité, Importance de variables

Resumé

Le pronostic des maladies en oncologie est d'une importance majeure pour la mise en place de stratégies thérapeutiques. Il nécessite l'utilisation d'algorithmes spécialisés pour l'estimation des risques d'évènements cliniques d'un patient sur la base de variables cliniques. Afin de modéliser ces derniers comme un processus d'évolution d'une maladie, les modèles multi-états considèrent chaque évènement clinique comme un "état" et le risque de survenue d'un évènement clinique comme une "transition" entre deux états. En particulier, le modèle à trois états illness-death est pertinent en oncologie car il prévoit de modéliser la progression d'une maladie vers un état intermédiaire de rechute et un état décès. Couramment appliqués à ces modèles, les modèles statistiques permettent d'obtenir des prédictions individualisées du pronostic d'un patient. Ils sont cependant soumis à des hypothèses statistiques qui ne sont pas toujours vérifiées. Les algorithmes d'apprentissage profond proposent plus de flexibilité et ont déjà démontré des résultats prometteurs en analyse de survie. Nous proposons la généralisation de ces approches pour les processus multi-états. Dans cette thèse, nous présentons une architecture d'apprentissage profond, IDNetwork (Illness-Death Network), permettant d'aborder la limitation des modèles statistiques dans le cadre d'un processus illness-death. Nous présentons également l'architecture MSnet (Multi-State network) pour la généralisation à tout processus multi-états progressif. Bien que ces algorithmes aient montré des résultats prometteurs sur des données cliniques, l'interprétation de leurs prédictions est difficile en raison de leur effet "boîte noire''. Cependant, l'acceptabilité par les médecins et les autorités de santé exigent une interprétatibilité de ces algorithmes pour leur utilisation en pratique. Nous proposons donc un nouvel algorithme, MS-CPFI (Multi-State Counterfactual Perturbation Feature Importance), permettant d'interpréter l'effet de chacune des variables sur les risques de transition. Les résultats obtenus sur des données de patientes avec un cancer du sein confirment les résultats prometteurs d'IDNetwork et de MS-CPFI pour évaluer le pronostic de patients en oncologie et identifier les facteurs de risques individuels.