Modélisation conjointe de la dynamique de biomarqueurs et de données de survie à risques compétitifs : développements et applications aux maladies infectieuses sévères
Joint modeling of biomarker dynamics and survival with competing risks : developments and applications on severe infectious diseases
par Alexandra LAVALLEY-MORELLE sous la direction de France MENTRÉ
Thèse de doctorat en Biostatistiques et biomathématiques
ED 393 École doctorale Pierre Louis de santé publique : épidémiologie et sciences de l'information biomédicale

Soutenue le lundi 13 novembre 2023 à Université Paris Cité

Sujets
  • Approximation stochastique
  • Maladies infectieuses
  • Marqueurs biologiques
  • Modèles non linéaires (statistique)

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04902080 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Modélisation conjointe, Modèles non-linéaires à effets-mixtes, Analyse de survie, Risques compétitifs, Algorithme SAEM, Prédictions dynamiques, Maladies infectieuses sévères
Resumé
Aujourd'hui, les hôpitaux sont équipés de systèmes d'information qui enregistrent quotidiennement les résultats d'analyses biologiques prescrites par les médecins. Ces observations biologiques longitudinales représentent une grande quantité d'information qui peut être utilisée dans un modèle joint pour prédire le pronostic du patient de façon dynamique, et ainsi guider les décisions thérapeutiques ou prévoir les besoins des hôpitaux. Les modèles joints proposés dans la littérature impliquent généralement un modèle linéaire à effets mixtes décrivant l'évolution d'un unique biomarqueur, et un modèle de survie décrivant le risque instantané de décès, en considérant la sortie de l'hôpital comme évènement en compétition. Cependant, les biomarqueurs ont souvent une dynamique non-linéaire qui n'est pas optimalement capturée par des modèles linéaires. Pour répondre à cette question, nous nous sommes intéressés au pronostique des patients admis en réanimation pour sepsis, dont le score Sequential Organ Failure Assessment (SOFA) était évalué chaque jour jusqu'au décès ou à la sortie de réanimation. Nous avons combiné un modèle non-linéaire à effets mixtes pour décrire l'évolution du SOFA et un modèle de survie à risques compétitifs pour modéliser le risque de décès à l'hôpital, en prenant en compte la sortie comme évènement en compétition. Dans le modèle de survie, une approche par risques de sous-distribution, communément distinguée de l'approche cause-spécifique, a été employée. Nous avons montré la capacité de l'algorithme Stochastic Approximation Expectation Maximization (SAEM) implémenté dans le logiciel Monolix à fournir des estimations non biaisées des paramètres d'un tel modèle. D'autre part, le fait de passer d'un seul biomarqueur à des centaines pourrait certainement améliorer les performances prédictives, mais poserait également des problèmes statistiques. Certains auteurs ont décrit des problèmes computationnels et d'identifiabilité dus au nombre élevé d'effets aléatoires lorsque de multiples modèles longitudinaux sont estimés conjointement avec un modèle de survie. Cela explique probablement pourquoi les modèles publiés se limitent souvent à des modèles longitudinaux comportant au maximum deux biomarqueurs et souligne la nécessité de disposer de méthodes de sélection dans ce contexte. C'est dans ce cadre que le deuxième projet de cette thèse s'est intéressé au pronostic des patients hospitalisés pour infection au SARS-CoV-2, avec un suivi de 59 biomarqueurs jusqu'au décès ou à la sortie d'hospitalisation. Une stratégie de sélection a été appliquée pour construire un modèle joint multivarié prédictif du risque de décès des patients. L'algorithme SAEM de Monolix et la stratégie de sélection ont démontré de bonnes propriétés dans ce cadre plus complexe. Dans ces deux projets, nous avons quantifié, par des approches de prédictions dynamiques individuelles, le bénéfice du suivi des biomarqueurs pour améliorer le pronostic des patients. Finalement dans un dernier projet, nous avons fait le constat que les outils disponibles pour estimer des modèles joints non-linéaires étaient presque exclusivement disponibles dans des logiciels issus de la pharmacométrie. Pour diffuser l'utilisation de ces méthodes, nous avons étendu le package R saemix, initialement dédié aux modèles non-linéaires à effets mixtes, au cas des modèles à réponses multiples et joints. Des modèles joints très spécifiques peuvent être estimés, l'utilisateur définissant lui-même la vraisemblance du modèle. Une étude de simulation a démontré de bonnes performances d'estimation des paramètres et de leur incertitude. Ces travaux ouvrent la voie au développement de modèles conjoints sophistiqués.