Mots clés |
Apprentissage de la structure, Séries temporelles cliniques, Dossiers patients informatisés, Processus gaussien, MIMIC-IV, COVID-19, PharmWAS |
Resumé |
Les dossiers patients informatisés (DPI) contiennent des données collectées dans les hôpitaux. Les DPI posent de multiples défis à l'apprentissage automatique. Nous nous intéressons aux aspects suivants : l'apprentissage à partir de séries temporelles échantillonnées de manière irrégulière et l'apprentissage de la structure de dépendances causale des modèles. Pour ce faire, nous nous sommes appuyés sur les processus gaussiens (GP) et des modèles causaux structurés (MCS). Notre première contribution a eu lieu dans le contexte de l'épidémie de COVID-19. Notre objectif était de générer des hypothèses pharmacologiques sans avoir besoin d'une connaissance a priori de la maladie. Nous avons développé le pipeline d'analyse Pharmacopeia-Wide Association Study (PharmWAS), qui recherche systématiquement des associations entre l'ensemble de la pharmacopée et un phénotype clinique. L'étude PharmWAS a mis en évidence la nécessité de développer des modèles d'apprentissage automatique adaptés qui tiennent compte de la nature dynamique des DPI et qui représentent de manière flexible la structure de dépendances au sein d'un graphe acyclique dirigé. Dans notre deuxième contribution, nous avons développé le modèle LPP-GP (latent patient pathways Gaussian process), un modèle interprétable et flexible pour l'apprentissage de dépendances entre les patients, et au sein de chaque patient entre les séries temporelles. Le modèle LPP-GP permet de découvrir des chemins latents dans une cohorte de patients. Le modèle LPP-GP permet un apprentissage par transfert interprétable et traçable entre les tâches et entre les patients. Enfin, constatant que l'ajout d'une simple contrainte sur les paramètres du modèle LPP-GP permettait de paramétrer un MCS dans le domaine des fréquences, nous avons développé le modèle StructGP, notre troisième contribution. Le modèle StructGP identifie un graphe de relations d'indépendance conditionnelle ordonnées entre des séries temporelles échantillonnées de manière irrégulière. Nous avons mis en oeuvre un algorithme d'apprentissage de la structure spectrale qui apprend le graphe à partir des observations et recouvre le véritable graphe avec une sensibilité élevée et une bonne précision. |