Mots clés |
Chimiothérapie, Dossier Patient Informatisé (DPI), Ontologie, Analyse de survie, Traitement Automatique des Langues (TAL) |
Resumé |
La chimiothérapie est le traitement prédominant pour soigner les cancers. C'est un traitement complexe au cours duquel des molécules cytotoxiques sont administrées au patient pour cibler les cellules cancéreuses et réduire la taille des tumeurs. Cependant, la réponse des patients à ces traitements varie considérablement, et l'administration de ces molécules entraîne souvent des toxicités de gravité variable. Mieux comprendre et gérer ces réponses individuelles est un sujet de recherche majeur en oncologie. Ainsi, extraire les informations sur les toxicités et évaluer l'efficacité du traitement sont des étapes essentielles dans les études qui visent à améliorer et personnaliser le traitement des cancers. L'objectif de cette thèse est d'exploiter les données hospitalières afin d'extraire, représenter et prédire les réponses aux chimiothérapies. Les informations individuelles sur les chimiothérapies suivies et leurs réponses sont disponibles dans les entrepôts de données hospitaliers, mais leur extraction présente plusieurs obstacles. Celle-ci sont irrégulièrement réparties et structurées dans des source hétérogènes, telles que des questionnaires, les données de suivi des chimiothérapies et des comptes rendus. De plus, les chimiothérapies suivent des protocoles complexes incluant les notions de cycles, lignes de traitement, de changements de doses et de temps d'administration qui ne sont pas facilement manipulables avec les entrepôts de données classiques.Pour répondre à ces défis, nous avons développé deux ontologies : ChemoOnto et OntoTox. ChemoOnto est une ontologie dédiée à la représentation du cours des chimiothérapies, en intégrant à la fois les protocoles théoriques et les lignes de traitement suivies par les patients. Elle réutilise des ontologies de référence pour représenter la temporalité et les médicaments. OntoTox, quant à elle, représente les toxicités induites par les chimiothérapies et leurs sévérité, extraites à partir de diverses parties d'un entrepôt de données hospitalier. OntoTox normalise ces toxicités en utilisant des thésaurus médicaux standardisés. Les deux ontologies ont été peuplées avec des données réelles, constituant ainsi deux bases de connaissances qui facilitent l'analyse de données sur les chimiothérapies et les réponses à ces traitements. Ces ressources ont été implémentées avec les outils du web sémantique qui permettent de surmonter certaines limites des entrepôts de données traditionnels en offrant une représentation standard et extensible des connaissances biomédicales. En parallèle, nous avons développé ProtoDrift, une métrique pour mesurer l'adhésion aux chimiothérapies. ProtoDrift évalue l'écart entre le protocole de chimiothérapie théoriquement suivi et le traitement effectivement suivi par un patient, en prenant en compte les décalages de jours d'administration et les réductions de doses. Cette métrique utilise une moyenne pondérée des dissimilarités à plusieurs niveaux (administration, molécule, cycle, ligne de traitement). L'optimisation des poids de ProtoDrift par des régression logistique ou de Cox montrent une amélioration significative des prédictions de survie par rapport à la méthode classique de mesure de l'adhésion aux chimiothérapies, la dose intensité relative. Ces résultats ont été reproduits dans deux hôpitaux différents, confirmant la robustesse et la pertinence de ProtoDrift pour évaluer l'adhésion aux chimiothérapies. Cette reproductibilité a notamment été facilitée par ChemoOnto que nous avons utilisé comme représentation standard pour calculer ProtoDrift. Les ontologies ChemoOnto et OntoTox, ainsi que la métrique ProtoDrift offrent des perspectives prometteuses pour la recherche en oncologie. Elles facilitent la considération de données médicales complexes et permettent une analyse plus fine des réponses aux chimiothérapies. De plus, ces ressources ont été développées en suivant les principes et bonnes pratiques de la sciences ouverte. |