These Descartes

Revenir au résultat de la recherche

Structuring medical image collections : clinical trial MRI database curation and self-supervised multi-image representation learning

Structuration de bases d'images médicales : curation de bases de donnée IRM d'essais cliniques et apprentissage auto-supervisé de représentations

par Thibault SAURON sous la direction de Florence CLOPPET et de Camille KURTZ
Thèse de doctorat en Traitement du signal et des images
ED 130 Informatique, Télécommunications et Electronique

Soutenue le mercredi 04 décembre 2024 à Université Paris Cité

Sujets

Apprentissage profond
Bases de données
Curation de données
Imagerie médicale
Imagerie par résonance magnétique

Texte integral en version complète PDF

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais

Description en français

Mots clés	Apprentissage profond, Apprentissage de représentation, Apprentissage auto supervisé, Apprentissage contrastif, Recherche par le contenu, Indexation, Structuration, Images médicales, Irm
Resumé	Cette thèse de doctorat porte sur le thème de la structuration des bases de données d'images radiologiques, avec un accent mis sur les techniques d'imagerie multi-séquences, principalement l'Imagerie par Résonance Magnétique (IRM). La structuration de bases de données médicales fait référence à un ensemble de méthodes visant à rendre les données d'imagerie et les données cliniques plus facilement disponibles / manipulables pour les radiologues et les algorithmes de vision par ordinateur. Dans cette thèse, nous explorons deux niveaux de structuration des bases de données d'images radiologiques : A partir de bases de données d'imagerie liées à des examens de routine ou à des essais cliniques, un premier niveau correspond à la structuration de ces bases de données pour les rendre compatibles avec des algorithmes d'intelligence artificielle/de vision par ordinateur. Notre objectif est de simplifier la réutilisation des données par une curation automatisée des données d'imagerie clinique. Cette étape est particulièrement pertinente pour les bases de données médicales, car elles sont difficiles à annoter en raison des préoccupations liées à la protection de la vie privée des patients et de l'expertise requise pour créer de telles annotations. Les bases de données d'images médicales sont donc beaucoup plus petites que les bases de données d'images naturelles. Cependant, les bases de données médicales sont souvent compilées pour des essais cliniques et l'annotation fait partie de la routine clinique, ce qui fait de la réutilisation des données une source prometteuse de données pour les algorithmes d'apprentissage profond. Nous nous concentrons sur une étude de cas impliquant l'étude de cohorte prospective multicentrique O-RADS (Ovarian-Adnexal Reporting Data System). À partir des données originales, nous détaillons et motivons les choix de curation et d'anonymisation à partir de méthodes de pointe et de législations telles que le RGPD et l'HIPAA. Nous développons également des logiciels facilement extensibles et configurables et les rendons disponibles en tant qu'outils open-source. L'autre niveau de structuration, au niveau des images radiologiques elles-mêmes, correspond au développement de nouvelles représentations des données, au-delà de la structuration classique pixel/voxel, facilitant les tâches de vision médicale par ordinateur. Notre objectif est d'apprendre des représentations visuelles robustes à l'aide de réseaux de neurones en utilisant des annotations minimales pour permettre l'exploration des bases de données par l'indexation. L'utilisation de réseaux de neurones pour l'indexation d'images permettrait d'explorer facilement des ensembles de données médicales par le biais d'une recherche basée sur le contenu visuel, permettant d'utiliser une image comme une requête à une base de données pour rechercher des images similaires. L'apprentissage auto-supervisé des représentations est un domaine d'étude relativement récent qui se concentre sur l'optimisation des réseaux neuronaux décorrélés de toute tâche finale. Il est souvent utilisé comme étape de pré-entraînement comme une alternative plus performante à la réutilisation d'un réseau avec des poids optimisés sur ImageNet. Parmi toutes les méthodes d'apprentissage de représentation auto-supervisées, nous avons décidé de nous concentrer sur les méthodes d'apprentissage contrastif car elles sont bien adaptées à l'apprentissage multimodal. Nous développons une nouvelle méthode d'apprentissage contrastif et évaluons ses performances sur deux jeux de données, un jeu de données standard de segmentation de tumeurs cérébrales (BRATS) et le jeu de données que nous avons créé lors de la première étape. Nous rapportons les performances sur l'évaluation de la sonde linéaire, comme c'est la norme dans l'apprentissage de représentation auto-supervisé, mais nous explorons également des méthodes quantitatives et qualitatives pour l'évaluation du requêtage par l'image de ces bases.

Mots clés

Apprentissage profond, Apprentissage de représentation, Apprentissage auto supervisé, Apprentissage contrastif, Recherche par le contenu, Indexation, Structuration, Images médicales, Irm

Resumé

Cette thèse de doctorat porte sur le thème de la structuration des bases de données d'images radiologiques, avec un accent mis sur les techniques d'imagerie multi-séquences, principalement l'Imagerie par Résonance Magnétique (IRM). La structuration de bases de données médicales fait référence à un ensemble de méthodes visant à rendre les données d'imagerie et les données cliniques plus facilement disponibles / manipulables pour les radiologues et les algorithmes de vision par ordinateur. Dans cette thèse, nous explorons deux niveaux de structuration des bases de données d'images radiologiques : A partir de bases de données d'imagerie liées à des examens de routine ou à des essais cliniques, un premier niveau correspond à la structuration de ces bases de données pour les rendre compatibles avec des algorithmes d'intelligence artificielle/de vision par ordinateur. Notre objectif est de simplifier la réutilisation des données par une curation automatisée des données d'imagerie clinique. Cette étape est particulièrement pertinente pour les bases de données médicales, car elles sont difficiles à annoter en raison des préoccupations liées à la protection de la vie privée des patients et de l'expertise requise pour créer de telles annotations. Les bases de données d'images médicales sont donc beaucoup plus petites que les bases de données d'images naturelles. Cependant, les bases de données médicales sont souvent compilées pour des essais cliniques et l'annotation fait partie de la routine clinique, ce qui fait de la réutilisation des données une source prometteuse de données pour les algorithmes d'apprentissage profond. Nous nous concentrons sur une étude de cas impliquant l'étude de cohorte prospective multicentrique O-RADS (Ovarian-Adnexal Reporting Data System). À partir des données originales, nous détaillons et motivons les choix de curation et d'anonymisation à partir de méthodes de pointe et de législations telles que le RGPD et l'HIPAA. Nous développons également des logiciels facilement extensibles et configurables et les rendons disponibles en tant qu'outils open-source. L'autre niveau de structuration, au niveau des images radiologiques elles-mêmes, correspond au développement de nouvelles représentations des données, au-delà de la structuration classique pixel/voxel, facilitant les tâches de vision médicale par ordinateur. Notre objectif est d'apprendre des représentations visuelles robustes à l'aide de réseaux de neurones en utilisant des annotations minimales pour permettre l'exploration des bases de données par l'indexation. L'utilisation de réseaux de neurones pour l'indexation d'images permettrait d'explorer facilement des ensembles de données médicales par le biais d'une recherche basée sur le contenu visuel, permettant d'utiliser une image comme une requête à une base de données pour rechercher des images similaires. L'apprentissage auto-supervisé des représentations est un domaine d'étude relativement récent qui se concentre sur l'optimisation des réseaux neuronaux décorrélés de toute tâche finale. Il est souvent utilisé comme étape de pré-entraînement comme une alternative plus performante à la réutilisation d'un réseau avec des poids optimisés sur ImageNet. Parmi toutes les méthodes d'apprentissage de représentation auto-supervisées, nous avons décidé de nous concentrer sur les méthodes d'apprentissage contrastif car elles sont bien adaptées à l'apprentissage multimodal. Nous développons une nouvelle méthode d'apprentissage contrastif et évaluons ses performances sur deux jeux de données, un jeu de données standard de segmentation de tumeurs cérébrales (BRATS) et le jeu de données que nous avons créé lors de la première étape. Nous rapportons les performances sur l'évaluation de la sonde linéaire, comme c'est la norme dans l'apprentissage de représentation auto-supervisé, mais nous explorons également des méthodes quantitatives et qualitatives pour l'évaluation du requêtage par l'image de ces bases.