| Mots clés |
Apprentissage profond, Apprentissage de représentation, Apprentissage auto supervisé, Apprentissage contrastif, Recherche par le contenu, Indexation, Structuration, Images médicales, Irm |
| Resumé |
Cette thèse de doctorat porte sur le thème de la structuration des bases de données d'images radiologiques, avec un accent mis sur les techniques d'imagerie multi-séquences, principalement l'Imagerie par Résonance Magnétique (IRM). La structuration de bases de données médicales fait référence à un ensemble de méthodes visant à rendre les données d'imagerie et les données cliniques plus facilement disponibles / manipulables pour les radiologues et les algorithmes de vision par ordinateur. Dans cette thèse, nous explorons deux niveaux de structuration des bases de données d'images radiologiques : A partir de bases de données d'imagerie liées à des examens de routine ou à des essais cliniques, un premier niveau correspond à la structuration de ces bases de données pour les rendre compatibles avec des algorithmes d'intelligence artificielle/de vision par ordinateur. Notre objectif est de simplifier la réutilisation des données par une curation automatisée des données d'imagerie clinique. Cette étape est particulièrement pertinente pour les bases de données médicales, car elles sont difficiles à annoter en raison des préoccupations liées à la protection de la vie privée des patients et de l'expertise requise pour créer de telles annotations. Les bases de données d'images médicales sont donc beaucoup plus petites que les bases de données d'images naturelles. Cependant, les bases de données médicales sont souvent compilées pour des essais cliniques et l'annotation fait partie de la routine clinique, ce qui fait de la réutilisation des données une source prometteuse de données pour les algorithmes d'apprentissage profond. Nous nous concentrons sur une étude de cas impliquant l'étude de cohorte prospective multicentrique O-RADS (Ovarian-Adnexal Reporting Data System). À partir des données originales, nous détaillons et motivons les choix de curation et d'anonymisation à partir de méthodes de pointe et de législations telles que le RGPD et l'HIPAA. Nous développons également des logiciels facilement extensibles et configurables et les rendons disponibles en tant qu'outils open-source. L'autre niveau de structuration, au niveau des images radiologiques elles-mêmes, correspond au développement de nouvelles représentations des données, au-delà de la structuration classique pixel/voxel, facilitant les tâches de vision médicale par ordinateur. Notre objectif est d'apprendre des représentations visuelles robustes à l'aide de réseaux de neurones en utilisant des annotations minimales pour permettre l'exploration des bases de données par l'indexation. L'utilisation de réseaux de neurones pour l'indexation d'images permettrait d'explorer facilement des ensembles de données médicales par le biais d'une recherche basée sur le contenu visuel, permettant d'utiliser une image comme une requête à une base de données pour rechercher des images similaires. L'apprentissage auto-supervisé des représentations est un domaine d'étude relativement récent qui se concentre sur l'optimisation des réseaux neuronaux décorrélés de toute tâche finale. Il est souvent utilisé comme étape de pré-entraînement comme une alternative plus performante à la réutilisation d'un réseau avec des poids optimisés sur ImageNet. Parmi toutes les méthodes d'apprentissage de représentation auto-supervisées, nous avons décidé de nous concentrer sur les méthodes d'apprentissage contrastif car elles sont bien adaptées à l'apprentissage multimodal. Nous développons une nouvelle méthode d'apprentissage contrastif et évaluons ses performances sur deux jeux de données, un jeu de données standard de segmentation de tumeurs cérébrales (BRATS) et le jeu de données que nous avons créé lors de la première étape. Nous rapportons les performances sur l'évaluation de la sonde linéaire, comme c'est la norme dans l'apprentissage de représentation auto-supervisé, mais nous explorons également des méthodes quantitatives et qualitatives pour l'évaluation du requêtage par l'image de ces bases. |