Bayesian deep learning for weak lensing analyses : overlapping galaxies separation and galaxy parameters estimation from blended scenes
Apprentissage profond bayésien pour les analyses de lentillage faible : séparation de galaxies se recouvrant et estimation de paramètres des galaxies à partir de sources superposées
par Bastien ARCELIN sous la direction de Éric AUBOURG
Thèse de doctorat en Physique de l'Univers
ED 560 Sciences de la terre et de l'environnement et physique de l'univers, Paris

Soutenue le lundi 20 septembre 2021 à Université Paris Cité

Sujets
  • Analyse des données
  • Apprentissage profond
  • Cosmologie
  • Énergie sombre (astronomie)
  • Euclid
  • Lentilles gravitationnelles
  • Statistique bayésienne
  • Traitement d'images

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

TEL (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Relevés de galaxies, Lentillage faible, Apprentissage profond bayésien, Traitement de données astronomiques, LSST
Resumé
Le lentillage gravitationnel faible est l'une des sondes cosmologiques les plus prometteuses pour contraindre les paramètres de l'énergie noire. Il correspond à la modification de l'image d'une source, induite par la courbure de l'espace-temps, et donc du passage des rayons lumineux, générée par la présence de masse le long de la ligne de visée. Cet effet est très faible et ne peut être détecté qu'en mesurant la corrélation des formes d'un ensemble de sources en arrière-plan. La valeur de cette corrélation donne la mesure du cisaillement gravitationnel. Plusieurs relevés dédiés à son étude vont bientôt démarrer, tels que le Vera Rubin Legacy Survey of Space and Time (LSST), et Euclid. Ces relevés ont été construits avec des exigences particulières, notamment sur le traitement des erreurs systématiques, afin d'atteindre une précision extrême sur les paramètres de l'équation d'état de l'énergie noire. Cette thèse s'est déroulée dans le contexte de la Dark Energy Science Collaboration (DESC), au sein de l'expérience LSST. Elle se focalise sur la problématique de la superposition de sources. Cet effet génère une incertitude systématique dominante dans la mesure du cisaillement gravitationnel. Cette systématique impacte à la fois les mesures de forme et celles du décalage vers le rouge des galaxies, deux mesures nécessaires à l'étude du lentillage gravitationnel faible. Nous proposons deux solutions basées sur les méthodes bayésiennes d'apprentissage profond. La première est un algorithme de séparation de galaxies qui utilise un réseau de neurones génératif appelé autoencodeur variationnel. Ce réseau de neurones permet l'apprentissage d'un prior pour la génération d'images de galaxie isolée. Celui-ci est utilisé dans un second réseau qui fait la séparation de la galaxie centrale sur des images de galaxies simulées. Nous montrons que l'analyse jointe des pixels des données LSST et Euclid permet une diminution de l'erreur médiane de reconstruction des formes des galaxies de 8 à 47%. La superposition de sources étant étroitement liée à l'étape de détection, nous démontrons la robustesse de notre méthode à de petits décentrages. Nous avons aussi testé notre méthode sur des images de vraies galaxies artificiellement superposées, montrant l'intérêt du transfert d'apprentissage à partir d'un réseau de neurones entraîné sur des images de galaxies simulées. Une processus itératif est ensuite mis en place afin de pouvoir séparer toutes les galaxies d'une image en passant par des étapes de détection, classification, et séparation des sources. Enfin, cet algorithme de séparation de galaxies est testé sur des images extraites de la simulation DC2, générée au sein de DESC dans le but de préparer à l'analyse des futures images prises par LSST. Nos résultats montrent une amélioration de 70 à 120% sur l'erreur médiane de reconstruction des formes comparée à la méthode générique utilisée dans la pipeline LSST actuellement. Ensuite, inspirés de cette première méthode, nous proposons un réseau de neurones permettant de faire directement l'estimation des paramètres de forme et de décalage vers le rouge d'une galaxie à partir des images DC2, sans appliquer de méthode de séparation de sources. Nous montrons que ce réseau permet des mesures précises de ces paramètres, même lorsque les sources sont superposées, et comparons ces résultats à ceux obtenus avec séparation de source. Par la suite, nous présentons une première application d'un réseau de neurones bayésien à l'estimation des formes des galaxies. Ce type de réseau permet l'estimation de l'incertitude épistémique qui représente l'incertitude liée à l'échantillon d'entraînement. Celle-ci peut être vue comme un niveau de confiance dans la mesure réalisée par le réseau, une information cruciale à l'utilisation des réseaux de neurones en science et en cosmologie. Elle permet de diminuer l'importance (voir de rejeter) d'une mesure qui a de fortes probabilités d'être erronée dans l'analyse.