Prédiction d'indicateurs démographiques à partir d'images satellites
Prediction of demographic indicators from remote sensing images
par Basile ROUSSE sous la direction de Laurent WENDLING et de Valérie GOLAZ
Thèse de doctorat en Traitement du signal et des images
ED 130 Informatique, Télécommunications et Electronique

Soutenue le jeudi 21 novembre 2024 à Université Paris Cité

Sujets
  • Afrique subsaharienne
  • Apprentissage profond
  • Démographie
  • Environnement
  • Imagerie satellitaire
  • Télédétection

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04832026 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Apprentissage profond, Adaptation de domaine, Télédétection, Démographie, Local Climate Zones (LCZ), Afrique subsaharienne
Resumé
Cette thèse explore l'utilisation des images satellites pour assister l'analyse des données provenant des enquêtes démographiques dans le contexte des pays d'Afrique sub-Saharienne. Dans ces pays, les enquêtes démographiques sont rares et fournissent peu d'informations environnementales actualisées, limitant l'étude des relations entre environnement et population à une échelle fine. Les images satellites, disponibles à une fréquence temporelle élevée et avec une haute résolution spatiale permette d'ajouter l'environnement à l'analyse, mais nécessitent des méthodes spécifiques préalables qui répondent aux contraintes déterminées par les données d'enquête. Des méthodes d'apprentissage profond peuvent être utilisées pour entraîner des modèles permettent de caractériser l'environnement. La thèse examine le lien entre la caractérisation environnementale et la population à deux échelles d'étude : au niveau d'une ville et d'un pays. À l'échelle locale, notre premier cas d'usage étudie la mortalité à Antananarivo, capitale de Madagascar. Les autorités sanitaires y enregistrent tous les décès et recueillent des informations des décès, telles que la cause et son quartier de résidence. Cette information géographique permet de relier les décès aux environnements des quartiers. La caractérisation de l'environnement utilise une carte basée sur le système de classification du sol "Local Climate Zones" (LCZ). Ce réseau est entraîné via une méthode d'adaptation de domaine, utilisant les définitions physiques du système LCZ. En complément, des indicateurs usuels comme l'indice de végétation, l'altitude et la détection de bâti sont intégrés. Après avoir attribué chaque décès à un quartier, l'influence de l'environnement sur les causes de décès est étudiée via ces indicateurs, en contrôlant les données socio-économiques pour garantir l'indépendance des résultats. À une échelle plus large, le deuxième cas d'usage examine cette relation au niveau national. Des organismes internationaux, comme le Demographic and Health Survey Program, organisent des enquêtes pour évaluer des indicateurs démographiques dans des pays à faible et moyen revenu. Une enquête "Malaria Indicator Survey" (MIS) a étudié la prévalence du paludisme au Burkina Faso en 2017-2018. Le système LCZ est utilisé pour caractériser l'environnement du Burkina Faso. Les méthodes d'apprentissage profond appliquées aux images satellites sont adaptées pour générer des cartes à large échelle, mais doivent respecter certaines contraintes, comme être générées durant la période de l'enquête et prendre en compte les caractéristiques climatiques du Burkina Faso, y compris les changements saisonniers. Une méthode d'adaptation de domaine a été développée pour la cartographie à l'échelle du pays, permettant d'extraire les informations pertinentes des images tout en intégrant les changements saisonniers. En utilisant les coordonnées géographiques des ménages de l'enquête MIS, des liens entre la présence de paludisme et les environnements locaux des ménages ont été établis, définis par les distributions de LCZ dans la zone, toujours sous contrôle des données socio-économiques. Cette thèse apporte deux contributions principales. D'abord, elle propose une approche complète pour relier les images satellites aux données de population, incluant une caractérisation adaptée de l'environnement des ménages via des méthodes d'apprentissage profond, et une méthode pour intégrer ces informations environnementales dans un processus d'analyse démographique. Ensuite, elle met en évidence des liens significatifs entre population et environnement via un système de classification adapté, soulignant l'importance de son intégration dans les futures études.