Homogenization and trend estimation of GNSS water vapour observations and atmospheric reanalyses : application to climate change analysis
Homogénéisation et estimation des tendances des observations GNSS de la vapeur d'eau et des réanalyses atmosphériques : application à l'analyse du changement climatique
par Khanh-Ninh NGUYEN sous la direction de Olivier BOCK et de Emilie LEBARBIER
Thèse de doctorat en Sciences de la terre et de l'environnement
ED 560 Sciences de la terre et de l'environnement et physique de l'univers, Paris

Soutenue le vendredi 08 décembre 2023 à Université Paris Cité

Sujets
  • Effets du réchauffement de la Terre
  • Localisation par satellites, Systèmes de
  • Météorologie -- Observations
  • Météorologie par satellite
  • Vapeur d'eau atmosphérique

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04816893 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Vapeur d'eau intégrée, GNSS, Homogénéisation, Tendance, Segmentation, Attribution, Réanalyse, Régression linéaire généralisée, Classification
Resumé
La vapeur d'eau joue un rôle important dans le bilan énergétique et le cycle hydrologique de la Terre. Avec le réchauffement climatique, la vapeur d'eau dans l'atmosphère tend à augmenter, mais la répartition géographique des tendances de vapeur d'eau dans les simulations de modèles climatiques et les observations reste incertaine. Les estimations de la vapeur d'eau intégrée (IWV) fournies par les systèmes mondiaux de navigation par satellites (GNSS) constituent une nouvelle source de données qui peut servir à vérifier les tendances simulées et observées de vapeur d'eau. Des études antérieures ont fait état d'inhomogénéités dans les données IWV du GNSS dues à des changements d'instrumentation des stations et de méthodes de traitement des données, et ont recommandé leur homogénéisation pour les applications climatiques. Cette étude utilise une méthode de segmentation statistique pour détecter les changements abrupts dans la moyenne (ou ruptures) des séries de différences IWV entre les données GNSS et celles de réanalyse. Les séries de différences sont utilisées pour atténuer la forte variabilité temporelle inhérente aux séries IWV, qui gêne la détection de petites ruptures sur les séries brutes. Cette étude utilise le package R GNSSseg développé par Quarello (2020). Le premier objectif de cette thèse est d'étudier la sensibilité de la segmentation et des estimations de tendances aux propriétés des données d'entrée. Ces dernières sont composées de deux ensembles de données GNSS (IGS repro1 et CODE REPRO2015) et de deux produits de réanalyse (ERA-Interim et ERA5). Il s'avère que seuls 45 à 50% des ruptures détectées sont similaires lors du changement des données d'entrée. La modification de la longueur des séries ou des données auxiliaires utilisées dans le traitement des données GNSS IWV a un impact plus faible, avec 70-80% de détections similaires. Les produits GNSS et de réanalyse plus récents présentent des différences moindres et permettent la détection de ruptures plus faibles. Les estimations des tendances sont sensibles au nombre et à la position des ruptures. Par conséquent, valider l'origine des ruptures avant d'estimer les tendances est crucial. Nous avons constaté que seuls 35 % sont expliqués par les métadonnées, le 65% restant vient de changements non documentés du GNSS ou de la réanalyse. Le deuxième objectif de cette thèse est de développer une méthode de classification automatique, opérée en post-traitement, pour distinguer les points de changement du GNSS et de la réanalyse. La méthode "d'attribution" proposée combine les données GNSS et de réanalyse d'une station principale avec des données similaires de stations voisines. Chaque paire station principale-station voisine comprend quatre séries de base à partir desquelles six séries de différences sont formées. Ensuite, pour chaque rupture détectée dans la série principale, un test de significativité est appliqué à la moyenne avant et après rupture, et une règle statistique prédictive est construite pour attribuer les points de changement testés au GNSS ou à la réanalyse. En présence de plusieurs stations voisines, une solution combinée est proposée. L'aspect original de la méthode d'attribution développée est l'utilisation d'une méthode d'inférence généralisée des moindres carrés, tenant compte de l'hétéroscédasticité et de l'autocorrélation dans les données, et d'un classificateur d'apprentissage automatique. La principale nouveauté réside dans la manière dont la règle prédictive est construite, en utilisant les résultats des tests obtenus à partir des données réelles avec une procédure de rééchantillonnage. Les résultats de la prédiction dépendent de la stratégie de rééchantillonnage (équilibrés ou déséquilibrés) et du niveau de significativité du test. Lorsque la méthode est appliquée aux données GNSS CODE REPRO2015 et à la réanalyse ERA5, 62% des ruptures testées sont attribuées au GNSS, 19% à la réanalyse et 10% à des changements communs aux deux.