These Descartes

Propriété d'intersection, décomposition d'interaction, optimisation régionalisée et applications.

Intersection property, interaction decomposition, regionalized optimization and applications.

par Grégoire SERGEANT-PERTHUIS sous la direction de Daniel BENNEQUIN
Thèse de doctorat en Mathématiques
ED 386 Sciences Mathematiques de Paris Centre

Soutenue le vendredi 28 mai 2021 à Université Paris Cité

Sujets

Bethe, Ansatz de
Gibbs, Mesures de
Probabilités

Texte integral en version complète PDF

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04452954 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais

Description en français

Mots clés	Problème des marginales, Mesures de Gibbs, Probabilités et théorie des catégorie, Energie libre de Bethe, Algorithme de passage de messages, Décomposition d'interaction, Décomposition en chaos
Resumé	Replacer des constructions probabilistes et statistiques dans le cadre de la théorie des catégories est un moyen de les unifier et de les étendre tout en les rendant plus modulables pour des applications concrètes; c'est aussi une manière d'identifier ce qu'elles ont de topologique. La première partie de cette thèse est consacrée à l'étude du problème des marginales et à la description des mesures de Gibbs de systèmes statistiques. Ces problèmes peuvent être reformulés et étendus dans le cadre de la théorie des catégories, respectivement dans la catégorie des espaces mesurables et dans celles des noyaux de probabilité comme initiés par Giry dans "A categorical approach to probability theory". Nous n'avons pas connaissance de travaux antérieurs qui proposent une présentation catégorique des mesures de Gibbs; ce point de vue permet d'exhiber de grandes similarités entre le problème des marginales et la caractérisation des mesures de Gibbs, les deux ayant la même interprétation topologique. Une contribution importante au problème des marginales est le résultat de Kellerer, dans "Masstheoretische Marginalprobleme", pour le problème des marginales linéarisé qui repose sur une construction algébrique que Lauritzen nomme la décomposition en sous-espaces d'interaction dans son livre de référence "Graphical Models". Dans ce travail, nous étendons cette construction, extension que nous appellerons décomposition d'interaction, dans plusieurs directions ce qui permet d'obtenir de nouveaux résultats pour le problème des marginales et la caractérisation des mesures de Gibbs dans les contextes énoncés précédemment. Les décompositions d'interaction n'existent pas toujours, c'est pourquoi nous introduisons plusieurs conditions intrinsèques qui caractérisent leur existence: ce sont les propriétés d'intersection, nommées ainsi en référence à la propriété d'intersection pour les graphoïdes. Dans une autre direction on se propose, dans le même esprit que Yedidia, Freeman, Weiss dans "Constructing free-energy approximations and generalized belief propagation algorithms", de donner une procédure pour reconstruire des problèmes d'optimisation globaux à partir de problèmes locaux; nous appellerons cette procédure l'optimisation régionalisée en référence à leur généralisation de l'énergie libre de Bethe, les approximations de l'énergie libre basées sur des régions. Une application de l'étude de cette procédure est la formulation d'une Analyse en Composantes Principales adaptées à des données filtrées telles que les séries temporelles; une autre application est l'extension des approximations de l'énergie libre basées sur des régions de Yedidia, Freeman, Weiss aux collections de mesures de probabilités dont les règles de compatibilité sont données par un diagramme dans la catégorie des noyaux de probabilités. Nous pensons qu'une telle procédure trouvera de nombreuses applications concrètes notamment pour la modélisation des mouvements du ribosomes pendant la traduction de l'ARN messager mais aussi pour l'expression des émotions. Des propriétés de la décomposition d'interaction permettent de donner un algorithme très simple pour trouver les points critiques de la fonction de coût sous-jacente à l'optimisation régionalisée.

Mots clés

Problème des marginales, Mesures de Gibbs, Probabilités et théorie des catégorie, Energie libre de Bethe, Algorithme de passage de messages, Décomposition d'interaction, Décomposition en chaos

Resumé

Replacer des constructions probabilistes et statistiques dans le cadre de la théorie des catégories est un moyen de les unifier et de les étendre tout en les rendant plus modulables pour des applications concrètes; c'est aussi une manière d'identifier ce qu'elles ont de topologique. La première partie de cette thèse est consacrée à l'étude du problème des marginales et à la description des mesures de Gibbs de systèmes statistiques. Ces problèmes peuvent être reformulés et étendus dans le cadre de la théorie des catégories, respectivement dans la catégorie des espaces mesurables et dans celles des noyaux de probabilité comme initiés par Giry dans "A categorical approach to probability theory". Nous n'avons pas connaissance de travaux antérieurs qui proposent une présentation catégorique des mesures de Gibbs; ce point de vue permet d'exhiber de grandes similarités entre le problème des marginales et la caractérisation des mesures de Gibbs, les deux ayant la même interprétation topologique. Une contribution importante au problème des marginales est le résultat de Kellerer, dans "Masstheoretische Marginalprobleme", pour le problème des marginales linéarisé qui repose sur une construction algébrique que Lauritzen nomme la décomposition en sous-espaces d'interaction dans son livre de référence "Graphical Models". Dans ce travail, nous étendons cette construction, extension que nous appellerons décomposition d'interaction, dans plusieurs directions ce qui permet d'obtenir de nouveaux résultats pour le problème des marginales et la caractérisation des mesures de Gibbs dans les contextes énoncés précédemment. Les décompositions d'interaction n'existent pas toujours, c'est pourquoi nous introduisons plusieurs conditions intrinsèques qui caractérisent leur existence: ce sont les propriétés d'intersection, nommées ainsi en référence à la propriété d'intersection pour les graphoïdes. Dans une autre direction on se propose, dans le même esprit que Yedidia, Freeman, Weiss dans "Constructing free-energy approximations and generalized belief propagation algorithms", de donner une procédure pour reconstruire des problèmes d'optimisation globaux à partir de problèmes locaux; nous appellerons cette procédure l'optimisation régionalisée en référence à leur généralisation de l'énergie libre de Bethe, les approximations de l'énergie libre basées sur des régions. Une application de l'étude de cette procédure est la formulation d'une Analyse en Composantes Principales adaptées à des données filtrées telles que les séries temporelles; une autre application est l'extension des approximations de l'énergie libre basées sur des régions de Yedidia, Freeman, Weiss aux collections de mesures de probabilités dont les règles de compatibilité sont données par un diagramme dans la catégorie des noyaux de probabilités. Nous pensons qu'une telle procédure trouvera de nombreuses applications concrètes notamment pour la modélisation des mouvements du ribosomes pendant la traduction de l'ARN messager mais aussi pour l'expression des émotions. Des propriétés de la décomposition d'interaction permettent de donner un algorithme très simple pour trouver les points critiques de la fonction de coût sous-jacente à l'optimisation régionalisée.