Mots clés |
Similarité visuelle, Intelligence augmentée, Recherche d'image par contenu, Prédiction de performance, Explicabilité |
Resumé |
L'objectif de cette thèse CIFRE est de développer un moteur de recherche par image, basé sur la vision par ordinateur, afin d'assister les officiers des douanes. En effet, nous constatons, paradoxalement, une augmentation des menaces sécuritaires (terrorisme, trafic, etc.) couplée d'une diminution des effectifs en Douane. Les images de cargos acquises par des scanners à rayons X permettent déjà l'inspection d'un chargement sans nécessiter l'ouverture et la fouille complète d'un chargement contrôlé. En proposant automatiquement des images similaires, un tel moteur de recherche permettrait d'aider le douanier dans sa prise de décision face à des signatures visuelles de produits peu fréquents ou suspects. Grâce à l'essor des techniques modernes en intelligence artificielle (IA), notre époque subit de grands changements : l'IA transforme tous les secteurs de l'économie. Certains voient dans cet avènement de la "robotisation" la déshumanisation de la force de travail, voire son remplacement. Cependant, réduire l'utilisation de l'IA à la simple recherche de gains de productivité serait réducteur. En réalité, l'IA pourrait permettre d'augmenter la capacité de travail des humains et non à les concurrencer en vue de les remplacer. C'est dans ce contexte, la naissance de l'Intelligence Augmentée, que s'inscrit cette thèse. Ce manuscrit consacré à la question de la similarité visuelle se décompose en deux parties. Deux cas pratiques où la collaboration entre l'Homme et l'IA est bénéfique sont ainsi proposés. Dans la première partie, le problème de l'apprentissage de représentations pour la recherche d'images similaires fait encore l'objet d'investigations approfondies. Après avoir implémenté un premier système semblable à ceux proposés par l'état de l'art, l'une des principales limitations est pointée du doigt : le biais sémantique. En effet, les principales méthodes contemporaines utilisent des jeux de données d'images couplées de labels sémantiques uniquement. Les travaux de la littérature considèrent que deux images sont similaires si elles partagent le même label. Cette vision de la notion de similarité, pourtant fondamentale en IA, est réductrice. Elle sera donc remise en question à la lumière des travaux en psychologie cognitive afin de proposer une amélioration : la prise en compte de la similarité visuelle. Cette nouvelle définition permet une meilleure synergie entre le douanier et la machine. Ces travaux font l'objet de publications scientifiques et d'un brevet. Dans la seconde partie, après avoir identifié les composants clefs permettant d'améliorer les performances du système précédemment proposé, une approche mêlant recherche empirique et théorique est proposée. Ce second cas, l'intelligence augmentée est inspirée des développements récents en mathématiques et physique. D'abord appliquée à la com- préhension d'un hyperparamètre important (la température), puis à une tâche plus large (la classification), la méthode proposée permet de fournir une intuition sur l'importance et le rôle de facteurs corrélés à la variable étudiée (ex. hyperparamètre, score, etc.). La chaîne de traitement ainsi mise en place a démontré son efficacité en fournissant une solution hautement explicable et en adéquation avec des décennies de recherches en apprentissage automatique. Ces découvertes permettront l'amélioration des solutions précédemment développées |