Algorithmes quantiques pour l'apprentissage par renforcement
Quantum algorithms for reinforcement learning
par El Amine CHERRAT sous la direction de Iordanis KERENIDIS
Thèse de doctorat en Informatique
ED 386 Sciences Mathematiques de Paris Centre

Soutenue le mardi 31 octobre 2023 à Université Paris Cité

Sujets
  • Apprentissage automatique
  • Apprentissage par renforcement (intelligence artificielle)
  • Apprentissage profond
  • Informatique quantique
  • Réseaux neuronaux (informatique)
Le texte intégral n’est pas librement disponible sur le web
Vous pouvez accéder au texte intégral de la thèse en vous authentifiant à l’aide des identifiants ENT d’Université Paris Cité, si vous en êtes membre, ou en demandant un accès extérieur, si vous pouvez justifier de de votre appartenance à un établissement français chargé d’une mission d’enseignement supérieur ou de recherche

Se connecter ou demander un accès au texte intégral

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

Theses.fr

Description en anglais
Description en français
Mots clés
Machine learning quantique, Apprentissage par renforcement, Informatique quantique
Resumé
Cette thèse étudie le développement de techniques d'apprentissage par renforcement quantique par l'intégration de l'informatique quantique dans les algorithmes d'apprentissage par renforcement. Basée sur trois articles connexes, l'étude est divisée en trois approches principales : 1. Des méthodes basées sur l'algèbre linéaire quantique sont développées pour l'itération de politique quantique, qui alternent entre l'évaluation de politique quantique et les étapes d'amélioration de politique quantique. Des méthodes efficaces pour construire des encodages de bloc des paramètres et des politiques du processus de décision de Markov sont présentées, et l'approche est généralisée à l'itération de politique approximative utilisant une approximation de fonction de valeur linéaire. Dans certains cas, cette approche offre des accélérations asymptotiques par rapport aux algorithmes d'itération de politique classiques. 2. Des couches et architectures de réseaux neuronaux quantiques sont proposées, passant des techniques basées sur l'algèbre linéaire quantique aux méthodes d'apprentissage par renforcement utilisant des réseaux neuronaux quantiques. La contribution clé réside dans la formulation de couches orthogonales utilisant des portes RBS et de couches composées utilisant des portes FBS. Plusieurs ansatzes pour des couches orthogonales et des procédures de chargement de données pour les matrices sont décrits, et des architectures de réseaux neuronaux quantiques pour l'incorporation d'images et de séquences sont proposées. Les architectures quantiques montrent une efficacité en termes de paramètres et offrent des performances compétitives sur les tâches de classification d'images. 3. Des méthodes d'apprentissage par renforcement profond quantique sont développées, intégrant des réseaux neuronaux quantiques avec des couches orthogonales et composées. Deux méthodes principales sont étudiées : un algorithme de recherche de politique pour des environnements classiques qui utilise des réseaux neuronaux orthogonaux quantiques, et une approche entièrement quantique basée sur un modèle acteur-critique qui utilise des réseaux neuronaux quantiques avec des couches composées, s'inspirant de l'apprentissage par renforcement distributionnel. Le cadre est évalué sur des processeurs quantiques à ions piégés, démontrant une performance supérieure pour les modèles acteur-critique distributionnels. Les contributions clés de cette thèse résident dans la formulation de méthodes d'apprentissage par renforcement quantique sur mesure et dans l'évaluation de leurs performances à la fois classiquement et sur du matériel quantique. Elle démontre le potentiel d'amélioration de l'apprentissage par renforcement grâce à l'intégration de l'informatique quantique. Cependant, la validation expérimentale des approches sur des ordinateurs quantiques plus grands et l'étude d'autres problèmes d'apprentissage par renforcement qui pourraient bénéficier des techniques quantiques restent des travaux futurs.