Identification des interactions médicamenteuses délétères et des variations génomiques structurales entraînant des effets secondaires chez l'homme à l'aide d'outils d'apprentissage automatique
Identification of drug-target interactions and genetic variations leading to adverse drug reactions by using computational approaches
par Bryan DAFNIET sous la direction de Olivier TABOUREAU
Thèse de doctorat en Bioinformatique
ED 393 École doctorale Pierre Louis de santé publique : épidémiologie et sciences de l'information biomédicale

Soutenue le jeudi 15 décembre 2022 à Université Paris Cité

Sujets
  • Apprentissage automatique
  • Médicaments -- Effets secondaires
  • Variabilité génétique
Le texte intégral n’est pas librement disponible sur le web
Vous pouvez accéder au texte intégral de la thèse en vous authentifiant à l’aide des identifiants ENT d’Université Paris Cité, si vous en êtes membre, ou en demandant un accès extérieur, si vous pouvez justifier de de votre appartenance à un établissement français chargé d’une mission d’enseignement supérieur ou de recherche

Se connecter ou demander un accès au texte intégral

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04746890 (Version partielle de la thèse pour sa diffusion sur Internet (pdf))
Theses.fr (Version partielle de la thèse pour sa diffusion sur Internet (pdf))

Description en anglais
Description en français
Mots clés
Effets indésirables, Médicaments, Science des réseaux, Bases de données, Réseaux de neurones profonds, Mutations, Phénotypes, Intégrations de données
Resumé
Le développement d'un médicament est un processus long et couteux pouvant durer plus de 10 ans et ayant un cout dépassant le milliard d'euros. Si les cibles thérapeutiques (cibles protéiques primaires) que doivent cibler ce médicament sont généralement connues, il a été établi qu'un médicament toucherait de nombreuses protéines supplémentaires (cibles protéiques secondaires) responsables d'effets secondaires. Cet effet peut être bénéfique (repurposing) ou délétère (effet indésirable). Ces cibles secondaires sont aujourd'hui mal ou non identifiées et seraient responsables d'environ 200 000 morts par an, engendrant un coût dépassant le milliard d'euros en Europe et aux Etats-Unis. De plus, il a été démontré que les variations génétiques d'un individu seraient susceptibles d'impacter l'efficacité d'un médicament et contribueraient à l'apparition d'effets indésirables associés à un médicament. Dans ces conditions, l'objectif de ce travail de thèse a été de développer des méthodes computationnelles permettant 1) d'intégrer un ensemble de données pharmacologiques provenant de différentes sources dans une seule base de données et de sélectionner 5100 composés avec leur activité biologique sur l'ensemble du protéome humain et des informations provenant de criblage phénotypique. Les informations composés-cibles seront ensuite reliées, si possible, à des informations provenant de criblages phénotypiques, pour effectuer des calculs d'enrichissement sur le rôle des protéines dans diverses fonctions biologiques et maladies. Ensuite de 2) déterminer les protéines fréquemment associées à un effet indésirable en se basant sur les interactions connues médicament-effet indésirable et médicament-protéine. A l'aide de l'implémentation d'une fonction de score, la contribution d'une protéine dans l'apparition d'un effet indésirable a été caractérisée et quantifiée. L'impact des mutations de type Copy Number Variations (CNV) sur l'apparition de tels effets a aussi été étudié. Enfin de 3) développer des modèles prédictifs permettant d'anticiper les effets indésirables d'un médicament potentiellement dus à des variations génétiques. En nous référant à la nomenclature SOC (System Organ Class) et aux variations génétiques de type Single Nucleotide Polymorphisms (SNPs) nous pourrons ensuite analyser les cibles thérapeutiques qui seraient les plus à même d'être la cause de ces effets.