AlphaProteo : une IA qui génère de nouvelles protéines pour la recherche en biologie et en santé
(deepmind.google)- Les interactions entre protéines déterminent des processus biologiques clés comme la croissance cellulaire et la réponse immunitaire, et AlphaProteo est le premier système d’IA de Google DeepMind visant à automatiser la conception de nouveaux liants capables de manipuler ces interactions
- En entrant la structure d’une protéine cible et le site de liaison souhaité, le système génère des protéines candidates à partir de motifs appris sur plus de 100 millions de structures issues de la Protein Data Bank et de prédictions AlphaFold
- Dans des expériences sur 7 protéines cibles, les taux de réussite et l’affinité de liaison ont été supérieurs à ceux de la meilleure méthode existante, avec pour certaines cibles des résultats plus solides que les liants optimisés auparavant
- Pour BHRF1, 88 % des candidats se sont liés lors des tests en laboratoire, et le système est présenté comme le premier cas où un outil d’IA a conçu une protéine se liant avec succès à VEGF-A
- Le système pourrait fortement réduire le temps des premières expérimentations sur les liants protéiques, mais des cibles difficiles subsistent, comme l’échec sur TNFɑ, ce qui exige encore des validations supplémentaires et des améliorations de bio-ingénierie avant des applications concrètes
La conception de liants protéiques visée par AlphaProteo
- Les processus biologiques, de la croissance cellulaire à la réponse immunitaire, dépendent fortement des interactions entre protéines
- Des outils de prédiction de structure protéique comme AlphaFold ont élargi la compréhension de ces interactions, mais ne permettent pas de créer directement de nouvelles protéines pour les manipuler
- AlphaProteo est un système d’IA de Google DeepMind conçu pour élaborer de nouveaux liants protéiques se fixant fortement à des molécules cibles
- Ces liants peuvent être utilisés dans plusieurs domaines de recherche
- développement de médicaments
- imagerie cellulaire et tissulaire
- compréhension et diagnostic des maladies
- résistance des cultures aux ravageurs
Données d’entraînement et méthode de génération
- AlphaProteo a été entraîné sur un vaste ensemble de données protéiques de la Protein Data Bank ainsi que sur plus de 100 millions de structures prédites par AlphaFold
- Les entrées sont la structure de la molécule cible et l’ensemble des sites de liaison privilégiés à sa surface
- La sortie est une protéine candidate conçue pour se lier aux sites spécifiés
- La conception de liants protéiques performants par les méthodes classiques prend du temps et nécessite plusieurs cycles de travail en laboratoire et d’optimisation de l’affinité de liaison
Résultats expérimentaux sur 7 protéines cibles
- AlphaProteo a conçu des liants pour diverses protéines cibles liées aux infections, au cancer, à l’inflammation et aux maladies auto-immunes
- Pour ces 7 cibles, les protéines candidates générées in silico se sont liées fortement aux protéines visées lors des tests expérimentaux
- Sur l’ensemble des tests, le taux de réussite expérimental a été supérieur à celui de la meilleure méthode de conception existante, et l’affinité de liaison a été améliorée d’un facteur de 3 à 300
- Pour BHRF1, 88 % des molécules candidates se sont liées avec succès lors des tests du Wet Lab de Google DeepMind
- Sur les cibles testées, les liants AlphaProteo se sont liés en moyenne 10 fois plus fortement que ceux issus de la meilleure méthode de conception existante
- Sur la cible TrkA, les liants AlphaProteo se sont montrés plus puissants que des liants conçus auparavant et optimisés après plusieurs cycles expérimentaux
- C’est la première fois qu’un outil d’IA conçoit une protéine se liant avec succès à VEGF-A
Validation externe et fonction biologique
- En plus des validations in silico et des tests internes en wet lab, Google DeepMind a validé les liants avec des groupes de recherche du Francis Crick Institute
- Les groupes de Peter Cherepanov, Katie Bentley et David LV Bauer ont participé à cette validation
- Ils ont étudié plus en profondeur certains candidats performants parmi les liants SC2RBD et VEGF-A
- Les interactions de liaison observées correspondaient aux prédictions d’AlphaProteo
- Certains liants SC2RBD ont montré qu’ils empêchaient SARS-CoV-2 et certains variants d’infecter les cellules
Échec sur TNFɑ et défis restants
- AlphaProteo n’a pas réussi à concevoir un liant efficace pour une 8e cible, TNFɑ
- TNFɑ est une protéine liée à des maladies auto-immunes comme la polyarthrite rhumatoïde
- D’après l’analyse computationnelle, TNFɑ a été évaluée comme une cible très difficile pour la conception de liants, et a été choisie pour mettre AlphaProteo à rude épreuve
- Obtenir une forte liaison n’est souvent que la première étape dans la conception de protéines utiles pour des applications pratiques
- Le processus de recherche et développement comporte encore des obstacles de bio-ingénierie
Développement responsable et usages futurs
- La conception de protéines présente un potentiel dans de nombreux domaines scientifiques, de la compréhension des causes des maladies à l’accélération du développement de tests diagnostiques lors d’épidémies virales, en passant par le soutien à des procédés de fabrication durables et la dépollution de l’environnement
- Google DeepMind travaille avec des experts externes en tenant compte des risques de biosécurité et met en place une approche de partage progressive
- Ces travaux s’inscrivent aussi dans les efforts de la communauté pour développer des bonnes pratiques, notamment via le nouveau AI Bio Forum du NTI
- À l’avenir, l’entreprise prévoit de travailler avec la communauté scientifique pour appliquer AlphaProteo à des problèmes biologiques importants et mieux comprendre ses limites
- Isomorphic Labs explore aussi des applications à la conception de médicaments pour AlphaProteo
- Google DeepMind veut améliorer le taux de réussite et l’affinité de l’algorithme AlphaProteo, élargir l’éventail des problèmes de conception qu’il peut traiter, et développer avec des chercheurs en machine learning, biologie structurale et biochimie des outils de conception protéique plus complets
Aucun commentaire pour le moment.