Chai-1 : décrypter les interactions entre molécules du vivant
(chaidiscovery.com)- Chai Discovery a dévoilé Chai-1, un modèle de prédiction de structures moléculaires utilisé pour la découverte de médicaments, capable de traiter dans un seul modèle les protéines, petites molécules, ADN, ARN et modifications covalentes
- Sur des benchmarks publics, il a obtenu 77 % de taux de réussite sur PoseBusters et un Cα LDDT de 0,849 sur CASP15, avec une comparaison directe à AlphaFold3 et ESM3-98B
- Contrairement aux outils existants, qui reposent majoritairement sur les alignements de séquences multiples (MSA), Chai-1 conserve l’essentiel de ses performances même en mode séquence unique
- Pour la prédiction de multimères, il a atteint un DockQ acceptable prediction rate de 69,8 %, supérieur aux 67,7 % d’AlphaFold-Multimer basé sur MSA
- L’interface web gratuite est ouverte aux usages commerciaux, et les poids du modèle ainsi que le code d’inférence sont publiés sous licence Apache 2.0
Publication de Chai-1 et mode d’utilisation
- Chai-1 est un modèle de prédiction de structures moléculaires multimodal conçu pour les tâches liées à la découverte de médicaments
- Il prend en charge les protéines, les petites molécules, l’ADN, l’ARN et les modifications covalentes
- Il peut être utilisé via une interface web gratuite, y compris pour des applications commerciales comme la découverte de médicaments
- Les poids du modèle et le code d’inférence sont publiés sous licence Apache 2.0 dans la bibliothèque logicielle chai-lab
Résultats de benchmark et dépendance réduite au MSA
- Les principaux résultats de benchmark sont présentés comme comparables, voire supérieurs, à ceux des grands modèles existants
- PoseBusters : 77 % de taux de réussite, contre 76 % pour AlphaFold3
- Ensemble de prédiction de structure de monomères protéiques CASP15 : Cα LDDT de 0,849, contre 0,801 pour ESM3-98B
- Alors que de nombreux outils de prédiction structurelle exigent des alignements de séquences multiples (MSA), Chai-1 peut aussi fonctionner en mode séquence unique tout en conservant l’essentiel de ses performances
- Pour la prédiction du repliement de multimères, il a atteint 69,8 % selon le critère DockQ acceptable prediction rate, contre 67,7 % pour AlphaFold-Multimer basé sur MSA
- Selon Chai Discovery, Chai-1 est le premier modèle capable de prédire des structures multimériques d’une qualité comparable à AlphaFold-Multimer à partir d’une seule séquence, sans recherche MSA
- Lorsqu’on lui fournit en prompt de nouvelles données comme des contraintes obtenues en laboratoire, les performances peuvent s’améliorer de plusieurs dizaines de points de pourcentage
- Un exemple est l’epitope conditioning : même avec seulement quelques contacts ou résidus de poche, la précision de prédiction des structures anticorps-antigènes est doublée
- Ces entrées peuvent provenir d’expériences en laboratoire, ce qui rend plus réaliste l’ingénierie des anticorps basée sur l’IA
- Une analyse complète du modèle est disponible dans le rapport technique
L’équipe et la suite
- L’équipe de Chai Discovery est composée de profils issus d’entreprises de recherche et d’IA appliquée comme OpenAI, Meta FAIR, Stripe et Google X
- Plusieurs membres de l’équipe ont occupé des postes de Head of AI dans des entreprises de pointe de la découverte de médicaments, et ont collectivement contribué à plus de 12 programmes de développement de médicaments
- Chai-1 est le résultat de quelques mois de travail intensif, et l’objectif plus large de Chai Discovery est de faire passer la biologie de la science à l’ingénierie
- L’entreprise prévoit de développer d’autres modèles basés sur l’IA pour prédire et reprogrammer les interactions entre molécules biochimiques
Aucun commentaire pour le moment.