1 points par GN⁺ 2024-09-12 | 1 commentaires | Partager sur WhatsApp

Présentation de Chai-1 : décoder les interactions des biomolécules

  • Lancement de Chai-1
    • Chai-1 est un nouveau modèle foundation multimodal qui atteint des performances de pointe sur diverses tâches liées à la découverte de médicaments
    • Il permet de prédire de manière intégrée les protéines, petites molécules, ADN, ARN et modifications covalentes
    • Il est proposé gratuitement via une interface web et peut aussi être utilisé à des fins commerciales
    • Pour un usage non commercial, les poids du modèle et le code d’inférence sont fournis sous forme de bibliothèque logicielle

Un modèle de pointe pour les interactions biomoléculaires

  • Évaluation des performances
    • Taux de réussite de 77 % sur le benchmark PoseBusters (contre 76 % pour AlphaFold3)
    • Score Cα LDDT de 0.849 sur l’ensemble de prédiction de structure de monomères protéiques CASP15 (contre 0.801 pour ESM3-98B)
    • Ne nécessite pas d’alignement multiple de séquences (MSA) et conserve de hautes performances même en mode séquence unique
    • Taux de prédiction plus précis que le modèle AlphaFold-Multimer pour la prédiction de structures multimériques (69.8 % vs. 67.7 %)
    • Capable de prédire des structures multimériques avec une qualité comparable à AlphaFold-Multimer à partir d’une seule séquence

Un modèle foundation nativement multimodal

  • Exploitation de données supplémentaires
    • Les performances peuvent être améliorées avec de nouvelles données, comme des contraintes issues du laboratoire
    • Exploration de diverses fonctions, comme le conditionnement par épitope, qui double la précision de la prédiction de structures anticorps-antigène

Publication du modèle

  • Mise à disposition d’une interface web gratuite
    • Utilisable aussi à des fins commerciales
    • Pour un usage non commercial, le code est publié sous forme de bibliothèque logicielle
    • Vise à faire bénéficier l’ensemble de l’écosystème grâce à la collaboration avec les communautés de recherche et industrielles

Étapes suivantes

  • Contexte de l’équipe
    • Issue d’entreprises de recherche et d’IA appliquée de premier plan comme OpenAI, Meta FAIR, Stripe et Google X
    • Joue un rôle important dans l’avancement de la recherche en biologie avec l’IA
    • Chai-1 est le résultat de plusieurs mois de travail intensif et n’en est encore qu’à ses débuts
    • L’objectif est de transformer la biologie, de science en ingénierie
    • Développement prévu de modèles d’IA supplémentaires capables de prédire et de reprogrammer les interactions entre molécules biochimiques

Le résumé de GN⁺

  • Chai-1 est un outil important pour la découverte de médicaments et la recherche en sciences du vivant, avec des performances de pointe en prédiction de structures de protéines, petites molécules, ADN et ARN
  • Il maintient de hautes performances sans alignement multiple de séquences et affiche aussi d’excellents résultats pour la prédiction de structures multimériques
  • Grâce à la collaboration avec les communautés de recherche et industrielles, il bénéficie à l’ensemble de l’écosystème et propose une interface web gratuite ainsi qu’une bibliothèque logicielle pour un usage non commercial
  • Avec pour objectif de transformer la biologie en discipline d’ingénierie, il doit encore évoluer vers des modèles d’IA capables de prédire et reprogrammer les interactions entre molécules biochimiques

1 commentaires

 
GN⁺ 2024-09-12
Commentaires Hacker News
  • Depuis l'affaire Reflection, l'enthousiasme pour des tests indépendants est né
  • Souhaite qu'on n'accepte pas les évaluations SOTA telles quelles
  • A découvert que Chai avait copié des fonctions de quaternions depuis pytorch3d
  • Les connaissances sur la structure des protéines ne sont pas le facteur limitant du développement de médicaments
    • Il est intéressant d'estimer l'impact des résultats sur le pipeline de développement de médicaments
  • Les termes "foundation" et "multi-modal" n'apparaissent que dans le résumé de l'article
    • Copie la méthode AlphaFold et ajoute des embeddings de langage ainsi que d'autres contraintes
    • Les données montrant une amélioration des performances sont insuffisantes
  • La marge d'erreur est très grande
  • Il existe des risques liés à la publication
    • Cela pourrait être détourné pour développer de nouvelles armes biologiques
  • Se demande à quel point il est difficile pour des biohackers de développer de nouvelles protéines
  • Le titre HN est inexact
    • Obtenir un score supérieur de 1 % ne signifie pas avoir battu le modèle précédent
  • S'il y avait une cote de pari, une retraite anticipée serait possible
  • Est l'auteur de AutoDock Vina
    • Un logiciel de docking doit pouvoir généraliser pour trouver de nouveaux ligands
    • L'approche d'évaluation ne teste pas les performances sur de nouvelles molécules
    • La sortie de Chai-1 aidera à évaluer les méthodes