Oubliez ChatGPT : pourquoi les chercheurs font désormais tourner de petites IA sur leur ordinateur portable
(nature.com)- Les modèles d’intelligence artificielle (IA) sont généralement utilisés en ligne, mais plusieurs outils open source sont en train de changer cela
- Le bio-informaticien Chris Thorpe utilise un grand modèle de langage (LLM), un outil d’IA, pour transformer histo.fyi — une base de données sur les molécules du complexe majeur d’histocompatibilité (MHC), des protéines du système immunitaire — en résumés faciles à lire
- Thorpe fait tourner l’IA sur son ordinateur portable plutôt que d’utiliser un LLM web comme ChatGPT
Tendances récentes des LLM
- Des organisations publient des versions à « poids ouverts » de LLM, que les utilisateurs peuvent télécharger et exécuter en local s’ils disposent d’une puissance de calcul suffisante
- Les entreprises technologiques produisent aussi des versions réduites capables de tourner sur du matériel grand public, avec des performances comparables à celles des grands modèles d’autrefois
Pourquoi les chercheurs utilisent des modèles locaux
- Réduction des coûts
- Protection des données confidentielles des patients ou des entreprises
- Garantie de reproductibilité
- À mesure que les ordinateurs deviennent plus rapides et les modèles plus efficaces, de plus en plus de personnes feront tourner l’IA sur des ordinateurs portables ou des appareils mobiles
Exemples récents de petits modèles à poids ouverts
- Google DeepMind, Meta, l’Allen Institute for Artificial Intelligence et d’autres ont publié des modèles comportant plusieurs milliards de paramètres
- Microsoft a publié de petits modèles de langage comme Phi-1, Phi-1.5, Phi-2, Phi-3 et Phi-3.5, dont certains peuvent aussi traiter des images
- Sébastien Bubeck, vice-président de l’IA générative chez Microsoft, explique les performances de Phi-3 par son jeu de données d’entraînement
Développement d’applications sur mesure
- Les chercheurs peuvent développer des applications personnalisées à partir de ces outils
- Alibaba, en Chine, a construit un modèle appelé Qwen, qu’un chercheur en sciences biomédicales du New Hampshire a affiné sur des données scientifiques pour créer Turbcat-72b
Protection de la vie privée
- Un autre avantage des modèles locaux est la protection de la vie privée
- Envoyer des informations personnellement identifiables à des services commerciaux peut contrevenir aux réglementations sur la protection des données
- Cyril Zakka, médecin à la tête de l’équipe médicale de Hugging Face, utilise des modèles locaux pour générer des données d’entraînement destinées à d’autres modèles
- Johnson Thomas, endocrinologue du système de santé Mercy à Springfield, développe pour la confidentialité des patients un système fondé sur Whisper d’OpenAI et Gemma 2 de Google DeepMind pour transcrire et résumer les conversations entre médecins et patients
- CELLama, développé par l’entreprise pharmaceutique Portrai à Séoul, utilise des LLM locaux pour condenser en phrases de synthèse des informations sur l’expression génétique des cellules et d’autres caractéristiques, en mettant en avant la confidentialité comme avantage majeur
Utilisation des modèles
- Les chercheurs sont confrontés à une offre de LLM en évolution rapide
- Thorpe utilise actuellement Llama sur son ordinateur portable et souligne que les modèles locaux ont l’avantage de ne pas changer, ce qui favorise la reproductibilité
- Thorpe écrit du code pour aligner des molécules MHC à partir de structures 3D et utilise ProtGPT2, un modèle à poids ouverts, pour concevoir de nouvelles protéines
- Mais les applications locales ne suffisent pas toujours : Thorpe utilise GitHub Copilot, un service cloud, pour le codage
Comment s’y mettre
- Il est possible d’exécuter des LLM en local avec des logiciels comme Ollama, GPT4All et Llamafile
- Selon les préférences de l’utilisateur, on peut choisir une application ou la ligne de commande
- Stephen Hood, de Mozilla, estime que les LLM locaux seront bientôt assez bons pour la plupart des applications
Avis de GN+
- Les LLM locaux peuvent être des outils très utiles pour les chercheurs, notamment grâce à la réduction des coûts, à la protection de la vie privée et à la reproductibilité
- Mais dans certains cas, les services cloud peuvent offrir de meilleures performances ; les chercheurs doivent donc choisir l’outil adapté aux besoins de leur application
- Comme les LLM locaux progressent rapidement, les chercheurs doivent continuer à explorer et expérimenter de nouveaux modèles et outils
- Selon le domaine de recherche, il peut aussi être pertinent d’envisager le développement de modèles sur mesure. Par exemple, en biomédecine, affiner un modèle sur des données médicales peut permettre d’obtenir de meilleures performances
- Les LLM locaux en sont encore à un stade précoce ; les chercheurs doivent donc rester conscients des problèmes et limites possibles lors de leur utilisation, notamment les biais des modèles, la qualité des données et les considérations éthiques
7 commentaires
Pour l’instant, c’est encore chaud, lent et imprécis. Pour du Nature, la qualité de l’article est assez faible.
N’est-ce pas lent et moins précis lorsqu’on l’exécute en edge ? ,,
En pratique, sauf dans les domaines où la latence et la confidentialité posent réellement problème, il n’y a aucune raison d’utiliser l’edge computing (local)..
Presque toutes les données du monde sont déjà traitées par AWS et Google, alors venir parler de confidentialité maintenant, c’est juste un argument commercial de sociétés qui n’ont pas la technologie pour créer des LLM..
Bien que le mot small apparaisse dans le titre de l’article de Nature, l’essentiel du contenu porte plutôt sur le local.
À chaque fois, on nous dit d’oublier ChatGPT...
MDR
Avis Hacker News
Recommandation d’utiliser des modèles locaux
Expérience d’utilisation d’un LLM local
AMD Strix Halo APU
Problème de licence de Llama 3.1
Utilisation de Docker et Ollama
Performances des LLM locaux
Expérimentation avec des LLM locaux
Produits basés sur les LLM des grandes entreprises
Données d’entraînement des LLM
Recommandation de configuration pour exécuter de petits modèles