Une nouvelle stack de modèles de langage pour les applications d’IA

xguru · 2023-06-19T10:41:01+09:00

Presque toutes les entreprises dans lesquelles Sequoia a investi intègrent des LLM comme ChatGPT dans leurs produits À partir d’une étude des entreprises de son réseau, Sequoia a identifié deux stacks IA Stack d’API LLM API LLM : OpenAI, Anthropic, Cohere Vector DB : AWS, pgvector, Pinecone, Qdrant, Weaviate, Chroma Frameworks : LangChain, LlamaIndex, Anarchy Text-to-Speech : Resemble.AI, ElevenLabs, Wellsaid Monitoring : DISTYL, Guardrails, Helicone, HoveHive, Autoblocks Stack d’entraînement / d’ajustement de modèles personnalisés Compute : AWS, Azure, Google Cloud, Foundary, Lamba, MosaicML, Modal, Fireworks.ai Model Hub : Hugging Face, Replicate Frameworks : PyTorch, TensorFlow Expérimentation : Weights & Biases Monitoring/Observability : Robust Intelligence, Gantry, Arthur, arise, Whylabs Hébergement : Replicate, HuggingFace Points clés La plupart des entreprises intègrent des LLM dans leurs produits L’accent est mis sur les API de modèles de langage, la recherche et l’orchestration. L’usage de l’open source augmente Les entreprises veulent adapter et personnaliser les modèles de langage à leur propre contexte Pour l’instant, la stack d’API LLM et la stack d’entraînement de modèles semblent séparées, mais elles vont progressivement fusionner La stack devient de plus en plus developer-friendly Pour que les modèles de langage soient pleinement adoptés, il faut renforcer leur fiabilité (qualité, confidentialité des données, sécurité) Les applications basées sur les modèles de langage vont devenir de plus en plus multimodales Nous n’en sommes encore qu’au tout début

(sequoiacap.com)

13 points par xguru 2023-06-19 | 3 commentaires | Partager sur WhatsApp

Presque toutes les entreprises dans lesquelles Sequoia a investi intègrent des LLM comme ChatGPT dans leurs produits
À partir d’une étude des entreprises de son réseau, Sequoia a identifié deux stacks IA

Stack d’API LLM

API LLM : OpenAI, Anthropic, Cohere
Vector DB : AWS, pgvector, Pinecone, Qdrant, Weaviate, Chroma
Frameworks : LangChain, LlamaIndex, Anarchy
Text-to-Speech : Resemble.AI, ElevenLabs, Wellsaid
Monitoring : DISTYL, Guardrails, Helicone, HoveHive, Autoblocks

Stack d’entraînement / d’ajustement de modèles personnalisés

Compute : AWS, Azure, Google Cloud, Foundary, Lamba, MosaicML, Modal, Fireworks.ai
Model Hub : Hugging Face, Replicate
Frameworks : PyTorch, TensorFlow
Expérimentation : Weights & Biases
Monitoring/Observability : Robust Intelligence, Gantry, Arthur, arise, Whylabs
Hébergement : Replicate, HuggingFace

Points clés

La plupart des entreprises intègrent des LLM dans leurs produits
L’accent est mis sur les API de modèles de langage, la recherche et l’orchestration. L’usage de l’open source augmente
Les entreprises veulent adapter et personnaliser les modèles de langage à leur propre contexte
Pour l’instant, la stack d’API LLM et la stack d’entraînement de modèles semblent séparées, mais elles vont progressivement fusionner
La stack devient de plus en plus developer-friendly
Pour que les modèles de langage soient pleinement adoptés, il faut renforcer leur fiabilité (qualité, confidentialité des données, sécurité)
Les applications basées sur les modèles de langage vont devenir de plus en plus multimodales
Nous n’en sommes encore qu’au tout début

3 commentaires

gcback 2023-06-19

La situation actuelle de l’environnement de développement est bien compréhensible.
Mais dans le contexte national, à quel niveau en est-on ?

bigbreadguy 2023-06-19

Il semble que « Seaviate » dans la liste des bases de données vectorielles soit une faute de frappe pour « Weaviate », la base de données vectorielle !

xguru 2023-06-19

Je l’ai corrigé à la va-vite haha