- Presque toutes les entreprises dans lesquelles Sequoia a investi intègrent des LLM comme ChatGPT dans leurs produits
- À partir d’une étude des entreprises de son réseau, Sequoia a identifié deux stacks IA
Stack d’API LLM
- API LLM : OpenAI, Anthropic, Cohere
- Vector DB : AWS, pgvector, Pinecone, Qdrant, Weaviate, Chroma
- Frameworks : LangChain, LlamaIndex, Anarchy
- Text-to-Speech : Resemble.AI, ElevenLabs, Wellsaid
- Monitoring : DISTYL, Guardrails, Helicone, HoveHive, Autoblocks
Stack d’entraînement / d’ajustement de modèles personnalisés
- Compute : AWS, Azure, Google Cloud, Foundary, Lamba, MosaicML, Modal, Fireworks.ai
- Model Hub : Hugging Face, Replicate
- Frameworks : PyTorch, TensorFlow
- Expérimentation : Weights & Biases
- Monitoring/Observability : Robust Intelligence, Gantry, Arthur, arise, Whylabs
- Hébergement : Replicate, HuggingFace
Points clés
- La plupart des entreprises intègrent des LLM dans leurs produits
- L’accent est mis sur les API de modèles de langage, la recherche et l’orchestration. L’usage de l’open source augmente
- Les entreprises veulent adapter et personnaliser les modèles de langage à leur propre contexte
- Pour l’instant, la stack d’API LLM et la stack d’entraînement de modèles semblent séparées, mais elles vont progressivement fusionner
- La stack devient de plus en plus developer-friendly
- Pour que les modèles de langage soient pleinement adoptés, il faut renforcer leur fiabilité (qualité, confidentialité des données, sécurité)
- Les applications basées sur les modèles de langage vont devenir de plus en plus multimodales
- Nous n’en sommes encore qu’au tout début
3 commentaires
La situation actuelle de l’environnement de développement est bien compréhensible.
Mais dans le contexte national, à quel niveau en est-on ?
Il semble que « Seaviate » dans la liste des bases de données vectorielles soit une faute de frappe pour « Weaviate », la base de données vectorielle !
Je l’ai corrigé à la va-vite haha