Compatibilité OpenAI
- Ollama est désormais compatible avec l’API OpenAI Chat Completions, ce qui permet d’utiliser Ollama en local avec davantage d’outils et d’applications.
- La configuration commence par le téléchargement d’Ollama et l’importation de modèles comme Llama 2 ou Mistral.
Utilisation
cURL
- Utilisez le format OpenAI pour appeler le point de terminaison d’API compatible OpenAI d’Ollama et remplacez le nom d’hôte par
http://localhost:11434.
Bibliothèque OpenAI Python
- Vous pouvez accéder au point de terminaison d’API d’Ollama avec la bibliothèque OpenAI Python, en incluant une clé API requise mais non utilisée.
Bibliothèque OpenAI JavaScript
- Vous pouvez accéder au point de terminaison d’API d’Ollama avec la bibliothèque OpenAI JavaScript, en incluant une clé API requise mais non utilisée.
Exemples
Vercel AI SDK
- Vercel AI SDK est une bibliothèque open source qui aide à créer des applications interactives en streaming.
create-next-app est utilisé pour cloner le dépôt d’exemple.
Autogen
- Autogen est un framework open source populaire pour créer des applications multi-agents, développé par Microsoft.
- Dans cet exemple, le modèle Code Llama est utilisé, et Ollama est exploité en installant Autogen puis en créant un script Python.
D’autres éléments à venir
- Il s’agit d’une première prise en charge expérimentale de l’API OpenAI.
- Parmi les améliorations futures envisagées figurent l’API Embeddings, l’appel de fonctions, la prise en charge de la vision et les Logprobs.
- Pour plus d’informations, consultez la documentation sur la compatibilité OpenAI.
L’avis de GN⁺
- Compatibilité avec l’API OpenAI : avec la compatibilité d’Ollama avec l’API OpenAI, les développeurs peuvent intégrer et exploiter plus facilement des modèles d’IA dans un environnement local. Il s’agit d’une évolution importante qui améliore l’accessibilité du développement d’applications basées sur l’IA.
- Prise en charge de plusieurs langages de programmation : la prise en charge via les bibliothèques Python et JavaScript montre son utilité dans divers environnements de développement. Cela signifie que les développeurs peuvent intégrer facilement des fonctionnalités d’IA dans leur langage de prédilection.
- Intégration avec des frameworks open source : les exemples d’intégration avec des frameworks open source comme Vercel AI SDK et Autogen montrent l’élargissement des possibilités d’usage d’Ollama et son potentiel pour stimuler une innovation portée par la communauté.
1 commentaires
Avis Hacker News
Ces derniers mois, la facilité d’utilisation des LLM hébergés localement s’est améliorée de façon remarquable.
Certaines personnes sont personnellement mécontentes de voir la compatibilité avec l’API d’OpenAI devenir le standard communautaire.
Une version améliorée de Copilot est en cours de développement, avec la possibilité pour l’utilisateur d’apporter son propre LLM.
Ollama fonctionne mieux que d’autres outils, et fonctionne simplement.
Le script d’installation Linux d’Ollama suit actuellement le style standard.
La compatibilité avec OpenAI est un peu trompeuse.
La couche de compatibilité peut aussi être construite dans une bibliothèque.
llm()qui fonctionne avec plusieurs backends de LLM.Un projet est en cours pour permettre de basculer facilement entre des modèles open source (par ex. HF, VLLM) et des modèles commerciaux (OpenAI, Google, Anthropic, Together).
Une question est posée sur les cas d’usage d’Ollama, et sur les raisons pour lesquelles il ne faudrait pas utiliser directement llama.cpp.
Une autre question porte sur le fait de savoir si Ollama n’est qu’un serveur HTTP dockerisé appelant directement llama.cpp, et, en dehors de l’API OpenAI ajoutée récemment, quelle est la différence.