- Ollama publie en API une fonctionnalité de recherche d’informations web récentes, afin de réduire les hallucinations des modèles et d’améliorer leur précision
- Même les comptes gratuits incluent un quota gratuit de recherche généreux, et les utilisateurs intensifs peuvent bénéficier de limites plus élevées via Ollama Cloud
- Basée sur une API REST, elle s’intègre aux bibliothèques Python et JavaScript, permettant à des modèles comme OpenAI
gpt-oss d’effectuer des travaux de recherche de longue durée
- Les fonctions
web_search et web_fetch renvoient des résultats de plusieurs milliers de tokens et prennent en charge l’intégration avec divers outils comme Cline, Codex et Goose via des serveurs MCP
- Il est ainsi possible de construire directement des agents de recherche, ce qui élargit considérablement la capacité des modèles d’IA à interagir avec des données récentes
Présentation de la fonctionnalité de recherche web d’Ollama
- Ollama a dévoilé une API de recherche web, offrant un environnement dans lequel les modèles d’IA peuvent accéder immédiatement aux informations web les plus récentes
- Cela permet de réduire les hallucinations et d’obtenir une meilleure précision
- Les utilisateurs individuels bénéficient d’un quota gratuit de recherche généreux, et ce quota peut être étendu via un abonnement au cloud Ollama en cas de besoins plus élevés
- Le service est proposé sous forme d’API REST et permet une intégration avancée avec des outils via des bibliothèques Python et JavaScript
- Grâce à cette architecture, différents modèles comme gpt-oss peuvent mener des recherches et travaux d’exploration sur la durée
Exemples d’utilisation de l’API
- Avec une clé API émise depuis un compte Ollama, il est possible d’appeler le service via
cURL, avec ollama.web_search() en Python et client.webSearch() en JavaScript
- Les résultats sont renvoyés dans une structure JSON contenant le titre, l’URL et un résumé du contenu
- L’API
web_fetch permet de récupérer, pour une URL donnée, le contenu de la page jusqu’au texte principal et à la liste des liens
Implémentation d’un agent de recherche basé sur la recherche web
- L’API Ollama peut être combinée à des modèles comme Qwen3 et gpt-oss pour développer des agents de recherche multi-tour automatisés
- Le code d’exemple automatise le processus recherche → raisonnement → synthèse des résultats à l’aide du modèle Qwen3:4B
- En s’appuyant sur les résultats de recherche, il passe par un processus de "Thinking" et exploite de manière répétée les résultats des appels aux outils de recherche et de fetch afin de mener des scénarios de recherche ou d’exploration complexes
- La nouvelle mise à niveau du moteur Ollama inclut une gestion mémoire plus précise, des optimisations GPU / multi-GPU, des améliorations de performances ainsi qu’un support renforcé des modèles de vision (multimodaux)
Modèles recommandés et indications de performances
- Recommandation de modèles cloud dotés de solides capacités d’utilisation d’outils, par exemple
qwen3:480b-cloud, gpt-oss:120b-cloud, deepseek-v3.1-cloud
- Les outils de recherche et de fetch pouvant renvoyer des données sur plusieurs milliers de tokens, il est recommandé d’augmenter la longueur de contexte du modèle à environ 32000 tokens
Fonction de fetch de pages web individuelles
- En plus de la recherche web, une API / fonction est fournie pour fetcher directement le texte et la structure de liens d’une page web spécifique
- En Python, JavaScript ou via cURL, il suffit de passer une url en argument pour extraire le
title, le content, les liens associés, etc.
- Des exemples de code plus détaillés sont disponibles dans le dépôt GitHub officiel
Intégration des outils et des agents
web_search et web_fetch renvoient des données de plusieurs milliers de tokens, et il est recommandé d’étendre le contexte du modèle à 32K ou plus
- Grâce à la prise en charge des serveurs MCP, une intégration directe est possible avec des environnements de développement IA comme Cline, Codex et Goose
- Des exemples de code Python et JavaScript sont fournis dans le dépôt GitHub officiel
Pour commencer
- La recherche web est incluse par défaut avec un compte Ollama gratuit, et des volumes d’utilisation plus élevés sont accessibles via un abonnement payant
- Il suffit de créer un compte sur le site d’Ollama, de générer une clé API et d’utiliser immédiatement le service
3 commentaires
J’ai l’impression que la version gratuite d’ollama ne sera pas vraiment à la hauteur pour un usage réel...
La page des tarifs n’explique pas non plus les quotas, donc j’ai du mal à juger si ça vaut le coup.
Avis sur Hacker News