6 points par GN⁺ 2025-09-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • ChatGPT basé sur GPT-5 (surnommé Research Goblin) fait preuve d’un très haut niveau de précision et d’utilité pour la recherche sur le Web
  • Il déploie de solides capacités d’exploration et de raisonnement sur un large éventail de sujets, des questions triviales aux enquêtes d’information complexes
  • Dans des exemples concrets, il fournit des réponses et des sources fiables grâce à un vaste processus de recherche et un raisonnement en chaîne
  • Même en environnement mobile, il offre une excellente ergonomie et un flux de travail continu
  • Grâce à l’intégration du tool calling et du chain-of-thought, il propose, du point de vue des développeurs, un nouveau standard pour la recherche fondée sur les LLM

La réflexion de GPT-5 (Research Goblin) et l’innovation dans la recherche

Un paradigme de recherche qui change

  • Jusqu’ici, le conseil dominant était de « ne pas utiliser un chatbot comme moteur de recherche », mais ce principe vole en éclats avec le ChatGPT récent basé sur GPT-5
  • Le modèle basé sur GPT-5 va au-delà d’une simple intégration avec un moteur comme Bing et atteint concrètement un niveau capable de remplacer ou dépasser une enquête sur Internet
  • S’il a reçu le surnom de « Research Goblin », c’est parce que, quelle que soit la question ou la tâche complexe qu’on lui confie, il enquête avec une ténacité presque anormale pour produire la meilleure réponse possible

Cas de recherche concrets et résultats

Les travelators amusants

  • À la question de savoir quand les tapis roulants en caoutchouc de l’aéroport d’Heathrow ont été remplacés par des versions métalliques, il a estimé que cela s’était produit entre 2014 et 2018, et a même trouvé un article connexe intéressant de 2024

Identification d’un bâtiment

  • Interrogé sur un bâtiment exotique visible depuis la fenêtre d’un train, il a correctement identifié « The Blade (Reading) » en 1 minute et 4 secondes, avec les liens vers les sources

Enquête sur les cake pops de Starbucks UK

  • Il a mené une enquête approfondie sur l’absence de cake pops dans les magasins Starbucks au Royaume-Uni et a découvert qu’ils avaient été introduits en 2023 mais n’étaient pas proposés dans certains points de vente, en particulier dans les magasins de voyage
  • Il a également rassemblé des éléments de preuve, notamment un PDF sur la nutrition et les allergènes, ainsi que des discussions Reddit

Relation entre Wikipedia et Britannica

  • Il a analysé en profondeur la véracité et le contexte d’affirmations en ligne selon lesquelles Wikipedia aurait utilisé au départ certaines sources de l’édition 1911 de Britannica, en remontant jusqu’aux documents et explications des projets concernés

Dénomination officielle de l’University of Cambridge

  • Il a fourni, avec sources à l’appui, la dénomination juridique officielle de l’université de Cambridge : The Chancellor, Masters, and Scholars of the University of Cambridge
  • En détaillant de manière transparente le processus de raisonnement, il permet aussi de vérifier la fiabilité de la réponse

Historique des grottes et du restaurant sur Exeter Quay

  • Il a élucidé, au terme de plusieurs étapes de recherche et d’analyse de PDF, la structure intérieure d’un restaurant creusé dans la falaise dans le quartier d’Exeter Quay ainsi que son histoire, en établissant qu’il avait été aménagé dans des falaises de grès rouge dans les années 1820-1830
  • Il a montré un mode d’exploration actif, allant jusqu’à chercher des rapports/plans en anglais et, en cas d’échec, rédiger même un brouillon d’e-mail de demande

Comparaison entre Aldi et Lidl

  • Il a longuement analysé la présence d’Aldi et de Lidl au Royaume-Uni, leurs images et leur classement sur le marché, avec des chiffres sur les parts de marché et les évaluations des consommateurs
  • À la demande de l’utilisateur, il a aussi réorganisé le classement selon le critère de la « fanciness » (caractère haut de gamme)

Numérisation de livres par les laboratoires d’IA

  • En dehors du cas d’Anthropic, qui a numérisé de grandes quantités de livres pour constituer des données d’entraînement, il n’a pas pu confirmer si d’autres laboratoires d’IA avaient fait de même, mais il a consigné en détail son exploration des possibilités

La supériorité concrète de la recherche GPT-5

  • Avec la recherche ChatGPT basée sur GPT-5, il devient possible de collecter et d’évaluer des informations plus rapidement, de manière plus systématique et plus large qu’avec un travail manuel
  • L’ergonomie s’est notamment beaucoup améliorée en environnement mobile, ce qui permet de satisfaire sa curiosité ou de mener des recherches du quotidien à tout moment et en tout lieu
  • Il dispose de la capacité à fournir des résultats rapides et riches au point de pouvoir remplacer la fonctionnalité Deep Research d’OpenAI

Ce que cela signifie du point de vue du développement LLM

  • Grâce à la combinaison des techniques de tool calling et de chain-of-thought, la recherche, le raisonnement en chaîne et l’exploration supplémentaire s’enchaînent naturellement dans une même étape de « réflexion »
  • Les techniques de RAG (recherche-génération combinées) peuvent elles aussi être exploitées de façon beaucoup plus puissante grâce à des appels d’outils flexibles en plusieurs étapes et à une intégration de recherche avancée
  • Dans la terminologie d’Anthropic, cela correspond à interleaved thinking, et l’API OpenAI Responses prend en charge un flux similaire

Conseils pour mieux exploiter la recherche

  • Il est possible d’améliorer la qualité de la recherche grâce à une intuition empirique (par exemple en utilisant des indications comme « go deep » pour encourager une enquête plus poussée)
  • Même pour des questions interprétatives sans réponse claire, il produit des résultats utiles et intéressants
  • Comme le suggère la métaphore du « goblin », Research Goblin est une IA de recherche laborieuse mais pas totalement fiable, différente de l’humain, et qui présente donc une grande valeur d’usage

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.