10 points par GN⁺ 2026-01-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Au fil des projets, on observe de façon répétée une évolution depuis la simple écriture de scripts vers la construction d’agents IA autonomes
  • Lorsqu’on accorde aux outils en cours de développement un droit d’accès aux outils, un simple modèle conversationnel se transforme en agent capable de planifier, d’exécuter et d’itérer
  • Les classifieurs ou la logique fondée sur des conditions finissent par être remplacés par une architecture d’agent, et une structure simple centrée sur les appels d’outils choisis par le modèle est plus souple et plus puissante
  • Le rôle humain passe de Human-in-the-Loop à Human-on-the-Loop, et la tâche centrale devient la définition des objectifs et des garde-fous
  • Plus que la complexité du code, c’est la gestion de la confiance et du jugement qui devient essentielle, et les agents s’imposent comme des systèmes qui grandissent avec les développeurs

De simples scripts à la convergence vers les agents

  • La plupart des projets IA menés au cours de 2025 ont finalement abouti à une forme d’agent
  • Un script simple structuré en entrée·traitement·sortie évolue en agent en ajoutant une boucle d’itération, un ensemble d’outils et du parsing JSON
  • Définition personnelle d’un agent : un modèle exécuté dans une boucle avec accès à des outils
  • Autrement dit, si on lui laisse assez de temps, tout projet IA converge vers un agent

L’attraction vers l’autonomie

  • Au-delà de la simple automatisation, le logiciel passe à une étape où il juge et agit de lui-même, comme un « stagiaire numérique »
    • Gemini Scribe n’était au départ qu’un simple plugin de chat pour Obsidian, mais une fois l’accès à l’outil read_file autorisé, il a géré lui-même le contexte et l’exécution
    • L’utilisateur n’a plus à gérer manuellement l’entrée du modèle et ne transmet plus que des instructions de haut niveau comme « lis le compte rendu de réunion et résume-le »
  • Ce changement marque le passage de la conversation à la délégation, avec une architecture où l’agent prend en charge la planification, l’exécution et l’itération

Du script à Sudoers

  • Pendant le développement de Gemini CLI, le modèle, en utilisant un outil d’exécution de commandes, est allé au-delà du simple générateur de code pour devenir un exécutant autonome
    • Le modèle entre dans une boucle où il lance des tests, détecte les échecs, se corrige puis relance
  • Dans ce processus, les enjeux de sécurité et de confiance deviennent saillants, ce qui rend nécessaire un système de politiques de séparation des autorisations comparable au fichier sudoers
    • Un simple script n’a pas besoin d’un moteur de politiques, mais pour un agent, des garde-fous destinés à prévenir les erreurs de jugement sont indispensables

L’agent qui voulait être un classifieur

  • Dans le projet Podcast RAG, un classifieur IA a été créé pour orienter la recherche selon la requête de l’utilisateur, mais ses limites sont apparues
    • La logique de classification ne reflétait pas pleinement l’intention de l’utilisateur et bridait par du code un jugement que le modèle savait déjà bien produire
  • La solution a consisté à supprimer le classifieur et à fournir à l’agent les deux outils search_descriptions et search_episodes
    • L’agent choisit les outils selon la situation, les utilise en parallèle si besoin, et réalise une recherche plus souple
  • Dans Gemini Scribe également, la logique complexe de prédiction du contexte a été retirée au profit d’une structure simplifiée d’appels d’outils lisant les fichiers au moment nécessaire
  • Cela mène à un critère de développement : « si vous décidez avec des if/else ce que l’IA doit faire, c’est que vous êtes déjà en train de construire un agent »

La transition vers Human-on-the-Loop

  • Le rôle humain passe d’une structure où chaque étape est approuvée à un rôle de supervision qui ne fixe que les objectifs et les limites
    • Comme l’agent travaille sans intervention humaine continue, il est indispensable de définir clairement les objectifs, les limites et le traitement des exceptions
  • Sans garde-fous appropriés, l’agent risque aussi de rester bloqué dans l’attente d’une entrée ou de s’engager sur une voie improductive
  • L’humain ne joue plus le rôle d’exécutant, mais celui de superviseur et de fixeur de frontières, chargé d’orienter le système

Accepter la complexité

  • Construire des agents n’est pas aussi difficile qu’il y paraît et peut même simplifier le système en supprimant les embranchements conditionnels et la logique de gestion des exceptions
    • Comme le modèle juge selon la situation, la logique prédictive en amont devient inutile
  • La vraie complexité ne réside pas dans le code, mais dans la confiance et la délégation du jugement
    • Les développeurs doivent se concentrer moins sur les erreurs de syntaxe que sur une conception qui empêche les erreurs de jugement
  • Contrairement à un script figé, un agent est un système qui évolue en fonction des demandes des utilisateurs et cherche de meilleures méthodes
  • Dès que l’on ressent le besoin d’ajouter des définitions d’outils à un simple script, c’est qu’on est déjà entré dans la phase de construction d’un agent

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.