36 points par GN⁺ 20 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • La stratégie Advisor est désormais officiellement introduite sur Claude Platform — un schéma qui combine Opus comme conseiller et Sonnet ou Haiku comme exécuteur (executor) afin d’apporter aux agents des capacités de raisonnement proches du niveau d’Opus tout en réduisant les coûts
  • Lorsque Sonnet exécute une tâche avec un conseiller Opus plutôt que seul, le score SWE-bench Multilingual progresse de 2,7 points, tandis que le coût par tâche agentique baisse de 11,9 %
  • La combinaison Haiku + conseiller Opus a enregistré une performance de 41,2 % sur BrowseComp, soit plus du double de Haiku seul (19,7 %), tout en réduisant le coût de 85 % par rapport à Sonnet seul
  • En déclarant l’outil advisor_20260301 dans une requête Messages API, le transfert entre modèles s’effectue dans une seule requête /v1/messages, sans aller-retour supplémentaire ni gestion de contexte
  • Les jetons du conseiller sont facturés au tarif du modèle conseiller, et ceux de l’exécuteur au tarif du modèle exécuteur, ce qui permet un suivi et un contrôle des coûts

Vue d’ensemble de la stratégie Advisor

  • Sonnet ou Haiku agit comme exécuteur et prend en charge la tâche de bout en bout, y compris les appels d’outils, la lecture des résultats et les opérations itératives
  • Lorsque l’exécuteur atteint une décision difficile à résoudre de manière raisonnable, il demande des indications à Opus ; Opus consulte alors le contexte partagé et renvoie soit un plan, soit une correction, soit un signal d’arrêt
  • Le conseiller (Opus) n’appelle pas directement les outils et ne génère pas de sortie destinée à l’utilisateur ; il fournit uniquement des indications à l’exécuteur
  • Cette architecture inverse le schéma classique de sous-agents, où un grand modèle orchestrateur décompose le travail et le délègue à de petits modèles workers, et fonctionne sans pool de workers ni logique d’orchestration séparée
  • Le raisonnement de niveau frontier n’est appliqué que lorsque l’exécuteur en a besoin, tandis que le reste de l’exécution conserve le coût du modèle exécuteur

Résultats des évaluations de performance

  • La combinaison Sonnet + conseiller Opus affiche un gain de 2,7 points sur SWE-bench Multilingual par rapport à Sonnet seul, avec un coût par tâche agentique réduit de 11,9 %
  • Sur les benchmarks BrowseComp et Terminal-Bench 2.0, les scores progressent également par rapport à Sonnet seul, tandis que le coût par tâche diminue
  • Haiku + conseiller Opus : score BrowseComp de 41,2 % — soit plus du double de Haiku seul (19,7 %)
    • Le score reste inférieur de 29 % à celui de Sonnet seul, mais le coût par tâche baisse de 85 %
    • L’ajout du conseiller augmente le coût par rapport à Haiku seul, mais le coût combiné reste malgré tout bien inférieur à celui de Sonnet

Utilisation de l’outil Advisor

  • En déclarant advisor_20260301 dans une requête Messages API, le transfert entre modèles est effectué dans une seule requête /v1/messages — sans aller-retour supplémentaire ni gestion de contexte
  • Le modèle exécuteur décide lui-même quand appeler le conseiller ; un contexte sélectionné est transmis au modèle conseiller, qui renvoie ensuite un plan
  • Le paramètre max_uses permet de définir un plafond sur le nombre d’appels au conseiller par requête
  • Les jetons du conseiller sont signalés séparément dans le bloc usage, ce qui permet de suivre les dépenses par palier
  • Il peut être utilisé dans la même boucle que les outils existants (recherche web, exécution de code, etc.)
response = client.messages.create(  
    model="claude-sonnet-4-6",  # executor  
    tools=[  
        {  
            "type": "advisor_20260301",  
            "name": "advisor",  
            "model": "claude-opus-4-6",  
            "max_uses": 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)  

Structure tarifaire

  • Les jetons du conseiller sont facturés au tarif du modèle conseiller (Opus), et les jetons de l’exécuteur au tarif du modèle exécuteur (Sonnet/Haiku)
  • Comme le conseiller ne génère que de courts plans (généralement 400 à 700 jetons de texte) et que la sortie complète est traitée par l’exécuteur à un coût unitaire plus faible, le coût total reste nettement inférieur à une exécution uniquement sur le modèle conseiller

Retours utilisateurs

  • Ingénieur ML chez Eve Legal : « Haiku 4.5 étend dynamiquement son intelligence en consultant Opus 4.6 selon la complexité, et atteint une qualité de niveau frontier pour un coût cinq fois inférieur »
  • CEO de Bolt : « Sur les tâches complexes, cela permet de prendre de meilleures décisions d’architecture, sans surcoût sur les tâches simples — la différence entre la planification et la trajectoire d’exécution est flagrante »
  • CTO de Genspark : « Amélioration nette sur les tours d’agent, les appels d’outils et le score global — de meilleurs résultats que notre outil de planification développé en interne »

Pour commencer

  • Actuellement disponible en bêta sur Claude Platform
  • Procédure de démarrage :
    1. Ajouter l’en-tête de fonctionnalité bêta : anthropic-beta: advisor-tool-2026-03-01
    2. Ajouter advisor_20260301 à la requête Messages API
    3. Adapter le prompt système à votre cas d’usage
  • Il est recommandé de comparer, dans votre suite d’évaluation existante, les trois configurations suivantes : Sonnet seul / Sonnet + conseiller Opus / Opus seul

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.