Anthropic a synthétisé, à partir de son expérience réelle en production, les 3 modèles de workflow pour agents IA les plus utilisés en pratique et les points clés pour savoir quand choisir chacun.
Message clé
- Plus le nombre d’agents augmente, plus la structure (le workflow) devient importante
- Mauvais modèle → latence↑, coûts↑, fiabilité↓
- Les modèles ne suppriment pas l’autonomie : ils définissent le périmètre de cette autonomie
1. Workflow séquentiel (Sequential)
- Exécution étape par étape dans l’ordre (A → B → C)
- Adapté : quand la dépendance entre les étapes est nette
Ex. : copy marketing → traduction → relecture
extraction de données de documents → validation du schéma → chargement en base de données - Avantage : chaque agent se concentre sur une seule tâche → précision ↑
- Inconvénient : la latence augmente à cause de l’attente entre les étapes
- Conseil : ne partez pas systématiquement sur du multi-step ; testez d’abord sérieusement avec un agent unique
2. Workflow parallèle (Parallel)
- Répartir des tâches indépendantes entre plusieurs agents en même temps → puis regrouper les résultats (fan-out → fan-in)
- Adapté : quand plusieurs dimensions doivent être évaluées simultanément
Ex. : revue de code (répartition par type de vulnérabilité)
analyse de documents (thème, sentiment et vérification des faits en parallèle)
évaluation qualité sous plusieurs angles - Avantage : séparation facile des préoccupations par équipe, optimisation individuelle possible
- Inconvénient : de nombreux appels API simultanés augmentent les coûts ; la logique d’agrégation des résultats (majorité ? pondération ? priorité aux experts ?) doit être conçue explicitement
3. Workflow évaluateur-optimiseur (Evaluator-Optimizer)
- L’agent de génération et l’agent d’évaluation échangent des retours de façon itérative
- Génération → évaluation → correction → évaluation… (jusqu’à atteindre le niveau de qualité cible ou le nombre maximal d’itérations)
- Adapté : pour les tâches où la qualité est critique
Ex. : génération automatique de documentation API
communication client (respect du ton et des politiques)
rédaction de requêtes SQL sensibles sur le plan de la sécurité - Avantage : spécialiser la génération et l’évaluation → meilleure qualité finale
- Inconvénient : forte consommation de tokens et de temps → définir impérativement des conditions d’arrêt (nombre maximal d’itérations + seuil de qualité)
Principes d’application en pratique (important !)
- Commencer par la solution la plus simple
Si un agent unique suffit → terminé
Si le séquentiel suffit → terminé
Si le premier résultat respecte les critères → terminé - N’augmenter la complexité que si nécessaire
- Les trois modèles sont combinables (insérer du parallèle dans un séquentiel, évaluateurs parallèles dans une boucle d’évaluation, etc.)
Aucun commentaire pour le moment.