18 points par GN⁺ 2026-02-23 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Le software engineering représente environ 50 % de l’ensemble des appels d’outils d’agents IA, tandis que 16 verticaux comme la santé, le droit ou la finance restent chacun sous les 5 %
  • Les capacités réelles des modèles d’IA atteignent un niveau où ils peuvent accomplir des tâches qui prendraient 5 heures à un humain, mais en usage réel, les sessions au 99,9e percentile ne durent qu’environ 42 minutes, ce qui révèle un fort écart entre capacité et confiance
  • À mesure que l’expérience utilisateur s’accumule, le taux d’approbation automatique passe de 20 % à plus de 40 %, tandis que les utilisateurs expérimentés font évoluer leur stratégie de supervision d’une approbation préalable vers une surveillance active
  • Le cœur de la vertical AI repose sur l’intégration de données propriétaires, le context engineering spécialisé par domaine et la conduite du changement chez le client, ce qui distingue un simple wrapper d’une entreprise réellement défendable
  • De la même manière que le SaaS a fait émerger plus de 170 licornes au cours des dernières décennies, il est possible que chaque licorne SaaS trouve son équivalent en licorne de vertical AI, avec des versions IA capables de remplacer non seulement le logiciel, mais aussi l’opérateur

Le software engineering capte la moitié de l’activité des agents IA

  • Selon une étude d’Anthropic sur l’usage réel des agents IA, le software engineering représente 49,7 % des appels d’outils agentiques
  • La santé ne pèse que 1 %, le droit 0,9 % et l’éducation 1,8 %, et aucun des 16 verticaux ne dépasse 9 %
  • Cela montre non pas un marché saturé, mais un marché encore en cours de formation
  • Han Wang décrit cela comme une opportunité greenfield que la plupart des fondateurs négligent
  • L’auteur de l’article, Garry Tan, indique que « si je créais une startup aujourd’hui, je surveillerais la zone rouge de ce graphique »

Le deployment overhang

  • Selon l’évaluation METR, les modèles Claude peuvent accomplir des tâches qui prendraient 5 heures à un humain, mais les sessions réelles ne durent en moyenne que 42 minutes
  • L’écart entre ce que l’IA peut faire et ce que les utilisateurs acceptent de lui confier constitue une opportunité majeure
  • Entre octobre 2025 et janvier 2026, la durée des tours au 99,9e percentile a presque doublé, passant de moins de 25 minutes à plus de 45 minutes
    • Cela reflète non seulement l’amélioration des modèles, mais aussi l’accumulation de confiance par les utilisateurs au fil des sessions
  • D’après des données internes, le taux de réussite de Claude Code a doublé, tandis que les interventions humaines par session sont passées de 5,4 à 3,3
  • Les capacités du modèle sont suffisantes, mais le déploiement ne suit pas encore, ce qui ouvre de nouvelles opportunités produit

Comment la confiance évolue

  • Les nouveaux utilisateurs n’accordent une approbation automatique qu’à 20 % des sessions Claude Code, mais après 750 sessions d’expérience, plus de 40 % passent en approbation entièrement automatique
  • De manière contre-intuitive, les utilisateurs expérimentés interviennent non pas moins, mais davantage — taux d’intervention de 5 % chez les débutants contre 9 % chez les experts
    • Ce n’est pas une contradiction, mais un changement de stratégie de supervision : les débutants approuvent chaque étape à l’avance, tandis que les utilisateurs aguerris délèguent puis interviennent en cas de problème (approbation préalable → surveillance active)
  • Côté sécurité, une observation ressort : sur les tâches complexes, Claude Code pose des questions de vérification plus de deux fois plus souvent que les humains n’interviennent
    • L’agent ne poursuit donc pas aveuglément, mais s’arrête de lui-même en cas d’incertitude
  • Le principal enseignement d’Anthropic : l’autonomie réellement exercée par un agent est co-construite par le modèle, l’utilisateur et le produit

Le playbook de la vertical AI selon Aaron Levie

  • La formule proposée par Aaron Levie pour construire une vertical AI :
    • Comprendre les données, workflows et barrières réglementaires propres à chaque industrie est au cœur d’une entreprise hautement défendable
    • Il ne suffit pas d’un simple wrapper ; il faut des capacités d’intégration de données propres, d’automatisation des workflows et de conduite du changement
    • Construire un logiciel agentique connecté à des données propriétaires
    • Concevoir le logiciel pour qu’il fonctionne en adéquation avec des personnes réelles et des problèmes concrets
    • Maximiser l’intelligence des sorties grâce à un context engineering spécialisé par domaine
    • Ce que la plupart des fondateurs oublient : piloter la conduite du changement (change management) chez le client
  • Si la vertical AI est défendable, c’est que tout le monde peut créer un wrapper, mais rares sont ceux qui savent naviguer dans des workflows concrets, des contraintes réglementaires et des frictions organisationnelles comme la facturation santé, la discovery juridique ou les permis de construire
  • Le SaaS a connu une croissance multipliée par 10 à chaque décennie sur plusieurs décennies, plus de 40 % des investissements VC des 20 dernières années s’y sont concentrés, et il a fait émerger plus de 170 licornes SaaS
  • Thèse centrale : à chaque licorne SaaS pourrait correspondre une licorne de vertical AI, et la version IA pourrait être 10 fois plus grande puisqu’elle peut remplacer non seulement le logiciel, mais aussi l’opérateur

Insight de co-construction et implications pour les politiques

  • Découverte clé d’Anthropic :
    • L’autonomie n’est pas une propriété intrinsèque du modèle ; elle est co-construite par le modèle, l’utilisateur et le produit
    • Les évaluations préalables au déploiement ne suffisent pas à la capturer, d’où la nécessité de mesures en environnement réel
  • Côté sécurité : 73 % des appels d’outils impliquent une intervention humaine, et 0,8 % seulement sont classés comme actions irréversibles
    • Les déploiements les plus risqués (fuite de clés API, trading crypto autonome, etc.) relèvent surtout d’évaluations de sécurité plutôt que de véritables usages en production
  • Une politique consistant à « approuver chaque action » ne fait que nuire à la productivité sans améliorer la sécurité ; un meilleur objectif est de garantir que l’humain puisse surveiller et intervenir

Là où se cachent les licornes

  • Le software engineering est déjà bien occupé, tandis que la santé, le droit, la finance, l’éducation, le service client, la logistique et d’autres encore forment 16 verticaux à part de marché à un chiffre qui attendent encore quelqu’un capable d’intégrer l’expertise métier dans des agents
  • Après l’émergence de 300 licornes SaaS, viendra celle de 300 licornes de vertical AI
  • Les fondateurs qui choisiront un vertical, intégreront l’expertise métier dans les agents et résoudront la conduite du changement détiendront l’enterprise software des dix prochaines années
  • Les modèles peuvent déjà travailler pendant 5 heures, mais les utilisateurs ne leur en accordent que 42 minutes
    • Cela montre que nous n’en sommes qu’aux premiers stades de l’adoption de l’IA
    • Et cela suggère qu’il existe encore de nombreux domaines où pas même une minute d’intelligence n’a été appliquée

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.