- Pourquoi la réservation de vols est-elle devenue le « Hello World » des démos d’agents IA ?
- Les utilisateurs préfèrent déjà une UX aboutie (par ex. Google Flights) plutôt que de laisser l’IA réserver un vol à leur place
- Une seule erreur peut déclencher un véritable enfer de service client
- Un système intuitif et prévisible est en réalité plus innovant
- L’IA en est encore à ses débuts, et les utilisateurs attendent avant tout de la cohérence et de la prévisibilité
- Exemple : un système à 80 % de précision mais aux résultats cohérents peut être acceptable
À l’inverse, une précision irrégulière de 90 % détruit la confiance
- Beaucoup de projets IA passent cela sous silence et visent des démos tape-à-l’œil et des fonctionnalités excessives → au final, perte de confiance
- De plus en plus d’IDE perdent en transparence
- Les utilisateurs ne savent plus ce que l’IA est en train de faire
- Exemple : l’incident devenu viral sur Reddit où Cursor a supprimé l’ensemble du travail
- Le manque de maîtrise du versioning par l’utilisateur a aussi joué, mais la vraie cause relève de la conception UI/UX
- Une bonne conception doit prévenir les erreurs, expliquer clairement le comportement de l’IA et offrir une fonction d’annulation
- À ses débuts, Cursor :
- proposait une interaction légère et transparente via une interface de tab-completion
- a gagné en popularité grâce à une approche qui construisait progressivement la confiance des utilisateurs
- un design simple et réversible s’est révélé efficace pour réduire la méfiance envers l’IA
- Devin, qui a levé 200 millions de dollars, vise un « agent entièrement autonome »
- Système complexe, réponses lentes, résultats imprévisibles : la confiance s’effondre
- Une approche trop ambitieuse finit au contraire par désorienter les utilisateurs
Rapidité vs fiabilité : le dilemme des équipes de développement IA
- Les équipes IA doivent choisir entre :
- aller vite au risque de faire des erreurs
- faire passer la fiabilité et la stabilité en priorité
- La réponse consiste à se concentrer sur des fonctionnalités capables d’obtenir d’excellents résultats sur un périmètre réduit, puis à les améliorer de façon itérative et régulière
Principe clé : la prévisibilité avant la complexité
- Mieux vaut se concentrer sur des tâches bien comprises que sur des systèmes complexes
- Les agents IA restent profondément transformateurs, mais trois éléments doivent rester au centre :
- fiabilité
- transparence
- prévisibilité
Workflow vs agent
- Le cadrage d’Anthropic : « Si une tâche peut être exprimée sous forme de workflow, mieux vaut construire un workflow plutôt qu’un agent »
- Un workflow est prévisible, contrôlable et simple
- Les agents sont complexes et difficiles à contrôler, et ne devraient donc être utilisés que dans de véritables situations dynamiques
1 commentaires
Avis Hacker News
L’agent de « réservation de vols » est désormais devenu un sujet de plaisanterie. Il a même été mentionné dans la keynote récente de l’événement AI Engineer de Swyx
Des chercheurs de Google DeepMind travaillent actuellement sur des moyens d’améliorer la fiabilité des agents
La réservation de vols est une tâche qu’on ne peut pas confier à une IA
Dans bien des cas, les gens ont tendance à vouloir faire entrer l’IA dans des workflows existants
Mon expérience avec Cursor m’a amené à la conclusion que la fiabilité est primordiale
Je pense que, dans les avancées technologiques des 20 dernières années, la fiabilité est plus importante
Un commentaire dans un fil Reddit sur l’état actuel de la programmation avec l’IA résume bien ce que je ressens
J’ai pour principe que, lorsque l’IA écrit du code, je dois au moins être capable de comprendre ce code
Je pense que le workflow est plus important que les agents
Google Flights offre déjà une UX parfaite