Au-delà des bots : les agents IA mènent la prochaine vague de l’automatisation en entreprise

xguru · 2024-10-07T11:21:01+09:00

Tous les emplois peuvent être vus comme un ensemble de tâches partagées entre humains et machines Les logiciels prennent en charge de plus en plus de tâches, mais la plupart des processus métier restent encore pilotés par des humains Les agents IA devraient transformer de manière décisive cet équilibre du travail Contrairement aux générations précédentes de logiciels, ils peuvent automatiser dynamiquement des processus de bout en bout grâce à une nouvelle architecture cognitive Il ne s’agit pas simplement d’une IA capable de lire et d’écrire, mais d’une IA capable de décider du flux de la logique applicative et d’agir à la place de l’utilisateur, ce qui représente la plus grande opportunité des LLM dans l’entreprise Ce n’est pas simplement du RPA ? : limites et problèmes du RPA Cela peut sembler familier, car UiPath et Zapier vendent depuis dix ans une vision similaire sous le nom de "bot automation" UiPath, géant du RPA, automatise des processus comme l’extraction d’informations depuis des documents, le déplacement de dossiers, le remplissage de formulaires ou la mise à jour de bases de données en enregistrant le comportement des utilisateurs via le screen scraping et l’automatisation GUI, puis en reproduisant des étapes séquentielles Par la suite, des fournisseurs d’iPaaS comme Zapier ont introduit une approche plus légère d’"automatisation via API", mais, contrairement à UiPath, avec un périmètre limité à l’automatisation des applications web UiPath et Zapier ont validé le marché de plateformes horizontales d’automatisation composables et fondées sur des règles, destinées à traiter la longue traîne des processus d’entreprise présents au sein des systèmes logiciels et entre eux, selon les départements ou les secteurs Mais à mesure que les entreprises ont voulu faire passer à l’échelle l’automatisation fondée sur des bots, l’écart entre les capacités des architectures existantes et l’autonomie promise a commencé à apparaître Cela demande encore beaucoup de main-d’œuvre et de travail manuel. La création et la maintenance des automatisations restent douloureusement manuelles L’automatisation par UI est fragile et les intégrations API restent limitées. L’automatisation UI casse souvent quand l’interface d’un logiciel change, et les API, bien que plus stables, s’intègrent beaucoup moins aux logiciels legacy ou on-premise Elle ne sait pas traiter les données non structurées. Or 80 % des données d’entreprise sont non structurées ou semi-structurées, et l’automatisation fondée sur des séquences ne peut pas travailler intelligemment avec elles Les solutions RPA et iPaaS existantes restent menottées à des architectures déterministes, même lorsqu’elles tentent d’intégrer des LLM L’Autopilot de UiPath et les AI Actions de Zapier n’utilisent les LLM que pour des sous-modèles d’agents, comme le passage du texte à l’action, ou des nœuds dédiés à la recherche sémantique, à la synthèse et à la génération en one-shot Ces fonctions IA peuvent être puissantes, mais elles passent encore à côté des usages plus transformateurs des LLM dans l’automatisation des processus Les agents IA sont fondamentalement différents en tant que moteurs de décision Contrairement aux bots RPA ou aux applications RAG d’aujourd’hui, les agents occupent la place centrale du flux de contrôle d’une application en tant que moteur de décision Pour la première fois, ils rendent possibles l’adaptabilité, les actions en plusieurs étapes, le raisonnement complexe et une gestion robuste des exceptions Prenons l’exemple du rapprochement de factures (Invoice Reconciliation) : dans un diagramme simplifié de processus visant à faire correspondre un nouveau PDF de facture avec le grand livre de l’entreprise, la complexité du workflow devient rapidement difficile à gérer Rien qu’au sein des trois premiers ensembles de décisions, il devient presque impossible de prendre en compte toutes les situations d’exception pertinentes Un bot RPA qui exécute ce workflow comme un robot produit souvent des erreurs et escalade vers un humain en cas de correspondance partielle ou d’élément manquant Mais si l’on applique un agent au même workflow, les performances sont nettement supérieures Adaptation aux situations nouvelles : en s’appuyant sur un raisonnement élémentaire et sur le contexte métier pertinent, il peut reconnaître et intégrer intelligemment de nouvelles sources de données, de nouveaux formats de facture, des conventions de nommage, des numéros de compte, des changements de politique, etc. Travail en plusieurs étapes : si le montant d’une facture ne correspond pas, il peut mener une enquête en plusieurs étapes, par exemple en examinant les e-mails récents du fournisseur pour vérifier une éventuelle modification de prix Démonstration de raisonnement complexe : si une facture d’un fournisseur international doit être rapprochée du grand livre, il faut rechercher et calculer ensemble plusieurs éléments comme la devise de la facture, la devise du grand livre, la date de transaction, les variations de taux de change, les frais transfrontaliers et les frais bancaires. Un agent peut exécuter ce type d’intelligence, là où un bot RPA escaladerait vers un humain Prise en compte de l’incertitude : face à des exceptions comme des erreurs d’arrondi sur des lignes individuelles ou des chiffres illisibles, il peut traiter le cas de manière robuste à partir du contexte, comme la correspondance du montant total de la commande, l’historique et la fréquence des factures Cartographie du marché des agents IA Les agents IA ne relèvent plus de la science-fiction. Des startups aux entreprises du Fortune 500, ces systèmes sont déjà achetés et utilisés à grande échelle Aujourd’hui, le marché des agents peut être visualisé selon deux dimensions principales : la spécificité métier et l’autonomie du LLM Spécificité métier : cela va d’agents spécialisés pour des secteurs verticaux ou des départements, comme la santé ou le support client, jusqu’à des plateformes d’agents horizontales aux fonctions larges et généralistes Autonomie du LLM : cela désigne le degré auquel le modèle de langage peut planifier et diriger de manière indépendante la logique de l’application Dans le coin supérieur droit de cette cartographie se trouvent les agents les plus horizontaux et les plus généralisables Enterprise agent : plateforme scalable permettant de construire et gérer des agents couvrant plusieurs fonctions et workflows, à l’aide de SOP en langage naturel ou de règles similaires à celles que l’on fournirait à un nouvel employé. La plupart utilisent une architecture d’"agent on rails", où l’agent doit être ancré, pour chaque nouveau processus, dans un ensemble prédéfini d’actions, de contexte métier et de garde-fous Browser agent : suit une conception de "general AI agent" en s’appuyant sur des vision transformers entraînés sur différentes interfaces logicielles et bases de code sous-jacentes afin d’automatiser la navigation web, les tâches d’interface visuelle, la saisie de texte, etc. Ils gagnent en généralisabilité, mais tendent à sacrifier la cohérence Services alimentés par l’IA : comme les conceptions d’"agent on rails" exigent dans la pratique une vaste infrastructure de données et des garde-fous pour vraiment fonctionner, des entreprises comme Distyl ou Agnetic proposent des services d’ingénierie forward-deployed pour combler l’écart avec les clients, selon un modèle de type "Palantir for AI" Mais tous les agents ne visent pas à être horizontaux et généralisables. Les agents spécialisés par domaine et par workflow, qui peuvent gagner en fiabilité en limitant le type de problème traité, se multiplient Vertical agent : les opportunités les plus prometteuses se trouvent dans les processus manuels et procéduraux qu’un humain exécute en suivant des SOP ou des règles. Le support client, le recrutement, les tâches de développement logiciel comme la revue de code, les tests et la maintenance, la prospection commerciale à froid ou encore les opérations de sécurité en sont des catégories représentatives AI assistant : une autre façon de resserrer le périmètre d’un agent consiste à se focaliser non pas sur un domaine, mais sur une tâche spécifique. Contrairement aux processus complexes de bout en bout pris en charge par les agents d’entreprise et verticaux, ils accomplissent des tâches plus simples et davantage axées sur la productivité Sans être des agents à proprement parler, des solutions d’IA générative construites autour d’architectures RAG entrent parfois en concurrence avec les solutions fondées sur des agents pour les mêmes budgets et workflows Vertical AI : la plateforme d’automatisation médicale Tennr fait avancer le traitement des orientations en extrayant des données non structurées depuis diverses sources comme les fax, les PDF et les appels téléphoniques, puis en les saisissant dans l’EHR des cliniques, supprimant ainsi la nécessité de saisie manuelle par le personnel RAG-as-a-Service : des entreprises comme Danswer ou Gradient permettent aux clients d’interroger des sources de données non structurées comme des PDF et d’en extraire des données pour les injecter dans des bases ou systèmes plus structurés Enterprise search : Glean, Perplexity, Sana et d’autres proposent des requêtes sémantiques afin de mieux gérer la connaissance à l’échelle de l’organisation et de démanteler les silos de données, en indexant et retrouvant des documents conceptuellement liés L’avenir de l’automatisation en entreprise La deuxième vague de l’IA générative sera définie non pas simplement par la capacité à lire et écrire, mais par des agents capables de penser et d’agir à la place de l’utilisateur À mesure que ces architectures mûriront, elles deviendront un puissant catalyseur de la conquête de l’économie des services par l’IA

(menlovc.com)

9 points par xguru 2024-10-07 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Tous les emplois peuvent être vus comme un ensemble de tâches partagées entre humains et machines
Les logiciels prennent en charge de plus en plus de tâches, mais la plupart des processus métier restent encore pilotés par des humains
Les agents IA devraient transformer de manière décisive cet équilibre du travail
Contrairement aux générations précédentes de logiciels, ils peuvent automatiser dynamiquement des processus de bout en bout grâce à une nouvelle architecture cognitive
Il ne s’agit pas simplement d’une IA capable de lire et d’écrire, mais d’une IA capable de décider du flux de la logique applicative et d’agir à la place de l’utilisateur, ce qui représente la plus grande opportunité des LLM dans l’entreprise

Ce n’est pas simplement du RPA ? : limites et problèmes du RPA

Cela peut sembler familier, car UiPath et Zapier vendent depuis dix ans une vision similaire sous le nom de "bot automation"
UiPath, géant du RPA, automatise des processus comme l’extraction d’informations depuis des documents, le déplacement de dossiers, le remplissage de formulaires ou la mise à jour de bases de données en enregistrant le comportement des utilisateurs via le screen scraping et l’automatisation GUI, puis en reproduisant des étapes séquentielles
Par la suite, des fournisseurs d’iPaaS comme Zapier ont introduit une approche plus légère d’"automatisation via API", mais, contrairement à UiPath, avec un périmètre limité à l’automatisation des applications web
UiPath et Zapier ont validé le marché de plateformes horizontales d’automatisation composables et fondées sur des règles, destinées à traiter la longue traîne des processus d’entreprise présents au sein des systèmes logiciels et entre eux, selon les départements ou les secteurs
Mais à mesure que les entreprises ont voulu faire passer à l’échelle l’automatisation fondée sur des bots, l’écart entre les capacités des architectures existantes et l’autonomie promise a commencé à apparaître
- Cela demande encore beaucoup de main-d’œuvre et de travail manuel. La création et la maintenance des automatisations restent douloureusement manuelles
- L’automatisation par UI est fragile et les intégrations API restent limitées. L’automatisation UI casse souvent quand l’interface d’un logiciel change, et les API, bien que plus stables, s’intègrent beaucoup moins aux logiciels legacy ou on-premise
- Elle ne sait pas traiter les données non structurées. Or 80 % des données d’entreprise sont non structurées ou semi-structurées, et l’automatisation fondée sur des séquences ne peut pas travailler intelligemment avec elles
Les solutions RPA et iPaaS existantes restent menottées à des architectures déterministes, même lorsqu’elles tentent d’intégrer des LLM
- L’Autopilot de UiPath et les AI Actions de Zapier n’utilisent les LLM que pour des sous-modèles d’agents, comme le passage du texte à l’action, ou des nœuds dédiés à la recherche sémantique, à la synthèse et à la génération en one-shot
Ces fonctions IA peuvent être puissantes, mais elles passent encore à côté des usages plus transformateurs des LLM dans l’automatisation des processus

Les agents IA sont fondamentalement différents en tant que moteurs de décision

Contrairement aux bots RPA ou aux applications RAG d’aujourd’hui, les agents occupent la place centrale du flux de contrôle d’une application en tant que moteur de décision
Pour la première fois, ils rendent possibles l’adaptabilité, les actions en plusieurs étapes, le raisonnement complexe et une gestion robuste des exceptions
Prenons l’exemple du rapprochement de factures (Invoice Reconciliation) : dans un diagramme simplifié de processus visant à faire correspondre un nouveau PDF de facture avec le grand livre de l’entreprise, la complexité du workflow devient rapidement difficile à gérer
- Rien qu’au sein des trois premiers ensembles de décisions, il devient presque impossible de prendre en compte toutes les situations d’exception pertinentes
- Un bot RPA qui exécute ce workflow comme un robot produit souvent des erreurs et escalade vers un humain en cas de correspondance partielle ou d’élément manquant
Mais si l’on applique un agent au même workflow, les performances sont nettement supérieures
- Adaptation aux situations nouvelles : en s’appuyant sur un raisonnement élémentaire et sur le contexte métier pertinent, il peut reconnaître et intégrer intelligemment de nouvelles sources de données, de nouveaux formats de facture, des conventions de nommage, des numéros de compte, des changements de politique, etc.
- Travail en plusieurs étapes : si le montant d’une facture ne correspond pas, il peut mener une enquête en plusieurs étapes, par exemple en examinant les e-mails récents du fournisseur pour vérifier une éventuelle modification de prix
- Démonstration de raisonnement complexe : si une facture d’un fournisseur international doit être rapprochée du grand livre, il faut rechercher et calculer ensemble plusieurs éléments comme la devise de la facture, la devise du grand livre, la date de transaction, les variations de taux de change, les frais transfrontaliers et les frais bancaires. Un agent peut exécuter ce type d’intelligence, là où un bot RPA escaladerait vers un humain
- Prise en compte de l’incertitude : face à des exceptions comme des erreurs d’arrondi sur des lignes individuelles ou des chiffres illisibles, il peut traiter le cas de manière robuste à partir du contexte, comme la correspondance du montant total de la commande, l’historique et la fréquence des factures

Cartographie du marché des agents IA

Les agents IA ne relèvent plus de la science-fiction. Des startups aux entreprises du Fortune 500, ces systèmes sont déjà achetés et utilisés à grande échelle
Aujourd’hui, le marché des agents peut être visualisé selon deux dimensions principales : la spécificité métier et l’autonomie du LLM
- Spécificité métier : cela va d’agents spécialisés pour des secteurs verticaux ou des départements, comme la santé ou le support client, jusqu’à des plateformes d’agents horizontales aux fonctions larges et généralistes
- Autonomie du LLM : cela désigne le degré auquel le modèle de langage peut planifier et diriger de manière indépendante la logique de l’application
Dans le coin supérieur droit de cette cartographie se trouvent les agents les plus horizontaux et les plus généralisables
- Enterprise agent : plateforme scalable permettant de construire et gérer des agents couvrant plusieurs fonctions et workflows, à l’aide de SOP en langage naturel ou de règles similaires à celles que l’on fournirait à un nouvel employé. La plupart utilisent une architecture d’"agent on rails", où l’agent doit être ancré, pour chaque nouveau processus, dans un ensemble prédéfini d’actions, de contexte métier et de garde-fous
- Browser agent : suit une conception de "general AI agent" en s’appuyant sur des vision transformers entraînés sur différentes interfaces logicielles et bases de code sous-jacentes afin d’automatiser la navigation web, les tâches d’interface visuelle, la saisie de texte, etc. Ils gagnent en généralisabilité, mais tendent à sacrifier la cohérence
- Services alimentés par l’IA : comme les conceptions d’"agent on rails" exigent dans la pratique une vaste infrastructure de données et des garde-fous pour vraiment fonctionner, des entreprises comme Distyl ou Agnetic proposent des services d’ingénierie forward-deployed pour combler l’écart avec les clients, selon un modèle de type "Palantir for AI"
Mais tous les agents ne visent pas à être horizontaux et généralisables. Les agents spécialisés par domaine et par workflow, qui peuvent gagner en fiabilité en limitant le type de problème traité, se multiplient
- Vertical agent : les opportunités les plus prometteuses se trouvent dans les processus manuels et procéduraux qu’un humain exécute en suivant des SOP ou des règles. Le support client, le recrutement, les tâches de développement logiciel comme la revue de code, les tests et la maintenance, la prospection commerciale à froid ou encore les opérations de sécurité en sont des catégories représentatives
- AI assistant : une autre façon de resserrer le périmètre d’un agent consiste à se focaliser non pas sur un domaine, mais sur une tâche spécifique. Contrairement aux processus complexes de bout en bout pris en charge par les agents d’entreprise et verticaux, ils accomplissent des tâches plus simples et davantage axées sur la productivité
Sans être des agents à proprement parler, des solutions d’IA générative construites autour d’architectures RAG entrent parfois en concurrence avec les solutions fondées sur des agents pour les mêmes budgets et workflows
- Vertical AI : la plateforme d’automatisation médicale Tennr fait avancer le traitement des orientations en extrayant des données non structurées depuis diverses sources comme les fax, les PDF et les appels téléphoniques, puis en les saisissant dans l’EHR des cliniques, supprimant ainsi la nécessité de saisie manuelle par le personnel
- RAG-as-a-Service : des entreprises comme Danswer ou Gradient permettent aux clients d’interroger des sources de données non structurées comme des PDF et d’en extraire des données pour les injecter dans des bases ou systèmes plus structurés
- Enterprise search : Glean, Perplexity, Sana et d’autres proposent des requêtes sémantiques afin de mieux gérer la connaissance à l’échelle de l’organisation et de démanteler les silos de données, en indexant et retrouvant des documents conceptuellement liés

L’avenir de l’automatisation en entreprise

La deuxième vague de l’IA générative sera définie non pas simplement par la capacité à lire et écrire, mais par des agents capables de penser et d’agir à la place de l’utilisateur
À mesure que ces architectures mûriront, elles deviendront un puissant catalyseur de la conquête de l’économie des services par l’IA