12 points par GN⁺ 2025-08-22 | 1 commentaires | Partager sur WhatsApp
  • Selon un rapport du MIT, 95 % des entreprises dans le monde ne tirent aucun rendement concret de l’adoption de l’IA générative
  • Les entreprises ont largement expérimenté les grands modèles de langage comme ChatGPT et Copilot, mais la plupart des usages se limitent à des gains de productivité
  • Des cas de réussite n’ont été observés que dans 5 % des pilotes IA intégrés, et, dans la majorité des cas, il n’y a eu aucun impact sur le chiffre d’affaires ni sur les bénéfices
  • Les principales raisons sont que l’IA générative s’intègre mal aux processus de travail réels, ne retient pas les retours et ne s’adapte pas bien au contexte
  • Le rapport relativise les craintes d’un remplacement massif des emplois et estime que la réduction de coûts externes est possible, mais qu’une refonte interne ou des licenciements massifs restent peu réalistes à court terme
  • En conclusion, l’IA est plus performante sur des tâches ciblées que comme stratégie globale ; les entreprises devraient donc se concentrer sur des domaines limités où des résultats immédiats sont possibles, plutôt que sur une transformation à l’échelle de toute l’organisation

Investissements des entreprises dans l’IA générative et rentabilité

  • Au cours des trois dernières années, les entreprises ont investi 30 à 40 milliards de dollars dans des projets d’IA générative
  • Mais très peu d’entre elles en ont tiré un rendement économique réel
  • D’après une nouvelle étude du MIT, 95 % des entreprises interrogées déclarent n’avoir constaté aucun gain mesurable malgré l’adoption de l’IA
  • Seuls 5 % des projets pilotes IA créent actuellement une valeur de l’ordre de plusieurs millions de dollars

État de l’adoption des grands modèles de langage et leurs limites

  • Plus de 80 % des grandes entreprises testent ou exploitent en pilote les principaux LLM comme ChatGPT et Copilot
  • Environ 40 % des entreprises ont adopté ces systèmes dans une certaine mesure, mais l’usage reste le plus souvent limité au renforcement de la productivité individuelle des employés
  • L’effet sur le chiffre d’affaires global ou les bénéfices des entreprises est quasi nul

Limites techniques de l’IA générative

  • Les outils d’IA générative s’adaptent souvent mal aux processus opérationnels réels
    • Parmi les problèmes les plus souvent cités : workflows instables, absence d’apprentissage contextuel et mauvaise intégration aux tâches
  • La plupart des modèles d’IA générative ne conservent pas les retours passés et ont du mal à transférer des apprentissages d’un contexte ou d’une tâche à l’autre
  • Selon le rapport, la majorité des systèmes de GenAI sont incapables de maintenir les retours, de s’adapter au contexte et de s’améliorer dans la durée
  • Ces caractéristiques augmentent les coûts d’intégration à long terme en entreprise sans apporter d’amélioration significative de l’efficacité

L’écart entre les attentes business et la réalité

  • Malgré des attentes élevées et des investissements importants dans l’IA générative, cela ne se traduit pas par des réductions de coûts ni par une création de revenus tangible
  • En pratique, elle est surtout utilisée pour des missions limitées comme le service client, le marketing ou la rédaction de documents : elle fait gagner du temps, mais génère peu d’effet direct sur les revenus

Impact sur l’emploi et la structure des organisations

  • Les craintes selon lesquelles l’IA générative provoquerait à court terme une baisse massive de l’emploi reposent sur peu d’éléments solides
  • Son effet devrait surtout se limiter à l’optimisation des coûts externes, comme la réduction des dépenses de sous-traitance, plutôt qu’à une transformation de la structure interne des effectifs
  • Plutôt qu’un remplacement massif et immédiat des salariés, elle devrait surtout permettre de réduire les coûts d’outsourcing

Malentendus technologiques et limites du progrès

  • De nombreux échecs s’expliquent par le fait que les entreprises comprennent mal les capacités réelles et les limites de l’IA
  • L’IA générative peut produire rapidement du texte ou du code, mais elle ne dispose pas d’un apprentissage continu ni de la flexibilité d’un humain
  • Par exemple, un employé peut s’adapter de manière souple à des erreurs passées ou à de nouvelles demandes, alors que l’IA ne peut pas assurer un tel transfert continu de mémoire

Investissements et orientations futures

  • Les investisseurs et les dirigeants misent sur une amélioration continue de la technologie IA, mais, à court terme, les progrès avancent plus lentement que prévu
  • Le rapport suggère qu’il est encore trop tôt pour déployer immédiatement l’IA dans tous les secteurs et tous les workflows
  • Les organisations doivent concentrer leurs déploiements sur des domaines étroits où des effets immédiats et mesurables sont possibles
    • Exemples : automatisation du support client, outils d’assistance au développement, rédaction d’ébauches de documents
  • L’intégration de l’IA à l’échelle de toute l’entreprise reste encore risquée et fortement exposée à l’échec

Conclusion et enseignements

  • La création de valeur en entreprise par l’IA générative reste limitée à quelques cas de réussite
  • Pour la plupart des entreprises, elle n’apporte qu’une aide marginale dans les tâches quotidiennes
  • Le rapport souligne que les entreprises doivent considérer l’IA générative non comme un moteur de croissance global, mais comme un outil limité
  • Les attentes sont élevées, mais tant que les systèmes actuels ne sauront pas s’adapter comme des humains, les entreprises auront du mal à tirer d’importants profits de l’IA

1 commentaires

 
GN⁺ 2025-08-22
Avis sur Hacker News
  • Il y a eu une discussion en doublon cette semaine (162 commentaires) https://news.ycombinator.com/item?id=44941118. Le véritable rapport source non lié dans l’article est https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • Cette personne dit que le rapport ne dit absolument pas la même chose que l’article. Quelques infos partagées : 50 % des budgets gaspillés l’ont été en marketing et ventes ; l’IA pourrait automatiser 2,3 billions de dollars de valeur du travail ; 39 millions de postes seraient affectés ; et les principales causes d’échec mises en avant sont le refus d’adopter de nouveaux outils et le manque de soutien de la direction. Elle trouve qu’on conclut beaucoup trop vite que l’IA ne fonctionne pas. Ce n’est pas ce que dit le rapport.
    • Il est dit que « l’IA automatise 2,3 billions de dollars de valeur du travail et affecte 39 millions de postes », mais à l’heure actuelle, le potentiel d’automatisation de la valeur du travail aux États-Unis n’est que de 2,27 %. Le PIB américain est actuellement de 27 billions de dollars, donc on dit qu’en optimisant 61 milliards de dollars de valeur du travail aux États-Unis, on remplacerait environ 15 % de la population active américaine et on créerait 2,3 billions de dollars de valeur ; je doute que le calcul tienne vraiment. Je me demande aussi qui achèterait tout cela (si ce ne sont pas les travailleurs, qui alors ?). Les investissements IA de 2025 dépassent déjà la moitié de cette somme. Dans ces conditions, je ne sais pas comment mesurer cette « valeur du travail ». Le PIB ne me semble pas être un indicateur adapté.
    • C’est aussi l’impression que j’ai eue en lisant le rapport. Certains médias poussent simplement un récit sensationnaliste pour générer des clics. Ils déforment gravement le contenu réel du rapport. Le problème n’est pas l’échec de l’IA, mais plutôt le fait que les employés n’adoptent pas bien les outils actuels, ou du moins pas ceux fournis par leur entreprise. La « shadow AI economy » qu’ils mentionnent est aussi un vrai problème. Les gens utilisent des abonnements personnels à des LLM au lieu des outils fournis par l’entreprise. Notre université a aussi fourni ChatGPT Enterprise à tous les étudiants et au personnel, mais l’outil est très en retrait par rapport aux dernières versions cloud (par ex. GPT-5). Résultat : faibles taux d’adoption et de rétention. Dans la plupart des cas d’usage, l’utilisation du cloud porte sur des données dont l’usage n’est pas illégal, donc les contraintes sont limitées.
    • Ce passage du rapport m’a particulièrement marqué : dans un cabinet d’avocats de taille intermédiaire, un avocat a acheté pour 50 000 dollars un outil d’analyse de contrats pour l’entreprise, mais dans la pratique, les gens continuent d’utiliser ChatGPT. L’outil IA acheté par l’entreprise produit des résumés trop rigides et se personnalise difficilement, alors que ChatGPT permet de guider la conversation et d’itérer jusqu’au résultat voulu. Autrement dit, il y a ce paradoxe où un outil à 20 dollars donne une satisfaction utilisateur réelle bien supérieure à une solution enterprise coûtant des dizaines de millions de wons. Le rapport explique que c’est ainsi que beaucoup d’entreprises se retrouvent du mauvais côté de la fracture GenAI.
    • Le chiffre de 39 millions de postes affectés est vraiment énorme. La population active américaine est de 163 millions de personnes, donc cela voudrait dire qu’environ un quart est menacé.
    • En réponse au commentaire disant que « beaucoup de gens concluent trop vite que l’IA ne marche pas », quelqu’un partage la célèbre phrase : « Il est difficile de faire comprendre quelque chose à quelqu’un quand son salaire dépend du fait qu’il ne le comprenne pas. »
  • Je dirige actuellement une équipe d’ingénierie IA, donc l’idée que l’IA crée de la valeur correspond évidemment à mes intérêts. Dans notre entreprise, l’adoption de l’IA nous a permis d’économiser plusieurs millions de dollars. Nous exploitons un grand centre d’appels, et auparavant les agents rédigeaient manuellement un résumé de 3 à 5 minutes après chaque appel. Nous avons récemment automatisé les résumés d’appels avec l’IA. La qualité des résumés est meilleure et les humains peuvent se concentrer sur des tâches à plus forte valeur. Ce n’est pas révolutionnaire, mais c’est un gain d’efficacité concret et mesurable.
    • Petit conseil : je suggère de ne pas générer les résumés systématiquement, mais seulement lorsqu’un document est nécessaire. L’audio des appels peut être stocké en Opus 24Kb/s, soit 180KB par minute, puis supprimé après une certaine durée, ce qui peut faire économiser plusieurs millions de dollars supplémentaires par an.
    • Dans notre entreprise, nous utilisons Google Meet et Gemini pour générer des transcriptions de réunions. Mais dans les faits, c’est très imprécis. On ne sait pas toujours qui a parlé, le sens est parfois inversé, il manque du contexte, et l’outil ne comprend pas notre terminologie interne. En pratique, c’est à peine utilisable.
    • Je me demande si les agents du centre d’appels ont vraiment l’impression que les résumés IA sont meilleurs que les leurs. Dans mon cas, je pense que ce serait difficile à utiliser pour des résumés de réunion. J’ai l’impression que cela marche surtout pour des appels à sens unique.
    • Nous avons aussi essayé l’IA pour les résumés de réunion, mais les résultats étaient trop faibles, donc on est revenus à une rédaction manuelle. Je serais curieux de connaître des cas concrets où cela a bien marché, ou s’il y a eu de la formation ou de la personnalisation particulières.
    • Je me demande pourquoi les agents du centre d’appels devaient consacrer 3 à 5 minutes à rédiger un résumé pour chaque appel. Parmi beaucoup de cas d’usage de l’IA, on voit souvent l’automatisation de tâches qui n’auraient pas dû exister. Si personne ne lit les rapports, la qualité des résumés n’a pas d’importance, donc peu importe que l’IA les rédige mal. Dans l’efficacité opérationnelle, le plus important n’est pas d’automatiser les processus inutiles, mais de les supprimer. Au fond, l’IA semble souvent servir à masquer du travail organisationnel gaspillé. Si cette optimisation n’est pas possible, alors peut-être que cela reste utile.
  • Nous sommes en train d’entrer dans le « Trough of disillusionment ». Ce cycle de hype est prévisible. Comme GPT-5 suscite des réactions disant qu’il a déçu après des attentes énormes, cela pourrait marquer la fin du récit « GenAI is over ». Dès qu’on commence à demander le ROI, la réalité apparaît. Les plus lucides se préparent déjà à la prochaine transformation, et d’autres n’ont pas encore atteint le fond de la vallée. On va voir des RP de plus en plus désespérées nous marteler que « cela a une vraie valeur ».
    • Je ne serais pas surpris que la plupart des entreprises aient investi en sachant que c’était du gaspillage, simplement parce qu’elles n’avaient pas le choix vis-à-vis du cours de l’action.
    • Gemini donne une impression assez bonne à chaque mise à jour, mais récemment le rythme des améliorations et la qualité du contenu ont nettement ralenti. J’y vois le signe qu’un mur approche. Une fois une phase de stagnation passée, je pense que les LLM ont plus de chances de rebondir que la computer vision.
    • Sam Altman a survendu les performances de GPT-5. Du point de vue de l’utilisateur, on ne ressent pas de grand bond par rapport à GPT-4. En revanche, le fait que l’approche de routeur dynamique entraînable ait fortement réduit le coût d’inférence est très important. C’est une innovation qui profite davantage à OpenAI et au réseau électrique qu’aux utilisateurs.
    • Quand OpenAI est passé de GPT-3.5-Turbo à GPT-4, le changement était révolutionnaire et il n’y avait pas d’autres modèles. Mais avant même l’arrivée de GPT-5, on avait déjà les séries o, Llama, DeepSeek, Gemini et bien d’autres. À l’avenir, on n’aura plus de saut du type GPT-3.5 vers 4. GPT-5 unifie plusieurs modèles, mais ne peut pas revendiquer le statut de « premier ».
    • Je me demande si c’est pour cela que l’équipe de Windsurf a vendu tôt et quitté le navire.
  • Quelqu’un demande quels sont les cas d’usage réalistes de l’IA qui augmentent réellement le chiffre d’affaires ou réduisent réellement les coûts : 1. génération de contenus en ligne (déjà saturée) 2. remplacement des développeurs junior (gains de productivité limités) 3. remplacement des agents du service client (réduction de coûts, mais peu d’effet sur les revenus) 4. outils d’assistance (écriture, analyse, etc., avec des limites) 5. interactions de nouvelle génération dans les jeux vidéo / personnages robotiques 6. compagnons virtuels IA et NSFW, un marché qui semble pouvoir rester rentable un moment. La personne demande s’il existe d’autres cas plus réalistes.
    • Je travaille sur un projet où des LLM extraient des informations spécifiques à partir de documents semi-structurés, puis les classent et les archivent automatiquement. Nous avons plus de 95 % de précision sans même avoir fait de fine-tuning. Il y aura encore une validation manuelle finale, mais cela représente déjà des centaines d’heures économisées par an. L’IA est très efficace pour l’extraction d’information et la classification.
    • Dans la santé, les notes cliniques, les données et l’interprétation d’images sont directement liées aux revenus. Chaque année, des milliards de dollars de coûts administratifs sont consacrés à cela. Si GenAI améliore fortement la qualité et la précision des notes, cela peut augmenter directement le chiffre d’affaires. Même chose dans l’assurance, où il faut énormément de documentation et de vérifications. Au final, on aura peut-être des IA qui ne feront que s’envoyer mutuellement des documents pendant que les humains seront assis au bord de la piscine.
    • Le service client par IA est une expérience agaçante du point de vue de l’utilisateur.
    • Une hausse de productivité de 50 % pour 200 dollars par mois, c’est une valeur énorme. Dans la plupart des pays, la croissance annuelle de la productivité est de 0 à 2 %.
    • J’aimerais avoir une IA qui relie la documentation interne, le wiki et la base de code via du RAG pour faciliter l’onboarding et la recherche d’informations. Au lieu de remplacer les humains, il vaudrait mieux chercher à rendre le travail plus facile.
  • La plus grosse erreur des gens, c’est de penser qu’il faut voir l’IA comme un service alors qu’il faut la voir comme une fonctionnalité. Personne ne se dit : « Aujourd’hui, j’ai envie de parler à une IA ! » Les utilisateurs veulent simplement terminer leur travail correctement, sans s’ennuyer ni être submergés. Dans ce cas, l’IA doit aider discrètement. Mais comme ce que nous vendons, ce n’est pas une fonctionnalité mais un service (= un produit), le marketing n’a pas d’autre choix que de mettre l’IA au premier plan. Notion, Slack, Airtable, etc. mettent tous l’IA en gros titre, mais l’essentiel, ce n’est pas l’IA, c’est la nature du travail qu’elle aide à accomplir.
    • Pour moi, l’IA n’est même pas une fonctionnalité ; au fond, c’est une technologie. On ne se dit pas « j’aimerais qu’on mette de l’IA dans ce produit », mais plutôt « j’aimerais pouvoir accomplir cette tâche ». Si le produit résout mon problème, peu importe la méthode. Trop d’entreprises essaient d’intégrer de l’IA pour elle-même, au lieu de se concentrer sur le problème que l’utilisateur veut résoudre.
    • C’est vrai, mais en pratique, si on raisonne ainsi, les valorisations élevées et l’ambiance de surchauffe du marché disparaissent. Quand ce moment de lucidité arrivera, même les derniers secteurs logiciels encore « hot » s’éteindront, et l’industrie devra accepter qu’elle n’est plus le marché qu’elle était il y a 5 à 10 ans.
    • J’aimerais que l’IA soit présentée comme un simple outil de plus. Une seule fenêtre d’info du type « voici quelques cas d’usage » suffirait. En réalité, toutes les interfaces sont maintenant couvertes de logos IA, d’autocomplétion, etc., ce qui nuit à la concentration. On a l’impression que l’outil n’est plus un outil, mais le personnage principal. En pratique, il suffirait de guider l’utilisateur pour qu’il s’en serve selon ses besoins, mais on a surtout l’impression qu’on essaie de lui enfoncer ça de force. Ces entreprises devraient ralentir un peu et laisser davantage la main à l’utilisateur.
    • Je suis totalement d’accord : au final, ce qui compte, c’est la valeur du produit lui-même, pas ce qui est utilisé en dessous.
    • Aujourd’hui, presque toutes les applications qui intègrent de l’IA ressemblent à des « solutions en quête de problème ».
  • Le lien PDF du rapport redirige vers une landing page, et le CTA dit « faites réussir votre produit IA plus vite », ce qui donne davantage l’impression de content marketing ordinaire que de rapport objectif. J’ai cliqué sur le nom de l’auteur et il n’y avait rien. Ni le site ni l’auteur ne m’inspirent confiance. HN devient lui aussi comme Reddit : on entre juste en lisant le titre, puis on poste un commentaire pour dire si l’on est d’accord ou non.
  • Je me demande ce qu’il se serait passé si les gens avaient vraiment lu le rapport https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf. Seules 40 % des entreprises ont un abonnement officiel à un LLM, mais plus de 90 % des employés utilisent au quotidien des outils IA personnels pour leur travail. En réalité, presque tous les employés utilisent un LLM d’une manière ou d’une autre. Les utilisateurs de « shadow AI » exploitent les LLM plusieurs fois par jour pendant que les projets IA officiels de leur entreprise restent bloqués au stade pilote. C’est cette situation paradoxale : les initiatives IA officielles des entreprises échouent, alors qu’en réalité l’usage des LLM se diffuse à l’intérieur de l’entreprise. Cette histoire pourrait ne pas être une nouvelle bombe comme l’article le présente, mais au contraire raconter tout autre chose.
  • On dirait encore une fois que les États-Unis prennent toujours de l’avance à chaque innovation technologique. Ils dépensent beaucoup et perdent parfois beaucoup, mais ils acceptent aussi le risque, ce qui leur permet au final de prendre une avance impossible à rattraper. Il est dangereux de déclarer trop tôt la victoire contre l’IA ou contre les entreprises américaines.
    • Je ne pense pas qu’on puisse généraliser en disant que les États-Unis sont en tête dans tous les domaines. Dans plusieurs secteurs comme la finance, ils sont en retard sur d’autres pays. La Chine est devant dans les véhicules électriques, le solaire, etc. Pour le logiciel, d’accord, mais la défense américaine repose aussi sur des monopoles, du lock-in et des réglementations conçues pour les plus riches.
    • Cette façon de penser est trop simpliste. Elle risque plutôt de déformer la réalité.
    • En citant le solaire, les véhicules électriques, les drones, etc., quelqu’un explique qu’on ne peut pas dire que les États-Unis sont forcément toujours devant.
    • En évoquant aussi l’histoire du GSM, quelqu’un avance que les États-Unis n’ont pas toujours mené l’innovation.
  • Il est intéressant de voir que l’autoévaluation de sa propre productivité peut diverger de la réalité. Dans une étude de METR, les développeurs avaient l’impression d’être 20 % plus rapides grâce à l’IA, alors qu’en réalité ils étaient 19 % plus lents https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • Il y a beaucoup de nuances que même ce type d’étude saisit difficilement : le type d’IA utilisé, les outils employés, le degré de familiarité, le processus de développement, la taille de l’équipe, le niveau d’expérience et de minutie de l’utilisateur, etc., influencent tous les résultats. Pour l’instant, les investisseurs subventionnent massivement les prix de l’IA pour gagner des parts de marché, mais une fois cette période terminée, les prix pourraient même encore baisser. Personnellement, j’estime déjà avoir beaucoup profité des progrès de l’IA ; la suite sera sans doute surtout faite d’améliorations incrémentales et d’une meilleure expérience utilisateur. Je n’ai pas l’intention d’investir dans des entreprises d’IA pour l’instant.
    • Parfois, l’IA semble lire parfaitement dans mes pensées, comme un autocompléteur ; d’autres fois, elle ne propose que des absurdités et ne fait que me gêner.
    • Je me demande aussi si l’IA ne risque pas de pousser les gens à se concentrer uniquement sur des améliorations trop détaillées, « in the weeds », au point de perdre de vue l’ensemble. La vitesse de développement se joue peut-être davantage dans les décisions stratégiques globales (ai-je vraiment besoin de cet outil ? cette fonctionnalité est-elle vraiment nécessaire ?) que dans l’exécution.
    • L’échantillon est petit, mais cela reste une étude bien plus significative que des anecdotes ou des données auto-déclarées.