1 points par GN⁺ 2 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Chez Amazon, les employés subissent une pression pour intégrer davantage d’IA dans leur travail, mais comme les points d’application restent flous, cela génère des tâches inutiles
  • Certains employés utilisent l’outil interne MeshClaw pour créer des agents destinés à augmenter l’activité liée à l’IA plutôt qu’à améliorer la productivité
  • Les employés estiment que le suivi de la consommation de tokens IA a installé une culture où le volume d’usage passe avant la qualité
  • Amazon affirme ne disposer ni d’indicateurs globaux sur l’IA ni de classement interne, mais des employés disent qu’il existe un objectif d’utilisation de 80 % ainsi qu’un suivi
  • OpenClaw et MeshClaw, exécutés en local, offrent davantage d’autonomie, mais les risques augmentent lorsque des autorisations d’accès trop larges leur sont accordées

Pression autour de l’usage de l’IA et recours à MeshClaw

  • Chez Amazon, les employés sont poussés à intégrer davantage d’IA dans leurs flux de travail, mais sans indication claire sur les usages pertinents, ce qui accroît le risque de voir des ressources IA mobilisées pour des tâches inutiles
  • Selon un article du Financial Times, certains employés d’Amazon utilisent l’outil interne d’IA MeshClaw pour créer des agents superflus visant surtout à faire gonfler l’activité IA plutôt qu’à améliorer la productivité
  • Un employé a déclaré : « Il y a énormément de pression pour utiliser ces outils », ajoutant que certains se servent de MeshClaw pour maximiser l’usage des tokens

Désaccords autour des indicateurs d’usage

  • Les employés estiment qu’en suivant la consommation de tokens IA, Amazon a poussé certains collègues à privilégier la quantité d’usage technologique plutôt que sa qualité
  • Plusieurs employés anonymes d’Amazon estiment que l’augmentation des attentes en matière d’usage de l’IA dégrade l’environnement de travail
  • Amazon aurait indiqué à ses employés que les statistiques d’usage de l’IA n’entrent pas dans l’évaluation des performances, mais tous ne semblent pas le croire
  • Un autre employé considère que le suivi de l’usage crée des incitations perverses et pousse certaines personnes à adopter un comportement très compétitif
  • Les employés interrogés affirment que l’entreprise s’est fixé comme objectif que 80 % des développeurs utilisent l’IA chaque semaine, et que la consommation de tokens des employés est suivie dans un classement interne
  • Un porte-parole d’Amazon a déclaré qu’il n’existait ni indicateur global sur l’usage de l’IA à l’échelle de l’entreprise, ni classement interne permettant de comparer les employés entre eux
  • Selon Amazon, les employés peuvent consulter leur propre niveau d’usage de l’IA dans un tableau de bord individuel

OpenClaw et les risques de l’exécution locale

  • MeshClaw, que certains employés d’Amazon utiliseraient pour gonfler artificiellement leur niveau d’usage de l’IA, est un outil inspiré d’un autre outil d’IA, OpenClaw
  • OpenClaw et MeshClaw, contrairement à d’autres modèles d’IA, s’exécutent en local sur le propre matériel de l’utilisateur, ce qui leur confère une plus grande autonomie
  • Plus tôt cette année, la directrice de l’alignement chez Meta Superintelligence Labs a fait parler d’elle après qu’OpenClaw a failli supprimer l’intégralité de sa boîte de réception, mettant en lumière les risques liés à l’octroi d’autorisations d’accès excessives à l’IA

1 commentaires

 
GN⁺ 2 시간 전
Réactions sur Hacker News
  • Ce n’est pas propre à Amazon : on a l’impression que toute la grande tech et même certaines plus petites boîtes deviennent folles en même temps
    C’est un peu comme si le PDG disait un jour : « Il faut encourager les dépenses de déplacement, donc réservez autant de voyages que possible et dépensez un maximum d’argent. Prenez la première classe pour aller dans les bureaux satellites, une limousine au lieu d’un Uber, mangez dans des restos haut de gamme. Si vous ne dépensez pas assez en frais de déplacement, vous serez mal noté à l’évaluation. »
    On vit vraiment une époque complètement anormale

    • C’est ce qui m’a poussé à créer le nouvel outil CLI Burn, Baby, Burn : https://github.com/dtnewman/burn-baby-burn/tree/main
      Si j’étais vice-président chez Amazon, j’étudierais même une offre de rachat, et je travaille aussi sur une version enterprise avec des fonctionnalités supplémentaires
      Show HN : https://news.ycombinator.com/item?id=48151287
    • Quelqu’un à qui on avait demandé d’utiliser davantage l’IA au travail a créé un agent qui ne faisait que brûler des tokens, et a fini par en consommer environ 10 fois plus que l’employé suivant
      Il pensait se faire réprimander, mais il a au contraire été félicité et on lui a même demandé de faire une courte présentation pour expliquer sa méthode aux autres
    • Dans mon entreprise, les dépenses IA font partie de l’évaluation et on nous dit que la « singularité » est arrivée
      Désormais, 20 % de nos dépenses d’infrastructure sont des tokens, et le nombre hebdomadaire de pull requests par développeur est passé de 4,2 à 5,1
      Une grande partie correspond juste à des agents qui changent une ou deux lignes de fichier de config, donc tout ça ressemble à de la pensée magique
    • Mon père travaillait au début des années 90 dans une entreprise qui avait sa propre agence de voyages, et on lui réservait souvent des vols plus chers parce que c’était plus rentable pour l’agence
      Sur d’autres vols, il aurait pu voyager en première classe pour moins cher, mais la politique de l’entreprise interdisait la première classe
      En fait, on a toujours vécu à des époques anormales
    • Certaines entreprises se sont peut-être laissé convaincre par le marketing qui promettait que l’IA rendrait chaque employé 10 000 fois plus productif et ferait économiser des milliards de dollars
      Comme cela ne s’est pas produit, elles semblent supposer que c’est parce que les employés n’utilisent pas assez souvent l’IA magique
      Les entreprises qui construisent leurs propres produits IA peuvent aussi vouloir que leurs employés utilisent l’IA autant que possible afin de récupérer des données d’entraînement pour remplacer ensuite la plupart, voire la totalité, de ces employés
      Punir les salariés qui refusent d’entraîner leur propre remplaçant IA peut leur sembler rationnel si elles considèrent que le coût présent sera largement compensé par les économies futures
  • J’ai assisté il y a environ six mois à une présentation d’un employé AWS sur des outils IA adaptés à notre cas d’usage
    En plein milieu, pendant le partage d’écran, il a soudain dit : « Regardez combien de tokens j’ai utilisés ce mois-ci. Je fais tourner Opus à fond », et le chiffre était insultant de grandeur
    Je me suis alors dit : « Drôle de flex. Vu le prix de ce truc, le simple fait d’en utiliser autant n’est-il pas déjà un signal d’alerte ? »
    Il a montré plusieurs cas d’usage de Claude Code pour gérer et ajuster de l’infrastructure AWS, mais à mes yeux de vieux sysadmin barbu plus âgé qu’Internet, cela ressemblait surtout à : « on a utilisé l’IA pour faire quelque chose qui tenait en une seule commande »
    Donc cette histoire me paraît crédible. Ils étaient déjà encouragés à en faire un usage débridé il y a six mois

    • Une grande partie des suggestions de Cursor correspond à des choses que le linter devrait corriger automatiquement
      Mais si vous appuyez sur tab, cette ligne est comptée comme une ligne modifiée par l’IA
      Une bonne partie du reste, on aurait déjà pu la faire à vitesse comparable en apprenant juste le multi-cursor, les déplacements vim et les macros
      En pratique, je ne les ai jamais vraiment appris parce que je n’ai jamais été assez lent à écrire du code à l’écran pour que cela devienne le goulot d’étranglement
    • Je ne sais toujours pas comment concilier ce genre de témoignages avec l’idée qu’un développement assisté par des agents d’IA générative serait désormais, surtout dans les startups, la seule manière de travailler
      Ce n’est probablement pas binaire et cela dépend sans doute de plusieurs facteurs, mais c’est étrange de voir circuler simultanément des récits aussi contradictoires
    • Beaucoup de grands fonds d’investissement ont probablement des intérêts fortement imbriqués non seulement dans plusieurs entreprises tech, mais aussi dans OpenAI et Anthropic
      Du coup, on comprend mieux d’où peuvent venir ces injonctions, et pourquoi elles ne sont ni prudentes ni équilibrées
    • Avec le temps, à mesure que les couches d’abstraction s’empilent, les générations suivantes finissent par ne plus comprendre les couches inférieures
      C’est une grande faiblesse dans le développement de systèmes, et cela peut devenir une énorme surface d’attaque pour un adversaire
    • « On a utilisé l’IA pour faire quelque chose qui tenait en une seule commande » est au contraire une bonne chose
      Une part importante de la valeur de l’IA est précisément là
      Il n’est plus nécessaire de connaître cette commande, il suffit de comprendre le contrat fonctionnel pour accomplir le travail nécessaire
      C’est un changement énorme
  • On voit passer beaucoup d’histoires du genre « il fallait utiliser des tokens, alors on les a gaspillés inutilement », ce qui est difficile à croire en pleine urgence climatique
    À ce rythme, on pourrait bien pousser jusqu’à +3 °C de réchauffement
    Ça me fait penser à l’histoire selon laquelle l’URSS a failli conduire les baleines à la quasi-extinction juste pour atteindre des quotas de viande de baleine dont personne ne voulait manger

    • Plus l’économie devient dirigée d’en haut, plus elle commence à ressembler à l’URSS
      On a de facto une planification centrale, avec toutes les pathologies du système ; la seule différence avec l’Union soviétique, c’est que notre GOSPLAN est dirigé par quelques personnes devenues riches par hasard ou en arrosant les bonnes personnes
    • C’est donc pour ça qu’on rase des forêts entières pour construire de nouveaux data centers ?
      Non pas pour un « vrai » gain de productivité, mais juste pour consommer des tokens
    • Pas d’inquiétude : on continue d’utiliser des pailles en papier, parce que c’est ça le vrai sujet important
      Si vous ne brûlez pas de tokens, vous n’atteindrez pas vos KPI, et vous risquez d’être étiqueté comme luddiste et viré avant même que l’IA vous prenne votre poste
      J’adhère à l’idée que cette dynamique et les va-t-en-guerre sont en train de bousiller la planète
    • L’URSS ne représentait qu’environ 15 % des prises mondiales de baleines, et le numéro un était le Japon
      L’affirmation selon laquelle « personne n’en voulait » manque aussi de fondement
    • Mais au fond, que peut-on y faire ? Moi non plus je n’ai pas envie d’être pénalisé au travail
      Heureusement, je travaille côté gestion d’applications et je sais qu’on ne peut voir que la dernière date d’utilisation, donc une requête par jour suffit
      Mais je suis vraiment épuisé par cette surchauffe autour de l’IA
  • Je travaille dans une FAANG, mais pas chez Amazon, et j’ai beaucoup entendu ce genre d’histoires en interne comme en externe
    Cela dit, je n’ai jamais entendu les personnes importantes, c’est-à-dire la direction, le dire officiellement
    Ça commence toujours par des rumeurs ou par des dashboards et des métriques bricolés par quelqu’un en interne, puis ça prend de l’ampleur
    J’ai aussi entendu des dirigeants dire : « Ce n’est pas ce que nous regardons, et il ne faut pas gaspiller des tokens coûteux »
    Bien sûr, il est déjà arrivé qu’on utilise des métriques absurdes comme le nombre de lignes de code ou de commits sans vraiment l’assumer pleinement, mais je ne crois pas que ce soit aussi simple que plus il y a de tokens, mieux c’est

    • Je suis aussi dans une FAANG, et lors de la réunion hebdomadaire des managers, la direction encourage l’augmentation de l’usage des tokens
      Quand on répond que ce n’est pas une bonne métrique et qu’elle est très facile à détourner, la direction l’admet… puis enchaîne immédiatement en nous disant d’augmenter quand même la dépense de tokens de nos équipes
      Je le sais parce qu’il existe un dashboard de suivi des tokens que la direction consulte et qu’elle affiche directement en réunion
      Heureusement, cela n’a pas encore été rendu public sous forme de classement pour tout le monde
      Il y a beaucoup de rumeurs selon lesquelles la dépense de tokens entrera dans les évaluations ; la direction le nie, puis organise de nouvelles réunions sur l’importance d’augmenter cette dépense et discute des insuffisances visibles dans le dashboard
    • Je fais partie d’un grand groupe de pairs parmi les engineering managers, et la surconsommation de tokens IA devient un problème de plus en plus important
      Dans les entreprises qui créent des classements de consommation de tokens ou laissent entendre que les ingénieurs refusant les outils IA pourraient être licenciés, le problème explose
      Une course à qui brûlera le plus de tokens pour survivre s’enclenche alors
      C’est particulièrement marqué chez les développeurs qui lisent beaucoup les réseaux sociaux
      Sur Twitter, Threads, Mastodon, LinkedIn, etc., les récits viraux sur la nécessité de devenir AI-native et de licencier ceux qui n’utilisent pas assez l’IA sont recyclés en boucle, et les développeurs anxieux finissent par croire qu’ils doivent brûler plus de tokens que leurs collègues pour éviter d’être inclus dans la prochaine vague de licenciements
    • J’ai quitté récemment une FAANG, et juste avant mon départ, le directeur de notre organisation s’est fait remonter les bretelles par le VP de sa ligne hiérarchique parce que l’usage des tokens dans l’organisation était trop faible
      Ensuite, on a dit aux contributeurs individuels de l’organisation qu’ils devaient utiliser l’IA pour tout, sous peine de conséquences possibles sur leur carrière
    • Même dans le conseil enterprise, ça devient de plus en plus ridicule
      On enchaîne les formations obligatoires, ateliers et hackathons pour « encourager » l’usage de l’IA dans le travail quotidien
      Même pour des tâches qu’un simple shell script ferait très bien, on demande : « comment pourrait-on transformer ça en agent ? »
    • Chez nous, cela vient réellement d’en haut
      On a beaucoup payé pour Copilot, donc ils veulent voir les gens s’en servir
  • Le but est peut-être précisément d’amener les gens à jouer avec la métrique
    Si on pousse les gens à utiliser davantage l’IA, ils essaient, expérimentent et « gaspillent » du temps tout en apprenant
    C’est peut-être le véritable objectif
    En ce moment, ils brûlent des tokens sur des tâches inutiles pour découvrir où cela aide vraiment
    Et c’est aussi comme ça qu’ils apprennent où cela n’aide pas
    Mon entreprise fait la même chose

    • Si on leur demande d’installer meshclaw et de brûler des tokens à outrance, ce n’est plus la même histoire
    • C’est exactement ça, le point
      Oui, cela peut être gaspilleur, mais c’est aussi la façon la plus rapide d’explorer où l’IA peut réellement être utile à l’entreprise
      Même si 80 % des employés ne font que gaspiller des tokens, les 20 % restants sont en train de trouver comment s’en servir
    • Désolé, mais c’est complètement délirant
      Si on a tant d’argent à brûler, je peux imaginer de pires manières de le gaspiller, mais si on est sérieux, c’est idiot
      A-t-on déjà vu des entreprises dépenser des millions de dollars et autant de temps humain pour « découvrir à quoi cet outil pourrait bien servir » ?
      C’est une solution à la recherche d’un problème
      Si, au départ, on n’a pas une idée claire des problèmes que cet outil résout, il faut l’abandonner et passer à autre chose
      L’argent restant vaudrait mieux être rendu aux salariés et aux actionnaires
  • C’est dommage que l’IA dispose désormais d’un programme de revenu universel de base en emploi, alors que les humains n’en ont toujours pas
    Les entreprises paient des IA pour creuser des trous, puis d’autres IA pour les reboucher
    [1] https://locusmag.com/feature/cory-doctorow-full-employment/

    • Cela a déjà existé
      L’URSS a atteint le plein emploi à 100 % il y a longtemps[0], avec la pauvreté qui allait avec
      Ce n’est pas la même chose ici, puisque ce n’est pas financé par l’impôt
      Des entreprises privées expérimentent avec leur propre argent et prennent aussi le risque de voir leurs clients partir ailleurs si les coûts montent plus tard
      C’est bien préférable à un système où l’on donne de l’argent aux gens via l’impôt forcé, indépendamment de la productivité
      [0] https://nintil.com/the-soviet-union-achieving-full-employmen...
  • En interne chez Amazon, avec Kiro, la consommation de tokens est gamifiée
    Ce n’est pas comme chez AWS où les coûts sont refacturés aux équipes, ni comme dans l’ancien système où il fallait justifier la capacité
    Bien avant que quiconque ne regarde des classements internes, il était déjà crédible d’entendre que les gens jouaient avec cette métrique, et les utilisateurs enthousiastes créent et partagent toutes sortes de projets internes
    Il est certain que les managers, qui entendent dans les présentations internes des promesses du type N00 % de gain de productivité, exercent une pression, mais là où je suis, on repérerait assez vite quelqu’un qui fabrique de faux travaux au lieu de faire son vrai boulot
    La pression vient plutôt de délais agressifs et du passage, dans le processus annuel OP1, à un mode de fonctionnement plus agile

  • J’ai entendu des histoires similaires venant d’AWS mais aussi d’employés FAANG hors AWS
    Tous les classements de tokens portent une mention du type « ceci n’est pas pris en compte dans les évaluations », mais avec derrière une impression implicite de clin d’œil entendu
    Dans une organisation dont on m’a parlé, quelqu’un fait tourner GasTown 24 h/24 pour dévorer des tokens
    Il ne contribue pas beaucoup, mais reste confortablement en tête du classement

    • Plusieurs personnes m’ont dit que, dans diverses organisations de taille petite à moyenne, la consommation de tokens et l’adoption de l’IA sont devenues centrales dans les évaluations
    • Mon manager dans notre entreprise de 400 personnes est exactement ce genre de personne
      Il fait tourner GasTown et laisse des agents tripoter toute la base de code, ce qui produit environ 50 commits par jour
      Des versions compatibles, du formatting, ce genre de choses
      Le problème, cependant, ce n’est pas la technologie, c’est lui
      Il était déjà comme ça avant les LLM
      Il « refactorisait » le dépôt en plus petits dépôts pour que son nom se retrouve soudain associé à tout le code, donnant l’impression au premier coup d’œil qu’une grosse partie du code de l’entreprise venait de lui
      Il refusait parfois que je fasse quelque chose, puis le faisait lui-même plus tard
      Il pinaillait sans fin sur mes pull requests, ou me disait carrément qu’il ne fallait pas faire telle chose, avant de se retourner et de l’implémenter lui-même
      Il ne copiais-collait pas mon code, mais après l’ouverture de ma PR, il réimplémentait la même idée qu’il avait refusée
      Il est très intelligent, mais aussi très malhonnête, et très bon pour le dissimuler
      Si on le confronte, il répond des choses comme « je trouvais juste que cette approche serait plus propre »
      Vu de l’extérieur, on peut toujours soutenir qu’une approche vaut mieux qu’une autre, donc la malhonnêteté n’apparaît pas clairement, mais moi je vois à 100 % ce qu’il fait, et le schéma est totalement évident
      En plus, une fois, quand j’ai dit que je prendrais des congés une semaine précise, il ne les a pas refusés explicitement, mais m’a demandé si je pouvais les décaler en disant qu’il y avait une forte pression pour livrer The Thing
      J’ai répondu que non, je ne les décalerais pas, et il a approuvé
      Puis, quand la semaine en question est arrivée, il a lui-même posé des congés cette même semaine
      Je n’ai pas cherché à le confronter là-dessus. Je savais déjà très bien qu’il n’a aucune honte à exiger des autres ce qu’il n’accepterait jamais pour lui-même
  • Si le porte-parole d’Amazon a dit qu’il n’existait ni métrique d’usage de l’IA à l’échelle de l’entreprise, ni classement interne comparant les employés, et que chacun ne voyait que son propre usage dans un dashboard personnel, alors c’est complètement faux
    Il existe un dashboard global qui classe les employés par usage de Kiro/QuickSuite (anciennement Amazon Q) en nombre de tokens
    Le dashboard lui-même est dans QuickSight, qui fait désormais lui aussi partie de QuickSuite
    Les données sont non seulement ouvertes à tout le monde, mais peuvent aussi être triées par rang ainsi que par usage quotidien, hebdomadaire, mensuel ou annuel
    Les employés actuels comme anciens y figurent tous sous leur alias interne
    Il existe même un système interne de « récompenses » visible dans les profils PhoneTool, avec des titres Kiro/AmazonQ/QuickSuite comme « Blaze », « Thunderstorm », etc. attribués aux employés
    On peut cliquer pour voir tous les autres ayant reçu la même récompense
    Pour info, PhoneTool est l’annuaire interne permettant de consulter les profils des autres employés
    De l’autre côté, je connais plusieurs personnes incapables d’écrire elles-mêmes du code correct ou d’intégrer quoi que ce soit directement
    Ces gens qu’il faut constamment tenir par la main produisent d’énormes volumes avec Kiro/AmazonQ et se classent désormais au-dessus des SDE
    Ils ressemblent davantage à des SysDev, des ingénieurs support ou des TPM qu’à des SDE
    Ce n’est pas intrinsèquement bien ou mal, mais si on fait du stack ranking sur la consommation de tokens, les bons ingénieurs qui s’efforcent d’écrire du « bon » code risquent d’être moins bien notés que ceux qui ne cherchent pas des solutions concises
    La qualité finira donc par baisser, et quand la direction comprendra ce qui s’est passé, il sera trop tard
    On a déjà vu des incidents liés à Amazon-Q/Kiro, et pourtant ils continuent à nier

  • Cette tendance arrive aussi chez nous
    Si je n’utilise pas Copilot dans MS Office tous les jours, ça m’envoie une notification agacée, donc je tape juste Hello