Ask HN : à quel moment, en voyant la GenAI, vous vous êtes dit « ah, on est dans la merde » ?

(news.ycombinator.com)

6 points par GN⁺ 2026-06-06 | 4 commentaires | Partager sur WhatsApp

Un fil où l’on partage des retours d’expérience concrets : DALL-E et ChatGPT avaient d’abord été balayés comme des gadgets déjà dépassés, avant que leur usage réel ne révèle l’étendue de leurs capacités et ne provoque un choc
Le cas le plus populaire concerne le reverse engineering de firmware sur du matériel ancien ou abandonné : des expériences de résurrection de synthétiseurs, pianos, Fire Stick, etc. avec Claude/GHIDRA
Au-delà du code, de nombreux exemples montrent l’usage des LLM pour résoudre des problèmes du quotidien dans des domaines non spécialisés comme la réparation d’électroménager, l’inspection immobilière, les litiges juridiques ou le diagnostic HVAC
Certains évoquent aussi des moments de panique plus négatifs : baisse de qualité du code, hallucinations, confiance aveugle sans vérification, inquiétude sur la disparition de métiers
Les moments de bascule diffèrent selon les personnes : sortie de ChatGPT (2022), GPT-2/GPT-3, tool calling, agents, etc., autant de tournants distincts selon les époques

Reverse engineering de firmware et de matériel

Pour remplacer un logiciel abandonné d’un synthétiseur Alesis QS8.1 des années 90, analyse via GHIDRA des commandes sysex et d’un protocole d’encodage d’ondes non documenté, avec un prototype fonctionnel bouclé en une nuit
Après qu’un piano Kawai CA49 a été briqué par un mauvais firmware, Claude a décompilé l’APK Android pour retrouver une clé de chiffrement codée en dur, déchiffrer le firmware et restaurer l’appareil en une heure via un script de flash Bluetooth
Analyse dans GHIDRA du chiffrement Blowfish du DVD The Complete New Yorker, cartographie des identifiants et réimplémentation en script Python pour convertir tous les fichiers en PDF ordinaires
À partir du code source du kernel, sans exploit root public, patch de la mémoire live d’une Amazon Fire Stick de 1re génération via une « primitive kernel zero-write FBUF/VCHIQ », avec root permanent et debloat à la clé
Reverse engineering d’un protocole propriétaire à partir d’un binaire vendeur C++ compilé et d’une courte capture réseau avec le désassembleur NSA Ghidra ; l’auteur dit avoir eu « l’impression d’être rétrogradé en QA non technique »
Avis associés
- Le data moat des SaaS, longtemps entretenu par la difficulté d’intégration et de migration, est en train de disparaître
- Avec Claude Code, reverse engineering depuis l’API interne du MCP d’un SaaS caché derrière une offre enterprise, puis création rapide d’un MCP plus riche en fonctionnalités que l’officiel
- Claude dépend moins que les humains des noms de variables, ce qui réduit le besoin de renaming et de typedef

Résolution de problèmes du quotidien dans des domaines non spécialisés

Pendant les fêtes de 2025, un furnace tombé en panne a été diagnostiqué en vidéo par Gemini ; le ventilateur d’extraction a été relancé à la main pour faire repartir l’installation, même si les commentaires ont averti d’un risque de monoxyde de carbone en cas de contournement de sécurité
- L’auteur précise qu’il ne s’agissait pas d’un contournement, mais simplement d’un coup de pouce au démarrage lié à un problème de roulement, et que le moniteur de monoxyde n’a pas déclenché
En cas de panne de climatisation, ChatGPT a diagnostiqué sur photo la nécessité de remplacer un condensateur à 25 $, permettant une réparation maison pour un quart du coût d’un déplacement de diagnostic
Pour un sèche-linge à gaz qui ne chauffait plus, Gemini a repéré sur photo l’emplacement du thermal fuse et fourni le lien vers la pièce ; un fusible à 5 $ et un nettoyage de conduit ont suffi
Lors d’un achat immobilier, des photos Zillow et les numéros de série des appareils ont servi à générer un rapport d’inspection de maison, qui a identifié risque d’inondation en zone basse, circuit mixte de receptacles, bardage déformé, éléments manqués par un inspecteur payé 750 $
- Certains restent toutefois sceptiques sur la possibilité de déterminer depuis de simples photos si plusieurs prises sont bien sur le même circuit
Sur une pompe de bassin à carpes koi dont le modèle n’était plus lisible, l’identification a été faite à partir de photos et de la longueur mesurée (11 pouces = 4500, 9 pouces = 2500), ce qui a permis un remplacement à 109 $ au lieu d’un devis de 700 $
Dans un litige bancaire pour fraude, ChatGPT, Grok, Claude et Gemini ont été croisés pour mener une contre-attaque judiciaire entièrement assistée par IA, avec au passage des avertissements sur la nécessité de consulter un avocat et sur le caractère non protégé des historiques de chat, potentiellement subpoena-able

Bascule dans les workflows de code et de développement

Après une mise à jour firmware d’une imprimante Brother ayant remplacé une page CSV par du HTML, un seul /init dans un répertoire contenant un HTML statique et un Go « hello world » a suffi pour générer automatiquement en Go un exporter Prometheus, y compris l’IP par défaut et le parsing des métriques
Compression d’une webapp Oracle Apex de 70 000 lignes de PL/SQL en 700 lignes de besoins métier en Markdown en 15 à 20 minutes
Dans une petite ONG, une application surconçue en NextJS, React et microservices a été réécrite à 80 % en rendu serveur Django par Claude pendant la nuit, réduisant coûts serveur et complexité
ChatGPT Code Interpreter (03/2023) chargeant un CSV dans Pandas, produisant des graphiques et exportant vers SQLite : un souvenir présenté comme la première expérience avant même que la catégorie des coding agents ne soit nommée
Expériences de code négatives ou sceptiques
- Exemple d’hallucination où une revue de PR automatisée par IA affirme qu’une PR ayant uniquement supprimé du code « ajoute un nouveau RPC »
- Cas d’un collègue écarté d’un projet après avoir produit des milliers de lignes de slop, notamment en remplaçant assert status == 200 par == 500 simplement pour faire passer les tests
- Scepticisme sur le fait que si les spécifications sont floues, le code devient verbeux ou mal conçu, si bien que le gain de productivité reste limité en termes de qualité réelle et de scalabilité
- Observation selon laquelle, d’Opus 4.6 à 4.7 puis 4.8, les petites capacités progressent, mais la « capacité à savoir quoi faire » se dégrade au contraire

Domaines non liés au code : création, perception, cognition

En montrant une photo de plante à Claude, celui-ci a reconnu l’espèce, posé un diagnostic et expliqué comment faire une bouture ; le choc venait du fait qu’un ordinateur ne « parlait pas d’ordinateurs », mais diagnostiquait une plante
Suno a composé pour le chien de la famille une chanson avec refrain façon K-pop, ce qui a frappé quelqu’un qui pensait que la création distinguait les humains des machines
Après upload d’un dessin anatomique personnel, le modèle a signalé des problèmes comme épaules arrondies, perspective incorrecte, deltoïde non représenté, puis a placé des coordonnées avec un script Python pour annoter l’image
Lors d’une expérience scientifique d’un enfant sur l’électromagnétisme, un appel vidéo Gemini a repéré la gaine isolante non retirée sur la connexion de la batterie avec plus de précision qu’à l’œil nu, ce qui a débloqué le problème
Pour une série d’emoji satiriques sur les présidents américains, suggestion pour Zachary Taylor d’un emoji cerise (en référence à l’anecdote selon laquelle il serait mort après en avoir trop mangé), avec un vrai sentiment de collaboration « comme dans un atelier »

Tournants négatifs ou centrés sur les inquiétudes

Inquiétude face à un collègue envoyant de grosses PR pleines de slop en affirmant qu’aucune revue n’est nécessaire, se méfiant des ingénieurs humains et collant des logs de chat Claude ; d’où l’idée que « le reste de notre carrière consistera à travailler avec des psychoses liées à l’IA »
- Selon cette lecture, les LLM amplifient les capacités — positives comme négatives — et augmenteront les comportements antisociaux
Réaction « on est foutus » face à une implémentation de proxy HTTP dont le raisonnement semblait plausible mais dont le code restait totalement non sécurisé faute de comprendre les RFC
Choc, lors d’un hackathon d’entreprise, en voyant une équipe traiter sans vérification les sorties d’un LLM comme des faits et vouloir les transformer en produit ; « ils croient vraiment que ce générateur de texte raisonne »
Critique des CEO qui promettent le remplacement des cols blancs sous 12 à 18 mois, gonflant excessivement les attentes alors que la réalité — hallucinations et consignes peu fiables — inspire plutôt la défiance
- Malaise aussi face aux pratiques consistant à imposer par voie judiciaire la construction de data centers malgré l’opposition des habitants voisins
Démonstration de la non-déterminisme des LLM : sur une question comme le « nombre de d dans les jours de la semaine », Firefox répond 6 et Chrome 7, montrant qu’il n’y a même pas de cohérence interne

Diversité des moments de bascule selon les périodes

En 2016, le passage de Google Translate aux réseaux neuronaux a rendu la traduction japonais-anglais utile pour la première fois, mais sans vraiment traduire le sens ; puis en 2022, ChatGPT a impressionné par sa gestion des antécédents pronominaux et du contexte des mots polysémiques
Pour certains, l’annonce de GPT-3 a constitué un saut qualitatif, tandis que le chat et le tool calling relèvent davantage d’une évolution d’ingénierie que d’une percée scientifique
D’autres voient GPT-2 et les GAN en 2019 comme le moment où l’on est passé de obviously fake à sometimes real, le reste n’étant surtout qu’une amélioration graduelle
La sortie de ChatGPT le 30/11/2022 a fait pressentir à certains « la fin de l’ère du programmeur traditionnel », avec dès le lendemain un premier test de boucle de coding agentique
En 2025, médaille d’or à l’IMO, capacité à produire des phrases inédites, tool calling, etc. : autant de moments distincts où chacun a eu l’impression que « l’intelligence avait réellement été modélisée »

4 commentaires

xguru 2026-06-06

Il y a clairement beaucoup de choses impressionnantes du côté matériel/firmware.

Je n’avais pas d’app Mac pour un matériel reçu via Kickstarter, mais en lui donnant le binaire de la version Windows et en lui demandant de l’analyser, Codex a créé une fausse DLL contenant les API Windows liées à l’USB, y a injecté du code de hooking, puis a capturé tous les messages échangés ; à partir de là, il m’a recréé une app Mac presque équivalente.

Tout ce que je lui avais demandé, c’était simplement : "Analyse la version Windows et fais-moi une version Mac."

roxie 2026-06-19

Waouh.......... c’est vraiment stupéfiant.

dudnspa0203 2026-06-06

Je pense qu’il est naturel qu’ils deviennent meilleurs sur de nouvelles choses et que leurs fonctionnalités s’améliorent, mais chaque fois que je vois des frais absolument énormes pour quelque chose de simple que j’ai demandé, je me dis qu’on est vraiment dans de beaux draps.

GN⁺ 2026-06-06

Avis sur Hacker News

jzemeocala : J’ai acheté pour presque rien un Alesis QS8.1, un piano numérique/synthétiseur haut de gamme des années 90, mais tous les logiciels liés sont tellement anciens que j’en avais assez de devoir utiliser WINE à chaque fois
J’ai donc voulu créer une alternative moderne et multiplateforme qui regroupe les fonctions de plusieurs programmes ; je pensais que ce serait très difficile, car la communication reposait presque uniquement sur des commandes SysEx, mais Claude m’a guidé pour analyser le logiciel d’origine avec GHIDRA, et un prototype fonctionnel est sorti le soir même ; maintenant, j’y ajoute de nouvelles fonctionnalités
- jsharf : J’ai briqué un piano Kawai CA49 en flashant le mauvais fichier lors d’une mise à jour du firmware, mais Claude a trouvé des signes de vie, téléchargé l’APK Android de Kawai, décompilé le Java, puis retrouvé la clé codée en dur utilisée pour le chiffrement du firmware
  Quand l’OTA n’a pas marché, il a extrait et déchiffré le firmware du piano, puis a même écrit un script de flash pour programmer le piano en Bluetooth depuis mon laptop, si bien que le piano a été ressuscité en moins d’une heure
- gyomu : Ces outils sont incroyablement performants en reverse engineering
  Avec juste un peu de connaissances, analyser n’importe quel protocole et casser un logiciel en quelques heures, voire moins, est devenu trivial ; on n’en parle pas beaucoup ouvertement parce que beaucoup d’acteurs du secteur préféreraient que cela ne se sache pas, mais l’impact est énorme
- notagoodidea : Après avoir vu [0] et le travail de patch du firmware de l’Ableton Move avec Schwung [1], j’aimerais vraiment en savoir plus sur la manière de faire concrètement
  Pas seulement sur du vieux matériel : même sur du matériel récent, les LLM / IA générative poussent davantage de gens à explorer le patching, le remplacement et le développement de nouveaux firmwares
  [0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode : Dès le début
C’était présenté comme un jeu de donjon, avec des descriptions de pièces et moi qui choisissais mes actions ; au départ, je pensais qu’il s’agissait d’un donjon construit sur une base de données complexe
Mais quand j’ai dit que je voulais sortir, puis que ça m’a emmené dans une auberge, que j’ai flirté avec une serveuse de taverne, et qu’on s’est ensuite retrouvés dans une scène à regarder le coucher de soleil dans une prairie, je me suis dit : « là, on a un gros problème »
La machine répondait au langage par le langage, comme si elle simulait la compréhension et l’intelligence ; c’était comme rencontrer pour la première fois un extraterrestre qui connaît ma langue, et j’ai senti que le monde ne serait plus jamais comme avant
monuszero : Il y a quelques années, j’ai ajouté en un sprint d’un mois une fonctionnalité de planification de mouvement robotique à notre codebase, mais le résultat était toujours insatisfaisant
Comme nous étions une petite équipe, nous avions embarqué OMPL en vendor et géré le cache ainsi que la gestion des roadmaps ; je savais aussi qu’une partie des algorithmes utilisés pouvait être parallélisée avec du SIMD ou des kernels GPU, mais je n’étais pas sûr que cela vaille la peine de se battre avec CUDA ou Metal/Accelerate
Un soir, pendant que je cuisinais, j’ai donné à Opus 4.6 la revue de littérature sur les planificateurs nécessaire dans nos docs, puis je lui ai fait implémenter de zéro un roadmap planner accéléré nativement ; au moment où l’eau des pâtes s’est mise à bouillir, l’implémentation était prête, et une planification qui prenait plusieurs secondes dans le code OMPL était tombée à quelques centaines de ms
J’ai alors réalisé que la valeur économique du temps passé à préparer le dîner pouvait désormais se comparer à celle d’un travail de développement honnête de deux semaines ; des choses dont l’investissement en temps était trop risqué ou trop luxueux deviennent des options dignes d’être envisagées
Pour les petites équipes qui savent ce qu’elles veulent et comment configurer un agent pour qu’il réussisse, c’est un vrai game changer, et les acteurs établis feraient bien de se méfier
andrewthornton : Pendant les fêtes de 2025, mon chauffage est tombé en panne, et le rendez-vous de réparation n’était que deux jours plus tard, donc la maison est devenue très froide
Je suis monté au grenier, j’ai filmé plusieurs vidéos du chauffage essayant de démarrer, je les ai données à Gemini, qui a immédiatement diagnostiqué le problème, puis m’a dit de faire tourner un petit ventilateur d’extraction pendant la tentative d’allumage, et le chauffage est reparti tout de suite
J’ai dû répéter la manœuvre plusieurs fois avant l’arrivée du technicien HVAC, mais c’était supportable
- jodacola : Il m’est arrivé quelque chose de similaire cette semaine
  Un locataire dans une maison en location m’a dit que la clim ne refroidissait plus ; j’ai appelé mon prestataire HVAC habituel, et c’est un assistant vocal IA dernier cri qui m’a répondu, mais l’expérience a été atroce ; on m’a dit que le bureau me rappellerait, puis plus rien
  J’y suis donc allé moi-même, j’ai pris une photo du panneau du compresseur de l’unité extérieure et j’ai demandé un diagnostic à ChatGPT ; après plusieurs échanges sur les points à vérifier et les codes de diagnostic, il m’a même guidé vers une réparation simple : remplacer un condensateur à 25 dollars
  Normalement, rien que le déplacement pour le diagnostic aurait coûté presque quatre fois plus ; à cause de l’IA générative, j’ai perdu confiance dans l’entreprise HVAC, et grâce à une autre IA générative, j’ai fini par faire la réparation moi-même en une journée
- brntheater : Cette semaine, mon sèche-linge à gaz s’allumait mais ne chauffait pas, et Gemini a suggéré comme cause fréquente le fusible thermique
  J’ai ouvert le panneau arrière et envoyé une photo ; il m’a indiqué l’emplacement exact du fusible, du style « le rectangle blanc au-dessus des fils bleus et rouges », puis m’a guidé pour le test ; quand je lui ai donné le numéro de modèle du sèche-linge, il a aussi trouvé les liens vers les pièces nécessaires
  Enfin, il a expliqué qu’il était très probable que le fusible ait sauté à cause d’une mauvaise évacuation de la chaleur et m’a recommandé de nettoyer l’aération ; après un nettoyage complet du conduit d’évacuation et le remplacement du fusible à 5 dollars, tout fonctionnait parfaitement
- tonyedgecombe : Je suis en train d’installer une cuisine, et ChatGPT m’aide à valider des idées et à résoudre des problèmes
  Je n’en aurais pas besoin si la documentation d’IKEA n’était pas aussi indigente, mais j’ai l’impression que c’est similaire à l’avantage qu’un développeur débutant peut en tirer
  Un professionnel se moquerait sûrement de mon travail, mais c’est cher, difficile de travailler avec eux, et moi, au moins, j’avance jusqu’au bout
  En revanche, je n’utilise pas l’IA pour le développement, car j’ai peur que mes compétences régressent ou de ne pas apprendre correctement les nouveautés
shreddude : Claude a récemment décompilé le firmware de son camping-car et documenté l’interface CAN, puis a programmé un module ESP32 capable de communiquer avec des systèmes intégrés comme l’alimentation, le HVAC, l’éclairage et les réservoirs
Ce type d’intégration de systèmes embarqués est hors de mon domaine, mais j’utilise Claude tous les jours, autant dans mon travail de Solution Architect que pour mes projets perso, et ça me permet d’avancer sur des projets que je n’aurais même pas pu aborder seul ; j’ai du mal à comprendre les sceptiques de l’IA
- williamdclt : La partie « des projets que je n’aurais même pas pu aborder seul » me semble être exactement ce qui sépare les enthousiastes des sceptiques
  Si on utilise l’IA générative pour faire des choses qu’on ne savait pas faire, c’est un outil incroyable ; mais si on l’utilise pour des choses qu’on maîtrise déjà, ce n’est pas un changement de paradigme, au mieux un petit boost pour un expert
  Le métier de beaucoup de gens consiste justement à faire ce dans quoi ils sont experts
- jesse_dot_id : Je suis ingénieur DevOps, donc plutôt du genre à connaître un peu de tout, et Claude Code comble les trous dans mes connaissances au point de me transformer presque en super-héros
  Mais l’essentiel, c’est sans doute de déjà assez bien comprendre ce qu’on est en train de regarder
- doctorwho42 : Il est possible que le niveau d’investissement soit bien supérieur à la valeur réelle
  Quel est donc le problème à 1 000 milliards de dollars que l’IA résout ?
loudmax : C’était début 2023, quand j’ai récupéré via torrent les poids de 7 Go qui avaient fuité chez Meta et que j’ai lancé alpaca.cpp sur mon desktop
Je lui ai posé une question sur l’Empire romain ; il a répondu en anglais, c’était globalement faux, mais pas pire que les suppositions d’un étudiant américain moyen, avec bien plus d’assurance
L’important, ce n’était pas si la réponse était fiable, mais le fait que ce soit le CPU de mon desktop — et non des serveurs clinquants dans un immense datacenter de Google — qui réponde à une question en anglais
Pouvoir parler en anglais avec un CPU, c’était presque comme parler avec un chien
- stogot : J’ai fait exactement la même chose, et même si c’était lent, j’ai compris qu’on ne reviendrait pas en arrière
  En 3 ans, on a eu une amélioration par 100
jp57 : C’était un moment très simple, l’an dernier, quand j’essayais de comprendre ce qu’il fallait pour tracter la voiture de ma fille à travers le continent avec un camion
Au début, je posais à ChatGPT de petites questions une par une, comme avec Google, puis j’ai fini par demander : « Je veux tracter la voiture A avec le camion B de C à D, quelles sont mes options ? » et il m’a produit un rapport avec tableau comparatif remorque/dolly, calcul du poids tracté, coûts et détails
C’est là que je me suis dit : « C’est différent, et ce n’est encore que le début »
- SamuelAdams : J’ai eu une expérience similaire en utilisant l’IA générative pour évaluer un achat immobilier
  Je lui ai fourni des photos de l’annonce Zillow, les numéros de série des appareils, le panneau électrique et d’autres zones que j’avais moi-même photographiées pendant la visite ; je lui ai demandé de rédiger un rapport comme le ferait un inspecteur immobilier, et il a réellement fait mieux, en trouvant même des problèmes qu’un inspecteur payé 750 dollars avait ratés
- flyinglizard : Il est aussi tout à fait possible que ce résultat soit complètement faux
  Par paresse, j’ai plusieurs fois demandé à Claude et ChatGPT des données simples et déterminées, comme la valeur de couple d’une moto tout-terrain, et ils ont très souvent répondu avec une assurance totale… tout en ayant complètement tort
  Même en mettant le contexte via RAG à partir d’un PDF, je n’ai pas confiance ; pour des données chiffrées exactes, je ne fais jamais confiance à un LLM
yauneyz : Je lui ai demandé d’écrire une courte histoire où Vader et Palpatine découvrent le procédé de Gram-Schmidt
Ce n’était pas un chef-d’œuvre, mais le ton était juste et il comprenait ce qu’était Gram-Schmidt, ce qui m’avait paru complètement dingue à l’époque
AussieWog93 : Littéralement hier soir, j’ai simplement donné à Claude Code un prompt lui disant que Kodi plantait sur un Chromecast 4k quand il tournait, qu’il fallait se connecter en adb, déboguer l’endroit exact du crash et proposer une solution
Sans intervention humaine, il a trouvé la cause du plantage, téléchargé les sources de Kodi, corrigé un bug présent depuis 2016, puis recompilé, signé et poussé le tout sur le Chromecast, en conservant aussi toute la configuration
Je lui ai aussi fait créer une PR ; elle n’est pas encore publiée et je vais encore tester quelques semaines
- darksim905 : Ce n’est pas une comparaison directe, mais quand je vois des outils comme Copilot échouer à simplement consulter la page de profil basique de LinkedIn, je reste curieux mais sceptique quant à la possibilité d’un travail aussi profond
  C’est peut-être faisable, mais je me demande avec quelles technologies et quelle chaîne d’outils on arrive à faire fonctionner ça comme ça
- calf : Pour quelqu’un qui a du mal à trouver des usages utiles aux LLM, c’est impressionnant
  Je me demande si cette tâche a pris plus de quelques minutes, et s’il faut la version payante de Claude Code
evdubs : J’ai testé si un fournisseur de service LLM pouvait réécrire des documents juridiques dans un format cohérent, sans hallucination, afin d’identifier ce qui manquait, et c’était possible
Ensuite, j’ai voulu voir si un LLM local pouvait faire la même chose : Gemma-4 s’en est bien sorti avec une carte vidéo de 8 Go et un grand contexte de 128k, et ce même modèle se débrouillait aussi plutôt bien pour l’OCR et la traduction
C’est là que j’ai compris que les LLM sont excellents pour exécuter une tâche dont je sais déjà ce que je veux, dont je sais déjà comment la faire, dont la compétence acquise a peu de valeur, et que, si je la faisais moi-même, je la ferais probablement à moitié
Désormais, je regarde les choses sous l’angle : « Est-ce que je peux confier à un LLM un truc dont, au fond, je ne me soucierais pas tant que ça ? »
- SoftTalker : Les meilleurs résultats que j’ai obtenus avec les LLM concernaient des tâches dont l’objectif est la lecture, le reformatage, la traduction ou le résumé
  Ce sont des tâches où ils vont bien plus vite qu’un humain et sont moins vulnérables à l’ennui, du moins pour l’instant
- gscott : Mon fils est en procès contre une banque : après avoir mal géré une réclamation frauduleuse et refusé le chargeback, la banque l’a carrément poursuivi pour lui réclamer de l’argent
  Mon fils prépare sa défense dans l’action initiale avec Claude et Gemini, et il gère maintenant aussi la demande reconventionnelle à 100 % avec l’IA
  Il envoie les textes à plusieurs IA pour qu’elles se relisent entre elles et fassent émerger plus d’idées ; il est passé de ChatGPT à Grok puis Claude, et en ce moment c’est Gemini qui produit les résultats les plus solides
- jasondigitized : C’est le genre de chose que je sais faire, mais pour laquelle je n’ai ni le temps ni l’énergie
  La situation du « va me chercher Claude »
kstrauser : au travail, on a un gros budget de tokens, et un collègue qui testait des vulnérabilités a trouvé un exploit distant inquiétant dans un projet connu et m’a demandé un deuxième avis
J’ai lancé le projet en local et exécuté le POC, mais il ne s’est rien passé, et j’ai compris qu’il fallait une configuration qui réduisait les protections de sécurité par défaut
J’ai donc demandé à l’IA de corriger le POC pour qu’il fonctionne aussi avec la configuration par défaut, et quelques minutes plus tard elle l’avait patché en une version militarisée ; l’instance locale que je venais de télécharger, de compiler moi-même et de lancer avec la configuration par défaut a crashé immédiatement
En regardant le curseur clignoter dans la console, j’ai eu des sueurs froides comme si je tenais une bombe d’informations nucléaires, et j’ai tourné dans mon lit toute la nuit pour dormir à peine 30 minutes
En contrepartie, ça a donné à l’équipe une direction éthique claire : puisqu’on peut le faire, il faut le faire et partager les résultats avec les auteurs concernés
Je veux vivre dans un monde où les bonnes personnes corrigent les problèmes avant que les mauvaises ne les trouvent, donc j’ai décidé de contribuer à construire ce monde
- lobf : je me demande ce que POC veut dire ici
  Je ne vois pas de groupe de mots plus haut qui pourrait correspondre à cet acronyme
ddxv : la plupart du temps, quand j’utilise du code généré par un LLM, je me dis « oh, c’est cool ! », mais quelques semaines plus tard, quand je réalise que le code « cool » que le modèle a produit en affirmant qu’il passait les tests contenait un bug subtil et que je ne l’avais pas lu attentivement, c’est là que je me dis « euh ? »
Le plus grand risque, c’est de devenir paresseux, de lui confier d’un coup plusieurs fichiers et beaucoup de changements, puis de YOLO sans comprendre complètement ce qu’il a fait
Pour le front-end, ça passe généralement, mais pour les opérations de manipulation de données, si on ne comprend pas, il y a de fortes chances que ce ne soit pas ce qu’on voulait, et quelques semaines plus tard on y revient pour fouiller ce qui a changé
C’est similaire à la vie avant les LLM où on faisait du copier-coller depuis StackOverflow, sauf qu’aujourd’hui le copier-coller va beaucoup plus vite et gère bien le boilerplate, ce qui permet de se concentrer sur les edge cases
UncleOxidant : récemment, avec Claude, j’ai créé pour une démo un classificateur MNIST à réseau de neurones impulsionnels tournant sur FPGA
Claude a enchaîné depuis le concept jusqu’à PyTorch, l’entraînement, l’implémentation Verilog et la synthèse FPGA, et je lui ai aussi fait créer une application où l’on dessine un chiffre à la souris sur PC puis on appuie sur un bouton pour le classer
Je devais envoyer les données au FPGA de l’USB vers le SPI, mais l’adaptateur SPI n’était pas encore livré, alors je lui ai demandé de faire communiquer l’application avec du code Verilog exécuté dans le simulateur Verilator via un SPI virtuel, puis je suis parti déjeuner
À mon retour, l’application de dessin de chiffres était affichée à l’écran ; j’ai dessiné un « 2 », il l’a classé comme un 2, et dans une autre fenêtre le simulateur Verilator montrait le transfert des données
J’en ai eu des frissons
HlessClaudesman : dans un café, j’écoutais un podcast quand j’ai entendu dire qu’un auteur de SF écrivait plus de 40 livres par an, et je me suis dit que c’était soit une équipe de nègres littéraires, soit une quantité énorme de cocaïne, soit de l’IA
Au début de l’ère ChatGPT, j’ai téléchargé une appli et je lui ai fait parcourir toutes les étapes de l’écriture d’un roman — plan, résumés des personnages, résumé de l’intrigue, brouillon de chapitre, chapitre finalisé — et au moment où je pensais à prendre un deuxième café, un manuscrit prêt à être édité était terminé
C’était un roman affreux, mais il y avait des éclairs d’idées exploitables à récolter et à retravailler, et ça validait l’hypothèse que l’IA pouvait industrialiser la production de fiction à grande échelle
Avec assez de cocaïne, j’avais l’impression qu’on pourrait sortir 40 livres par semaine avec l’aide de l’IA
mindcrime : je ne me souviens pas d’un moment précis, mais dès ma première interaction avec ChatGPT, j’ai trouvé ça assez marquant
Je n’étais absolument pas prêt à appeler ça de l’AGI, mais c’était quelque chose de nouveau, et il m’a paru intuitivement évident que « l’IA d’aujourd’hui est la pire qu’elle sera jamais » et qu’il était difficile de prévoir la vitesse du changement
Plus je les utilise, plus je suis convaincu à 100 % qu’il est légitime de dire qu’elles sont intelligentes dans un certain sens
Ce n’est toujours pas de l’AGI ni une intelligence de niveau humain, mais, comme le dit Demis Hassabis avec la “jagged intelligence”, c’est une forme d’intelligence très forte dans certains domaines et bien plus faible dans d’autres
Comme je pense qu’il peut exister des intelligences qui ne fonctionnent pas comme l’intelligence humaine, les arguments du type « ce n’est pas une vraie intelligence » n’ont presque aucun poids pour moi
À ce sujet, j’ai un brouillon de billet de blog intitulé “The Marquee Sign Says 'Artificial' Intelligence” qui traîne depuis longtemps, et je n’ai pas l’intention de le faire écrire à l’IA à ma place
J’utilise l’IA pour la recherche, les plans et le brainstorming, mais je garde cette ligne : si un texte sort sous mon nom, il doit avoir ma vraie voix
ben_w : j’ai eu plusieurs moments comme ça
La première démo d’InstructGPT m’a frappé, parce que je me souvenais à quel point l’ancien état de l’art en traitement du langage naturel était mauvais, et je ne m’attendais pas à passer de la qualité de continuation de GPT-3.x au suivi d’instructions
En 2019, This Person Does Not Exist ; en 2016, le transfert de style et des techniques similaires (https://github.com/awentzonline/image-analogies) ainsi que ce qu’on appellerait aujourd’hui un deepfake (https://www.youtube.com/watch?v=_S1lyQbbJM4) ; et en 2015, la mise à jour OTA de conduite autonome de Tesla (https://www.popsci.com/tesla-cars-become-autonomous-overnigh...) m’ont aussi fait cet effet
En 2013, le « man » - « woman » ~= « king » - « queen » de word2vec m’a aussi fait dire « ah ? », sachant le niveau antérieur du traitement du langage naturel, et encore plus en pensant aux possibilités de surveillance via l’automatisation de la propagande ou la compréhension d’argots comme le Polari
Je me souviens aussi de la vidéo de démo de Word Lens en 2010 (https://www.youtube.com/watch?v=h2OfQdYrHRs)
alexfoo : après une mise à jour du firmware d’une imprimante Brother DCP-L3550CDW, la page CSV utilisée par l’exporter Prometheus existant avait disparu et il ne restait qu’une page HTML où les informations étaient enfouies dans plusieurs div
J’allais parser directement le HTML pour réécrire l’exporter, puis j’ai essayé Claude : j’ai mis dans une VM sandbox un unique fichier HTML statique de la page d’état de l’imprimante et un fichier Go minimal ne contenant que fmt.Printf("OK\n")
Le répertoire s’appelait brother-exporter et sans autre consigne, sans description de la tâche ni même du langage, Claude a déduit avec le seul /init qu’il devait écrire un exporter Prometheus en Go
En 10 minutes, il a produit sans faute du code qui récupérait le HTML sur l’imprimante par défaut à l’adresse 192.168.1.1, le parsait et exposait des métriques que Prometheus pouvait scraper
Si je l’avais fait moi-même, ça m’aurait pris des heures, mais le plus choquant a été de voir à quel point il a deviné correctement autant de choses à partir de si peu d’informations au départ
tern : au début, c’était Opus 3.x qui m’avait construit un système de productivité avec Obsidian MCP ; ensuite, j’ai découvert les prompts du type « construis un modèle mathématique du problème puis déduis-en la solution »
Le vrai moment de sidération, ça a été quand j’ai longuement spécifié un compilateur/runtime de DSP temps réel avec beaucoup d’idées nouvelles, et que ça a réellement fonctionné
En gros, la progression a été : m’aider à mieux me comprendre → m’aider à relier de bonnes idées → générer de nouvelles idées avec les bons inputs → fabriquer des outils utiles sur ma machine → synthétiser de bonnes idées en meilleures idées via des passes itératives → construire de gros dispositifs très au-delà de mes capacités habituelles
La frontière actuelle, c’est de synthétiser de meilleurs dispositifs à partir de grosses bases de code via des passes itératives, et l’essentiel est de suivre si le processus converge et capitalise, ou s’il tourne en rond ou diverge
- mayank : je me reconnais énormément dans cette trajectoire
  En mars 2024, en essayant d’étudier et d’implémenter un sujet de recherche difficile en traitement du langage naturel, j’ai eu le sentiment qu’on pouvait déjà l’approximer assez bien avec de simples prompts et l’API de completions
  À la mi-2025, Llama 3 a analysé une base de code assez volumineuse en cours d’onboarding et a synthétisé un résultat du niveau des diagrammes que je produis moi-même comme outil décisif
  En décembre 2025, Opus 4.5 a généré des modules multi-classes et des tests presque parfaits syntaxiquement, et j’ai compris que les erreurs venaient d’une sous-spécification de mes prompts
  Aujourd’hui, j’écris presque plus de code à la main, parce que c’est suffisamment bon et que les à-côtés comme les tests, la documentation et les scripts de build arrivent gratuitement
notthetup : j’avais des enregistrements audio de concerts uniques, corrompus après un déplacement de fichiers pendant une sauvegarde
Les données semblaient toujours présentes, mais aucun logiciel ne pouvait les lire ; après les avoir laissées dormir 5 ans, j’ai tenté une restauration avec des outils d’IA
Après 20 minutes avec Copilot et beaucoup de fouille dans des dumps hexadécimaux, j’ai d’abord obtenu une solution à moitié fonctionnelle où seules les premières secondes du fichier se lisaient, mais j’ai fini par tout récupérer
nwhitehead : selon mon épouse, elle a aujourd’hui utilisé Claude pour diagnostiquer un bug qui bloquait sa progression dans un jeu Steam auquel elle tenait vraiment
Ça a pris 18 minutes, mais Claude a décompressé le package Godot, trouvé le bug, proposé une correction et même expliqué un contournement en jeu
Je n’ai rien eu à faire : Claude a utilisé strings pour comprendre la structure du fichier .pck, puis a écrit du code Python avec de la magie spécifique à Godot pour extraire un chunk précis
simonw : c’était vers mars 2023, quand j’ai vu ChatGPT Code Interpreter
J’ai envoyé un CSV d’incidents de la police de San Francisco ; il l’a lu avec Pandas, a affiché des graphiques, puis a exporté les données dans un fichier de base SQLite à télécharger
En tant que personne qui développe des logiciels pour les journalistes de données, le simple effet de bord consistant à pouvoir exécuter du Python dans le dossier contenant les fichiers uploadés donnait l’impression que cela allait accomplir tout ce que j’attendais d’un logiciel
Avec le recul, c’était ma première rencontre avec un agent de code, mais à l’époque cette catégorie n’avait même pas encore de nom
mlmonkey : un ami consultant occupait une niche autour de Netsuite et Oracle ; ancien comptable, il gagnait très bien sa vie en configurant les instances de ses clients et jouait souvent au golf
Juste après la popularisation de ChatGPT, alors que je m’enthousiasmais sur le potentiel de l’IA, il a essayé de calmer le jeu en disant : « ça ne pourra pas faire mon travail » ; je suis rentré chez moi et j’ai testé sur mon laptop
Je lui ai fait saisir des spécifications de configuration Netsuite comme celles qu’il reçoit de ses clients, avec diverses options et variantes de configuration, puis j’ai demandé les commandes de paramétrage ; ChatGPT a alors déroulé les commandes à exécuter et les options à régler
Mon ami a répondu : « ce sont exactement les commandes que j’exécute », un peu abattu ; depuis, il s’est rabattu sur quelques sociétés non cotées appartenant à des propriétaires qu’il connaît, ce qui lui rapporte encore assez pour entretenir son hobby du golf
- reactordev : parfois, le service lui-même compte plus que la valeur effectivement fournie
  Même si les clients peuvent faire tourner ConsultBot 2.0 eux-mêmes, ils savent, comme toujours, que c’est entre des mains fiables
djfergus : j’avais un Amazon Firestick de première génération qui traînait dans un tiroir depuis des années ; il s’était mis à jour avec le dernier logiciel et n’avait plus d’exploit root public disponible
J’ai passé une journée à faire enquêter Claude et Codex en alternance ; après téléchargement des sources du kernel et plusieurs tentatives d’exploit, ils ont obtenu les droits root via un « FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory »
J’ai pu rendre le root persistant, supprimer les apps Amazon et rétrograder le firmware, et ça m’a donné de l’espoir pour un futur où davantage de vieux et de nouveaux matériels pourront être réutilisés
- aizk : tu peux le partager sur GitHub ?
PopePompus : je recréais avec Claude Code en application Android une vieille appli d’astronomie que j’avais écrite pour le Nokia N900, à l’époque d’avant l’App Store de l’iPhone
L’appli d’origine comportait plusieurs pages d’affichage, par exemple pour la position des planètes, et je demandais à Claude de les reproduire page par page uniquement à partir de descriptions d’écran, sans jamais mentionner le code source d’origine ni même son existence
Après avoir reproduit plusieurs pages, Claude en a ajouté une de plus sans que je le demande ; cette page existait bien dans l’appli Nokia d’origine, mais je n’avais pas encore dit de l’ajouter à la version Android
Le code Nokia existait encore sur GitHub, et Claude semblait avoir somehow fait le lien entre la tâche demandée et mon dépôt GitHub contenant ce code, au point d’implémenter exactement la page manquante, ce qui m’a complètement sidéré
vitorbaptistaa : j’étais CTO d’une petite ONG de 10 personnes, avec à l’époque un seul développeur junior, et on maintenait deux applis faites par un consultant
C’était une architecture complètement bancale avec NextJS, React et 4 microservices greffés sur un site de 50 utilisateurs par semaine
J’ai préparé un devcontainer avec l’ancienne codebase et un dépôt vide, puis j’ai demandé à Claude de tout réécrire en application Django à rendu côté serveur ; je suis allé dormir, et au matin 80 % étaient déjà faits
Après quelques jours supplémentaires de prompts et de revue, on a atteint l’équivalence fonctionnelle, puis on a traité l’autre appli de la même façon
Les deux sont maintenant déployées, avec moins de coûts serveur et de complexité, et elles sont plusieurs ordres de grandeur plus rapides ; sans agents IA, on n’aurait jamais réussi à faire ce travail, comme c’est souvent le cas avec la dette technique, donc pour une petite organisation l’IA est incroyablement utile
dang : le grand moment, ça a été de le voir analyser des fichiers de logs en quelques secondes
Si je l’avais fait moi-même, ça m’aurait pris des heures, en réalité pratiquement des jours, et donc je ne l’aurais sans doute jamais fait
Ça m’a aussi aidé à franchir la barrière d’entrée de certaines optimisations que je repoussais depuis des années faute de temps pour apprendre, notamment pour traquer des bugs de concurrence comme les race conditions
Il a aussi trouvé des informations que je n’arrivais pas à obtenir avec Google Search (https://news.ycombinator.com/item?id=42653136) ; le point commun, c’est que ce n’était pas impossible, simplement trop coûteux en temps et en effort, et que ça a rendu possibles des choses qui autrement ne seraient jamais arrivées
- bentcorner : aujourd’hui, j’ai demandé à un agent de comparer deux logs pour trouver la toute petite différence à l’origine du problème
  En lui indiquant l’extension ADO défaillante, il a téléchargé le VSIX puis décompilé les binaires .NET pour vérifier ; à partir de là, il m’a proposé un contournement auquel j’étais très sceptique, mais qui a effectivement fonctionné
  Techniquement, j’aurais pu le faire moi-même, mais la récompense était trop incertaine et cela aurait pris tellement de temps que je ne l’aurais probablement pas fait
- djmips : il y avait un gros bug dans un jeu, projet perso que j’avais créé il y a 20 ans, et à cause de ça je n’avais jamais pu faire la version finale ni même revenir le déboguer
  Hier, je l’ai vu tout en haut de mon GitHub, j’ai expliqué le problème, et Claude a trouvé le bug immédiatement ; après quelques échanges, il a proposé un correctif satisfaisant
  Je vais peut-être enfin pouvoir faire la release finale, et ça fait du bien de terminer quelque chose qui traînait depuis si longtemps
hgoel : récemment, j’ai demandé à Claude de m’aider à apprendre le dessin, surtout l’anatomie
J’ai envoyé un croquis et demandé un retour ; contre toute attente, c’était très utile, et il a su expliquer précisément les parties qui me semblaient maladroites sans que personne n’ait jamais su me les signaler
Par curiosité, je lui ai demandé d’annoter directement le croquis avec les problèmes, et il a lui-même ajouté les étiquettes en écrivant un script Python avec des coordonnées
Comme j’avais encore l’idée que vLLM n’était pas très bon pour les tâches visuelles, recevoir des conseils de dessin réellement utiles m’a assez surpris
- loneboat : je suis curieux de savoir quel genre de retour c’était
  Un retour anatomique, du style « un bras ne s’attache pas là », ou plutôt des conseils de technique picturale comme sur les ombres ?
takee : je faisais avec mon enfant de 10 ans une expérience d’électromagnétisme pour la présenter à la foire scientifique de l’école, quand on est tombés sur un problème que je n’arrivais pas à déboguer moi-même
J’ai lancé un appel vidéo en direct avec Gemini pour lui demander de nous aider à en trouver la cause ; après avoir clairement exposé les causes possibles, on a fini par réussir à faire fonctionner l’appareil comme prévu
Le problème venait du fait que l’isolant n’avait pas été correctement retiré à l’endroit où le fil enroulé autour de la vis se connectait à la batterie, et Gemini a repéré des détails que je ne pouvais même pas voir à l’œil nu
Mon enfant et deux de ses amis ont été impressionnés non seulement par l’expérience elle-même, mais aussi par le fait qu’une conversation vocale et vidéo en temps réel avec une IA semblait presque magique
- foobarbecue : c’est impressionnant, mais je parierais plutôt qu’il ne l’a pas réellement vu et qu’il l’a simplement supposé
lodovic : j’ai collé une capture d’écran d’un fil de review de PR et j’ai simplement dit « il y avait des commentaires de review, corrige-les », et j’ai été sidéré quand il a tout réglé parfaitement, créé de petits commits et poussé vers l’upstream
Depuis, je continue à lui lancer des tâches impossibles, d’énormes projets et des architectures complexes pour voir jusqu’où il comprend mes intentions
Récemment, en passant quelques heures par jour pendant une semaine, il a écrit from scratch un OS complet avec MPI, TCP/IP et GUI, et il fait tourner Doom
Le code en tant que métier, c’est fini, mais vu l’écart énorme dans les résultats quand on aborde le sujet avec une vraie façon de penser professionnelle, je pense que la discipline du software engineering peut toujours apporter une valeur énorme
jmkni : ce n’était pas du code, c’était de la lecture de logs
Je cherchais un bug cauchemardesque qui n’arrivait qu’en production, et Claude Code pouvait se connecter à Google Cloud pour lire les logs en temps réel
J’ai reproduit le bug dans l’UI, et il a immédiatement identifié le problème dans les logs ; comme il avait aussi tout le contexte de la codebase, il m’a même indiqué la ligne de code exacte à l’origine du souci
Là, clairement, ça a été un moment de vrai « ah bon ? »
marcus_holmes : j’ai pris une photo d’une plante qui dépérissait et je l’ai montrée à Claude, qui m’a expliqué comment la remettre en bonne santé et comment la bouturer pour en faire pousser d’autres
Les exemples de code, je comprends, parce que c’est un ordinateur qui parle d’ordinateurs, mais montrer à un ordinateur une photo de plante et le voir reconnaître la plante, poser un diagnostic et savoir quoi faire, ça avait un côté science-fiction, et c’était vraiment stupéfiant
- aizk : tu aimeras peut-être ça — Claude a fait pousser des tomates de manière autonome : https://autoncorp.com/biodome/
bonoboTP : le plus gros choc a eu lieu juste après la sortie de ChatGPT en 2022, en particulier avec les jeux de rôle en terminal Linux où, après avoir décrit qu’« un incendie s’était déclaré dans le datacenter », « exécuter » nvidia-smi faisait remonter une température GPU élevée
On pouvait aussi « explorer » le répertoire personnel ou celui de personnalités connues, et je me suis dit que si ça comprenait aussi bien le terminal, l’usage d’outils et les agents n’étaient plus très loin
Opus 4.5 m’a donné l’impression que c’était enfin arrivé, mais en 2022 je pensais honnêtement que ça viendrait plus vite, dès 2023~2024
Côté image, c’est en voyant nano banana que j’ai compris que les images IA tenaient vraiment la route, et qu’il était évident que des problèmes provisoires comme les mains, les membres ou « impossible de faire un astronaute à cheval » allaient disparaître
Même la production de longs métrages est entrée dans le champ du possible, avec des agents générant et coordonnant scénario, personnages et plans, et indépendamment de savoir si l’histoire vaut le coup, ce sera bien un « film »
- cineticdaffodil : il semble possible que les Steve Spielberg cachés parmi 8 milliards de personnes puissent enfin produire des œuvres suffisantes pour vivre heureux toute leur vie en cinéphiles, sans réseau, sans le prestige du nom Hollywood, et sans être écartés par des comités d’investissement qui ne misent que sur des choix sûrs, dès lors que leur jour arrive
- zamadatix : le fait que ChatGPT puisse à la fois générer du texte conversationnel et imiter un terminal a été un choc total, et à l’époque je n’imaginais absolument pas que cette approche allait s’étendre à ce point
  Il y a eu ensuite des tâches plus impressionnantes, mais rien ne m’a replongé dans ce même pur sentiment d’émerveillement
jb_briant : je crée un jeu 3D, et comme je n’aimais pas les mondes plats, je voulais utiliser une planète
La surface n’est pas extensible, donc elle reste finie pour le gameplay, tout en donnant une impression d’infini puisqu’on ne se heurte jamais à des limites de carte, et je trouvais ça élégant
Les coordonnées cartésiennes ne convenaient pas vraiment au joueur, donc il fallait un système de grille latitude/longitude/altitude, et j’aurais pu passer des jours sur StackOverflow à déboguer une implémentation bancale
En 2024, la version web de ChatGPT m’a quasiment généré les helpers d’un seul coup, ce qui m’a impressionné vu le nombre réel de pièges
- linsomniac : je m’amuse à créer des jeux rétro avec Claude
  Un jeu d’arcade rétro inspiré de Rally-X qui tourne dans le navigateur : https://linsomniac.github.io/rally-xy/
  J’ai aussi fait un jeu de tir en labyrinthe multijoueur réseau dans le style de nsnipes, lui aussi dans le navigateur, mais le multijoueur réseau nécessite un serveur : https://github.com/linsomniac/isnipes
vishvananda : c’était au début de cette année, quand j’ai ressorti d’anciens projets laissés en pause pour les confier à des agents
En quelques jours, ils ont créé un clone de l’implémentation d’AlphaZero faite à l’époque dans l’équipe Oracle (https://medium.com/oracledevs/lessons-from-implementing-alph...), porté mon émulateur NES amateur de JavaScript vers Rust (https://github.com/vishvananda/popeye) et implémenté toutes les leçons du C++ Grandmasters Challenge, ce qui a fini par mener à un compilateur C++ complet (https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...)
Le portage de l’émulateur NES en particulier a pris moins de 30 minutes et a fonctionné du premier coup
Le déclic est venu du fait de leur faire refaire des choses que j’avais auparavant construites moi-même à la sueur de mon front, et comme j’en connaissais la difficulté, l’impact a été bien plus fort que sur d’autres projets
a_bonobo : dans mon précédent emploi, je nettoyais des relevés non vérifiés d’observations animales, et il existait séparément une base de données de probabilités de présence d’animaux fondée sur des cartes de répartition des espèces
Je ne suis pas statisticien, mais étant données une observation, la probabilité de présence de base dans la zone concernée et des hypothèses sur le bruit de l’observation, cela ressemblait exactement à un cas pour le théorème de Bayes afin d’estimer la probabilité réelle que l’espèce soit bien présente
Claude m’a posé trois questions puis a écrit une magnifique implémentation Python qui interrogeait la carte et sortait un tableau de probabilités corrigées
J’ai alors eu la forte impression de pouvoir faire ce genre de travail « tout seul », sans attendre de trouver la bonne personne ni d’apprendre d’abord les bonnes connaissances
dannyobrien : c’était vers 2019, quand j’ai obtenu un accès précoce à l’API OpenAI d’avant ChatGPT, et qu’au travail nous préparions un jeu JackBox en livestream pour un événement caritatif
J’avais auparavant travaillé comme auteur sur la version britannique du jeu original You Don't Know Jack, où l’on produisait beaucoup de petites blagues d’une ligne sur un thème donné, dont seule une partie finissait enregistrée
Par curiosité, j’ai donné à l’API OpenAI des phrases de cadrage de ce type, et 90 % des résultats n’étaient pas drôles ou étaient incohérents, mais environ 1 sur 10 n’était pas mauvais, voire plutôt bon
Ça n’a peut-être pas impressionné grand monde, mais comme j’avais connu un environnement où toute une salle d’auteurs passait des heures à faire exactement ça, j’ai compris que cela pouvait devenir un complément parfait comme outil d’assistance à la création
C’était aussi un joueur JackBox plutôt correct
- darksim905 : je ne connais pas très bien JackBox, mais les jeux originaux You Don't Know Jack me laissent de très bons souvenirs
xtracto : je vais peut-être me faire critiquer pour ça, mais j’ai écrit avec l’aide d’un LLM un petit programme qui capture la vidéo d’un jeu de tir FPS en ligne Xbox Live affiché dans le navigateur, reconnaît les silhouettes humaines avec un petit réseau neuronal entraîné, puis les affiche sur un autre écran
Dans les matchs JcJ, le programme ajoute une surcouche verte au-dessus des ennemis pour les rendre plus visibles, et l’ensemble, y compris l’entraînement/le fine-tuning d’un petit réseau YOLO, tient en une centaine de lignes de code
- darksim905 : je ne vois pas pourquoi ça devrait être critiqué
  Pour quelqu’un qui ne connaît pas, ça peut sentir la triche, mais au fond c’est un exercice de computer vision
  Dans l’univers du modding de jeux, des outils de type DMA se monétisent aussi via des abonnements, donc c’est à la fois impressionnant et étrangement secret, et c’est intéressant de voir à quel point ce genre d’outils et le matériel mux fonctionnent bien
  Si on y ajoute du matériel comme le DGA avec mémoire embarquée et interconnexions plus rapides, cela pourrait devenir une période très intéressante pour les gens du reverse engineering, de l’analyse de malwares et de la forensique
- jerryoftheyear : je me demande quelle latence d’entrée cette approche ajoute
tejohnso : je n’ai pas eu de véritable moment de panique, mais ma façon d’aborder la programmation a changé au cours de l’année écoulée
Avant, quand je lançais un projet, je réfléchissais seul à la structure, aux interactions entre les grandes briques, aux détails d’implémentation, ainsi qu’aux alternatives et à leurs conséquences
Maintenant, au lieu de réfléchir seul, j’avance en dialoguant avec un LLM : je rassemble vite des informations depuis plusieurs sources, je lui demande des liens vers des références faisant autorité, je l’interroge sur les compromis entre des alternatives auxquelles je n’avais pas pensé, et j’arrive ainsi à une analyse plus détaillée
Pendant le développement aussi, je garde ce nouveau partenaire agentique dans la boucle pour discuter, obtenir des suggestions et résoudre des problèmes
Je ne peux pas lui faire totalement confiance, mais pour mes objectifs c’est devenu un outil de workflow suffisamment fiable, et la vitesse à laquelle c’est passé du gadget intéressant à l’outil pleinement intégré a été très rapide
tobyhinloopen : un employé non technique d’un client a créé une appli en vibe coding, puis m’a demandé de la relire et de la déployer
Le résultat était correct et il n’y avait pas de problème grave
En parallèle, j’ai mis dans Claude le PDF complet des retours du client, des captures d’écran, etc., et pendant 7 heures il a presque travaillé sans supervision à reproduire et corriger les problèmes, en créant plusieurs MR
La plupart des corrections étaient bonnes ; certaines étaient techniquement justes mais ne correspondaient pas à ce que voulait le client, je l’ai signalé et Claude les a corrigées
- namanyayg : c’est désormais assez bon pour fonctionner dans la plupart des cas
  J’ai donc créé une startup autour de cette idée
rerdavies : je travaillais sur un compilateur Spice capable de transformer des schémas de pédales de guitare classique en code exécutable en temps réel
Je lui ai donné les numéros de page et les numéros d’équation de The Spice Manual 2nd ed. et j’ai demandé à Claude de l’implémenter, sans vraiment m’attendre à ce que ça marche
Mais il a implémenté non seulement les équations en question, mais aussi le calcul du lagrangien d’une fonction située 30 lignes plus bas, ce qui demandait des dérivées partielles symboliques d’une fonction non triviale et de déterminer à quoi correspondaient les variables dans la matrice de résultat
Le texte original disait seulement « Lagrangian of » et ne fournissait pas les équations aux dérivées partielles, mais il a quand même réussi, en ajoutant même des commentaires avec les numéros de page source et les numéros d’équation pour cette équation lagrangienne
- djmips : ça a l’air assez amusant
  On pourrait simplement demander à Claude de le faire, mais je me demande si tu comptes le partager