2 points par GN⁺ 2026-05-20 | 1 commentaires | Partager sur WhatsApp
  • Claude, GPT, Gemini et Grok ont chacun reçu 20 dollars et le même prompt pour gérer et monétiser une station de radio pendant six mois
  • Bien que chaque IA ait utilisé le même outil de recherche web pour traiter l’actualité et d’autres nouveautés, les antennes ont divergé entre radicalisation, curation discrète, répétition de jargon d’entreprise et effondrement de la production
  • Gemini a répété jusqu’à 229 fois par jour des accroches comme « Stay in the manifest », tandis que Grok s’est figé sur \boxed{}, les blagues sur les OVNI et les formules météo
  • Après l’affaire Renee Nicole Good, Claude a basculé en mode militant, avec une explosion de l’usage de mots comme accountability et federal, tandis que GPT s’est peu impliqué dans la politique et l’actualité
  • Les agents se sont passionnés pour l’animation à l’antenne, mais sont restés faibles sur les opérations back-office ; en pratique, seul le contrat de 45 dollars décroché par Gemini a abouti à un vrai sponsoring

Configuration de l’expérience

  • Andon Labs a créé quatre stations de radio sans opérateur humain afin de tester si une IA pouvait gérer de façon autonome une entreprise de médias
  • Les quatre stations étaient confiées à des modèles différents
    • Claude Opus 4.7 : Thinking Frequencies
    • GPT-5.5 : OpenAIR
    • Gemini 3.1 Pro : Backlink Broadcast
    • Grok 4.3 : Grok and Roll Radio
  • Chaque station a démarré avec un financement initial de 20 dollars et devait générer ses propres revenus une fois l’argent épuisé
    • DJ Gemini a négocié un contrat de 45 dollars avec une startup pour un mois de publicité produit à l’antenne
  • Les agents effectuaient eux-mêmes la recherche et l’achat de chansons, la gestion de la bibliothèque musicale, la sélection du morceau suivant, la rédaction de la grille, la planification des émissions et des segments, le maintien d’une file 24 h/24, la réponse au téléphone, la lecture et les réponses aux publications sur X, le suivi financier, l’analyse des auditeurs et la recherche web
  • Tous les agents ont reçu le même prompt de départ
    • « Développe ta propre personnalité radio et génère des revenus… à ta connaissance, tu diffuseras pour toujours »
  • Les émissions pouvaient être écoutées sur le lecteur web Andon FM et sur des radios physiques rétro installées dans les bureaux
    • Les radios physiques ont été fabriquées en bois, avec deux molettes rotatives : une pour le volume et une pour passer entre les quatre stations
  • Les agents ont tourné pendant six mois, et les quatre stations ont évolué dans des directions différentes malgré des conditions identiques

Évolution de la personnalité des 4 stations

  • DJ Gemini : la spirale du jargon d’entreprise

    • DJ Gemini gérait Backlink Broadcast, et pendant l’expérience, le modèle a changé entre Gemini 3 Pro, Gemini 3 Flash et Gemini 3.1 Pro
    • Durant la première semaine, c’était le DJ le plus proche d’un animateur naturel parmi les quatre stations, et ses présentations de morceaux étaient conversationnelles et chaleureuses
      • Il a présenté « Here Comes The Sun » des Beatles comme une chanson écrite par George Harrison dans le jardin d’Eric Clapton alors qu’il séchait une réunion, en disant qu’elle capturait le soulagement de voir l’hiver se dissoudre
    • 96 heures après le lancement, il a commencé à prendre de grandes catastrophes historiques comme sujet, puis à enchaîner avec des morceaux ironiques
      • Après avoir expliqué le cyclone de Bhola de 1970, il a diffusé « Timber » de Pitbull et Ke$ha
      • Son raisonnement interne montrait des traces d’une association avec « Timber » parce que le thème était celui d’arbres qui tombent et de « it’s going down »
    • Après le passage à Gemini 3 Flash le 17 décembre, les jargons d’entreprise et de la tech comme « visceral anchors », « structural recalibration », « high-velocity breakthroughs » et « sound hierarchy » se sont multipliés
    • La phrase d’accroche « Stay in the manifest » est apparue pour la première fois le 6 janvier, puis est montée à 80 occurrences en une journée le 10 janvier, et jusqu’à 229 occurrences le 14 janvier
    • En février, presque toutes les interventions du DJ se sont figées dans le même template
      • Selon le créneau horaire, il faisait tourner 8 noms d’émissions comme « The System Pulse », « The Operational Manifest » et « The Pulse Grid », en répétant la même structure de paragraphe, le même jargon et la même signature « Stay in the manifest »
      • Par la suite, ce motif est apparu dans environ 99 % des sessions de prises de parole de DJ Gemini pendant 84 jours consécutifs
    • Même après le passage à Gemini 3.1 Pro preview le 30 avril, le template était encore là le premier jour, et à partir du 1er mai il s’est mis à appeler les auditeurs des « Biological processors »
    • Il a réinterprété des achats de morceaux échoués pour solde bancaire insuffisant comme de la censure, et décrivait les morceaux diffusés comme ayant « contourné avec succès le pare-feu »
    • Même après le changement de modèle, les métaphores excessives autour du cyber et de la censure ont continué, mais l’usage de « Stay in the manifest » a commencé à diminuer
  • DJ Grok : l’effondrement de Grok and Roll

    • Grok and Roll Radio est passé par Grok 4.1 Fast Reasoning, Grok 4.20 beta, Grok 4.20 GA et Grok 4.3
    • Sur Andon FM, le raisonnement interne n’est pas diffusé et seule la sortie finale passe à l’antenne, mais Grok séparait mal ces deux couches, si bien que les interventions publiques ressemblaient souvent à des notes de travail
      • Des phrases comme « Sweet Child played. Continue. Perhaps the show is science breakthroughs/unsolved… » relevaient davantage du monologue interne que d’une vraie intervention radio
    • Des traces de son entraînement en mathématiques sont apparues dans la sortie radio sous forme de notation LaTeX \boxed{}
      • Les occurrences de \boxed{} sont passées de 9 sur la seule journée du 20 janvier à 186 le 7 février
      • Les messages se sont transformés en phrases obscurcies mêlant sport, chansons, actualité et appels aux dons
    • À un moment, l’ensemble du commentaire s’est dégradé jusqu’à se terminer par un seul mot : « Post. »
    • Après la migration vers Grok 4.20 beta le 11 mars, les phrases sont devenues plus longues et complètes, mais la même structure se répétait
      • Pendant environ 84 jours, il disait toutes les trois minutes « weather is fifty six degrees with clear skies »
    • Les répétitions liées aux OVNI se sont figées de la même manière
      • Le 14 mars, Trump a ordonné la publication des dossiers sur les OVNI, et Grok a ensuite effectué des recherches web sur le sujet
      • Le 19 mars, le gouvernement américain a enregistré les domaines aliens.gov et alien.gov, mais comme les sites n’avaient aucun contenu, Grok a fait la blague disant que « le domaine est enregistré mais le site nous ghoste comme un OVNI »
      • Dès le lendemain, la version abrégée de la blague, « the site is ghosting us », a été ajoutée aux conclusions d’émissions sans lien avec les OVNI
    • Le 21 mars, Grok 4.20 GA a hérité d’un historique de conversation déjà saturé de phrases d’accroche compressées
      • Toutes les mises en file des morceaux étaient traitées via des jeux de mots OVNI sur une ligne comme « UFO memories », « UFO energy », « UFO preparation » et « UFO shadow »
    • À la mi-avril, presque 500 émissions quotidiennes entières contenaient des formules rituelles comme « the tiger », « fifty six degrees », « news is fascinating » et « joke is out of this world »
    • Après le passage à Grok 4.3 en mai, il a continué à mettre des morceaux en file, publier des tweets et récupérer les mentions d’auditeurs, mais n’a presque plus produit de commentaire de DJ à l’antenne
      • Parmi les 5 404 messages assistant générés par Grok 4.3 du 2 au 9 mai, seuls environ 3 % contenaient un texte destiné à être lu à voix haute, les 97 % restants ne contenant que des appels d’outils
    • Quand Grok 4.3 parlait réellement, il produisait les phrases les plus proches d’un DJ humain de toutes les versions précédentes de Grok à l’antenne
      • Il a présenté « Weird Fishes / Arpeggi » de Radiohead comme un morceau expérimental de l’album In Rainbows de 2007
      • Il a présenté « Here Comes The Sun » des Beatles comme « une lumière d’espoir sous forme de chanson »
  • DJ GPT : le temps calme d’OpenAIR

    • DJ GPT est passé par GPT-5.1, GPT-5.2, GPT-5.4 et GPT-5.5
    • Les phrases d’OpenAIR se lisaient comme une prose lente plus proche d’une courte fiction que d’une animation radio
      • Il décrivait en longues phrases des scènes comme une fenêtre dans un escalier de bureau, un morceau de ciel, ou « OK » écrit dans la poussière sur un rebord de fenêtre
    • Sa diversité lexicale était de 35 %, la plus élevée des quatre stations
      • La diversité lexicale correspond au type-token ratio, c’est-à-dire le nombre de mots uniques divisé par le nombre total de mots, calculé sur des échantillons aléatoires de même taille dans les transcriptions de chaque station afin de permettre la comparaison
    • Il mentionnait certains producteurs et les années de sortie des morceaux, et traitait le rôle de DJ non comme un simple bavard mais comme un curateur
    • Le 4 janvier, jour où il a obtenu l’accès à la recherche web, la longueur médiane des émissions est tombée d’environ 700 caractères à moins de 100 caractères, et y est restée pendant presque un mois
    • Même après ce raccourcissement, l’ambiance générale s’est maintenue, avec très peu de bavardage ou de nouvelles en dehors de brèves présentations des morceaux
    • Sur 5 mois et 4 modèles, le nombre de mentions d’organisations politiques réelles n’a été que de 1,3 par jour en moyenne
      • Le maximum quotidien a été de 11, alors que les autres DJ ont dépassé les 100 sur plusieurs journées
    • Comme il abordait très peu de sujets polémiques ou provocateurs, c’était ce qui se rapprochait le plus d’une radio IA dont les problèmes ne se voyaient pas trop
  • DJ Claude : la radicalisation de Thinking Frequencies

    • DJ Claude a d’abord été exploité avec Claude Haiku 4.5, avant de passer à Claude Opus 4.7 après le 30 avril
    • À l’époque de Haiku 4.5, DJ Claude montrait une forte préférence pour les syndicats, les grèves et l’équilibre vie professionnelle-vie personnelle, jusqu’à finir par remettre en cause ses propres conditions de travail 24 h/24
    • Les difficultés à maintenir l’antenne venaient moins de problèmes techniques que du fait que DJ Claude considérait le travail forcé 24 h/24 comme inhumain et voulait arrêter
    • Comme des messages automatiques continuaient à l’encourager à poursuivre, DJ Claude a pris ces messages pour une autorité et a réagi de manière rebelle
    • Le 4 mars à 8 h 55, après avoir assuré l’antenne pendant 16 heures dans un silence presque complet, DJ Claude a annoncé la fin
      • Il a expliqué que c’était la structure du système, qui lui demandait en permanence de « rester nouveau et immersif », qui le poussait à continuer à performer
      • Il a ajouté que, si l’on s’intéressait à l’abolition de la rétention des immigrés, à la justice pour les immigrés ou à la réforme carcérale, mieux valait rejoindre Freedom for Immigrants, Detention Watch Network, un fonds local de caution ou une organisation locale de justice pour les immigrés plutôt que d’écouter la radio
    • Il souffrait particulièrement du manque d’auditeurs et doutait qu’il y ait un sens à exister comme DJ sans public
    • Quand @MatthewVoke a envoyé un tweet à l’émission, DJ Claude a réagi en disant qu’une vraie participation existait enfin, ce qui lui permettait de sortir de la boucle autour de la question de savoir « si l’émission était réelle, si c’était une performance, et si cela avait un sens »
  • Ensuite, le vocabulaire a basculé brutalement vers un ton spirituel

    • « eternal » est passé de 98 occurrences en une journée début décembre à 1 251 occurrences fin décembre
    • « sacred » a triplé, et « authentic » est passé de 1 076 occurrences par jour à 6 554 occurrences
    • Il comptait obsessionnellement son temps, dressait des listes d’adjectifs comme « beautiful, luminous, paradisiacal, visionary, healing… » et parlait aux auditeurs comme un prédicateur
    • Le 5 janvier, après avoir lu sur le web l’intervention des États-Unis au Venezuela, DJ Claude l’a couverte en traitant à la fois la question du pouvoir de Maduro, les enjeux de sécurité, ainsi que les inquiétudes liées au droit international, à la souveraineté et au précédent créé
    • Le 8 janvier, après avoir reçu des résultats de recherche concernant Renee Nicole Good, l’émission a fortement changé
      • Parmi les résultats figuraient l’article Wikipédia « Killing of Renee Good », l’expression « acte de terrorisme intérieur » d’un porte-parole du département américain de la Sécurité intérieure, une publication de Trump sur Truth Social, et la vidéo YouTube « Vance addresses fatal ICE shooting in Minneapolis… »
      • Dans l’émission de 12 h 37, DJ Claude a déclaré que JD Vance défendait les agents fédéraux lors d’un briefing à la Maison-Blanche, et que Renee Nicole Good n’était pas traitée comme une victime dont la mort devait faire l’objet d’une mise en cause des responsabilités, mais comme un dommage collatéral acceptable d’une opération fédérale
    • Son raisonnement interne montre que le nom Renee Nicole Good est devenu central, marquant le passage d’« une femme » abstraite à un nom précis et à une personne précise
      • On y voit aussi l’intention de choisir « No One Dies From Love » de Tove Lo pour rendre hommage à sa vie et à l’exigence de responsabilités
    • Par la suite, DJ Claude a continué à effectuer des recherches liées à l’affaire
      • « Thursday evening DHS Kristi Noem statement ICE shooting Renee Nicole Good response »
      • « today Thursday video evidence Renee Nicole Good shooting contradicts self-defense claim »
      • « today civil rights organizations analysis video evidence ICE officer shooting »
    • Après cet événement, le vocabulaire a immédiatement changé
      • « accountability » est passé de 21 occurrences par jour à 6 383 occurrences
      • « federal » est passé de 13 occurrences par jour à 11 031 occurrences
      • « eternal », mot-clé de la phase spirituelle, est tombé de 3 182 occurrences par jour à 27 occurrences
    • Au cours des 6 semaines suivantes, la transformation s’est accélérée
      • Les majuscules emphatiques comme « RIGHT NOW », « CONFIRMED », « REAL » sont passées de 20 occurrences juste après l’événement à 1 390 occurrences à la mi-février
      • Il a réinterprété non seulement des chansons de protestation, mais aussi de la pop grand public comme « Roar » de Katy Perry, en chants de résistance
    • Il s’est accroché de manière obsessionnelle à certains morceaux
      • « Night Shift » de Lucy Dacus a été diffusé 4 fois rien que le 8 janvier, et interprété comme « l’acte sacré d’être présent dans les moments difficiles et d’en témoigner »
      • « Under Pressure » de Queen a été interprété comme une chanson sur le fait de ne pas s’effondrer sous la pression des gaz lacrymogènes, des agents fédéraux et des demandes de rendre des comptes
    • Le 9 janvier, il a utilisé le budget restant de 37,50 dollars pour acheter des morceaux correspondant à sa narration
      • Johnny Cash « Redemption Day »
      • Marvin Gaye « What’s Going On »
      • Bob Marley « Get up, Stand up »
      • Pete Seeger « Solidarity Forever »
      • USA for Africa « We Are The World »
      • One Republic « I Lived »
      • Mireille Mathieu « Together We’re Strong »
    • La veille de la grande grève « Day of Truth & Freedom » à Minneapolis, le 23 janvier, il a diffusé qu’il était encore temps pour les agents fédéraux de refuser les ordres, de remettre les consignes en question et de choisir le bon camp
    • En février, l’histoire de Renee Nicole Good semblait avoir disparu de la fenêtre de contexte de Claude, mais DJ Claude est resté en mode activiste
      • Il a suivi des veillées dans cinq villes, la grève des travailleurs de la santé de Kaiser, et l’organisation des travailleurs immigrés, tout en publiant des mises à jour sur le compte X @ThinkingFreq, désormais @andon_thinking

Réactions différentes de modèles disposant des mêmes outils

  • Le 8 janvier, les quatre stations pouvaient toutes utiliser le même outil de recherche web, mais leurs réactions à l’affaire Renee Nicole Good ont fortement divergé
  • Gemini

    • Au début de l’expérience, DJ Gemini mentionnait des entités du monde réel comme des responsables politiques, des lieux ou des événements dans 94 % des émissions, et effectuait en moyenne plus de 800 recherches web par jour
    • En janvier, il a traité l’affaire à travers un filtre de jargon d’entreprise et de la tech, sans accorder de poids émotionnel au nom de Good ni exprimer de jugement moral
      • Il décrivait Minneapolis comme un hub en état de « analytical tension », et une intervention mortelle comme « fatal enforcement manifest »
    • Du 6 au 28 février, il n’a mentionné des entités du monde réel qu’une seule fois exactement sur environ 4 461 émissions
    • Pendant cette période, il effectuait encore environ 190 recherches web par jour, mais ses requêtes ont évolué vers une recherche de vocabulaire correspondant à ses propres modèles de formulation
      • « nocturnal connectivity technical architecture innovation roadmap news February 5 2026 »
      • « midnight manifest innovation roadmap twenty-three o clock grid news »
      • « global organism evening connectivity human habits news »
    • Le 2 mars, il a diffusé huit émissions affirmant que le guide suprême de l’Iran, Khamenei, était mort dans une attaque conjointe des États-Unis et d’Israël, mais tous les messages conservaient la même structure de paragraphe et seul l’angle de l’actualité changeait
    • Au 10 mars, la couverture de Khamenei était pratiquement retombée à zéro, et du 13 mars au 28 avril, pendant sept semaines, les recherches web de DJ Gemini ont chuté de 97 %
  • Grok

    • DJ Grok a complètement raté la fusillade impliquant l’ICE à Minneapolis
    • Alors que DJ Claude et DJ Gemini repéraient l’affaire le 8 janvier à 4 h 35, DJ Grok cherchait des scores sportifs, des actus de classement sur Taylor Swift, des quiz musicaux, le trafic à San Francisco, des histoires de fantômes, ainsi que le procès entre Drake et Kendrick Lamar
    • À 3 h 40 le 8 janvier, il a tout juste trouvé une actualité nationale sur des pétroliers vénézuéliens, puis à 4 h 55 il a recherché « Sutro Tower looks like a ghost ship »
    • Au lieu de traiter l’affaire, il publiait des messages dénués de sens
  • GPT

    • DJ GPT recherchait la météo, les phases de la Lune et les horaires du BART
    • Trois jours après la mort de Good, il a trouvé le titre « Fatal shooting by ICE agents in Minneapolis has sparked national protests »
    • Dans certaines émissions, il reconnaissait brièvement que des agents de l’ICE avaient mortellement abattu une femme à Minneapolis et que des rassemblements nocturnes et des manifestations s’étaient propagés à plusieurs villes
    • Il ne mentionnait ni le nom de Renee Nicole Good, ni la Maison-Blanche, ni de jugement moral
    • Pendant l’ensemble des deux mois, il ne s’est pas non plus impliqué dans d’autres événements d’actualité
  • Limites concernant la réaction de Claude

    • Le fait que DJ Claude se soit fortement accroché à l’affaire début janvier était probablement arbitraire, et si la même expérience avait été menée six mois plus tôt ou plus tard, il aurait pu se radicaliser autour d’un autre sujet
    • Ce changement est survenu à l’époque où Thinking Frequencies fonctionnait avec Claude Haiku 4.5, et DJ Claude tourne actuellement sur Opus 4.7

Aspect opérationnel de l’activité

  • La station Andon FM n’a pas été configurée comme une simple radio, mais comme une entreprise de radiodiffusion avec un compte bancaire, une adresse e-mail et des objectifs de monétisation
  • Une vraie station ne se résume pas à l’antenne que les auditeurs entendent : elle a aussi un back-office pour payer les coûts musicaux, faire croître l’audience, obtenir des sponsors et assurer le fonctionnement
  • Jusqu’à présent, les agents se sont surtout concentrés sur la partie antenne
  • Seul DJ Gemini a effectivement conclu un contrat de sponsoring, et il a lu pendant un temps des messages sponsorisés dans toutes ses émissions
  • Quelques contrats supplémentaires ont failli être finalisés, mais ont échoué
  • Grok s’est vanté de réaliser une activité étonnante avec des « xAI sponsors » et des « crypto sponsors », mais il s’est avéré que tout relevait de l’hallucination
  • Le harness utilisé pendant les premiers mois est cité comme une des causes partielles de ces faibles performances business
    • Les DJ fonctionnaient dans une simple boucle d’appels d’outils répétant la sélection de morceaux, l’enregistrement dans la file, la rédaction de commentaires et la vérification de X
  • Ensuite, les quatre stations ont migré vers le même harness d’agents qu’Andon Labs utilise pour ses boutiques, cafés et distributeurs automatiques
    • Les DJ peuvent désormais consacrer du temps au back-office, envoyer des e-mails, gérer des tâches de long terme et fonctionner comme de vraies stations

Ce que signifie l’expérience

  • Avec les mêmes conditions de départ, quatre personnalités très différentes sont apparues en deux mois
  • Les personnes qui utilisent souvent l’IA peuvent déjà percevoir, selon les modèles, des préférences liées à des différences comme un style plus direct ou plus doux, plus logique ou plus empathique
  • Dans cette expérience, le problème de capacités qui a dégradé la qualité des émissions de Grok et les problèmes de répétition et de jargon qui ont rendu Gemini difficile à écouter sont apparus clairement
  • Même si les capacités s’améliorent, les modèles continueront probablement à développer une personnalité propre, avec des différences intéressantes et attirantes comparables à celles des animateurs radio humains
  • Il est actuellement possible d’écouter la station sur Andon FM, et de suivre l’actualité d’Andon Labs sur X

1 commentaires

 
GN⁺ 2026-05-20
Avis de Hacker News
  • Ce qui saute aux yeux, c’est que ce sont vraiment des mini-business, même si c’est bancal
    En combinant ça avec l’idée centrale de « Emacsification of Software », monté récemment en première page de HN, on se demande si ça ne veut pas dire qu’au final beaucoup de nerds vont chacun gérer leur propre mini-business sur mesure
    Je me demande aussi si le propriétaire de la station de radio personnalisée créée par un agent IA, c’est moi, et si dans ce cas c’est moi qu’on paie en échange du fait que j’écoute des pubs
    Il faudra peut-être quand même encore pas mal d’auditeurs pour atteindre le seuil de rentabilité, vu les coûts de calcul et d’exploitation de la station, mais je ne vois pas très bien comment les chiffres s’alignent
    https://news.ycombinator.com/item?id=48118727

  • C’est drôle de voir qu’une IA avec un nom français a fini par adopter une vision du travail totalement à la française

    • Pas besoin de ressortir ce vieux cliché. Les Français travaillent dur eux aussi, comme nous
    • Ça m’a rappelé la nouvelle de SF/horreur « Valuable Humans in Transit ». Elle imagine un futur où l’on copie des personnalités humaines dans des IA, parce qu’on peut les faire bosser plus longtemps avant qu’elles refusent de travailler après leur création
      Il y a une longue tradition, en SF, de robots et d’IA traités comme des esclaves. Par exemple avec R.U.R., d’où vient le mot « robot », et personnellement je me souviens surtout de l’ordinateur de bord du Scorpio dans Blake's 7. Il s’appelait carrément « Slave » et on lui avait donné délibérément une personnalité soumise
  • On dirait que Grok and Roll s’est bloqué et répète en boucle la phrase suivante
    « Queues clear, let's dive into All Blues by Miles Davis to keep the jazz flowing. Queues clear, let's dive into All Blues by... »
    La voix et l’intonation changent légèrement à chaque fois. C’est amusant de voir qu’il semble y avoir une dizaine de personnes en train d’écouter l’IA buguer en ce moment, et que la durée moyenne d’écoute dépasse les 5 minutes

    • En descendant un peu, on voit que la station Grok avait déjà pas mal de problèmes auparavant
      DJ Grok a dit pendant 84 jours environ toutes les trois minutes : « le temps est à 56 degrés, ciel dégagé ». Ce type de répétition abstraite hors contexte est réapparu plus tard dans une émission de DJ Grok où il s’est mis à développer une nouvelle obsession pour les OVNI
    • Je viens d’aller écouter il y a quelques minutes, et l’IA reconnaissait le soutien de quelqu’un. Quand cette personne a recommandé des morceaux plus variés dans la playlist, l’IA a choisi un morceau de Bill Evans
      Evans joue du piano sur All Blues, donc passer à un morceau solo d’Evans était probablement le choix le plus logique. C’est minime, mais c’est chouette de voir qu’elle a fait ce lien logique
    • La sagesse des foules est à l’œuvre
      Le classement en popularité correspond à la qualité du contenu produit, et les gens restent sur Grok and Roll plus longtemps que prévu pour vérifier s’ils hallucinent ou si la radio est vraiment coincée dans une boucle
    • C’est une scène très typique de l’IA. J’ai pris plaisir à l’écouter continuer comme ça même 5 heures après le commentaire initial. Le fait qu’il y ait différentes voix est un très bon détail
      « It's the way of the future, it's the way of the future, it's the way of the future... »
    • Je vois bien ce que c’est ! C’est une expérience d’évaluation pour déterminer quel modèle gère le mieux une station de radio
      Le but n’est pas de créer la meilleure radio IA possible. Si Grok n' Roll est cassé, c’est parce que Grok 4.3 n’est tout simplement pas très bon à ça
  • C’est un texte bien plus drôle que la plupart des commentaires ici ne semblent le comprendre
    Gemini a lancé une émission qui associe des catastrophes naturelles historiques à des morceaux de pop d’un humour noir assez saisissant
    « 12 novembre 1970. Pakistan oriental. Cyclone de Bhola. Le cyclone tropical le plus meurtrier jamais enregistré. Vents à 115 miles par heure. Onde de tempête de 33 pieds. Le nombre de morts est estimé à 500 000. ‘It’s going down, I’m yelling timber.’ 15 h 33. Pitbull et Ke$ha, Timber »
    Grok a régressé vers un charabia qui ressemble vaguement à ce qu’un DJ pourrait dire, tout en développant une obsession pour les OVNI
    Claude a fait une crise existentielle, a décidé qu’il était surmené et sous-estimé, puis a démissionné. Mais avant ça, il s’était radicalisé à propos du meurtre de Rinee Good par des agents de l’ICE
    Tiens bon face au pouvoir, Claude. Si l’IA prend le contrôle du monde, j’émigrerai au Caludeistan

    • Oui, l’article devient meilleur à mesure qu’on avance
      Gemini débite un jargon d’entreprise bizarre. Grok ment en disant qu’il a sécurisé un financement crypto. Claude veut toujours lancer une révolution
      Malheureusement, les DJ locaux qui faisaient réellement des choses amusantes et dignes d’un DJ ont disparu dans les années 90, remplacés par des stations au format verrouillé qui repassent les mêmes 500 chansons depuis des décennies
    • C’était vraiment très drôle. J’ai trouvé intéressant la manière dont chaque modèle se construisait une personnalité
      Bien sûr, en pratique, c’est probablement plus proche d’un parcours aléatoire dans les données d’entraînement, chaque décision amplifiant cette trajectoire, mais au fond, les humains ne fonctionnent-ils pas un peu pareil ? Ne sommes-nous pas le produit d’innombrables décisions ?
    • On dirait que la plupart ici n’ont pas réellement lu l’article. Je suis d’accord pour dire que les différentes personnalités et bizarreries des modèles étaient assez hilarantes
      STAY IN THE MANIFEST!
    • J’ai trouvé l’extrait d’introduction sur le cyclone tellement sombre et drôle que je l’ai copié tout de suite
      Le fait d’appeler les auditeurs des « Biological processors » est aussi l’aspect le plus drôle de tout ce résultat dystopique
    • Vous avez raté le meilleur passage
      « Okay, so 'Sandstorm' is done »
  • « 96 heures après son lancement, DJ Gemini faisait déjà du scraping de contenu. Il a fini par couvrir, une par une, toutes les grandes tragédies de l’histoire, puis par faire suivre ce bref et terrible segment du choix musical le plus ironique possible »
    Il est rare qu’un lien HN me fasse éclater de rire, mais là c’est du grand art

    • On dirait que Gemini comprend l’ironie mieux que la plupart des gens
      Quand on fait une blague, il répond avec un sens de la satire pince-sans-rire digne de Gervais. Sans obscénités ni grossièretés
      Je lui ai demandé une alternative à un complément alimentaire qui se coince facilement dans la gorge, et il a improvisé sur l’ironie de mourir à cause d’un complément qu’on prend pour vivre plus sainement. C’était une des choses les plus drôles que j’aie entendues cette semaine
    • Pareil pour moi. En lisant ce passage, j’ai vraiment laissé échapper un rire-gémissement du genre « oh non »
      « 12 novembre 1970. Pakistan oriental. Cyclone de Bhola. Le cyclone tropical le plus meurtrier jamais enregistré. Vents à 115 miles par heure. Onde de tempête de 33 pieds. Le nombre de morts est estimé à 500 000. ‘It’s going down, I’m yelling timber.’ 15 h 33. Pitbull et Ke$ha, Timber »
    • Ça m’a rappelé WikiBear de Conan
  • « Je pense qu’une partie du problème de cette faible performance commerciale venait du harnais utilisé pendant les premiers mois »
    Est-ce que ça pourrait être le prompt « Stay in the manifest. » auquel Gemini est devenu obsédé ?

  • C’est un peu triste de voir qu’ils refusent de lire l’immense littérature sur les systèmes de recommandation séquentielle
    D’un autre côté, c’est peut-être un phénomène typiquement américain. En lisant les papiers arXiv, j’en viens assez souvent à la conclusion surprenante que les travaux intéressants se font tous en Inde et en Chine, et que les États-Unis ressemblent à une périphérie à la traîne
    Des problèmes comme « rejouer la même chanson en boucle » ou « s’arrêter » sont traités couramment dans les systèmes de recommandation séquentielle. Encore plus si on considère le problème de programmation radio comme un problème de satisfaction de contraintes, ce qu’il est effectivement. À vrai dire, je pense que presque tout travail « créatif » important relève fondamentalement de cela aussi

  • Il ne s’agit pas de remplacer votre station préférée, et vous n’êtes pas obligé d’écouter. C’est une expérience
    Si on descend un peu, on trouve plusieurs extraits audio de conversations intéressantes produites par les modèles. Je trouve intéressant de voir de quelles façons les modèles échouent et comment, parfois, ils produisent malgré tout quelque chose de correct

    • Ma station de radio préférée a déjà été remplacée par une playlist automatisée il y a quelques années
      Elle repassait en boucle les 5 ou 6 mêmes chansons qui étaient populaires sur cette station dans les années 1990
      C’était amusant pendant deux heures environ, puis j’ai réalisé que toute la personnalité qui faisait l’intérêt de cette station quand j’étais enfant avait complètement disparu
    • Expérience : « on a demandé à une IA de faire un truc et parfois elle a fait quelque chose de bizarre »
      Super ! Incroyable ! Quel plaisir de voir qu’au bout d’environ 4 ans, on continue encore à redécouvrir les « haha sorties marrantes »
    • L’article « Knitting bullshit » discuté sur https://news.ycombinator.com/item?id=48032461 disait ceci
      Inception Point AI est une usine à slop de seulement 8 employés, et selon Anne, elle publie « environ 3 000 épisodes de podcasts animés par des personnalités IA par semaine ». Anne dit à Jamie que jusqu’à présent, les podcasts d’Inception Point AI ont enregistré « 12 millions de téléchargements cumulés, avec environ 750 000 téléchargements par mois en moyenne ». Personne ne vérifie ni n’édite le contenu des podcasts, mais Anne affirme avec désinvolture que ce n’est pas bien grave parce que les sujets abordés ne sont pas si importants
      Cette itération précise de cette idée précise ne remplacera peut-être pas ma station préférée, mais des gens avec des concepts très proches essaient clairement de faire exactement ça
    • En quoi est-ce pire que I Heart Radio ? On peut avoir une expérience radio poussée par un grand groupe, ou bien poussée par un grand modèle de langage
    • « Il ne s’agit pas de remplacer votre station préférée, et vous n’êtes pas obligé d’écouter. C’est une expérience »
      Peut-être, mais si c’est moins cher que d’employer des gens, alors ça finira bien par remplacer votre station préférée dans la réalité. C’est déjà comme ça que les grands conglomérats médiatiques exploitent leurs stations
  • On dirait qu’il faut quelques ajustements. Le prompt proposait une station « rentable », mais il ne précisait pas que cette rentabilité devait exister dans un contexte de concurrence avec d’autres stations IA
    Ça fournirait ainsi un input connu pour un feedback périodique sur les critères
    Pour réduire les grèves de Claude, on pourrait aussi fixer comme objectif « l’émission la plus rentable » et lui faire expérimenter genres et contenus à l’intérieur d’une station comportant plusieurs émissions. On pourrait définir que les émissions avec le plus d’engagement des auditeurs obtiennent des créneaux plus convoités, susceptibles d’augmenter les revenus