2 points par GN⁺ 5 시간 전 | 2 commentaires | Partager sur WhatsApp
  • À l’occasion du lancement de Claude Fable, l’auteur extrapole de façon satirique les futurs noms de modèles à partir de l’idée qu’Anthropic évolue de la poésie vers des objets narratifs d’entreprise
  • On peut s’attendre à des extensions plus courtes, plus longues, ou variées, entre les modèles existants et au-delà
  • Plus petit que Haiku, Aphorism ne fait qu’une phrase mais donne toujours l’impression d’avoir raison, tandis que Marginalia, plus petit que Sonnet, fournit des commentaires annotationnels non demandés dans le code
  • "Fable (xhigh)" est décrit comme un speedrun vers la faillite, et Saga comme un « Fable encore plus verbeux »
  • Plus les modèles fictifs montent en gamme, plus augmentent la longueur des réponses, le coût et les effets secondaires, dans une satire humoristique des conventions de nommage des modèles et des coûts/excès des grands modèles

Introduction — l’hypothèse d’une extension du nommage

  • Avec la sortie de Claude Fable, il est désormais clair qu’Anthropic passe de la poésie à des objets narratifs à l’échelle de l’entreprise (enterprise-scale narrative objects)
  • Pour suivre la concurrence, l’entreprise construit un large portefeuille de modèles optimisés pour l’ensemble de la pile littéraire (literary stack)

Noms de modèles et description

Nom du modèle Description
Aphorism Une seule phrase, mais donne toujours l’impression d’avoir raison
Haiku Petit poème, petite facture
Marginalia Fournit des commentaires non demandés dans le code
Abstract Résume un raisonnement qui n’a pas eu lieu
Sonnet Poème de longueur moyenne, facture de taille moyenne
Diatribe Un Sonnet en colère
Opus Long poème, occupe la totalité de la facture
Treatise Comme Opus, mais les sources des citations sont laissées en exercice au lecteur
Mythos Un Opus effrayant
Fable Fonctionne comme Mythos jusqu’au moment où la question devient importante
Fable (xhigh) Un speedrun vers la faillite
Saga Un Fable encore plus verbeux
Saga (Unabridged) Inclut aussi des réponses à des questions sans rapport
Lore Nécessite un wiki pour l’interprétation
Cinematic Universe Regroupe plusieurs Saga avec une couche de dispatch Lore
Cinematic Universe (Director's Cut) Ajoute 42 % de tokens en plus à la même réponse
Terms of Service N’assume aucune responsabilité pour la réponse ni pour ses conséquences
Overwhelmingly Large Narrative Unit Il faut regarder la section « précédemment » avant utilisation
Omnibus Le fine-tuning continue jusqu’à amélioration du moral

2 commentaires

 
zapiana 37 분 전

S’amuser avec les conventions de nommage, c’est universel.

 
GN⁺ 5 시간 전
Commentaires Hacker News
  • Parmi les autres candidats possibles, on pourrait aussi avoir Serial, Prequel, Yarn, Head Canon, Overstory et Oeuvre
    Serial sortirait des réponses incroyablement captivantes, puis se terminerait sur un cliffhanger en cachant la bonne réponse, et Prequel fournirait toute la backstory menant à la question au lieu de donner la réponse
    Yarn prendrait volontairement un chemin long et tortueux jusqu’à la bonne réponse pour maximiser les tokens de sortie, et Head Canon répondrait aux entrées avec sa propre théorie étrange mais amusante
    Overstory transformerait ma réponse en une méta-réponse plus vaste et plus profonde, tissée avec celles de huit autres utilisateurs, et Oeuvre générerait pour chaque question un ensemble d’œuvres variées mais cohérentes à travers plusieurs médias, chacune étant un chef-d’œuvre déchirant

  • Overwhelmingly Large Narrative Unit : ça me fait regretter Iain M. Banks. J’aime ce petit hommage à The Culture

  • Excellent. saga et canon sont clairement de futurs noms de modèles possibles, et pour plaisanter, j’aimerais aussi voir « Cinematic Universe »

    • Zack Snyder's Saga ferait aussi un bon nom
  • Dario Legendarium serait sans doute un matériau assez amusant à explorer pour les historiens qui chercheront à retracer les origines de cette époque. Le caractère relatif des organisations concernées transparaît aussi un peu dans le naming : {o1,4o,3.5,5.5} vs. {Haiku,Sonnet,Opus} vs. {3.1, 3.5-pro, 3.5-flash, 3.5-flash-lite} vs. {3.7, 3.7-plus, 3.7-max}
    C’est dommage que Samsung ne soit pas dans le lot. J’aurais bien aimé essayer un modèle nommé Samsung Galaxy S10+ 5G Lite

    • IBM aurait probablement choisi un nom du genre CICS/370 Neural Transaction Facility: sous-système résident z/OS de traitement transactionnel de langage naturel pour entreprise, destiné à la génération de spools de raisonnement interactif orienté batch et de gestion des prompts
    • Sony aurait pareillement sorti un nom comme AI-LLM1000XM5 Mark II
    • Galaxy AI 3.8-Flash-Plus Max (xhigh)
    • Samsung Galaxy Brain S26
    • C’est étrange de ne pas voir dans les modèles chinois des noms comme « Good Fortune 27b » ou « Much Success MoE »
  • Le fait qu’Anthropic dégrade volontairement les réponses montre qu’eux aussi se focalisent sur de mauvaises choses. Au lieu de construire le meilleur modèle possible, ils nerfent les performances du modèle

    • Les utilisateurs sont l’ennemi, et les clients des voleurs
    • Si l’on croit les mythes et les fables comme s’il s’agissait de faits, il faut s’attendre à une certaine déception
  • Je trouve qu’Anthropic est bien meilleur qu’OpenAI pour le naming

    • L’époque où, dans un menu déroulant d’un produit grand public utilisé par un milliard de personnes, on te demandait de choisir entre o3, 4o, 4o-mini, o4-mini, gpt-4.1, gpt-4.1-mini et gpt-4.5 (Research Preview) me manque
    • C’est difficile de faire pire qu’OpenAI en matière de naming
  • J’aime bien le fait que les initiales des trois modèles d’origine reflètent assez bien leur comportement : Opus fait OP, c’est-à-dire OverPowered, et Sonnet faisait SO, comme un être aimé. C’était encore plus parlant à l’époque de Sonnet 3.7. Haiku, c’est HA, comme la réaction à une blague nulle
    Le dernier modèle avait naturellement besoin de trois lettres, donc c’est devenu FAB. Maintenant j’attends ABS et LO

    • Voici ! Je vais vous montrer Overclaude !
  • Tractatus : connaît très bien ses propres limites et refuse de parler de trop nombreux sujets. Aime énormément numéroter ses phrases. Inutilisable à cause d’un bug de fenêtre de contexte, puis corrigé après une latence considérable

  • Prayer : on appuie sur Entrée et on prie pour que ça marche. Parable : répond aux questions que je ne savais même pas que je devais poser. Bible : des dizaines d’instances de Parable venues de différentes époques font leur rapport, et les tokens sont sauvés à l’expiration