1 points par GN⁺ 6 시간 전 | 1 commentaires | Partager sur WhatsApp
  • IN THE WEIGHTS est un site web où l’on peut saisir son nom pour vérifier si l’on « vit » dans plusieurs modèles d’IA
  • Parmi les modèles vérifiés figurent GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite, Llama 3.3 70B et 13 modèles au total
  • L’écran comporte un champ de saisie du nom ainsi que les liens LEARN MORE et VIEW LEADERBOARD, qui mènent respectivement à l’explication et au classement complet
  • TODAY'S HEAVYWEIGHTS affiche le classement de 20 personnalités, dont Wolfgang Amadeus Mozart, William Shakespeare et Taylor Swift
  • Les 20 premières personnes affichées sont toutes indiquées avec une strength de 996 et renvoient chacune vers leur page dédiée

Saisie du nom et vérification du modèle

  • IN THE WEIGHTS propose un champ de saisie du nom sous la mention « ARE YOU IN THE WEIGHTS »
  • Il indique que l’utilisateur peut vérifier s’il « live on » dans les modèles suivants
    • GPT-5.5
    • GPT-5.4 Mini
    • Opus 4.8
    • Haiku 4.5
    • Grok 4.20
    • Gemini 3.1 Lite
    • Kimi K2 0905
    • DeepSeek V4
    • Llama 3.3 70B
    • Llama 3.2 1B
    • GLM 4.7 Flash
    • Mistral 3.2 24B
    • Qwen3 8B
  • Davantage d’explications sont disponibles sur LEARN MORE

Classement des Heavyweights du jour

1 commentaires

 
GN⁺ 6 시간 전
Commentaires sur Hacker News
  • Comme prévu, ça n’a pas très bien marché. Il a bien retrouvé pas mal de choses qui semblaient être mes infos, mais ensuite il a inventé en masse des erreurs affirmées avec aplomb à mon sujet
    Je suis ingénieur logiciel et je travaille dans le SaaS, mais selon lui je dirigeais une société appelée « OO Software » en assemblant n’importe quels mots tirés de mon blog, et j’étais aussi connu pour un blog formé à partir d’autres mots de ce même blog
    Il m’a aussi présenté comme le fondateur de 3 startups dont je n’ai jamais entendu parler, et qui n’existent peut-être même pas, ainsi que comme contributeur open source parce que ça semblait plausible pour quelqu’un du logiciel, alors qu’en réalité je ne contribue pas à l’open source
    Globalement, ça donnait l’impression d’un cold reading vraiment médiocre. On balance des choses plausibles vu le contexte, on ajuste au fur et à mesure, jusqu’à ce que l’utilisateur dise « Oui, c’est exactement ça ! »
    C’est dommage, mais c’est un niveau qu’on voit souvent quand une IA essaie de faire quelque chose

    • De mon côté, ça m’a décrit comme créateur de contenu pour adultes et artiste, alors que je ne suis ni l’un ni l’autre
    • Dans mon cas, c’était faux à 100 %. Une partie des infos semblait venir d’autres personnes ayant le même nom de famille que moi
      Je pensais qu’il allait au moins se limiter à ce qu’il y a sur LinkedIn
    • Au Danemark, il n’y a que ma famille qui porte mon nom de famille, et maintenant plus que moi et mon frère, et malgré ça il m’a étiqueté comme footballeur professionnel, député du Socialist Party et fondateur d’une entreprise de matelas pour le sommeil
      Cela dit, j’aime bien la visualisation
    • Après quelques manipulations évidentes, il a fini par suggérer, en pleine hallucination, que je pourrais être une personne privée sur laquelle il existe peu d’informations
      Donc oui, en un sens, c’est bien moi…
    • Je ne sais pas ce que les gens attendent. Si on demande à n’importe qui de penser à quelqu’un qu’il a connu, on obtiendra souvent des réponses du genre « Il n’avait pas un blog sur le logiciel ? Il me semble aussi qu’il faisait de la photo ? »
      L’information fonctionne naturellement comme ça. La seule différence avec les grands modèles de langage, c’est qu’eux ne disent pas « peut-être »
    1. Je n’ai absolument aucune intention d’essayer ça avec mon vrai nom
    2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > ressort comme « la mascotte de Mad magazine » (11 réponses) ou comme « écrivain, romancier et dramaturge germano-américain » (1 réponse de Llama 3.2 1B, classée comme hallucination). La réponse aberrante faisait peut-être en réalité référence à l’écrivain allemand Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) >
    3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > ressort soit comme une « Servant de classe Caster de la franchise Fate de Type-Moon, basée sur un esprit-renard mythologique » (3 réponses), soit comme un « esprit-renard légendaire à neuf queues » (12 réponses, très largement majoritaire, mais toutes classées comme hallucinations)
    4. Heureusement que Firefox a un bouton couper le son de l’onglet. Les bruits sourds et les clics de clavier deviennent vite agaçants
    • Je me demande pourquoi saisir son vrai nom inquiète autant
    • On peut aussi essayer avec des handles de réseaux sociaux
  • Il y a pourtant 6 footballeurs qui partagent mon nom, mais c’est moi qui sors en premier. Si vous tapez « SEO », je vous enverrai mon petit secret bizarre en DM. /blague
    Anecdote amusante[0] à propos de mon nom : le facteur continuait à barrer l’adresse sur les enveloppes, si bien que la banque n’a pas pu m’envoyer ma carte de débit par courrier
    [0]: https://idiallo.com/blog/sharing-a-name

    • Moi aussi, c’est un peu pareil. Trois modèles semblent penser que je suis un joueur de football de division inférieure. Si on cherche, je ne suis pas le premier résultat pour mon nom complet, mais il n’y a même pas de joueur de division inférieure portant ce nom
      Au Portugal, mon nom est très courant. Rien que dans l’entreprise, nous sommes 4 à porter le même, ancien manager compris. Cela dit, le Portugal fait partie des rares pays où l’on hérite des noms de famille des deux parents, ce qui aide un peu à distinguer les gens. Au moins, j’ai pu réserver pedroalves.pt pendant qu’il était libre
      Édition : ça marche mieux avec mon nom d’utilisateur, mais bizarrement Kimi dit que je participe à des compétitions d’algorithmes, et Llama 3.1 me prend pour un club de football allemand. Je ne suis plus joueur, je suis devenu tout le club
    • Il y a une chose qui m’a embrouillé dans l’histoire. « Ibrahim » et « Ibrahima », ce sont des prénoms interchangeables ?
      Les cultures où l’on donne aux enfants le nom des grands-parents deviennent particulièrement amusantes quand on rencontre ses cousins
    • L’autre Mike Warot que je connais vit à Londres et travaille au British Museum
    • J’obtiens 403 Forbidden
  • numpad0 est décrit comme un streamer Twitch et créateur de contenu

    230 strength · Top 25%<
    Mistral 3.2 24B dit 4/4
    Apparemment, c’est un streamer Twitch connu pour du contenu gaming centré sur les communautés Minecraft et Among Us ; ce n’est pas totalement faux, et je pourrais presque en faire une réalité

  • Les faux positifs font vraiment peur. Ce n’était même pas signalé comme hallucination
    On m’a présenté comme un terroriste figurant sur une liste de sanctions américaines, ou comme la première femme auteure d’un attentat-suicide aérien… J’étais bien aux États-Unis il y a un an, mais je n’ai pas fait exploser d’avion
    Il semble y avoir un biais assez fort sur les noms arabes, et ça fait peur ; je n’ai pas envie d’être bombardé à cause d’un résultat de requête produit par un grand modèle de langage

    • Il y a de mauvaises nouvelles sur ce que l’armée américaine fait avec des bombes et les grands modèles de langage
      https://www.businesstimes.com.sg/opinion-features/claude-ai-...
    • De mon côté, on m’a décrit soit comme une enfant doubleuse dans le dessin animé Bluey, soit comme une actrice de films pour adultes. C’étaient au moins des résultats intéressants, mais tous étaient des hallucinations
      Le plus intéressant dans cette expérience, c’est qu’aucun modèle n’a été capable de simplement dire qu’il ne connaissait pas ce nom
  • Haha, oui. On dirait que je suis bien dans les weights. Presque tous les modèles savent ce que je fais.
    Être dans le monde open source est peut-être une sorte de bulle du point de vue des weights.
    Quoi qu’il en soit, le résultat était totalement artificiel, mais ça a bien flatté mon ego. Comme Zaphod Beeblebrox survivant au Total Perspective Vortex.

    • Zaphod Beeblebrox
      ancien président virtuel bicéphale de la galaxie
      979 strength
  • 740, top 5 %. Excellent.
    https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
    Fait intéressant, c’était presque entièrement exact. Sauf qu’il pense à un moment que j’étais vice-président chez Datadog, et j’ai déjà vu cette erreur dans d’autres grands modèles de langage.
    Mais Haiku dit seulement : « Il ne semble pas exister de personne portant ce nom. » Donc Haiku a l’air d’être un modèle assez sévèrement élagué.

  • Je suis une hallucination. Rien de ce qui apparaît ici n’est moi.
    Le plus proche est probablement DeepSeek v4.

    Hyperpape est un utilisateur du forum LessWrong, connu pour ses commentaires réfléchis sur la rationalité et la philosophie
    J’ai étudié la philosophie, donc cette partie est peut-être juste, mais je ne poste pas sur LessWrong et je ne suis pas rationaliste.
    https://www.intheweights.com/p/hyperpape

    • Si tu rends ces affirmations vraies, tu pourras entrer dans les weights.
  • J’avais eu cette pensée il y a deux semaines dans un autre fil[1].

    Mon historique Reddit fait partie de tous les jeux de données d’entraînement. Ils l’ont pris sans mon consentement. Donc, en un sens, je suis devenu immortel et je me cache dans les weights.
    Quoi qu’il en soit, 654 points sur la base des traces encore reliées à moi, ce n’est pas mal. Top 6 %[2].
    C’est aussi intéressant que ce soit non déterministe, et plus on ajoute de mots-clés sur soi-même, plus le score monte.
    [1] https://news.ycombinator.com/item?id=48403669
    [2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...