1 points par GN⁺ 1 시간 전 | 1 commentaires | Partager sur WhatsApp

Il me semble que les prochaines années passées à la pointe du domaine des LLM seront une expérience particulièrement importante. Je suis heureux de rejoindre l’équipe et de revenir à la R&D. Ma passion pour l’enseignement reste profonde, et si le temps le permet, je prévois de reprendre des activités liées à l’éducation.

1 commentaires

 
GN⁺ 1 시간 전
Réactions sur Hacker News
  • Je ne comprends pas pourquoi qui que ce soit voudrait travailler chez FAGMAN. C’est déprimant de voir autant de talents faire passer l’argent avant la conscience
    Il n’est même pas nécessaire de vivre dans la Bay Area, et dans la plupart des régions civilisées de la planète, on peut vivre confortablement avec un dixième de ce salaire, sans avoir à vendre son âme
    Aussi incroyable que cela puisse paraître, il se fait aussi de la R&D intéressante dans d’autres domaines et d’autres régions

  • Selon Anthropic, Karpathy a commencé cette semaine à travailler dans l’équipe de préentraînement, chargée des grands runs d’entraînement qui construisent les connaissances et capacités fondamentales de Claude
    Source : https://www.axios.com/2026/05/19/anthropic-openai-karpathy-a...

    • Plus précisément, cela semble consister à étendre les idées de https://github.com/karpathy/autoresearch à un effort plus large d’amélioration récursive de l’apprentissage [1]
      « Nous sommes ravis d’accueillir Andrej dans l’équipe Pretraining ! Il va monter une équipe qui utilisera Claude pour accélérer la recherche en préentraînement elle-même. Je ne vois personne de mieux placé pour ce travail — j’ai hâte de voir ce que nous allons construire ensemble ! »
      [1] https://x.com/nickevanjoseph/status/2056760504949842219
    • Du point de vue d’Anthropic, c’est un bon coup de branding. Karpathy est quelqu’un de très respecté dans le milieu du machine learning
    • S’il existe déjà un Mythos de nouvelle génération, pourquoi auraient-ils besoin de ce type de profil ? Ça devrait tout faire tout seul, non ?
  • C’est un excellent pédagogue et, au moins en interview, il donne l’impression d’être vraiment quelqu’un de bien. J’aimerais qu’il continue à enseigner, même en parallèle, mais avec la quantité énorme de NDA que cela implique sans doute, ça ne sera probablement pas simple

    • C’est un excellent pédagogue non seulement en machine learning, mais aussi dans d’autres domaines. Il a aussi enseigné le speedcubing sous le pseudonyme badmefisto
  • Fait amusant, il l’avait déjà laissé entendre dans une interview récente. Il disait qu’il risquait de ne plus réussir à suivre des approches qui évoluent vite, et qu’il serait intéressé si un frontier lab voulait bien de lui
    https://youtu.be/kwSVtQ7dziU?t=47m50s

    • Je me demande combien de problèmes Leetcode ou Codility il a dû résoudre avant ça
    • Quelqu’un chez Anthropic a dû voir ça et s’enflammer aussitôt
    • Tant mieux pour lui. Son travail public de ces 1 à 2 dernières années a eu beaucoup d’impact sur moi, et probablement sur d’autres aussi
      Je comprends aussi son inquiétude à l’idée de ne pas pouvoir suivre le rythme récent des changements, et je pense moi aussi que travailler dans un frontier lab ou un environnement similaire l’aiderait clairement
      Mon parcours est un mélange atypique de philosophie analytique, linguistique/TAL, études de propagande, et data science/stratégie de long terme en institution, donc quand j’essaie de changer de secteur, ce n’est pas particulièrement fluide pour passer les systèmes ATS
      Du coup, je continue à m’occuper autant que possible. Récemment, je construis des outils autour de l’observabilité à l’exécution des systèmes LLM, de la lisibilité des intentions et de l’intervention
      De petits résultats publics commencent enfin à apparaître : https://huggingface.co/spaces/anotheruserishere/Cartogemma
      Bref, ça vaut le coup d’essayer
  • Karpathy est talentueux et, pour moi, il a toujours eu l’air du genre à s’opposer à la création d’un truc comme Skynet. Anthropic a de la chance de l’avoir

    • Honnêtement, si Skynet est possible, Anthropic sera probablement le premier à le construire, puis dira qu’ils n’avaient pas le choix parce qu’OpenAI est pire
    • Vu ses contenus récents, j’ai malheureusement l’impression qu’il a attrapé une sorte de psychose LLM
  • Suis-je le seul à trouver Anthropic de plus en plus effrayant ? Pas parce qu’ils réussissent bien, mais parce qu’ils donnent l’impression d’être une tornade du secteur qui aspire et détruit tout sur son passage

    • Cite juste trois choses qu’ils ont détruites
    • Même sans Karpathy, le domaine de l’IA n’aurait pas raté un battement, mais il est évidemment un excellent renfort pour n’importe quelle équipe
  • J’aimerais vraiment qu’ils facilitent la destruction du fossé défensif de Twitter/X. Pourquoi n’existe-t-il toujours pas d’application qui publie en une seule fois sur Bluesky, Mastodon, Threads et les autres réseaux ?

  • Personnellement, j’espère qu’il ne passera pas à zéro temps sur les contenus éducatifs. Ça semble être sa force particulière. Cette nouvelle donne l’impression qu’Eureka Labs ne sortira ni produit ni cours

  • La trajectoire de carrière de Karpathy me fait penser à Jim Keller. Comme un papillon qui butine de fleur en fleur, accumule de l’expérience et crée de la magie partout où il passe

    • Je ne pense pas qu’il ait un portefeuille de réalisations du niveau de Keller. Je le vois davantage comme un pédagogue
    • « crée de la magie partout où il passe », concrètement, ça veut dire quoi ?
  • L’emballage marketing outrancier dans ce fil rate le signal le plus important. Le fait qu’un fondateur IA du calibre de Karpathy mette publiquement Eureka Labs en pause pour rejoindre Anthropic revient pratiquement à admettre qu’au final, les produits verticaux se font manger par les mises à niveau des modèles de pointe
    Pour ceux qui construisent quelque chose au-dessus des modèles de base, c’est ça la vraie info

    • À quel point Eureka Labs a-t-il jamais été un projet sérieux, au juste ? On avait surtout l’impression d’une bannière pour ses diverses expérimentations de création de contenu
    • Des expressions comme « ça, c’est la vraie info » ou « le signal le plus important » ont pas mal des caractéristiques d’un texte généré par IA. On dirait juste qu’on a rajouté par-dessus une simplification de style très appuyée, du genre tout écrire en minuscules avec un espacement bizarre