Andrej Karpathy rejoint Anthropic

(twitter.com/karpathy)

12 points par GN⁺ 2026-05-20 | 4 commentaires | Partager sur WhatsApp

Il me semble que les prochaines années passées à la pointe du domaine des LLM seront une expérience particulièrement importante. Je suis heureux de rejoindre l’équipe et de revenir à la R&D. Ma passion pour l’enseignement reste profonde, et si le temps le permet, je prévois de reprendre des activités liées à l’éducation.

Selon Anthropic, Karpathy commencera à travailler dès cette semaine au sein de l’équipe de pré-entraînement
Cette équipe est chargée des cycles d’entraînement à très grande échelle (massive training runs) qui confèrent à Claude ses connaissances et capacités fondamentales
Un domaine qui devient de plus en plus important alors que les entreprises d’IA rivalisent pour automatiser une partie du processus de développement de l’IA en utilisant Claude pour accélérer la recherche sur le pré-entraînement elle-même

4 commentaires

xguru 2026-05-20

Anthropic est en train de collectionner les CTO/cofondateurs d’entreprises connues,
et maintenant même Karpathy !

L’actuel CTO d’Anthropic, Rahul Patil, était le CTO de Stripe
CTO d’Instagram - Mike Krieger
CTO de Workday - Peter Bailis
CTO de You.com - Bryan McCann
CTO de Box - Ben Kus
CTO de Super.com - Henry Shi
CTO d’Adept AI - Niki Parmar

bokjjang 2026-05-20

Mais alors, pourquoi ne m’a-t-on toujours pas contacté ?

xguru 2026-05-20

À bien y penser, Eugene Yan, qui a récemment écrit comment travailler avec l’IA et progresser de façon cumulative, comme des intérêts composés, est lui aussi parti chez Anthropic.
Il y a vraiment énormément de gens connus. Je suis vraiment curieux de voir comment ils vont organiser leur processus de développement haha

GN⁺ 2026-05-20

Réactions sur Hacker News

Je ne comprends pas pourquoi qui que ce soit voudrait travailler chez FAGMAN. C’est déprimant de voir autant de talents faire passer l’argent avant la conscience
Il n’est même pas nécessaire de vivre dans la Bay Area, et dans la plupart des régions civilisées de la planète, on peut vivre confortablement avec un dixième de ce salaire, sans avoir à vendre son âme
Aussi incroyable que cela puisse paraître, il se fait aussi de la R&D intéressante dans d’autres domaines et d’autres régions
Selon Anthropic, Karpathy a commencé cette semaine à travailler dans l’équipe de préentraînement, chargée des grands runs d’entraînement qui construisent les connaissances et capacités fondamentales de Claude
Source : https://www.axios.com/2026/05/19/anthropic-openai-karpathy-a...
- Plus précisément, cela semble consister à étendre les idées de https://github.com/karpathy/autoresearch à un effort plus large d’amélioration récursive de l’apprentissage [1]
  « Nous sommes ravis d’accueillir Andrej dans l’équipe Pretraining ! Il va monter une équipe qui utilisera Claude pour accélérer la recherche en préentraînement elle-même. Je ne vois personne de mieux placé pour ce travail — j’ai hâte de voir ce que nous allons construire ensemble ! »
  [1] https://x.com/nickevanjoseph/status/2056760504949842219
- Du point de vue d’Anthropic, c’est un bon coup de branding. Karpathy est quelqu’un de très respecté dans le milieu du machine learning
- S’il existe déjà un Mythos de nouvelle génération, pourquoi auraient-ils besoin de ce type de profil ? Ça devrait tout faire tout seul, non ?
C’est un excellent pédagogue et, au moins en interview, il donne l’impression d’être vraiment quelqu’un de bien. J’aimerais qu’il continue à enseigner, même en parallèle, mais avec la quantité énorme de NDA que cela implique sans doute, ça ne sera probablement pas simple
- C’est un excellent pédagogue non seulement en machine learning, mais aussi dans d’autres domaines. Il a aussi enseigné le speedcubing sous le pseudonyme badmefisto
Fait amusant, il l’avait déjà laissé entendre dans une interview récente. Il disait qu’il risquait de ne plus réussir à suivre des approches qui évoluent vite, et qu’il serait intéressé si un frontier lab voulait bien de lui
https://youtu.be/kwSVtQ7dziU?t=47m50s
- Je me demande combien de problèmes Leetcode ou Codility il a dû résoudre avant ça
- Quelqu’un chez Anthropic a dû voir ça et s’enflammer aussitôt
- Tant mieux pour lui. Son travail public de ces 1 à 2 dernières années a eu beaucoup d’impact sur moi, et probablement sur d’autres aussi
  Je comprends aussi son inquiétude à l’idée de ne pas pouvoir suivre le rythme récent des changements, et je pense moi aussi que travailler dans un frontier lab ou un environnement similaire l’aiderait clairement
  Mon parcours est un mélange atypique de philosophie analytique, linguistique/TAL, études de propagande, et data science/stratégie de long terme en institution, donc quand j’essaie de changer de secteur, ce n’est pas particulièrement fluide pour passer les systèmes ATS
  Du coup, je continue à m’occuper autant que possible. Récemment, je construis des outils autour de l’observabilité à l’exécution des systèmes LLM, de la lisibilité des intentions et de l’intervention
  De petits résultats publics commencent enfin à apparaître : https://huggingface.co/spaces/anotheruserishere/Cartogemma
  Bref, ça vaut le coup d’essayer
Karpathy est talentueux et, pour moi, il a toujours eu l’air du genre à s’opposer à la création d’un truc comme Skynet. Anthropic a de la chance de l’avoir
- Honnêtement, si Skynet est possible, Anthropic sera probablement le premier à le construire, puis dira qu’ils n’avaient pas le choix parce qu’OpenAI est pire
- Vu ses contenus récents, j’ai malheureusement l’impression qu’il a attrapé une sorte de psychose LLM
Suis-je le seul à trouver Anthropic de plus en plus effrayant ? Pas parce qu’ils réussissent bien, mais parce qu’ils donnent l’impression d’être une tornade du secteur qui aspire et détruit tout sur son passage
- Cite juste trois choses qu’ils ont détruites
- Même sans Karpathy, le domaine de l’IA n’aurait pas raté un battement, mais il est évidemment un excellent renfort pour n’importe quelle équipe
J’aimerais vraiment qu’ils facilitent la destruction du fossé défensif de Twitter/X. Pourquoi n’existe-t-il toujours pas d’application qui publie en une seule fois sur Bluesky, Mastodon, Threads et les autres réseaux ?
- Tu devrais jeter un œil à https://github.com/alexandru/social-publish
Personnellement, j’espère qu’il ne passera pas à zéro temps sur les contenus éducatifs. Ça semble être sa force particulière. Cette nouvelle donne l’impression qu’Eureka Labs ne sortira ni produit ni cours
La trajectoire de carrière de Karpathy me fait penser à Jim Keller. Comme un papillon qui butine de fleur en fleur, accumule de l’expérience et crée de la magie partout où il passe
- Je ne pense pas qu’il ait un portefeuille de réalisations du niveau de Keller. Je le vois davantage comme un pédagogue
- « crée de la magie partout où il passe », concrètement, ça veut dire quoi ?
L’emballage marketing outrancier dans ce fil rate le signal le plus important. Le fait qu’un fondateur IA du calibre de Karpathy mette publiquement Eureka Labs en pause pour rejoindre Anthropic revient pratiquement à admettre qu’au final, les produits verticaux se font manger par les mises à niveau des modèles de pointe
Pour ceux qui construisent quelque chose au-dessus des modèles de base, c’est ça la vraie info
- À quel point Eureka Labs a-t-il jamais été un projet sérieux, au juste ? On avait surtout l’impression d’une bannière pour ses diverses expérimentations de création de contenu
- Des expressions comme « ça, c’est la vraie info » ou « le signal le plus important » ont pas mal des caractéristiques d’un texte généré par IA. On dirait juste qu’on a rajouté par-dessus une simplification de style très appuyée, du genre tout écrire en minuscules avec un espacement bizarre

Andrej Karpathy rejoint Anthropic

À lire aussi

4 commentaires

Réactions sur Hacker News