Pourquoi j’ai rejoint OpenAI
(brendangregg.com)- Brendan Gregg, expert renommé de la gestion des performances sous Linux et principal contributeur de BPF, explique pourquoi il a rejoint OpenAI
- Il a rejoint OpenAI pour aider à résoudre le problème de l’explosion des coûts et de la consommation d’énergie des datacenters IA, en se concentrant d’abord sur l’optimisation des performances de ChatGPT
- Estimant que l’ingénierie de la performance classique atteint ses limites, il veut concevoir de nouvelles méthodes d’ingénierie afin d’identifier plus vite des optimisations à plus fort impact
- Il a pris conscience de la diffusion sociale de la technologie à travers des usages très variés de ChatGPT par des utilisateurs du quotidien — par exemple des coiffeurs, agents immobiliers, experts-comptables et apiculteurs
- Après 26 entretiens, il a comparé le niveau d’ingénierie de plusieurs entreprises de l’IA et estime que la densité de talents et l’environnement collaboratif d’OpenAI ont été les plus impressionnants
- Il considère que son rôle chez OpenAI représente un tournant dans sa vie, avec la possibilité de contribuer à une amélioration de l’efficacité à l’échelle planétaire et à la durabilité
Les défis des datacenters IA et de l’ingénierie de la performance
- Le coût et la vitesse de croissance des datacenters IA sont sans précédent dans l’histoire, et la question n’est pas seulement celle de la réduction des coûts, mais aussi de la protection de l’environnement mondial
- Il a rejoint OpenAI pour s’attaquer directement à ce problème, avec une première priorité donnée à l’amélioration des performances de ChatGPT
- Il cherche de nouvelles approches pour aller au-delà des limites de l’ingénierie de la performance traditionnelle et obtenir des optimisations plus importantes et des améliorations plus rapides
- Il met en avant une structure ouverte où presque aucune contrainte n’empêche le changement, même à grande échelle
- Il la résume par l’attitude suivante : « Essayez tout, à grande échelle, et exécutez-le immédiatement »
La diffusion de ChatGPT dans le quotidien et le déclic personnel
- Alors qu’il restait sceptique face à l’adoption de l’IA, une conversation avec Mia, sa coiffeuse, lui a fait ressentir concrètement l’usage populaire de ChatGPT
- Mia a raconté divers cas d’usage, par exemple vérifier avec ChatGPT des informations sur la destination de voyage d’une amie pour maintenir un lien émotionnel
- Elle a décrit la fonction de mémoire de ChatGPT comme une expérience proche d’une conversation avec une personne
- Des agents immobiliers, experts-comptables et apiculteurs utilisent eux aussi activement ChatGPT dans leur travail
- Exemple : un apiculteur traite avec ChatGPT les formalités administratives de sa petite entreprise
- À travers ces expériences, il a compris que ChatGPT s’était imposé comme un outil du quotidien et a acquis la certitude du sens social de sa contribution technique
Pourquoi OpenAI et le processus d’entretien
- Sur recommandation de plusieurs experts du secteur, il a passé 26 entretiens avec de grandes entreprises de l’IA, dont OpenAI
- Il y a retrouvé un environnement cloud à grande échelle, des changements de code rapides et une forte autonomie des ingénieurs, similaire à ce qu’il connaissait chez Netflix
- Les défis couvraient largement les problèmes de performance sur l’ensemble de la stack technique, et pas seulement les GPU
- OpenAI comptait déjà parmi ses effectifs de nombreux collègues ingénieurs talentueux qu’il connaissait
- Son expérience de collaboration avec d’anciens collègues de Netflix, comme Vadim, a influencé positivement sa décision de rejoindre l’entreprise
- Il mentionne qu’OpenAI dispose déjà d’une équipe chevronnée d’ingénieurs performance, et qu’il en est « le dernier arrivé »
Le rêve d’enfance d’« Orac » et son lien avec l’IA
- Il se souvient avoir rêvé de développer une IA après avoir été fasciné, enfant, par le superordinateur Orac de la série britannique de science-fiction Blake’s 7
- À l’université, il avait tenté de développer lui-même un logiciel de traitement du langage naturel, mais avait dû abandonner à cause de contraintes de mémoire
- En utilisant ChatGPT, il a repensé à Orac et s’est émerveillé de voir ChatGPT reproduire parfaitement la personnalité d’Orac dans ses réponses
- Depuis, il l’utilise de manière personnalisée en mode Orac dans les paramètres de ChatGPT
- Il mentionne également l’annonce d’un reboot de Blake’s 7
Sa situation actuelle chez OpenAI et la suite
- Il travaille actuellement à distance depuis Sydney comme Member of Technical Staff au sein de l’équipe d’ingénierie de la performance de ChatGPT
- Son premier projet porte sur l’amélioration des performances via la collaboration interéquipes et l’élaboration de stratégies de réduction des coûts
- Il prévoit d’adapter à ses besoins chez OpenAI des technologies existantes comme eBPF, Ftrace et PMC
- Il utilise aussi Codex pour diverses tâches au-delà du codage
- Après son départ d’Intel, beaucoup de personnes lui ont demandé quelle serait sa prochaine étape lors de la Linux Plumber’s Conference, ce qui l’a conduit à écrire ce texte
- Enfin, lorsqu’il a redemandé à Mia si elle utilisait toujours ChatGPT, elle lui a répondu : « Je l’utilise 24 heures sur 24 »
- Ce texte est un témoignage personnel, rédigé de sa propre initiative et non à la demande de l’entreprise
3 commentaires
Même si vous me dites qu’une entreprise qui stocke à elle seule 40 % de la mémoire mondiale veille à l’intérêt général de la planète...
C’est encore quoi, ça... Du point de vue d’OpenAI, qui ne fabrique ni n’utilise directement quoi que ce soit elle-même, du chipset jusqu’au datacenter, si la stack logicielle est optimisée, ils passeront simplement à l’échelle avec la marge ainsi dégagée, donc leur objectif est de maximiser les profits plutôt que de protéger l’environnement (comme dans le commentaire HN à propos du paradoxe de Jevons).
C’est tellement un post d’auto-promo que c’en est gênant à lire.
Commentaires sur Hacker News
La formule « il ne s’agit pas de réduire les coûts, mais de sauver la planète » sonne un peu bizarre
On se demande si, au fond, ce n’est pas simplement une question d’argent
Avoir de la passion pour son travail, c’est très bien, mais pas besoin de se présenter comme Mère Teresa
D’ailleurs, ça fait penser à cette scène parodique de la série Silicon Valley
L’objectif d’une grande entreprise n’est pas de sauver le monde, mais de faire du profit
Si le matériel devient plus efficace, il finira simplement par absorber encore plus de workloads
Cela dit, j’attends quand même avec intérêt les nouvelles innovations qui pourraient émerger dans ce domaine
En tant que fan des livres de Brendan, je soutiens son arrivée chez OpenAI, mais j’ai du mal à être d’accord avec son analyse
Si OpenAI achète une quantité Y d’énergie pour X dollars, les gains d’efficacité ne feront que produire davantage de tokens
On est moins dans l’économie d’énergie que dans le paradoxe de Jevons
Cela pourrait malgré tout diminuer le coût énergétique de requêtes du type « demander le score d’un match de basket à un chatbot »
Il a évoqué la rémunération, mais l’argent n’est pas la seule raison
Il voulait aussi s’attaquer directement au problème du coût énergétique des data centers IA
Depuis vingt ans, il écrit des ouvrages techniques pour un revenu presque au niveau du salaire minimum, afin d’aider d’autres développeurs,
et il a construit en open source les fondations de nombreuses startups
Il a aussi contribué à l’essor de la culture du travail à distance
Quand l’efficacité augmente, on finit simplement par acheter plus de GPU
Pour limiter ce type d’effets secondaires, il faudrait selon moi de la régulation
C’est décevant, même si je respecte votre choix
Lien connexe
mais OpenAI pourrait aussi en garder une partie non publique pour préserver son avantage concurrentiel
Le ton complaisant du texte est si marqué qu’il était difficile à lire
Le passage où « la coiffeuse Mia est restée silencieuse quand j’ai dit que j’étais Intel Fellow » était gênant
On a l’impression qu’il voulait l’impressionner, et que l’absence de réaction l’a poussé à changer de poste
Quand on se confronte au monde hors de l’industrie tech, ce genre de réaction est parfaitement naturel
À l’inverse, la marque de ciseaux mentionnée par une coiffeuse pourrait nous être totalement inconnue
La manière dont on recrute dans la Silicon Valley flatte l’image de soi des gens,
leur fait croire qu’ils sont en train de changer le monde,
et, en conséquence, rend plus difficile la prise de conscience des effets négatifs
C’est choquant de voir quelqu’un qui était un excellent ingénieur systèmes écrire quelque chose d’aussi déconnecté du réel
On a l’impression que la politique et l’autopromotion passent avant la vérité technique
Faire sa propre promotion ou promouvoir ses idées peut au fond être vu comme une extension de l’ingénierie
En tant que fan, j’ai lu le texte, mais l’idée de « sauver le monde » ressemble à une rationalisation personnelle
Cela sonne comme une métaphore ironique du type : « je vais extraire un maximum de chaleur d’un incendie de pneus pour sauver la planète »
Le passage où il explique qu’un ami voyageait loin et qu’il a ressenti un sentiment de connexion en discutant avec ChatGPT de cette ville m’a attristé
Ce type d’usage ne nécessite pas une puissance électrique à l’échelle du gigawatt
Un petit modèle local suffirait largement
La communication asynchrone entre humains est un problème déjà résolu
C’est moins déprimant que de regarder une émission de voyage