Huit employés de Google ont inventé l’IA moderne : récit interne
- L’article scientifique intitulé "Attention Is All You Need", rédigé au printemps 2017, comptait 8 auteurs.
- Tous étaient des chercheurs de Google, et Noam Shazeer, le contributeur le plus expérimenté, a été surpris de voir son nom figurer en premier.
- Les auteurs ont décidé de "détruire" la pratique consistant à classer les contributions, en ajoutant un astérisque à côté de chaque nom et une note de bas de page indiquant que "l’ordre d’apparition est aléatoire".
Le début d’une transformation
- Cet article a fait progresser la technologie des réseaux de neurones dans le domaine de l’IA, au point de la transformer en systèmes numériques puissants qui donnent l’impression d’être le produit d’une intelligence extraterrestre.
- Cette architecture sert d’ingrédient secret à des produits d’intelligence artificielle comme ChatGPT, Dall-E et Midjourney.
- Sept ans après sa publication, cet article a acquis un statut légendaire.
L’architecture de la transformation : le transformer
- L’histoire du transformer commence avec le quatrième auteur, Jakob Uszkoreit.
- Uszkoreit a imaginé une nouvelle approche fondée sur son idée de self-attention.
- Ce réseau peut traduire des mots en se référant à certaines parties d’une phrase, ce qui aide le système à produire de bonnes traductions.
Collaboration et innovation
- Uszkoreit pensait que le modèle de self-attention pouvait être plus rapide et plus efficace que les réseaux de neurones récurrents.
- Cette idée a progressé grâce à la collaboration avec d’autres chercheurs, notamment Illia Polosukhin et Ashish Vaswani.
- Ils ont rédigé un document de conception intitulé "Transformers: Iterative Self-Attention and Processing for Various Tasks".
Publication de l’article et impact
- L’équipe de recherche a utilisé le modèle transformer pour effectuer de la traduction automatique, puis a mesuré ses performances à l’aide du benchmark BLEU.
- Leur nouveau modèle a surpassé les concurrents, et une version plus grande, Big, a obtenu un score BLEU battant le record précédent.
- L’article a été soumis juste avant la date limite, et Google a rapidement déposé un brevet provisoire sur ce travail.
La réaction de Google et les évolutions
- En interne chez Google, ce travail a été considéré comme un projet d’IA intéressant parmi d’autres, et l’entreprise a commencé à intégrer les transformeurs à ses produits à partir de 2018.
- Mais cette évolution paraît timide comparée à l’accélération radicale d’OpenAI et à l’intégration audacieuse par Microsoft de systèmes fondés sur les transformeurs dans sa gamme de produits.
Les auteurs qui ont quitté Google
- Tous les auteurs ont quitté Google et travaillent aujourd’hui de différentes manières à partir des systèmes qu’ils ont créés.
- Beaucoup d’entre eux ont quitté Google pour rejoindre de nouvelles startups de l’IA.
L’avis de GN⁺
- Cet article offre un éclairage intéressant sur l’évolution des technologies de l’IA en expliquant en détail la naissance et le développement du modèle transformer, qui a joué un rôle majeur dans le domaine.
- Le modèle transformer est aujourd’hui une technologie centrale du traitement du langage par l’IA et une invention essentielle à la base d’IA conversationnelles comme ChatGPT.
- L’article montre comment l’environnement de recherche innovant au sein de Google a permis une percée technologique majeure.
- Mais le fait que Google ait adopté une approche plutôt prudente dans l’exploitation commerciale de cette technologie offre aussi un enseignement important sur le rythme d’innovation et la stratégie des entreprises.
- Les entreprises ou développeurs qui adoptent cette technologie doivent tenir compte de la complexité du modèle transformer et de ses besoins en ressources, mais les bénéfices potentiels sont très importants.
1 commentaires
Avis sur Hacker News
Discussion sur les modèles d’attention :
Souvenirs de l’âge d’or de Google :
Conversation sur l’histoire de l’IA :
Comparaison entre Google et OpenAI :
Mention de la collaboration entre employés de Google :
Critique de la stratégie IA de Google :
Document interne sur l’histoire de l’IA chez Google :
Attention portée à la diversité des auteurs :
Soutien aux départements R&D :