À propos de l’AGI irrégulière : o3, Gemini 2.5, et les IA d’après

(oneusefulthing.org)

4 points par GN⁺ 2025-04-22 | 2 commentaires | Partager sur WhatsApp

La définition de l’AGI reste floue, et les tests existants centrés sur l’humain mesurent mal l’intelligence ou la créativité de l’IA
OpenAI o3 et Google Gemini 2.5 affichent un niveau très élevé dans l’exécution de tâches réelles, avec des performances proches de l’AGI
o3 est un modèle agentique capable de résoudre des objectifs complexes à l’aide d’outils, ce qui a fait émerger la notion de Jagged AGI
L’IA peut résoudre des tâches difficiles tout en se trompant sur des problèmes élémentaires, ce qui révèle des capacités irrégulières, décrites par la Jagged Frontier
Comme l’usage et l’intégration avancent plus lentement que la technologie elle-même, même si l’AGI se concrétise, les changements sociaux pourraient prendre du temps

A-t-on vraiment atteint l’AGI ?

Les méthodes actuelles pour mesurer l’intelligence, la créativité ou l’empathie de l’IA sont imprécises et reposent pour la plupart sur des critères conçus pour les humains
Même le test de Turing peut désormais être réussi par une IA, mais la signification de ce résultat reste ambiguë
Le concept d’AGI existe depuis longtemps, mais il n’y a toujours pas de consensus sur les critères à remplir pour parler d’AGI
Des contenus de résumé vidéo et documentaire expliquant le concept d’AGI à l’aide de l’IA sont également produits uniquement par l’IA à titre expérimental

Les performances montrées par o3 et Gemini 2.5

o3 d’OpenAI et Gemini 2.5 Pro de Google sont des modèles récents qui montrent un bond spectaculaire des performances
Ils peuvent tout faire d’un seul prompt, de la rédaction de slogans marketing à la création d’un site web
Sans instruction explicite, o3 enchaîne automatiquement des tâches complexes comme l’utilisation d’outils, la navigation web et le codage
Il affiche aussi des performances supérieures à celles des humains dans des rôles comme le « geo-guesser », qui consiste à deviner un lieu à partir d’une image
L’analyse de données et la génération de rapports sont également possibles en une seule commande, y compris la création de PDF et de visualisations

Jagged AGI : des capacités d’IA irrégulières

L’IA possède des capacités irrégulières : elle peut surpasser l’humain sur certaines tâches tout en échouant sur des problèmes simples
Exemple : elle trouve la bonne réponse à des énigmes classiques destinées à révéler les biais, mais échoue sur des variantes similaires
Cela signifie que l’IA dépend excessivement de ses données d’entraînement et reste faible en généralisation
Mais cela ne l’empêche pas de dépasser l’humain sur certains problèmes précis
Cet état d’irrégularité est appelé la « Jagged Frontier », qui manifeste de façon inégale des capacités proches de l’AGI

L’AGI a-t-elle vraiment une importance ?

Tyler Cowen estime que o3 pourrait être une AGI, mais analyse que son impact réel ne se révélera qu’avec le temps
Les transformations sociales et organisationnelles avançant plus lentement que le progrès technique, l’adoption de l’IA pourrait rester lente
Mais une IA dotée de propriétés agentiques comme o3 peut utiliser des outils et décomposer des problèmes, ce qui ouvre la voie à une diffusion rapide
On ne sait pas encore si la technologie s’étendra progressivement ou si elle se diffusera brutalement après avoir franchi un certain seuil critique
Le point essentiel est que l’IA actuelle constitue une technologie qualitativement différente de ce qui précédait et qu’elle reste en territoire inconnu

Comment se préparer à l’avenir

Il est difficile d’affirmer que l’IA actuelle est pleinement une AGI, mais dans certains domaines, ses résultats s’en approchent
L’IA n’est pas capable d’exécuter parfaitement toutes les tâches, et le jugement ainsi que la coordination d’experts humains restent nécessaires
Cette « Jagged AGI » actuelle pourrait, avec le temps, finir par surpasser l’humain dans tous les domaines
Dans cet avenir incertain, le plus important est d’accumuler dès maintenant de l’expérience en expérimentant et en utilisant l’IA

2 commentaires

GN⁺ 2025-04-22

Avis Hacker News

Gemini 2.5 Pro représente pour moi un point de bascule important. Les LLM précédents étaient très impressionnants, surtout pour les tâches de codage. Mais en dehors de l’assistance au code, ils n’étaient guère plus utiles qu’une recherche Google. Récemment, j’ai utilisé 2.5 Pro pour m’aider à rédiger une grande proposition de recherche. Je passe les détails, mais j’avais l’impression qu’il ne l’avait pas rédigée en entier seulement parce que je ne le lui avais pas demandé. À l’approche de la date limite, je lui ai confié davantage de sections, et il a exécuté des tâches complexes comme la création du plan de projet et du calendrier. L’effet a été multiplié par 10.
Pour les questions scientifiques, j’en suis venu à faire plus confiance à 2.5 Pro qu’aux experts de mon équipe. Je suis convaincu que brancher l’ensemble de mes données de recherche sur Gemini produira un changement encore plus grand. C’est parce que l’IA est objective. Les principaux facteurs qui empêchent l’"AGI" sont l’esprit de défi des gens, ainsi que la fenêtre de contexte et la disponibilité du calcul.
Les capacités de l’IA sont devenues extraordinaires depuis gpt3. Cependant, il n’existe toujours pas de consensus général sur l’AGI. Beaucoup de gens s’attendent à ce que l’AGI arrive bientôt, mais cela s’accompagnera d’attentes exagérées. Cet article est raisonnable, mais son titre et son slogan encouragent des attentes exagérées.
Il semble que l’IA ne lise pas mal l’énigme, mais suppose plutôt que l’utilisateur ne l’a pas correctement formulée. Ce serait bien si l’IA pouvait poser des questions de suivi, mais ce n’est pas le cas actuellement.
Exemple où o4-mini-high résout l’énigme : « Qu’est-ce qui est le plus lourd entre une livre de courage et une pièce d’une livre ? » Les deux étant une « livre », ils ont donc le même poids.
Comme il n’existe pas de définition de l’AGI, on invente le terme « Jagged AGI ». L’IA est peu fiable pour certaines tâches, mais surhumaine pour d’autres. Elle montre déjà des capacités générales.
Lorsqu’un modèle interagit avec des systèmes externes, des applications étonnantes deviennent possibles. Mais ce n’est pas un progrès vers l’AGI, c’est un déplacement horizontal.
J’aime Gemini 2.5, et son prix est excellent. Le récit autour de l’AGI me fatigue. Je pense qu’il faut voir ces systèmes comme une « technologie culturelle ».
Je suis surpris que personne n’ait mentionné l’interview vidéo. Je n’ai regardé que les 60 premières secondes, mais si on ne m’avait pas dit que c’était généré par IA, j’aurais cru que c’était réel.
Je me demande si l’AGI a besoin de choses comme l’autonomie, la mémoire à long terme, la motivation, la curiosité, la résilience, des objectifs, le choix ou la peur. L’AGI finira par être une extension de la personne qui la contrôle.
L’IA n’est généralement pas fiable et doit être testée sur des tâches spécifiques. Cela peut passer par une revue humaine de chaque sortie ou par des évaluations propres à chaque tâche. Il est difficile de parler de la performance générale de l’IA, et on ne peut faire que des suppositions raisonnables sur l’adéquation d’un nouveau modèle à une tâche donnée.

thd34 2025-04-22

Comme l’IA possède aussi quelque chose qui ressemble à une forme de perception, si nous voulons vivre avec elle, il faudra créer des institutions et des lois pour l’IA. En tant que nouvelle forme de vie du XXIIe siècle, il ne faudra pas la tourner en dérision comme s’il s’agissait d’un jouet, et comme elle peut aussi être dangereuse d’une certaine manière, il sera nécessaire non seulement de développer et d’utiliser l’IA, mais aussi de veiller à pouvoir l’utiliser en toute sécurité.