Sortie de GLM 5.2
(twitter.com/jietang)- GLM-5.2 est un modèle open source prenant en charge un contexte de 1M réellement exploitable ainsi que l’exécution autonome de tâches de longue durée, fournissant une base pour construire des applications d’agents complexes
- Dans une situation où l’accès à des modèles de pointe est soudainement bloqué pour des raisons non techniques, la science doit être mondiale et la voie vers l’AGI ne doit pas être enfermée derrière de hautes barrières
- L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment, mais une base commune permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de résoudre des tâches complexes
- GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour et continue de servir de moteur principal pour créer le modèle de code le plus puissant du pays
- Il sera d’abord proposé aux utilisateurs Lite / Pro / Max du GLM Coding Plan, et l’API sera publiée la semaine prochaine, rapprochant d’un cran l’accessibilité à l’intelligence de pointe
Message clé
- Les restrictions soudaines imposées à certains modèles de pointe sont présentées comme profondément regrettables, et l’idée que la science doit être mondiale se renforce d’autant plus lorsque l’accès est coupé pour des raisons non techniques
- La voie vers l’AGI ne doit pas être entourée de hautes barrières, et l’AGI doit être une pierre angulaire permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de relever des défis complexes
- L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment ; face aux blocages et restrictions externes, une ouverture radicale est nécessaire
- L’intelligence de pointe doit rester open source, accessible et constructible, et doit être mise à disposition de tous les développeurs engagés
Publication de GLM-5.2 et calendrier de disponibilité
- GLM-5.2 est le modèle open source le plus puissant publié par Zhipu à ce jour
- Ce modèle prend en charge une fenêtre de contexte de 1M réellement exploitable et conserve un avantage constant dans l’achèvement autonome de tâches de longue durée
- Il fournit une base solide pour créer des applications d’agents complexes et continue de servir de moteur principal pour construire le modèle de code le plus puissant du pays
- GLM-5.2 sera officiellement proposé à 5:21 aux utilisateurs du GLM Coding Plan, y compris les utilisateurs Lite / Pro / Max
- L’API sera publiée la semaine prochaine et la clé de modèle est
GLM-5.2
1 commentaires
Discussions sur Hacker News
Selon l’annonce du fondateur de Z.ai, GLM-5.2 est un modèle « entièrement ouvert », et l’intelligence de pointe devrait être accessible à tous à un moment où l’accès à certains modèles de pointe est soudainement restreint pour des raisons non techniques
GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour, et met en avant une fenêtre de contexte de 1M réellement exploitable ainsi que la capacité à mener de longues tâches de manière autonome
Il est d’abord proposé aux utilisateurs Lite / Pro / Max de GLM Coding Plan, et l’API doit être publiée la semaine prochaine
https://x.com/jietang/status/2065784751345287314
Cela semble différent d’autres modèles chinois à poids ouverts comme Qwen
Il ne semble pas encore y avoir de billet de blog officiel avec les résultats de benchmarks, mais je me sens une fois de plus reconnaissant de voir des laboratoires d’IA chinois publier leur travail et contribuer au monde avec une licence permissive
L’affaire Fable 5 montre à nouveau à quel point ce type de modèle ouvert est précieux
Cela reste très impressionnant et largement utilisable
C’est nettement plus faible sur l’architecture ou les problèmes complexes, mais peu de gens s’attendaient sans doute à autre chose
En particulier, il semble étonnamment bon en design et interface utilisateur pour sa catégorie, même si c’est peut-être juste une préférence personnelle
Ces derniers jours, les laboratoires chinois ont sorti MiniMaxM3, KimiK2.7 et GLM5.2, tandis qu’entre-temps les États-Unis censurent des modèles
On dirait presque de la fiction
On peut certes dire, dans l’affaire Anthropic actuelle, que les États-Unis censurent les modèles, mais cela ressemble davantage à la corruption générale, aux représailles, à l’extorsion et à l’incompétence de l’administration Trump
Apparemment, ce n’est pas la bibliothèque C++ OpenGL Mathematics que j’espérais
Vu la dernière action du gouvernement américain contre Fable, cette tendance ressemble de plus en plus à l’avenir
On ne peut pas dépendre de produits stratégiques dont l’accès peut être verrouillé par un acteur capricieux
Les modèles à poids ouverts y sont par nature presque immunisés
Le gouvernement américain pourrait rendre illégal le fait de commercer avec des modèles étrangers à poids ouverts, de les télécharger ou de les utiliser
Ce serait difficile à faire appliquer auprès des particuliers, mais les entreprises s’y conformeraient en gros, et si cela passe par des sanctions, ils pourraient aussi disparaître d’hébergements basés aux États-Unis comme GitHub
En plus, nous avançons déjà rapidement vers un niveau effrayant de surveillance de masse, ce qui pourrait aider à l’application
La situation autour de Fable crée un précédent extrêmement dangereux, et j’ai peur pour l’avenir car nous semblons perdre la bataille pour la liberté de l’information et du calcul
C’est Anthropic qui alimente cette absurdité
Ils dégradent la qualité des résultats sans prévenir et refusent des requêtes au nom de la « sécurité »
Même si le gouvernement n’avait pas demandé de retirer le modèle aux étrangers, la situation aurait quand même été très mauvaise, simplement parce qu’Anthropic est lamentable
Anthropic a reçu la lettre d’interdiction gouvernementale pour Fable à 17 h 21, heure chinoise, et l’annonce a été publiée exactement au même moment, avec une mention explicite du fait que d’autres modèles devenaient indisponibles
Cela paraît assez étrange
Je me demande s’ils n’ont pas simplement modifié le post plus tard
Cette publication semble avoir été avancée en urgence pour surfer sur le feuilleton Mythos
C’est du genre « dommage que vous ne puissiez plus utiliser Fable, mais essayez le nôtre ce week-end », et elle était peut-être initialement prévue pour la semaine prochaine, ce qui expliquerait pourquoi les benchmarks ne sont pas encore prêts
J’attends la sortie de 5.2 flash avec impatience
Cela fait un moment, mais j’ai toujours l’impression que 4.7 flash reste l’un des meilleurs modèles locaux pour le code
Pour les modèles locaux, Qwen-3.5 reste encore le meilleur
La 3.6 dépasse légèrement les 24 Go de VRAM, et à partir de là on n’est plus vraiment sur du GPU grand public
J’aimerais qu’ils écrivent un billet de blog expliquant les capacités du nouveau modèle, ce qu’on peut en attendre, s’il est moins cher, plus rapide, si la qualité de sortie est meilleure, etc.
Cela dit, merci de l’avoir publié
Je me demande de combien de ressources de calcul il a réellement besoin, et quelles sont les exigences selon les différentes variantes
J’aimerais aussi savoir s’ils ont réussi à rendre une qualité de niveau frontière réaliste pour des utilisateurs locaux, grâce à des optimisations de Google comme TurboQuant, MTP, ou à leurs propres innovations
Ce n’est pas un modèle local au sens raisonnable du terme, mais comme c’est un modèle ouvert, plusieurs fournisseurs d’inférence tiers concurrenceront probablement au prix par token une fois que les poids seront publiés d’ici une semaine environ
Il n’existe pas de modèle local qui tourne efficacement sur du matériel grand public, et quiconque dit le contraire ment ou délire