Sortie de GLM 5.2

(twitter.com/jietang)

2 points par GN⁺ 2026-06-14 | 1 commentaires | Partager sur WhatsApp

GLM-5.2 est un modèle open source prenant en charge un contexte de 1M réellement exploitable ainsi que l’exécution autonome de tâches de longue durée, fournissant une base pour construire des applications d’agents complexes
Dans une situation où l’accès à des modèles de pointe est soudainement bloqué pour des raisons non techniques, la science doit être mondiale et la voie vers l’AGI ne doit pas être enfermée derrière de hautes barrières
L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment, mais une base commune permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de résoudre des tâches complexes
GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour et continue de servir de moteur principal pour créer le modèle de code le plus puissant du pays
Il sera d’abord proposé aux utilisateurs Lite / Pro / Max du GLM Coding Plan, et l’API sera publiée la semaine prochaine, rapprochant d’un cran l’accessibilité à l’intelligence de pointe

Message clé

Les restrictions soudaines imposées à certains modèles de pointe sont présentées comme profondément regrettables, et l’idée que la science doit être mondiale se renforce d’autant plus lorsque l’accès est coupé pour des raisons non techniques
La voie vers l’AGI ne doit pas être entourée de hautes barrières, et l’AGI doit être une pierre angulaire permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de relever des défis complexes
L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment ; face aux blocages et restrictions externes, une ouverture radicale est nécessaire
L’intelligence de pointe doit rester open source, accessible et constructible, et doit être mise à disposition de tous les développeurs engagés

Publication de GLM-5.2 et calendrier de disponibilité

GLM-5.2 est le modèle open source le plus puissant publié par Zhipu à ce jour
Ce modèle prend en charge une fenêtre de contexte de 1M réellement exploitable et conserve un avantage constant dans l’achèvement autonome de tâches de longue durée
Il fournit une base solide pour créer des applications d’agents complexes et continue de servir de moteur principal pour construire le modèle de code le plus puissant du pays
GLM-5.2 sera officiellement proposé à 5:21 aux utilisateurs du GLM Coding Plan, y compris les utilisateurs Lite / Pro / Max
L’API sera publiée la semaine prochaine et la clé de modèle est GLM-5.2

1 commentaires

GN⁺ 2026-06-14

Discussions sur Hacker News

Selon l’annonce du fondateur de Z.ai, GLM-5.2 est un modèle « entièrement ouvert », et l’intelligence de pointe devrait être accessible à tous à un moment où l’accès à certains modèles de pointe est soudainement restreint pour des raisons non techniques
GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour, et met en avant une fenêtre de contexte de 1M réellement exploitable ainsi que la capacité à mener de longues tâches de manière autonome
Il est d’abord proposé aux utilisateurs Lite / Pro / Max de GLM Coding Plan, et l’API doit être publiée la semaine prochaine
https://x.com/jietang/status/2065784751345287314
- Ce qui est bien avec GLM, c’est que sur OpenRouter, on peut le filtrer avec les critères fournisseur basé aux États-Unis et aucune conservation des données
  Cela semble différent d’autres modèles chinois à poids ouverts comme Qwen
- Je me demande si « GLM-5.2 is Fully Open » signifie seulement poids ouverts, ou si cela veut dire que le code source et les données sont également publiés
Il ne semble pas encore y avoir de billet de blog officiel avec les résultats de benchmarks, mais je me sens une fois de plus reconnaissant de voir des laboratoires d’IA chinois publier leur travail et contribuer au monde avec une licence permissive
L’affaire Fable 5 montre à nouveau à quel point ce type de modèle ouvert est précieux
- À première vue, cela semble avoir environ 6 mois de retard sur les laboratoires de pointe, avec une sensation proche d’Opus en janvier
  Cela reste très impressionnant et largement utilisable
  C’est nettement plus faible sur l’architecture ou les problèmes complexes, mais peu de gens s’attendaient sans doute à autre chose
  En particulier, il semble étonnamment bon en design et interface utilisateur pour sa catégorie, même si c’est peut-être juste une préférence personnelle
- Sortir un modèle sans benchmarks donne l’impression que le modèle n’est probablement pas très bon
Ces derniers jours, les laboratoires chinois ont sorti MiniMaxM3, KimiK2.7 et GLM5.2, tandis qu’entre-temps les États-Unis censurent des modèles
On dirait presque de la fiction
- Je me demande comment kimi2.7 se compare à GLM5.2
- Les modèles chinois sont eux aussi censurés
  On peut certes dire, dans l’affaire Anthropic actuelle, que les États-Unis censurent les modèles, mais cela ressemble davantage à la corruption générale, aux représailles, à l’extorsion et à l’incompétence de l’administration Trump
Apparemment, ce n’est pas la bibliothèque C++ OpenGL Mathematics que j’espérais
Vu la dernière action du gouvernement américain contre Fable, cette tendance ressemble de plus en plus à l’avenir
On ne peut pas dépendre de produits stratégiques dont l’accès peut être verrouillé par un acteur capricieux
Les modèles à poids ouverts y sont par nature presque immunisés
- C’est vrai seulement dans une certaine mesure
  Le gouvernement américain pourrait rendre illégal le fait de commercer avec des modèles étrangers à poids ouverts, de les télécharger ou de les utiliser
  Ce serait difficile à faire appliquer auprès des particuliers, mais les entreprises s’y conformeraient en gros, et si cela passe par des sanctions, ils pourraient aussi disparaître d’hébergements basés aux États-Unis comme GitHub
  En plus, nous avançons déjà rapidement vers un niveau effrayant de surveillance de masse, ce qui pourrait aider à l’application
  La situation autour de Fable crée un précédent extrêmement dangereux, et j’ai peur pour l’avenir car nous semblons perdre la bataille pour la liberté de l’information et du calcul
- Il est très probable que la Chine passe aussi au fermé au moment où elle égalera ou dépassera les autres
- Critiquer le gouvernement est probablement justifié, mais il ne faut pas laisser passer Anthropic
  C’est Anthropic qui alimente cette absurdité
  Ils dégradent la qualité des résultats sans prévenir et refusent des requêtes au nom de la « sécurité »
  Même si le gouvernement n’avait pas demandé de retirer le modèle aux étrangers, la situation aurait quand même été très mauvaise, simplement parce qu’Anthropic est lamentable
Anthropic a reçu la lettre d’interdiction gouvernementale pour Fable à 17 h 21, heure chinoise, et l’annonce a été publiée exactement au même moment, avec une mention explicite du fait que d’autres modèles devenaient indisponibles
- Vraiment ? Je ne suis pas certain du fuseau horaire
  Cela paraît assez étrange
  Je me demande s’ils n’ont pas simplement modifié le post plus tard
Cette publication semble avoir été avancée en urgence pour surfer sur le feuilleton Mythos
C’est du genre « dommage que vous ne puissiez plus utiliser Fable, mais essayez le nôtre ce week-end », et elle était peut-être initialement prévue pour la semaine prochaine, ce qui expliquerait pourquoi les benchmarks ne sont pas encore prêts
J’attends la sortie de 5.2 flash avec impatience
Cela fait un moment, mais j’ai toujours l’impression que 4.7 flash reste l’un des meilleurs modèles locaux pour le code
- Il me semble avoir vu qu’il n’y aurait pas de flash
- Vraiment ? 4.7-flash a été assez catastrophique pour moi
  Pour les modèles locaux, Qwen-3.5 reste encore le meilleur
  La 3.6 dépasse légèrement les 24 Go de VRAM, et à partir de là on n’est plus vraiment sur du GPU grand public
J’aimerais qu’ils écrivent un billet de blog expliquant les capacités du nouveau modèle, ce qu’on peut en attendre, s’il est moins cher, plus rapide, si la qualité de sortie est meilleure, etc.
Cela dit, merci de l’avoir publié
- Il vaudrait sans doute mieux attendre jusqu’à lundi
Je me demande de combien de ressources de calcul il a réellement besoin, et quelles sont les exigences selon les différentes variantes
J’aimerais aussi savoir s’ils ont réussi à rendre une qualité de niveau frontière réaliste pour des utilisateurs locaux, grâce à des optimisations de Google comme TurboQuant, MTP, ou à leurs propres innovations
- La série GLM-5 est 744B-A40B
  Ce n’est pas un modèle local au sens raisonnable du terme, mais comme c’est un modèle ouvert, plusieurs fournisseurs d’inférence tiers concurrenceront probablement au prix par token une fois que les poids seront publiés d’ici une semaine environ
- Si vous dépensez 80 000 dollars en matériel, vous pouvez le faire tourner
  Il n’existe pas de modèle local qui tourne efficacement sur du matériel grand public, et quiconque dit le contraire ment ou délire

Sortie de GLM 5.2

Message clé

Publication de GLM-5.2 et calendrier de disponibilité

À lire aussi

1 commentaires

Discussions sur Hacker News