1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • GLM-5.2 est un modèle open source prenant en charge un contexte de 1M réellement exploitable ainsi que l’exécution autonome de tâches de longue durée, fournissant une base pour construire des applications d’agents complexes
  • Dans une situation où l’accès à des modèles de pointe est soudainement bloqué pour des raisons non techniques, la science doit être mondiale et la voie vers l’AGI ne doit pas être enfermée derrière de hautes barrières
  • L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment, mais une base commune permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de résoudre des tâches complexes
  • GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour et continue de servir de moteur principal pour créer le modèle de code le plus puissant du pays
  • Il sera d’abord proposé aux utilisateurs Lite / Pro / Max du GLM Coding Plan, et l’API sera publiée la semaine prochaine, rapprochant d’un cran l’accessibilité à l’intelligence de pointe

Message clé

  • Les restrictions soudaines imposées à certains modèles de pointe sont présentées comme profondément regrettables, et l’idée que la science doit être mondiale se renforce d’autant plus lorsque l’accès est coupé pour des raisons non techniques
  • La voie vers l’AGI ne doit pas être entourée de hautes barrières, et l’AGI doit être une pierre angulaire permettant à l’humanité d’explorer ensemble les frontières de l’intelligence et de relever des défis complexes
  • L’AGI ne doit pas être un privilège monopolisé par quelques règles et retirable à tout moment ; face aux blocages et restrictions externes, une ouverture radicale est nécessaire
  • L’intelligence de pointe doit rester open source, accessible et constructible, et doit être mise à disposition de tous les développeurs engagés

Publication de GLM-5.2 et calendrier de disponibilité

  • GLM-5.2 est le modèle open source le plus puissant publié par Zhipu à ce jour
  • Ce modèle prend en charge une fenêtre de contexte de 1M réellement exploitable et conserve un avantage constant dans l’achèvement autonome de tâches de longue durée
  • Il fournit une base solide pour créer des applications d’agents complexes et continue de servir de moteur principal pour construire le modèle de code le plus puissant du pays
  • GLM-5.2 sera officiellement proposé à 5:21 aux utilisateurs du GLM Coding Plan, y compris les utilisateurs Lite / Pro / Max
  • L’API sera publiée la semaine prochaine et la clé de modèle est GLM-5.2

1 commentaires

 
GN⁺ 4 시간 전
Discussions sur Hacker News
  • Selon l’annonce du fondateur de Z.ai, GLM-5.2 est un modèle « entièrement ouvert », et l’intelligence de pointe devrait être accessible à tous à un moment où l’accès à certains modèles de pointe est soudainement restreint pour des raisons non techniques
    GLM-5.2 est le modèle open source le plus puissant de Zhipu à ce jour, et met en avant une fenêtre de contexte de 1M réellement exploitable ainsi que la capacité à mener de longues tâches de manière autonome
    Il est d’abord proposé aux utilisateurs Lite / Pro / Max de GLM Coding Plan, et l’API doit être publiée la semaine prochaine
    https://x.com/jietang/status/2065784751345287314

    • Ce qui est bien avec GLM, c’est que sur OpenRouter, on peut le filtrer avec les critères fournisseur basé aux États-Unis et aucune conservation des données
      Cela semble différent d’autres modèles chinois à poids ouverts comme Qwen
    • Je me demande si « GLM-5.2 is Fully Open » signifie seulement poids ouverts, ou si cela veut dire que le code source et les données sont également publiés
  • Il ne semble pas encore y avoir de billet de blog officiel avec les résultats de benchmarks, mais je me sens une fois de plus reconnaissant de voir des laboratoires d’IA chinois publier leur travail et contribuer au monde avec une licence permissive
    L’affaire Fable 5 montre à nouveau à quel point ce type de modèle ouvert est précieux

    • À première vue, cela semble avoir environ 6 mois de retard sur les laboratoires de pointe, avec une sensation proche d’Opus en janvier
      Cela reste très impressionnant et largement utilisable
      C’est nettement plus faible sur l’architecture ou les problèmes complexes, mais peu de gens s’attendaient sans doute à autre chose
      En particulier, il semble étonnamment bon en design et interface utilisateur pour sa catégorie, même si c’est peut-être juste une préférence personnelle
    • Sortir un modèle sans benchmarks donne l’impression que le modèle n’est probablement pas très bon
  • Ces derniers jours, les laboratoires chinois ont sorti MiniMaxM3, KimiK2.7 et GLM5.2, tandis qu’entre-temps les États-Unis censurent des modèles
    On dirait presque de la fiction

    • Je me demande comment kimi2.7 se compare à GLM5.2
    • Les modèles chinois sont eux aussi censurés
      On peut certes dire, dans l’affaire Anthropic actuelle, que les États-Unis censurent les modèles, mais cela ressemble davantage à la corruption générale, aux représailles, à l’extorsion et à l’incompétence de l’administration Trump
  • Apparemment, ce n’est pas la bibliothèque C++ OpenGL Mathematics que j’espérais

  • Vu la dernière action du gouvernement américain contre Fable, cette tendance ressemble de plus en plus à l’avenir
    On ne peut pas dépendre de produits stratégiques dont l’accès peut être verrouillé par un acteur capricieux
    Les modèles à poids ouverts y sont par nature presque immunisés

    • C’est vrai seulement dans une certaine mesure
      Le gouvernement américain pourrait rendre illégal le fait de commercer avec des modèles étrangers à poids ouverts, de les télécharger ou de les utiliser
      Ce serait difficile à faire appliquer auprès des particuliers, mais les entreprises s’y conformeraient en gros, et si cela passe par des sanctions, ils pourraient aussi disparaître d’hébergements basés aux États-Unis comme GitHub
      En plus, nous avançons déjà rapidement vers un niveau effrayant de surveillance de masse, ce qui pourrait aider à l’application
      La situation autour de Fable crée un précédent extrêmement dangereux, et j’ai peur pour l’avenir car nous semblons perdre la bataille pour la liberté de l’information et du calcul
    • Il est très probable que la Chine passe aussi au fermé au moment où elle égalera ou dépassera les autres
    • Critiquer le gouvernement est probablement justifié, mais il ne faut pas laisser passer Anthropic
      C’est Anthropic qui alimente cette absurdité
      Ils dégradent la qualité des résultats sans prévenir et refusent des requêtes au nom de la « sécurité »
      Même si le gouvernement n’avait pas demandé de retirer le modèle aux étrangers, la situation aurait quand même été très mauvaise, simplement parce qu’Anthropic est lamentable
  • Anthropic a reçu la lettre d’interdiction gouvernementale pour Fable à 17 h 21, heure chinoise, et l’annonce a été publiée exactement au même moment, avec une mention explicite du fait que d’autres modèles devenaient indisponibles

    • Vraiment ? Je ne suis pas certain du fuseau horaire
      Cela paraît assez étrange
      Je me demande s’ils n’ont pas simplement modifié le post plus tard
  • Cette publication semble avoir été avancée en urgence pour surfer sur le feuilleton Mythos
    C’est du genre « dommage que vous ne puissiez plus utiliser Fable, mais essayez le nôtre ce week-end », et elle était peut-être initialement prévue pour la semaine prochaine, ce qui expliquerait pourquoi les benchmarks ne sont pas encore prêts

  • J’attends la sortie de 5.2 flash avec impatience
    Cela fait un moment, mais j’ai toujours l’impression que 4.7 flash reste l’un des meilleurs modèles locaux pour le code

    • Il me semble avoir vu qu’il n’y aurait pas de flash
    • Vraiment ? 4.7-flash a été assez catastrophique pour moi
      Pour les modèles locaux, Qwen-3.5 reste encore le meilleur
      La 3.6 dépasse légèrement les 24 Go de VRAM, et à partir de là on n’est plus vraiment sur du GPU grand public
  • J’aimerais qu’ils écrivent un billet de blog expliquant les capacités du nouveau modèle, ce qu’on peut en attendre, s’il est moins cher, plus rapide, si la qualité de sortie est meilleure, etc.
    Cela dit, merci de l’avoir publié

    • Il vaudrait sans doute mieux attendre jusqu’à lundi
  • Je me demande de combien de ressources de calcul il a réellement besoin, et quelles sont les exigences selon les différentes variantes
    J’aimerais aussi savoir s’ils ont réussi à rendre une qualité de niveau frontière réaliste pour des utilisateurs locaux, grâce à des optimisations de Google comme TurboQuant, MTP, ou à leurs propres innovations

    • La série GLM-5 est 744B-A40B
      Ce n’est pas un modèle local au sens raisonnable du terme, mais comme c’est un modèle ouvert, plusieurs fournisseurs d’inférence tiers concurrenceront probablement au prix par token une fois que les poids seront publiés d’ici une semaine environ
    • Si vous dépensez 80 000 dollars en matériel, vous pouvez le faire tourner
      Il n’existe pas de modèle local qui tourne efficacement sur du matériel grand public, et quiconque dit le contraire ment ou délire