2 points par GN⁺ 1 일 전 | 1 commentaires | Partager sur WhatsApp
  • ZCode est le harnais officiel de GLM-5.2, conçu pour réunir outils de développement et agents IA afin de traiter planification, codage, revue et déploiement dans un flux unique
  • ZCode 3.0 met en avant une optimisation pour GLM-5.2 et une amélioration de la collaboration multi-agents, en soulignant l’intégration avec GLM sur l’ensemble des tâches de raisonnement et de codage
  • L’exemple de tâche consiste à créer de zéro un jeu de Gomoku IA dans le navigateur, puis à générer index.html, app.js, styles.css avant de valider le tout avec node --check app.js
  • Les formules sont affichées à $16.2/mois pour Lite, $64.8/mois pour Pro et $144/mois pour Max, mais il faut consulter z.ai pour les tarifs et avantages finaux
  • Des installateurs sont proposés pour macOS, Windows et Linux, avec sur Linux des .deb x64 et ARM64 ainsi que des AppImage marqués Beta

Un harnais de développement conçu pour GLM-5.2

  • ZCode est un outil qui combine des agents IA avec les outils de développement existants pour aider à enchaîner plus fluidement planification, codage, revue et déploiement
  • Le positionnement produit est « Simple, Fast, Vibe‑Ready », et il est présenté comme le harnais officiel pour GLM-5.2
  • ZCode 3.0 a été optimisé pour GLM-5.2, et met en avant comme évolution majeure l’amélioration de la collaboration multi-agents

Exemple de flux de travail

  • La liste des tâches d’exemple comprend gomoku-ai, zcode-website, zcode-desktop, release-bot
  • gomoku-ai correspond à la création d’un Gomoku intelligent
    • le joueur affronte un algorithme intelligent
    • l’objectif est de jouer des coups stratégiques et de détecter précisément les conditions de victoire
  • D’après les journaux de tâche, le dépôt existant était vide ou presque vide, donc le flux s’est déroulé comme une création d’application depuis zéro
    • l’exécution de git status --short renvoie une erreur indiquant que le répertoire courant n’est pas un dépôt Git
    • ensuite, les fichiers index.html, app.js, styles.css sont créés

Résultat de l’implémentation de Gomoku

  • L’exemple finalisé est un jeu de Gomoku autonome dans le navigateur
    • il affiche un plateau 15×15
    • le joueur peut placer les pierres noires
    • il détecte la victoire dans quatre directions
    • il met en évidence la ligne gagnante
    • il suit le tour et le nombre de coups
    • il permet de redémarrer la partie
  • L’IA ne joue pas au hasard : elle choisit ses coups selon une approche heuristique
    • elle explore les coups candidats à proximité
    • elle attribue un score aux schémas offensifs favorables
    • elle attribue un score aux coups défensifs qui bloquent les menaces du joueur
    • elle ajoute une préférence pour le centre
    • elle sélectionne le meilleur coup
  • Il est possible d’activer en option un overlay AI focus area pour voir les positions candidates fortes prises en compte par l’IA
  • À l’étape de validation, node --check app.js est passé avec succès
  • L’exécution interactive dans le navigateur n’a pas été effectuée ; l’étape restante consiste à ouvrir index.html dans le navigateur pour jouer

Travaux de longue durée et contrôle externe

  • ZCode propose la fonctionnalité Goals pour les tâches de longue durée
    • elle gère la planification, l’exécution et la validation continues sur des tâches complexes
  • Avec la fonctionnalité Bot control, il est possible de lancer et piloter ZCode depuis WeChat, Feishu et Telegram
  • L’intégration avec GLM-5.2 est optimisée pour le raisonnement, le codage et la collaboration multi-agents dans leur ensemble

Tarifs et téléchargement

  • GLM Coding Plan présente trois formules
    • Lite : pour les tâches légères, $16.2/mois, avec un volume d’utilisation de base inclus
    • Pro : pour les usages professionnels, $64.8/mois, avec un volume 5 fois supérieur à Lite
    • Max : pour les usages intensifs, $144/mois, avec un volume 20 fois supérieur à Lite
  • Les tarifs et avantages des formules peuvent évoluer ; il faut vérifier les détails finaux sur z.ai
  • All Downloads fournit les installateurs selon la plateforme
    • macOS : Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
    • Windows : 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
    • Linux : x64 .deb, x64 AppImage, ARM64 .deb, ARM64 AppImage v3.2.2, tous marqués Beta

1 commentaires

 
GN⁺ 1 일 전
Avis sur Hacker News
  • J’ai été un peu surpris que ce ne soit apparemment pas open source. La comparaison se fait avec Mimo Code https://github.com/XiaomiMiMo/MiMo-Code. La différence, c’est que Mimo est un CLI et que celui-ci est une application desktop

    • Je ne vois même pas très bien ce que je ferais avec une appli desktop. Ce genre de choses, je les fais tourner dans une VM headless, avec au besoin des options comme --dangerously-skip-permissions. Même sans ce flag, je ne lui ferais pas confiance sur mon desktop/ordinateur portable
    • S’il s’agit d’un CLI, c’est parce qu’ils ont retiré le code desktop d’opencode. Les fournisseurs de modèles Go/Zen d’opencode ont aussi été retirés
      À mon avis, ils ont fait beaucoup de substitutions de chaînes pour donner rapidement l’impression d’être un fournisseur de premier rang. Cela dit, ils auraient quand même pu rajouter opencode comme fournisseur générique
    • Je ne trouve pas ça vraiment surprenant. Le harness devient aussi important que le modèle de base. On a déjà vu des cas où les résultats de benchmark étaient presque doublés rien qu’avec le harness
      Je pense que le harness est en train de devenir rapidement un composant central du « modèle » lui-même. Qu’une entreprise qui voit une opportunité de revenus garde son harness fermé n’a rien d’étonnant
    • Ils envoient peut-être certaines requêtes utilisateur vers Anthropic afin de collecter des données de transaction pour leur propre modèle. Dans ce cas, ils peuvent avoir besoin d’ajouter des traceurs de requêtes qu’ils préféreraient cacher
    • Anthropic exprime de fortes inquiétudes sur la distillation de Claude et, si l’on ajoute l’idée que le harness constitue un fossé défensif, il n’est pas très surprenant que l’autre camp veuille éviter de révéler à quel point il s’en sort bien et quelle approche il utilise
  • Z.ai documente des intégrations avec presque tous les agents basés sur CLI populaires : https://docs.z.ai/devpack/tool/others
    Si vous êtes déjà habitué aux agents de codage en UI terminal, vous n’avez pas vraiment besoin d’un agent desktop. Mais pour ceux qui préfèrent l’approche UI de Codex App/Claude App, c’est bien que ça existe

    • L’incitation ici, ce sont probablement davantage de tokens. Si mes souvenirs sont bons, les limites étaient plus généreuses avec leur propre harness
    • J’utilise GLM 5.2 dans OpenCode, et je le fais tourner dans un conteneur Docker avec CodeNomad comme GUI web. C’est accessible de partout, et tous les modèles fonctionnent bien, sauf le modèle d’abonnement d’Anthropic
    • Le fait que l’équipe Z.ai ait inclus la prise en charge de Linux dès le premier jour mérite d’être salué
  • Ça a l’air plutôt joli. Je ne sais pas si j’aurais envie de l’utiliser à la place d’OpenCode. OpenCode a aussi une application desktop, et personnellement je préfère son UI terminal. Franchement, je la trouve même meilleure que l’UI terminal de Claude Code. La version desktop est plus basique, mais tout à fait correcte : https://opencode.ai/download
    Cela dit, il est intéressant de voir qu’ils sortent d’un coup beaucoup de choses liées depuis https://chat.z.ai/ : ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw, etc. C’est une quantité assez considérable pour une seule organisation
    J’ai aussi essayé le plan Pro pour le codage ; vu le nombre de tokens nécessaires pour terminer certaines tâches, le quota ne semble pas immensément plus élevé que celui d’Opus. GLM 5.2 lui-même reste toutefois assez bon, comme un Sonnet plus puissant

    • Leur UI terminal est assez lourde et plante souvent par rapport à Claude Code
  • C’est impressionnant de voir des entreprises s’en tirer avec des formulations comme « usage de base inclus » [1] ou « limites standard » [2], puis construire les plans supérieurs comme des multiples de cette « base » sans jamais révéler quelle est cette valeur de base
    On dirait que la valeur de base est fixée en fonction de la marge bénéficiaire du mois
    [1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
    [2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...

    • Quand on lance l’application, elle indique le véritable usage de base. En revanche, les noms des plans ne sont pas les mêmes que sur la page web
      Start plan : 5 millions de tokens par jour (3 millions GLM-5.2, 2 millions GLM-5 Turbo)
      For individuals : quota +150 %, 18,00 USD et plus, quota dédié au Coding Plan pour développeurs individuels
    • C’est vraiment nul. Nous essayons d’être aussi transparents que possible, donc nous l’avons publié ici : https://synthetic.new/rate-limits
    • C’est pour ça que l’ACCC australienne est appréciable. Si c’était une entreprise australienne, elle n’aurait pas laissé passer ce genre de pratique
    • C’est une stratégie qui peut se retourner contre eux. Un outil imprévisible est pire qu’un mauvais outil
  • En tant qu’utilisateur quotidien de GPT-5.5/Codex, je suis curieux de savoir comment GLM-5.2/ZCode se compare sur une base de code déjà configurée pour le codage agentique

    • GLM 5.2 se trouve dans une vallée un peu inconfortable. Il est trop gros pour tourner à la maison, et cher et lent par rapport à des modèles aux performances similaires. Il y a un bon graphique ici : https://deepswe.datacurve.ai/
      Cela ne compare que les prix API. Si l’on tient compte des offres d’abonnement d’Anthropic et d’OpenAI, il n’y a pas de comparaison possible. Un abonnement Codex à 200 $ permet facilement de consommer 1 milliard de tokens par semaine avec GPT 5.5 high/xhigh
      C’est intéressant du point de vue du meilleur modèle à poids ouverts, mais il ne semble pas avoir de place évidente sur le marché actuel
    • En résumé, GLM mettra beaucoup plus de temps à accomplir les tâches, et selon la complexité il pourra aussi consommer davantage de tokens
      Malgré tout, il est beaucoup moins cher, donc utilisable pour moi. J’ai plus d’expérience avec Claude, mais je dirais qu’il est à peu près au niveau d’Opus 4.1
  • Du point de vue de l’UI, cela ressemble beaucoup plus à Codex qu’à Claude Code. En fait, c’est une copie exacte de Codex

    • Tout à fait d’accord. L’icône en forme de main, l’usage du champ texte, le style de la barre latérale aussi sont identiques à Codex, en 1:1. Le titre prête à confusion. Ce n’est pas proche de Claude Code
    • C’est pour ça que garder Codex fermé paraît encore plus ridicule. Le logiciel n’est plus le moat de personne. On peut simplement le laisser tel quel
  • Je me demande s’il y a des gens qui utilisent une UI terminal neutre vis-à-vis des fournisseurs, ou un harnais, permettant de changer de fournisseur de manière presque transparente pour les tâches de développement
    Je veux un contexte local du genre « voici 3 fournisseurs d’IA, utilisez celui-ci pour les tâches de code, celui-là pour la rédaction en prose, et celui-ci pour la génération d’images »

    • https://opencode.ai/
      OpenCode a été le premier harnais d’agent que j’ai utilisé et il continue de me plaire. On peut configurer différents fournisseurs, il est open source et compte plusieurs contributeurs clés
      Une autre option est Pi (le harnais d’agent Pi). C’est un excellent choix léger et il prend en charge plusieurs fournisseurs. On peut aussi utiliser un serveur de modèles local
    • Ces 6 derniers mois, j’ai utilisé à la fois Pi et OpenCode, et sur la même période je n’ai pas ouvert les harnais propriétaires Claude Code, Codex ou Cursor. J’utilise maintenant Pi, et je peux changer en plein milieu d’une session vers n’importe quel modèle de n’importe quel fournisseur, de façon transparente. Je peux aussi le faire pointer vers un modèle exécuté en local
      J’ai l’impression que les gens ne réalisent pas à quel point c’est plus pratique. À mon avis, Claude Code et Codex reposent entièrement sur le verrouillage fournisseur
    • C’est possible avec role-model, le routeur de modèles que j’ai créé. Il route en fonction des rôles, des tâches, etc. Il existe une extension pour Pi, afin qu’un agent de codage puisse préciser des métadonnées de requête comme le rôle ou les capacités
      https://github.com/try-works/role-model
    • Si vous ne l’avez pas encore essayé, https://pi.dev vaut le détour
      J’utilise exclusivement Pi depuis plusieurs mois et je l’étends aussi : https://a.l3x.in/ai. J’utilise principalement GLM-4.7, puis 5.1, et maintenant 5.2, et je n’ai presque rien à redire
      Je peaufine encore mon workflow basé sur une approche « Github/Forgejo d’abord », mais j’en suis déjà assez satisfait. La plupart des sessions s’exécutent comme des tâches CI/CD, déclenchées par un commentaire "/pi", et créent des PR ou poussent des commits dans des PR : https://github.com/shaftoe/pi-coding-agent-action
    • J’ai écrit une compétence pour Codex et Claude Code. L’idée est de désigner un orchestrateur dans l’arbre de travail principal, et de rendre indifférent le type de travailleurs IA présents dans N arbres de travail auxiliaires
      Comme l’orchestrateur sait quel client IA tourne dans chaque arbre de travail, il est assez facile de préciser quelle tâche envoyer à quelle IA
      J’exécute Claude ou Codex dans chaque onglet d’arbre de travail. Il y a aussi quelques consignes propres à chaque UI terminal IA ; par exemple, Codex a une surveillance rudimentaire par rapport à Claude Code, donc j’ai ajouté des instructions supplémentaires aux travailleurs Codex sur la façon de bien surveiller les nouveaux « mails »
      En travaillant avec l’orchestrateur dans l’arbre de travail principal, je lui fais déléguer des tâches aux travailleurs et répondre à de petites questions. Il remonte les résultats et aide aussi à nettoyer le contexte si nécessaire
      L’orchestrateur et les travailleurs communiquent via un simple système de fichiers partagé sous tmp/*, et peuvent traiter ensemble des charges de travail importantes et variées
      Comme j’utilise iTerm2, j’ai aussi ajouté du Python spécifique à iTerm2 pour que l’orchestrateur puisse « réveiller » un travailleur en modifiant et soumettant l’entrée, ou lui faire exécuter des actions bloquées par l’UI terminal (/clear, etc.)
  • J’aime les modèles à poids ouverts chinois qui proposent des tokens bon marché, mais je ne les utilise que pour des projets personnels
    La Chine a des antécédents en matière de vol de propriété intellectuelle et de secrets commerciaux, et les tribunaux chinois ont favorisé leurs entreprises nationales. À l’inverse, les États-Unis disposent de tribunaux solides capables de faire respecter les droits de propriété intellectuelle. Si vous voulez exposer la propriété intellectuelle, les secrets commerciaux et les données de votre entreprise pour quelques tokens bon marché, utilisez les services de Z.ai

    • Pour info, les modèles Z.AI peuvent aussi être utilisés sur une infrastructure non chinoise
    • Les États-Unis aussi
  • La séparation des modèles et des outils est aussi importante que la séparation du législatif et du judiciaire. Il faut simplement ignorer les outils ou harnais qui ne sont pas vraiment open source. Ils s’immiscent peu à peu dans la vie quotidienne et finissent par vous étrangler avec du verrouillage fournisseur

  • Je considère qu’il est difficile de faire confiance aux systèmes d’agents chinois à source fermée
    En pratique, c’est une boîte noire disposant de tous les droits utilisateur : cela revient à remettre tout son système à des serveurs appartenant à des intérêts chinois. Avec OpenCode et un fournisseur GLM, on peut au moins surveiller quels fichiers ont été lus, quels fichiers ont été modifiés et quelles commandes ont été exécutées
    En outre, la loi chinoise sur la sécurité nationale oblige légalement les entreprises à coopérer avec les services de renseignement de l’État et les activités de contre-espionnage [0]. Si vous installez ça sur des postes de travail d’entreprise et que la société est d’une taille suffisante, la possibilité d’être surveillé n’est pas un simple risque, c’est presque une certitude
    [0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...

    • D’accord. Les concurrents américains sont tout aussi difficiles à croire. Ici, je pense que la réponse, c’est l’open source
    • Au moins, les poids du modèle sont publics. Comme je ne suis pas américain, de tous les points de vue possibles, cela me paraît bien plus digne de confiance
      On parle des agences de renseignement américaines comme si elles étaient du bon côté, mais en tout cas, pour moi, ce n’est pas du tout le cas
    • Les fournisseurs américains, c’est exactement pareil
    • Il suffit de le lancer dans un conteneur sous Opencode. Ça fonctionne très bien, et je suis même passé au plan Pro (environ 60 $/mois). Si vous voulez l’utiliser dans un conteneur, il y a des infos dans le projet sur mon profil. Tout ce code est open source, et je l’ai écrit parce que j’en avais besoin pour mon travail. Il existe sûrement d’innombrables autres façons de faire
      En revanche, quelle que soit le pays de l’entreprise, je déconseille fortement d’exécuter le moindre agent sur du bare metal. Dans mon article, j’aborde ce point directement et à plusieurs reprises
      Récemment, quelqu’un m’a demandé pourquoi j’exécutais un logiciel avec seulement quelques étoiles, mais face à ce genre de raisonnement, je n’ai pas grand-chose à dire. J’ai conçu et construit des systèmes qui ont servi des dizaines de milliers d’utilisateurs. Je ne plaisante pas. Ma façon de faire n’est pas conventionnelle et je ne recommande pas aux autres de m’imiter, mais elle fonctionne bien pour moi et correspond à ma manière de penser les systèmes complexes
      Vous êtes libre de l’utiliser ou non, mais si vous venez chercher la petite bête sans argument solide, il faut aussi vous attendre à une réponse. J’ai fait beaucoup d’erreurs au cours de ma carrière, et je pense qu’assumer ses responsabilités est important pour progresser. Si quelqu’un apporte une critique valable et concrète, je serai ravi de travailler avec lui pour utiliser mon code
    • C’est pour ça que j’aime utiliser Reasonix avec Deepseek. En cas de hit dans le cache, les requêtes deviennent pratiquement gratuites, et ce chemin passe aussi par des fournisseurs américains non subventionnés comme Digital Ocean ou Cloudflare