1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Agent de codage terminal open source conçu exclusivement pour l’API DeepSeek, communiquant directement avec api.deepseek.com
  • La boucle append-only est optimisée pour le byte-stable prefix cache de DeepSeek, ce qui permet de maintenir plus de 90 % de taux de cache hit sur les longues sessions et de réduire le coût des tokens d’entrée à environ 1/5 (soit environ 1/3 du coût d’outils comparables)
  • Exécutable en une seule ligne avec npx reasonix code, sans installation globale requise (Node ≥ 22, prise en charge de macOS/Linux/Windows)
  • 3 conceptions clés
    • Cache-First Loop : structure append-only, sans dépendance aux marqueurs, avec ordre d’appel déterministe pour préserver le prefix cache
    • R1 Thought Harvest : collecte de la chaîne de raisonnement des tool calls manqués
    • Tool-Call Repair : récupération via une approche d’auto-réparation aware du schéma
  • Principe terminal-first : pas de plugin IDE pris en charge, utilisation directe des outils terminal comme git diff ou ls
    • Basé sur TypeScript + Ink TUI, avec aussi un client desktop Tauri séparé (runtime Node embarqué)
  • Exploitation en modèle V4 à deux niveaux : V4-Flash par défaut pour les itérations à bas coût, promotion vers V4-Pro sur un seul tour avec /pro, ou exécution de toute la session en Pro avec /preset max
  • Support de premier ordre pour MCP (Model Context Protocol) : connexion à des serveurs externes en une ligne avec --mcp "name=cmd args", avec prise en charge des transports stdio, SSE et Streamable HTTP
  • Sandbox + gate /plan : tous les outils intégrés sont sandboxés dans le répertoire d’exécution, et le mode /plan agit comme une gate d’audit en lecture seule qui bloque l’écriture avant approbation
    • Les éditions SEARCH/REPLACE restent en attente dans une file pending et ne sont pas appliquées au disque avant /apply
  • Composable Skills : placement de fichiers Markdown dans .reasonix/skills/<name>.md, avec isolation d’exécution via le frontmatter runAs: subagent et allowed-tools
  • Replay & Events : tous les événements sont enregistrés sur disque, permettant de rejouer les sessions passées et d’obtenir statistiques et audit via les commandes reasonix replay / events / stats
  • Extensibilité basée sur du texte brut : tous les réglages sont gérés sous forme de texte brut versionnable par git via les répertoires /mcp, /skills, /memory, /config et /slash
  • Prise en charge d’endpoints DeepSeek auto-hébergés : à partir de 0.30, les préfixes de clés non standard sont autorisés ; il suffit de définir baseUrl vers une adresse interne pour conserver le même fonctionnement des boucles, du cache et du protocole d’outils
  • Tarification de l’API DeepSeek : V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
  • Licence MIT

1 commentaires

 
GN⁺ 4 시간 전
Commentaires Hacker News
  • Je ne suis pas sûr qu’il faille absolument un agent de code dédié à DeepSeek pour tirer parti du cache DeepSeek
    Comme le problème de quota de Codex n’était toujours pas résolu hier, j’ai bricolé un tout petit pont pour utiliser DeepSeek V4 Pro dans Codex, et presque tout ce que j’ai fait semblait mis en cache : https://i.imgur.com/7eKn6wN.png
    Au 2026-05-23, j’avais 39,123,200 tokens en cache hit sur l’entrée, contre 1,692,286 en cache miss, et le pont ne fait rien de spécial : il se contente d’adapter le format de l’API DeepSeek à ce qu’attend Codex, sans aucun traitement particulier lié au cache
    En dehors du fait que le caching serait meilleur, je ne vois pas très bien quel avantage il y aurait par rapport à lancer directement OpenCode avec l’API DeepSeek. Ça profiterait manifestement aussi d’un caching similaire, communiquerait directement avec api.deepseek.com si c’est important, et offrirait un environnement d’exécution bien plus mature

    • Il vaudrait mieux plutôt lier cette page : https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
      Elle explique pourquoi ils considèrent que c’est une meilleure solution, et pourquoi ils ont une philosophie de conception aussi marquée
      « Le caching automatique de préfixe ne s’active que si le préfixe en octets de la requête précédente correspond exactement. La plupart des boucles d’agent réordonnent, réécrivent ou injectent de nouveaux horodatages à chaque tour — en pratique, les taux de cache hit sont inférieurs à 20 % »
      L’idée est donc d’optimiser ce point et d’autres techniques pour améliorer le taux de cache hit et réduire les coûts
    • OpenCode a de sérieux problèmes de stabilité du cache, et pour l’instant ils ne semblent pas très motivés à les corriger
    • C’est exactement ce que je me suis dit, et en regardant le code du fournisseur DeepSeek de l’agent de code que j’utilise, presque tout ce qu’a écrit l’auteur y était déjà implémenté
      Pour les curieux : http://github.com/tontinton/maki
    • Quand tu dis « j’ai fait un petit pont pour utiliser DeepSeek V4 Pro dans Codex », je serais curieux de voir si tu peux partager ce pont
      DeepSeek v4 est excellent avec claude-code ou opencode. Dans mon cas, claude code m’a coûté moins cher qu’opencode, probablement grâce à un environnement d’exécution mieux conçu
    • Ça semble se brancher nativement au terminal. Donc il n’y aurait pas d’application séparée qui exécute ou encapsule l’agent dans un TUI
      Au final, j’imagine qu’on saisit des phrases en anglais courant au lieu de commandes
  • Ce site web a l’air d’avoir été fait par Codex. J’avais demandé à Codex de me faire un HTML de présentation des fonctionnalités pour l’équipe, et il m’a sorti un monstre trop décoré, avec de gros encadrés de statistiques sans grand intérêt, et c’était quasiment le même style : police, couleurs, mise en page, section héro, tout pareil
    C’était tout aussi affreux sur mobile que ce site. J’ai fini par demander à Claude de faire un fichier HTML d’une seule page, et c’était utilisable à 95 % tel quel pour expliquer clairement l’intention, avec juste quelques petites retouches

    • On voit beaucoup de design piloté par LLM qui ressemble à ça en ce moment. Je ne comprends pas pourquoi les gens ne trouvent pas la combinaison de polices serif fortement inclinées franchement laide
      Sur mobile, les exemples de code repoussent sans arrêt le contenu, au point qu’il devient difficile de lire l’essentiel de la page. Bon, c’est peut-être un peu sévère et l’intention était sans doute bonne, mais un site plus simple aurait largement suffi
    • Dire seulement que « Claude a généré un fichier HTML d’une page, utilisable à 95 % tel quel » ne dit pas grand-chose sur un modèle donné
      Après tout, comme n’importe quel ingénieur logiciel le sait, retirer des fonctionnalités peut simplifier radicalement n’importe quel projet
  • J’aimerais que l’auteur comprenne que certaines personnes veulent un binaire unique autonome qui ne consomme pas la moitié de la mémoire de leur machine, et c’est pourquoi elles veulent l’écrire en Rust ou en Go

    • Je suis vraiment content de voir autant de nouveaux logiciels en Rust, Go et Zig
      La valeur et le confort de développement qu’apportaient les langages interprétés lents sont en train de s’éroder. Les langages plus récents intègrent de bonnes choses par défaut, ou plus exactement, les alertes d’astreinte à 1 h du matin commencent à nous rendre franchement irritables
    • Même avec toute la couche IA et toutes les promesses autour, je serais curieux qu’on m’explique pourquoi on ne pourrait pas faire un agent de code en Go pur par exemple
      Go a déjà plein d’excellentes bibliothèques pour le terminal
    • Si tu veux essayer un binaire unique autonome qui consomme plus de la moitié de la mémoire de ta machine, il y a aussi ds4-agent
    • Surtout à l’ère des agents de code, si c’est ce que tu veux, pourquoi ne pas simplement le faire toi-même ?
    • Économiser l’effort de coder alors qu’on construit un bot de code, ça dit quand même quelque chose
  • Je n’aime pas cette page. À cause de l’animation de frappe, la taille de la zone d’exemple change en permanence, et le contenu en dessous est constamment poussé vers le haut puis vers le bas
    C’est une très mauvaise expérience utilisateur

    • Avec ou sans agent, les gens devraient toujours tester les sites web sur plusieurs résolutions, ou au moins selon différentes largeurs de fenêtre
      Pourtant, on dirait que c’est en train de devenir un savoir-faire perdu
    • On dirait des déchets de design IA générés par Claude
  • Pour quelqu’un qui construit des environnements d’exécution depuis un an, le problème n’est pas que les gens d’opencode sont idiots et cassent le cache de préfixe
    En général, s’ils font ça exprès, c’est parce qu’après test le résultat global est meilleur
    Si vous pensez que dsv4 se comporte suffisamment différemment de la moyenne des autres modèles, alors envoyez au runtime concerné une PR avec un traitement d’exception spécifique et des éléments concrets à l’appui. Partir aveuglément du principe qu’« il faut toujours être en append-only à cause du cache » fait perdre du temps à tout le monde

  • Ce n’est pas un agent créé par DeepSeek, donc le titre est trompeur

  • La marque DeepSeek est désormais assez forte pour qu’on en soit au stade où les gens veulent profiter de cette notoriété de marque

  • C’est assez intéressant. Je suis abonné à Claude à 200 $ par mois, et jusqu’ici je n’avais pratiquement jamais eu besoin d’autre chose
    Mais plus Claude restreint mon flux de travail, surtout depuis les récents changements autour de l’IDE / -p, plus j’ai envie d’aller voir ailleurs
    J’accorde vraiment de l’importance au raisonnement de pointe, donc ça m’inquiète, mais DeepSeek continue quand même à m’intéresser

    • Si tu veux du raisonnement de pointe, ça vaut le coup d’essayer aussi d’autres modèles et de voir par toi-même à quel point ils diffèrent des modèles de tout premier plan
      C’est ce que j’ai fait, et j’ai réalisé que Qwen-2.5-Max me suffisait largement. Pour les petits projets jouets sur lesquels je travaille, Claude Sonnet 3.5 me semblerait aussi suffisant. Je ne vise pas une médaille Fields en maths
    • J’ai donné aujourd’hui un travail de rétro-ingénierie assez complexe à DS-4 xhigh et à GPT-5.5 xhigh
      Environ 6 heures plus tard, aucun des deux n’avait réussi une rétro-ingénierie complète, mais l’écart était énorme
      DS s’arrêtait toutes les 30 minutes en disant qu’il avait terminé la rétro-ingénierie complète et que tout devait désormais fonctionner, alors qu’en réalité il n’avait même pas fini 1 %. Je lui avais pourtant demandé très clairement de ne pas prendre certains raccourcis, mais il n’arrêtait pas d’en chercher, et ça a été un échec total
      À l’inverse, GPT-5.5 a été vraiment impressionnant. Il a fait ce qu’il fallait, et il ne passait pas à l’étape suivante avant d’avoir terminé les couches initiales et d’être sûr d’avoir compris complètement ce qui était nécessaire. Pendant 6 heures, je ne lui ai envoyé des prompts que lorsque je voyais qu’il allait dans la bonne direction et que je voulais simplement l’orienter légèrement vers une meilleure approche. Je n’avais pas l’impression de me battre contre lui
      Bon, après compression, il lui arrivait parfois de partir sur un « je ne peux pas aider pour la rétro-ingénierie », mais dans une nouvelle session le problème se réglait proprement
      J’ai annulé mon abonnement Claude il y a un mois, donc je n’ai pas pu comparer, mais DeepSeek m’a beaucoup rappelé ce que je ressentais en travaillant avec Opus 4.6/4.7. Pour certains, ce sera peut-être un signal positif, mais en voyant GPT-5.5, on réalise surtout à quel point la manière de travailler façon Claude/DS peut être pénible
    • Tu ferais mieux de garder absolument le forfait à 200 $ par mois et de ne surtout pas essayer le forfait code à 10 $ avec des modèles open weights et des limites plus élevées
      Anthropic a besoin de ton argent pour survivre, et tu dormiras mieux en te disant que tu utilises l’état de l’art
    • Plutôt que d’abandonner complètement les modèles Anthropic, il y a aussi l’option de les utiliser pour certaines tâches comme la planification, puis de confier l’implémentation à quelque chose comme DeepSeek
      Même avec des outils différents, un plan Markdown fonctionne plutôt bien. Si je passe de l’abonnement 5x Max à Pro, c’est probablement comme ça que je procéderai
      Je suis aussi en train de faire un lanceur qui permet d’utiliser facilement des fournisseurs tiers avec Claude Code : https://ccode.kronis.dev
      Le proxy local fonctionne déjà, il manque seulement le basculement dynamique de modèle. Ça ne devrait pas être difficile à ajouter, et selon mon planning ça devrait arriver d’ici 1 à 2 semaines
      Je ne pense pas qu’il soit judicieux de quitter complètement Anthropic. Le modèle est excellent, et l’abonnement donne aussi accès à des fonctions comme Remote Control que j’apprécie. En revanche, changer de palier pour économiser un peu d’argent semble possible. À l’inverse, il faut quand même une ligne de base en matière de qualité. Quand j’utilisais GLM 4.6 sur Cerebras, j’obtenais parfois des résultats assez brouillons
    • Si tu veux du raisonnement de pointe, il faut utiliser GPT 5.5 Pro
  • J’aime bien l’accent mis sur l’efficacité du taux de cache hit. Bravo à l’équipe DeepSeek d’avoir construit un excellent produit qui maximise la rentabilité pour l’utilisateur

    • Je l’ai utilisé pendant quelque temps et je suis totalement d’accord. Je le trouve aussi bon que Codex ou Claude, avec lesquels je l’utilise
      Sur les segments sensibles au coût, c’est le gagnant, et si une startup l’emballe proprement en pensant à la conservation des données, ça pourrait devenir un excellent produit vendable aux entreprises. Car pour un assistant de code, la question clé reste la conservation des données et la confidentialité
    • Au cas où, ce projet est le side project de quelqu’un
      « Projet open source indépendant · sans affiliation avec DeepSeek »
    • Vu le faible coût de l’API en plus, on pourrait probablement faire tourner la même tâche pendant plusieurs jours
    • Je ne comprends pas comment cette efficacité de cache hit est possible. N’est-ce pas simplement une question de ne pas modifier le contexte précédent ?
      Je ne vois pas quels leviers on peut réellement ajuster ici
  • J’ai essayé, et la zone de saisie du texte était en police sombre sur fond noir
    J’ai consulté la documentation et demandé de l’aide à DeepSeek v4, Claude et Gemini pour la police et le style, mais rien n’a marché, sauf l’exécuter dans un terminal à thème sombre. C’est dingue. Aucun des développeurs de ce projet n’utilise donc de thème clair ?

    • Je suis d’accord pour dire que c’est un problème, mais en pratique je pense qu’ils ne s’en servent tout simplement pas
      Les thèmes clairs sont extrêmement rares à l’usage