DeepSeek Reasonix - Agent de codage natif DeepSeek avec cache élevé et faible coût
(esengine.github.io)- Agent de codage terminal open source conçu exclusivement pour l’API DeepSeek, communiquant directement avec
api.deepseek.com - La boucle append-only est optimisée pour le byte-stable prefix cache de DeepSeek, ce qui permet de maintenir plus de 90 % de taux de cache hit sur les longues sessions et de réduire le coût des tokens d’entrée à environ 1/5 (soit environ 1/3 du coût d’outils comparables)
- Exécutable en une seule ligne avec
npx reasonix code, sans installation globale requise (Node ≥ 22, prise en charge de macOS/Linux/Windows) - 3 conceptions clés
- Cache-First Loop : structure append-only, sans dépendance aux marqueurs, avec ordre d’appel déterministe pour préserver le prefix cache
- R1 Thought Harvest : collecte de la chaîne de raisonnement des tool calls manqués
- Tool-Call Repair : récupération via une approche d’auto-réparation aware du schéma
- Principe terminal-first : pas de plugin IDE pris en charge, utilisation directe des outils terminal comme
git diffouls- Basé sur TypeScript + Ink TUI, avec aussi un client desktop Tauri séparé (runtime Node embarqué)
- Exploitation en modèle V4 à deux niveaux : V4-Flash par défaut pour les itérations à bas coût, promotion vers V4-Pro sur un seul tour avec
/pro, ou exécution de toute la session en Pro avec/preset max - Support de premier ordre pour MCP (Model Context Protocol) : connexion à des serveurs externes en une ligne avec
--mcp "name=cmd args", avec prise en charge des transports stdio, SSE et Streamable HTTP - Sandbox + gate
/plan: tous les outils intégrés sont sandboxés dans le répertoire d’exécution, et le mode/planagit comme une gate d’audit en lecture seule qui bloque l’écriture avant approbation- Les éditions SEARCH/REPLACE restent en attente dans une file pending et ne sont pas appliquées au disque avant
/apply
- Les éditions SEARCH/REPLACE restent en attente dans une file pending et ne sont pas appliquées au disque avant
- Composable Skills : placement de fichiers Markdown dans
.reasonix/skills/<name>.md, avec isolation d’exécution via le frontmatterrunAs: subagentetallowed-tools - Replay & Events : tous les événements sont enregistrés sur disque, permettant de rejouer les sessions passées et d’obtenir statistiques et audit via les commandes
reasonix replay / events / stats - Extensibilité basée sur du texte brut : tous les réglages sont gérés sous forme de texte brut versionnable par git via les répertoires
/mcp,/skills,/memory,/configet/slash - Prise en charge d’endpoints DeepSeek auto-hébergés : à partir de 0.30, les préfixes de clés non standard sont autorisés ; il suffit de définir
baseUrlvers une adresse interne pour conserver le même fonctionnement des boucles, du cache et du protocole d’outils - Tarification de l’API DeepSeek : V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
- Licence MIT
1 commentaires
Commentaires Hacker News
Je ne suis pas sûr qu’il faille absolument un agent de code dédié à DeepSeek pour tirer parti du cache DeepSeek
Comme le problème de quota de Codex n’était toujours pas résolu hier, j’ai bricolé un tout petit pont pour utiliser DeepSeek V4 Pro dans Codex, et presque tout ce que j’ai fait semblait mis en cache : https://i.imgur.com/7eKn6wN.png
Au 2026-05-23, j’avais 39,123,200 tokens en cache hit sur l’entrée, contre 1,692,286 en cache miss, et le pont ne fait rien de spécial : il se contente d’adapter le format de l’API DeepSeek à ce qu’attend Codex, sans aucun traitement particulier lié au cache
En dehors du fait que le caching serait meilleur, je ne vois pas très bien quel avantage il y aurait par rapport à lancer directement OpenCode avec l’API DeepSeek. Ça profiterait manifestement aussi d’un caching similaire, communiquerait directement avec api.deepseek.com si c’est important, et offrirait un environnement d’exécution bien plus mature
Elle explique pourquoi ils considèrent que c’est une meilleure solution, et pourquoi ils ont une philosophie de conception aussi marquée
« Le caching automatique de préfixe ne s’active que si le préfixe en octets de la requête précédente correspond exactement. La plupart des boucles d’agent réordonnent, réécrivent ou injectent de nouveaux horodatages à chaque tour — en pratique, les taux de cache hit sont inférieurs à 20 % »
L’idée est donc d’optimiser ce point et d’autres techniques pour améliorer le taux de cache hit et réduire les coûts
Pour les curieux : http://github.com/tontinton/maki
DeepSeek v4 est excellent avec claude-code ou opencode. Dans mon cas, claude code m’a coûté moins cher qu’opencode, probablement grâce à un environnement d’exécution mieux conçu
Au final, j’imagine qu’on saisit des phrases en anglais courant au lieu de commandes
Ce site web a l’air d’avoir été fait par Codex. J’avais demandé à Codex de me faire un HTML de présentation des fonctionnalités pour l’équipe, et il m’a sorti un monstre trop décoré, avec de gros encadrés de statistiques sans grand intérêt, et c’était quasiment le même style : police, couleurs, mise en page, section héro, tout pareil
C’était tout aussi affreux sur mobile que ce site. J’ai fini par demander à Claude de faire un fichier HTML d’une seule page, et c’était utilisable à 95 % tel quel pour expliquer clairement l’intention, avec juste quelques petites retouches
Sur mobile, les exemples de code repoussent sans arrêt le contenu, au point qu’il devient difficile de lire l’essentiel de la page. Bon, c’est peut-être un peu sévère et l’intention était sans doute bonne, mais un site plus simple aurait largement suffi
Après tout, comme n’importe quel ingénieur logiciel le sait, retirer des fonctionnalités peut simplifier radicalement n’importe quel projet
J’aimerais que l’auteur comprenne que certaines personnes veulent un binaire unique autonome qui ne consomme pas la moitié de la mémoire de leur machine, et c’est pourquoi elles veulent l’écrire en Rust ou en Go
La valeur et le confort de développement qu’apportaient les langages interprétés lents sont en train de s’éroder. Les langages plus récents intègrent de bonnes choses par défaut, ou plus exactement, les alertes d’astreinte à 1 h du matin commencent à nous rendre franchement irritables
Go a déjà plein d’excellentes bibliothèques pour le terminal
Je n’aime pas cette page. À cause de l’animation de frappe, la taille de la zone d’exemple change en permanence, et le contenu en dessous est constamment poussé vers le haut puis vers le bas
C’est une très mauvaise expérience utilisateur
Pourtant, on dirait que c’est en train de devenir un savoir-faire perdu
Pour quelqu’un qui construit des environnements d’exécution depuis un an, le problème n’est pas que les gens d’opencode sont idiots et cassent le cache de préfixe
En général, s’ils font ça exprès, c’est parce qu’après test le résultat global est meilleur
Si vous pensez que dsv4 se comporte suffisamment différemment de la moyenne des autres modèles, alors envoyez au runtime concerné une PR avec un traitement d’exception spécifique et des éléments concrets à l’appui. Partir aveuglément du principe qu’« il faut toujours être en append-only à cause du cache » fait perdre du temps à tout le monde
Ce n’est pas un agent créé par DeepSeek, donc le titre est trompeur
La marque DeepSeek est désormais assez forte pour qu’on en soit au stade où les gens veulent profiter de cette notoriété de marque
C’est assez intéressant. Je suis abonné à Claude à 200 $ par mois, et jusqu’ici je n’avais pratiquement jamais eu besoin d’autre chose
Mais plus Claude restreint mon flux de travail, surtout depuis les récents changements autour de l’IDE /
-p, plus j’ai envie d’aller voir ailleursJ’accorde vraiment de l’importance au raisonnement de pointe, donc ça m’inquiète, mais DeepSeek continue quand même à m’intéresser
C’est ce que j’ai fait, et j’ai réalisé que Qwen-2.5-Max me suffisait largement. Pour les petits projets jouets sur lesquels je travaille, Claude Sonnet 3.5 me semblerait aussi suffisant. Je ne vise pas une médaille Fields en maths
Environ 6 heures plus tard, aucun des deux n’avait réussi une rétro-ingénierie complète, mais l’écart était énorme
DS s’arrêtait toutes les 30 minutes en disant qu’il avait terminé la rétro-ingénierie complète et que tout devait désormais fonctionner, alors qu’en réalité il n’avait même pas fini 1 %. Je lui avais pourtant demandé très clairement de ne pas prendre certains raccourcis, mais il n’arrêtait pas d’en chercher, et ça a été un échec total
À l’inverse, GPT-5.5 a été vraiment impressionnant. Il a fait ce qu’il fallait, et il ne passait pas à l’étape suivante avant d’avoir terminé les couches initiales et d’être sûr d’avoir compris complètement ce qui était nécessaire. Pendant 6 heures, je ne lui ai envoyé des prompts que lorsque je voyais qu’il allait dans la bonne direction et que je voulais simplement l’orienter légèrement vers une meilleure approche. Je n’avais pas l’impression de me battre contre lui
Bon, après compression, il lui arrivait parfois de partir sur un « je ne peux pas aider pour la rétro-ingénierie », mais dans une nouvelle session le problème se réglait proprement
J’ai annulé mon abonnement Claude il y a un mois, donc je n’ai pas pu comparer, mais DeepSeek m’a beaucoup rappelé ce que je ressentais en travaillant avec Opus 4.6/4.7. Pour certains, ce sera peut-être un signal positif, mais en voyant GPT-5.5, on réalise surtout à quel point la manière de travailler façon Claude/DS peut être pénible
Anthropic a besoin de ton argent pour survivre, et tu dormiras mieux en te disant que tu utilises l’état de l’art
Même avec des outils différents, un plan Markdown fonctionne plutôt bien. Si je passe de l’abonnement 5x Max à Pro, c’est probablement comme ça que je procéderai
Je suis aussi en train de faire un lanceur qui permet d’utiliser facilement des fournisseurs tiers avec Claude Code : https://ccode.kronis.dev
Le proxy local fonctionne déjà, il manque seulement le basculement dynamique de modèle. Ça ne devrait pas être difficile à ajouter, et selon mon planning ça devrait arriver d’ici 1 à 2 semaines
Je ne pense pas qu’il soit judicieux de quitter complètement Anthropic. Le modèle est excellent, et l’abonnement donne aussi accès à des fonctions comme Remote Control que j’apprécie. En revanche, changer de palier pour économiser un peu d’argent semble possible. À l’inverse, il faut quand même une ligne de base en matière de qualité. Quand j’utilisais GLM 4.6 sur Cerebras, j’obtenais parfois des résultats assez brouillons
J’aime bien l’accent mis sur l’efficacité du taux de cache hit. Bravo à l’équipe DeepSeek d’avoir construit un excellent produit qui maximise la rentabilité pour l’utilisateur
Sur les segments sensibles au coût, c’est le gagnant, et si une startup l’emballe proprement en pensant à la conservation des données, ça pourrait devenir un excellent produit vendable aux entreprises. Car pour un assistant de code, la question clé reste la conservation des données et la confidentialité
« Projet open source indépendant · sans affiliation avec DeepSeek »
Je ne vois pas quels leviers on peut réellement ajuster ici
J’ai essayé, et la zone de saisie du texte était en police sombre sur fond noir
J’ai consulté la documentation et demandé de l’aide à DeepSeek v4, Claude et Gemini pour la police et le style, mais rien n’a marché, sauf l’exécuter dans un terminal à thème sombre. C’est dingue. Aucun des développeurs de ce projet n’utilise donc de thème clair ?
Les thèmes clairs sont extrêmement rares à l’usage