4 points par sugeuljin 2026-02-23 | 8 commentaires | Partager sur WhatsApp

Comme je peux utiliser des tokens Gemini à très bas coût, j’utilise, comme l’indique le titre, un backend proxy connecté à Gemini avec Claude Code. Le CLI Gemini est trop agressif à mon goût (même quand je lui demande seulement de lire du code, il essaie sans cesse de modifier quelque chose), donc cela ne me convenait pas, et j’ai l’impression que la conception en agent de Claude Code fonctionne le mieux. Je l’utilise donc de manière satisfaisante même après avoir remplacé le backend.

Cette couche proxy ajoute en quelque sorte une couche d’abstraction supplémentaire, ce qui permet de connecter et d’utiliser OpenAI, XAI, Claude et Gemini dans Claude Code de la même manière.

J’ai dû résoudre quelques problèmes pénibles, comme le streaming et l’analyse du JSON, ou encore le nettoyage des schémas pour le tool use. Donc, si certains veulent essayer quelque chose de similaire, dites-le-moi en commentaire ; je pourrais le publier en open source.

Si quelqu’un a déjà fait un travail similaire, n’hésitez pas à partager votre expérience ~

8 commentaires

 
srebaragi 2026-03-02

J’ai une approche un peu différente. Au lieu d’utiliser des outils agents comme Claude Code ou Cowork, je développe en conversation en langage naturel directement dans un chat web de LLM. J’ai déployé un proxy sur mon propre serveur pour relier les API Claude ↔ Gemini, et en production réelle (chatbot KakaoTalk, agent ERP en langage naturel), c’est Gemini qui tourne ; pour la revue de code et la conception de l’architecture, j’échange avec Claude ; et l’humain ne fait que la validation finale et le déploiement.
Gemini pour l’exécution du code, Claude pour la vérification du code, et l’humain pour la validation finale — cette répartition des rôles fonctionne plutôt bien.
Par rapport aux agents basés sur un éditeur de code (Claude Code, etc.), l’avantage est aussi une consommation de tokens bien plus faible. On échange le code par conversation, sans fichier I/O, puis l’humain l’applique directement. Le point avec lequel je suis d’accord, c’est que « la conception agentique de Claude est celle qui fonctionne le mieux ». Gemini CLI a clairement un caractère bien affirmé (haha), donc pour le rôle de relecture, Claude est meilleur à mon avis.

 
sugeuljin 2026-03-02

Merci de partager votre expérience. 👍 Je partage aussi votre point de vue sur les différences de style entre Gemini et Claude.
Vous utilisez donc plusieurs fournisseurs à la fois via une seule interface web ; quand on fait du codage autonome basé sur des agents, on a tendance à écrire de manière superficielle, dans un esprit de « développement guidé par le CV », plutôt qu’à réfléchir à une bonne conception, donc je pense moi aussi qu’il vaut mieux faire la conception sous forme de dialogue. ☺️

 
winterjung 2026-02-23

Pour ma part, j’ai lancé quelque chose comme anthropic-proxy en local et j’utilisais ensuite d’autres modèles Gemini ou GPT via un proxy avec une commande du type ANTHROPIC_BASE_URL=http://0.0.0.0:3000 claude, mais comme vous dites l’avoir implémenté en serverless, ça m’intrigue.

 
sugeuljin 2026-02-23

Oh, il existe aussi un projet open source écrit en JS. Merci 👍👍
La structure interne est similaire, mais de mon côté je l’utilise avec un peu plus d’abstraction. (question de préférence)

Même en le développant en serverless, comme le temps de réponse du LLM est bien plus lent, le cold start est difficilement perceptible et l’expérience reste fluide. De plus, avec la fonctionnalité Function URL de Lambda, le streaming est aussi possible, donc cela couvre complètement le besoin. Surtout, le meilleur point est qu’il n’y a pas besoin de redémarrer le serveur même après un reboot.
Dans ce code, vous pouvez aussi essayer de ne modifier que la partie FastAPI au format handler Lambda pour le déployer sur Lambda ; après un peu de troubleshooting, cela devrait être tout à fait utilisable.

 
superwoou 2026-02-23

Y a-t-il des personnes qui se demandent comment connecter Gemini à Claude Code ?

https://github.com/1rgs/claude-code-proxy
Quelle est la différence avec ce type de proxy ?

 
sugeuljin 2026-02-23

Merci de m’avoir fait découvrir cette excellente bibliothèque. Si je l’avais connue plus tôt, j’aurais sans doute pu faire quelque chose de plus facilement 👍👍
En interne, le traitement lui-même de la conversion des formats d’entrée/sortie ne semble pas très différent,
mais s’il faut relever une différence, la bibliothèque que vous avez présentée repose sur le self-service / Docker / Python / LiteLLM, tandis que de mon côté je l’ai implémentée en serverless / AWS Lambda / TS / sans dépendances.

 
bsh998 2026-02-23

Si vous connectez Gemini à Claude Code, il est possible que vous vous fassiez suspendre.
Vous devriez probablement faire attention à une vague de suspensions massives sur opencode.

 
sugeuljin 2026-02-23

Merci pour votre réponse rapide. 🙌
Le problème lié à l’arrêt d’Open Code (abonnement Claude => intégration Open Code) venait du fait qu’une clé d’abonnement forfaitaire authentifiée via OAuth était utilisée dans un logiciel tiers. Pour l’utiliser comme ci-dessus, il faut émettre une clé API et l’utiliser à l’usage, ce qui ne constitue pas une violation des conditions d’utilisation.