gstack - Une équipe d’ingénierie virtuelle créée avec Claude Code
(github.com/garrytan)- Une software factory open source composée d’IA, créée et utilisée par le CEO de YC, Garry Tan, pensée pour permettre à une seule personne de travailler comme une équipe de 20 personnes
- Organisée autour de slash commands couvrant l’ensemble d’un sprint dans l’ordre Think → Plan → Build → Review → Test → Ship → Reflect, chaque skill transmettant automatiquement son contexte au suivant
- On commence par
/office-hourspour valider les hypothèses produit, puis on finalise l’architecture avec/plan-ceo-review·/plan-eng-review, avant d’automatiser avec/review·/qa·/shiptout ce qui va de la correction de bugs à la création de PR - Chaque commande agit comme un expert par rôle : revue CEO, conception par un manager engineering, supervision design, lead QA, release engineer, etc.
- Utilisateurs visés
- Founder·CEO — fondateurs techniques qui veulent encore déployer eux-mêmes leur code
- Débutants sur Claude Code — utilisateurs ayant besoin d’un workflow structuré basé sur des rôles plutôt que d’un prompt vide
- Tech Lead·Staff Engineer — ingénieurs seniors ayant besoin d’une revue stricte, de QA et d’automatisation des releases à chaque PR
- Les skills au cœur du sprint
/office-hours— valide les hypothèses produit via 6 questions imposées au format office hours de YC, génère un document de design et le transmet automatiquement aux skills en aval/plan-ceo-review— redéfinit le problème et explore un « produit 10 étoiles » ; 4 modes : Expansion, Selective Expansion, Hold Scope, Reduction/plan-eng-review— définit l’architecture, les flux de données, les diagrammes ASCII, les edge cases, la matrice de tests et les préoccupations de sécurité/plan-design-review— évalue chaque dimension du design de 0 à 10, explique le niveau 10, inclut une détection de l’AI Slop, et lance une interactionAskUserQuestionune fois par décision de design/design-consultation— construit un système de design complet from scratch et génère des maquettes produit réalistes/review— détecte les bugs qui passent en CI mais cassent en production, corrige automatiquement les problèmes évidents et signale les écarts de qualité/investigate— principe absolu : pas de correction sans investigation ; suit le flux de données, vérifie les hypothèses, et s’arrête après 3 échecs/design-review— réalise le même audit que/plan-design-review, puis corrige directement les problèmes détectés avec captures d’écran avant/après/qa— teste l’application dans un vrai navigateur, détecte et corrige les bugs, puis génère automatiquement un test de régression pour chaque correction/qa-only— même méthodologie que/qa, mais génère uniquement un rapport de bugs sans modifier le code/cso— audit des menaces basé sur OWASP Top 10 + STRIDE ; 17 règles d’exclusion des faux positifs, seuil de confiance de 8/10 minimum, et scénario d’exploit concret pour chaque découverte/ship— synchronisemain, lance les tests, audite la couverture, push, crée une PR ; bootstrap automatique si aucun framework de test n’est présent/land-and-deploy— fusionne la PR → attend la CI et le déploiement → vérifie l’état en production, le tout en une seule commande/canary— boucle de monitoring après déploiement pour les erreurs console, les régressions de performance et les pannes de page/benchmark— mesure les temps de chargement, les Core Web Vitals et les tailles de ressources, puis compare avant/après pour chaque PR/document-release— met à jour toute la documentation du projet selon ce qui a été déployé, avec détection automatique des README obsolètes/retro— rétrospective hebdomadaire ; analyses individuelles, historique des déploiements continus, tendances de santé des tests, et avec/retro global, rétrospective consolidée du projet entier et des outils IA (Claude Code, Codex, Gemini)/browse— vrai navigateur Chromium, vrais clics, vraies captures d’écran, environ 100 ms par commande/setup-browser-cookies— importe les cookies de Chrome, Arc, Brave et Edge dans une session headless pour tester des pages authentifiées/autoplan— exécute automatiquement dans l’ordre les revues CEO → design → engineering, et n’expose à l’utilisateur que les décisions relevant des préférences
- Power tools
/codex— revue de code indépendante via OpenAI Codex CLI ; 3 modes : review (gate pass/fail), adversarial challenge et open consultation ; si/reviewet/codexsont tous deux exécutés, analyse croisée inter‑modèles/careful— avertit avant l’exécution de commandes destructrices commerm -rf,DROP TABLEou un force push ; s’active en saisissant "be careful"/freeze— limite l’édition de fichiers à un répertoire précis pour éviter les modifications hors périmètre pendant le debug/guard— combine/careful+/freeze, configuration de sécurité maximale pour le travail en production/unfreeze— retire les limites imposées par/freeze/setup-deploy— configuration initiale unique pour/land-and-deploy, avec détection automatique de la plateforme, de l’URL de production et des commandes de déploiement/gstack-upgrade— met à niveau gstack vers la dernière version, en détectant et synchronisant à la fois les installations globales et vendorisées
- Sprint parallèle : via Conductor, plusieurs sessions Claude Code peuvent être exécutées simultanément dans des workspaces isolés
- Exemple : une session pour
/office-hours, une autre pour/review, une troisième pour l’implémentation de fonctionnalité, une quatrième pour/qa
— Les fondateurs, lead engineers et PM peuvent forker cette usine de développement IA, l’expérimenter directement et l’étendre
- Exemple : une session pour
- Fonctionne non seulement avec Claude Code, mais aussi avec tous les agents prenant en charge le standard SKILL.md, comme Codex, Gemini CLI, Cursor
- Licence MIT
4 commentaires
Waouh !! Garry Tan a retweeté GeekNews.
https://x.com/garrytan/status/2035898375934300353
J’ai cherché parce que l’Office Hour prenait vraiment longtemps, et même rien que ce skill a déjà un markdown d’une longueur assez folle.
On dirait que ça évolue de plus en plus pour être utile aux personnes qui travaillent en entreprise individuelle.
Les office hours sont amusantes, moi je fais du hands-on.