- Une software factory open source composée d’IA, créée et utilisée par le CEO de YC, Garry Tan, pensée pour permettre à une seule personne de travailler comme une équipe de 20 personnes
- Organisée autour de slash commands couvrant l’ensemble d’un sprint dans l’ordre Think → Plan → Build → Review → Test → Ship → Reflect, chaque skill transmettant automatiquement son contexte au suivant
- On commence par
/office-hours pour valider les hypothèses produit, puis on finalise l’architecture avec /plan-ceo-review · /plan-eng-review, avant d’automatiser avec /review · /qa · /ship tout ce qui va de la correction de bugs à la création de PR
- Chaque commande agit comme un expert par rôle : revue CEO, conception par un manager engineering, supervision design, lead QA, release engineer, etc.
- Utilisateurs visés
- Founder·CEO — fondateurs techniques qui veulent encore déployer eux-mêmes leur code
- Débutants sur Claude Code — utilisateurs ayant besoin d’un workflow structuré basé sur des rôles plutôt que d’un prompt vide
- Tech Lead·Staff Engineer — ingénieurs seniors ayant besoin d’une revue stricte, de QA et d’automatisation des releases à chaque PR
- Les skills au cœur du sprint
/office-hours — valide les hypothèses produit via 6 questions imposées au format office hours de YC, génère un document de design et le transmet automatiquement aux skills en aval
/plan-ceo-review — redéfinit le problème et explore un « produit 10 étoiles » ; 4 modes : Expansion, Selective Expansion, Hold Scope, Reduction
/plan-eng-review — définit l’architecture, les flux de données, les diagrammes ASCII, les edge cases, la matrice de tests et les préoccupations de sécurité
/plan-design-review — évalue chaque dimension du design de 0 à 10, explique le niveau 10, inclut une détection de l’AI Slop, et lance une interaction AskUserQuestion une fois par décision de design
/design-consultation — construit un système de design complet from scratch et génère des maquettes produit réalistes
/review — détecte les bugs qui passent en CI mais cassent en production, corrige automatiquement les problèmes évidents et signale les écarts de qualité
/investigate — principe absolu : pas de correction sans investigation ; suit le flux de données, vérifie les hypothèses, et s’arrête après 3 échecs
/design-review — réalise le même audit que /plan-design-review, puis corrige directement les problèmes détectés avec captures d’écran avant/après
/qa — teste l’application dans un vrai navigateur, détecte et corrige les bugs, puis génère automatiquement un test de régression pour chaque correction
/qa-only — même méthodologie que /qa, mais génère uniquement un rapport de bugs sans modifier le code
/cso — audit des menaces basé sur OWASP Top 10 + STRIDE ; 17 règles d’exclusion des faux positifs, seuil de confiance de 8/10 minimum, et scénario d’exploit concret pour chaque découverte
/ship — synchronise main, lance les tests, audite la couverture, push, crée une PR ; bootstrap automatique si aucun framework de test n’est présent
/land-and-deploy — fusionne la PR → attend la CI et le déploiement → vérifie l’état en production, le tout en une seule commande
/canary — boucle de monitoring après déploiement pour les erreurs console, les régressions de performance et les pannes de page
/benchmark — mesure les temps de chargement, les Core Web Vitals et les tailles de ressources, puis compare avant/après pour chaque PR
/document-release — met à jour toute la documentation du projet selon ce qui a été déployé, avec détection automatique des README obsolètes
/retro — rétrospective hebdomadaire ; analyses individuelles, historique des déploiements continus, tendances de santé des tests, et avec /retro global, rétrospective consolidée du projet entier et des outils IA (Claude Code, Codex, Gemini)
/browse — vrai navigateur Chromium, vrais clics, vraies captures d’écran, environ 100 ms par commande
/setup-browser-cookies — importe les cookies de Chrome, Arc, Brave et Edge dans une session headless pour tester des pages authentifiées
/autoplan — exécute automatiquement dans l’ordre les revues CEO → design → engineering, et n’expose à l’utilisateur que les décisions relevant des préférences
- Power tools
/codex — revue de code indépendante via OpenAI Codex CLI ; 3 modes : review (gate pass/fail), adversarial challenge et open consultation ; si /review et /codex sont tous deux exécutés, analyse croisée inter‑modèles
/careful — avertit avant l’exécution de commandes destructrices comme rm -rf, DROP TABLE ou un force push ; s’active en saisissant "be careful"
/freeze — limite l’édition de fichiers à un répertoire précis pour éviter les modifications hors périmètre pendant le debug
/guard — combine /careful + /freeze, configuration de sécurité maximale pour le travail en production
/unfreeze — retire les limites imposées par /freeze
/setup-deploy — configuration initiale unique pour /land-and-deploy, avec détection automatique de la plateforme, de l’URL de production et des commandes de déploiement
/gstack-upgrade — met à niveau gstack vers la dernière version, en détectant et synchronisant à la fois les installations globales et vendorisées
- Sprint parallèle : via Conductor, plusieurs sessions Claude Code peuvent être exécutées simultanément dans des workspaces isolés
- Exemple : une session pour
/office-hours, une autre pour /review, une troisième pour l’implémentation de fonctionnalité, une quatrième pour /qa
— Les fondateurs, lead engineers et PM peuvent forker cette usine de développement IA, l’expérimenter directement et l’étendre
- Fonctionne non seulement avec Claude Code, mais aussi avec tous les agents prenant en charge le standard SKILL.md, comme Codex, Gemini CLI, Cursor
- Licence MIT
Aucun commentaire pour le moment.