94 points par xguru 2026-03-23 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Une software factory open source composée d’IA, créée et utilisée par le CEO de YC, Garry Tan, pensée pour permettre à une seule personne de travailler comme une équipe de 20 personnes
  • Organisée autour de slash commands couvrant l’ensemble d’un sprint dans l’ordre Think → Plan → Build → Review → Test → Ship → Reflect, chaque skill transmettant automatiquement son contexte au suivant
  • On commence par /office-hours pour valider les hypothèses produit, puis on finalise l’architecture avec /plan-ceo-review · /plan-eng-review, avant d’automatiser avec /review · /qa · /ship tout ce qui va de la correction de bugs à la création de PR
  • Chaque commande agit comme un expert par rôle : revue CEO, conception par un manager engineering, supervision design, lead QA, release engineer, etc.
  • Utilisateurs visés
    • Founder·CEO — fondateurs techniques qui veulent encore déployer eux-mêmes leur code
    • Débutants sur Claude Code — utilisateurs ayant besoin d’un workflow structuré basé sur des rôles plutôt que d’un prompt vide
    • Tech Lead·Staff Engineer — ingénieurs seniors ayant besoin d’une revue stricte, de QA et d’automatisation des releases à chaque PR
  • Les skills au cœur du sprint
    • /office-hours — valide les hypothèses produit via 6 questions imposées au format office hours de YC, génère un document de design et le transmet automatiquement aux skills en aval
    • /plan-ceo-review — redéfinit le problème et explore un « produit 10 étoiles » ; 4 modes : Expansion, Selective Expansion, Hold Scope, Reduction
    • /plan-eng-review — définit l’architecture, les flux de données, les diagrammes ASCII, les edge cases, la matrice de tests et les préoccupations de sécurité
    • /plan-design-review — évalue chaque dimension du design de 0 à 10, explique le niveau 10, inclut une détection de l’AI Slop, et lance une interaction AskUserQuestion une fois par décision de design
    • /design-consultation — construit un système de design complet from scratch et génère des maquettes produit réalistes
    • /review — détecte les bugs qui passent en CI mais cassent en production, corrige automatiquement les problèmes évidents et signale les écarts de qualité
    • /investigate — principe absolu : pas de correction sans investigation ; suit le flux de données, vérifie les hypothèses, et s’arrête après 3 échecs
    • /design-review — réalise le même audit que /plan-design-review, puis corrige directement les problèmes détectés avec captures d’écran avant/après
    • /qa — teste l’application dans un vrai navigateur, détecte et corrige les bugs, puis génère automatiquement un test de régression pour chaque correction
    • /qa-only — même méthodologie que /qa, mais génère uniquement un rapport de bugs sans modifier le code
    • /cso — audit des menaces basé sur OWASP Top 10 + STRIDE ; 17 règles d’exclusion des faux positifs, seuil de confiance de 8/10 minimum, et scénario d’exploit concret pour chaque découverte
    • /ship — synchronise main, lance les tests, audite la couverture, push, crée une PR ; bootstrap automatique si aucun framework de test n’est présent
    • /land-and-deploy — fusionne la PR → attend la CI et le déploiement → vérifie l’état en production, le tout en une seule commande
    • /canary — boucle de monitoring après déploiement pour les erreurs console, les régressions de performance et les pannes de page
    • /benchmark — mesure les temps de chargement, les Core Web Vitals et les tailles de ressources, puis compare avant/après pour chaque PR
    • /document-release — met à jour toute la documentation du projet selon ce qui a été déployé, avec détection automatique des README obsolètes
    • /retro — rétrospective hebdomadaire ; analyses individuelles, historique des déploiements continus, tendances de santé des tests, et avec /retro global, rétrospective consolidée du projet entier et des outils IA (Claude Code, Codex, Gemini)
    • /browse — vrai navigateur Chromium, vrais clics, vraies captures d’écran, environ 100 ms par commande
    • /setup-browser-cookies — importe les cookies de Chrome, Arc, Brave et Edge dans une session headless pour tester des pages authentifiées
    • /autoplan — exécute automatiquement dans l’ordre les revues CEO → design → engineering, et n’expose à l’utilisateur que les décisions relevant des préférences
  • Power tools
    • /codex — revue de code indépendante via OpenAI Codex CLI ; 3 modes : review (gate pass/fail), adversarial challenge et open consultation ; si /review et /codex sont tous deux exécutés, analyse croisée inter‑modèles
    • /careful — avertit avant l’exécution de commandes destructrices comme rm -rf, DROP TABLE ou un force push ; s’active en saisissant "be careful"
    • /freeze — limite l’édition de fichiers à un répertoire précis pour éviter les modifications hors périmètre pendant le debug
    • /guard — combine /careful + /freeze, configuration de sécurité maximale pour le travail en production
    • /unfreeze — retire les limites imposées par /freeze
    • /setup-deploy — configuration initiale unique pour /land-and-deploy, avec détection automatique de la plateforme, de l’URL de production et des commandes de déploiement
    • /gstack-upgrade — met à niveau gstack vers la dernière version, en détectant et synchronisant à la fois les installations globales et vendorisées
  • Sprint parallèle : via Conductor, plusieurs sessions Claude Code peuvent être exécutées simultanément dans des workspaces isolés
    • Exemple : une session pour /office-hours, une autre pour /review, une troisième pour l’implémentation de fonctionnalité, une quatrième pour /qa
      — Les fondateurs, lead engineers et PM peuvent forker cette usine de développement IA, l’expérimenter directement et l’étendre
  • Fonctionne non seulement avec Claude Code, mais aussi avec tous les agents prenant en charge le standard SKILL.md, comme Codex, Gemini CLI, Cursor
  • Licence MIT

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.