Automatiser la vérification de la qualité d’un blog avec un pipeline de revue parallèle Gemini + Cla

J’ai confié la relecture du blog à 5 IA, et elles ont réellement détecté des problèmes

Le plus difficile après l’écriture, c’était toujours de relire et corriger moi-même. À chaque fois, lire ligne par ligne un brouillon généré par l’IA et le corriger me prenait énormément de temps.
J’ai donc essayé de construire un pipeline où l’IA fait relire l’IA.

** J’ai gardé une structure simple **

2 Gemini, 2 Claude et 1 session en cours — soit 5 critics lancés en même temps avec Bash &
Je leur ai demandé de lire chacun avec une persona différente : « développeur senior qui découvre le sujet », « personne ayant déjà utilisé cette technologie », « éditeur », « lecteur qui va essayer de reproduire », « responsable SEO »
Je récupère des scores en JSON : si la moyenne dépasse 8, c’est validé ; sinon, j’intègre les retours puis je relance une évaluation

** Concrètement, voici ce qu’elles ont trouvé **
Au premier tour, la moyenne est sortie à 7,6. Le « critic lecteur qui va essayer de reproduire » a mis 3 points en disant qu’il n’y avait pas d’exemple de code, alors que c’était typiquement le genre de détail que j’aurais laissé passer si je l’avais relu moi-même. Après avoir ajouté 3 blocs de code et transformé un dépannage sous forme de liste en récit plus fluide, le second tour est passé à 8,4.

** En le faisant tourner, j’ai vu des failles structurelles **
Quand les retours des critics entraient en conflit, le système tranchait seul et passait à la suite sans vraie décision. Quand la moyenne était élevée, même une note éliminatoire pouvait passer. Et en cas d’échec du parsing, tout s’arrêtait.
J’ai donc ajouté un médiateur Synthesis, mis en place un Veto et une condition éliminatoire, puis prévu un parseur de fallback.

** À la fin, j’ai remplacé la publication par push par une PR **
Dans une logique Human-In-The-Loop, même si les IA tombent d’accord, je fais en sorte qu’un regard humain intervienne toujours. Le body de la PR contient un tableau des scores des critics, et quand je laisse des commentaires ligne par ligne, l’IA ajoute un commit de correction. Cette boucle se répète jusqu’au merge.

Oui, au final, cet article lui-même a été publié avec le même pipeline.

Automatiser la vérification de la qualité d’un blog avec un pipeline de revue parallèle Gemini + Claude

3 commentaires

Automatiser la vérification de la qualité d’un blog avec un pipeline de revue parallèle Gemini + Claude

À lire aussi

3 commentaires