1 points par GN⁺ 2025-04-30 | 1 commentaires | Partager sur WhatsApp
  • CoRT est un algorithme qui permet à un modèle d’IA de réexaminer de manière itérative ses propres réponses et de générer des alternatives afin de sélectionner la meilleure réponse
  • Lorsqu’il est appliqué au modèle Mistral 3.1 24B, les performances s’améliorent fortement, en particulier pour les tâches de programmation
  • L’IA génère une réponse initiale, puis évalue des alternatives sur plusieurs « tours de réflexion » afin de choisir la réponse finale
  • Ce processus inclut l’auto-évaluation, la génération d’alternatives concurrentes, l’amélioration itérative et une profondeur de réflexion dynamique
  • CoRT est proposé sous licence MIT et les contributions pour l’améliorer sont les bienvenues

CoRT (Chain of Recursive Thoughts) 🧠🔄

Résumé

  • Présentation de CoRT, un algorithme qui permet à une IA de débattre avec elle-même pour trouver de meilleures réponses
  • Le modèle d’IA réexamine ses réponses de manière itérative et génère des alternatives afin de sélectionner la meilleure réponse
  • Lorsqu’il est appliqué au modèle Mistral 3.1 24B, les performances s’améliorent fortement, en particulier pour les tâches de programmation

Fonctionnement de CoRT

  • L’IA génère une réponse initiale
  • L’IA détermine le nombre de « tours de réflexion » nécessaires
  • À chaque tour :
    • Génération de 3 réponses alternatives
    • Évaluation de toutes les réponses
    • Sélection de la meilleure réponse
  • La réponse finale devient la survivante de cette battle royale entre IA

L’ingrédient secret

  • Auto-évaluation
  • Génération d’alternatives concurrentes
  • Amélioration itérative
  • Profondeur de réflexion dynamique

Contribution

  • Si vous avez trouvé un moyen de l’améliorer, les PR sont les bienvenues

Licence

  • Libre d’utilisation sous licence MIT

1 commentaires

 
GN⁺ 2025-04-30
Avis sur Hacker News
  • Faire proposer une réponse à un problème par un modèle de chat IA, puis lui faire rédiger un rapport expliquant pourquoi cette réponse est correcte

    • Un deuxième modèle d’IA évalue ensuite ce rapport et rédige un rapport signalant les informations manquantes ou les incohérences logiques que le modèle initial n’a pas fournies
    • Le processus est répété jusqu’à ce que le deuxième modèle d’IA soit satisfait de l’explication du premier, ou que le premier modèle ait mis en œuvre toutes les modifications demandées
    • La méthode est un peu complexe, mais lorsqu’elle a été essayée, elle a donné de très bons résultats
  • En mode permanent et à plus grande échelle, envie d’essayer des débats de « sénat »

    • Au lieu de répondre à des problèmes individuels, fournir une liste de tâches et laisser le sénat les résoudre
    • Avec des points de vue variés et une analyse critique, cela pourrait produire des résultats impressionnants
    • Cela demande beaucoup de tokens, mais le coût par token baisse progressivement, donc cela semble envisageable
    • Il serait aussi possible de mettre en place un serveur IRC dédié à l’IA pour créer un espace de débat partagé où chacun pourrait connecter son propre modèle
  • Comme stratégie simple, demander à la fin d’un message : « réfléchissez une fois avec une balise de pensée, faites une autocritique une fois avec une balise critique, puis réfléchissez encore une fois avec une balise de pensée avant de répondre »

    • Ça fonctionne bien
    • Demander aussi d’identifier les 5 plus gros problèmes de la proposition est efficace
  • Ce n’est pas ce à quoi le titre faisait s’attendre

    • Définir les rôles d’assistant, de vérificateur croisé et de juge, puis faire avancer les questions et réponses selon chacun de ces rôles
    • Demander à ChatGPT : « expliquez si XYZ est vrai » et « expliquez si XYZ n’est pas vrai », puis retenir le côté le plus convaincant
  • En train de concevoir un éditeur de graphes dans le style des Blueprints d’Unreal Engine, pour faire travailler plusieurs agents à partir d’une entrée utilisateur

    • Les modèles Mistral small 3.1 et gemma 3 donnent l’impression d’être les premiers modèles localement exécutables à moitié compétents
    • Si on tente une exécution Python dans une boucle et qu’on lui dit d’explorer le monde, il commence à télécharger et lire des actualités, etc.
  • Curiosité de voir si une équipe d’agents IA pourrait faire tourner une équipe scrum et tenir des stand-up meetings toutes les quelques heures

    • Curiosité aussi de savoir si l’on finirait par reproduire une bureaucratie gouvernementale, avec des agents débattant de sujets toute la journée pour trouver le meilleur avis
  • Comme moyen de pousser un modèle de ML à produire de nouvelles idées, l’aborder en diagonale par rapport à des idées déjà essayées puis abandonnées, tout en maintenant certaines contraintes de cohérence

  • Si tous les GPU ne passent pas rapidement à une énergie verte, la planète va se réchauffer pendant que l’IA débattra avec elle-même pour trouver la solution optimale

  • Il y a des exemples avec CoRT et d’autres sans, et ceux sans CoRT sont nettement meilleurs

    • Choix d’exemples étrange
  • Cette approche fait penser aux créateurs YouTube

    • Écrire un script pour qu’un jeu fonctionne comme un circuit de course et atteigne un objectif, puis répéter jusqu’à trouver la solution la plus rapide
    • C’est ce qu’on appelle l’apprentissage automatique ou l’apprentissage par renforcement
    • Une compréhension naïve de l’IA qui, dans l’ensemble, se ressemble beaucoup