- CoRT est un algorithme qui permet à un modèle d’IA de réexaminer de manière itérative ses propres réponses et de générer des alternatives afin de sélectionner la meilleure réponse
- Lorsqu’il est appliqué au modèle Mistral 3.1 24B, les performances s’améliorent fortement, en particulier pour les tâches de programmation
- L’IA génère une réponse initiale, puis évalue des alternatives sur plusieurs « tours de réflexion » afin de choisir la réponse finale
- Ce processus inclut l’auto-évaluation, la génération d’alternatives concurrentes, l’amélioration itérative et une profondeur de réflexion dynamique
- CoRT est proposé sous licence MIT et les contributions pour l’améliorer sont les bienvenues
CoRT (Chain of Recursive Thoughts) 🧠🔄
Résumé
- Présentation de CoRT, un algorithme qui permet à une IA de débattre avec elle-même pour trouver de meilleures réponses
- Le modèle d’IA réexamine ses réponses de manière itérative et génère des alternatives afin de sélectionner la meilleure réponse
- Lorsqu’il est appliqué au modèle Mistral 3.1 24B, les performances s’améliorent fortement, en particulier pour les tâches de programmation
Fonctionnement de CoRT
- L’IA génère une réponse initiale
- L’IA détermine le nombre de « tours de réflexion » nécessaires
- À chaque tour :
- Génération de 3 réponses alternatives
- Évaluation de toutes les réponses
- Sélection de la meilleure réponse
- La réponse finale devient la survivante de cette battle royale entre IA
L’ingrédient secret
- Auto-évaluation
- Génération d’alternatives concurrentes
- Amélioration itérative
- Profondeur de réflexion dynamique
Contribution
- Si vous avez trouvé un moyen de l’améliorer, les PR sont les bienvenues
Licence
- Libre d’utilisation sous licence MIT
1 commentaires
Avis sur Hacker News
Faire proposer une réponse à un problème par un modèle de chat IA, puis lui faire rédiger un rapport expliquant pourquoi cette réponse est correcte
En mode permanent et à plus grande échelle, envie d’essayer des débats de « sénat »
Comme stratégie simple, demander à la fin d’un message : « réfléchissez une fois avec une balise de pensée, faites une autocritique une fois avec une balise critique, puis réfléchissez encore une fois avec une balise de pensée avant de répondre »
Ce n’est pas ce à quoi le titre faisait s’attendre
En train de concevoir un éditeur de graphes dans le style des Blueprints d’Unreal Engine, pour faire travailler plusieurs agents à partir d’une entrée utilisateur
Curiosité de voir si une équipe d’agents IA pourrait faire tourner une équipe scrum et tenir des stand-up meetings toutes les quelques heures
Comme moyen de pousser un modèle de ML à produire de nouvelles idées, l’aborder en diagonale par rapport à des idées déjà essayées puis abandonnées, tout en maintenant certaines contraintes de cohérence
Si tous les GPU ne passent pas rapidement à une énergie verte, la planète va se réchauffer pendant que l’IA débattra avec elle-même pour trouver la solution optimale
Il y a des exemples avec CoRT et d’autres sans, et ceux sans CoRT sont nettement meilleurs
Cette approche fait penser aux créateurs YouTube