Cursor AI dévoile le modèle Composer 1.5
(cursor.com)Il y a quelques mois, nous avons lancé Composer 1, notre premier modèle de codage basé sur des agents. Depuis, nous avons apporté des améliorations significatives à ses capacités de programmation.
Le nouveau Composer 1.5 offre un excellent équilibre entre rapidité et intelligence pour un usage quotidien. Composer 1.5 a été construit en étendant par 20 l’apprentissage par renforcement sur le même modèle préentraîné. Les ressources de calcul consacrées au post-entraînement de Composer 1.5 dépassent largement celles utilisées pour le préentraînement du modèle de base.
À mesure que l’échelle augmente, les capacités de codage continuent de progresser. D’après des mesures de benchmark internes basées sur de vrais problèmes de programmation, ce modèle a rapidement dépassé Composer 1 et ses performances continuent d’augmenter. Les gains sont particulièrement marqués sur les tâches les plus difficiles.
Composer 1.5 est un modèle de raisonnement. Lorsqu’il répond à une requête, le modèle génère des jetons de raisonnement afin d’inférer le codebase de l’utilisateur et de planifier les étapes suivantes. Nous avons constaté que ces étapes de réflexion sont essentielles à l’intelligence du modèle. En même temps, nous voulions préserver la rapidité et l’interactivité de Composer 1.5 pour un usage quotidien. Pour trouver cet équilibre, le modèle a été entraîné à répondre rapidement avec un minimum de réflexion sur les problèmes simples, et à poursuivre son raisonnement sur les problèmes difficiles jusqu’à trouver une réponse satisfaisante.
Pour gérer les tâches de longue durée, Composer 1.5 dispose d’une fonction d’auto-résumé. Cela permet au modèle de continuer à explorer des solutions même lorsque le contexte disponible est épuisé. Nous avons entraîné Composer 1.5 à produire ses propres résumés dans le cadre de l’apprentissage par renforcement (RL), en lui demandant de générer des résumés utiles lorsque le contexte se vide pendant l’entraînement. Sur les exemples difficiles, ce processus peut se produire plusieurs fois de manière récursive. Grâce à l’auto-résumé, nous avons confirmé que le modèle peut conserver sa précision initiale même lorsque la longueur du contexte varie.
Composer 1.5 est un modèle bien plus puissant que Composer 1, et nous le recommandons pour un usage conversationnel. Le processus d’entraînement de ce modèle montre que le RL appliqué au codage peut continuer à monter en puissance avec des gains d’intelligence prévisibles.
Les prix sont disponibles ici -> https://cursor.com/docs/models
Aucun commentaire pour le moment.