- Modèles dérivés de Qwen2.5-32B-Instruct (modèle de raisonnement), spécialisés dans le raisonnement pour la résolution de problèmes en mathématiques, en code et en sciences
- Utilisables à des fins de recherche commerciales et non commerciales
- Prennent en charge une longueur de contexte de 64 000 tokens et sont proposés en tailles 1.5B, 7B, 14B et 32B
- Ont enregistré des performances de raisonnement de tout premier plan dans leur catégorie sur divers benchmarks comme LiveCodeBench, GPQA et MMLU-PRO
- En raisonnement combiné multi-agents (GenSelect), obtiennent des performances encore supérieures à celles d’un modèle unique existant sur les benchmarks de mathématiques, de code et de sciences
- GenSelect : exécute en parallèle le raisonnement de plusieurs modèles, puis sélectionne la meilleure solution
Aucun commentaire pour le moment.