1.5B

xguru · 2025-07-21T10:21:02+09:00

Modèles dérivés de Qwen2.5-32B-Instruct (modèle de raisonnement), spécialisés dans le raisonnement pour la résolution de problèmes en mathématiques, en code et en sciences Utilisables à des fins de recherche commerciales et non commerciales Prennent en charge une longueur de contexte de 64 000 tokens et sont proposés en tailles 1.5B, 7B, 14B et 32B Ont enregistré des performances de raisonnement de tout premier plan dans leur catégorie sur divers benchmarks comme LiveCodeBench, GPQA et MMLU-PRO En raisonnement combiné multi-agents (GenSelect), obtiennent des performances encore supérieures à celles d’un modèle unique existant sur les benchmarks de mathématiques, de code et de sciences GenSelect : exécute en parallèle le raisonnement de plusieurs modèles, puis sélectionne la meilleure solution

(huggingface.co)

8 points par xguru 2025-07-21 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Modèles dérivés de Qwen2.5-32B-Instruct (modèle de raisonnement), spécialisés dans le raisonnement pour la résolution de problèmes en mathématiques, en code et en sciences
Utilisables à des fins de recherche commerciales et non commerciales
Prennent en charge une longueur de contexte de 64 000 tokens et sont proposés en tailles 1.5B, 7B, 14B et 32B
Ont enregistré des performances de raisonnement de tout premier plan dans leur catégorie sur divers benchmarks comme LiveCodeBench, GPQA et MMLU-PRO
En raisonnement combiné multi-agents (GenSelect), obtiennent des performances encore supérieures à celles d’un modèle unique existant sur les benchmarks de mathématiques, de code et de sciences
- GenSelect : exécute en parallèle le raisonnement de plusieurs modèles, puis sélectionne la meilleure solution

NVIDIA dévoile les modèles OpenReasoning-Nemotron 32B/14B/7B/1.5B

À lire aussi

Aucun commentaire pour le moment.