2 points par GN⁺ 9 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Successeur de Qwen3.6-Plus, avec des améliorations par rapport à la version précédente en codage agentique, ainsi qu’en connaissance du monde et en suivi des instructions
  • Le modèle obtient les meilleurs scores sur 6 benchmarks majeurs de codage, confirmant une forte progression des performances des agents de codage
  • Prend en charge la fonctionnalité preserve_thinking, qui permet de conserver dans les messages le processus de réflexion des tours précédents lors des tâches agentiques
  • Sur les benchmarks de connaissance du monde, amélioration de SuperGPQA de +2.3 et de QwenChineseBench de +5.3 ; pour le suivi des instructions, score de +2.8 sur ToolcallFormatIFBench
  • Des tests interactifs sont possibles dans Qwen Studio, et l’appel via l’API Alibaba Cloud Model Studio sera effectué avec qwen3.6-max-preview

Principales améliorations

  • Capacités de codage agentique fortement améliorées par rapport à Qwen3.6-Plus : SkillsBench +9.9, SciCode +6.3, NL2Repo +5.0, Terminal-Bench 2.0 +3.8
  • Renforcement de la connaissance du monde (world knowledge) : SuperGPQA +2.3, QwenChineseBench +5.3
  • Amélioration du suivi des instructions (instruction following) : ToolcallFormatIFBench +2.8
  • Meilleurs scores atteints sur 6 benchmarks majeurs de codage : SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode

Caractéristiques du modèle et approche

  • Modèle propriétaire hébergé fourni via Alibaba Cloud Model Studio
  • Amélioration des performances des agents réels (real-world agent) et de la fiabilité des connaissances (knowledge reliability)
  • Test interactif immédiat possible dans Qwen Studio
  • Le nom du modèle dans l’API est qwen3.6-max-preview, et il sera bientôt disponible dans l’API Alibaba Cloud Model Studio

Utilisation de l’API et fonctionnalités

  • Prise en charge des protocoles standard de l’industrie comme les API OpenAI-compatibles chat completions et responses, ainsi que les interfaces compatibles Anthropic
  • La fonctionnalité preserve_thinking permet de conserver le processus de raisonnement (reasoning content) des tours précédents, recommandé pour les tâches agentiques
  • Avec le paramètre enable_thinking: True, il est possible de recevoir séparément, en streaming, le contenu de raisonnement et la réponse
  • URL de base de l’API disponibles par région : Pékin, Singapour, États-Unis (Virginie)

État du développement

  • Actuellement au stade de preview release, avec des améliorations itératives en cours et d’autres optimisations prévues dans les versions suivantes

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.