- Successeur de Qwen3.6-Plus, avec des améliorations par rapport à la version précédente en codage agentique, ainsi qu’en connaissance du monde et en suivi des instructions
- Le modèle obtient les meilleurs scores sur 6 benchmarks majeurs de codage, confirmant une forte progression des performances des agents de codage
- Prend en charge la fonctionnalité preserve_thinking, qui permet de conserver dans les messages le processus de réflexion des tours précédents lors des tâches agentiques
- Sur les benchmarks de connaissance du monde, amélioration de SuperGPQA de +2.3 et de QwenChineseBench de +5.3 ; pour le suivi des instructions, score de +2.8 sur ToolcallFormatIFBench
- Des tests interactifs sont possibles dans Qwen Studio, et l’appel via l’API Alibaba Cloud Model Studio sera effectué avec
qwen3.6-max-preview
Principales améliorations
- Capacités de codage agentique fortement améliorées par rapport à Qwen3.6-Plus : SkillsBench +9.9, SciCode +6.3, NL2Repo +5.0, Terminal-Bench 2.0 +3.8
- Renforcement de la connaissance du monde (world knowledge) : SuperGPQA +2.3, QwenChineseBench +5.3
- Amélioration du suivi des instructions (instruction following) : ToolcallFormatIFBench +2.8
- Meilleurs scores atteints sur 6 benchmarks majeurs de codage : SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode
Caractéristiques du modèle et approche
- Modèle propriétaire hébergé fourni via Alibaba Cloud Model Studio
- Amélioration des performances des agents réels (real-world agent) et de la fiabilité des connaissances (knowledge reliability)
- Test interactif immédiat possible dans Qwen Studio
- Le nom du modèle dans l’API est
qwen3.6-max-preview, et il sera bientôt disponible dans l’API Alibaba Cloud Model Studio
Utilisation de l’API et fonctionnalités
- Prise en charge des protocoles standard de l’industrie comme les API OpenAI-compatibles chat completions et responses, ainsi que les interfaces compatibles Anthropic
- La fonctionnalité
preserve_thinkingpermet de conserver le processus de raisonnement (reasoning content) des tours précédents, recommandé pour les tâches agentiques - Avec le paramètre
enable_thinking: True, il est possible de recevoir séparément, en streaming, le contenu de raisonnement et la réponse - URL de base de l’API disponibles par région : Pékin, Singapour, États-Unis (Virginie)
État du développement
- Actuellement au stade de preview release, avec des améliorations itératives en cours et d’autres optimisations prévues dans les versions suivantes
Aucun commentaire pour le moment.