- Qwen2-Math, construit sur la base du LLM Qwen2, surpasse largement les capacités en mathématiques des modèles open source et des modèles fermés (par ex. GPT-4o)
- Une série de grands modèles de langage spécialisés en mathématiques, comprenant Qwen2-Math ainsi que Qwen2-Math-Instruct-1.5B/7B/72B
- Le plus grand modèle, Qwen2-Math-72B-Instruct, dépasserait des modèles récents comme GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro et Llama-3.1-405B
- Les modèles ne prennent actuellement en charge que l’anglais. Un modèle mathématique bilingue (anglais et chinois) devrait être lancé prochainement
1 commentaires
Alibaba, présentation du modèle Qwen 2
Qwen1.5-110B : le premier modèle 100B+ de la série open source LLM Qwen1.5 d'Alibaba
Alibaba, présentation du modèle d'IA open source QWEN