4 points par xguru 2024-08-11 | 1 commentaires | Partager sur WhatsApp
  • Qwen2-Math, construit sur la base du LLM Qwen2, surpasse largement les capacités en mathématiques des modèles open source et des modèles fermés (par ex. GPT-4o)
    • Une série de grands modèles de langage spécialisés en mathématiques, comprenant Qwen2-Math ainsi que Qwen2-Math-Instruct-1.5B/7B/72B
  • Le plus grand modèle, Qwen2-Math-72B-Instruct, dépasserait des modèles récents comme GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro et Llama-3.1-405B
  • Les modèles ne prennent actuellement en charge que l’anglais. Un modèle mathématique bilingue (anglais et chinois) devrait être lancé prochainement