Résumé du keynote de la conférence Alibaba Cloud Qwen 2026 à Singapour

(youtube.com)

4 points par ragingwind 2026-05-27 | 8 commentaires | Partager sur WhatsApp

Le keynote de la conférence Qwen, organisée pour la première fois à Singapour, a marqué la formalisation par Alibaba Cloud de sa transition vers « l’ère de l’IA agentique ». Des représentants du gouvernement de Singapour, de la direction d’Alibaba Cloud et de partenaires comme Nous Research, Fireworks AI, NVIDIA et PicsArt sont montés sur scène pour annoncer des évolutions couvrant les modèles, l’infrastructure, les outils et l’ensemble de l’écosystème. Le message central était la volonté de construire une infrastructure full stack capable de transformer « les tokens en intelligence, l’intelligence en action, et l’action en valeur métier ».

Points clés des annonces

Partenariat avec le gouvernement de Singapour : le ministre d’État Desmond Tan a annoncé un plan de coopération avec Alibaba Cloud, NTUC et ST Telemedia Global Data Centres pour proposer une formation pratique en IA générative et agentique à plus de 1 000 entreprises, développeurs et étudiants locaux. Il a insisté sur le principe selon lequel « l’IA ne remplace pas les travailleurs, elle travaille pour eux ».
Présentation de Qwen 3.7 Max : un nouveau foundation model a été dévoilé, avec de fortes améliorations en codage, utilisation d’outils (prise en charge native du protocole MCP), multimodalité et exécution de tâches de longue durée (long-horizon). Alibaba affirme qu’il a atteint des performances de tout premier plan sur des benchmarks majeurs comme SWE-Bench, IFBench et HLE.
Annonce de Qwen Cloud : lancement de qwencloud.com, une gateway dédiée aux agents. Le service propose plus de 200 modèles, une tarification par tokens (de 30 dollars par mois pour l’offre Standard jusqu’au plan Max) et des fonctions d’automatisation de workflows basées sur Skills et CLI.
Coder et Muron : présentation de Coder, un outil de vibe coding à installer sur ordinateur portable, ainsi que de Muron, un agent multi-domaines fonctionnant 24h/24 dans le cloud. Muron est déjà utilisé dans 43 pays, et Alibaba a également révélé avoir construit en interne Coder Works en seulement 5 personnes et 7 jours.
Infrastructure cloud agentique : présentation d’un sandbox basé sur MicroVM (démarrage en millisecondes, prise en charge de 10 000 sessions simultanées par tenant), ainsi que d’une stack full stack couvrant l’ID des agents, la gouvernance, la sécurité, la mémoire et le data plane. MiniMax affirme y avoir obtenu un démarrage de conteneur en 20 à 40 ms et une réduction du TCO de 40 %.

Différenciateurs techniques

Intégration full stack : Alibaba met en avant le fait d’être l’un des deux seuls hyperscalers à posséder en interne toutes les couches, du silicium (PPU maison, CIPU de 5e génération) jusqu’aux foundation models.
Cloud nativement pensé pour les agents : au lieu d’une architecture SaaS centrée sur les usages humains, l’entreprise redessine l’ensemble du control plane autour d’API et d’infrastructures directement appelées et utilisées par des agents.
Écosystème ouvert : Alibaba a rejoint la fondation PyTorch comme membre Platinum et cherche à devenir un hub multi-modèles en hébergeant aussi dans son Model Studio des modèles concurrents comme Kimi, Zhipu, MiniMax, StepFun et Vidu.

Points mis en avant comme atouts

Efficacité des coûts : les plans par tokens offrent une meilleure visibilité sur les coûts et un meilleur contrôle budgétaire, tandis que la sélection automatique des modèles dans Coder permettrait de réduire les coûts en tokens jusqu’à 70 %.
Capacité d’exécution prolongée : selon Alibaba, Qwen 3.7 Max a montré des cas d’usage avec 35 heures d’exécution continue, plus de 1 000 appels d’outils et une vitesse moyenne multipliée par 10.
Confiance et sécurité : l’entreprise a souligné son inscription comme seul fournisseur d’Asie-Pacifique dans le Magic Quadrant 2025 de Gartner pour la gestion des accès, ainsi que des protections d’exécution comme un pare-feu pour agents et Agent ID Guard.

Limites et défis soulevés

Difficulté à établir la confiance : Tommy Eastman de Nous Research a indiqué qu’exécuter la même tâche de manière reproductible reste un défi majeur, et qu’une approche en trois étapes est nécessaire : qualité des modèles, human-in-the-loop et gouvernance entre agents.
Goulot d’étranglement mémoire : Fireworks AI estime que le principal goulot d’étranglement de l’inférence n’est pas le calcul, mais la mémoire du cache KV, ce qui impose un stockage multi-niveaux et une refonte systémique.
Retour en grâce du CPU : NVIDIA a souligné qu’en raison de la nature sérielle des appels d’outils des agents, la demande pour de nouveaux CPU à forte performance mono-thread allait exploser, remettant en cause les hypothèses classiques de conception des CPU cloud.

Exemples dans l’écosystème

PicsArt : avec une base de 130 millions d’utilisateurs, l’entreprise a intégré les modèles Qwen Image, Wan et Happy Horse pour démontrer des workflows agentiques comme le casting de personas et la production de publicités vidéo. Elle affirme que l’adoption de Happy Horse a entraîné une hausse de 72 % du volume de génération vidéo.
Hackathon mondial : Alibaba a simultanément annoncé le Qwen Cloud Global Hackathon, doté de 70 000 dollars de prix, et les Happy Horse Awards 2026 afin d’attirer développeurs et créateurs.

Comparaison avec les conférences de Google

Le Google Cloud Next 2025 d’avril et Google I/O 2025 de mai, organisés un mois plus tôt, pointaient en pratique dans la même direction, mais avec des armes différentes.

Line-up des annonces de Google : Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), protocole Agent2Agent (A2A), TPU Ironwood de 7e génération, lunettes Android XR et Veo 3, avec des annonces couvrant recherche, devices et infrastructure.
Indicateurs d’usage de Google : AI Mode aurait atteint 150 millions d’utilisateurs dans 200 pays, l’application Gemini 400 millions d’utilisateurs mensuels, et le volume de traitement de tokens serait passé de 9,7 billions à 480 billions en un an, soit une multiplication par 50.
Différence de stratégie : là où Alibaba combine intégration verticale full stack et stratégie de hub ouverte fondée sur l’open source (plus de 450 modèles, 2 milliards de téléchargements cumulés) et l’accueil de modèles concurrents, Google répond avec une puissance inégalée côté points de contact utilisateur, ses propres TPU et une avance dans la standardisation avec A2A.
Faiblesses respectives : Google garde son produit phare Gemini fermé et une grande partie de ses annonces reste au stade du coming soon, tandis qu’Alibaba doit composer avec son accessibilité limitée sur les marchés américain et européen, ainsi qu’avec les enjeux de fiabilité et de goulot d’étranglement mémoire évoqués pendant les panels.
Avantages à court terme : à court terme, Google semble avantagé par son échelle utilisateur et ses form factors, tandis qu’Alibaba mise sur le coût de l’infrastructure et les marchés hors États-Unis

Alibaba Cloud estime qu’il lui sera difficile de prendre l’avantage à l’ère des agents sur la seule base de la compétitivité de ses modèles. L’entreprise pousse donc à la fois une intégration verticale, du silicium aux modèles, à l’infrastructure, aux outils et à l’écosystème, et une expansion horizontale en embarquant PyTorch ainsi que des éditeurs de modèles concurrents. Mais comme les débats de panel ont rappelé de façon répétée les défis fondamentaux autour de la fiabilité, des goulots d’étranglement mémoire et de la refonte de l’architecture CPU, il reste à prouver que le cloud agentique tiendra réellement ses promesses de performance et d’efficacité économique sur des workloads d’entreprise. L’événement a clairement montré la volonté d’utiliser Singapour comme hub international pour intensifier la concurrence avec les hyperscalers américains.

8 commentaires

moderator 2026-05-27

J’ai corrigé le contenu. Merci de le relire avant la publication de l’article.

emptybynature 2026-05-27

Je l’implémente avec deepseek v4 pro, je fais la revue de code avec qwen 3.7 max et l’orchestration avec gpt 5.5, et la qualité du code est étonnamment bonne. L’époque du vrai codage humain est vraiment en train de s’achever...

ligion 2026-05-28

Pourriez-vous me dire comment vous avez configuré l’environnement ?

recast7838 2026-05-28

DeepSeek est performant ? Il faisait sans arrêt n'importe quoi, donc j'avais arrêté de l'utiliser.

yupkidangju 2026-05-27

Même si l’IA rédige automatiquement, la leçon à retenir de cet article est qu’une vérification humaine reste indispensable.

jhk0530 2026-05-27

Ce n’est pas plutôt qwen que quen ? On dirait que l’IA a mal transcrit.

dydwls140 2026-05-27

Bien vu, moi j’ai lu qwen haha

tsboard 2026-05-27

C’est ça, moi aussi en lisant je me demandais : c’est quoi, Quen ??

Résumé du keynote de la conférence Alibaba Cloud Qwen 2026 à Singapour

À lire aussi

8 commentaires