Le chinois DeepSeek baisse durablement de 75 % le prix de l’API V4-Pro
(digitaltrends.com)La startup chinoise d’IA DeepSeek annonce une baisse permanente de 75 % du prix d’utilisation de son modèle d’IA phare, « V4-Pro », laissant entrevoir une guerre mondiale des prix de l’IA et des changements sur le marché.
Traduction intégrale
La startup chinoise d’IA DeepSeek a pris la décision tarifaire la plus audacieuse à ce jour dans la compétition autour de l’intelligence artificielle. L’entreprise a annoncé une baisse permanente de 75 % {p:75} du coût d’utilisation de son modèle d’IA phare, « V4-Pro », si bien que les développeurs ne paient plus qu’une infime fraction de ce qu’ils déboursaient encore il y a seulement quelques semaines. Les entreprises d’IA du monde entier font face à deux grands problèmes : des coûts d’infrastructure élevés et un accès limité aux puces d’IA avancées. Lorsqu’une entreprise procède à une baisse de prix aussi agressive et permanente, cela laisse généralement penser qu’un changement important est en train de se produire en coulisses.
DeepSeek a indiqué que l’ancien coût d’utilisation de V4-Pro, qui allait de 0,1 à 24 yuans par million de tokens selon le type de tâche {b:10,240}, a désormais été fortement réduit pour se situer entre 0,025 et 6 yuans selon la charge de travail {b:2,60}. Pour les développeurs qui créent des applications, des agents et des services d’IA, cette baisse des coûts peut réduire considérablement les dépenses d’exploitation.
Le possible début de l’influence des puces d’IA de Huawei
DeepSeek n’a pas expliqué directement ce qui a rendu possible cette réduction de prix spectaculaire, mais l’attention du secteur s’est immédiatement portée sur Huawei et ses puces d’IA Ascend. L’entreprise avait auparavant reconnu qu’un accès limité aux capacités de calcul avancées avait contraint V4-Pro à être tarifé bien plus cher que le modèle Flash, moins coûteux. Lors de son lancement, le coût d’accès au modèle Pro aurait été jusqu’à 12 fois plus élevé {b:120,10} en raison des contraintes liées au matériel d’IA de pointe.
Il semble désormais que ces restrictions commencent enfin à s’atténuer. Depuis que les restrictions américaines à l’exportation empêchent des entreprises comme NVIDIA de vendre en Chine leur matériel d’IA le plus avancé, la puce Ascend 950 de Huawei devient de plus en plus importante pour les entreprises chinoises de l’IA.
Vers une intensification de la guerre des prix dans l’IA
L’enseignement plus large à tirer ici est simple : les modèles d’IA deviennent rapidement moins chers. Si les entreprises chinoises parviennent à réduire drastiquement les coûts d’inférence tout en continuant à faire progresser les performances de l’IA, la concurrence mondiale sur les prix de l’IA pourrait devenir bien plus agressive au cours de l’année à venir. Cela mettrait la pression non seulement sur les startups chinoises concurrentes, mais aussi sur les grands fournisseurs occidentaux d’IA, qui facturent beaucoup plus cher leurs modèles premium.
Bien sûr, l’approvisionnement en matériel reste une grande inconnue. Huawei est toujours confronté à des goulets d’étranglement de production en raison des restrictions sur les équipements avancés de fabrication de puces. Mais si la baisse de prix de DeepSeek est un premier signal d’une amélioration de l’infrastructure IA en Chine, cela pourrait marquer le début d’un changement bien plus important sur le marché mondial de l’IA.
2 commentaires
J’ai entendu dire que, dans certaines startups, certains outils sont remplacés par DeepSeek ; c’est incroyablement moins cher.
Pour un usage professionnel, des questions de performance du modèle ou de sécurité pourraient se poser, mais avec un tel rapport qualité-prix, cela semble intéressant pour des projets personnels.