DeepSeek aurait utilisé des puces Nvidia interdites pour développer des modèles d’IA
(finance.yahoo.com)- La startup d’intelligence artificielle chinoise DeepSeek serait impliquée dans le développement d’un modèle d’IA de nouvelle génération à l’aide de puces Nvidia Blackwell, visées par l’interdiction d’exportation américaine.
- The Information rapporte que ces puces auraient été démontées dans des centres de données de pays tiers où leur vente est autorisée, puis introduites clandestinement en Chine.
- Les États-Unis interdisent l’exportation de semi-conducteurs avancés vers la Chine ; certains développeurs y auraient accès via des centres de données étrangers ou par des canaux de contournement.
- Nvidia a déclaré à ce sujet qu’« elle n’a pas confirmé de telles opérations » et a indiqué enquêter en cas de signalement.
- Ce cas montre la réalité d’une dynamique où, dans la rivalité technologique sino-américaine, les entreprises chinoises d’IA cherchent à se procurer des puces haute performance.
Suspicion de recours à des puces interdites chez DeepSeek
- DeepSeek est crédité par The Information d’avoir développé de nouveaux modèles d’IA avec les puces Nvidia Blackwell, soumises à une interdiction d’exportation américaine.
- Ces puces auraient été installées dans des centres de données de pays dont la vente est autorisée, puis démontées et acheminées vers la Chine.
- Elles auraient été importées après avoir passé les contrôles d’entreprises développant du matériel serveur.
- Les États-Unis interdisent l’exportation de semi-conducteurs avancés vers la Chine.
- De ce fait, des développeurs chinois se procureraient des puces via des centres de données à l’étranger ou des voies informelles.
Affaire liée aux restrictions à l’exportation américaines
- En novembre, le parquet américain a mis en examen deux Chinois et deux Américains.
- Ils sont accusés d’avoir créé une société immobilière fictive pour acheminer des puces vers la Chine via la Malaisie.
- Ces affaires sont évoquées comme des exemples d’opérations de contournement apparues après le renforcement du contrôle américain sur l’exportation de semi-conducteurs.
Position de Nvidia
- Nvidia a déclaré qu’elle n’avait reçu aucun signalement confirmé concernant de tels faits de contrebande.
- Son porte-parole a ajouté : « Si une telle contrebande était réelle, elle serait peu probable, mais nous enquêterions s’il y avait un signalement. »
Contexte de DeepSeek et développement de modèles d’IA
- DeepSeek a annoncé en janvier 2024 avoir développé un modèle d’IA à faible coût capable de rivaliser avec les meilleurs de la Silicon Valley.
- La société est soutenue par le fonds de couverture chinois High-Flyer, et aurait acquis 10 000 GPU Nvidia en 2021.
- Cela date d’avant les restrictions d’exportation américaine.
- En septembre 2024, elle a annoncé un nouveau modèle et a déclaré collaborer avec des fabricants de puces chinois.
Dernières mesures américaines et réaction chinoise
- Le président Donald Trump a autorisé au début de la semaine l’exportation vers la Chine du vieil accélérateur IA H200 de Nvidia.
- L’interdiction d’exportation sur les puces plus puissantes Blackwell reste toutefois en place.
- Le gouvernement chinois a appelé les entreprises technologiques nationales à accroître l’usage d’équipements locaux.
- DeepSeek s’inscrit également dans cette tendance en poursuivant sa coopération avec des fabricants chinois de puces.
1 commentaires
Commentaires sur Hacker News
Le fait que DeepSeek ait entraîné son modèle avec des puces Nvidia acquises avant l’interdiction américaine d’exporter des semi-conducteurs grand public était déjà connu
Certains pensent qu’ils ont aussi pu s’en procurer ensuite via des canaux non officiels
J’ai aussi lu ailleurs qu’ils auraient utilisé les données de sortie de ChatGPT, Claude et Gemini comme données d’entraînement
Dans un système où l’on recycle des données volées entre voleurs, un peu de contrebande n’a rien de surprenant
Même le président américain a reconnu que ces sanctions servent aussi au protectionnisme
Anthropic aussi a payé 1 milliard de dollars dans un accord lié à une violation du droit d’auteur, et au final tous ces modèles sont le produit d’un pillage à grande échelle de la propriété intellectuelle et des données personnelles de l’humanité
Je soutiens l’idée que les modèles open battent les modèles fermés
Cela dit, les CGU d’OpenAI interdisent de les utiliser pour entraîner un modèle concurrent, ce qui est ironique
Utiliser les sorties d’autres modèles pour l’entraînement, ça s’appelle la distillation de connaissances (distillation)
Les anciens modèles Grok commençaient parfois leurs réponses par « as a model trained by OpenAI… »
Le documentaire de GamersNexus explique très bien le fonctionnement du marché noir des GPU IA de NVIDIA
Il montre comment des entreprises comme DeepSeek obtiennent des puces en contournant l’interdiction d’exportation américaine
L’acheteur final avait un compte australien, mais l’adresse de livraison était une maison ordinaire dans le Delaware, aux États-Unis, et le nom était différent
Apparemment, dans ce genre de cas, des étudiants chinois à l’étranger ou des expatriés achètent des GPU pour les revendre
Ma 4090 finira sans doute elle aussi transformée en GPU Frankenstein modifié au niveau de la VRAM quelque part en Chine
Une fois la frontière franchie, le GPU est déjà en Chine
Ce n’est de la « contrebande » qu’au moment de l’entrée sur le territoire, et une fois en Chine, ce n’est plus illégal
Il est donc naturel que DeepSeek utilise ce type de GPU
Les sanctions ne font qu’augmenter un peu les coûts, elles ne rendent pas les choses impossibles
Que ce soit pour les composants électroniques, le pétrole ou même l’accès à ChatGPT, avec assez d’argent on finit toujours par y arriver
En revanche, ce type de biens sanctionnés pourrait aussi être instrumentalisé comme outil de propagande
Par exemple, imaginons qu’installer un pilote Nvidia oblige à répondre à une question sur les événements de Tian’anmen
Transporter un camion rempli de GPU est infiniment plus facile que transporter de la drogue
C’est surtout interdit sur les plateformes publiques
Du coup, je doute de l’efficacité réelle d’une telle stratégie de propagande
Même si l’on n’arrête pas totalement la flotte clandestine qui transporte le pétrole russe, le simple climat de peur peut déjà réduire les profits
Bloomberg parle de « puces interdites en Chine », mais
une interdiction d’exportation américaine n’est pas la même chose qu’une interdiction en Chine
Article lié (Al Jazeera)
On l’a vu par exemple avec les exploitants de sites torrent ou les personnes liées à WikiLeaks, que Washington a tenté de faire arrêter et extrader à l’étranger
Ils ont même déjà justifié l’enlèvement et la torture de ressortissants étrangers au motif qu’il s’agissait de « combattants ennemis »
Je pense que le monde se porterait mieux si les États-Unis ne passaient pas leur temps à contenir les autres pays
Toutes les grandes puissances ont l’instinct de protéger leur rang
Les sanctions américaines ne sont donc pas seulement du protectionnisme, mais aussi une réponse à une concurrence déloyale
Je trouve étrange qu’on ne parle pas du tout ici de l’accessibilité du cloud
Il était possible de louer des H100 sur des serveurs américains sans véritable contrainte
Il est difficile pour un utilisateur ordinaire d’obtenir une infrastructure à ce niveau
Il n’y aurait peut-être même pas besoin de redémarrage
Rien de tout cela n’est vraiment surprenant, et j’ai l’impression que rien ne se passera
Quand le lieu de fabrication se trouve dans un pays voisin, il y a toujours un moyen de se procurer les puces
À moins d’interdire totalement les ventes internationales de Nvidia, ces sanctions restent peu efficaces
Et imaginer un système de licence d’État pour l’achat de GPU n’est pas réaliste
L’image donnée par GamersNexus d’une attitude consistant à « fermer un œil et garder l’autre ouvert » est juste
La Chine a demandé l’arrêt de l’usage des puces Nvidia, mais en pratique cela ressemble surtout à un signal pour encourager l’autonomie
Les sanctions américaines aussi sont des politiques vouées à l’échec, un peu comme la guerre contre la drogue
À condition, bien sûr, qu’il s’agisse bien d’adhésion volontaire et non de contrainte
Si les puces utilisées cette fois-ci ont été achetées légalement avant l’interdiction,
toute cette polémique n’a peut-être en réalité aucun sens
Il circulait des rumeurs selon lesquelles DeepSeek avait contourné les sanctions et réduit ses coûts en bootstrapant les paramètres d’autres modèles
Cet article semble aller dans le sens de cette rumeur
Je pense qu’il est en pratique difficile d’empêcher les échanges entre deux pays
Les GPU sont des biens à faible volume de circulation qu’on ne peut pas suivre par satellite,
ce qui les distingue de produits comme le pétrole, dont l’infrastructure est visible