2 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • NVIDIA fait sa première entrée sur le marché des puces PC grand public avec le superchip RTX Spark, qui combine jusqu’à un GPU Blackwell RTX de 6 144 cœurs et un CPU Grace à 20 cœurs basé sur Arm
  • Prévu pour équiper à l’automne des ноутebooks Windows et des mini-desktops, il vise à réunir création, développement IA et gaming sur une même machine, tout en étant la puce RTX la plus économe en énergie à ce jour avec une autonomie sur toute la journée et des châssis ultra-fins
  • La stack CUDA s’exécute nativement, permettant sur un même appareil le développement de modèles, le prototypage, le fine-tuning et l’inférence
  • Avec jusqu’à 128 Go de mémoire unifiée, il peut faire tourner localement un LLM de 12 milliards de paramètres et a été conçu avant tout pour exécuter des agents IA fonctionnant en arrière-plan
  • Les PC RTX Spark ciblent les tâches d’agents, la création et le jeu, avec des lancements prévus chez ASUS, Dell, HP, Lenovo, Microsoft, MSI et d’autres

NVIDIA RTX Spark Superchip

  • Fusionne l’IA NVIDIA et les graphismes RTX dans une seule puce
  • Apporte création, développement IA et gaming aux laptops RTX fins et aux desktops compacts ultra-efficaces
  • Spécifications clés

    • Jusqu’à 6 144 cœurs GPU Blackwell RTX
    • Jusqu’à 20 cœurs CPU ultra-efficaces
    • Jusqu’à 1 pétaflop FP4 IA de performances
    • Jusqu’à 128 Go de mémoire unifiée
  • Principales caractéristiques

    • CUDA s’exécute nativement pour les agents et les workloads IA
    • La puce RTX la plus économe en énergie à ce jour, avec une autonomie sur toute la journée et des châssis ultra-fins
    • Des centaines d’apps de création et d’outils IA accélérés par RTX et NVIDIA Studio
    • Support du ray tracing, de toute la gamme DLSS, de NVIDIA Reflex et du gaming G-SYNC
  • Agents IA

    • Des agents capables d’exécuter des tâches, de générer des assets et d’écrire du code à la demande fonctionnent aux côtés de l’utilisateur
    • L’utilisateur fixe des objectifs et le PC devient un coéquipier qui traite le travail
  • Usages par profil

    • Creators: FP4 Tensor Cores et mémoire unifiée, rendu 3D temps réel avec RT Cores et DLSS, encodage/décodage matériel 4:2:2, encodeur AV1 et NVIDIA Broadcast
    • Developers: développement et prototypage avec la même stack NVIDIA CUDA, fine-tuning et inférence en local avec jusqu’à 128 Go
    • Gamers: éclairage en ray tracing, gamme complète DLSS, NVIDIA Reflex
  • Produits équipés

    • Laptops: ASUS ProArt P16, Dell XPS 16, HP OmniBook X 14, Lenovo Yoga Pro 9n, Microsoft Surface Laptop Ultra, MSI Prestige N16 Flip AI+
    • Desktops: Acer, Asus, Dell, Gigabyte, HP, Lenovo, MSI — agent IA personnel 24/7

Article lié #1 Nvidia debuts RTX Spark processor for Windows laptops, taking aim at Intel, AMD

  • L’article adopte l’angle attaque frontale contre Intel et AMD : le jour de l’annonce, Intel a perdu 6 % et AMD 5 %, tandis que NVIDIA gagnait 4 % et Microsoft 3 %
  • Composition de la puce et lancement
    • Combinaison GPU Blackwell + CPU Grace, lancement prévu cet automne
    • ASUS, Dell, HP, Microsoft et d’autres sont explicitement cités parmi les constructeurs
    • Une version mini-desktop est également proposée, visant les utilisateurs d’agents IA, les créateurs et les gamers
  • Mémoire et prix
    • Les 128 Go sont inhabituels face aux 16 Go d’un laptop classique, et un MacBook Pro haut de gamme à configuration comparable atteint 5 099 $
    • Prix non communiqué ; la première gamme vise le premium, avec aussi des versions inférieures à plus faible capacité mémoire prévues
  • Compatibilité et gaming
    • L’architecture Grace basée sur Arm impose une collaboration avec Microsoft et les développeurs pour faire tourner la plupart des logiciels x86
    • Les processeurs Arm de Qualcomm alimentent déjà des laptops Windows, mais le gaming sur Arm présente des difficultés potentielles
    • Collaboration avec l’ensemble des grands studios de jeu pour le support et le fonctionnement des anti-cheat, avec prise en charge de DLSS
    • Aucun benchmark publié ; le GPU Blackwell est évoqué comme étant du niveau d’un GPU laptop RTX 5070
  • Design et approvisionnement
    • Épaisseur d’environ 14 mm, webcam HD, et promesse implicite d’une autonomie sur toute la journée
    • Malgré la pénurie mondiale de mémoire, aucune limitation d’approvisionnement n’est attendue
  • Vera CPU, annoncé en parallèle
    • Le CPU Vera pour datacenter entre en pleine production, avec des serveurs en rack dédiés Vera attendus à l’automne
    • Anthropic, OpenAI, SpaceXAI, ByteDance, CoreWeave, Oracle Cloud Infrastructure envisagent son adoption

Article lié #2 Nvidia Challenges Apple Silicon With New RTX Spark PC Chip

  • Le cadrage est celui d’une première entrée de NVIDIA sur le marché des puces PC grand public, lancée comme un défi à Apple
  • NVIDIA la présente comme sa « puce PC la plus efficace », en confrontation directe avec l’Apple M5
  • Identité de la puce
    • Comme les puces Apple, elle est basée sur Arm et combine GPU Blackwell RTX + CPU Grace
    • Il s’agit en pratique de la même configuration que la puce GB10 du DGX Spark lancé l’an dernier
  • Performances mises en avant par NVIDIA
    • Rendu de scènes 3D géantes de 90 Go avec OptiX et DLSS
    • Montage de vidéos 12K 4:2:2 avec le décodeur Blackwell
    • Exécution d’un LLM de 12 milliards de paramètres avec un contexte de 1 million de tokens
    • Jeux AAA en 1440p à plus de 100 fps avec ray tracing, DLSS et Reflex activés
  • Ampleur du lancement et Surface Laptop Ultra
    • À terme, intégration dans environ 30 laptops et plus de 10 desktops (Asus, HP, MSI, Lenovo, Dell)
    • Parmi les premiers appareils, le Surface Laptop Ultra 15 pouces, avec écran tactile mini-LED, plus grand trackpad haptique jamais proposé, et ports HDMI, USB-C, USB-A, SD et casque
    • Avec jusqu’à 128 Go, il peut faire tourner localement un modèle de 12 milliards de paramètres ; Microsoft le présente comme le Surface le plus puissant jamais conçu, avec une sortie plus tard cette année et un prix encore inconnu
  • Réactions des lecteurs
    • Le concept d’agent IA « teammate » fonctionnant en permanence en arrière-plan suscite de nombreux rejets et du cynisme
    • Certains estiment aussi que « cela reste Windows » et que, même après près de six ans de concurrence, Apple a continué à donner la direction au secteur

1 commentaires

 
GN⁺ 4 시간 전
Avis sur Hacker News
  • J’ai ajouté un R9700 32GB à un desktop de plus de 10 ans à la place de mon ancienne 980 4GB, pour un coût total d’environ 1 350 $
    Par rapport au GHCP que j’utilisais auparavant, l’amortissement de l’investissement était de 33 mois, mais depuis l’annonce d’une hausse de prix de GHCP, il est tombé à au moins 3 mois
    Autrement dit, GHCP a en pratique appliqué une hausse de prix d’environ 10x pour les workflows de type agent, par opposition au parallélisme
    Je peux faire tourner facilement Qwen3.6 35B-A3B en Q5_K_M avec une fenêtre de contexte de plus de 260k tout en gardant de la VRAM libre, avec des performances autour de 80 tps
    Même comparé à Claude Sonnet 4.5 ou 4.6 de GHCP, sur les workflows de type agent, le temps d’usage réel est plus rapide et le respect des règles est d’un niveau comparable
    Cela dit, quand il ne s’agit pas de générer une interface GUI ou une app CRUD mais de créer un vrai programme pour une tâche nouvelle ou peu familière — par exemple exécuter correctement un processus complexe — il faut dans tous les cas énormément de guidage
    Ce n’est pas du niveau d’Opus, mais avec un harness adapté on peut s’en approcher sérieusement, et aujourd’hui beaucoup de problèmes semblent davantage venir du manque de harness que du modèle lui-même

  • Beaucoup réagissent avec scepticisme sur la compatibilité, mais il est assez intéressant que Nvidia ait l’influence nécessaire pour convaincre plusieurs éditeurs de jeux et entreprises d’apps créatives de sortir des versions Arm
    Des jeux populaires comme League of Legends, ainsi que des apps comme Adobe Photoshop et Premiere, sont en train de recevoir des ports Arm natifs
    « Plus de 100 éditeurs de logiciels Windows tels qu’Adobe, Blackmagic Design, Blender, CapCut, ComfyUI et OTOY, ainsi que des développeurs de jeux comme KRAFTON, NetEase, Remedy Entertainment, Riot Games et XBOX, adoptent la nouvelle plateforme RTX Spark. NVIDIA collabore avec Adobe pour repenser Adobe Premiere et Photoshop pour RTX Spark. » [0]
    « Grâce au partenariat avec NVIDIA, le jeu sur Arm entre enfin dans une phase de maturité. Les solutions anti-triche natives d’Epic et de BattlEye sont entièrement prises en charge sur la plateforme RTX Spark. Riot Games porte nativement League of Legends et Valorant sur cette architecture, KRAFTON fait de même avec PUBG Battlegrounds, et d’autres grands développeurs rejoignent le mouvement. » [1]
    La Nintendo Switch est aussi une machine de jeu Nvidia/Arm, donc beaucoup d’éditeurs ont déjà une expérience de cette combinaison
    [0] https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-...
    [1] https://www.windowslatest.com/2026/06/01/microsoft-builds-it...

    • Un bon nombre de ces apps avaient déjà un port Windows on Arm dès la première génération de Snapdragon X Elite
      J’utilise un Surface Laptop 7 équipé de cette puce, et je me souviens qu’on avait beaucoup parlé des portages de Photoshop et Lightroom
      Blender avait aussi une build Windows on Arm depuis déjà un bon moment, et il me semble que Davinci Resolve en avait une vers 2024
      La vraie grande nouvelle concerne plutôt le jeu vidéo, et c’est probablement là que l’influence de Nvidia a joué
      Je me demande quand même ce que signifie concrètement « repensé pour RTX Spark »
      Si ce n’est pas seulement convaincre les éditeurs de faire une build Windows on Arm, mais aussi exploiter des fonctions matérielles spécifiques, alors je me demande ce que cela implique pour la série Snapdragon X
    • Je me demande aussi si cette dynamique pourrait pousser davantage le jeu vers Linux
    • Publier un communiqué de presse, c’est facile ; tenir réellement les promesses, c’est bien plus difficile
    • La plupart ont déjà une version Arm
  • On dirait un DGX renommé sous forme de laptop, et le plus gros point faible est que la vitesse mémoire semble limitée
    C’est la moitié de la vitesse mémoire d’un laptop M5, et un tiers de celle d’un M3 Ultra déjà vieux de quelques années

    • Ce n’est peut-être pas si mauvais que ça
      Il ne rivalisera sans doute pas avec l’Apple M5, mais sur le marché « non-Mac », cela pourrait très bien réussir auprès de ceux qui cherchent un DGX au format laptop
  • C’est une bonne chose qu’Apple ait un concurrent sur ce terrain, et qu’Intel et AMD en aient un aussi.
    Mais je doute vraiment de la capacité de Windows on Arm à bien fonctionner sur le long terme.
    Apple a imposé le passage à Arm pour quiconque voulait acheter un nouveau Mac, et comme tout le monde savait aussi que le support d’Intel finirait par être abandonné, la transition a pu se faire.
    Avec le temps, des fonctionnalités réservées à la série M sont apparues, et les développeurs ont dû soit mettre à jour leurs applis pour prendre en charge le Mac, soit l’abandonner, ce qui a fini par améliorer l’expérience utilisateur après les douleurs de croissance initiales.
    Windows ne peut pas forcer les choses de cette manière, et il y a de fortes chances qu’il reste coincé à maintenir un émulateur en permanence, avec une grande partie des applis qui ne prennent en charge qu’une seule architecture.
    Je me demande aussi si l’inverse est possible, à savoir faire tourner des applis Arm-only sur x86.
    Ça ressemble à une répétition de l’époque où les jeux ne prenaient en charge que Intel ou AMD, NVIDIA ou AMD, sauf que cette fois ce n’est même pas du x86 des deux côtés, donc c’est pire.
    Même s’il y a de l’émulation, ça ne devrait pas être une solution de long terme comme Rosetta2.

    • Si Apple a réussi, c’est surtout parce qu’ils ont attendu d’avoir un CPU ARM ISA vraiment excellent.
      On peut aussi considérer qu’ils ont volontairement moins poussé leurs produits x86 pendant quelques années auparavant, mais l’élément clé, c’était le CPU.
      Qualcomm construit aussi un bon CPU ARM ISA via le rachat de NuVia puis l’architecture Oryon.
      En revanche, ce produit ressemble davantage à un Blackwell greffé à côté d’un CPU ARM standard dans un SoC MediaTek.
      Jusqu’ici, les CPU d’ARM ont été insuffisants pour des puces de niveau laptop, et c’est pour ça que ni Apple ni Qualcomm ne les utilisent tels quels.
    • Apple a misé entièrement sur ARM, mais pour Microsoft, on est encore face à une expérience dégradée dans une certaine mesure.
      Le plus gros problème, c’est de savoir combien d’utilisateurs Windows restent sur Windows à cause de la rétrocompatibilité.
      Que se passerait-il si on cassait ce modèle et que l’OS était jugé uniquement sur l’expérience utilisateur pure et les applis disponibles ?
      Difficile d’être certain qu’il resterait compétitif sur le marché grand public.
      Je n’arrive pas à penser à une seule nouvelle fonctionnalité de Windows de ces vingt dernières années qui m’ait vraiment marqué.
      Sans rétrocompatibilité, il ne resterait presque plus d’écosystème, alors que macOS regorge de fonctions d’écosystème comme la collaboration entre appareils, la connectivité ou Handoff.
    • Créer des binaires universels et en faire un standard semble être l’une des voies réalistes.
  • Un peu décevant.
    J’espérais qu’ils iraient dans la direction d’une amélioration de la bande passante mémoire pour rivaliser avec le M5 Max, mais on est plus proche de Strix Halo.

    • En lisant davantage, il semble très probable que ce soit la même puce que celle utilisée dans le DGX Spark, et une bande passante mémoire de 300MB/s est à peu près au niveau d’un M5 Pro.
      En revanche, le M5 Pro n’existe pas en configuration 128GB de RAM, et Apple pousse plutôt vers la plus grosse puce M5 Max, qui coûte 5099 $ au format 14 pouces.
      On peut acheter un ASUS GB10 avec 2TB de stockage pour 4000 $, donc un laptop RTX Spark sera probablement plus cher à cause de la batterie et de l’écran.
      La génération suivante de Spark pourrait améliorer la bande passante et la capacité de RAM.
      Cela ressemble beaucoup à Strix Halo, mais ici il y a CUDA, donc ça intéressera les développeurs qui en ont besoin.
      J’ai récemment cherché des laptops AMD AI Max+ 395, mais je n’ai vu que des modèles 13 pouces, ce qui m’a semblé étrange du point de vue de la dissipation thermique.
      Je cherche un 16 pouces ; un 13 pouces serait pratique pour les trajets et pour se brancher sur un grand moniteur au bureau ou à la maison, mais l’absence même d’un écran 14 pouces est dommage.
    • 128GB de mémoire, c’est aussi un peu léger.
      J’attends toujours une machine Windows qui puisse répondre au Mac Studio en version 512GB.
  • Spark a encore beaucoup d’angles vifs.
    Il y a des problèmes de compatibilité, de performances survendues, de consommation électrique et de chauffe ; pour une machine destinée aux développeurs, ça peut passer, mais sur un vrai laptop grand public, c’est une toute autre histoire.

  • Tout se joue sur la prise en charge de Linux.

    • Un ingénieur Nvidia a dit sur le serveur Discord que ça fonctionnerait sans problème.
    • Nvidia n’a pas vraiment d’intérêt à en faire une machine réservée à Windows, donc il y a de fortes chances qu’on ait une prise en charge complète de Linux comme pour les GPU.
    • Dans une certaine mesure, oui.
      C’est le même chipset que dans les DGX Spark et DGX Station, et ces machines font tourner une Ubuntu façon NVIDIA.
    • Le DGX Spark est livré avec Linux installé par défaut, donc il paraît difficile d’imaginer que cette machine ne soit pas compatible.
    • C’est une question tellement centrale et évidente qu’on a presque l’impression que Microsoft a payé pour qu’elle ne soit pas mentionnée.
      Honnêtement, presque personne ne s’intéresse sérieusement à faire tourner ça sous Windows.
      Ce que les gens veulent, c’est Steam et CUDA/Ollama, et Windows ne fait que gêner.
      Nvidia n’est probablement pas assez naïf pour ne pas le comprendre, et à leur place j’aurais sans doute estimé que l’implication de Microsoft apportait plus d’ennuis que de bénéfices.
      Après, c’est peut-être aussi pour ce genre de raisons que je ne suis pas milliardaire.
      Ils pensent peut-être aussi que le marché de la RAM est tellement chaotique que cette tentative est condamnée d’avance.
  • Je pense que c’est la première fois qu’un appareil Windows ARM est présenté comme une machine de jeu.
    Ce sera intéressant de voir quelle est la perte de performances en jeu due à la couche de traduction de x86 vers ARM.

    • Rosetta sur Mac était clairement impressionnant.
      À une époque, la traduction Arm→Intel fonctionnait aussi de façon assez impressionnante dans l’écosystème mobile.
      L’une des raisons pour lesquelles cela marche parfois étonnamment bien sur les systèmes modernes, c’est qu’une grande partie du travail est passée au GPU.
      En revanche, si ce n’est pas réellement natif, il est difficile d’obtenir une excellente optimisation énergétique.
      Certains jeux restent limités par le CPU, et il sera intéressant de voir ce qu’il advient de ceux-là.
      Fait intéressant, beaucoup de ces jeux utilisent déjà des moteurs compatibles Arm.
    • Apple Silicon dispose d’un mode spécial qui fait que la gestion des transactions mémoire de la puce ARM se comporte comme du x86.
      Je me demande si ce Nvidia ARM a la même capacité.
      Il sera aussi intéressant de voir à quelle vitesse les développeurs commenceront à viser une prise en charge directe d’ARM64.
  • Je suis surpris que ce produit soit effectivement sorti.
    Pour Nvidia, la perception de la marque compte sans doute bien plus que le chiffre d’affaires que ce produit peut générer, mais en pratique, sous la forme de ce DGX Spark, il risque surtout de décevoir.
    J’ai entendu dire que cette plateforme accumule encore beaucoup de problèmes, à la fois logiciels et matériels.
    Les problèmes logiciels pourront sans doute être corrigés avec le temps, mais la première impression risque de rester mauvaise.
    Je pensais que Nvidia allait plutôt enterrer ça et retenter le coup plus tard avec une nouvelle génération de silicium au design repensé.
    Ce produit semble destiné à répéter l’échec des laptops Snapdragon sous Windows.

    • À moins d’avoir vraiment trop d’argent, je ne vois pas pourquoi on ferait tourner ce genre de workflow sur un laptop Windows.
  • Les machines Windows basées sur ARM m’inspirent de la prudence, car je ne suis pas certain de la qualité du support long terme des pilotes pour ce SoC.
    Sera-t-il pris en charge plus longtemps que la version de Windows lancée en même temps ?
    Quand on regarde des appareils comme la NVIDIA Shield, on peut espérer que NVIDIA fera mieux que Qualcomm.
    Cela dit, j’aimerais que NVIDIA fournisse directement ce support, au lieu d’un modèle où les OEM doivent acheter à l’avance plusieurs années de support pilote auprès du fournisseur de puces.