1 points par carnoxen 2023-08-23 | Aucun commentaire pour le moment. | Partager sur WhatsApp

L’IA fonctionne en deux étapes : l’apprentissage, qui consiste à ajuster des paramètres à partir des données fournies, puis l’inférence, qui résout des problèmes sur la base des paramètres ainsi créés. Jusqu’ici, l’IA n’était exploitée qu’entre chercheurs, mais avec l’arrivée de ChatGPT, le grand public s’y est désormais familiarisé.

Les performances de cette IA sont fortement influencées par du matériel comme les GPU et les NPU. Parmi les entreprises qui fabriquent ce type de matériel, NVIDIA détient une part écrasante du marché, en particulier du côté de l’apprentissage. En revanche, l’inférence est moins difficile que l’apprentissage, ce qui voit émerger les unes après les autres des entreprises qui s’opposent à NVIDIA. Dans ce contexte, Rebellions a lancé son défi.

Accordant de l’importance aux talents, l’entreprise a été fondée par quatre administrateurs titulaires de masters ou doctorats liés à l’IA. Au départ, elle concevait des puces nécessaires aux sociétés financières, avant d’élargir ensuite son champ jusqu’à concevoir des puces d’inférence IA.

Les produits créés par l’entreprise sont les suivants.

Spécialisé pour le secteur financier, ION est le premier produit de l’entreprise, rendu possible par la présence du CEO Park Seong-hyeon et du CTO Oh Jin-uk, tous deux expérimentés en conception de puces. Il peut traiter simultanément les nombres entiers et à virgule flottante, permet de manipuler librement l’ISA et prend en charge divers algorithmes liés au deep learning. De plus, il offre une haute efficacité énergétique (TOPS/Watt) et permettrait de construire des serveurs à latence ultra-faible (Ultra Low Latency, ULL).

ATOM, lancé ensuite, est une puce conçue pour l’inférence IA. Pour accélérer davantage l’inférence, elle ajoute à ION des fonctions de mémoire et de communication entre les cœurs à l’intérieur de la puce (network on chip, NoC) qui n’y figuraient pas. Grâce à cela, elle a pris une nette avance sur Qualcomm dans les performances du modèle BERT de MLPerf.

L’entreprise n’a pas seulement conçu du matériel, elle a aussi développé un compilateur pour puces IA. Il repose sur l’open source Apache TVM et intègre également des fonctions pensées pour les environnements cloud.

L’entreprise semble viser comme clients les grands opérateurs de centres de données. Contrairement aux ordinateurs portables et aux smartphones, très contraints, les centres de données peuvent accueillir n’importe quelle charge de travail et permettent de personnaliser facilement les systèmes. En outre, comme les marchés des data centers et de l’inférence IA sont en croissance, l’entreprise devra d’autant plus les cibler.

Aucune annonce de contrat n’a encore été faite pour ION, mais ATOM est fourni régulièrement à KT depuis 2023. De plus, l’entreprise a reçu d’énormes investissements de Kakao et du gouvernement, ce qui laisse penser qu’elle poursuivra une croissance encore plus importante.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.