Lors du Consumer Electronics Show (CES) qui se tient actuellement à Las Vegas, le CEO de Nvidia, Jensen Huang, a officiellement présenté la toute nouvelle architecture de calcul Rubin, qu’il a décrite comme étant la pointe de la technologie dans le domaine du matériel d’intelligence artificielle (IA). Cette nouvelle architecture est déjà en production et devrait connaître une accélération significative au cours du second semestre de l’année, marquant une étape majeure dans l’évolution des infrastructures IA.
La famille d’architectures Rubin, annoncée pour la première fois en 2024, succède à la série Blackwell, elle-même remplaçant les architectures Hopper et Lovelace. Conçue pour répondre à la croissance exponentielle des besoins en calcul liés à l’IA, Rubin intègre six puces distinctes conçues pour fonctionner ensemble. Au centre, une puce GPU Rubin constitue le cœur de cette architecture innovante, épaulée par des avancées en stockage et en interconnexion via des composants tels que Bluefield et NVLink. Elle inclut également un nouveau CPU Vera, spécifiquement destiné au raisonnement agentique, une capacité essentielle pour les applications futures d’IA autonome et évolutive.
La nouvelle architecture Rubin offre une montée en puissance exceptionnelle, notamment en termes de vitesse et d’efficacité énergétique, avec des performances jusqu’à cinq fois supérieures en inference et une capacité atteignant 50 petaflops.
Selon Dion Harris, directeur principal des solutions d’infrastructure IA chez Nvidia, cette architecture représente une avancée significative pour accompagner la montée en puissance des workflows modernes, tels que l’agentic AI ou les tâches à long terme. La nouvelle technologie de stockage, connectée en externe au dispositif de calcul, permet de mieux gérer l’augmentation des demandes en cache de mémoire, une composante critique dans le traitement de données massives et complexes propres à l’IA moderne.
Les premiers systèmes Rubin sont déjà déployés chez presque tous les principaux fournisseurs de cloud, avec des partenariats stratégiques impliquant Nvidia, Anthropic, OpenAI et Amazon Web Services. On retrouve également ces innovations dans des projets emblématiques comme le superordinateur Blue Lion d’HPE ou le futur superordinateur Doudna développé par le Lawrence Berkeley National Laboratory, illustrant ainsi l’utilisation concrète et polyvalente de cette architecture révolutionnaire.
En résumé, la nouvelle architecture Rubin de Nvidia incarne une étape majeure dans la convergence entre puissance de calcul, efficacité énergétique et innovations en stockage, propulsant l’IA vers de nouveaux horizons et alimentant un marché estimé à plusieurs trillions de dollars dans les années à venir.
