Apple a récemment dévoilé ce qui pourrait bien être le supercalculateur de bureau le plus discret du monde. Avec une configuration impressionnante intégrant 1,5 To de RAM partagée, ce système fonctionne sans bruit, ne consomme que 250 watts, et surpasse largement les performances de certaines solutions Nvidia en calcul pur. Ce projet, encore expérimenté, ouvre des perspectives inédites pour les chercheurs et les amateurs de haute performance, tout en remettant en question le monopole des grands clouds technologiques.
Ce qui frappe le plus dans cette nouvelle technologie, c’est l’utilisation du RDMA (Remote Direct Memory Access) sur Thunderbolt 5, permettant à plusieurs Mac de partager leur mémoire unifiée comme s’il s’agissait d’un unique gigantesque pool de RAM. La mise en œuvre par Jeff Geerling de cette technologie, grâce à quatre Mac Studio équipés de M3 Ultra, a permis de faire tourner des modèles massifs d’IA allant jusqu’à 671 milliards de paramètres, avec des performances toujours en progression. La latence réduite à moins de 50 microsecondes représente une avancée majeure dans le traitement entre plusieurs machines connectées via Thunderbolt 5.
La promesse que cette innovation pourrait bouleverser la course aux supercalculateurs de bureau est palpable, mais le logiciel reste encore en bêta, avec des bugs et des limitations à surmonter.
Les résultats impressionnent : sur Geekbench 6, le M3 Ultra surpasse aisément ses concurrents comme le Dell Pro Max ou l’AMD Ryzen AI Max+ 395 en mono et multi-coeur. Sur le benchmark HPL en virgule flottante 64 bits, cette configuration atteint même le seuil du téraflop, dépassant nettement le GPU Nvidia GB10. La capacité de faire tourner des modèles d’IA titanesques, tels que Kimi K2 Thinking avec ses 1000 milliards de paramètres, à une vitesse de 30 tokens par seconde, en consommant seulement 250 watts et sans bruit, constitue une réelle révolution.
Cependant, cette réussite n’est pas exempte de défis : le logiciel étant encore en phase bêta, des crashs fréquents et des instabilités sont à prévoir. De plus, l’administration à distance pose problème, puisqu’il est impossible de mettre à jour macOS via SSH, obligeant à une gestion locale sur chaque machine. Enfin, seules quatre machines sont supportées pour l’instant, alors que Thunderbolt 5 offre cinq ports, un paradoxe qui témoigne encore de l’état immature de cette technologie.
Ce nouveau système, bien qu’encore en développement, propose une perspective radicale pour ceux qui veulent faire tourner des modèles d’IA massifs à la maison sans recourir aux services cloud, mais son coût reste prohibitif pour le moment.
En définitive, cette avancée technologique d’Apple et ses tests par Jeff Geerling illustrent un tournant potentiel dans le domaine du calcul haute performance pour le grand public. Si la stabilité et la compatibilité s’améliorent, on pourrait rapidement se retrouver face à une véritable alternative aux solutions cloud coûteuses, offrant puissance et autonomie sur un bureau compact. Reste à voir comment l’écosystème logiciel évoluera pour accompagner cette innovation prometteuse.
