HRM – L’IA de 27 millions de paramètres qui écrase GPT-4 sur le raisonnement | Le site de Korben

Illustration générée par intelligence artificielle

Une startup de Singapour, Sapient Intelligence, vient de démontrer qu’en matière d’intelligence artificielle, il est toujours possible pour David de vaincre Goliath. Leur modèle, le Hierarchical Reasoning Model (HRM), utilise seulement 27 millions de paramètres et surpasse des géants tels que GPT-4 sur des tâches de raisonnement complexe. Comment un tel exploit est-il réalisable ? La clé réside dans l’inspiration qu’ils tirent directement du fonctionnement du cerveau humain.

En janvier 2025, l’équipe de Sapient Intelligence a réussi à lever 22 millions de dollars et a récemment mis son code à disposition sur GitHub. Leur méthode repose sur deux modules qui opèrent en tandem, à l’image des régions de notre cortex. Le premier est un module “lent” consacré à la planification abstraite, tandis que le second, un module “rapide”, prend en charge les calculs détaillés. Selon les chiffres rapportés par VentureBeat, HRM affiche des performances pouvant atteindre 100 fois celles des modèles de langage classiques avec seulement 1000 exemples d’entraînement.

“Cette approche suggère que nous avons peut-être fait fausse route en privilégiant la taille brute à l’efficacité architecturale.”

Les résultats sur le terrain sont impressionnants. HRM s’est illustré lors de l’ARC-AGI Challenge avec un taux de réussite de 40,3%, alors que des modèles bien plus volumineux échouaient. Il résout presque parfaitement des Sudoku extrêmement complexes et parvient à identifier le chemin optimal dans des labyrinthes de 30×30. Fait remarquable, tout cela est accompli sans pré-entraînement ni utilisation de données Chain-of-Thought.

L’efficacité du modèle repose sur ce que les développeurs appellent la “convergence hiérarchique”. Un module de haut niveau élabore une stratégie générale, tandis qu’un module de bas niveau exécute rapidement les calculs requis. Cette structure fait écho à la manière dont notre cerveau aborde les problèmes complexes, en combinant réflexion stratégique et exécution rapide.

Les implications de cette technologie sont vastes, tant pour le secteur des entreprises que pour le domaine médical. Sapient Intelligence teste déjà HRM pour des diagnostics de maladies rares, où la précision est essentielle, et obtient des taux de réussite impressionnants de 97% dans les prévisions climatiques. De plus, contrairement aux modèles coûteux et fermés des grandes entreprises technologiques, HRM est entièrement open-source, permettant ainsi à chacun de modifier et d’améliorer le code.

Alors, la question se pose : est-il réellement nécessaire d’avoir des centaines de milliards de paramètres lorsqu’une intelligence efficace peut émerger de structures plus compactes et mieux organisées ? L’avenir nous dira si les géants de la technologie seront prompts à réévaluer leurs stratégies à la lumière de cette innovation révolutionnaire.

Partagez cet article
article précédent

Plaud lance un nouveau dispositif de prise de notes intelligent, le Note Pro à 179 $

article suivant

IA et recrutement : pourquoi les candidats sont-ils méfiants ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles