Le boom de l’intelligence artificielle s’est construit sur une hypothèse fondamentale : des modèles plus grands sont plus puissants, et les modèles les plus puissants remportent la mise. Cependant, l’industrie est désormais confrontée à une nouvelle réalité qui pourrait remettre en question cette croyance : la montée des coûts. Face à cette pression financière, les utilisateurs commencent à envisager sérieusement des modèles plus petits et moins coûteux. Cette évolution, encore en phase d’expérimentation, pourrait profondément transformer le paysage du secteur de l’IA.
Une prédiction notable, formulée par Brian Armstrong, cofondateur de Coinbase, prévoit que d’ici 12 à 18 mois, environ 80 % des charges de travail seront déplacées vers des modèles 99 % moins chers, tout en maintenant une qualité acceptable. Selon lui, seuls 20 % des tâches nécessiteront encore les modèles de dernière génération, où la puissance d’intelligence est primordiale. Si cette tendance se confirme, cela représenterait une révolution économique majeure pour l’industrie, qui a jusqu’à présent misé sur la progrès continu de la puissance des modèles, au prix d’un coût exorbitant.
« La majorité des déploiements pourrait être effectuée avec des modèles plus petits, sans compromis sur la qualité »
Des tests récents menés par des startups comme Harvey, spécialisée dans les services juridiques basés sur l’IA, illustrent cette tendance. En partenariat avec Fireworks AI, Harvey a réussi à réduire ses coûts d’inférence par un facteur trois, sans diminuer la qualité de ses résultats. Ces résultats suggèrent qu’il est possible de trouver un équilibre entre performance et coût, en adoptant des modèles plus économiques pour certaines tâches, notamment dans des secteurs où la précision est essentielle, comme le droit. Pour cette start-up, la qualité ne doit pas être sacrifiée, mais elle doit évoluer vers une utilisation plus efficace des ressources.
Ce mouvement de fond ne se limite pas à la simple rivalité entre grands modèles propriétaires et modèles open-weight, mais concerne surtout le choix entre modèles de grande, moyenne ou petite taille. La véritable question réside dans la capacité à substituer un modèle volumineux par un modèle plus compact, tout en conservant une performance satisfaisante. Ainsi, la guerre des prix entre les grands labs et les modèles open-source ne concerne pas tant le type de modèle, mais la taille du modèle lui-même. La tendance indique que pour beaucoup de tâches, la solution la plus rentable pourrait être un modèle réduit, ce qui pourrait bouleverser l’économie du secteur.
Malgré l’évidence apparente de l’efficience, cette transition va à contre-courant de la stratégie historique où le scalabilité et l’optimisation de la puissance étaient privilégiées. Jusqu’à présent, les investissements massifs dans la formation de modèles de plus en plus ambitieux ont été subventionnés par des investisseurs, entraînant une course au sommet. Mais avec la hausse des coûts et la ralentissement des subventions, les entreprises se findif à devoir repenser leur stratégie. La question est désormais : seront-elles prêtes à privilégier des modèles plus petits, voire à renoncer à certains déploiements coûteux, pour optimiser la rentabilité ?
