La discussion sur l’importance des modèles fondamentaux en intelligence artificielle soulève des questions intrigantes parmi les startups. Ces dernières semblent de plus en plus à l’aise avec les entreprises auparavant qualifiées de “wrappers GPT”, soit celles qui construisent des interfaces sur des modèles d’IA existants comme ChatGPT. Aujourd’hui, les équipes de startups se concentrent principalement sur la personnalisation de ces modèles d’IA pour des tâches spécifiques, considérant le modèle fondamental comme une marchandise interchangeable.
Cette tendance s’est particulièrement illustrée lors de la conférence Boxworks de la semaine dernière, dédiée quasiment à des logiciels orientés utilisateur construits sur des modèles d’IA. L’une des raisons de ce changement est que les bénéfices d’échelle liés à la pré-formation des modèles d’IA (le processus initial d’enseignement à l’aide de vastes ensembles de données) ont commencé à ralentir. Bien que le progrès de l’IA se poursuive, les premiers avantages des modèles fondamentaux hyperscalés semblent atteindre des rendements décroissants. Les yeux se tournent désormais vers des sources d’avancement telles que la post-formation et l’apprentissage par renforcement.
« Les modèles fondamentaux continuent de progresser, mais il semble de moins en moins plausible qu’une seule entreprise puisse conserver un avantage suffisant pour dominer l’industrie. »
Le paysage concurrentiel de l’IA évolue, remettant en question les avantages des grands laboratoires d’IA. Plutôt qu’une course vers une AGI tout-puissante, l’avenir immédiat s’oriente vers des entreprises distinctes dans le développement de logiciels, la gestion des données d’entreprise, la génération d’images, etc. Les alternatives open-source abondent, ce qui réduit la capacité de tarification des entreprises comme OpenAI et Anthropic. Ces dernières pourraient se transformer en fournisseurs de services en backend dans une industrie à faible marge, comparables à « vendre des grains de café à Starbucks » selon les mots d’un fondateur.
Cette dynamique représente un changement majeur pour l’industrie de l’IA. Pendant les périodes de prospérité contemporaines, le succès de l’IA était inextricablement lié à celui des entreprises développant des modèles fondamentaux, avec OpenAI, Anthropic et Google en tête. Longtemps, il semblait que ces entreprises devaient devenir des acteurs d’importance générationnelle, mais des signes récents indiquent que l’avantage du premier arrivé dans cette course est moins prépondérant qu’on ne le pensait.
Pour autant, il convient de ne pas sous-estimer les entreprises de modèles fondamentaux. Elles conservent de nombreux avantages durables, tels que la reconnaissance de marque et des réserves de trésorerie considérables. L’intérêt actuel pour la post-formation pourrait également évoluer. Néanmoins, la stratégie consistant à construire des modèles fondamentaux de plus en plus puissants semble moins attrayante qu’auparavant, alors que des dépenses vertigineuses, comme celles de Meta, deviennent de plus en plus risquées.