Les investissements dans les startups d’IA générative – celles qui créent des produits alimentés par l’IA pour générer du texte, de l’audio, de la vidéo et plus – ne montrent aucun signe de ralentissement. Mais ils se concentrent vers un nombre de plus en plus restreint de jeunes entreprises. Au premier semestre 2023, du 1er janvier au 16 juillet, 225 startups ont levé 12,3 milliards de dollars auprès des VC, selon les données de Crunchbase partagées avec TechCrunch. Si la tendance se maintient, les entreprises d’IA générative sont en bonne voie pour égaler ou dépasser les 21,8 milliards de dollars qu’elles ont levés en 2023. Voici comment le total du S1 2024 se répartit par étape : 198 deals en phase d’amorçage : 500 millions de dollars, 39 deals en début de parcours : 8,7 milliards de dollars, 18 deals en phase avancée : 3,1 milliards de dollars.
Les startups en phase de démarrage ont été les grandes gagnantes, comme xAI d’Elon Musk (qui a levé 6 milliards de dollars en mai), Moonshot AI de Chine (1 milliard de dollars en février), Mistral AI (502,6 millions de dollars en juin), Glean (203,2 millions de dollars en février) et Cognition (175 millions de dollars en avril). Selon Chris Metinko, analyste et reporter senior chez Crunchbase, les investisseurs semblent parier sur de grandes startups qu’ils considèrent comme ayant une forte chance de succès, tout en laissant ceux dont ils sont moins sûrs “s’étioler” aux stades précédents.
“Certains VC s’attendent à ce que les dilemmes juridiques et réglementaires que pourraient rencontrer les entreprises d’IA aux États-Unis et à l’étranger entraînent un ralentissement de l’afflux de financement de l’IA”, a déclaré Metinko à TechCrunch.
D’autres soulignent le fait que lorsque la révolution mobile a eu lieu il y a plus d’une décennie, les plus grands gagnants en ce qui concerne la couche d’infrastructure fondamentale ont fini par être des entreprises technologiques bien établies. À ce titre, le sort de nombreuses entreprises d’IA générative – même les mieux financées – semble incertain. Les modèles d’IA générative sont généralement formés sur des données telles que des images et du texte provenant de pages web publiques, et les entreprises affirment que l’utilisation équitable les protège des défis juridiques dans les cas où ces données s’avèrent être protégées par des droits d’auteur.
Mais il n’est pas encore clair si les tribunaux décideront finalement en faveur des entreprises d’IA générative, c’est probablement pourquoi certaines ont commencé à signer des accords de licence avec les détenteurs de droits d’auteur. Indépendamment de l’issue de chaque procès, il devient de plus en plus difficile et coûteux d’obtenir des données d’entraînement de haute qualité car les startups épuisent le stock du web et de plus en plus de créateurs choisissent de bloquer les robots d’indexation pour extraire leurs données. Une analyse estime que le marché des données d’entrainement pour l’IA va passer de 2,5 milliards à 30 milliards de dollars en une décennie.
Le processus de formation des modèles ne devient pas non plus plus facile ou moins cher : selon un récent rapport de Stanford, le coût de formation de GPT-4, le modèle de OpenAI, a atteint 78 millions de dollars, tandis que le prix de Google Gemini s’est élevé à 191 millions de dollars. Sans surprise, vu l’investissement initial important nécessaire pour construire des modèles phares, rares sont les startups d’IA générative qui sont rentables – même les poids lourds tels qu’OpenAI et Anthropic.
Selon The Information, OpenAI, qui génère environ 3,4 milliards de dollars de revenus, pourrait finir par perdre 5 milliards de dollars cette année. Les investisseurs en IA générative jouent le long terme, semble-t-il – et en particulier les grands investisseurs technologiques tels que Google, Amazon et Nvidia, qui voient les investissements en IA générative comme des paris stratégiques.