Cette startup parie que la tokenmaxxing créera le prochain géant de l’informatique

Dans un contexte où la demande pour l’utilisation des modèles d’intelligence artificielle générative explose, Parasail s’impose comme un acteur clé en fournissant une infrastructure cloud spécialisée pour la réalisation d’inférences sur ces modèles. Selon Mike Henry, PDG de Parasail, la société traite actuellement environ 500 milliards de tokens par jour, illustrant la forte croissance de cette activité et la nécessité pour les développeurs de disposer d’une solution rapide, économique et flexible pour gérer ces volumes massifs de données. Par cette démarche, Parasail se positionne comme un facilitateur pour les entreprises qui souhaitent accélérer le déploiement de leurs applications basées sur l’IA sans devoir investir massivement dans leur propre infrastructure matérielle.

Historique en vue, Mike Henry possède un background dans la conception de puces physiques, ayant notamment travaillé chez Groq, une entreprise spécialisée dans les puces pour large language models (LLMs). Chez Groq, il a développé une offre cloud pour répondre aux besoins spécifiques des développeurs d’IA. Aujourd’hui, Parasail ne possède pas ses propres puces en totalité, mais loue de la puissance de calcul auprès de 40 centres de données à l’échelle mondiale, en maîtrisant habilement l’allocation des charges de travail pour réduire les coûts. La stratégie consiste à éviter les pics de demande tout en diversifiant ses sources de capacité via des marchés de liquidités, afin de mieux rivaliser avec des acteurs disposant de leur propre silicon, souvent limités par des engagements ou des charges de travail préexistantes.

L’essor des modèles open-source et des agents dans le développement logiciel favorise la croissance de sociétés comme Parasail en rendant l’inférence plus abordable et flexible, notamment face à la montée en puissance des offres propriétaires coûteuses.

Cette tendance est également confirmée par Andreas Stuhlmüller, PDG d’Elicit, dont la startup a levé 22 millions de dollars en série A pour développer un assistant de recherche en littérature scientifique. Les clients, notamment dans l’industrie pharmaceutique, utilisent des modèles pour analyser des dizaines de milliers d’articles scientifiques, déléguant une partie du traitement à des agents et des modèles open-source pour réduire les coûts et augmenter la stratégie à long terme. Selon lui, le recours à ces modèles ouverts permet de traiter efficacement une volumétrie importante de requêtes, tout en économisant par rapport aux API propriétaires coûteuses, notamment celles de grands acteurs comme OpenAI ou Anthropic.

Le développement de ces agents et l’augmentation du volume de requêtes alimentent l’intérêt croissant pour des infrastructures comme celles proposées par Parasail. Samir Kumar, partenaire chez Touring Capital, estime que l’inférence représentera bientôt au moins 20 % du coût de la création logicielle, soulignant la nécessité de plateformes capables de proposer cette puissance à coût réduit. Parasail se différencie en ciblant majoritairement les startups en phase initiale, sans engagement à long terme, ce qui contraste avec les grands fournisseurs de cloud traditionnels ou même certains concurrents mieux financés comme Fireworks AI ou Baseten. La promesse d’un marché en pleine expansion reste donc un moteur essentiel pour cette stratégie.

Ce contexte d’expansion rapide, où la demande d’inférence dépasse déjà l’offre, d’après Steve Jang de Kindred Ventures, indique que la logistique du calcul et le courtage des ressources seront au cœur de l’évolution du secteur. La montée en puissance des modèles pour la génération de contenu, la robotique ou d’autres applications concrètes renforce encore plus cette tendance. Comme le souligne Tim Fernholz, journaliste spécialisé, « il n’y a pas de bulle de l’IA, la demande en inférence dépasse largement l’offre ».

Partagez cet article
article précédent

Gitar, une startup qui utilise des agents pour sécuriser le code, sort de l’ombre avec 9 millions de dollars

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles