L’appétit pour des services de stockage en nuage alternatifs n’a jamais été aussi grand. Preuve en est, CoreWeave, le fournisseur d’infrastructure GPU qui a commencé par une opération de minage de cryptocurrency, a levé cette semaine 1,1 milliard de dollars auprès d’investisseurs comme Coatue, Fidelity et Altimeter Capital. Cette levée de fonds augmente sa valorisation à 19 milliards de dollars après investissement, et porte le total levé à 5 milliards de dollars en dettes et en actions, un chiffre remarquable pour une entreprise de moins de dix ans. Et ce n’est pas seulement CoreWeave. Lambda Labs, qui propose également un large éventail d’instances de GPU hébergées en cloud, a obtenu en avril un “véhicule de financement spécial” de jusqu’à 500 millions de dollars, quelques mois après avoir conclu une levée de fonds de série C de 320 millions de dollars.
Le fonds à but non lucratif Voltage Park, soutenu par le milliardaire en crypto Jed McCaleb, a annoncé en octobre dernier qu’il investirait 500 millions de dollars dans des centres de données soutenus par des GPU. Et Together AI, un hôte de GPU en nuage qui mène également des recherches en intelligence artificielle générative, a obtenu en mars 106 millions de dollars lors d’un tour de table mené par Salesforce. Alors, pourquoi tout cet engouement – et cet afflux de liquidités – pour l’espace de cloud alternatif ? La réponse, comme on pourrait s’y attendre, est l’intelligence artificielle générative.
“Avec la demande croissante en hardware pour exécuter et former des modèles d’IA générative à grande échelle, les entreprises se tournent vers le cloud. C’est là que les fournisseurs de cloud alternatifs comme CoreWeave tirent leur épingle du jeu.”
Alors que l’IA générative continue de se développer, la demande de matériel pour faire fonctionner et former des modèles d’IA générative à grande échelle se fait également sentir. Les GPU sont le choix logique pour former, affiner et exécuter des modèles car ils contiennent des milliers de cœurs qui peuvent travailler en parallèle pour réaliser les équations d’algèbre linéaire qui composent les modèles génératifs. Mais installer des GPU est coûteux. La plupart des développeurs et des organisations se tournent donc vers le cloud.
Les acteurs établis dans l’espace de l’informatique en nuage – Amazon Web Services (AWS), Google Cloud et Microsoft Azure – offrent un large éventail d’instances de GPU et de matériels spécialisés optimisés pour les charges de travail de l’IA générative. Mais pour certains modèles et projets, les clouds alternatifs peuvent se révéler moins chers – et offrir une meilleure disponibilité.
Chez CoreWeave, la location d’un Nvidia A100 40GB – un choix populaire pour la formation et l’inférence des modèles – coûte 2,39 $ de l’heure, soit 1 200 $ par mois. Chez Azure, le même GPU coûte 3,40 $ de l’heure, soit 2 482 $ par mois ; chez Google Cloud, il coûte 3,67 $ de l’heure, soit 2 682 $ par mois. Comme les charges de travail de l’IA générative sont généralement effectuées sur des clusters de GPU, les deltas de coûts augmentent rapidement.