Le milliardaire soutenu par SoftBank va investir 230M$ dans la start-up indienne de l’IA, Krutrim

Generated with DALL·E 3

Bhavish Aggarwal, le fondateur d’Ola, investit 230 millions de dollars dans une startup d’IA qu’il a créée alors que le pays cherche à s’imposer dans un domaine dominé par les entreprises américaines et chinoises. Aggarwal finance l’investissement dans Krutrim – qui a développé des LLM pour les langues indiennes – principalement par son family office, a déclaré une source proche du dossier à TechCrunch. Dans un message posté mardi sur X, Aggarwal a déclaré que Krutrim cherche à attirer un investissement de 1,15 milliard de dollars d’ici l’année prochaine. Il cherchera à lever le reste du capital auprès d’investisseurs extérieurs, a déclaré la source.

L’annonce du financement coïncide avec la décision de la startup licorne Krutrim de rendre ses modèles IA open source et de dévoiler ses plans pour construire ce qu’elle prétend être le plus grand supercalculateur de l’Inde en partenariat avec Nvidia. Le laboratoire a publié Krutrim-2, un modèle de langage à 12 milliards de paramètres qui a montré de bonnes performances dans le traitement des langues indiennes. Dans les tests d’analyse de sentiment que Krutrim a partagés mardi, il a obtenu un score de 0,95 contre 0,70 pour les modèles concurrents, tout en atteignant un taux de réussite de 80% dans les tâches de génération de code.

“Nous ne sommes pas encore à la hauteur des normes mondiales, mais nous avons fait de bons progrès en un an”, a écrit Aggarwal, dont d’autres aventures ont été soutenues par SoftBank.

Le laboratoire a open-sourcé plusieurs modèles spécialisés, y compris des systèmes de traitement d’images, de traduction vocale et de recherche de texte, tous optimisés pour les langues indiennes. “En open-sourcing nos modèles, nous espérons que toute la communauté AI indienne collaborera pour créer un écosystème AI indien de classe mondiale”. Cette initiative intervient alors que l’Inde cherche à établir sa place dans un paysage de l’intelligence artificielle dominé par les entreprises américaines et chinoises.

La récente sortie du modèle de “raisonnement” R1 de DeepSeek, construit sur un budget prétendument modeste, a envoyé des ondes de choc à travers l’industrie technologique. L’Inde a salué la semaine dernière les progrès de DeepSeek et a déclaré que le pays allait héberger les grands modèles de langage du laboratoire d’IA chinois sur des serveurs domestiques. L’armée du nuage de Krutrim a commencé à offrir DeepSeek sur les serveurs indiens la semaine dernière. Krutrim a également développé son propre cadre d’évaluation, BharatBench, pour évaluer la compétence des modèles d’IA dans les langues indiennes, comblant ainsi une lacune dans les benchmarks existants qui se concentrent principalement sur l’anglais et le chinois.

L’approche technique du laboratoire comprend l’utilisation d’une fenêtre de contexte de 128 000 tokens, permettant à ses systèmes de traiter des textes plus longs et des conversations plus complexes. Les métriques de performance publiées par la startup montrent que Krutrim-2 obtient des scores élevés en correction de grammaire (0,98) et en conversations à plusieurs tours (0,91). Cet investissement fait suite au lancement en janvier de Krutrim-1, un système à 7 milliards de paramètres qui a servi de premier grand modèle de langue de l’Inde. Le déploiement du supercalculateur avec Nvidia est prévu pour être opérationnel en mars, avec une expansion prévue tout au long de l’année.

Partagez cet article
article précédent

La société canadienne StackAdapt séduit les investisseurs avec une levée de fonds de 235 millions de dollars pour sa plateforme publicitaire basée sur l’IA | TechCrunch

article suivant

Snap dévoile un modèle d’IA de conversion de texte en image pour appareils mobiles | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles