Pourquoi cette start-up d’IA mise sur les robots vocaux pour accélérer l’adoption de l’IA en Inde | TechCrunch

Generated with DALL·E 3

Si votre marché cible compte 22 langues officielles et que ses habitants parlent plus de 19 000 dialectes, est-il logique de proposer un chatbot AI uniquement en texte qui peut fonctionner au mieux dans quelques langues? C’est la question à laquelle la start-up indienne d’IA Sarvam a cherché à répondre. Mardi, elle a lancé une série d’offres, dont un bot d’IA vocal capable de supporter plus de 10 langues indiennes, pariant que les gens dans le pays préféreraient parler à un modèle d’IA dans leur propre langue plutôt que de discuter avec lui par texte. La start-up lance également un petit modèle de langue, un outil d’IA pour les avocats, ainsi qu’un modèle de langue audio. “Les gens préfèrent parler dans leur propre langue. Il est extrêmement difficile de taper en langues indiennes aujourd’hui”, a déclaré Vivek Raghavan, cofondateur de Sarvam AI, à TechCrunch.

La start-up basée à Bengaluru, qui cible principalement les entreprises et les grandes entreprises, propose ses robots d’IA activés par la voix pour un certain nombre d’industries, en particulier celles qui dépendent du support client. À titre d’exemple, elle a mentionné l’un de ses clients : Sri Mandir, une start-up qui propose du contenu religieux, utilise l’agent IA de Sarvam pour accepter les paiements, et a jusqu’à présent traité plus de 270 000 transactions. La société a déclaré que ses agents vocaux d’IA peuvent être déployés sur WhatsApp, au sein d’une application, et peuvent même fonctionner avec des appels vocaux traditionnels.

“Alors que les grands modèles de langues de base sont très excitants, vous pouvez obtenir une expérience qui est supérieure, plus spécifique, à moindre coût et avec une latence réduite en utilisant de petits modèles de langues”, a déclaré Raghavan.

La start-up, qui est soutenue par Peak XV et Lightspeed, prévoit de fixer le prix de ses agents d’IA à partir de ₹1 (environ 1 cent) par minute d’utilisation. Sarvam construit ses agents d’IA activés par la voix sur un modèle de langue fondamental et petit, appelé Sarvam 2B, qui est formé sur un ensemble de données de 4 trillions de tokens. Le modèle est entièrement formé sur des données synthétiques, selon Raghavan. Les experts en IA conseillent souvent la prudence lors de l’utilisation de données synthétiques – essentiellement des données générées par un grand modèle de langue qui vise à reproduire des données réelles – pour former d’autres modèles d’IA, car les LLM ont tendance à halluciner et à inventer des informations qui peuvent ne pas être exactes. Former des modèles d’IA sur ces données peut servir à exacerber ces inexactitudes.

Raghavan a déclaré que Sarvam a choisi d’utiliser des données synthétiques en raison de la disponibilité extrêmement limitée de contenu en langue indienne sur le web ouvert. La start-up a développé des modèles pour nettoyer et améliorer les données d’abord utilisées pour générer les ensembles de données synthétiques, a-t-il ajouté. Le fondateur a affirmé que Sarvam 2B coûtera un dixième de tout ce qui est comparable dans l’industrie. La start-up met le modèle en open source, en espérant que la communauté l’améliorera davantage.

La start-up lance également un modèle de langue audio, appelé Shuka, basé sur son décodeur audio Saaras v1 et l’instruction Llama3-8B de Meta. Ce modèle est également en open source, de sorte que les développeurs peuvent utiliser les modules de traduction, TTS et autres de la start-up pour construire des interfaces vocales. Et, il y a un autre produit appelé “A1” – un établi de travail génératif d’IA conçu pour les avocats qui peut rechercher des réglementations, rédiger des documents, les rédiger et en extraire des données.

Partagez cet article
article précédent

À quoi sert l’IA ? Peut-être pas à résumer des contenus | TechCrunch

article suivant

Exclusif: Anysphere, un rival de GitHub Copilot, a levé plus de 60 millions de dollars en série A à une valorisation de 400 millions de dollars par a16z, Thrive, selon des sources.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles