Lancement par Cohere d’une famille de modèles multilingues open source

Lors du Sommet IA en Inde, la société de l’intelligence artificielle d’entreprise Cohere a dévoilé une nouvelle gamme de modèles linguistiques multilingues baptisée Tiny Aya. Ces modèles, en open-weight, disposent de leur code source accessible au public, permettant à quiconque de les utiliser, de les modifier et de contribuer à leur développement. Supportant plus de 70 langues, ils sont conçus pour fonctionner sur des appareils courants comme les laptops, sans nécessiter de connexion Internet.

Cohere Labs, le bras de recherche de l’entreprise, a lancé ces modèles avec une attention particulière aux langues régionales, notamment celles d’Asie du Sud telles que le Bengali, Hindi, Punjabi, Urdu, Gujarati, Tamoul, Telugu et Marathi. Le modèle de base, de 3,35 milliards de paramètres, témoigne d’une avancée significative dans la capacité à traiter la diversité linguistique. En complément, la société a également présenté TinyAya-Global, une version affinée pour mieux suivre les instructions des utilisateurs, idéale pour des applications demandant une prise en compte plus précise des commandes.

Cette démarche favorise le développement de systèmes linguistiquement et culturellement plus nuancés, tout en maintenant une couverture multilingue étendue, offrant ainsi des points de départ flexibles pour la recherche et la création d’applications localisées.

Outre la version globale, Cohere a développé des variantes régionales : TinyAya-Earth pour les langues africaines, TinyAya-Fire pour celles d’Asie du Sud, et TinyAya-Water couvrant l’Asie-Pacifique, l’Asie de l’Ouest et l’Europe. Ces modèles, entraînés avec une infrastructure modeste utilisant un cluster de 64 GPU Nvidia H100, sont particulièrement adaptés aux chercheurs et développeurs souhaitant construire des applications pour des publics parlant des langues indigènes. En se concentrant sur l’exécution locale, ils permettent également la traduction hors ligne, une nécessité dans des pays où l’accès à Internet peut être limité.

Disponibles sur HuggingFace, Kaggle, et Ollama, ces modèles peuvent être facilement téléchargés pour un déploiement local. Cohere a également prévu de publier un rapport technique détaillant sa méthodologie d’entraînement, ainsi que des ensembles de données pour l’évaluation et la formation sur HuggingFace. La stratégie de l’entreprise, qui réalise ses modèles à partir de ressources relativement modestes, vise à démocratiser l’accès à une IA multilingue performante et accessible à tous.

Le PDG de Cohere, Aidan Gomez, avait déjà évoqué l’année dernière la perspective d’une introduction en bourse « prochaine ». À la fin de 2025, la société affichait un chiffre d’affaires annuel récurrent de 240 millions de dollars, avec une croissance trimestrielle de 50%. Avec cette nouvelle initiative, cohérence et ouverture technologique montrent l’engagement de Cohere à soutenir la diversité linguistique à l’échelle mondiale, notamment dans des pays à forte diversité linguistique comme l’Inde.

Partagez cet article
article précédent

Congé de CSP : une appellation trompeuse, voici ce qu’il faut savoir

article suivant

FFmpeg – Comment normaliser le volume audio proprement avec loudnorm – Korben

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles