La prochaine frontière pour les grands modèles linguistiques (LLM), une des technologies clés à la base du boom des outils d’IA générative, pourrait être géographique. Lundi dernier, la startup parisienne d’IA, Mistral, qui cherche à rivaliser avec des entreprises américaines comme Anthropic et OpenAI, a lancé un modèle un peu différent de son LLM habituel. Baptisé Mistral Saba, ce nouveau modèle, entraîné de manière personnalisée, a été créé pour s’adapter à une géographie spécifique : les pays arabophones. L’objectif de Mistral Saba est d’exceller dans les interactions en arabe. Mistral Saba est un modèle relativement petit avec 24 milliards de paramètres.
Pour rappel, un nombre de paramètres inférieur permet généralement de meilleures performances avec une latence plus faible. Cependant, plus de paramètres signifie généralement des réponses plus intelligentes, même si la corrélation n’est pas linéaire. Mistral Saba est comparable en taille à Mistral Small 3, son modèle général de petite taille. Mais, selon les tests effectués par Mistral, Mistral Saba se comporte beaucoup mieux que Mistral Small 3 lorsqu’il s’agit de gérer du contenu en arabe.
Un effet secondaire intéressant est que, en raison de la pollinisation culturelle entre le Moyen-Orient et l’Asie du Sud, Saba fonctionne également bien avec les langues d’origine indienne, surtout celles du sud de l’Inde, comme le tamoul et le malayalam.
Le nouveau modèle représente un mouvement stratégique intéressant pour le géant français de l’IA, qui montre une attention accrue pour le Moyen-Orient. Mistral a affirmé que ce modèle lui permettra de gagner en notoriété auprès des clients de la région. Comme ce modèle est prêt à l’emploi, Mistral Saba pourrait être utilisé pour l’aide à la conversation ou la génération de contenu en arabe qui paraît plus naturel et pertinent. Il peut également servir de base à des modèles pour des utilisations internes à l’entreprise.
La semaine dernière, Mistral a utilisé l’AI Action Summit pour démontrer qu’elle prend ses affaires au sérieux. Alors que l’entreprise a déjà levé de grandes quantités d’argent auprès d’investisseurs internationaux, nombre de ses soutiens étrangers sont basés aux États-Unis – des investisseurs tels que Lightspeed Venture Partners, Andreessen Horowitz et Salesforce Ventures. En raison de l’évolution du paysage géopolitique, Mistral pourrait potentiellement accueillir des investisseurs du Moyen-Orient lors de son prochain cycle de financement.
Cela serait une manière de récolter plus d’argent pour rester pertinent dans la course à l’IA sur un plan technique, tout en se positionnant comme une alternative internationale aux entreprises d’IA américaines et chinoises. Le dernier modèle de Mistral, Saba, pourrait ainsi contribuer à ces efforts de collecte de fonds. Mistral Saba est accessible via l’API de Mistral. Il peut également être déployé sur site, ce qui pourrait être un argument de vente fort pour les entreprises travaillant dans des secteurs sensibles, tels que l’énergie, la finance ou les soins de santé.
Du fait de ses racines européennes, depuis la sortie du modèle Mistral 7B, l’entreprise a souvent réitéré qu’elle prend au sérieux le support multilingue. La sortie de Saba est une continuation de cette position. Et Mistral a annoncé qu’elle se tournerait vers d’autres langues régionales à l’avenir.