La société d’IA d’Elon Musk, xAI, a tardivement publié lundi son dernier modèle phare d’IA, Grok 3, et a dévoilé de nouvelles capacités pour les applications Grok iOS et web. Grok, la réponse de xAI à des modèles tels que le GPT-4o d’OpenAI et Gemini de Google, peut analyser des images, répondre à des questions et alimente de nombreuses fonctionnalités sur le réseau social de Musk, X. Grok 3, qui était en développement depuis plusieurs mois, était optimistiquement destiné à être lancé en 2024, mais il a manqué cette échéance. Lundi est un lancement ambitieux. xAI a utilisé un immense data center à Memphis contenant environ 200 000 GPU pour entraîner Grok 3.
Dans une publication sur X, Musk a déclaré que Grok 3 a été développé avec “10x” plus de puissance de calcul que son prédécesseur, Grok 2, en utilisant un ensemble de données d’entraînement élargi qui inclut vraisemblablement des dépôts de dossiers judiciaires. “Grok 3 est un ordre de grandeur plus capable que Grok 2”, a déclaré Musk lors d’une présentation en direct lundi. “[C’est une] IA qui cherche au maximum la vérité, même si cette vérité est parfois en contradiction avec ce qui est politiquement correct”. Grok 3 est une famille de modèles, pour être précis. Une version plus petite de Grok 3, Grok 3 mini, répond plus rapidement aux questions au détriment de certaines précisions.
“Pas tous les modèles et les fonctions connexes de Grok 3 sont disponibles pour l’instant (certains sont en version bêta), mais ils ont commencé à être déployés lundi.”
xAI affirme que Grok 3 bat GPT-4o sur des benchmarks comprenant AIME (qui évalue les performances d’un modèle sur un échantillon de questions de mathématiques) et GPQA (qui évalue les modèles en utilisant des problèmes de physique, de biologie et de chimie au niveau doctorat). Une version préliminaire de Grok 3 a également obtenu des scores compétitifs dans Chatbot Arena, un test participatif qui oppose différents modèles d’IA et fait voter les utilisateurs sur leurs réponses préférées, selon xAI.
Deux modèles de la nouvelle famille Grok 3, Grok 3 Reasoning et Grok 3 mini Reasoning, peuvent “réfléchir” soigneusement aux problèmes, similaires aux modèles “raisonnants” comme le o3-mini d’OpenAI et le R1 de la société chinoise d’IA DeepSeek. Les modèles de raisonnement tentent de s’auto-vérifier avant de donner des résultats, ce qui les aide à éviter certains des pièges qui déroutent normalement les modèles. xAI prétend que Grok 3 Reasoning dépasse la meilleure version de o3-mini – o3-mini-high – sur plusieurs benchmarks populaires, y compris un benchmark de mathématiques plus récent appelé AIME 2025.
Dans le futur – peut-être dès une semaine à partir de maintenant – l’application Grok gagnera un “mode voix”, a déclaré Musk, ce qui donnera aux modèles Grok une voix synthétisée. Quelques semaines après cela, les modèles Grok 3 seront disponibles via l’API de l’entreprise de xAI, ainsi que la capacité de DeepSearch. xAI prévoit d’ouvrir le code source de Grok 2 dans les prochains mois, a déclaré Musk. Il n’est pas encore clair si xAI a atteint cet objectif, et quelles pourraient en être les conséquences.