Google a annoncé le lancement officiel de son nouveau modèle d’intelligence artificielle, le Gemini 3 Flash, une version à la fois rapide et économique basée sur son modèle Gemini 3, déployé le mois dernier. Ce nouvel outil est conçu pour rivaliser avec OpenAI, en étant intégré comme modèle par défaut dans l’application Gemini et la recherche Microsoft Bing. Arrivé six mois après l’introduction du Gemini 2.5 Flash, cette avancée témoigne de la stratégie de Google pour renforcer sa position dans le domaine de l’IA générative.
Les performances du Gemini 3 Flash ont été particulièrement remarquables lors des benchmarks. Sur le Humanity’s Last Exam, un test d’expertise multidisciplinaire, il a obtenu un score de 33,7 %, surpassant largement ses prédécesseurs – notamment Gemini 2.5 Flash avec 11 % et Gemini 3 Pro avec 37,5 %. Il se positionne également au même niveau que GPT-5.2, qui a obtenu 34,5 %. Sur l’évaluation multimodale MMMU-Pro, le modèle a en outre obtenu un score sans précédent de 81,2 %, affirmant sa supériorité dans la compréhension et l’intégration du contenu multimédia.
“Ce modèle est conçu pour être un véritable cheval de trait pour les entreprises et les utilisateurs, combinant rapidité et efficacité tout en étant moins coûteux.”
Google déploie ainsi largement le Gemini 3 Flash comme le nouveau modèle par défaut dans son application Gemini, remplaçant le Gemini 2.5 Flash. Les utilisateurs peuvent continuer à sélectionner le modèle Pro pour des questions de mathématiques ou de codage, mais la majorité bénéficiera désormais de cette version plus performante. La société met en avant la capacité du modèle à identifier et exploiter le contenu multimodal, en permettant par exemple de télécharger une vidéo pour obtenir des conseils ou de créer des esquisses qui seront reconnues par l’IA, ou encore d’analyser un enregistrement audio, renforçant ainsi son usage dans divers contextes.
En outre, Google affirme que le Gemini 3 Flash s’améliore dans la compréhension de l’intention des utilisateurs, tout en générant des réponses plus visuelles, intégrant images et tableaux. La possibilité de créer des prototypes d’applications à partir de prompts via l’application Gemini promet une expérience plus interactive et accessible pour les développeurs. La disponibilité de Gemini 3 Pro à l’échelle nationale dans plusieurs contextes, notamment dans la recherche ou par des entreprises partenaires comme JetBrains, Figma ou Latitude, illustre la volonté de Google de démocratiser cette technologie.
Sur le plan commercial, Google a précisé que le modèle est accessible via Vertex AI et Gemini Enterprise, ainsi que dans une version preview par API, notamment à travers l’outil de codage Antigravity lancé récemment. Le prix de ce modèle s’établit à 0,50 dollar par million d’input tokens et 3 dollars par million de tokens générés, ce qui reste compétitif malgré une hausse par rapport à la version précédente. Google revendique cependant une vitesse de traitement trois fois supérieure et une réduction de 30 % de l’utilisation de tokens pour les tâches intellectuelles par rapport au Gemini 2.5 Pro, permettant ainsi aux entreprises de réduire leurs coûts opérationnels.
“Le modèle Gemini 3 Flash vise à devenir le modèle de référence pour les entreprises, alliant rapidité, coût réduit et capacités avancées dans un marché en pleine effervescence.”
Ce lancement s’inscrit dans un contexte de compétition intense avec OpenAI, qui a récemment dévoilé GPT-5.2 et accentué ses efforts pour maintenir sa position dans le secteur. La pression semble également à son comble après un rapport interne de Sam Altman, PDG d’OpenAI, évoquant une baisse de trafic sur ChatGPT et un besoin de redynamiser l’innovation. La réponse de Google, avec des modèles toujours plus performants et polyvalents, montre que le paysage de l’IA générative reste à la fois dynamique et concurrentiel, avec chaque acteur cherchant à dominer ce marché en pleine expansion.
