Jeudi dernier, Google a présenté une version « réimaginée » de son agent de recherche Gemini Deep Research, basé sur son modèle de fond ultramoderne, Gemini 3 Pro. Cette nouvelle version ne se limite pas à générer des rapports de recherche, bien qu’elle puisse continuer à le faire. Elle offre désormais aux développeurs la possibilité d’intégrer les capacités de recherche du modèle SATA de Google dans leurs propres applications, grâce à la nouvelle API Interactions. Cette API vise à offrir plus de contrôle aux développeurs dans l’ère de l’IA agentique, anticipant une évolution où les agents IA pourraient potentiellement remplacer la recherche traditionnelle par Google.
Le nouvel outil Gemini Deep Research est conçu comme un agent capable de synthétiser d’importantes quantités d’informations et de gérer des contextes complexes dans ses requêtes. Selon Google, il est déjà utilisé pour des tâches variées comme la vérification diligente ou la recherche sur la toxicité des médicaments. La société indique également qu’elle intégrera prochainement cet agent dans plusieurs de ses services, notamment Google Search, Google Finance, l’application Gemini, ainsi que NotebookLM, sa plateforme d’écriture collaborative. Avec cette initiative, Google semble préparer le terrain pour un avenir où l’humain ne dira plus « Google » mais laissera l’agent IA faire le travail.
Google affirme que Deep Research bénéficie du modèle Gemini 3 Pro, considéré comme le plus précis de la société, avec un entraînement visant à minimiser les hallucinations dans des tâches complexes.
Les problématiques liées aux hallucinations de l’IA — ces moments où le modèle invente des informations — restent cruciales, particulièrement dans les tâches nécessitant un long raisonnement. Plus un modèle doit prendre de décisions, plus le risque d’erreur s’accroît, pouvant invalider tout le résultat. En réponse, Google a développé un nouveau benchmark, nommé DeepSearchQA, pour tester ces agents dans des scénarios de recherche multi-étapes complexes. Ce benchmark a été open source, soulignant la volonté de Google de contribuer à la communauté de l’IA. Lors de tests effectués avec Deep Research, l’agent a surpassé ses concurrents sur ses propres benchmarks ainsi que sur Humanity’s Last Exam, un test de connaissances générales avec des tâches très pointues. Cependant, OpenAI, qui ne reste pas inactif, a lancé le 13 octobre son GPT 5.2, surnommé Garlic, qui semble surpasser Google dans plusieurs évaluations.
Le timing de ces annonces n’est pas anodin : Google a dévoilé ses avancées tout juste au moment où OpenAI annonçait la sortie de son nouveau modèle. Selon les performances en benchmark, GPT 5.2 d’OpenAI semble surpasser ses rivaux, y compris Google, dans une série d’évaluations classiques, ce qui confirme l’intensification de la compétition dans le domaine de l’IA de pointe. La rivalité entre ces géants du numérique promet de redessiner rapidement le paysage de l’intelligence artificielle, où chaque nouvelle version cherche à dépasser la précédente dans la course à la suprématie technologique.
Ainsi, face à la sortie simultanée de Google et d’OpenAI, le secteur de l’IA observe une alteration rapide et intense des leaders, laissant entrevoir une période de forte compétition et d’innovations disruptives à venir.
