À partir de aujourd’hui, les développeurs qui utilisent l’API Gemini de Google et son Google AI Studio pour créer des services et des bots basés sur l’IA seront en mesure d’ancrer les résultats de leurs invites avec des données provenant de Google Search. Cela devrait permettre des réponses plus précises basées sur des données plus récentes. Comme c’était le cas auparavant, les développeurs pourront essayer gratuitement l’ancrage dans AI Studio, qui est essentiellement le terrain de jeu de Google pour les développeurs afin de tester et d’affiner leurs invites, et d’accéder à ses derniers modèles de langage de grande taille (LLM). Les utilisateurs de l’API Gemini devront être sur le plan payant et paieront 35 $ pour 1 000 requêtes ancrées.
Le mode de comparaison intégré récemment lancé par AI Studio facilite la visualisation de la différence entre les résultats des requêtes ancrées et ceux qui reposent uniquement sur les données du modèle. Au cœur de l’ancrage, on trouve la connexion d’un modèle à des données vérifiables — qu’il s’agisse des données internes d’une entreprise ou, dans ce cas, du catalogue de recherche complet de Google. Cela aide également le système à éviter les hallucinations.
Dans un exemple que Google m’a montré avant le lancement d’aujourd’hui, une invite demandant qui a remporté l’Emmy de la meilleure série comique en 2024, le modèle — sans ancrage — a dit que c’était “Ted Lasso”. Mais c’était une hallucination. “Ted Lasso” a remporté le prix, mais en 2022. Avec l’ancrage activé, le modèle a fourni le résultat correct (“Hacks”), a inclus du contexte supplémentaire et a cité ses sources.
“Activer l’ancrage est aussi simple que d’activer un interrupteur et de décider à quelle fréquence l’API doit utiliser l’ancrage en modifiant le paramètre de “récupération dynamique”.”
La possibilité d’enrichir les résultats avec des données provenant de Google Search est aussi simple qu’activer un interrupteur et de décider à quelle fréquence l’API doit utiliser l’ancrage en modifiant le paramètre de “récupération dynamique”. Cela pourrait être aussi simple que de décider de l’activer pour chaque invite ou de choisir un paramètre plus nuancé qui utilise ensuite un modèle plus petit pour évaluer l’invite et décider si elle bénéficierait d’un enrichissement avec des données provenant de Google Search.
Lorsque Google enrichit les résultats avec des données provenant de Google Search, il fournit également des liens de soutien vers les sources sous-jacentes. Logan Kilpatrick, qui a rejoint Google plus tôt cette année après avoir précédemment dirigé les relations avec les développeurs chez OpenAI, m’a dit que l’affichage de ces liens est une exigence de la licence Gemini pour quiconque utilise cette fonctionnalité.