Lors de la conférence des développeurs Google I/O 2024 mardi, Google a annoncé qu’il construit Gemini Nano, le plus petit de ses modèles d’IA, directement dans le client de bureau Chrome, à partir de Chrome 126. Cela, selon l’entreprise, permettra aux développeurs d’utiliser le modèle sur appareil pour alimenter leurs propres fonctionnalités d’IA. Google prévoit d’utiliser cette nouvelle capacité pour alimenter des fonctionnalités comme l’outil existant “aidez-moi à écrire” de Workspace Lab dans Gmail, par exemple. L’entreprise affirme que c’est le travail récent sur le support WebGPU et WASM dans Chrome qui permet à ces modèles de fonctionner à une vitesse raisonnable sur un large ensemble de matériel.
Lors d’un briefing avant l’annonce de mardi, Jon Dahlke, directeur de la gestion de produits pour Chrome chez Google, a fait remarquer que Google était en pourparlers avec d’autres vendeurs de navigateurs pour activer cette fonction ou une fonction similaire dans leurs navigateurs. “Nous avons commencé à dialoguer avec d’autres navigateurs et nous ouvrirons un programme d’aperçu préliminaire pour les développeurs”, a écrit Dahlke dans l’annonce de mardi. “Avec webGPU, WASM et Gemini intégrés à Chrome, nous pensons que le web est prêt pour l’IA”.
“Je doute que la plupart des concurrents de Chrome souhaitent uniquement miser sur les modèles d’IA de Google. Ce qui est plus logique, c’est de permettre aux navigateurs – et aux développeurs – de faire fonctionner le modèle de leur choix.”
Google opterait clairement pour faire fonctionner Gemini pour ses applications, mais ces modèles sont suffisamment petits pour permettre aux développeurs de choisir celui qu’ils veulent pour leurs applications. Le pari de Google, cependant, est de permettre un certain nombre d’API de haut niveau dans Chrome pour traduire, légendes et transcrire en texte dans le navigateur à l’aide de ses modèles Gemini. “Pour livrer cette fonctionnalité, nous avons peaufiné notre version la plus efficiente de Gemini et optimisé Chrome,” Dahlke a dit lors de la keynote des développeurs d’aujourd’hui à I/O. “Maintenant, nous voulons vous donner accès aux modèles Gemini dans Chrome. Notre vision est de vous donner les modèles d’IA les plus puissants dans Chrome pour atteindre des milliards d’utilisateurs sans avoir à vous soucier de l’ingénierie rapide, du peaufinage, de la capacité et du coût. Tout ce que vous avez à faire est d’appeler quelques API de haut niveau – traduire, légendes, transcrire. C’est un grand changement pour le web et nous voulons bien le faire.”
Pour les développeurs, Google utilise désormais également le modèle Gemini Nano intégré pour alimenter certaines nouvelles fonctionnalités dans la console Chrome DevTools. Grâce à cela, les outils de développement Chrome peuvent maintenant expliquer les erreurs et fournir des solutions de débogage directement dans la console. Nous lançons une newsletter d’IA! Inscrivez-vous ici pour commencer à la recevoir dans vos boîtes de réception à partir du 5 juin.