Google dit avoir corrigé la fonction de génération de personnes de Gemini | TechCrunch

Generated with DALL·E 3

En février dernier, Google a suspendu la capacité de son chatbot alimenté par l’IA, Gemini, à générer des images de personnes après que les utilisateurs se sont plaints d’inexactitudes historiques. Par exemple, lorsqu’on lui demandait de représenter “une légion romaine”, Gemini montrait un groupe de soldats de races diverses anachroniquement, tout en représentant les “guerriers Zulu” de manière stéréotypée noire. Sundar Pichai, le PDG de Google, s’est excusé, et Demis Hassabis, le co-fondateur de la division de recherche en IA de Google, DeepMind, a déclaré qu’une solution devrait arriver “en très peu de temps” – dans les semaines suivantes. Cependant, cela a finalement pris beaucoup plus de temps que cela (malgré le fait que certains googlers aient fait des semaines de travail de 120 heures!). Mais dans les prochains jours, Gemini sera à nouveau en mesure de créer des images montrant des personnes.

Néanmoins, seuls certains utilisateurs, et plus précisément ceux inscrits à un des plans payants de Google Gemini, Gemini Advanced, Business ou Enterprise, retrouveront la fonctionnalité de génération de personnes de Gemini dans le cadre d’un test d’accès anticipé, en anglais uniquement. Google n’a pas dit quand le test sera étendu à la version gratuite de Gemini et aux autres langues. “Gemini Advanced donne à nos utilisateurs un accès prioritaire à nos dernières fonctionnalités”, a déclaré un porte-parole de Google à TechCrunch. “Cela nous aide à recueillir des commentaires précieux tout en donnant accès en premier à une fonctionnalité très attendue à nos abonnés premium.”

“Nos efforts ont été axés sur les tests rigoureux de la génération de personnes avant de la réactiver.”

Alors, quelles corrections Google a-t-il apportées à la génération de personnes ? Selon l’entreprise, Imagen 3, le dernier modèle de génération d’images intégré à Gemini, contient des mesures d’atténuation pour rendre les images de personnes produites par Gemini plus “justes”. Par exemple, Imagen 3 a été formé sur des légendes générées par l’IA conçues pour “améliorer la diversité et la variété des concepts associés aux images dans [ses] données d’entraînement”, selon un article technique partagé avec TechCrunch. Et les données d’entraînement du modèle ont été filtrées pour “la sécurité”, plus “examinées … en tenant compte des questions d’équité”, affirme Google. Nous avons demandé plus de détails sur les données d’entraînement d’Imagen 3, mais le porte-parole n’a voulu dire que le modèle a été formé sur “un grand ensemble de données comprenant des images, du texte et des annotations associées”.

“Nous avons considérablement réduit le potentiel de réponses indésirables grâce à des tests intensifs en interne et en externe, en collaborant avec des experts indépendants pour assurer une amélioration continue,” a poursuivi le porte-parole. “Notre objectif a été de tester rigoureusement la génération de personnes avant de la réactiver.”

En parallèle d’Imagen 3, Google lance Gems pour Gemini – mais uniquement pour les utilisateurs de Gemini Advanced, Business et Enterprise. Comme les GPT d’OpenAI, les Gems sont des versions de Gemini sur mesure qui peuvent agir en tant qu'”experts” sur des sujets spécifiques (par exemple, la cuisine végétarienne). Voici comment Google les décrit dans un article de blog: “Avec Gems, vous pouvez créer une équipe d’experts pour vous aider à réfléchir à un projet difficile, à brainstormer des idées pour un événement à venir ou à rédiger la légende parfaite pour un post sur les réseaux sociaux. Votre Gem peut également se souvenir d’un ensemble d’instructions détaillées pour vous aider à gagner du temps sur des tâches répétitives, ennuyeuses ou difficiles.” Pour créer un Gem, les utilisateurs écrivent des instructions, lui donnent un nom et ils sont prêts à l’action. Les Gems sont disponibles sur ordinateur et mobile dans 150 pays et “dans la plupart des langues”, selon Google (mais pas encore pris en charge dans Gemini Live).

Partagez cet article
article précédent

Nouvelle prolongation du régime d’assurance chômage – Centre Inffo

article suivant

OpenAI serait en pourparlers pour boucler un nouveau tour de financement à une valorisation supérieure à 100 milliards de dollars | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles