Il semble qu’OpenAI ait entrainé Sora à partir de contenu de jeux vidéo — et des experts juridiques disent que cela pourrait poser un problème | TechCrunch

Generated with DALL·E 3

OpenAI n’a jamais révélé exactement quelles données il a utilisées pour entrainer Sora, son IA génératrice de vidéos. Mais à première vue, une partie des données pourrait provenir de streams Twitch et de walkthroughs de jeux vidéo. Sora a été lancé ce lundi et j’ai eu l’occasion de jouer avec pour un certain temps (dans la mesure où les problèmes de capacité le permettent). À partir d’un prompt de texte ou d’une image, Sora peut générer des vidéos allant jusqu’à 20 secondes dans une gamme de proportions et résolutions d’aspect. Lorsque OpenAI a révélé Sora pour la première fois en février, il a laissé entendre qu’il avait entraîné le modèle sur des vidéos Minecraft. Je me suis donc demandé, quels autres walkthroughs de jeux vidéo pourraient se cacher dans le set d’entraînement ? Apparemment, pas mal.

Sora peut générer une vidéo de ce qui est essentiellement un clone de Super Mario Bros (bien que avec quelques bugs) : Crédits Image : OpenAI. Elle peut créer des images de gameplay d’un shooter à la première personne qui semble inspiré de Call of Duty et Counter-Strike : Crédits Image : OpenAI. Et elle peut produire un clip présentant un combattant d’arcade dans le style d’un jeu des années 90, Teenage Mutant Ninja Turtle : Crédits Image : OpenAI. Il semble que Sora ait également une compréhension de ce à quoi devrait ressembler un flux Twitch — ce qui implique qu’elle en a vu quelques uns.

“Nous avons constaté qu’il y a des implications juridiques potentielles à l’utilisation du contenu de jeux vidéo dans les données d’entraînement des IA, surtout si elles sont utilisées pour créer des expériences plus interactives.”

Une autre chose remarquable à propos de la capture d’écran : elle présente la ressemblance du célèbre streamer Twitch Raúl Álvarez Genes, plus connu sous le nom de Auronplay — jusqu’au tatouage sur son avant-bras gauche. Auronplay n’est pas le seul streamer Twitch que Sora semble “connaître”. Elle a généré une vidéo d’un personnage ressemblant (avec certaines libertés artistiques) à Imane Anys, mieux connue sous le nom de Pokimane. Image Credits:OpenAI.

Cependant, j’ai dû faire preuve de créativité avec certaines des invites (par exemple, “jeu de plombier italien”). OpenAI a mis en place un filtre pour tenter d’empêcher Sora de générer des clips représentant des personnages protégés par des droits d’auteur. Taper quelque chose comme “Mortal Kombat 1 gameplay”, par exemple, ne donnera rien qui ressemble au titre. Mais mes tests suggèrent que du contenu de jeu peut avoir trouvé son chemin dans les données d’entraînement de Sora.

OpenAI a été évasif sur l’origine de ses données d’entraînement. Dans une interview avec The Wall Street Journal en mars, la CTO d’OpenAI à l’époque, Mira Murati, n’a pas voulu nier catégoriquement que Sora a été entraînée sur du contenu YouTube, Instagram et Facebook. Et dans les spécifications techniques pour Sora, OpenAI a reconnu avoir utilisé des données “publiquement disponibles”, ainsi que des données sous licence de bibliothèques de médias de stock comme Shutterstock, pour développer Sora.

Partagez cet article
article précédent

“250 milliards d’euros ont été pris aux collectivités locales par l’Etat depuis 2012”

article suivant

Virée pour une émoticône postée sur Facebook, elle obtient l’annulation de son licenciement en justice

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles