Suivre une industrie aussi dynamique que l’IA est une tâche ardue. Jusqu’à ce qu’une IA puisse le faire pour vous, voici un condensé des actualités récentes dans le monde de l’apprentissage automatique, ainsi que des recherches et des expériences notables que nous n’avons pas couvertes de manière isolée. D’ailleurs, TechCrunch prévoit de lancer une newsletter sur l’IA prochainement. Restez à l’écoute. Cette semaine en IA, huit journaux américains importants, détenus par le géant de l’investissement Alden Global Capital, dont le New York Daily News, le Chicago Tribune et l’Orlando Sentinel, ont poursuivi en justice OpenAI et Microsoft pour violation de droits d’auteur en relation avec l’utilisation des entreprises de la technologie IA génératrice. Ils accusent, à l’instar du New York Times dans son procès en cours contre OpenAI, OpenAI et Microsoft d’avoir utilisé leur propriété intellectuelle sans autorisation ni compensation pour créer et commercialiser des modèles génératifs tels que GPT-4.
“Nous avons dépensé des milliards de dollars pour recueillir de l’information et rapporter des nouvelles dans nos publications, et nous ne pouvons permettre à OpenAI et Microsoft d’élargir le playbook de la big tech en volant notre travail pour construire leurs propres entreprises à nos dépens”, a déclaré dans un communiqué Frank Pine, le rédacteur en chef qui supervise les journaux d’Alden. Le procès semble susceptible de se terminer par un règlement à l’amiable et un accord de licence, compte tenu des partenariats existants d’OpenAI avec les éditeurs et de sa réticence à faire reposer l’ensemble de son modèle économique sur l’argument de l’utilisation équitable. Mais qu’en est-il du reste des créateurs de contenu dont les œuvres sont emportées dans la formation de modèles sans rémunération ? Il semble qu’OpenAI y réfléchisse.
Mais que penser des autres créateurs de contenu dont les œuvres sont utilisées pour former des modèles, sans contrepartie financière ? Il semble qu’OpenAI se penche sur la question.
Un article de recherche récemment publié, co-écrit par Boaz Barak, un scientifique de l’équipe de superposition d’OpenAI, propose un cadre pour rémunérer les propriétaires de droits d’auteur “proportionnellement à leurs contributions à la création de contenu généré par l’IA”. Comment? Grâce à la théorie des jeux coopératifs. Le cadre évalue dans quelle mesure le contenu d’un ensemble de données d’entraînement – par exemple du texte, des images ou d’autres données – influence ce qu’un modèle génère, en utilisant un concept de la théorie des jeux connu sous le nom de valeur de Shapley. Ensuite, sur la base de cette évaluation, il détermine la “part légitime” (c’est-à-dire la rémunération) des propriétaires de contenu.
Supposons que vous ayez un modèle de génération d’images formé à l’aide d’œuvres de quatre artistes : John, Jacob, Jack et Jebediah. Vous lui demandez de dessiner une fleur dans le style de Jack. Avec le cadre, vous pouvez déterminer l’influence qu’a eu le travail de chaque artiste sur l’art généré par le modèle et, donc, la compensation que chacun devrait recevoir. Il y a cependant un inconvénient à ce cadre – il est coûteux en calcul. Les solutions des chercheurs s’appuient sur des estimations de compensation plutôt que sur des calculs exacts. Cela satisferait-il les créateurs de contenu ? Je ne suis pas si sûr. Si un jour OpenAI le met en pratique, nous le saurons certainement.
Voici quelques autres histoires notables en IA des derniers jours: ….