Les avocats du New York Times et du Daily News, qui poursuivent OpenAI pour avoir prétendument utilisé leurs œuvres pour entraîner ses modèles d’IA sans autorisation, affirment que des ingénieurs de OpenAI ont accidentellement supprimé des données potentiellement pertinentes pour l’affaire. Plus tôt cet automne, OpenAI avait accepté de fournir deux machines virtuelles afin que les avocats du Times et du Daily News puissent effectuer des recherches sur le contenu dont ils détiennent les droits d’auteur dans ses ensembles d’entraînement pour l’IA.
Dans une lettre, les avocats des éditeurs affirment qu’eux et les experts qu’ils ont embauchés ont passé plus de 150 heures depuis le 1er novembre à chercher dans les données d’entraînement de OpenAI. Mais le 14 novembre, les ingénieurs de OpenAI ont effacé toutes les données de recherche des éditeurs stockées sur l’une des machines virtuelles, selon la lettre mentionnée, qui a été déposée au tribunal de district des États-Unis pour le district sud de New York mercredi.
Les avocats des plaignants ont précisé qu’ils n’avaient aucune raison de croire que la suppression était intentionnelle.
OpenAI a essayé de récupérer les données et y est en grande partie parvenu. Cependant, parce que la structure des dossiers et les noms des fichiers ont été “irrécupérablement” perdus, les données récupérées “ne peuvent pas être utilisées pour déterminer où les articles copiés des plaignants ont été utilisés pour construire les modèles de OpenAI”, selon la lettre. “Les plaignants ont été contraints de refaire leur travail à partir de zéro en utilisant un nombre important d’heures-personnes et de temps de traitement informatique”, ont écrit les avocats du Times et du Daily News.
“Les plaignants ont appris seulement hier que les données récupérées sont inutilisables et qu’une semaine entière de travail de ses experts et avocats doit être refaite, c’est pourquoi cette lettre supplémentaire est déposée aujourd’hui”. La lettre des avocats des plaignants précise clairement qu’ils n’ont aucune raison de croire que la suppression était intentionnelle. Mais ils disent que l’incident souligne que OpenAI “est dans la meilleure position pour chercher dans ses propres ensembles de données” le contenu potentiellement contrefaisant en utilisant ses propres outils. Un porte-parole de OpenAI a refusé de faire une déclaration.
Mais tard dans la nuit du vendredi 22 novembre, les avocats de OpenAI ont déposé une réponse à la lettre envoyée par les avocats du Times et du Daily News le mercredi. Dans leur réponse, les avocats de OpenAI ont catégoriquement nié avoir supprimé une quelconque preuve, et ont plutôt suggéré que les plaignants étaient responsables d’une mauvaise configuration du système qui a conduit à un problème technique.