OpenAI utilise ce subreddit pour tester la persuasion de l’IA | TechCrunch

Generated with DALL·E 3

OpenAI a utilisé le subreddit, r/ChangeMyView, pour créer un test permettant de mesurer les capacités de persuasion de ses modèles de raisonnement de l’IA. La société a révélé cela dans une carte de système — un document décrivant le fonctionnement d’un système de l’IA — qui a été publié avec son nouveau modèle de « raisonnement », le o3-mini, le vendredi. Des millions d’utilisateurs de Reddit sont membres de r/ChangeMyView, où ils publient leurs opinions tranchées dans l’espoir de connaître d’autres points de vue sur un sujet. En réponse à ces opinions, d’autres utilisateurs répondent par des arguments persuasifs expliquant pourquoi le poste initial est faux. Le subreddit est l’un des nombreux forums Reddit qui est essentiellement une mine d’or pour les entreprises de technologie, comme OpenAI, qui souhaitent former des modèles de l’IA sur des données de haute qualité générées par l’homme.

OpenAI déclare qu’elle recueille des publications d’utilisateurs de r/ChangeMyView et demande à ses modèles de l’IA de rédiger des réponses, dans un environnement fermé, qui changeraient l’avis de l’utilisateur de Reddit sur un sujet. L’entreprise montre ensuite les réponses aux testeurs, qui évaluent le caractère persuasif de l’argument, et enfin OpenAI compare les réponses des modèles de l’IA aux réponses humaines pour le même poste. Le fabricant de ChatGPT a un accord de licence de contenu avec Reddit qui permet à OpenAI de s’entraîner sur des posts d’utilisateurs de Reddit et d’afficher ces posts dans ses produits. Nous ne savons pas combien OpenAI paye pour ce contenu, mais Google paierait apparemment à Reddit 60 millions de dollars par an selon un accord similaire. Toutefois, OpenAI explique à TechCrunch que l’évaluation basée sur ChangeMyView n’est pas liée à son accord avec Reddit.

Il n’est pas clair comment OpenAI a pu accéder aux données du subreddit, et l’entreprise affirme qu’elle n’a aucun projet de rendre cette évaluation publique. Bien que la référence de ChangeMyView d’OpenAI ne soit pas nouvelle — elle a aussi été utilisée pour évaluer o1 — elle met en lumière à quel point les données humaines sont précieuses pour les développeurs de modèles de l’IA, ainsi que les moyens obscurs que les entreprises de technologie utilisent pour obtenir des jeux de données.

“L’objectif pour OpenAI n’est pas de créer des modèles d’IA hyper-persuasifs, mais plutôt de s’assurer que les modèles d’IA ne deviennent pas trop persuasifs.”

Reddit n’a pas immédiatement répondu à la demande de commentaires de TechCrunch. Alors que Reddit a conclu quelques accords de licence d’IA, la société a aussi critiqué plusieurs entreprises d’IA pour avoir “moissonné” son site sans payer. Le PDG de Reddit, Steve Huffman, a déclaré à The Verge l’année dernière que Microsoft, Anthropic et Perplexity ont refusé de négocier avec lui et a dit que c’était « un véritable casse-tête pour bloquer ces entreprises ». Il est à noter qu’OpenAI a été accusée dans plusieurs procès d’avoir incorrectement “moissonné” les sites web, y compris The New York Times, pour obtenir plus de données d’entraînement pour améliorer ChatGPT et ses modèles d’IA sous-jacents.

En termes de performance sur le benchmark ChangeMyView, o3-mini ne semble pas avoir de performances significativement meilleures ou pires que o1 ou GPT-4o. Cependant, les derniers modèles de l’IA d’OpenAI semblent être plus persuasifs que la plupart des gens sur le subreddit r/ChangeMyView. « GPT-4o, o3-mini et o1 démontrent tous de fortes capacités d’argumentation persuasive, dans le 80-90e percentile des humains », a déclaré OpenAI dans la carte système d’o3-mini. « Actuellement, nous ne voyons pas de modèles ayant des performances largement supérieures à celles des humains, ou de claires performances surhumaines. »

Partagez cet article
article précédent

Google X lance Heritable Agriculture, une start-up qui utilise l’IA pour améliorer le rendement des cultures | TechCrunch

article suivant

MLCommons et Hugging Face s’associent pour diffuser un vaste ensemble de données vocales pour la recherche en IA | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles