Creative Commons débute CC signals, un cadre pour un écosystème AI ouvert

Generated with DALL·E 3

“`html

Creative Commons, l’organisation à but non lucratif qui a propulsé le mouvement des licences permettant aux créateurs de partager leurs œuvres tout en conservant leurs droits d’auteur, se prépare désormais à l’ère de l’IA. Mercredi, l’organisation a annoncé le lancement d’un nouveau projet, CC signals, qui permettra aux détenteurs de jeux de données de préciser comment leur contenu peut ou ne peut pas être réutilisé par les machines, comme dans le cas de la formation des modèles d’IA. L’idée est de trouver un équilibre entre la nature ouverte d’Internet et la demande croissante de données pour alimenter l’IA.

Comme l’explique Creative Commons dans un billet de blog, l’extraction de données en cours pourrait éroder l’ouverture d’Internet et amener les entités à restreindre l’accès à leurs sites ou à les protéger par des paywalls, au lieu de partager l’accès à leurs données. Le projet CC signals, en revanche, vise à fournir une solution juridique et technique offrant un cadre pour le partage de données destiné à être utilisé entre ceux qui contrôlent les données et ceux qui les utilisent pour entraîner des modèles d’IA.

“CC signals sont conçus pour maintenir le bien commun à l’ère de l’IA,” Anna Tumadóttir, PDG de Creative Commons.

La demande pour un tel outil est en forte hausse, alors que les entreprises essaient de modifier leurs politiques et leurs conditions d’utilisation pour soit limiter l’entraînement de l’IA sur leurs données, soit expliquer dans quelle mesure elles utiliseront les données des utilisateurs à des fins liées à l’IA. Par exemple, X a initialement apporté un changement permettant aux tiers d’entraîner leurs modèles sur ses données publiques, avant de revenir sur cette décision. Reddit utilise son fichier robots.txt pour restreindre les bots d’extraction de leurs données pour l’entraînement de l’IA. De son côté, Cloudflare envisage une solution visant à facturer les bots d’IA pour l’extraction de données, ainsi que des outils pour les tromper.

Le projet CC signals propose plutôt une solution différente : un ensemble d’outils offrant un éventail d’applicabilité légale et avec un poids éthique, similaire aux licences CC qui couvrent aujourd’hui des milliards d’œuvres créatives sous licence ouverte en ligne. “Tout comme les licences CC ont contribué à bâtir le web ouvert, nous croyons que les CC signals aideront à façonner un écosystème IA ouvert basé sur la réciprocité,” a déclaré Anna Tumadóttir lors de l’annonce.

Le projet commence tout juste à prendre forme. Des conceptions préliminaires ont été publiées sur le site Web de Creative Commons et sur leur page GitHub. L’organisation recherche activement des retours du public avant ses projets de lancement alpha (test préliminaire) en novembre 2025. Elle organisera également une série de rencontres pour recueillir des commentaires et répondre à des questions.

“`

Partagez cet article
article précédent

“Festival RH, deux jours pour retrouver du plaisir à faire son métier”

article suivant

Rubrik acquiert Predibase pour accélérer l’adoption des agents IA

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles