L’organisation à but non lucratif Creative Commons, qui a initié le mouvement des licences libres permettant aux créateurs de partager leurs œuvres tout en conservant les droits d’auteur, se prépare à entrer dans l’ère de l’intelligence artificielle. Mercredi, l’organisation a annoncé le lancement d’un nouveau projet, CC Signals, qui permettra aux détenteurs de jeux de données de définir comment leur contenu peut ou ne peut pas être réutilisé par les machines, notamment pour l’entraînement de modèles d’IA.

Le besoin d’un équilibre entre l’ouverture d’Internet et la demande de données pour l’IA

L’idée derrière CC Signals est de créer un équilibre entre la nature ouverte d’Internet et la demande croissante de données pour alimenter l’IA. Selon Creative Commons, l’extraction continue de données pourrait éroder l’ouverture d’Internet et pourrait voir les entités fermer leurs sites ou les protéger derrière des paywalls, au lieu de partager l’accès à leurs données. Le projet CC Signals vise à fournir une solution légale et technique qui offre un cadre pour le partage de jeux de données destiné à être utilisé entre les détenteurs de données et les utilisateurs qui les utilisent pour entraîner des modèles d’IA.

Les entreprises et les développeurs open source se préparent à l’ère de l’IA

La demande pour un outil comme CC Signals est en augmentation, car les entreprises et les développeurs open source s’efforcent de modifier leurs politiques et conditions de service pour limiter ou expliquer l’utilisation de leurs données pour l’entraînement d’IA. Par exemple, X a initialement permis aux tiers de former leurs modèles sur ses données publiques, avant de révoquer cette décision. Reddit utilise son fichier robots.txt pour restreindre les bots qui scrapent ses données pour l’entraînement d’IA. Cloudflare explore une solution qui chargerait les bots d’IA pour le scraping, ainsi que des outils pour les confondre. Les développeurs open source ont également construit des outils pour ralentir et gaspiller les ressources des bots d’IA qui ne respectent pas leurs directives « no crawl ». Le projet CC Signals propose une solution différente : un ensemble d’outils qui offrent une gamme de force légale, mais tous ont un poids éthique, semblable aux licences CC qui couvrent aujourd’hui des milliards d’œuvres créatives ouvertes en ligne.

Le lancement d’CC Signals et son avenir

Le projet CC Signals est encore en cours de développement. Les conceptions initiales ont été publiées sur le site web de Creative Commons et sur sa page GitHub. L’organisation cherche activement des commentaires publics avant de lancer une version alpha en novembre 2025. Elle organisera également une série de réunions pour recueillir des commentaires et des questions. « Les signaux CC sont conçus pour soutenir le commun dans l’ère de l’IA », a déclaré Anna Tumadóttir, directrice générale de Creative Commons. « Tout comme les licences CC ont aidé à construire le web ouvert, nous croyons que les signaux CC aideront à façonner un écosystème d’IA ouvert fondé sur la réciprocité. »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *