Cette initiative met en lumière les défis posés par ces technologies qui créent du contenu à partir d’œuvres existantes, bouleversant ainsi les fondements traditionnels de la propriété intellectuelle et plus particulièrement le droit d’auteur.

Les systèmes d’intelligence artificielle générative reposent des modèles entraînés avec d’énormes volumes de données – souvent collectés par web scraping – pour produire du texte, des images, de la musique ou encore du code. Or, ces données contiennent fréquemment des œuvres protégées.

Cette réalité soulève une question centrale : dans quelle mesure l’utilisation de contenus sous droit d’auteur pour entraîner une IA est-elle licite ?

Pour y répondre, l’Union européenne a prévu des ajustements juridiques dans le cadre de la directive européenne sur le droit d’auteur « Copyright in the Digital Single Market » (CDSM). Celle-ci autorise le Text and Data Mining (TDM) sous certaines conditions, tout en permettant aux titulaires de droits de s’y opposer via des réserves explicites (opt-out) dans un format lisible par machine.

Le règlement européen sur l’intelligence artificielle (AI Act) va plus loin : il impose aux développeurs de modèles d’IA génériques de publier des résumés des données d’entraînement utilisées, et de garantir la traçabilité des contenus générés qui doivent être détectable de manière automatisée.

Plusieurs dispositifs  juridiques et techniques de réservation de droits sont explorés :

  • le fichier robots.txt des sites web,
  • les protocoles TDM,
  • les initiatives de certification comme C2PA.

Face aux défis, de nouvelles opportunités émergent, notamment en matière de licences directes. Des expérimentations sont en cours dans la presse et l’édition scientifique. Toutefois, ces initiatives exigent des mécanismes de réservation de droits efficaces et fiables, ainsi qu’une plus grande lisibilité juridique pour les acteurs concernés.

La diversité des approches et l’arrivée de technologies comme la RAG (Real-time Augmented Generation), qui mélange contenu généré et sources externes en temps réel, ajoutent une couche de complexité supplémentaire.

  • Fournir des outils pratiques aux créateurs pour gérer leurs droits face aux IA ;
  • Favoriser la transparence et la traçabilité des contenus générés ;
  • Accompagner la conclusion de licences adaptées ;
  • Réfléchir à une éventuelle protection des œuvres générées par IA.

Mai 2025

Guillaume Mortreux, cabinet Santarelli, Juriste Marques

Guillaume Mortreux

Juriste | Associé