Sarah Silverman poursuit OpenAI et Meta pour violation présumée du droit d’auteur dans la formation à l’IA

La comédienne Sarah Silverman est la principale plaignante dans un nouveau procès contre le fabricant de ChatGPT OpenAI qui allègue que la technologie d’intelligence artificielle de l’entreprise a violé les lois sur le droit d’auteur en s’entraînant sur le livre de Silverman « The Bedwetter ».

Le procès pourrait avoir des implications importantes pour l’industrie de la musique, où les inquiétudes grandissent depuis un certain temps quant au fait que les modèles d’IA pourraient violer la loi en s’entraînant sur du matériel protégé par le droit d’auteur.

Dans une plainte déposée auprès du tribunal de district américain du district nord de Californie, division de San Francisco, vendredi 7 juillet, les avocats de Silverman ont fait valoir qu’« une grande partie du matériel contenu dans les ensembles de données de formation d’OpenAI… provient d’œuvres protégées par le droit d’auteur, y compris des livres. écrits par des plaignants – qui ont été copiés par OpenAI sans consentement, sans crédit et sans compensation.

Silverman est l’un des trois auteurs de livres qui poursuivent OpenAI dans cette affaire. Les autres sont Christopher Golden, en relation avec son livre « Ararat », et Richard Kadrey, en relation avec son livre « Sandman Slim », le premier volume d’une série du même nom.

« Lorsque ChatGPT a été invité à résumer les livres écrits par chacun des plaignants, il a généré des résumés très précis », a poursuivi la plainte, ajoutant que cela signifie que « ChatGPT conserve la connaissance d’œuvres particulières dans l’ensemble de données de formation et est capable de produire un contenu textuel similaire. . À aucun moment ChatGPT n’a reproduit l’un des demandeurs d’informations sur la gestion des droits d’auteur inclus dans leurs œuvres publiées.

La génération actuelle d’algorithmes d’IA est formée sur de grands ensembles de données qui permettent à l’algorithme de détecter des modèles – qu’il s’agisse de mots ou de musique – et de les imiter de manière convaincante.

Vous pouvez lire la plainte complète contre OpenAI, ici.

Sur un site dédié des avocats, ils annoncent également avoir « déposé un premier recours collectif contre Meta » au nom de Sarah Silverman, Chris Golden et Richard Kadrey, « défiant LLaMA, un ensemble de grands modèles linguistiques formés en partie sur les livres protégés par le droit d’auteur ».

Vous pouvez lire cette plainte dans son intégralité, ici.

Le procès contre OpenAI fait valoir que, parce que ChatGPT a intégré les œuvres protégées par le droit d’auteur dans son algorithme, il peut lui-même être une « œuvre dérivée » couverte par le droit d’auteur.

«Parce que les modèles de langage OpenAI ne peuvent pas fonctionner sans les informations expressives extraites des œuvres des plaignants (et d’autres) et conservées à l’intérieur, les modèles de langage OpenAI enfreignent eux-mêmes des œuvres dérivées, réalisées sans l’autorisation des plaignants et en violation de leurs droits exclusifs en vertu du Loi sur le droit d’auteur », indique la plainte.

Le procès a été intenté par les avocats Joseph Saveri et Matthew Butterick, qui une semaine plus tôt avaient déposé un autre procès similaire contre OpenAI devant le même tribunal. Ce procès, au nom des auteurs Mona Awad, qui a écrit « Bunny » et « 13 Ways of Looking at a Fat Girl », et Paul Tremblay, auteur de « The Cabin at the End of the World », avance des arguments similaires à ceux du Silverman. costume.

Vous pouvez lire cette plainte dans son intégralité ici.

Alors que la technologie de l’IA prolifère à une vitesse vertigineuse depuis le dévoilement de ChatGPT en novembre dernier, les gouvernements du monde entier se sont efforcés d’élaborer des lois qui réglementeraient leur utilisation.

L’Union européenne est sans doute la plus avancée sur ce front, qui a adopté le mois dernier une législation connue sous le nom de loi sur l’IA. Parmi ses règles figure une exigence que les développeurs de « modèles fondamentaux » – des modèles d’IA, comme ChatGPT, qui peuvent être utilisés comme base pour créer des fonctions d’IA plus sophistiquées – seront tenus de divulguer s’ils ont utilisé du matériel protégé par le droit d’auteur dans la formation de leur des modèles.

De nouvelles réglementations en Chine ont une exigence similaire.

Aux États-Unis, l’Office des brevets a ouvert une consultation publique sur la manière de traiter les violations du droit d’auteur liées à l’IA, bien que le Congrès américain n’ait pas encore proposé de législation à ce sujet.

En revanche, le Japon ne semble pas évoluer dans la même direction. Plus tôt cette année, les commentaires du ministre de l’éducation, de la culture, des sports, de la science et de la technologie du pays ont indiqué que le gouvernement japonais considère l’utilisation de matériel protégé par le droit d’auteur pour la formation de l’IA comme une pratique acceptable, même lorsque ce matériel est hébergé en ligne illégalement – si longtemps car l’IA ne reproduit pas le matériel.


L’action en justice intentée par les auteurs contre OpenAI et Meta sera probablement surveillée de près par les sociétés d’enregistrement de musique ou d’autres titulaires de droits qui s’opposent à ce que leur matériel soit utilisé dans la formation de modèles d’IA.

Suite à la controverse sur le « faux Drake » plus tôt cette année, Universal Music Group (UMG), propriétaire des labels de Drake, a clairement indiqué qu’il considérait l’œuvre comme une violation de la loi sur le droit d’auteur.

« Nous [Universal] possèdent tous les sons capturés sur un enregistrement sonore », a déclaré Michael Nash, EVP et Chief Digital Officer chez UMG.

« Plus précisément, les sons similaires qui servent à confondre le public quant à la source ou à l’origine, ou qui constituent une appropriation commerciale de la ressemblance sous la forme d’une voix distinctive, sont tous clairement illégaux. »

Alors que les industries de la musique et d’autres médias tirent la sonnette d’alarme sur le fait que l’IA récupère du matériel protégé par le droit d’auteur sans autorisation, certaines entreprises technologiques ont récemment pris soin de souligner que leurs nouveaux modèles sont conformes aux lois sur le droit d’auteur.

Le mois dernier, le parent de Facebook, Meta, a dévoilé un générateur de texte en musique appelé MusicGen, qui, selon la société, a été formé sur 20 000 heures de musique sous licence.L’industrie de la musique dans le monde