Les sociétés d'IA accusées de la «plus grande piratage national de l'IP dans l'histoire de notre nation» à l'audience du Congrès dirigée par Maga Republican

Le mouvement MAGA du président Donald Trump a vu la division dans ses rangs récemment sur un certain nombre de questions allant du bombardement de l'Iran et du «grand projet de loi sur la controverse autour de l'affaire Jeffrey Epstein.

Maintenant, nous pouvons en ajouter une autre à la liste: la question de savoir s'il s'agit d'une «utilisation équitable» pour que les entreprises d'IA utilisent du matériel protégé par le droit d'auteur sans l'autorisation de former leurs modèles d'IA.

De l'avis du Sen républicain du Missouri, le sénateur Josh Hawley – largement considéré comme un allié Maga, bien qu'il ait parfois brisé avec le président Trump sur certaines questions – la réponse est non.

Lors d'une audience du sous-comité de la commission judiciaire du Sénat présidé par le sénateur Hawley mardi 16 juillet, des experts juridiques ont accusé des sociétés d'IA telles que Méta et Anthropique de piratage pur et simple dans leurs efforts pour améliorer autant de données que possible pour leurs outils d'IA génératifs.

«Alors que les sociétés de l'IA se sont précipitées pour se dépasser, beaucoup d'entre elles se sont tournées vers des sites Web pirates illégaux – des référentiels massifs de dizaines de millions d'œuvres protégées par le droit d'auteur – pour obtenir du texte pour leurs modèles d'IA», avocat Maxwell Pritt de Boies Schiller Flexner LLP dit au sous-comité.

«En pirant ces œuvres gratuitement plutôt que de les acheter ou de les licencier auprès des titulaires de droits d'auteur, les sociétés d'IA ont construit une industrie de plusieurs milliards de dollars généralement sans payer un seul centime aux créatifs dont les œuvres alimentent leurs produits ou les éditeurs chargés d'introduire et de fournir ces travaux au public.»

Pritt a accusé les principales sociétés d'IA des États-Unis de «ce qui est probablement le plus grand piratage national de la propriété intellectuelle de l'histoire de notre pays. Ce piratage comprend des centaines de téraoctets de données et plusieurs millions d'œuvres, y compris, par exemple, au moins 12 livres rédigés par des membres de ce sous-comité.»

Pritt, qui a déclaré qu'il plaide des affaires contre des sociétés de l'IA comme Meta, Openai, Github et Médialesdits documents de l'entreprise montrent que, à Meta, « Mark Zuckerberg lui-même a fait l'appel «pour pirater de grandes quantités de matériel protégé par le droit d'auteur.

Pendant ce temps, des documents chez Anthropic – qui combat une affaire de violation du droit d'auteur apporté par des éditeurs musicaux, notamment Groupe de musique universel – «Montrez un mépris flagrant de nos lois sur le droit d'auteur, préférant aux livres des pirates pour éviter ou retarder le« slog juridique / pratique / entreprise », en tant que co-fondateur et PDG d'Anthropic Dario Amodei Mettez-le.

«Alors que les sociétés d'IA se sont précipitées pour se dépasser, beaucoup d'entre elles se sont tournées vers des sites de pirates illégaux – des référentiels massifs de dizaines de millions d'œuvres protégées par le droit d'auteur – pour obtenir du texte pour leurs modèles d'IA.»

Maxwell Pritt, Boies Schiller Flexner LLP

Pritt a présenté les communications internes de Meta montrant que le personnel était conscient que leurs pratiques étaient illégales.

« C'est le piratage (et nous connaissons et étant des complices) qui est le problème », a déclaré un employé de Meta, tandis qu'un autre a écrit: «S'il existe une couverture médiatique suggérant que nous avons utilisé un ensemble de données que nous savons être piratés, tels que [book piracy site] Libgen, cela peut saper notre position de négociation avec les régulateurs sur ces questions. »

Le sénateur Hawley ne s'est pas secret de sa position sur la question.

« Les entreprises d'IA forment leurs modèles sur le matériel volé, point final … et nous ne parlons pas de ces entreprises qui parcourent simplement Internet pour ce qui est accessible au public. Nous parlons de piratage », a déclaré le sénateur Hawley.

«Allons-nous protéger [Americans’ creative community]ou allons-nous permettre à quelques méga-sociétés de tout aspirer, de la digérer et de gagner des milliards de dollars de bénéfices – peut-être des billions – et de ne payer personne pour cela? Ce n'est pas l'Amérique.

La position de Hawley le place en désaccord avec le président Trump, qui a été considéré comme un côté des entreprises technologiques dans la race de l'IA. Le récent «Big Beautiful Bill» des républicains comprenait initialement une disposition qui aurait empêché les États américains de réglementer l'IA au niveau de l'État, avant d'être retiré du projet de loi.

Dans de nombreuses poursuites déposées par les titulaires de droits d'auteur, les sociétés de l'IA se défendent en prétendant que leur utilisation non autorisée du contenu protégé par le droit d'auteur équivaut à une «utilisation équitable» en vertu de la loi sur le droit d'auteur américain. Deux décisions récentes des juges fédéraux sont descendus des côtés opposés de cet argument.

Dans une affaire portée par des auteurs de livres contre Anthropic, juge William Alsup du tribunal de district américain du district nord de la Californie a conclu que l'utilisation non autorisée d'Anthropic des livres considérait comme une «utilisation équitable» – mais son utilisation de livres piratés n'a pas considéré comme une utilisation équitable. Anthropic devra désormais faire face à une audience pour déterminer la taille des dommages qu'il doit payer.

«Allons-nous protéger [Americans’ creative community]ou allons-nous permettre à quelques méga-sociétés de tout aspirer, de la digérer et de gagner des milliards de dollars de bénéfices – peut-être des billions – et de ne payer personne pour cela? Ce n'est pas l'Amérique.

Le sénateur Josh Hawley

Quelques jours plus tard, dans une affaire déposée par le comédien Sarah Silverman et d'autres auteurs de livres contre Meta, juge Vince Chhabria du même tribunal de district a conclu que la formation de modèles d'IA sur le contenu protégé par le droit d'auteur pris sans autorisation est pas Utilisation équitable – bien qu'il ait statué contre Silverman et les autres auteurs au motif qu'ils avaient fait de mauvais arguments pour prouver leur cas.

David SacksL'IA du président Trump et le Czar crypto, sont tombés du côté du juge dans l'affaire anthropique qui a statué en faveur de l'argument de la «remise à usage équitable».

« Il est très important que nous nous retrouvions avec une définition raisonnable d'utilisation équitable comme celle que le juge a proposé dans cette affaire anthropique, car sinon nous perdrons la course de l'IA auprès de la Chine », a déclaré Sacks lors d'un récent épisode du podcast qu'il co-host.

Lors de l'audience du Congrès mardi, Pritt a fait valoir que les sociétés de l'IA avaient prévu ces affaires judiciaires et avaient toujours prévu d'utiliser la défense de la «remise des cours». Après avoir été capturé «à plat» par la sortie d'Openai de Chatgpt à la fin de 2022, les sociétés de l'IA se sont retrouvées dans une course pour publier des produits de l'IA génératrices, a-t-il déclaré.

«L'analyse coûts-avantages était simple… dépenser du temps et des ressources pour acquérir légalement les droits des livres et des articles protégés par les droits d'auteur de ceux qui détiennent les droits; ou les piratent tous gratuitement maintenant sur des sites Web illégaux et verser des dommages-intérêts des litiges plus tard – ou, encore plus attrayants, ne paient rien du tout s'ils peuvent convaincre les courts pour excuser leur piratie commerciale non déconseillée comme une utilisation équitable.»