En janvier dernier, Ed Newton-Rex – ancien cadre de Stability AI et fondateur de la plateforme d'IA de création musicale Jukedeck – a lancé Fairly Trained, une organisation à but non lucratif dont la mission est d'évaluer et de certifier la technologie d'IA sur la base de son respect des droits des créateurs. .
L'organisation à but non lucratif est en quelque sorte une croisade pour Newton-Rex, qui a démissionné de Stability AI par principe après que la société a soumis une déclaration au Bureau américain du droit d'auteur affirmant que la suppression de documents protégés par le droit d'auteur sans autorisation pour entraîner l'IA devrait être considérée comme une « utilisation équitable » en vertu du droit d'auteur. la loi.
C'est une position défendue par de nombreuses autres sociétés d'IA, notamment Anthropiquela société faisant face à une poursuite pour violation du droit d'auteur de la part de Groupe de musique universel pour son utilisation présumée non autorisée de paroles protégées par le droit d'auteur pour former son chatbot Claude AI.
Newton-Rex n'est pas d'accord avec cette position « parce que l'un des facteurs déterminant si l'acte de copie constitue un usage loyal, selon le Congrès, est « l'effet de l'utilisation sur le marché potentiel ou la valeur de l'œuvre protégée par le droit d'auteur » », a-t-il écrit. dans une chronique invitée pour MBW l’automne dernier.
« Les modèles d'IA génératifs d'aujourd'hui peuvent clairement être utilisés pour créer des œuvres qui concurrencent les œuvres protégées par le droit d'auteur sur lesquelles ils sont formés. Je ne vois donc pas comment l’utilisation d’œuvres protégées par le droit d’auteur pour former des modèles d’IA génératifs de cette nature peut être considérée comme une utilisation équitable.
Deux mois après la rédaction de cette chronique, Fairly Trained était opérationnel, et maintenant, l'organisation à but non lucratif semble avoir causé des dommages considérables à un point clé avancé par de nombreuses entreprises d'IA : qu'il n'est pas possible de former un grand modèle de langage (LLM ) sans utiliser des tonnes et des tonnes de matériel protégé par le droit d'auteur.
« Il n'y a aucune raison fondamentale pour laquelle les grands développeurs de modèles de langage ne peuvent pas travailler d'une manière qui respecte les droits des créateurs. »
Assez formé
Fairly Trained a annoncé mercredi 20 mars avoir certifié quatre nouvelles technologies d'IA comme étant exemptes de violation du droit d'auteur, y compris un grand modèle de langage : KL3M depuis 273 Entreprisesle premier LLM à être certifié par l'association.
« L'une des questions les plus fréquemment posées lors de notre lancement en janvier était de savoir s'il était réaliste de penser que nous serions en mesure de certifier des modèles linguistiques de grande envergure », a déclaré Fairly Trained dans un communiqué.
« Nous étions optimistes, car il n'y a aucune raison fondamentale pour que les grands développeurs de modèles de langage ne puissent pas travailler d'une manière qui respecte les droits des créateurs. L'annonce d'aujourd'hui répond à cette question et renforce notre croyance en un avenir dans lequel une approche équitable des données de formation est la norme.
« La certification incite les entreprises d’IA à se former sur des données sous licence et centre les créateurs humains dans le paysage de l’IA. Il s’agit d’une étape importante pour garantir que les auteurs humains obtiennent leur consentement et reçoivent une compensation pour l’utilisation de leurs œuvres dans le cadre de la formation en IA.
La guilde des auteurs
Fairly Trained a également annoncé avoir certifié Mod vocalla première entreprise proposant des modèles de parole et de chant IA à recevoir la certification.
De plus, deux sociétés de musique qui utilisent l’IA générative – Album infini et Limonaïde – ont également obtenu une certification, tout comme une « bande AI » appelée Orckings gelures.
« L'extension de la certification Fairly Trained à la génération de texte et de parole est une étape importante, car elle montre qu'il est possible de former des modèles d'IA génératifs de manière plus équitable dans n'importe quel domaine créatif », a déclaré Fairly Trained.
L'organisation à but non lucratif a également annoncé quatre nouveaux soutiens officiels du monde de la propriété intellectuelle et de la création de contenu : La guilde des auteurs, SAG-AFTRA, Forum des gestionnaires de musique – États-Uniset le Société américaine pour les licences de droits collectifs (ASCRL).
« Trop d'entreprises d'IA générative exploitent des œuvres protégées par le droit d'auteur sans autorisation », a déclaré l'Authors Guild.
« La certification incite les entreprises d’IA à se former sur des données sous licence et centre les créateurs humains dans le paysage de l’IA. Il s’agit d’une étape importante pour garantir que les auteurs humains obtiennent leur consentement et reçoivent une compensation pour l’utilisation de leurs œuvres dans le cadre de la formation en IA.