ChatGPT peut écrire de la musique : l'IA est-elle le dernier espoir des auteurs-compositeurs ?

MBW Views est une série d'articles d'opinion exclusifs rédigés par d'éminents personnalités de l'industrie musicale… avec quelque chose à dire. L'éditorial suivant provient de Ran Geffen Levy (encadré sur la photo), fondateur d'OG.studio, qui fournit des informations aux start-ups, entreprises et sociétés de capital-risque de technologie musicale. Il est également PDG d'Amusica Song Management en Israël.


Il y a quelques jours, j'ai demandé à ChatGPT4-o de créer une version pop et punk de « Harvest Moon » de Neil Young.

Il m'a fourni une notation et, à ma demande, a ajusté les paroles pour les adapter au genre, a suggéré une instrumentation, m'a donné une explication complète des modifications apportées à l'evergreen original et m'a donné des conseils marketing.

Voici la transcription de la conversation.

Mis à part les questions juridiques (j’y reviendrai sous peu), c’est une bonne chose. La composition musicale est un code binaire, un ADN – et les auteurs-compositeurs en sont propriétaires. La formation à l’IA ne correspond à aucune des règles existantes qui sous-tendent l’industrie musicale : il ne s’agit pas d’un droit mécanique, ni d’un droit d’exécution, et il n’y a pas de licence obligatoire. C'est pur et simple : une utilisation commerciale de la propriété intellectuelle.

Les auteurs-compositeurs et les éditeurs de musique vont enfin obtenir leur juste part. Lorsqu’il s’agit de formation sur les données, l’IA ne se soucie pas de savoir qui chante « Jolene », elle se soucie de la manière dont il a été écrit et de la raison pour laquelle il est devenu un succès.

Tout ce que nous devons faire, c'est nous assurer qu'ils s'en soucient qui l'a écrit et qu'ils soient indemnisés en conséquence. Le calcul est simple : un enregistrement équivaut à un enregistrement, mais une composition peut équivaloir à un nombre infini d’enregistrements. En matière d’IA, le pouvoir appartient aux auteurs-compositeurs.


Mais en ce moment, les auteurs-compositeurs sont foutus

Au début du siècle, j’ai participé à l’un des premiers contrats de licence de sonneries. Nous avons conclu un accord qui a donné aux auteurs-compositeurs et aux éditeurs 40 % du top. Les sonneries étaient des fichiers MIDI qui se vendaient comme des patates chaudes, et tous les bénéfices allaient directement dans les poches des auteurs.

Puis est arrivée la sonnerie polyphonique et on nous a demandé de partager les revenus avec les labels. J'ai décroché le téléphone et j'ai demandé à un grand éditeur que je représentais à l'époque : « C'est quoi ce bordel ? Aucun enregistrement n’est utilisé. Pourquoi devrions-nous partager les revenus avec les labels ? Sa réponse a été : C'est compliqué, et expliqué. Ma première pensée a été : nous sommes foutus.

Un quart de siècle plus tard, les auteurs-compositeurs se sont vu (encore une fois) privés de leur part minimale et légale de la manne du streaming, tandis que les autres acteurs de l'industrie conservent leurs tarifs et profitent des projets de Spotify pour une ère post-streaming axée sur la monétisation. de superfans.

La seule chose qui a changé depuis, c'est que les auteurs-compositeurs et les éditeurs ont désormais des partenaires sous la forme de fonds d'actions qui ont dépensé des milliards pour l'acquisition de leurs actions et se mettent donc à la place de l'auteur-compositeur. Ils voudront maximiser leur retour sur investissement. Voyez comment ils réagissent lorsque quelqu’un vient dévaloriser leurs actifs.


Qui a poussé l'ours ?

Que faut-il pour créer de la musique à l’aide de l’IA ? Plateformes capables de comprendre et de générer des paroles, des compositions et du son.

Module Paroles (LLM) : Formation axée sur les paroles des chansons avec des métadonnées et des informations théoriques sur la façon d'écrire des chansons.

J'ai demandé à Claude, Reka, Gemini et ChatGPT4 de transformer Troilus's Song de Geoffrey Chaucer de « Troilus and Criseyde » de Chaucer en pop et rock anglais modernes (Reka). Chaque IA a renvoyé de nouvelles versions de la chanson, y compris des explications détaillées des modifications. Quand j'ai demandé : « Comment savez-vous comment faire ça ? La réponse de Reka fut : J'ai passé des années à étudier et à analyser différentes formes de littérature et de musique. Cette expérience pratique m’a donné une compréhension nuancée de la façon d’adapter et de transformer des œuvres sur différents médiums et genres. : Trois des modules ont pu créer des versions du « Mambo Number 5 » de Dámaso Pérez Prado dans différents genres (Reka, Gemini, ChatGPT). Claude a refusé en raison de problèmes de droits d'auteur.

Module de Composition (LLM) : Formé à la mélodie et à l'harmonie (notes, accords) ainsi qu'au solfège (contrepoint, harmonie occidentale, etc.). aucun enregistrement n’est requis.

OpenAI a commencé son parcours de création musicale générative avec MuseNet basé sur ChatGPT2, qui a été formé uniquement sur des fichiers midi et a créé une carte pour montrer comment un compositeur a été influencé par d'autres. ChatGPT4 a pu générer la notation et les paroles d'une chanson pop basée sur le « Printemps » de Vivaldi.

À ma demande, il a converti « Bohemian Rhapsody » en « Bohemian Jazzody » (Arr. ChatGPT). Gemini a réussi à convertir « Harvest Moon » en K-Pop (y compris la notation et les paroles coréennes), et Reka a converti « Shallow » en chanson rock. Claude est capable de créer de nouveaux genres musicaux et de générer des codes de notation ABC pour générer des fichiers MIDI.

L'essentiel : nous pouvons désormais utiliser du texte brut pour créer de la nouvelle musique ou réorganiser des chansons existantes à l'aide des modules LLM AI. C'est maladroit, pour le moment, mais la technologie peut combler le fossé en un clin d'œil.

Sur la base de ce qui précède, il semble que les LLM aient déjà été formés sur les données des auteurs-compositeurs et puissent créer des œuvres dérivées protégées par la loi en vigueur. Blackstone a dépensé quelques milliards de dollars pour acheter les droits de « Harvest Moon » et « Shallow », tandis que Neil Young a de fermes convictions quant à l'utilisation de sa musique et que Queen est en train de vendre son catalogue pour une somme considérable. d'argent. Qu’est-ce que cela signifie pour eux ? Les entreprises d’IA viennent-elles de piquer l’ours ?



Module sonore : formé aux enregistrements pour apprendre le style de l'artiste qui enregistre et de la production. Le son peut être créé sans aucun enregistrement sonore existant en utilisant le modèle de composition pour créer des fichiers MIDI pouvant être convertis en enregistrements sonores complets.

Le fondateur de Fairly Trained, Ed Newton-Rex, a écrit deux excellents articles d'analyse sur les résultats de Suno et Udio. La plupart de ses idées tournent autour de la mélodie, des accords et des paroles. Il fait référence aux enregistrements dans un seul sens : le style et le recours à de vrais artistes et groupes (d'enregistrement). Sam Altman a déclaré à Lex Fridman que ce dernier de tout ce qui précède devrait être indemnisé. L’omission des auteurs-compositeurs et des éditeurs est, encore une fois, flagrante étant donné que ces véritables artistes interprètent le travail de véritables auteurs-compositeurs.

Il y a une vingtaine d’années, on m’a demandé de concéder sous licence une composition pour un CD-ROM éducatif. Je n'en avais aucune idée. J'ai décroché le téléphone et appelé Jane Dyball (WCM à l'époque) et lui ai demandé conseil. « Laissez-moi vous dire ce que je fais lorsque je reçois une demande pour une nouvelle forme de licence », a-t-elle déclaré. « Mettez votre doigt dans votre bouche, mettez-le en l'air, voyez où souffle le vent et nommez votre prix ».

Il semble que le vent souffle dans la mauvaise direction en ce qui concerne les auteurs-compositeurs. Alors que l’ensemble de l’industrie musicale tourne autour du récit « équitablement formé », et à juste titre, les titulaires de droits de chansons devraient se concentrer sur une « compensation équitable » de la part des sociétés d’IA et des propriétaires d’enregistrements.


Utilisez le mot C

La compensation est basée sur le principe largement accepté selon lequel les sociétés d’IA doivent divulguer l’origine des données de formation et les propriétaires de ces données peuvent se désinscrire. Il est inclus dans le Copyright Disclosure Act, dans la EU AI Act, dans les lignes directrices éthiques de l'IMPF et dans le point de vue de Sarah William d'IMPEL sur les deux autres C : contenu et culture.

En matière de saisie de données, c'est très simple : les sociétés d'IA ont conclu des accords avec les propriétaires de contenu pour la formation aux données ; OpenAI avec Axel Springer, Apple avec Shutterstock, UMG avec Endel et BandLab. Je ne sais pas si ces offres sont basées sur des frais de formation uniques ou récurrents et/ou s'il y a un avantage en termes de capitaux propres. Quel que soit l’accord, nous parlons d’accords généraux sans véritables paramètres de répartition des redevances.

Pour garantir une distribution équitable et créer des opportunités de monétisation supplémentaires pour les titulaires de droits, l’industrie musicale doit faire pression en faveur d’une clause d’attribution qui obligerait les sociétés d’IA à conserver des enregistrements sur quel groupe de données a été utilisé pour générer un nouveau morceau de musique. AI21Labs le fait avec du texte, Bria le fait avec des images. De nombreuses solutions pourraient être mises en œuvre sur des ensembles de données de formation musicale nouveaux et existants.

Si une clause d’attribution et une compensation supplémentaire pour la production musicale de l’IA ne sont pas respectées, nous courons un réel danger de voir les futurs flux de revenus stagner. Accorder une licence d'entrée sans licence de sortie revient à accorder des droits de synchronisation sans garantir les revenus de l'exécution publique.


6 questions

La semaine prochaine, des éditeurs de musique et des auteurs-compositeurs du monde entier se rassembleront autour de tables au Grosvenor House Hotel pour célébrer le savoir-faire et les réalisations de créateurs musicaux exceptionnels : les Ivors et le Polar Music Prize. Ces événements seraient un bon point de départ pour commencer à répondre aux questions suivantes :

Les auteurs-compositeurs sont-ils les principaux contributeurs à la formation aux données sur l’IA ?

Allons-nous permettre aux propriétaires d'enregistrements d'accorder une licence d'enregistrement pour la formation de données sans l'approbation des auteurs-compositeurs ?

Tous les éditeurs de musique se battront-ils au nom des auteurs-compositeurs, quelle que soit leur affiliation ?

La parité de répartition des redevances est-elle le minimum lorsque la production inclut des données d’enregistrement ?

Sommes-nous prêts à supprimer les droits de publication pour garantir une rémunération équitable, comme l’UMPG l’a fait avec TikTok ?

Pouvons-nous mettre notre ego de côté pour créer un système unifié de gestion de nouvelles sources de revenus ?

Les réponses à ces questions détermineront la valeur des actifs des auteurs-compositeurs à l'avenir, le retour sur investissement des milliards de dollars investis par les fonds d'actions, la valeur des actifs de JKBX et le rôle futur des sociétés de gestion collective, de la CISAC, de l'IMPF, de l'Ivor Academy et bien d'autres. .

Je crois que nous avons une opportunité unique de créer un changement et je travaille avec de bonnes personnes pour développer une plateforme pour le soutenir.

Le PDG de l'Ivors Academy, Roberto Neri, a exprimé l'urgence de tout cela : « Je crois que maintenant, plus que jamais, c'est le moment crucial pour garantir que les intérêts des créateurs de musique soient protégés, défendus, valorisés et reconnus pour leur rôle central et indispensable dans le succès de l’ensemble du secteur de la musique.

Profitez des Ivors et du Polar Music Prize la semaine prochaine, commencez le combat dès aujourd'hui.