Le secteur de la musique a un problème de vol. Encore.

MBW Views est une série d'articles d'opinion exclusifs rédigés par d'éminents personnalités de l'industrie musicale… avec quelque chose à dire.

L'éditorial suivant provient de l'entrepreneur technologique et vétéran de la musique Shara Senderoff (photo en encadré), co-fondatrice et PDG de Jen.

Jen prétend être une « plate-forme musicale d'IA générative formée de manière éthique » qui introduit « une nouvelle norme en matière de conformité aux droits d'auteur dans la génération de texte en musique ».

Senderoff est un entrepreneur technologique très respecté. Elle a auparavant cofondé le fonds de capital-risque et le studio blockchain, Raised In Space, en 2018 aux côtés de Scooter Braun.

En plus de Senderoff, Jen a nommé Mike Caren, fondateur et PDG d'Artist Partner Group, comme partenaire fondateur l'année dernière.

L'équipe fondatrice de Jen est complétée par Aaron McDonald, vétéran de la technologie depuis 20 ans, qui a cofondé Futureverse aux côtés de Senderoff et du Dr Alex Wang, docteur en IA, qui a dirigé l'architecture et le développement de l'IA de Jen.

Être élevé dans le blues et le rock n' roll vous donne une profonde appréciation des composantes humaines de la musique. Les histoires. Le cœur. L'âme. « Un ordinateur ne pourrait jamais évoquer cela », ai-je écrit en réponse aux innombrables decks entrants que j'ai reçus alors que je gérais mon fonds d'investissement musical/technologique que j'avais co-fondé avec Scooter Braun. Une chose que j'étais catégoriquement pas ce qui m'intéressait était la musique générée par l'IA.

Cette dernière révolution technologique en matière d’IA a provoqué une onde de choc dans le secteur, car nous n’avons pas encore vu la technologie constituer une menace pour les droits d’auteur, et ce de manière significative depuis que le partage de fichiers a explosé sur la scène avec Napster il y a plus de 20 ans.

Il est cependant important de reconnaître que la véritable menace ne réside pas dans la technologie elle-même. Il s'agit d'exploiter des droits d'auteur sans licence pour former la technologie. Nous avions tous espéré que l’époque du vol de musique était révolue depuis longtemps. Mais l’essor de la musique basée sur l’IA générative a donné naissance à une toute nouvelle bande de mauvais acteurs. La foule « demande pardon » plus tard. L’armée du « fair use ». Les « chouchous des dérivés ». D'accord, je viens de l'inventer. Mais c'est exact.

Il y a deux ans, mon équipe chez Futureverse, l'une des principales sociétés d'infrastructure d'IA et Web3, a proposé que nous commencions à créer Jen. J'ai toujours cru que le sentiment de connexion que la musique suscite, à la fois conscient et subconscient, est quelque chose que nous ne pourrons jamais comprendre, et encore moins reproduire artificiellement. La musique est une expérience spirituelle. Comment l’IA pourrait-elle s’en approcher ?

Notre équipe de docteurs en IA estimés a profondément compris mon hésitation. En tant que musiciens eux-mêmes, ils ont identifié les nuances de composition que l’audio génératif n’avait pas réussi à capturer.

Ils m'ont remis leur premier document de recherche (* parmi tant d'autres) présentant JEN-1, un modèle sophistiqué de conversion texte-musique conçu pour surmonter les limitations de qualité sonore des systèmes de musique génératifs précédents. L'article décrivait les avancées qui répondaient à mes préoccupations quant à savoir si les modèles génératifs pouvaient ou non atteindre les détails d'une composition humaine ; une approche qui capture les nuances de la musique sur tout le spectre des fréquences.

Contrairement aux modèles d'IA qui s'appuient sur des représentations visuelles du son et subissent donc des pertes de fidélité lors de la conversion audio, l'architecture du modèle de diffusion de Jen génère un son stéréo haute fidélité de 48 kHz, garantissant toute la richesse et la profondeur du son que nous avons l'habitude d'entendre à la radio en travaillant directement avec des formes d'onde audio brutes. Combiné à une formation multitâche sur la conversion texte-musique, l'inpainting et la continuation, Jen permet une qualité audio supérieure et une polyvalence accrue dans la création musicale IA.

J'en suis venu à croire avec confiance que nous pouvions le faire techniquement, mais j'ai insisté : nous le ferions de manière éthique, ou nous ne le ferions pas du tout.

Aujourd'hui, nous lançons la version alpha de Jen, une plate-forme audio générative de synthèse texte-musique haute fidélité qui fait quelque chose que peu ont encore tenté : ça ne vole pas de musique. Avec une ligne morale tracée dans le sable, nous avons élaboré une doctrine de formation et un cadre de licence résolument engagés en faveur de la transparence, de la compensation et de l'identification des droits d'auteur. Tout le monde disait que c'était impossible, que l'industrie musicale était trop difficile à travailler ou que cela prendrait trop de temps et que je n'aurais aucune chance si je n'entrais pas d'abord sur le marché.

« Nous avions tous espéré que l’époque du vol de musique était révolue depuis longtemps. Mais l’essor de la musique basée sur l’IA générative a donné naissance à une toute nouvelle bande de mauvais acteurs.

Jen dispose de plus de 40 catalogues sous licence complète dans son ensemble de formation initiale. Il est formé de manière éthique et introduit une nouvelle norme en matière de conformité aux droits d'auteur. Notre processus de formation rigoureux et notre approche soigneusement conçue pour bien faire les choses sont inégalées. Chaque piste est automatiquement vérifiée pour la reconnaissance audio et l'identification des droits d'auteur à l'aide d'une base de données de 150 millions de pistes. Cela inclut à la fois les compositions de l'ensemble de formation et chaque piste nouvellement générée sur la plateforme. Nous ne pourrions pas faire ça si nous volions de la musique.

De plus, Jen génère un hachage cryptographique pour chaque piste qui est ensuite enregistrée sur la blockchain The Root Network. Ce processus fournit une forme avancée de vérification, garantissant l'intégrité et l'horodatage de la création de chaque piste. Les sorties de chansons vérifiées reçoivent un indicateur JENUINE™ lors de leur génération.

Voici ce que cela signifie et je vais faire l'impensable… Je vais faire référence à Taylor Swift. Si vous tapez une invite sur Jen qui dit « faites-moi une chanson qui ressemble à Taylor Swift », il n'est pas du tout possible qu'elle fasse quoi que ce soit de ce genre. Il n'a jamais entendu Taylor. Alors, comment pourrait-il savoir à quoi elle ressemble ? Si un mauvais acteur ajoute un extrait de chanson de Taylor ou des voix interprétant ses mélodies ou ses paroles à une piste de Jen après sa création, après examen, notre hachage indiquera que la piste a été modifiée après la génération et confirmera que la sortie de Jen ne contenait pas l'échantillon. Encore une fois, nous pouvons le faire parce que : nous ne volons pas de musique.

Les consommateurs sont totalement propriétaires des morceaux qu'ils créent sur Jen. Ils peuvent les exploiter et les distribuer sur les DSP, les réseaux sociaux, etc. Vous savez pourquoi ? Parce que nous ne volons pas de musique.

La réponse de l’industrie à la musique générative a été de menacer de retirer tout ce qui était créé à l’aide de l’IA. Mais la technologie de la musique générative progressera à des vitesses bien supérieures à toute technologie capable de la surveiller. Cette solution est fondamentalement erronée. L’industrie sera mortifiée lorsqu’elle sera surprise en train de distribuer les morceaux contre lesquels elle se bat sans même le savoir. Au lieu d’essayer de l’arrêter, et si nous travaillions ensemble pour suivre son cours ?

Nous devons protéger la valeur de la musique et le respect qu’elle mérite dans le monde entier. Nous avons besoin de cadres de licences solides qui protègent les droits d'auteur et imposent des sanctions aux entreprises qui utilisent de la musique sans licence pour les données de formation. Nous avons besoin que l’industrie s’exprime maintenant. Pas demain. Pas après avoir formé un comité sur l’IA. Pas l'année prochaine. Maintenant.

Beaucoup craignent que la technologie de l’IA ne constitue une menace pour le talent artistique. Mais la réalité est que la technologie a un impact sur la musique depuis des siècles et que nous n’avons pas encore perdu le talent artistique. Cela ne remplacera pas les artistes ou le talent artistique que nous admirons. Il collaborera avec eux. Habiliter. Améliorez leur travail de nouvelles manières. Taylor serait toujours Taylor si elle venait maintenant. La magie et le cœur des musiciens ne seront amplifiés que par la technologie à venir. Tant qu'on abat le marteau.

Je ne pense pas qu'il y ait eu un moment qui pourrait plus définir l'avenir de l'industrie musicale que celui-ci. Peu importe à quel point il est difficile de le faire correctement. Il faut que quelqu'un prouve que c'est possible.

Mon chapeau est sur le ring et je vais vous montrer que cela peut être fait sans voler de musique.