Google vient de lancer Lyria 3 – son générateur de musique IA « le plus avancé » à ce jour – dans l’application Gemini

Google a lancé ce qu’il dit être son modèle de musique d’IA générative « le plus avancé » à ce jour, Lyria 3, au sein de son application de chatbot Gemini, permettant aux utilisateurs de créer des pistes de 30 secondes à partir d’invites de texte ou d’images.

Lyria 3 a été développé par Google DeepMindla division de recherche en IA du géant de la technologie, et constitue la dernière itération de sa technologie de musique générative.

La fonctionnalité, dont le déploiement a commencé mercredi matin (18 février), permet aux utilisateurs âgés de 18 ans et plus de décrire un genre, une ambiance ou un scénario et de recevoir une piste générée par l’IA avec des voix et des paroles. Les utilisateurs peuvent également télécharger des photos ou des vidéos et demander à Gemini de composer une bande-son d’accompagnement.

Google positionne l’outil pour des cas d’utilisation occasionnels tels que des cartes d’anniversaire personnalisées ou « une ballade du point de vue de votre animal ». Lyria 3 est disponible en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais.

Google n’a pas précisé comment Lyria 3 a été formé, mais a déclaré dans un article de blog mercredi 18 février qu’il avait cherché à « développer cette technologie de manière responsable en collaboration avec la communauté musicale » et qu’il avait « été très attentif aux droits d’auteur et aux accords de partenariat » lors de la formation du modèle.

MBW comprend que cela signifie que la formation pour Lyria 3 utilise de la musique que YouTube et sa société mère, Google, « ont le droit d’utiliser » en vertu de leurs « conditions d’utilisation, accords de partenariat et loi applicable ».

Billboard a rapporté en janvier 2024 que Google avait déjà formé ses modèles musicaux d’IA sur des enregistrements protégés par le droit d’auteur avant de contacter les titulaires de droits pour des accords de licence.

Google a déclaré que Lyria 3 représente une amélioration par rapport à ses précédents modèles Lyria, offrant des paroles générées automatiquement, un meilleur contrôle créatif sur le style et le tempo, et « des pistes plus réalistes et musicalement complexes ».

Le nouveau modèle s’appuie sur Lyria 2, dont MBW a parlé en septembre, et qui alimente l’outil « Speech to Song » de YouTube pour convertir les dialogues en bandes sonores musicales.

La société a présenté cette fonctionnalité comme un outil d’expression créative personnelle plutôt que de production musicale professionnelle. « Le but de ces morceaux n’est pas de créer un chef-d’œuvre musical, mais plutôt de vous offrir une façon amusante et unique de vous exprimer », ont écrit Joël Yawili, chef de produit senior chez Gemini App, et Myriam Hamed Torres, chef de produit senior chez Google DeepMind, dans un article de blog annonçant le lancement.

Lyria 3 est également intégré à Dream Track de YouTube – le générateur de bande-son IA de la plateforme pour les créateurs de Shorts, lancé pour la première fois en 2023 – qui s’étend au-delà de sa disponibilité initiale aux États-Unis pour les créateurs d’autres pays.

Dream Track a été initialement lancé avec des clones vocaux IA des artistes participants, notamment Charlie Puth, T-Pain et Alec Benjamin. Lyria 3 se concentre sur la génération vocale et instrumentale originale plutôt que sur la ressemblance de l’artiste.

Ce lancement fait suite au déploiement par YouTube d’un outil musical d’IA distinct, « Music Assistant », au sein de son marché Creator Music plus tôt cette année. Cette fonctionnalité, dont MBW a parlé en avril de l’année dernière, permet aux membres du Programme Partenaire YouTube de générer des pistes d’accompagnement instrumentales libres de droits via des invites textuelles.


Google a déclaré que Lyria 3 est « conçu pour une expression originale, et non pour imiter des artistes existants ». Si l’invite d’un utilisateur nomme un artiste spécifique, la société a déclaré : « Gemini prendra cela comme une large inspiration créative et créera un morceau qui partage un style ou une ambiance similaire. »

La société a ajouté qu’elle avait « mis en place des filtres pour vérifier les sorties par rapport au contenu existant » et que les utilisateurs pouvaient signaler tout contenu susceptible de violer leurs droits.

Toutes les pistes générées dans Gemini sont intégrées à SynthID, la technologie de filigrane de Google pour identifier le contenu généré par l’IA. La société a également annoncé que les utilisateurs peuvent désormais télécharger des fichiers audio sur Gemini pour vérifier s’ils ont été générés à l’aide de Google AI.

Le lancement intervient après qu’Universal Music Group et YouTube ont conclu un nouvel accord de licence en octobre qui comprenait ce que le PDG d’UMG, Sir Lucian Grainge, a qualifié de « garde-fous et de protection vraiment importants pour nos artistes et écrivains autour du contenu de la génération IA ».