Google et YouTube ont dévoilé une suite de nouveaux outils musicaux baptisés « Music AI Sandbox », avec l'aide du rappeur/producteur Wyclef Jean, de l'auteur-compositeur Justin Tranter et du créateur d'électro et personnalité de YouTube Marc Rebillet.
Une nouvelle vidéo promotionnelle montre les trois créateurs de musique expérimentant le nouvel outil, que Google décrit dans un article de blog comme « conçu pour ouvrir un nouveau terrain de jeu à la créativité, permettant aux gens de créer de nouvelles sections instrumentales à partir de zéro, de transformer le son de nouvelles manières et bien plus encore. plus. »
La vidéo montre un écran interactif qui permet aux utilisateurs de créer des clips musicaux avec des saisies de texte dans un champ de texte intitulé « décrivez votre piste ». Il existe également un champ de texte intitulé « les sons dont vous ne voulez pas » et un champ facultatif pour les paroles. La vidéo montre également des clips générés par l'IA insérés dans des morceaux musicaux plus longs dans un éditeur de musique de forme d'onde.
Jean, Tranter et Rebillet ont publié des pistes de démonstration sur leurs chaînes YouTube, présentant les capacités de la technologie.
Dans la vidéo promotionnelle, Wyclef Jean déclare que « les outils sont capables d'accélérer le processus de sortie de ce que j'ai en tête. Vous êtes capable de vous déplacer à la vitesse de la lumière grâce à votre créativité.
Il décrit son processus consistant à « fouiller dans les caisses », c'est-à-dire parcourir les caisses des magasins de disques pour trouver des sons à échantillonner dans de nouveaux morceaux.
« Alors en ce moment, nous creusons dans la caisse infinie. C'est sans fin », dit-il dans la vidéo.
Il est peu probable que Music AI Sandbox soit le nom de la technologie à long terme, étant donné que le terme « sandbox » fait référence à un nouveau programme isolé dans un environnement de test.
La technologie vient de Google DeepMindle laboratoire de développement d'IA du géant de la technologie, en collaboration avec YouTube, qui a signé l'année dernière un partenariat avec Groupe de musique universel (UMG) pour lancer un « Incubateur d'IA musicale » dans lequel les deux sociétés développeraient conjointement des outils d'IA offrant des opportunités « sûres, responsables et rentables » aux créateurs de musique et aux titulaires de droits.
Cependant, sur les trois artistes présentés dans la promotion de Google, un seul – Justin Tranter – entretient une relation significative avec Universal.
Google a fourni peu d'informations sur la façon dont les outils Music AI Sandbox ont été formés, mais a indiqué que les outils sont issus de son travail sur Lyria de DeepMind, que la société a décrit l'automne dernier comme « notre modèle de génération musicale le plus avancé ».
Dans ses communications, Google décrit souvent ses travaux sur l’IA musicale générative comme étant des « collaborations » avec des créateurs de musique – soulignant l’idée que sa technologie est destinée à aider les créateurs de musique humains, et non à les remplacer.
« Nous sommes soucieux non seulement de faire progresser l'état de l'art, mais aussi de le faire de manière responsable. Nous prenons donc des mesures pour relever les défis posés par les technologies génératives et aider les personnes et les organisations à travailler de manière responsable avec le contenu généré par l'IA », a déclaré Google dans un article de blog rédigé par Eli Collinsvice-président des produits chez Google Research, et Douglas Eckdirecteur de recherche principal chez Google et responsable de la recherche chez Google DeepMind.
« Les outils sont capables d'accélérer le processus de sortie de ce que j'ai en tête. Vous êtes capable de vous déplacer à la vitesse de la lumière grâce à votre créativité.
Wyclef Jean
Néanmoins, certains doutes sur la provenance des recherches de Google ont été émis, notamment dans un article publié par Panneau d'affichage plus tôt cette année, qui alléguait que Google avait entraîné son IA sur des documents protégés par le droit d'auteur sans autorisation et cherchait à obtenir une licence rétroactive pour ce matériel.
DeepMind a également annoncé le déploiement d'un outil de génération vidéo Véoqui crée « des vidéos de résolution 1080p de haute qualité dans un large éventail de styles cinématographiques et visuels » et comprend des termes tels que « timelapse » ou « prises de vue aériennes d'un paysage ».
L'entreprise a également dévoilé Image 3qu'il a appelé son générateur de texte-image de « plus haute qualité » à ce jour.
« Imagen 3 comprend mieux le langage naturel, l'intention derrière votre invite et intègre les petits détails des invites plus longues. La compréhension avancée du modèle l'aide à maîtriser une gamme de styles », a déclaré Google.
Lors de sa conférence I/O, Google a également annoncé le déploiement d'une version mise à jour de son outil Gemini AI, comprenant notamment des projets d'intégration de l'outil directement dans le navigateur Google Chrome, ainsi que des projets d'intégration dans le moteur de recherche de Google.
Le projet visant à ce que Gemini donne des réponses aux requêtes des moteurs de recherche en haut des pages de résultats a suscité des inquiétudes chez les éditeurs de presse, dont certains ont déclaré que leurs entreprises pourraient souffrir si Google cannibalisait leurs articles de presse.
Une version antérieure de l'outil de génération d'images de Gemini a été largement ridiculisée sur les réseaux sociaux plus tôt cette année, après que les utilisateurs ont découvert qu'elle offrait des représentations historiquement inexactes, telles que des individus noirs dans les rangs militaires de l'Allemagne nazie.
Cette attention négative a incité Google à suspendre l'outil et à présenter des excuses, dans lesquelles il a promis de corriger les erreurs.