Stability AI publie un modèle texte-audio gratuit et open source qui « respecte les droits des créateurs »

Stability AI, connu pour son générateur d'art IA Stable Diffusion, a lancé Stable Audio Open, un modèle open source gratuit pour créer de courts clips audio.

Audio stable ouvert permet aux utilisateurs de générer des échantillons audio de haute qualité pour la conception sonore. Il crée des clips d’une durée maximale de 47 secondes à l’aide de simples descriptions textuelles.

Il est spécialement conçu pour créer des effets sonores, des battements de batterie, des riffs d'instruments, des ambiances et d'autres éléments de production couramment utilisés dans la musique et la conception sonore.

Le modèle open source permet aux utilisateurs d'affiner le produit avec leurs propres données audio personnalisées. Cela permet aux musiciens tels qu'un batteur d'entraîner le modèle sur leurs propres enregistrements de batterie afin de générer des rythmes nouveaux et uniques dans leur propre style.

Le lancement de Stable Audio Open fait suite à la sortie de Audio stable 1.0 en septembre 2023. Cette technologie, désignée comme l'une des Les meilleures inventions de TIME en 2023, permet aux utilisateurs de créer de courts clips audio basés sur des descriptions textuelles.

La dernière itération, Audio stable 2.0, a été dévoilé en avril de cette année. La mise à jour offre aux artistes et musiciens une gamme plus large d'outils créatifs et la possibilité de produire des morceaux de musique complets.

«Notre produit commercial Stable Audio produit des pistes complètes de haute qualité avec une structure musicale cohérente d'une durée allant jusqu'à trois minutes, ainsi que des fonctionnalités avancées telles que la génération audio-audio et des compositions musicales cohérentes en plusieurs parties.»

IA de stabilité

Stable Audio Open, quant à lui, est spécialement conçu pour les clips audio et les éléments de production plus courts. Bien qu'il puisse générer de courts extraits musicaux, il n'est pas optimisé pour créer des chansons, des mélodies ou des voix complètes.

« Notre produit commercial Stable Audio produit des pistes complètes de haute qualité avec une structure musicale cohérente d'une durée allant jusqu'à trois minutes, ainsi que des capacités avancées telles que la génération audio-audio et des compositions musicales cohérentes en plusieurs parties », a déclaré Stability AI dans un communiqué. article de blog.

Les poids du modèle Stable Audio Open sont disponibles en téléchargement sur Visage câlin, une plateforme pour les modèles d'apprentissage automatique. Stability AI encourage les concepteurs sonores, les musiciens, les développeurs et toute personne intéressée par l'audio à explorer les capacités du modèle et à fournir des commentaires.

La sortie de Stable Audio Open intervient au milieu d'un débat croissant sur l'utilisation de l'intelligence artificielle dans l'industrie musicale, en particulier sur le droit d'auteur.

Ed Newton-Rexancien vice-président de l'audio de Stability AI, est parti vers la fin de 2023, invoquant des désaccords sur l'utilisation de matériaux protégés par le droit d'auteur dans les ensembles de données de formation.

« Des entreprises valant des milliards de dollars forment, sans autorisation, des modèles d'IA génératifs sur les œuvres des créateurs, qui sont ensuite utilisés pour créer de nouveaux contenus qui, dans de nombreux cas, peuvent rivaliser avec les œuvres originales », a déclaré Newton-Rex.

« Je ne vois pas comment cela peut être acceptable dans une société qui a mis en place l'économie des arts créatifs de telle sorte que les créateurs dépendent du droit d'auteur », a déclaré Newton-Rex, qui a contribué au développement de Stable Audio, dans une lettre publique de démission.

Stability AI affirme que son nouveau modèle a été formé sur un ensemble de données de clips audio de Son gratuit et le Archives musicales gratuites,.

« Cela nous a permis de créer un modèle audio ouvert tout en respectant les droits des créateurs », a déclaré la société.