Le nouveau « changeur de voix » AI de Supertone, propriété de HYBE, permet aux artistes de changer leur voix… en temps réel

Supertone, comme le savent les lecteurs de longue date de MBW, est le logiciel de réplication vocale IA que le géant coréen de la musique HYBE a entièrement acquis dans le cadre d'un accord de 32 millions de dollars en 2022.

Fin février, les capacités d'IA de Supertone ont été démontrées via un clone vocal de HYBE. propre PDGJiwon Park, « s'exprimant » lors d'un appel sur les résultats de l'entreprise.

Plus tôt dans la journée (16 avril), Supertone a lancé la version bêta d'un nouvel outil appelé « Supertone Shift ».

L'outil est décrit comme un « changeur de voix en temps réel unique en son genre » qui, selon HYBE, « offrira aux créateurs de nouvelles possibilités d'expression et de création de contenu ».

Imaginez la scène : un artiste chantant en direct sur scène, via plusieurs voix différentes assistées par l'IA, toutes commutées en temps réel.

En mai de l'année dernière, HYBE a présenté les possibilités de ce qu'il peut faire avec la technologie Supertone en sortant un nouveau single intitulé Mascarade d'un artiste appelé MIDNATT.

MIDNATT, l'alter-ego de l'artiste signé HYBE Lee Hyun, a utilisé une version prototype de Changement de super-ton pour une transition « transparente » entre sa propre voix et celle d'une chanteuse sur le morceau Masquerade.

Ce même morceau a été vanté par HYBÉ comme le « tout premier morceau multilingue produit en coréen, anglais, japonais, chinois, espagnol et vietnamien ».

Selon HYBE, MIDNATT (alias Lee Hyun) a chanté le morceau dans les six langues, et en utilisant l'IA de Supertone, « les données de prononciation des locuteurs natifs ont été appliquées au morceau pour affiner davantage la prononciation et l'intonation de l'artiste ».

Selon Supertone et HYBE, le nouvel outil, Supertone Shift, permet aux utilisateurs de « passer immédiatement à la voix souhaitée » à partir d'une bibliothèque de dix voix prédéfinies en temps réel, leur voix étant analysée pour être convertie « en seulement 10 secondes ».

Les utilisateurs peuvent ensuite personnaliser la voix en ajustant un rapport de mélange ainsi que des paramètres de voix tels que la hauteur, la joie et la réverbération avec des « curseurs simples et intuitifs ».

Selon HYBE et Supertone, ce niveau de contrôle « aide les utilisateurs à créer leur style unique tout en conservant leur son distinct, parfaitement aligné avec leur intention créative ».

Vous pouvez voir une démonstration du fonctionnement du nouvel outil dans la vidéo de démonstration ci-dessous. Supertone indique dans la vidéo qu'il « peut même créer une voix personnalisée pour vous » si vous ne trouvez pas la voix exacte que vous souhaitez dans ses préréglages.



HYBE et Supertone affirment que Supertone Shift « représente une nouvelle frontière de la technologie de conversion vocale en temps réel (RTVC) avec une latence allant jusqu'à 47 millisecondes et une qualité de voix hyper réaliste, ce qui en fait un choix optimal pour le contenu et les performances en direct ».

L'annonce Supertone d'aujourd'hui indique : « Que les VTubers, les streamers en direct et les podcasteurs offrent des expériences audio élevées aux auditeurs, ou que les joueurs et les joueurs de costumes plongent leurs abonnés dans des chats vocaux interactifs, les créateurs peuvent facilement passer à leur autre « identité » en ligne.

Dans la vidéo de démonstration ci-dessus, Supertone confirme qu'un utilisateur « peut même chanter [their chosen] voix sur scène ».

La version bêta de Supertone Shift est actuellement disponible en téléchargement gratuit en tant qu'application de bureau jusqu'au 26 juin 2024 via son site officiel, son lancement officiel étant prévu pour le second semestre de cette année.

« Grâce à la version bêta de Supertone Shift, notre objectif est de recueillir les commentaires d'un large éventail de créateurs afin d'incorporer une gamme plus large d'échantillons vocaux et de fonctionnalités supplémentaires afin de mieux servir divers environnements de création de contenu. »

Kyogu Lee, Superton

« Grâce à la version bêta de Supertone Shift, notre objectif est de recueillir les commentaires d'un large éventail de créateurs afin d'incorporer une gamme plus large d'échantillons vocaux et de fonctionnalités supplémentaires afin de mieux servir divers environnements de création de contenu », a déclaré Kyogu Lee, président de Supertone.

« Nous espérons que cette innovation rehaussera la valeur de la voix dans le processus créatif, repoussant ainsi les limites de la créativité des créateurs. »


Un autre produit lancé récemment par Supertone est arrivé en novembre 2023 sous la forme de Supertone Clear, un plugin audio IA en temps réel pour la séparation de la voix et la réduction du bruit.

Supertone affirme que l'outil a été largement utilisé par les créateurs, notamment les ingénieurs de post-production, les monteurs vidéo, les streamers, les musiciens et les producteurs de disques dans 198 pays.

La société rapporte avoir engrangé plus de 27 000 utilisateurs actifs mensuels dans les six mois seulement suivant son lancement en novembre 2023.

Supertone a attiré l’attention des médias mondiaux pour la première fois en janvier 2021 avec sa technologie dite de synthèse vocale chantée (SVS).

La société a utilisé cette technologie pour « ressusciter » la voix de la superstar folk sud-coréenne Kim Kwang Seokavec la voix générée par l'IA qui a ensuite fait ses débuts dans une émission de télévision coréenne Compétition du siècle : IA contre humain.