Adobe Podcast : Amélioration audio de l'IA – Une plongée en profondeur

Aujourd'hui, nous souhaitons vous présenter ce que nous ne pouvons décrire que comme le logiciel basé sur l'IA le plus impressionnant que nous ayons vu à ce jour chez Adobe et l'un des outils les plus utiles que nous ayons testés en général pour réparer les enregistrements vocaux, initialement appelé Project Shasta et plus récemment Adobe Podcast.

L'outil d'amélioration de la parole dont nous parlerons aujourd'hui fait partie de ce projet Adobe peu connu annoncé en juin 2022. Selon la société :"Le projet Shasta apporte sur le Web l'enregistrement et l'édition audio basés sur l'IA, sans téléchargement. Désormais, n'importe qui peut créer un son qui sonne de manière professionnelle, sans avoir besoin d'être un professionnel".

Ce sont de grandes affirmations et nous les mettrons bientôt à l’épreuve pour voir jusqu’où vous pouvez aller avec cet outil. Nous avons découvert le projet Shasta alors que nous couvrions le salon IBC plus tôt cette année et, d'après notre expérience, cela a fait une énorme différence dans nos enregistrements audio du salon. Même si IBC n'était pas aussi bruyant que certaines autres expositions que nous avons couvertes, il y avait encore beaucoup de bruit de fond et d'audio à nettoyer.

L'outil d'amélioration de la parole du projet Shasta a si bien nettoyé l'audio que nous avons dû insérer manuellement un bruit de fond d'exposition de faible niveau juste pour rendre le son audio crédible.

Nous avons fait cela pour près de 30 vidéos de l'émission et sur plusieurs heures d'enregistrement dans différents environnements avec des configurations audio différentes et des personnes avec des accents anglais très différents, nous n'avons trouvé qu'un ou deux problèmes très mineurs avec les résultats. Assez impressionnant pour un outil entièrement automatique qui était encore en version bêta.

Interface audio en un clic – outil d'amélioration de la parole du projet Shasta

Adobe Podcast : Amélioration audio de l IA – Une plongée en profondeur

Si notre test IBC expo ne vous a pas convaincu, essayons un test plus approfondi. Nous avons pris notre A7 IV et enregistré un test de vlog simulé à côté d’une rue animée en pleine journée avec le micro intégré de la caméra (s’il vous plaît, ne faites jamais cela, c’était juste pour les besoins de ce test). Dans la vidéo ci-dessus, vous pouvez entendre nos résultats et comme vous pouvez le constater, même dans ces conditions horribles, l'outil d'amélioration de la parole d'Adobe a fait un très bon travail.

Project Shasta est bien plus qu'un simple outil de restauration audio. Adobe a créé un service de transcription entièrement automatique et toutes sortes d'autres outils pour aider les créateurs de contenu et en particulier les créateurs de podcasts. Vous pouvez consulter la démo dans la vidéo ci-dessous.

Vidéo Adobe officielle sur le projet Shasta

Adobe Podcast : Amélioration audio de l IA – Une plongée en profondeur

Juste pour mettre les choses en perspective, même si nous ne sommes même pas près d'être des ingénieurs du son, nous travaillons depuis de nombreuses années avec un logiciel de restauration audio tel que iZotope qui coûte plus de 1 000 $ pour sa version avancée, résolvant différents problèmes d'enregistrement audio pour nos projets commerciaux ainsi que pour LensVid.

iZotope est un outil professionnel fantastique qui peut faire bien plus de choses. Mais si la seule chose que vous souhaitez est de fournir un fichier audio, d'appuyer sur un seul bouton et d'obtenir quelque chose de propre et qui sonne bien au-dessus de la moyenne (dans la plupart des situations), alors l'outil d'amélioration de la parole du Projet Shasta bat iZotope et tout autre logiciel que nous connaissons de loin.

Ce que nous aimerions voir ensuite, c'est une intégration complète de Project Shasta dans Premiere Pro (et peut-être aussi Audition) avec différentes options de configuration pour permettre à l'utilisateur d'avoir un certain niveau de contrôle sur la sortie. Par exemple, ce serait formidable si nous pouvions laisser au moins un peu de bruit ambiant dans l’enregistrement. Encore plus intéressante serait une option permettant de choisir en un clic une tonalité de pièce à rajouter à l'audio afin qu'elle sonne un peu plus « vivante ».

En fin de compte, même comme c'est le cas actuellement, le Projet Shasta est devenu notre outil de prédilection pour chaque enregistrement vocal que nous réalisons, que ce soit dans notre studio avec nos milliers de dollars de matériel audio professionnel ou pour réparer des fichiers audio mal enregistrés que nous obtenons parfois et qui seraient autrement complètement inutilisables sans des outils très coûteux et beaucoup de travail acharné.

Avant de conclure, nous avons récemment eu l'occasion de parler à Mark Webster, directeur des produits chez Adobe, spécialisé dans l'audio et les services Web, et de lui poser quelques questions sur le passé, le présent et l'avenir du projet Shasta. Vous pouvez retrouver l'interview complète ci-dessous :

Adobe Podcast : Amélioration audio de l IA – Une plongée en profondeur

Vous pouvez essayer gratuitement l'outil d'amélioration vocale Adobe Podcat (vous devez vous inscrire) sur la page Adobe Podcast (n'hésitez pas à partager des idées d'améliorations ou des bugs avec Adobe).

Vous pouvez consulter d'autres articles et critiques exclusifs sur LensVid sur le lien suivant.

Adobe Podcast : Amélioration audio de l IA – Une plongée en profondeur Iddo Genuth

Iddo Genuth est le fondateur et rédacteur en chef de LensVid.com. Il est journaliste technologique travaillant pour des publications internationales depuis la fin des années 1990 et couvrant la photographie depuis 2009. Iddo est également co-fondateur d'une société de production spécialisée dans le contenu visuel de produits et d'aliments commerciaux.

Dans cet épisode de LensVid Talk, nous plongeons dans une vaste gamme de nouveaux équipements…

Bienvenue dans un autre podcast LensVid Talk (épisode 47). Cette semaine, nous plongeons dans le changement…

Aujourd'hui, nous examinons le plus grand membre de la base ronde iFootage…

Bienvenue dans un autre épisode plein d'action de LensVid Talk (épisode 46). Cette semaine, nous avons rassemblé un…