De plus en plus d’équipes de formation testent les voix et les avatars de l’IA pour accélérer la production vidéo et réduire les coûts, mais il y a encore des hésitations. Les apprenants prendront-ils ces formats au sérieux ? Pourraient-ils paraître bon marché ou distrayants ? Et si les gens se déconnectaient ?
Pour aller au-delà de l'opinion, l'équipe Camtasia a mené deux études mondiales auprès des téléspectateurs, axées sur la vidéo pédagogique.
Les participants ont regardé de courts clips de formation identiques, à l'exception de la voix de narration ou du format du présentateur. Ils ont ensuite évalué le professionnalisme, la confiance et l'engagement et ont répondu à un bref quiz pour mesurer la rétention.
L’objectif était de comprendre comment les vrais apprenants réagissent aux voix et aux avatars de l’IA dans un environnement contrôlé. Voici ce que nous avons découvert sur l'utilité de chaque format, sur ses lacunes et sur la manière dont il influence réellement les résultats d'apprentissage.
Principaux points à retenir
- Des voix de haute qualité, qu'elles soient IA ou humaines, améliorent constamment le professionnalisme perçu et améliorent la fidélisation. Le véritable problème était un son robotique de mauvaise qualité.
- Les apprenants ne savaient souvent pas si une voix d'IA de haute qualité était une voix d'IA ou une voix humaine, en particulier lorsque le son semblait naturel et soigné.
- Dans tous les formats, les vidéos d'avatars IA ont été jugées professionnelles et peuvent être visionnées à nouveau, mais l'image dans l'image de l'avatar a produit la meilleure rétention d'apprentissage pour l'enseignement sur écran.
- Les avatars en plein écran ont permis aux spectateurs de remarquer plus facilement les caractéristiques robotiques, ce qui a réduit les notes de qualité et détourné l'attention de la tâche.
- Le format d'avatar image dans l'image a montré une compréhension nettement supérieure, ce qui suggère que la taille et l'emplacement du présentateur influencent l'apprentissage.
Emportez cette étude avec vous.
Téléchargez l'étude sur l'IA au format PDF pour la lire hors ligne et planifier votre stratégie vidéo sur l'IA sans les onglets.
En soumettant votre adresse e-mail, vous acceptez de recevoir des e-mails de TechSmith. Vous pouvez vous désinscrire à tout moment.
Ce que nous apprend notre étude AI Voices sur la voix dans les vidéos de formation
Les apprenants peuvent-ils réellement faire la différence entre une voix humaine et celle d’une IA ? Dans notre étude AI Voices, les spectateurs ont regardé la même courte vidéo pédagogique sur la recherche avancée Google :seule la voix a changé.
Il existe quatre versions :une voix humaine de haute qualité, une voix humaine de faible qualité, une voix IA de haute qualité et une voix IA de faible qualité. Tout le reste est resté le même, donc seule la narration a pu être évaluée.
L'audience comprenait 768 travailleurs à temps plein âgés de 18 à 64 ans qui avaient regardé au moins une vidéo pédagogique au cours des 30 derniers jours. Les participants venaient des États-Unis, du Royaume-Uni, du Canada et de l'Australie.
Pourquoi la qualité de la voix compte plus que l'IA par rapport à l'humain
Qu’est-ce qui attire réellement l’attention des apprenants ? Une voix qui semble claire, chaleureuse et raffinée, qu’elle soit humaine ou IA. À mesure que la qualité de la voix s’est améliorée au cours de l’étude, les évaluations du professionnalisme ont également augmenté. En fait, 92 % des téléspectateurs ont déclaré que la voix de l'IA de haute qualité donnait à la vidéo une impression de production professionnelle.
Pour les responsables de l’apprentissage et du développement (L&D) et de la formation, le véritable risque n’est pas l’IA elle-même. Sa mauvaise qualité audio, qui peut rendre le contenu plus difficile à suivre (et à apprendre) et plus distrayant.
C'est là que des outils comme Camtasia aident les créateurs à faire mouche. Vous pouvez capturer et éditer un son clair, réduire le bruit de fond ou utiliser des options de synthèse vocale basées sur l'IA qui semblent naturelles et professionnelles, le tout sans configuration de studio.
Les voix de l'IA aident-elles ou nuisent-elles à la rétention des apprentissages ?
Les résultats de la partie « pop quiz » de notre étude montrent clairement la tendance :les réponses correctes augmentent à mesure que la qualité de la voix s'améliore. En fait, la voix de l’IA de haute qualité a produit les taux de rétention les plus élevés, à l’exception d’une valeur aberrante humaine de faible qualité.
Pourquoi cela arrive-t-il ? Nous pensons qu'un son de mauvaise qualité introduit des frictions. Lorsque la narration semble inégale, artificielle ou difficile à entendre, les apprenants doivent travailler plus dur juste pour comprendre ce qui est dit, ce qui ajoute une charge cognitive. Un son clair et fluide permet aux spectateurs de se concentrer sur les étapes et les concepts plutôt que sur la prestation. Une voix IA de haute qualité peut soutenir l’apprentissage aussi bien, sinon mieux, qu’un enregistrement humain médiocre.
Mais les voix de l’IA sont-elles globalement distrayantes ? Ça dépend. Les voix synthétiques de mauvaise qualité sont indubitables et détournent l’attention du contenu. Lorsque la voix de l'IA semble naturelle, de nombreux spectateurs ne peuvent pas la distinguer d'une voix humaine. La différence est moins flagrante et la rétention des informations reste stable, voire s’améliore.
Une prochaine étape pratique consiste à effectuer un test pilote. Comparez les performances des quiz et les commentaires des apprenants sur les versions IA et voix humaine avant de déployer des programmes complets. Cela permet de confirmer si une voix IA prend en charge l’apprentissage sans ajouter d’effort inutile.
Confort des apprenants, attentes en matière de divulgation et différences régionales
Dans notre étude, de nombreux apprenants ne savaient pas si une voix IA de haute qualité était une voix artificielle ou humaine, ce qui fait de la transparence un facteur important. Ce niveau de naturel est impressionnant, mais il soulève également d'importantes questions sur la divulgation.
Les téléspectateurs des pays anglophones avaient tendance à préférer révéler qu’une voix d’IA avait été utilisée, tandis que les participants allemands étaient moins inquiets. Le Royaume-Uni s’est particulièrement démarqué :les apprenants y étaient particulièrement ouverts aux vidéos racontées par l’IA. Ces différences sont importantes lors de la conception de formations destinées à un public mondial.
Pour les équipes L&D, la divulgation fonctionne mieux comme un choix de renforcement de la confiance plutôt que comme une formalité juridique. Une brève note comme « Narré avec une voix IA » dans la description de la vidéo ou au début d'un module peut rassurer les apprenants sans les distraire du contenu.
La prise en compte dès le départ des attentes culturelles facilite la mise à l’échelle de la narration de l’IA sur un catalogue de formation plus large. Lorsque les apprenants savent à quoi s’attendre et se sentent informés, ils s’engagent davantage et s’adaptent plus rapidement aux formats pris en charge par l’IA.
Cela est également lié au coût et à l’efficacité. Une fois que les apprenants sont à l’aise avec la narration vocale de l’IA, les équipes peuvent étendre son utilisation à davantage de programmes de formation sans sacrifier la confiance ou la rétention. Une divulgation réfléchie, associée à un son de haute qualité, maintient l'attention sur l'instruction elle-même.
Où la voix IA fait gagner du temps (et comment le réinvestir)
Remarque :Les études mentionnées précédemment n’ont pas mesuré l’efficacité de la production. Ce qui suit reflète les pratiques et flux de travail courants observés dans les équipes de formation plutôt que les résultats de la recherche.
Les voix de l’IA peuvent faire gagner beaucoup de temps dans la production de formations. Il n'est pas nécessaire de programmer des présentateurs ou de réserver du temps d'enregistrement, et les scripts peuvent être mis à jour et régénérés instantanément. La localisation dans plusieurs langues devient également beaucoup plus facile sans réenregistrer chaque version.
Le temps gagné peut directement servir à améliorer l’expérience d’apprentissage. Les équipes peuvent améliorer les visuels dans Camtasia avec des légendes plus claires, une mise en évidence du curseur et un rythme plus fluide. Ils peuvent ajouter davantage d'exemples basés sur des scénarios, créer des quiz et des points de contrôle, ou mettre à jour le contenu plus souvent pour que la formation reste alignée sur les changements de produits et de processus.
La voix de l’IA ne supprime pas le travail ; il déplace les efforts vers de meilleurs instructions et visuels plutôt que vers des sessions de voix off répétées.
Assurez-vous que les vidéos de formation soient exactes. Évitez les « slops de l'IA ».
Créez du contenu de formation plus rapidement sans sacrifier la qualité. Le cadre HUMAN est une stratégie en 5 étapes pour intégrer efficacement l'IA.
Obtenez le guide
Ce que notre étude AI Avatar nous apprend sur l'IA visuelle dans la formation
Notre étude AI Avatar a suivi une structure similaire à celle de la recherche vocale, les téléspectateurs regardant le même sujet pédagogique principal présenté dans cinq formats :image dans l'image humaine (PiP), humain plein écran, avatar IA PiP, avatar IA plein écran et une version avec un visualiseur audio.
Cette étude a porté sur des travailleurs à temps plein de plusieurs pays anglophones qui avaient récemment visionné une vidéo pédagogique. Il a mesuré les réactions à la qualité de la production, l’intention de revoir, la confiance et la rétention des apprentissages.
Tous les formats confondus, plus de 92 % des spectateurs ont qualifié les vidéos de professionnelles et ont déclaré qu'ils regarderaient une autre vidéo du même créateur. Ils étaient également convaincus de pouvoir terminer les étapes sans aide supplémentaire.
Cela constitue une base de référence importante :l’utilisation d’un avatar IA ne donne pas automatiquement l’impression qu’une vidéo est bon marché ou peu fiable. Lorsque la qualité de la production est solide, les apprenants s'engagent et font confiance au contenu tout autant qu'à une vidéo dirigée par un humain.
Quand les avatars de l'IA renforcent l'apprentissage (et pourquoi l'image dans l'image mène)
Moins peut être plus lorsqu'il s'agit d'avatars IA. Dans notre étude, le format PiP avatar a permis la rétention d'apprentissage la plus forte, avec environ 76 % des téléspectateurs répondant correctement aux questions du quiz, soit environ 10 points de plus que les autres formats. Et ils l'ont fait même après avoir regardé une vidéo de 43 secondes plusieurs minutes plus tôt sans possibilité de revenir en arrière.
PiP maintient le contenu de l'écran au premier plan tout en fournissant un petit guide à l'écran. L'avatar est visible sans être envahissant, ce qui aide les apprenants à rester concentrés sur les étapes et à se sentir guidés tout au long du processus.
Pour une formation étape par étape sur écran, avatar PiP est un choix par défaut solide. Des outils comme Camtasia rendent cette mise en page facile à créer, permettant à l'avatar de s'asseoir dans un petit cadre tandis que l'écran principal reste clair et lisible.
Quand les avatars IA deviennent distrayants (et pourquoi la taille est importante)
Les avatars IA ne sont pas distrayants par défaut, mais la taille compte. Lorsqu'un avatar remplit l'écran, les téléspectateurs sont plus susceptibles de remarquer des traits robotiques tels que des problèmes de synchronisation labiale, un contact visuel, des mouvements du visage limités, des clignements maladroits ou une respiration anormale.
Dans ces formats plein écran, davantage de participants ont correctement identifié l'avatar comme étant une IA. Cet examen minutieux supplémentaire détourne l’attention de la tâche ou du concept vers l’avatar lui-même. Pour les sujets sérieux, cela peut rendre l’expérience étrange ou rebutante.
Garder les avatars IA petits et secondaires est la meilleure solution pour la plupart des vidéos pédagogiques. Les dispositions d'image dans l'image ou les petits cadres permettent à l'avatar de fournir des conseils et un sentiment de présence sans dominer l'écran.
Les bons cas d'utilisation des avatars IA dans le contenu de formation
Tous les formats vidéo ne bénéficient pas de la même manière d'un avatar IA. Dans notre étude, les téléspectateurs étaient plus à l'aise avec les avatars IA dans le contenu pédagogique sur écran. Ils étaient moins à l'aise lorsqu'une présence personnelle était attendue, comme une vidéo de bienvenue du PDG ou une vidéo de mise à jour de l'équipe. Pour de meilleurs résultats, alignez intentionnellement l’utilisation de votre avatar sur vos cas d’utilisation spécifiques.
Utiliser Avatars IA pour :
- Tutoriels et procédures pas à pas sur les logiciels
- Formation sur les processus étroitement liée aux étapes à l'écran
- Mises à jour évolutives où la cohérence compte plus que la présence personnelle
Utilisez des présentateurs humains pour :
- Messages des dirigeants et communications sur le changement
- Sujets sensibles qui nécessitent des nuances émotionnelles et de la confiance
- Informations d'équipe sur les cas où il est important de voir le véritable manager ou leader
Avec des outils tels que Camtasia Audiate, les équipes peuvent mélanger des avatars d'IA avec des enregistrements d'écran pour créer un contenu de formation efficace et engageant, tout en continuant à capturer des vidéos dirigées par des humains où l'authenticité est essentielle.
Comment mesurer l'engagement avec des vidéos de formation basées sur l'IA
Si l’IA change la façon dont vos vidéos de formation sont créées, elle devrait également influencer la façon dont vous évaluez l’engagement des apprenants. Les statistiques de base restent les mêmes pour les formats IA et non-IA :
- Taux d'achèvement et points de dépôt
- Revoir le comportement des sections clés
- Performances des quiz et analyses au niveau des questions
- Enquêtes de rétroaction ou sondages rapides
Ce qui change, c'est la comparaison. Au lieu d'examiner une seule version de manière isolée, vous pouvez évaluer côte à côte les formats d'IA et ceux dirigés par l'humain pour voir en quoi ils diffèrent en termes de rétention et de sentiment des apprenants. Vous pouvez également savoir si les flux de travail basés sur l'IA aident les équipes à publier des mises à jour plus fréquentes et plus pertinentes.
Commencez par une petite expérience. Sélectionnez un ou deux modules de grande valeur, créez à la fois une version voix humaine et voix IA – ou une version PiP présentateur humain contre avatar IA – et mesurez l'achèvement et les résultats du quiz sur quelques semaines.
Créez votre prochaine vidéo de formation avec Camtasia
Enregistrez votre écran ou votre caméra. Ensuite, utilisez l’éditeur vidéo pour ajouter du raffinement et de la clarté.
En savoir plus
Comment l'IA réduit les coûts de formation et adapte les mises à jour de contenu
L'utilisation de voix et d'avatars IA permet de réaliser des économies directes et une plus grande flexibilité opérationnelle.
Les économies directes comprennent :
- Éliminez le temps (en studio) consacré aux enregistrements de voix off
- Pas besoin de réenregistrer des vidéos entières après de petites modifications de script
- Coût marginal réduit pour créer des versions localisées
Les gains indirects comprennent :
- Réponse plus rapide aux mises à jour de produits ou de règles
- La possibilité de tenir à jour un plus grand catalogue de formations
Plutôt que de rogner sur les raccourcis, l’IA supprime les goulots d’étranglement de la production. Les équipes peuvent réinvestir ce temps et ce budget dans une meilleure conception visuelle, des scénarios plus solides, des boucles de rétroaction plus claires et des mises à jour plus fréquentes.
Conseils pratiques pour choisir les avatars humains, IA et IA
Le bon format dépend de l’objectif de votre vidéo. Utilisez ce guide de décision rapide :
- Contenu chargé en écran, procédural et fréquemment mis à jour :Voix IA de haute qualité avec enregistrement d'écran, plus un avatar IA en option dans PiP.
- Contenu sensible aux émotions, axé sur la culture ou axé sur le leadership :Présentateur humain avec une voix humaine.
- Apprentissage long et riche en concepts :Un mélange de modules dirigés par des humains pour les idées de base, soutenus par des micro-leçons et des rappels exprimés par l'IA.
Quel que soit le format, quelques principes s’appliquent toujours. Établissez des normes de qualité élevées pour chaque voix, qu’elle soit IA ou humaine. Utilisez l’IA là où la vitesse, l’évolutivité et la cohérence comptent le plus. Pilotez régulièrement de nouveaux formats et recueillez les commentaires des apprenants.
Au sein de l'écosystème Camtasia, les équipes peuvent ajuster la mise en page et le rythme, utiliser des outils de voix ou d'avatar IA pour les voix off ou la narration.
Nos études montrent que lorsque la qualité est élevée et que le format est adapté à la tâche, les apprenants sont à l'aise avec les voix et les avatars de l'IA.
Une solution pratique consiste à commencer modestement et à rester axé sur les données. Associez un ou deux didacticiels à fort impact avec une voix IA de haute qualité ou un avatar PiP, soutenus par des instructions solides basées sur des scènes, et voyez comment les apprenants réagissent. Suivez l'achèvement, la rétention et le sentiment en cours de route, puis ajustez les domaines où l'IA ou la présence humaine sont les plus logiques.
Lorsque vous êtes prêt à expérimenter, Camtasia propose les outils nécessaires pour créer, affiner et faire évoluer le contenu de formation, plus rapidement et avec plus de cohérence.
Prêt à commencer ? Créez votre prochaine vidéo de formation avec Camtasia
FAQ
Les voix de l'IA sont-elles aussi performantes que la narration humaine dans les vidéos de formation ?
Dans notre étude AI Voices, la qualité de la voix comptait plus que le fait qu’elle provienne d’une intelligence artificielle ou d’une voix humaine. Les résultats du quiz étaient légèrement meilleurs pour les téléspectateurs qui regardaient des vidéos avec AI Voices. La voix de l'IA de haute qualité a produit les meilleurs résultats de rétention, tandis que les voix de mauvaise qualité, clairement synthétiques, étaient plus distrayantes et plus faciles à identifier comme étant de l'IA.
Les avatars IA sont-ils trop distrayants pour les sujets sérieux ou complexes ?
Pas par défaut. Tous les formats d’avatars ont obtenu des résultats très élevés en termes de professionnalisme, de revoyabilité et de confiance de l’apprenant. La distraction n'est devenue un problème que lorsque l'avatar a rempli l'écran et que les téléspectateurs ont pu facilement voir les traits du visage du robot. Pour les formations sérieuses ou complexes, les données permettent de conserver des avatars petits dans les dispositions d'image dans l'image et de réserver les formats plein écran aux présentateurs humains.
Devrions-nous divulguer lorsque nous utilisons une voix ou un avatar IA dans le contenu de formation ?
Les personnes interrogées dans les pays anglophones préféraient généralement la divulgation lorsqu’une voix ou un avatar IA était utilisé. Une simple note, telle que « Raconté avec une voix IA », suffit généralement à maintenir la confiance. La divulgation est avant tout un choix de transparence, en particulier lors du déploiement de la narration de l'IA à grande échelle.
Comment devrions-nous mesurer l'impact des voix et des avatars de l'IA sur l'apprentissage ?
Utilisez les mêmes mesures d'engagement et de fidélisation sur lesquelles vous comptez déjà :taux d'achèvement, points de dépôt, comportement de révision, performances des quiz et enquêtes de rétroaction rapides. Les formats d'IA facilitent simplement l'exécution de tests A/B, tels que la comparaison des versions à voix humaine et à voix IA, pour déterminer laquelle est la plus performante.
Où les voix et les avatars de l'IA ont-ils le plus de sens dans un catalogue de formation ?
L'ajustement le plus fort est le contenu procédural et lourd à l'écran où la clarté et la cohérence sont importantes. Une voix IA de haute qualité associée à des enregistrements d'écran et à une image dans l'image d'avatar en option fonctionne bien pour les procédures pas à pas, la formation aux processus et les mises à jour fréquentes. Les présentateurs humains restent le meilleur choix pour les messages de leadership, le contenu culturel et les sujets nécessitant une nuance émotionnelle.
L'utilisation de formats d'IA rendra-t-elle notre formation moins personnelle ou moins fiable ?
Cela dépend de la façon dont ils sont utilisés. Lorsque l’audio et les visuels sont de haute qualité et que le format correspond au cas d’utilisation, les apprenants considèrent les vidéos d’IA comme professionnelles et déclarent qu’ils en regarderaient davantage du même créateur. La confiance a tendance à diminuer uniquement lorsque l'IA est utilisée dans des endroits où les gens s'attendent à une véritable présence humaine ou lorsque l'avatar ou la voix semblent clairement artificiels.