La transcription automatique par IA consiste à utiliser cette technologie pour convertir du contenu audio et vidéo en texte. Contrairement à la transcription manuelle, où vous devez écouter et saisir ce que vous entendez, ces outils de transcription effectuent cette tâche automatiquement. Ces logiciels utilisent le traitement du langage naturel, des algorithmes d’apprentissage automatique et d’énormes bases de données de données linguistiques pour reconnaître et transcrire la parole. Ainsi on peut automatiser la prise de notes pendant des réunions ou des interviews, transformer des contenus vidéos et audio en texte et même d’ajouter des sous-titres à des vidéos. Ces avancées de l’IA permettent d’avoir des rendus beaucoup plus qualitatifs et de gagner plus de temps sur la création de contenu.
Quelles sont les différentes méthodes pour retranscrire un audio en texte facilement ? Quels types de logiciels existent ? Qu’est-ce qui fait un bon outil de retranscription ?
Pour vous faciliter la tâche, on répond à toutes ces questions dans cet article.
Sommaire
Les 4 types de logiciels de retranscription audio ou vidéo
Les logiciels de retranscription audio et vidéo fonctionnent en quelques étapes simples. Vous commencez par télécharger votre fichier audio ou vidéo dans l’outil de transcription. L’outil d’IA procède ensuite à l’analyse du fichier, le convertissant en texte pendant la phase de traitement. En sortie texte, vous obtenez finalement la transcription de votre contenu téléchargé, prête à être examinée, traduite, modifiée et partagée.
- Retranscription d’une interview à l’écrit
Suite à une interview orale avec un expert de votre domaine, vous avez la possibilité de convertir facilement votre contenu parlé en un article écrit grâce à des outils de retranscription tels que Verbit, Dictation, Happy Scribe et Scribe. Ces outils facilitent la transformation rapide et efficace de l’information verbale recueillie lors de l’entretien en un texte rédigé.
- Compte rendu d’une réunion
À la suite d’une réunion prolongée impliquant plusieurs participants, où le temps pour prendre des bonnes notes est limité, certains logiciels proposent l’automatisation de votre prise de notes. Des outils tels que Fireflies, TL;DV, Verbit et Otter.ai permettent d’analyser les voix enregistrées lors de la réunion pour générer automatiquement un résumé pertinent, ce qui simplifie la création d’un bon compte rendu.
- Transformer ses contenus vidéos et audio en texte
Après la création d’un contenu vidéo ou d’un podcast, si vous aspirez à sa transformation en d’autres formats ou à l’exploitation de moments importants pour diversifier votre contenu, il est possible de procéder à une analyse et à la sectorisation du contenu. Ce type de logiciel, comme Descript ou Capte, permet de transcrire les éléments essentiels à l’écrit, offrant ainsi la possibilité de les convertir en snack content, livre blanc, ou tout autre format écrit.
- Ajouter des sous-titres à son contenu vidéo
Si vous cherchez des outils pour intégrer des sous-titres à vos vidéos, des logiciels comme Happy Scribe ou Capte sont idéals. Ces logiciels effectuent une analyse précise de l’audio et vous proposent une transcription synchronisée au moment opportun. Par la suite, vous avez la flexibilité de réorganiser le texte pour ajuster et améliorer l’apparition des sous-titres au bon moment.
#1 Fireflies
Fireflies.ai est un assistant de réunion : il enregistre, retranscrit et résume vos réunions. Avec plus de 70 langues disponibles, l’outil utilise l’IA pour suivre les intervenants, les sujets principaux, les détails importants de vos réunions et vous propose ses analyses pour améliorer vos réunions futures.
Les intégrations permettent beaucoup de flexibilité avec une compatibilité Aircall, Salesloft, Ringcentral et Zoom, Google Meet, et MS Teams. En revanche, Fireflies ne dispose pas d’application mobile et les textes ne peuvent pas être traduits dans d’autres langues.
Niveau tarifs, il existe trois offres :
- Version gratuite : nombre limité de crédits-transcription et 800 minutes de stockage par utilisateur
- Version Pro : 10$/mois par utilisateur avec un nombre illimité de crédits-transcription, 8000 minutes de stockage et plus de fonctionnalités IA
- Version Business : 19$/mois par utilisateur avec un nombre illimité de crédits-transcription et de stockage, plus de fonctionnalités et d’intégrations
Fireflies propose une version gratuite pour vous faire une bonne idée des possibilités de l’outil.
Aller plus loin
#2TL;DV
Tout comme Fireflies, TL;DV est un logiciel de transcription de réunions qui enregistre et résume vos appels avec vos clients, prospects et équipes dans plus de 30 langues. L’outil combine la transcription automatique, la création de résumés ainsi que la traduction.
TL;DV permet de nombreuses intégrations avec d’autres logiciels comme Google Meet, Teams, Zoom, Notion ou Salesforce. Malgré des transcriptions généralement bonnes, l’outil peut parfois faire des erreurs.
Au niveau des tarifs, deux offres existent :
- Version gratuite : enregistrement et transcription illimitées pour Google Meet et Zoom dans une vingtaine de langues
- Version Pro : 20$/mois par utilisateur avec l’ensemble des fonctionnalités IA et des intégrations illimitées (plus de 5000 outils de productivité et CRMs)
tl;dv permet de rechercher des sujets abordés lors des réunions pour trouver et résumer instantanément chaque discussion liée au mot-clé.
#3 Verbit
Verbit combine l’IA et les compétences humaines pour offrir des services de transcription, de sous-titrage, de description audio et de traduction précis. Après que l’IA a généré les premières versions, elle fait appel à un réseau de plus de 5 000 transcripteurs professionnels pour les revoir et les corriger.
Le logiciel utilise des technologies de pointe pour générer des transcriptions précises, même pour des enregistrements audio bruyants, et s’intègre à de nombreuses applications externes comme Blackboard, Canvas ou Kaltura. Malheureusement, les seules langues disponibles sont l’anglais et l’espagnol.
Verbit propose 3 offres :
- Auto : 0.15$/minute avec un rendu utilisant l’IA en 2 heures seulement
- Pro : 1.80$/minute avec un retour vérifié par des pros de la traduction sous 48 heures
- Elite : 2.69$/minute avec un rendu complètement rédigé par des pros en 5 jours
Verbit est idéal pour les équipes des secteurs de l’enseignement supérieur, juridique et médiatique
#4 Scribe
Scribe est un transcripteur libre audio/vidéo en texte : l’objectif de cet outil est de fournir gratuitement un outil simple et rapide pour permettre de récupérer un texte et l’utiliser comme version numérique.
Le logiciel fonctionne avec des vidéos et des bandes-sons à télécharger directement depuis votre ordinateur ou avec un lien vers l’adresse d’un son ou d’une vidéo (Peertube, Youtube, Vimeo, Dailymotion…).
Pour l’instant, l’outil est seulement disponible en français ou en anglais et propose une retranscription brute sans analyse.
Scribe est un logiciel open source donc vous héberger l’outil sur vos propres serveurs gratuitement.
#5 Microsoft Word
La fonction Transcrire de Microsoft Word convertit la parole en une transcription textuelle où chaque orateur est isolé. Après votre conversation, entretien ou réunion, vous pouvez réécouter certaines parties de l’enregistrement en écoutant l’audio horodaté et en modifiant la transcription pour y apporter des corrections.
Vous pouvez enregistrer la transcription complète en tant que document Word ou en insérant des extraits dans des documents existants.
La fonction Transcrire de Word a l’avantage d’être très utile pour les utilisateurs de Microsoft Office 365.
#6 Dictation
Dictation est une application gratuite de reconnaissance vocale à télécharger sur l’App Store pour iPhone, iPad, Mac et Apple Watch. Elle permet de dicter, enregistrer, traduire et transcrire du texte au lieu de le taper dans plus de 40 langues, avec une synchronisation iCloud.
Malgré de très bons retours sur l’application en général, Dictation a tendance à mal comprendre les accents.
Plusieurs tarifs sont proposés chez Dictation :
- La version gratuite comprend des publicités et une limite de temps.
- La version payante (6,99€/mois ou 19,99€/an avec Mac et 5,99€/mois ou 14,99€/an sans Mac) est sans publicité et permet la traduction automatique de vos textes.
Découvrir l’application Dictation La version gratuite permet de tester l’application avant de passer à la version Premium.
#7 Happy Scribe
Happy Scribe est une solution de transcription professionnelle qui propose plus de 120 langues. Le processus de transcription est très simple : il suffit d’envoyer le fichier ou l’URL de la vidéo à traduire à Happy Scribe. Le logiciel s’occupe ensuite de la transcription et de l’envoi du résultat au format souhaité.
La précision de la transcription est de 85 % en moyenne et il est même possible de créer des espaces de stockage collaboratifs ou de connecter le logiciel à YouTube ou Zapier.
Au niveau des tarifs, il existe 4 offres :
- Version gratuite : quelques minutes d’essai seulement
- Version Basic : 17€/mois pour 120 minutes de transcription
- Version Pro : 29€/mois pour 300 minutes de transcription
- Version Business : 49€/mois pour 600 minutes de transcription
L’outil permet de faire vérifier les transcriptions par des professionnels.
#8 Otter.ai
Otter.ai est un outil de transcription automatisée en temps réel pour les événements en personne et virtuels avec une intégration aux calendriers Google et Microsoft. Après les réunions, Otter crée et partage des notes de réunion résumées avec tous les participants par e-mail.
L’outil fonctionne seulement en anglais et n’est pas idéal pour les accents non-américains et non-britanniques.
Otter.ai propose 3 offres :
- Basic : version gratuite avec 300 minutes de transcription par mois mais limité à 3 importations de fichiers
- Pro : 16.99$ par utilisateur pour 1200 minutes de transcription avec 10 importations de fichiers par mois
- Business : 40$ par utilisateur pour 6000 minutes de transcription avec importations illimitées
Pour les travaux nécessitant une perfection absolue, le service « White Glove » garantit une précision allant jusqu’à 99 % grâce à des transcripteurs professionnels.
#9 Descript
Descript est un outil de transcription automatique qui se distingue par sa rapidité, son rapport qualité-prix et sa précision allant jusqu’à 99%. Les fonctionnalités avancées sont disponibles en 22 langues et permettent d’enregistrer le nom des intervenants grâce à l’IA.
La synchronisation dans le cloud permet également d’accéder instantanément à vos transcriptions de n’importe où, tout en bénéficiant d’un historique complet des versions.
Niveau pricing, Descript propose 3 versions :
- Free : version gratuite avec 1 heure de transcription par mois
- Creator : 15$ par utilisateur pour 10 heures de transcription par mois
- Pro : 30$ par utilisateur pour 30 heures de transcription par mois
Découvrir Descript Pour les travaux nécessitant une perfection absolue, le service « White Glove » garantit une précision allant jusqu’à 99 % grâce à des transcripteurs professionnels.
#10 Capte
Capte est un outil français qui utilise la reconnaissance vocale pour transcrire l’audio en sous-titres. L’IA et l’interface simple rendent simple la création de sous-titres. Vous pouvez modifier vos sous-titres avec des mises à jour en temps réel, les personnaliser, les traduire dans plus de 10 langues puis les exporter en format SRT.
En revanche, le logiciel ne peut traduire qu’une seule langue par vidéo et le support chat n’est pas des plus réactifs.
Deux versions existent chez Capte :
- La version Standard à 20€/mois qui inclut 20 vidéos de 5 minutes maximum par jour et des templates pour réseaux sociaux
- La version Premium à 50€/mois qui inclut 100h de vidéos de 20 minutes maximum, la traduction automatique et les vidéos en HD.
Capte propose 3 jours d’essai gratuit et les deux versions sont sans engagement.