Dans cet article je vous explique comment accélérer la création de sous-titres pour vos vidéos avec le générateur de sous-titres automatique. Toutes ses informations sont basées sur les différents tests que j'ai effectués au cours des 3 dernières années.
J'ai réalisé mon premier projet de sous-titrage en 2016. A cette époque je venais de réaliser une vidéo pour une startup qui allait lancer une campagne Kickstarter. Je pensais que ça allait être extrêmement simple et que c'était l'occasion de vendre un service supplémentaire 🤑. Je ne savais pas du tout dans quoi je m'embarquais… A la fin de ce projet je me suis dit "je ne ferai plus jamais de sous-titrage".
C'est tout ce que je fais aujourd'hui. Qu'est-ce qui m'a fait changer d'avis ? C'est simple, j'ai réussi à optimiser mon workflow de création et à me doter des bons outils. J'ai réussi à diviser par huit le temps de création de mes sous-titres.
Dans cet article, je vais vous expliquer comment j'ai fait. Vous aurez toutes les astuces qui vous feront gagner du temps aussi dans la création de vos sous-titres ⚡
Je vais répondre à ces questions :
- Le sous-titrage automatique fonctionne-t-il ?
- Pouvons-nous utiliser le sous-titrage automatique de Youtube ?
- Quelle est la meilleure solution pour le sous-titrage en ligne ?
- Comment sous-titrer automatiquement une vidéo dans une langue étrangère ?
Voici le plan en détail :
- 1 – Comment fonctionne le sous-titrage automatique ?
- Sous-titres automatiques dans la langue d'origine de la vidéo
- Sous-titres automatiques dans une langue étrangère avec traduction automatique
- Comment fonctionne le sous-titrage automatique ?
- Créer des sous-titres automatiques.
- 2 – Quelle solution pour générer des sous-titres automatiquement ?
- API externes pour la reconnaissance vocale et la traduction automatique, si vous avez des compétences techniques.
- API de reconnaissance vocale
- Les meilleures API de reconnaissance vocale
- API de traduction automatique
- Les meilleures API de traduction automatique
- Entraîner son propre réseau de neurones, la solution la plus complexe.
- La solution de sous-titrage automatique en ligne la plus simple.
- API externes pour la reconnaissance vocale et la traduction automatique, si vous avez des compétences techniques.
- 3 – Quelles sont les meilleures solutions de sous-titrage automatique en ligne ?
- Sous-titrage Youtube automatique
- Sous-titrage Facebook automatique
- Checksub :solution de sous-titrage automatique en ligne
- Kapwing
- Rev :pour le sous-titrage anglais uniquement
- Veed.io :pour le montage vidéo en ligne
- Authôt :Pour les transcriptions vidéo
- 4 – Astuces à savoir :
- Préparez votre fichier vidéo
- Optimisez le téléchargement de votre vidéo
- Dans le cas d'une traduction, corrigez les sous-titres originaux.
- Récupérer ou exporter votre vidéo
- Ajouter des sous-titres à une vidéo déjà mise en ligne sur Youtube, Facebook, Vimeo, Wistia,…
- 5 – À retenir
1 - Comment fonctionne le sous-titrage automatique ?
Lorsque l'on parle de sous-titrage automatique, il est important de différencier deux besoins. Il y a du « sous-titrage » dans la langue originale de la vidéo et il y a du « sous-titrage » dans une langue étrangère. Vous verrez que le sous-titrage en langue étrangère est plus complexe.
Sous-titres automatiques dans la langue d'origine de la vidéo
Le sous-titrage codé dans la langue d'origine utilisera ce qu'on appelle la reconnaissance vocale. C'est-à-dire que la solution extraira l'audio de la vidéo, puis l'algorithme pourra comprendre et réécrire les mots prononcés.
Dans cette étape il est possible d'avoir un dictionnaire que l'on va alimenter en mots pour permettre à l'algorithme d'élargir son champ lexical. Ceci est par exemple très utile lors de l'utilisation d'un jargon particulier ou technique. On peut aussi l'appeler un glossaire.
Sous-titres automatiques dans une langue étrangère avec traduction automatique
Dans le cas du sous-titrage automatique en langue étrangère l'algorithme créera d'abord les sous-titres dans la langue de la vidéo puis sur cette base il les traduira.
La qualité de la traduction automatique dépendra donc de la qualité du sous-titrage dans la langue de la vidéo. Donc, si vous voulez un résultat de qualité, il est préférable de vérifier les légendes originales avant de les traduire automatiquement. Toute correction qui n'est pas faite sur les légendes originales devra être faite sur toutes les langues étrangères. Si vous n'avez qu'une seule langue, cela ne fait pas beaucoup de différence, mais si vous avez 15 langues, cela réduit considérablement votre temps de travail.
Comment fonctionne le sous-titrage automatique ?
Comment ça se passe côté algorithme ? En fait, que ce soit pour la reconnaissance vocale ou la traduction automatique, la logique est assez similaire. L'idée aujourd'hui n'est pas d'entrer dans les détails techniques mais d'en comprendre la logique.
Le résultat généré dépendra de ce qu'on appelle un modèle. C'est ce modèle qui intègre la logique utilisée pour transformer l'audio en texte. Ce modèle sera enrichi d'un ensemble de données avec lesquelles nous l'alimenterons. Par exemple en lui donnant des vidéos puis en corrigeant le résultat généré par le modèle. Le modèle enregistrera ses modifications et en tiendra compte lorsqu'il reviendra dans une situation similaire.
Si vous souhaitez une présentation beaucoup plus technique je vous invite à lire cet article qui est en anglais et qui parle de machine learning et deep learning.
Créer des sous-titres automatiques.
Commencez gratuitement2 - Quelle solution pour générer des sous-titres automatiquement ?
Il existe différentes solutions disponibles sur le marché. La solution idéale dépendra de votre besoin et de vos compétences techniques ou de celles de votre équipe.
Vous avez le choix entre ces trois grandes familles de solutions :
- API externes (pour les équipes techniques)
- créez votre propre modèle neuronal (le plus complexe)
- utiliser un éditeur de sous-titrage en ligne (le plus simple)
API externes pour la reconnaissance vocale et la traduction automatique, si vous avez des compétences techniques.
Il est à noter que cette solution nécessite des compétences techniques.
API de reconnaissance vocale
Le principe est de se connecter à un service externe, lui envoyer la vidéo ou l'audio et il nous enverra directement un fichier contenant tous les mots avec leurs time codes. Nous devons ensuite construire les sous-titres à partir de ce fichier.
Les meilleures API de reconnaissance vocale
Comme nous l'avons vu précédemment, chaque fournisseur d'API aura un modèle différent. Et le modèle donnera un résultat plus ou moins pertinent selon la langue que vous allez utiliser. Par exemple Google peut vous donner le meilleur résultat pour une vidéo en anglais mais ce ne sera pas forcément le cas pour une vidéo en espagnol. Pour obtenir le meilleur résultat, vous devez tester les différentes API et voir celle qui donne la meilleure qualité en fonction des vidéos que vous devrez sous-titrer.
Voici la liste des API les plus puissantes actuellement utilisées en reconnaissance vocale :
- Google Speech-to-text
- AWS
- Azur
- IBM
- Speechmatique
API de traduction automatique
Pour les API de traduction automatique, nous envoyons le texte original, la langue d'origine et la langue de traduction souhaitée. L'API nous enverra alors un texte correspondant à la traduction automatique générée par le système.
Les meilleures API de traduction automatique
Tout comme les API de reconnaissance vocale, il est difficile de dire que cela vous donnera le meilleur résultat. Cela dépend de la langue source et de la langue de traduction que vous allez utiliser. Google est un acteur majeur de la traduction automatique, couvrant plus de 110 langues. Mais il est loin d'être le plus performant sur toutes ces langues. Le petit nouveau Deepl est extrêmement puissant sur une dizaine de langues dont l'anglais, l'espagnol, l'italien, l'allemand…
- API Google Traduction
- API de traduction Microsoft
- API de traduction
- Text Translation API
- SYSTRAN.io Translation API
- MyMemory Translation API
- Deepl API
- My Translator Pro API
- Linguatools Translate API
- Yandex Translate API
- IBM Watson Language Translator API
Training your own neural network, the most complex solution.
If you have significant technical resources in your team the other solution is to build your own model powered by your data or open source data.
You can for example rely on an open source ASR such as CMUSphinx, Kaldi or more recently Common Voice by Mozilla.
This article details the differences in the complexity of implementation and the quality of the result:open-source solution for automatic transcription.
Please note that if you also want to subtitle in a foreign language you will have to create another template based on machine translation. The more languages you have for subtitles, the more complex and time-consuming it will be to create and maintain your own solution.
For the open-source translation solution, you can use the OpenNMT solution which is one of the most advanced projects.
The simplest online automatic subtitling solution.
If you don’t have the technical skills and want to opt for the easiest solution to generate your automatic subtitles, you’ve come to the right place.
Usually it is a solution available on a website that allows you to upload your video and automatically the platform will generate subtitles in the desired language. Some offer automatic translation and others only subtitles in the original language of the video.
Let me present you the different solutions in 3,2,1…
3 – What are the best solutions for automatic online subtitling?
Automatic Youtube subtitling
YouTube’s automatic subtitling platform is one of the most widely used. It has the advantage of being directly integrated into YouTube, but it is also free of charge. If subtitle quality is not a priority then it is more than enough. But if you want professional subtitles then in this case you might spend some time correcting the machine errors. The online interface is ergonomic but requires a lot of keyboard/mouse input in order to edit subtitles. We did the test with a timer and it takes as much or more time to correct the automatic subtitling of Youtube than to rewrite it entirely. But for those looking for a free solution, this is the best. For those who are interested, you have the step-by-step detail to use the Youtube automatic transcript in this article the best subtitling solutions on the market.
Please note that to use this solution you will have to upload your video to YouTube. But be aware that you can put it in private to prevent it from being visible to everyone.
Automatic Facebook subtitling
Facebook took a while to offer its online captioning solution. But inevitably in competition with YouTube, they had to come up with something. At the moment it’s not as good as YouTube. So if you only post on Facebook it can do the job but the other choices on this list are usually better.
Checksub:online automatic subtitling solution
By 2017 I had tested all existing subtitling solutions. Automatic solutions did not allow me to create subtitles faster. In fact, I was spending more time correcting automatic subtitling rather than creating subtitles from scratch. So I came up with a solution that really saves time with technology. On April 1, 2020, we decided to make this solution available to everyone at www.checksub.com.
Over the last 2 years we have imagined and designed the dream solution for video professionals, communication agencies, translation agencies, e-learning trainers,… The objective is to use all available technologies to create quality subtitles.
The strength of the solution is based on 3 elements:
- the best speech recognition and machine translation APIs are used
- the online subtitle editor is powerful and very easy to use
- it is a collaborative platform for working with translators, clients or other partners
How Automatic Closed Captioning Works :
- Upload your video
- Indicate, the desired language(s)
- Reread automatic subtitles
- Export the video or subtitle source file
The Checksub platform allows you to create subtitles in 128 languages.
Kapwing
Kapwing is mainly made for videos for social networks. The automatic English transcript works very well. In other languages, the result is not so good. Kapwing’s automatic subtitling interface is very simple. This quickly becomes a limit if you want quality subtitling. We can also regret the absence of the audio spectrum to adjust the time codes precisely.
Rev :pour le sous-titrage anglais uniquement
Rev is a transcription and captioning company that has become known for its manual (human) captioning service. For some time now it has been offering automatic subtitling. This service is only available for English videos. If your video is in another language you will not be able to use it. The result of the English transcription is of very good quality. Their online editor is very basic. Just like Kapwing, it is an interface that is meant to be quite simple and this is done at the expense of accuracy. This solution is therefore suitable if you have a project in English that is intended for social networks and the accuracy of the time codes is not a priority for you. In terms of price Rev is at the high end of the market.
Veed.io :for online video editing
Veed.io is above all an online video editor. But they also offer an automatic subtitling function. The principle is similar to that of other platforms, you upload your video and you have a “subtitles” menu so that the platform automatically generates subtitles in the original language. They are the only ones besides Checksub to offer automatic subtitle translation. Veed.io is an ideal solution for those who need to modify the editing of their video. If you are looking for a solution to manage mainly your subtitle creations this is not the most suitable solution.
Authôt :For video transcriptions
With Authôt it is possible to create a transcript of your video. But you should know that the tool is rather designed for the automatic transcription of audio documents. As soon as you open the interface, you will notice that the editor is less adapted to subtitling than its competitors. The subtitles are not displayed on the video, it is not possible to work on cutting the script into subtitles, and finally, it is impossible to modify the time codes.
Knowing that their rates are higher than other platforms, this solution does not seem to be suitable for the creation of subtitles. But this solution is interesting if you exceptionally have a subtitling project to do, you are used to using Authôt for your transcription and you already have credit. In this case, you don’t need to use another platform. But if your need for subtitling is becoming more and more important it would be a good idea to test other solutions.
4 – Tips to know :
Prepare your video file
Before starting to work on subtitling, it is essential that the editing be finalized. If after creating the subtitle you edit the video, the subtitle time codes may no longer match the video. This will force you to readjust all the subtitles or start from scratch. So even if you want to save time, wait until you have the final cut. If your changes do not affect the editing of the video at all (color, over-printing of text, …) it is not embarrassing and you can then start subtitling before the finalized version. But as soon as you modify the editing of the video you risk having staggered subtitles.
Optimize the download of your video
All the automatic subtitling solutions presented above require you to send the video to an external server for processing. If your video is too heavy and you don’t have the fiber, you may spend a lot of time uploading it to the server. The automatic subtitling platform will also take longer to prepare your project with a heavy video. So if you don’t need to generate an export from the platform by overlaying subtitles, it’s better to have a low definition version of your video to save time. In addition, if you have a slow Internet connection it will also save you time when loading the video on the platform. To compress your video you can use the Handbrake software available on this link:https://handbrake.fr/
In the case of a translation, correct the original subtitles.
As I explained earlier, machine translation will use subtitles in the original language. So the better the subtitles in the original language, the better the machine translation will be. So you have the choice to correct the original subtitles or spend more time on the foreign language subtitles. This is a tip that is especially valuable if you need to create subtitles in different foreign languages. Every change you make to the original subtitle saves you from having to redo it for each foreign language.
Recovering or exporting your video
Creating subtitles is good, using them is better. Depending on the use you want to make of the subtitles you will be able to export them in different formats. For example, if you want to add subtitles to a YouTube or Facebook video you will use the SRT format. If you want to customize the style of your subtitles it is necessary to generate a new export of the video by embedding the subtitles in the image. Checksub allows you to generate an export by embedding subtitles in the video. Alternatively, you can use a solution like Submerge to embed subtitles in a video. Here is a full tutorial to learn how to use Submerge to add subtitles to your video.
Add subtitles to a video already uploaded in Youtube, Facebook, Vimeo, Wistia,…
If the video you have just subtitled is already available on different platforms there is no need to upload your video again. If for example, you want to keep the views on YouTube you should avoid creating a new video that will make you start from scratch on all the statistics. In this case, it is best to upload the source file of the automatic subtitles, usually in SRT format, and then import it directly to the platform in question. This is an option that is available on almost all video hosting platforms that have a video player. It works with YouTube, Facebook, Vimeo, Wistia, and many others. The procedure, however, is specific to each form. We plan to do a tutorial to show how to do it. But for the moment the best is to look in the FAQ space of your hosting platform.
5 – To remember
As we have seen, there are many solutions, not all of which will necessarily save you time in subtitling. It is therefore important to choose the most suitable one. As a professional, the existing solutions did not suit me. That’s why I imagined and created Checksub. So if you are a video professional, a translation agency, a global company, … I invite you to test this solution because I imagined it for you.
Thank you for your attention and I hope this article will have helped you save a lot of time on the creation of your subtitles ⚡
Florian