Vous vous demandez ce qu'est un codec audio et comment choisir le bon pour la diffusion vidéo ou l'enregistrement en direct ?
Imaginez que nous vivions dans un monde purement analogique. Il n'y aurait pas besoin de choses telles que les codecs audio. Qu'est-ce qu'un codec audio que vous demandez? C'est un algorithme utilisé pour convertir les signaux audio analogiques en signaux numériques. Une nécessité dans le monde des appareils numériques, des lecteurs multimédias et d'Internet.
La qualité du codec audio s'est améliorée au fil des ans. Repensez aux années 1980, lorsque les amplis numériques devenaient courants. Par rapport à la qualité de reproduction des amplis numériques d'aujourd'hui, la différence est flagrante. De meilleurs codecs audio reproduisent un son haute fidélité plus réaliste.
Mais il existe tellement de codecs audio. Comment choisissez-vous ?
De nombreux codecs sont spécialisés. Certains sont propriétaires et d'autres sont créés pour des applications spécifiques, comme les télécommunications. Pour les signaux uniquement vocaux, comme sur votre téléphone, vous n'avez pas besoin de haute fidélité et vous pouvez en fait bénéficier de l'utilisation d'un codec qui reproduit un signal avec une plage audio limitée. Mais pour la musique, un signal audio de haute fidélité est certainement plus souhaitable.
Creusez plus profondément et vous découvrirez que différents codecs audio font des choses différentes sur le signal analogique d'origine. Par exemple, un codec audio comme PCM est un algorithme de compression sans perte. Cela signifie que le signal est reproduit numériquement sans perdre aucun des bits d'information d'origine. D'autres codecs audio, comme AAC et MP3, sont avec perte et compriment l'audio. La compression supprime de petits morceaux du contenu original pour réduire la taille du fichier. Si vous écoutez des chansons sur un appareil mobile, vous pouvez être sûr que les fichiers sont compressés pour les rendre plus petits. De cette façon, plus de fichiers musicaux peuvent tenir sur votre appareil, mais la qualité n'est pas optimale.
Codecs audio sur Pearl et Pearl-2
Maintenant, je n'essaie pas de combler le fossé béant entre les codecs audio dans ce blog, mais de vous aider à dissiper le flou entourant le choix d'un codec audio pour la diffusion vidéo en direct ou l'enregistrement à l'aide d'Epiphan Pearl ou Pearl-2.
Trois codecs audio sont disponibles sur Pearl :
- PCM – Codec audio non compressé, idéal si vous prévoyez d'enregistrer votre programme pour le modifier ultérieurement et lorsque vous n'êtes pas préoccupé par la quantité de bande passante requise.
- AAC :un codec audio de compression idéal pour la diffusion en direct ou l'enregistrement de contenu pour une lecture immédiate sur des lecteurs multimédias et pour le téléchargement sur Internet. Les experts disent que l'AAC reproduit un son de meilleure qualité que le MP3 au même débit audio. Bien que je n'aie pas testé cela, les nouveaux codecs audio ont tendance à mieux reproduire les signaux analogiques que les anciens, donc je ne serais pas du tout surpris si c'était vrai (clin d'œil aux experts).
- MP3 – Codec audio de compression plus ancien mais toujours très populaire, idéal pour la diffusion en direct ou l'enregistrement de contenu pour une lecture immédiate sur des lecteurs multimédias et pour la mise en ligne sur Internet.
Le choix du bon codec audio est important lors de la configuration de votre événement de diffusion en direct ou de l'enregistrement à l'aide de Pearl ou Pearl-2. Pour obtenir un son de meilleure qualité, vous devez également prendre en compte le choix d'un taux d'échantillonnage et les effets du rééchantillonnage de l'audio.
Taux d'échantillonnage et problème de rééchantillonnage
Le taux d'échantillonnage est le nombre de fois par seconde où le signal audio est échantillonné.
Des taux d'échantillonnage plus élevés équivalent à plus d'informations, ce qui signifie une plus grande fidélité, n'est-ce pas ? Donc, si je choisis un codec de compression avec perte comme MP3, ne puis-je pas simplement augmenter le taux d'échantillonnage et le débit audio pour améliorer la qualité ?
Il est vrai qu'une plus grande partie du signal d'origine est échantillonnée. Mais plus ne signifie pas automatiquement mieux. Il est important de faire correspondre le taux d'échantillonnage du signal encodé de votre flux en direct (ou contenu enregistré) au taux du signal source pour préserver la qualité de votre audio. L'équipement audio professionnel utilise une fréquence d'échantillonnage de 48 kHz et l'équipement audio grand public utilise une fréquence de 44,1 kHz. Les sources HDMI et SDI échantillonnent l'audio à 48 kHz. Si vous modifiez la fréquence d'échantillonnage de votre audio pendant la diffusion, l'audio est déformé car le signal est rééchantillonné à une fréquence différente.
Un exemple courant de rééchantillonnage est lorsque vous prenez de l'audio qui a été enregistré à l'origine avec un équipement professionnel à une fréquence d'échantillonnage de 48 kHz et que vous le transférez sur un CD sur votre ordinateur. L'audio est rééchantillonné à un taux inférieur de 44,1 kHz, ce qui provoque une certaine distorsion audio et une perte de fidélité. Dans ce cas, un choix légèrement meilleur consiste à échantillonner à 88,2 kHz (si votre équipement le prend en charge) car cela se convertit uniformément en 44,1 kHz.
Alors pourquoi le 48 kHz est-il la norme de référence et largement utilisé par les sources HDMI ou SDI ? Parce qu'il produit un bon son pour l'auditeur moyen et ne crée pas de fichiers trop volumineux. Augmenter considérablement le taux d'échantillonnage ne sera pas rentable si votre oreille ne peut pas distinguer la différence. Et pour l'auditeur moyen, la différence entre l'audio enregistré à 44,1 kHz et à 48 kHz est négligeable (même si je ne dis pas qu'il n'y en a pas pour tous les audiophiles).
Dans certains cas, une fréquence d'échantillonnage plus élevée peut être utile. Vous pouvez enregistrer du contenu original pour le post-produire et l'enregistrer plus tard sur CD (l'échantillonnage à 88,2 kHz fonctionne bien), ou peut-être que vous restaurez des enregistrements historiques et que vous souhaitez utiliser autant de données que possible. Il existe de bons arguments pour échantillonner à des fréquences plus élevées telles que 96 kHz ou 192 kHz. Cependant, cela produit des fichiers beaucoup plus volumineux.
Un phénomène peu évoqué lors du choix de fréquences d'échantillonnage supérieures à 48 kHz est la génération potentielle d'harmoniques ultrasonores. Ces harmoniques peuvent ne pas affecter négativement votre produit final, mais la façon dont ces harmoniques sont traitées dépend en grande partie de votre équipement. Les fréquences ultrasonores sont bien en dehors de la plage audible de l'oreille humaine, mais il est possible que l'électronique de votre équipement ou de vos haut-parleurs génère une distorsion qui se situe dans la plage audible, qui est d'environ 20 Hz à 20 kHz pour la personne moyenne. Vous voudrez peut-être approfondir vos recherches et tester votre équipement avant d'utiliser des taux d'échantillonnage de 96 kHz et plus.
Considérations relatives au codec audio, à la fréquence d'échantillonnage et au débit audio
Les codecs audio, les fréquences d'échantillonnage et le débit binaire audio résultant (c'est-à-dire la quantité de données par seconde) sont liés à la hanche. Ce qui vous convient dépend de considérations telles que la capacité de téléchargement de la bande passante dont vous disposez et l'équipement que vous utilisez.
Un débit audio plus important signifie une taille de fichier plus grande et certains sites Web limitent donc le débit. Des sites comme YouTube prennent en charge des débits binaires aussi élevés que 320 kbps (au moment de la rédaction de ce blog), mais d'autres le sont moins. Vérifiez cela avant d'en choisir un.
Avec Pearl ou Pearl-2, le débit binaire audio maximal pour l'encodage de signaux audio mono échantillonnés à 44 kHz est de 264 kbps. Pour la stéréo, 320 kbps est pris en charge.
Voici quelques éléments pratiques à prendre en compte lors du choix d'un codec audio et d'un débit audio.
- De quelle capacité de transfert de bande passante disposez-vous ? Et quelle quantité de bande passante souhaitez-vous utiliser pour votre signal audio lorsque vous devez également tenir compte de la quantité de bande passante dont votre vidéo a besoin ?
- Sacrifiez-vous la qualité vidéo en augmentant la qualité audio ? Une vidéo de qualité inférieure est beaucoup plus évidente qu'un son de qualité inférieure. Êtes-vous prêt à tolérer certaines images vidéo perdues pour un son plus fidèle si votre connexion Internet ne peut pas gérer l'exigence de bande passante combinée ?
- Quelle source audio enregistrez-vous ? Capturez-vous uniquement la voix ou avez-vous besoin d'une plus grande fidélité ? Si vous enregistrez simplement quelqu'un qui parle, vous pouvez utiliser une profondeur de bits inférieure. Le fichier sera également plus petit. Mais gardez à l'esprit que l'audio numérique sur disque compact utilise 16 bits, les DVD audio et Blu-ray prenant en charge jusqu'à 24 bits. Plus la profondeur de bits que vous sélectionnez est élevée, meilleure est la résolution de votre signal numérique résultant.
- L'enregistrement à des fréquences d'échantillonnage supérieures à 48 kHz (c'est-à-dire 96 kHz ou 128 kHz) n'est généralement pas nécessaire et augmente considérablement la taille de vos fichiers.
- Téléchargez-vous des fichiers directement sur Internet et souhaitez-vous les compresser ou enregistrez-vous le fichier pour le modifier ultérieurement à l'aide de votre logiciel de montage vidéo et ne souhaitez donc pas de compression ? Le choix d'un codec comme PCM conserve l'intégralité de l'intégrité du flux pour une édition ultérieure. Si la bande passante n'est pas un problème, choisissez le débit audio le plus élevé possible. Sinon, utilisez AAC ou MP3 et sélectionnez une fréquence d'échantillonnage qui correspond à la fréquence d'échantillonnage de votre source pour éviter de rééchantillonner l'audio.
Votre choix de codec audio fait toute la différence
Faire le bon choix de codec et de fréquence d'échantillonnage peut vous aider à améliorer la qualité de votre contenu numérique enregistré ou diffusé en continu. Savoir ce qui est nécessaire pour votre application particulière ou les exigences du distributeur de contenu que vous avez choisi fait toute la différence. Bien que je n'ai fait qu'effleurer la surface ici, j'espère que vous pourrez prendre une décision plus éclairée lors du choix d'un codec audio pour votre prochaine diffusion en direct ou événement enregistré.