Avec le MP3 disparu, quels codecs audio sont sur le point de devenir la nouvelle norme ? Parlons de la compression, des codecs audio modernes et de l'avenir de l'audio.
En 2017, les brevets du MP3, détenus par l'Institut Fraunhofer, ont expiré. À mesure que 2018 se déroule, de plus en plus de fabricants prennent en charge le codec. Le format MP3 est l'un des codecs audio les plus connus, et il a été en grande partie responsable de l'explosion du monde audio numérique.
Avec la disparition du MP3, quels codecs sont les mieux placés pour devenir le nouveau standard de l'industrie ?
Dans cet article, nous examinerons les bases des codecs, jetterons un coup d'œil aux formats audio les plus connus d'aujourd'hui et enfin jetterons un coup d'œil spéculatif sur les prochaines décennies de codecs audio.
Que sont les codecs audio ?
Codec est l'abréviation d'encoder/décoder. Ils peuvent être matériels ou logiciels - tous deux prennent l'entrée du signal analogique et le convertissent au format numérique. La fonction de décodage est exactement le même processus mais inversé pour permettre au flux de données numériques d'être converti en ondes sonores analogiques pour la sortie.
Il existe trois catégories de codec :non compressé, avec perte et sans perte.
- Non compressé : Les fichiers audio non compressés encodent le signal d'entrée audio complet dans un format numérique capable de stocker la pleine charge des données entrantes. Ils offrent la meilleure qualité et capacité d'archivage, au prix de fichiers volumineux et d'une latence élevée (lecture non en temps réel), interdisant leur utilisation généralisée dans de nombreux cas.
- Perdu : Les fichiers avec perte sont encodés différemment des fichiers non compressés. La fonction essentielle de la conversion analogique-numérique reste la même dans les techniques de codage avec perte. Avec perte diverge de non compressé, car la fréquence des ondes sonores d'entrée est échantillonnée jusqu'à une valeur numérique approximativement similaire. La somme totale de toutes ces valeurs numériques possibles donne au codec ce que l'on appelle sa profondeur de bits. La profondeur de bits du codec, 16 bits ou 24 bits le plus souvent, détermine la précision avec laquelle le son est «quantifié» - le processus d'échantillonnage utilisé pour arrondir les ondes sonores entrantes à leurs valeurs les plus proches. Les codecs avec perte rejettent une quantité considérable d'informations contenues dans les ondes sonores d'origine. Pour cette raison, les fichiers audio avec perte sont beaucoup plus petits que les fichiers non compressés et offrent une latence de lecture beaucoup plus faible, ce qui permet une utilisation dans des scénarios audio en direct.
- Sans perte : L'encodage sans perte constitue le juste milieu entre non compressé et avec perte. Il offre une qualité audio similaire à celle non compressée à des tailles considérablement réduites. Les codecs sans perte y parviennent en compressant l'audio entrant de manière non destructive lors de l'encodage avant de restaurer les informations non compressées lors du décodage.
Historique des codecs audio
Depuis le premier enregistrement audio connu en 1860 sur un Phonautographe, la technologie d'enregistrement et de lecture audio est en constante évolution. Le XXe siècle a introduit l'ère des preneurs de son et des ingénieurs du son professionnels, l'ère de la transmission de l'audio par ondes radio, les progrès massifs de la qualité et de la technologie audio, et la croissance continue de l'industrie audio - et du commerce en général.
En 1982, le monde de l'audio a fait ses premiers pas dans le nouveau millénaire avec le tout premier format audio numérique :le disque compact. Construit sur la technologie révolutionnaire Pulse Code Modulation (PCM), le CD a pu stocker des ondes sonores analogiques sous forme de valeurs numériques en les "quantifiant" à leur valeur numérique prise en charge la plus proche.
La modulation par impulsions codées a déclenché une nouvelle ère d'innovation pour les formats audio numériques. En une décennie, les codecs modernes reconnaissables comme MP3 et WAV gagnaient du terrain. Le début des années 2000 a vu la première vague de codecs audio sans perte qui ont amélioré encore la qualité numérique sans sacrifier la taille des fichiers.
Mais ces formats supérieurs n'étaient pas préparés à l'engouement pour les lecteurs MP3 du début des années 2000. L'iPod d'Apple a amené les masses dans le monde de l'audio numérique, et le MP3 est devenu la norme pour la lecture audio dans le monde entier.
Avec la mort du MP3, quel codec est le mieux placé pour le remplacer ? Quelles possibilités la technologie moderne apporte-t-elle au potentiel des futurs codecs audio ?
Les codecs d'aujourd'hui
Il existe aujourd'hui de nombreux codecs audio largement utilisés dans une myriade d'industries. De nombreuses entrées de cette liste ont été introduites il y a des décennies, mais quelques nouveaux codecs mettent en lumière le potentiel que recèle l'avenir des codecs audio.
- AMR – Multi-taux adaptatif : La famille AMR Codec est l'un des formats audio les plus couramment utilisés dans le monde. C'est en grande partie parce qu'il s'agit de la norme audio de facto sur les téléphones mobiles. L'AMR est optimisé pour la parole, ce qui signifie qu'il s'agit d'un codec de faible qualité, à faible bande passante et à faible latence. AMR n'a pas été développé pour la musique ou l'enregistrement ou la lecture audio de haute qualité.
- FLAC – Codec audio entièrement sans perte : Le FLAC est considéré par beaucoup comme la meilleure version du MP3. Il compresse les fichiers à des tailles remarquablement petites et le fait sans aucune perte perçue de qualité audio. Les fichiers FLAC sont très légers et polyvalents et peuvent être lus sur n'importe quel appareil capable de lire des MP3. Et c'est open-source, ce qui lui vaut toutes sortes de récompenses dans mon livre, notamment les implémentations tierces du codec et de ses fonctionnalités.
- WAV – Format de fichier audio de forme d'onde : Le format de fichier audio Waveform, généralement abrégé en WAV, est un cheval de bataille de l'industrie depuis près de trois décennies. Le secret de son adhérence réside dans la simplicité et la durabilité du codec. Les WAV offrent généralement une partie de l'audio non compressé de la plus haute qualité sans avoir besoin de transcodage. Sa stabilité signifie que souvent les fichiers WAV qui ont été endommagés ou corrompus seront toujours lus.
- ALAC – Codec sans perte Apple : Sorti en 2004, Apple Lossless Codec, ou Apple Lossless, prend en charge huit canaux audio jusqu'à une profondeur de 32 bits et une fréquence d'échantillonnage maximale de 384 kHz. En 2011, Apple a rendu ALAC open source et libre de droits.
- AAC – Codage audio avancé : AAC a été créé par l'Institut Fraunhofer - les mêmes ingénieurs derrière la compression MP3. Avec l'expiration du MP3 plus tôt cette année, l'Institut Fraunhofer recommande l'AAC comme codec de remplacement. AAC est un format avec perte dont le principal argument de vente est sa qualité sonore nettement supérieure à celle du MP3 aux mêmes débits binaires.
- DSD – Diffusion numérique directe : DSD est un codec audio unique de haute qualité. La technologie sous-jacente derrière DSD est un peu différente de la modulation de code d'impulsion standard trouvée dans la plupart des autres codecs. DSD utilise le codage Pulse-Density Modulation - réduisant la résolution du flux binaire et augmentant le taux d'échantillonnage à 2,8 millions de fois par seconde - pour générer le signal audio. DSD a une utilisation limitée dans le monde audio, servant en grande partie de codec audiophile à lire sur du matériel spécialisé.
- Opus : Opus est le codec le plus moderne pour faire cette liste. Sorti en 2012, il a été développé pour servir de norme unique pour plusieurs applications là où il y en avait plusieurs auparavant. Opus a été créé en gardant à l'esprit les besoins du monde moderne - au cœur de sa philosophie se trouve un son de haute qualité et à faible latence adapté aux communications réseau et aux performances musicales en direct. Sa latence peut être réduite jusqu'à 5 ms. La plupart des autres codecs peuvent à peine offrir 100 ms de latence, en comparaison.
Chaque année apporte de nouvelles variations et saveurs de la nouvelle technologie de codec, mais que devrions-nous rechercher dans une nouvelle norme pour la distribution audio de masse ?
Le futur
Alors que la myriade de formats parmi lesquels choisir aujourd'hui peut être écrasante, le moment est venu de commencer à définir les attentes pour les codecs à venir. Il y a beaucoup à apprendre des codecs du passé récent et plus lointain. La simplicité fiable et la fonctionnalité universelle du WAV, le modèle open source entièrement sans perte de FLAC, l'optimisation d'Opus pour la voix et l'audio général - la technologie a radicalement changé, alors pourquoi pas nos codecs ?
Un codec de rêve
Voici ce que je recherche dans un futur codec audio idéal :
- Sécurisé : Utilise toutes les technologies modernes de sécurité et de cryptographie.
- Ouvrir : Open source et entièrement documenté.
- Assistance universelle : Peut être enregistré et lu sans avoir besoin de nouveau matériel ou logiciel.
- Entièrement sans perte : Léger et de haute qualité.
- Multi-usage : Optimisé pour une utilisation vocale et audio générale.
- Haute résolution : Prise en charge des résolutions d'enregistrement les plus élevées possibles.
Bien que la plupart de ces paramètres idéaux existent aujourd'hui dans les codecs, aucun codec n'a réuni toutes ces spécifications de manière significative. Espérons que l'avenir soit plus ouvert, plus utilisable, plus fonctionnel et qu'il sonne bien pour démarrer.
Au cours de la prochaine décennie, les codecs audio qui repoussent les limites vont devenir plus courants. La technologie sous-jacente d'encodage et de décodage progresse et évolue, fusionnant avec d'autres sciences et disciplines au fur et à mesure.
Je doute que le monde audio reverra un jour un seul codec "standard de l'industrie" - je prédis que les formats audio continueront à se développer dans des niches de la même manière que les codecs vidéo. Cela permettra une plus grande convivialité et une plus grande spécialisation des tâches, ce qui fera des progrès significatifs dans la rationalisation du pipeline audio.
Quoi qu'il arrive, l'épine dorsale technologique de la production et de la lecture audio doit être alignée. Si les tendances actuelles se maintiennent, il y a de fortes chances que le monde de l'audio soit méconnaissable dans 10 ans.