Présentation
En anglaisRÉSUMÉ
Cet article traite de la «forme» numérique «compressée» dans laquelle sont converties les images et les sons, après l’étape initiale de leur numérisation aboutissant à leur «format natif numérique» représentant les résultats numériques des mesures des sons ou des images. L’objectif du processus de compression numérique est de réduire la quantité de «0» et de «1» de ce format natif. Cette réduction se base sur l’analyse des informations redondantes non perçues par nos sens. Mais si elle est mal ajustée elle peut entraîner des défauts dans les sons ou images reproduites. Cet article décrit pour chaque média les principes de base, les outils disponibles et les paramètres à prendre en compte.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
This article describes the digital “compressed” format into which are converted sounds and pictures, after the first step of digitization generating their “digital native format”, representing the results of the measurements of sounds or pictures. The objective of the digital compression process is to reduce the number of binary digits in this native format. This reduction is based on the analysis of redundant information perceived by our senses. However, when badly adjusted, this process can generate artefacts in the reproduced sounds or pictures. This article describes basic principles, tools used, and the parameters to take into account for each medium.
Auteur(s)
-
Jean-Noël GOUYET : Ingénieur en techniques et gestion des médias numériques - Ancien chargé d’études à la Direction de la recherche de l’Institut national de l’audiovisuel (Ina)
INTRODUCTION
Les professionnels, comme les particuliers, ont à produire, manipuler, stocker, gérer, échanger, diffuser, distribuer, des médias numériques « codés » dans divers formats, appelés formats « d’essence », et encapsulés dans des « formats-conteneurs » de stockage ou de transport extrêmement nombreux et variés.
Ce dossier « Panorama des médias numériques », composé de six articles, a pour objectif de proposer une définition, une description des caractéristiques, une cartographie et une classification de ces différents formats de médias numériques.
Le premier article [TE 5 364] détaille les paramètres du « format natif numérique », qui est le résultat d’une mesure discontinue et codée de l’amplitude des grandeurs analogiques, continues et proportionnelles, générées par des appareils de prise de son ou de vue.
Ce second article [TE 5 366] présente un panorama des formats de compression numérique, audio, image fixe et vidéo qui permettent de réduire la quantité de données composant les formats natifs, afin de faciliter leur stockage ou leur distribution.
Le troisième article [TE 5 368] introduit aux caractéristiques des formats-conteneurs permettant d’encapsuler l’audio, les images fixes ou la vidéo, soit en format natif, soit en format de compression.
Le quatrième article [TE 5 369] décrit des formats-conteneurs dédiés au stockage de médias, en particulier une cinquantaine de formats de fichiers, parmi les plus utilisés dans le monde des médias et de l’audiovisuel, ainsi que quelques formats d'enregistrement sur supports optiques ou magnétiques.
Le cinquième article [TE 5 370] décrit des formats-conteneurs dédiés à différents modes de transport des médias numériques, ainsi que des métaformats-conteneurs.
Le sixième article [TE 5 371] aborde le problème de la gestion des formats de médias numériques, en détaillant la conversion entre formats et en fournissant quelques critères d’évaluation et de sélection des formats.
Le lecteur trouvera en fin d’article une liste complète des abréviations et acronymes des formats de compression. Ceux concernant les formats natifs numériques se trouvent à la fin de l’article [TE 5 364]. De nombreux termes et le texte de certaines figures ont été conservés en anglais, avec la traduction jointe, de manière à faciliter la lecture et l’utilisation des spécifications et autres documents.
MOTS-CLÉS
KEYWORDS
Redundancy | digital media | compression format
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Formats de compression audio
2.1 Principes
La réduction des données audio comprend :
-
la réduction de la quantité d’informations résultant du format natif numérique. Par exemple, on peut réduire soit la fréquence d’échantillonnage et donc le nombre d’échantillons codés, soit la bande de fréquences audio. On peut aussi réduire la profondeur de codage de chaque échantillon, de 24 bits à 20 bits, à 16 bits ou à 8 bits ;
-
la compression elle-même des données restantes à l’aide d’algorithmes spécifiques.
L’élimination de la redondance en audio utilise en particulier un phénomène de masquage fréquentiel. Lorsqu’il y a plus d’énergie dans une bande de fréquences, par exemple à 1 kHz, l’oreille semble se protéger d’une surcharge en omettant d’enregistrer de l’énergie dans les bandes voisines (figure 4 a ). On peut alors utiliser cette redondance pour réduire la quantité d’informations. Ce phénomène a été utilisé dans le codage de la première norme ISO/IEC du format de compression MPEG-1 Audio Layer 1, Layer 2 puis Layer 3 (MP3).
On utilise aussi un phénomène de masquage temporel, dû à l’inertie de l’oreille, réalisé après l’apparition d’un son masquant de forte intensité (figure 4 b ), mais également avant la perception de ce son.
Une autre technique employée pour réduire la bande de fréquences, et donc les données, est la reconstruction de la bande haute, SBR (Spectral Band Replication). En codage natif audio traditionnel, une quantité significative de données est générée pour le codage des hautes fréquences, alors même que l’importance psychoacoustique de la dernière (ou des deux dernières) octave(s) est relativement faible, d’où l’idée de base de la SBR. Étant donnée la forte corrélation entre la bande haute (high band ) et la bande basse (low band) de fréquences du spectre audio, on peut obtenir une bonne approximation de la bande haute en effectuant une transposition de la bande basse (figure 5). Cette technique est utilisée par le format de compression MPEG-4 Audio HE-AAC (High Efficiency...
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Formats de compression audio
BIBLIOGRAPHIE
-
(1) - GOUYET (J.-N.) - Systèmes audio et vidéo numériques. - Codage de source – Réduction de débit, Chap. 10, Institut national de l’audiovisuel, Techniques et production audiovisuelles, Paris, ISBN 2-86938-030-5 (1993).
-
(2) - CHIARIGLIONE (L.) - MPEG audio coding - http://mpeg.chiariglione.org//technologies/media-coding/audio-coding
-
(3) - MELTZER (S.), MOSER (G.) - Coding technology – MPEG-4 HE-AAC v2 – Audio coding for today’s digital media world. - EBU Technical Review, janv. 2006 http://tech.ebu.ch/docs/techreview/trev_305-moser.pdf
-
(4) - FUCHS (H.), KORTE (O.), HILPERT (J.), FRAUNHOFER (I.I.S.) - Digital broadcasting with MPEG surround. - EBU Technical Review (2009Q3) http://tech.ebu.ch/docs/techreview/trev_2009-Q3_MPEG_Fraunhofer.pdf
-
(5) - FLAC - Free lossless audio codec - https://xiph.org/flac/
-
...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
Information technology – Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s – Part 3 : Audio http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=22412 - ISO/IEC 11172-3 - 1993
-
Information technology – Generic coding of moving pictures and associated audio information – Part 3 : Audio http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?csnumber=22991 - ISO/IEC 13818-3 - 1995
-
Information technology – Generic coding of moving pictures and associated audio information – Part 7 : Advanced Audio Coding (AAC) http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?csnumber=25040 - ISO/IEC 13818-7 - 1997
-
Information technology – Coding of audio-visual objects – Part 3 : Audio http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?csnumber=25035 - ISO/IEC 14496-3 - 1999
-
Information technology – MPEG audio technologies – Part 1 : MPEG Surround http://www.iso.org/iso/catalogue_detail.htm?csnumber=44159 - ISO/IEC 23003-1 - 2007
-
Transmission systems and media, digital systemes and networks http://www.itu.int/rec/T-REC-G/en - ...
1.1 Organismes – Fédérations – Associations (liste non exhaustive)
ATSC (Advanced Television Systems Committee) http://www.atsc.org/
DCI (Digital Cinema Initiatives LLC) http://www.dcimovies.com/
EBU (European Broadcasting Union) http://www.ebu.ch/
ETSI (European Telecommunications Standards Institute) http://www.etsi.org/
IEC (International Electrotechnical Commission) http://www.iec.ch/
IEEE (Institute of Electrical and Electronics Engineers) http://www.ieee.org/
ISO (International Organization for Standardization) http://www.iso.org
ITU (International Telecommunication Union) http://www.itu.int/
JPEG (Joint Photographic Experts Group) http://www.jpeg.org/
MPEG (Moving Picture Experts Group) http://mpeg.chiariglione.org/
SMPTE (Society of Motion Picture and Television Engineers) http://www.smpte.org/
Xiph.org (Xiph. org Foundation) https://xiph.org
Entreprise
IntoPIX https://www.intopix.com
HAUT DE PAGECet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive