Présentation
EnglishRÉSUMÉ
La spatialisation sonore s’intéresse à l’analyse, à la synthèse et à la transformation des propriétés du son qui contribuent à l’impression d’espace et à la sensation d’immersion. Dans les environnements virtuels - jeux vidéo, réalité virtuelle -, elle permet de simuler des sources sonores dans l’espace autour de l’auditeur. Dans le domaine de la production audiovisuelle, elle vise à capter ou à diffuser des scènes sonores. Cet article expose les principaux mécanismes psychoacoustiques de perception de l’espace sonore, puis il présente l’état de l’art des techniques permettant la synthèse - par des réseaux de haut-parleurs - et l’enregistrement - par des réseaux de microphones - de champs sonores.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Thibaut CARPENTIER : Ingénieur de recherche CNRS - STMS Lab (sciences et technologies de la musique et du son) – CNRS, IRCAM, Sorbonne Université Paris, France
INTRODUCTION
En acoustique et en musique, on caractérise généralement les sons selon leurs propriétés de durée, hauteur, timbre et intensité. Outre ces attributs, les sons s’organisent également dans l’espace. La spatialisation est l’étude du son dans sa dimension spatiale. Plus précisément, la spatialisation sonore s’intéresse à l’analyse, à la synthèse et à la transformation des propriétés du son qui contribuent à l’impression d’espace et à la sensation d’immersion. Ce champ d’études s’appuie sur des recherches fondamentales et des avancées technologiques issues de plusieurs disciplines scientifiques : acoustique, traitement du signal, informatique, psychoacoustique et cognition. La spatialisation sonore, parfois appelée « audio 3D », « audio spatial », « son multicanal », ou encore « acoustique virtuelle », est un domaine de recherche en plein essor et qui trouve des applications, industrielles ou grand public, dans de nombreux secteurs : production audiovisuelle (musique, cinéma, radio, vidéo 360°), spectacle vivant (sonorisation), jeux vidéo, réalité virtuelle, installations sonores, simulations acoustiques, etc. Par exemple, en mixage de musique, la spatialisation est utilisée pour répartir dans l’espace les différents instruments afin de favoriser leur intelligibilité et la clarté de la scène sonore. Dans les environnements virtuels (jeux vidéo, réalité virtuelle), elle permet de simuler des sources sonores dans l’espace autour de l’auditeur et elle participe à la sensation d’immersion.
Selon les domaines d’application et les cas d’usage, l’objectif de la spatialisation sonore est tantôt de capter et restituer des scènes sonores ou des espaces acoustiques existants, tantôt de créer virtuellement des expériences auditives avec une dimension sonore immersive. Pour ce faire, les procédés mis en œuvre exploitent des réseaux de transducteurs électroacoustiques (enceintes, casque, microphones) et des algorithmes de traitement du signal audio, et ils visent à produire soit un rendu réaliste (« objectivement précis »), soit une illusion plus artistique (« perceptivement plausible »).
Les systèmes de diffusion sonore spatiale cherchent, d’une part, à simuler des indices de localisation spatiale pour des sources sonores virtuelles arbitrairement placées dans l’espace et, d’autre part, à produire des effets de réverbération artificielle qui contribuent à la création d’un espace sonore immersif. Les techniques disponibles peuvent être classées en trois grandes familles : des approches dites « perceptives » qui reposent sur des modèles de l’audition humaine pour créer l’illusion d’un phénomène acoustique (positionnement d’une source « fantôme » dans l’espace 3D, ou effet de réverbération qui paraît « naturelle »), des approches par échantillonnage qui consistent à mesurer un champ acoustique en un ensemble discret de positions puis à le restituer par des techniques de convolution, des approches par modèles physiques qui visent à synthétiser, dans une certaine zone de l’espace, un champ acoustique précisément maîtrisé et conforme aux lois de propagation des ondes. Chacune de ces approches présente des avantages et des inconvénients, en termes de complexité, de coût (de calcul ou d’équipements), de précision, de nombre d’auditeurs, etc. C’est pourquoi il est fréquent, en pratique, d’utiliser des techniques hybrides qui combinent plusieurs approches.
Après quelques rappels des principaux mécanismes psychoacoustiques participant à la perception de l’espace sonore, cet article propose un panorama des techniques de synthèse de sources spatialisées et de prise de son multicanal [BR 1 150] ; la réverbération artificielle sera traitée dans l’article [BR 1 152].
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Le traitement du signal et ses applications > Captation et restitution des sons > Spatialisation sonore - Perception, captation et diffusion de scènes sonores > Technologies pour la spatialisation sonore
Cet article fait partie de l’offre
Bruit et vibrations
(97 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. Technologies pour la spatialisation sonore
5.1 Formats de production et diffusion
Les chapitres précédents ont présenté plusieurs approches pour produire des scènes sonores spatialisées, par synthèse (chapitre 2) ou par enregistrement (chapitre 3). Parallèlement, se pose la question du format utilisé pour la diffusion ou l’archivage de flux audio multicanaux. Trois grands paradigmes existent : le format orienté canaux, celui orienté scène et le format orienté objets , .
-
Format orienté canaux
C’est historiquement le premier format apparu, et de loin le plus répandu. Dans le paradigme orienté canaux, chaque piste d’un flux audio transporte le signal destiné à alimenter un haut-parleur donné, dans une position prédéfinie. Par exemple, pour un flux stéréo, le premier canal correspond au haut-parleur gauche (− 30°) et le second au haut-parleur droit (+ 30°). Le format repose donc sur une convention ou un standard. Chaque dispositif (5.1, 7.1, 9.1, 22.2, etc.) doit être précisément décrit (voir par exemple la recommandation ITU-R BS.2051). Le format orienté canaux garantit la fidélité de la reproduction puisque les signaux sont diffusés « tel quel ». En revanche, si les enceintes du dispositif de restitution ne sont pas dans la position attendue, la reproduction est erronée. Le paradigme canaux ne permet ni interactivité (l’auditeur final ne peut pas éditer le contenu audio), ni flexibilité (un flux prévu pour un système A ne peut être écouté sur un système B).
-
Format orienté scène
Il s’agit typiquement du format Ambisonic (chapitre 2.2.1), dans lequel la scène sonore est décrite – dans sa globalité – par une représentation intermédiaire (encodée) ; le décodeur permet de...
Cet article fait partie de l’offre
Bruit et vibrations
(97 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Technologies pour la spatialisation sonore
BIBLIOGRAPHIE
-
(1) - ABRAMOWITZ (M.), STEGUN (I.A.) - Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables (9th printing). - Dover (1970).
-
(2) - AHRENS (J.) - Analytic Methods of Sound Field Synthesis. - Springer, Berlin, Germany (2012).
-
(3) - ALGAZI (V.R.), AVENDANO (C.), DUDA (R.O.) - Estimation of a Spherical-Head Model from Anthropometry. - Journal of the Audio Engineering Society, 49(6), p. 462-479 (2001).
-
(4) - ALGAZI (V.R.), DUDA (R.O.), DURAISWAMI (R.), GUMEROV (N.A.), TANG (Z.) - Approximating the head-related transfer function using simple geometric models of the head and torso. - Journal of the Acoustical Society of America, 112(5), p. 2053-2064 (2002).
-
(5) - ALGAZI (V.R.), DUDA (R.O.), THOMPSON (D.M.) - The Use of Head-and-Torso Models for Improved Spatial Sound Synthesis. - In: Proc. of the 113rd Convention of the Audio Engineering Society (AES), Los Angeles, CA, USA (2002).
-
...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
Head and torso simulator for telephonometry - Recommandation ITU-T P.58 - 2021
-
Multichannel stereophonic sound system with and without accompanying picture - Recommandation ITU-R BS.775-3 - 2012
-
ADM Audio Definition Model - Recommandation ITU-R BS.2076 - 2015
-
Audio Definition Model renderer for advanced sound systems - Recommandation ITU-R BS.2127 - 2019
-
Advanced sound system for programme production - Recommandation ITU-R BS.2051-3 - 2022
-
AES standard for audio applications of networks – High-performance streaming audio-over-IP interoperability - Standard AES67 - 2018
-
AES standard for file exchange – Spatial acoustic data file format - Standard AES69 - 2020
-
AES Recommended Practice for Digital Audio Engineering – Serial Multichannel Audio Digital Interface (MADI) - Standard...
Cet article fait partie de l’offre
Bruit et vibrations
(97 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive