Présentation
RÉSUMÉ
Cet article est le second d’une série de trois, et concerne la production pour les systèmes audiovisuels immersifs. Il décrit d’abord le workflow, le processus de production et de postproduction des médias incluant la vidéo à 360° et l’audio 3D, Puis il détaille les outils associés à la captation (caméras 360°, microphones) ou au traitement de ces médias immersifs. Il propose ensuite des recommandations et bonnes pratiques pour l’acquisition et la création vidéo et audio. La dernière partie spécifie des formats de production vidéo et audio.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
This article is the second of a series of three and concerns the production for immersive audio-visual systems. It firstly describes the workflow, i.e. the production and postproduction process for media including 360° video and 3D audio. It secondly details the tools associated with the capture (360° cameras, microphone arrays) or the processing of these immersive media. It then proposes guidelines and best practices for video and audio acquisition and creation. The last part specifies video and audio production formats.
Auteur(s)
-
Jean-Noël GOUYET : Ingénieur-formateur et consultant en techniques et gestion des médias numériques - Ancien chargé d'études à la Direction de la Recherche de l'INA
INTRODUCTION
Cet article propose une présentation de la partie production des systèmes audiovisuels immersifs. Le terme « immersif » est utilisé dans le cas des médias numériques pour décrire la capacité d’un système à absorber un utilisateur dans une scène audiovisuelle. « Média immersif » peut être lié à du contenu naturel et/ou généré par ordinateur. Dans cet article et les deux autres, [TE 5 690] et [TE 5 694], on s’intéresse essentiellement à la vidéo 360° et à l’audio 3D. L’immersion dans une scène est fortement renforcée par l’interactivité, qui peut aller d’un simple glissement de doigt sur une tablette pour découvrir une scène vidéo à 360° jusqu’à des rotations de la tête d’un utilisateur équipé d’un visiocasque pour naviguer dans la scène, accompagnées ou non de déplacement.
Le Cinéorama, breveté en 1897 par Raoul Brimoin-Sanson, avec écran circulaire balayé par 10 projecteurs cinématographiques synchronisés disposés en cercle, fut le premier procédé de projection d’images à 360°… bien avant le développement professionnel, puis grand public, de la vidéo 360° et des visiocasques à la fin du 20e, puis au début du 21e siècle. Pour l’audio 3D, si on considère la stéréo comme un ancêtre, on peut rappeler la retransmission sur lignes téléphoniques d’un opéra par Clément Ader en 1881, avec le Théâtrophone… jusqu’à l’émergence des effets audio en 3D dans les années 1990, dans les PC et les consoles de jeux. Quant à l’un des premiers systèmes immersifs et interactifs, on peut citer le Sensorama, breveté en 1962 par Morton Heilig, qui était un simulateur de balade en moto à travers New York, avec un écran, des générateurs de sons, de vent, d’odeurs… jusqu’aux plus récents des simulateurs de pilotage d’avion ou le simulateur de « vol d’oiseau » immersif Birdly (2016).
Le développement des médias immersifs a été favorisé par l’essor du numérique, en particulier dans le domaine des formats de compression de la vidéo numérique et des réseaux de distribution Internet, ainsi que par la diffusion des jeux vidéo et des dispositifs portables (visiocasques, tablettes et smartphones).
Parmi les applications des médias immersifs 360°, on peut citer la diffusion d’évènements (en parallèle ou non à un flux télévision), la cinématographie linéaire ou interactive, des applications éducatives, la communication interpersonnelle et de groupe (par exemple vidéoconférence, ou avec les jeux en ligne, ou dans un lieu de rencontre virtuel), les visites guidées, le visionnage de contenu à la demande sur visiocasque…
Au-delà de l’intérêt lors de la découverte d’une nouvelle technologie, la vidéo 360° et l’audio 3D créent une sensation de présence dans un espace (dans une autre dimension), de liberté (de choix du point de vue), d’implication dans une histoire. Toutefois, les médias immersifs sont sujets à des contraintes : la nécessité de normes et de plateformes de distribution, la capacité des réseaux pour transmettre le volume important de données, la perte de repères de l’utilisateur et le malaise sensoriel qui éventuellement en découle…
Malgré un regain d’intérêt en particulier dans les années 2010, les contraintes techniques, économiques et d’usage n’ont pas permis la progression espérée. Cette série des trois articles propose donc un panorama des éléments techniques relatifs aux médias immersifs vidéo et audio, ainsi qu’aux systèmes et processus de production et de distribution, pouvant rendre possible un nouvel essor.
Le premier article, [TE 5 690], en définit d’abord les composantes : le contenu omnidirectionnel (vidéo à 360° et audio 3D), le continuum du réel au virtuel et ses divers degrés (AR, MR, AV, VR) avec les facteurs d’immersion et d’interactivité, les interfaces utilisateurs (visiocasque, binaural…). Dans une deuxième partie il détaille les fonctions et les techniques : l’acquisition, le traitement, le codage et formatage, la distribution et l’utilisation. La dernière partie précise les normes de codage et de formatage.
La lecture de ce premier article est indispensable pour la bonne compréhension des deux articles suivants. De nombreux renvois entre les trois articles sont insérés dans chacun des articles.
Ce second article concerne la partie production dans les systèmes audiovisuels immersifs. Il est composé de quatre parties :
-
la 1ère partie décrit le workflow, le processus de production et de postproduction des médias vidéo à 360° et audio 3D ;
-
la 2e partie présente et détaille les outils associés à la captation (caméras 360°, microphones) puis au traitement de ces médias immersifs ;
-
la 3e partie propose des recommandations et bonnes pratiques pour l’acquisition et la création de vidéo 360° et d’audio 3D ;
-
la 4e partie spécifie des formats de production vidéo 360° et audio 3D.
Le troisième article, [TE 5 694], décrit les formats, profils et normes utilisés pour la distribution en fichier et/ou sur réseau, en l’illustrant par deux études de cas.
le lecteur trouvera en fin d’article une liste des principaux acronymes et abréviations utilisés tout au long de ce document. De nombreux termes et le texte de quelques figures ont été conservés en anglais (en caractères italiques), soit parce qu’ils sont couramment utilisés dans le milieu professionnel, soit pour éviter toute ambiguïté de la traduction française qui en est proposée, soit enfin pour aider à la lecture des spécifications ainsi que d’autres documents en anglais.
des produits ou services spécifiques peuvent être cités dans cet article uniquement à titre d’illustration et ne représentent pas une promotion, une recommandation ou une approbation de l’auteur de ce document. Tous les articles ou sites spécialisés les évaluant (indiqués en référence dans la partie annexe « Pour en savoir plus ») n’engagent donc que leurs auteurs respectifs.
Pour identifier les systèmes de médias immersifs et interactifs dans les 3 articles de la série, ils sont désignés par le terme « 360°-I », avec :
-
« 360° » pour la vidéo omnidirectionnelle et/ou l’audio 3D ;
-
« I » pour Immersif et Interactif.
Ce terme est préféré au terme « 360/VR » qui implique également du contenu infographique et qui renvoie uniquement au domaine de la Réalité Virtuelle du continuum réalité-virtualité.
MOTS-CLÉS
KEYWORDS
production | 360°-video | 3D audio | immersive audiovisual
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Le traitement du signal et ses applications > Réalité virtuelle > Médias immersifs et réalité virtuelle : vidéo 360° et audio 3D - Production : processus, outils, recommandations > Recommandations pour la production de vidéo 360° et d’audio 3D
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Recommandations pour la production de vidéo 360° et d’audio 3D
Cette partie de l’article se base essentiellement sur le document Guidelines, dont la 4e version a été publiée par le consortium VR Industry Forum en janvier 2021 ( § 4.1). Ces recommandations de « bonnes pratiques » concernent la production de vidéo 360° et aussi de l’audio 3D, dans les aspects techniques mais également avec des considérations sur certains aspects artistiques et certains facteurs humains.
3.1 Expérience utilisateur et défis de production
Le contenu 360°-I est créé pour être affiché sur un visiocasque totalement immersif (HMD) ou sur un équipement non immersif comme une tablette, un smartphone ou un téléviseur. Le contenu produit doit permettre au spectateur de s’engager d’une manière unique. Dans le premier cas, la fenêtre de visualisation (viewport) est déterminée par l'orientation du visiocasque. Dans le deuxième cas, sur des écrans non immersifs, l'orientation peut également être déterminée par des capteurs, ou peut être contrôlée directement par l'utilisateur (par exemple, par un glissement de doigt).
Le caractère unique des expériences vidéo à 360° est principalement dû à deux facteurs :
-
le niveau d'immersion induit par le champ de vision plus large du visiocasque ;
-
l'interactivité de la scène qui répond aux actions de l'utilisateur (au niveau le plus bas, cette interactivité se réduit à la capacité d'explorer visuellement la scène comme dans le cas des trois degrés de liberté de la tête, 3DoF ([TE 5 690] § 1.3.3.3)).
Ces deux facteurs impliquent...
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Recommandations pour la production de vidéo 360° et d’audio 3D
BIBLIOGRAPHIE
-
(1) - ITU-R BT.2420 - Collection of usage scenarios and current statuses of advanced immersive audio-visual systems. - https://www.itu.int/dms_pub/itu-r/opb/rep/R-REP-BT.2420-2018-PDF-E.pdf (2018).
-
(2) - VR INDUSTRY FORUM - Guidelines Version 2.3. - https://www.vr-if.org/guidelines/ (2021).
-
(3) - SAMSUNG - The Ultimate Guide to 360 Video Production. - https://image-us.samsung.com/SamsungUS/samsungbusiness/short-form/the-ultimate-guide-to-360-video-production/WHP-360-ROUND-PRODUCTION-GUIDE-MAR18SW.pdf (2018).
-
(4) - LAURET (M.F.) - An Intro to VR Post Production, Part I. - https://medium.com/ajcontrast/an-intro-to-vr-post-production-part-i-887be8adef66 (2017).
-
(5) - speedVR - Videobred 360° Workflow. - http://speedvr.co.uk/vr-post-production/360-video-post-workflow/.
-
(6)...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
MXF Program Contribution – DPP UHD https://www.amwa.tv/as-11-x1. - AMWA AS-11 X1 - DPP - October 2018
-
Safe areas for 16 :9 Television production. https://tech.ebu.ch/docs/r/r095.pdf. - EBU R95 - June 2017
-
Video signal tolerance in Digital Television systems. https://tech.ebu.ch/docs/r/r103.pdf. - EBU R103 - May 2020
-
Loudness in Radio https://tech.ebu.ch/docs/r/r128s3.pdf. - EBU R 128 s - June 2021
-
Loudness normalisation and permitted maximum level of audio signals. https://tech.ebu.ch/docs/r/r128.pdf. - EBU R128 - August 2020
-
Guidelines for Radio Production and Distribution in accordance with EBU R 128 https://tech.ebu.ch/docs/tech/tech3401.pdf. - EBU TECH 3401 - June 2021
-
Information technology – Media context and control – Part 5 : Data formats for interaction devices. https://www.iso.org/standard/73438.htmlhttps://mpeg.chiariglione.org/standards/mpeg-v/data-formats-interaction/isoiec-cd-23005-5-3rd-edition-data-formats-interaction. - ...
ANNEXES
1.1 Organismes – Fédérations – Associations (liste non exhaustive)
Source : [EBU BPN 115 § 8] [ITU-R BT.2420-0 § 6 + § 7)
EBU (European Broadcasting Union)
IEC (International Electrotechnical Commission)
ISO (International Organization for Standardization)
JPEG (Joint Photographic experts Group)
MPEG (Moving Picture Experts Group)
https://www.mpegstandards.org/ https://mpeg.chiariglione.org/standards
SMPTE (Society of Motion Picture and Television Engineers)
VRIF (VR-Industry Forum)
HAUT DE PAGE1.2 Sociétés (liste non exhaustive)
BPI France – Immersion dans l’écosystème français des réalités virtuelle et augmentée
https://lehub.bpifrance.fr/mapping-startups-francaises-realites-virtuelle-augmentee/
...
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(160 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive