Présentation
RÉSUMÉ
L’intelligence artificielle (IA) a connu depuis les années 2015 une croissance accélérée dans le domaine des médias numériques. Cet article offre d’abord un rappel des principes, des composantes et des techniques de l’intelligence artificielle, en particulier des modes d’apprentissage automatique (machine learning), et d’apprentissage profond (deep learning) avec les réseaux neuronaux (neuronal network). Il propose ensuite un échantillon d’applications de l’IA développées dans le domaine des images en photographie, pour les films anciens, et en vidéo. Puis, dans le domaine des sons, l’article introduit à quelques exemples liés au traitement automatique de la parole, de l’audio 3D et de la musique.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Artificial intelligence (AI) has experienced accelerated growth in the digital media field since the 2015s. This article first provides a reminder of the principles, components and techniques of artificial intelligence, in particular machine learning, and deep learning with neural networks. It then proposes a sample of AI applications developed in the field of images in photography, for old films, and in video. In the field of sounds, the article presents some examples related to the automatic processing of speech, 3D audio and music.
Auteur(s)
-
Jean-Noël GOUYET : Ingénieur-formateur en techniques et gestion des médias numériques - Ancien chargé d’études à la Direction de la Recherche de l’INA (Institut National de l’Audiovisuel)
INTRODUCTION
Les pionniers de l’intelligence artificielle partaient du principe, dans les années 1950, que l’apprentissage et l’intelligence artificielle (IA) pouvaient être simulés par une machine. En particulier depuis les années 2000, les nombreux projets, recherches et développements d’applications témoignent d’une part de la croissance de ce secteur de l’informatique, et d’autre part des importants investissements humains et financiers de très grands acteurs dans le monde pour le développement de projets et de produits incluant l’IA. On peut citer aux États-Unis : Google, Apple, Facebook, Amazon, Microsoft – et en Chine : Baidu, Alibaba, Tencent…
Une autre caractéristique de l’IA est la grande diversité des connaissances et des technologies impliquées : sciences cognitives, modes d’apprentissage et apprentissage automatique, traitement automatique de la parole, analyse et traitement du signal et de l’image, vision par ordinateur, robotique…
L’objectif de cette série de deux articles est d’offrir un aperçu de la quantité et de la diversité des applications de l’IA dans le domaine des médias numériques, applications qui se multiplient depuis le milieu des années 2010.
Ce premier article offre en trois parties :
-
un rappel des principes, des composantes et des techniques de l’IA, ainsi que de ses usages ;
-
un échantillon des applications de l’IA dans le domaine des images (photo, film, vidéo) ;
-
un échantillon des applications de l’IA dans le domaine des sons (parole, audio 3D, musique).
Le deuxième article [TE 5 898] :
-
restitue ces applications de l’IA et d’autres dans le domaine du Broadcast et de l’industrie des médias ;
-
se concentre sur deux cas d’étude :
-
le journalisme et l’IA,
-
les hypertrucages (deepfakes).
-
Les produits ou services spécifiques cités dans cet article le sont uniquement à titre d’illustration et ne représentent pas une promotion, une recommandation ou une approbation de l’auteur de ce document. Tous les articles ou sites spécialisés les présentant et les évaluant (indiqués en référence dans la partie annexe) n’engagent donc que leurs auteurs respectifs.
De nombreuses références détaillant les techniques et modèles d’IA utilisés dans des applications sont proposées dans la partie annexe « Pour en savoir plus », que le lecteur intéressé pourra consulter. Ce sont en général des documents au format PDF ou des blogs rédigés par des chercheurs, des grands acteurs de l’IA, à l’exception de sociétés commercialisant des produits et ne publiant pas de détails techniques sur leur modèle d’IA. Certains documents du Web offrent des photos, des vidéos ou des animations illustrant les applications et techniques d’IA utilisées.
Le lecteur trouvera en fin d’article une liste des principaux acronymes et abréviations utilisés tout au long de ce document, ainsi que des renvois vers des glossaires. Des termes (en caractères italiques) et le texte de quelques figures ont été conservés en anglais, soit parce qu’ils sont couramment utilisés dans le milieu professionnel, soit pour éviter toute ambiguïté de la traduction française qui en est proposée, soit enfin pour aider à la lecture des nombreux documents en anglais référencés.
KEYWORDS
film | artificial intelligence | photo | video | 3D audio | AI | speech processing | music
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Le traitement du signal et ses applications > Gestion audio, images et vidéo numériques > Médias numériques et Intelligence Artificielle (IA) : Applications images et sons > Applications sons
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Gestion de contenus numériques > Médias numériques et Intelligence Artificielle (IA) : Applications images et sons > Applications sons
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Applications sons
Les principales applications de l’IA présentées dans le domaine des sons couvrent :
3.1 Traitement automatique de la parole
Le traitement automatique de la parole recouvre un vaste ensemble d’activités, souvent complémentaires, que l’on peut classer en cinq grands thèmes ([H 3 728] § 1) :
-
codage et compression de la parole, intervenant en transmission et en restitution de parole ;
-
synthèse de la parole, consistant à produire un signal vocal à partir d’un dictionnaire d’éléments phonétiques et/ou de règles ;
-
reconnaissance de la parole, revenant à faire interpréter par une machine des mots ou des phrases prononcés par un locuteur humain, dans le but de réaliser une action précise ;
-
reconnaissance et vérification du locuteur, problème dual du précédent dans lequel on cherche à authentifier une personne par sa voix ;
-
identification de la langue dans laquelle un locuteur s’exprime.
On se limitera dans cette section aux...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Applications sons
BIBLIOGRAPHIE
-
(1) - KAVLAKOGLU (E.) - What’s the difference ?. - AI vs. Machine Learning vs. Deep Learning vs. Neural Networks. https://www.ibm.com/cloud/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networks (2020).
-
(2) - ROBINS (M.) - The Difference between Artificial Intelligence, Machine Learning and Deep Learning. - https://www.intel.com/content/www/us/en/artificial-intelligence/posts/difference-between-ai-machine-learning-deep-learning.html (2020).
-
(3) - LAZZERI (F.) - Aide-Mémoire de l’algorithme Machine Learning pour le concepteur Azure Machine Learning. - https://docs.microsoft.com/fr-fr/azure/machine-learning/algorithm-cheat-sheethttps://docs.microsoft.com/en-us/azure/machine-learning/algorithm-cheat-sheet (2020).
-
(4) - LAZZERI (F.) - Apprentissage profond et apprentissage automatique dans Azure Machine Learning. - https://docs.microsoft.com/fr-fr/azure/machine-learning/concept-deep-learning-vs-machine-learninghttps://docs.microsoft.com/en-us/azure/machine-learning/concept-deep-learning-vs-machine-learning (2021).
-
(5) - Microsoft - Tout...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
Moving Picture, Audio, and Data Coding by Artificial Intelligence. https://mpai.community/standards/. - MPAI - 2020
-
JPEG AI Learning-based Image Coding System. https://www.iso.org/standard/81984.html. - ISO/IEC AWI 6048 - 2020
-
Information technology – Multimedia content description interface – Part 17 : Compression of neural networks for multimedia content description and analysis. https://www.iso.org/standard/78480.htmlhttps://www.mpegstandards.org/standards/MPEG-7/17/. - ISO/IEC 15938-17 - 2019-07
ANNEXES
1 Sites Web et logiciels pour apprendre l’IA
Sources : Un site spécialisé, animé par un jeune ingénieur en AI au Canada, offre un panorama détaillé de différentes ressources pour s’initier ou se perfectionner en AI : livres, vidéos YouTube, cours en ligne gratuits ou payants…
https://www.louisbouchard.ai/learnai/ (en anglais)
https://www.louisbouchard.ca/apprendre-ia (en français)
https://github.com/louisfb01/start-machine-learning (en anglais avec liste des ressources et des liens)
L’EBU News Report 2019 (p. 137-138 Courses on AI and Data) liste également des cours en ligne.
Tableau A (liste non exhaustive)
HAUT DE PAGE
Source : Patrick ARNECKE – Dive into AI and machine learning. EBU tech-I 35, 1er Mar 2018
https://tech.ebu.ch/publications/tech-i-035
Tableau B (liste non exhaustive)
Tableau C (liste non exhaustive)
...Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive