Présentation
EnglishRÉSUMÉ
L’intelligence artificielle (IA) a connu depuis les années 2015 une croissance accélérée dans le domaine des médias numériques. Cet article offre d’abord un rappel des principes, des composantes et des techniques de l’intelligence artificielle, en particulier des modes d’apprentissage automatique (machine learning), et d’apprentissage profond (deep learning) avec les réseaux neuronaux (neuronal network). Il propose ensuite un échantillon d’applications de l’IA développées dans le domaine des images en photographie, pour les films anciens, et en vidéo. Puis, dans le domaine des sons, l’article introduit à quelques exemples liés au traitement automatique de la parole, de l’audio 3D et de la musique.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Jean-Noël GOUYET : Ingénieur-formateur en techniques et gestion des médias numériques - Ancien chargé d’études à la Direction de la Recherche de l’INA (Institut National de l’Audiovisuel)
INTRODUCTION
Les pionniers de l’intelligence artificielle partaient du principe, dans les années 1950, que l’apprentissage et l’intelligence artificielle (IA) pouvaient être simulés par une machine. En particulier depuis les années 2000, les nombreux projets, recherches et développements d’applications témoignent d’une part de la croissance de ce secteur de l’informatique, et d’autre part des importants investissements humains et financiers de très grands acteurs dans le monde pour le développement de projets et de produits incluant l’IA. On peut citer aux États-Unis : Google, Apple, Facebook, Amazon, Microsoft – et en Chine : Baidu, Alibaba, Tencent…
Une autre caractéristique de l’IA est la grande diversité des connaissances et des technologies impliquées : sciences cognitives, modes d’apprentissage et apprentissage automatique, traitement automatique de la parole, analyse et traitement du signal et de l’image, vision par ordinateur, robotique…
L’objectif de cette série de deux articles est d’offrir un aperçu de la quantité et de la diversité des applications de l’IA dans le domaine des médias numériques, applications qui se multiplient depuis le milieu des années 2010.
Ce premier article offre en trois parties :
-
un rappel des principes, des composantes et des techniques de l’IA, ainsi que de ses usages ;
-
un échantillon des applications de l’IA dans le domaine des images (photo, film, vidéo) ;
-
un échantillon des applications de l’IA dans le domaine des sons (parole, audio 3D, musique).
Le deuxième article [TE 5 898] :
-
restitue ces applications de l’IA et d’autres dans le domaine du Broadcast et de l’industrie des médias ;
-
se concentre sur deux cas d’étude :
-
le journalisme et l’IA,
-
les hypertrucages (deepfakes).
-
Les produits ou services spécifiques cités dans cet article le sont uniquement à titre d’illustration et ne représentent pas une promotion, une recommandation ou une approbation de l’auteur de ce document. Tous les articles ou sites spécialisés les présentant et les évaluant (indiqués en référence dans la partie annexe) n’engagent donc que leurs auteurs respectifs.
De nombreuses références détaillant les techniques et modèles d’IA utilisés dans des applications sont proposées dans la partie annexe « Pour en savoir plus », que le lecteur intéressé pourra consulter. Ce sont en général des documents au format PDF ou des blogs rédigés par des chercheurs, des grands acteurs de l’IA, à l’exception de sociétés commercialisant des produits et ne publiant pas de détails techniques sur leur modèle d’IA. Certains documents du Web offrent des photos, des vidéos ou des animations illustrant les applications et techniques d’IA utilisées.
Le lecteur trouvera en fin d’article une liste des principaux acronymes et abréviations utilisés tout au long de ce document, ainsi que des renvois vers des glossaires. Des termes (en caractères italiques) et le texte de quelques figures ont été conservés en anglais, soit parce qu’ils sont couramment utilisés dans le milieu professionnel, soit pour éviter toute ambiguïté de la traduction française qui en est proposée, soit enfin pour aider à la lecture des nombreux documents en anglais référencés.
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Intelligence artificielle > Médias numériques et Intelligence Artificielle (IA) : Applications images et sons > Conclusion
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Gestion de contenus numériques > Médias numériques et Intelligence Artificielle (IA) : Applications images et sons > Conclusion
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. Conclusion
Dans cet article dédié aux applications de l’Intelligence Artificielle liées aux médias numériques, après un rappel des bases de l’IA, ont été présentés des exemples dans le domaine des images (photo, films anciens, vidéo) et dans celui des sons (parole, audio 3D, musique).
Le 2e article de cette série [TE 5 898] restitue ces applications et d’autres dans le domaine du Broadcast et de l’industrie des médias, puis se concentre sur deux cas d’étude : le journalisme et l’IA, puis les hypertrucages (deepfakes).
Ce fort développement dans le domaine des médias est à resituer plus globalement avec les autres domaines. C’est cette vision qui est proposée par le cabinet d’études Gartner qui propose chaque année la courbe prévisionnelle du cycle du succès de développement et d’implantation de l’IA ...
Cet article fait partie de l’offre
Le traitement du signal et ses applications
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Conclusion
BIBLIOGRAPHIE
-
(1) - KAVLAKOGLU (E.) - What’s the difference ?. - AI vs. Machine Learning vs. Deep Learning vs. Neural Networks. https://www.ibm.com/cloud/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networks (2020).
-
(2) - ROBINS (M.) - The Difference between Artificial Intelligence, Machine Learning and Deep Learning. - https://www.intel.com/content/www/us/en/artificial-intelligence/posts/difference-between-ai-machine-learning-deep-learning.html (2020).
-
(3) - LAZZERI (F.) - Aide-Mémoire de l’algorithme Machine Learning pour le concepteur Azure Machine Learning. - https://docs.microsoft.com/fr-fr/azure/machine-learning/algorithm-cheat-sheethttps://docs.microsoft.com/en-us/azure/machine-learning/algorithm-cheat-sheet (2020).
-
(4) - LAZZERI (F.) - Apprentissage profond et apprentissage automatique dans Azure Machine Learning. - https://docs.microsoft.com/fr-fr/azure/machine-learning/concept-deep-learning-vs-machine-learninghttps://docs.microsoft.com/en-us/azure/machine-learning/concept-deep-learning-vs-machine-learning (2021).
-
(5) - Microsoft - Tout...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
Moving Picture, Audio, and Data Coding by Artificial Intelligence. https://mpai.community/standards/. - MPAI - 2020
-
JPEG AI Learning-based Image Coding System. https://www.iso.org/standard/81984.html. - ISO/IEC AWI 6048 - 2020
-
Information technology – Multimedia content description interface – Part 17 : Compression of neural networks for multimedia content description and analysis. https://www.iso.org/standard/78480.htmlhttps://www.mpegstandards.org/standards/MPEG-7/17/. - ISO/IEC 15938-17 - 2019-07
ANNEXES
1 Sites Web et logiciels pour apprendre l’IA
Sources : Un site spécialisé, animé par un jeune ingénieur en AI au Canada, offre un panorama détaillé de différentes ressources pour s’initier ou se perfectionner en AI : livres, vidéos YouTube, cours en ligne gratuits ou payants…
https://www.louisbouchard.ai/learnai/ (en anglais)
https://www.louisbouchard.ca/apprendre-ia (en français)
https://github.com/louisfb01/start-machine-learning (en anglais avec liste des ressources et des liens)
L’EBU News Report 2019 (p. 137-138 Courses on AI and Data) liste également des cours en ligne.
Tableau A (liste non exhaustive)
HAUT DE PAGE
Source : Patrick ARNECKE – Dive into AI and machine learning. EBU tech-I 35, 1er Mar 2018
https://tech.ebu.ch/publications/tech-i-035
Tableau B (liste non exhaustive)
Tableau C (liste non exhaustive)
...Cet article fait partie de l’offre
Le traitement du signal et ses applications
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive