Présentation

Article

1 - RAPPEL DES PRINCIPES ET TECHNIQUES DE BASE DE L’IA

2 - APPLICATIONS IMAGES

3 - APPLICATIONS SONS

4 - NORMES

5 - CONCLUSION

6 - LISTE DES ABRÉVIATIONS ET ACRONYMES ET GLOSSAIRE

Article de référence | Réf : TE5897 v1

Applications sons
Médias numériques et Intelligence Artificielle (IA) : Applications images et sons

Auteur(s) : Jean-Noël GOUYET

Date de publication : 10 août 2022

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais English

RÉSUMÉ

L’intelligence artificielle (IA) a connu depuis les années 2015 une croissance accélérée dans le domaine des médias numériques. Cet article offre d’abord un rappel des principes, des composantes et des techniques de l’intelligence artificielle, en particulier des modes d’apprentissage automatique (machine learning), et d’apprentissage profond (deep learning) avec les réseaux neuronaux (neuronal network). Il propose ensuite un échantillon d’applications de l’IA développées dans le domaine des images en photographie, pour les films anciens, et en vidéo. Puis, dans le domaine des sons, l’article introduit à quelques exemples liés au traitement automatique de la parole, de l’audio 3D et de la musique.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Jean-Noël GOUYET : Ingénieur-formateur en techniques et gestion des médias numériques - Ancien chargé d’études à la Direction de la Recherche de l’INA (Institut National de l’Audiovisuel)

INTRODUCTION

Les pionniers de l’intelligence artificielle partaient du principe, dans les années 1950, que l’apprentissage et l’intelligence artificielle (IA) pouvaient être simulés par une machine. En particulier depuis les années 2000, les nombreux projets, recherches et développements d’applications témoignent d’une part de la croissance de ce secteur de l’informatique, et d’autre part des importants investissements humains et financiers de très grands acteurs dans le monde pour le développement de projets et de produits incluant l’IA. On peut citer aux États-Unis : Google, Apple, Facebook, Amazon, Microsoft – et en Chine : Baidu, Alibaba, Tencent…

Une autre caractéristique de l’IA est la grande diversité des connaissances et des technologies impliquées : sciences cognitives, modes d’apprentissage et apprentissage automatique, traitement automatique de la parole, analyse et traitement du signal et de l’image, vision par ordinateur, robotique…

L’objectif de cette série de deux articles est d’offrir un aperçu de la quantité et de la diversité des applications de l’IA dans le domaine des médias numériques, applications qui se multiplient depuis le milieu des années 2010.

Ce premier article offre en trois parties :

  • un rappel des principes, des composantes et des techniques de l’IA, ainsi que de ses usages ;

  • un échantillon des applications de l’IA dans le domaine des images (photo, film, vidéo) ;

  • un échantillon des applications de l’IA dans le domaine des sons (parole, audio 3D, musique).

Le deuxième article [TE 5 898] :

  • restitue ces applications de l’IA et d’autres dans le domaine du Broadcast et de l’industrie des médias ;

  • se concentre sur deux cas d’étude :

    • le journalisme et l’IA,

    • les hypertrucages (deepfakes).

       

Les produits ou services spécifiques cités dans cet article le sont uniquement à titre d’illustration et ne représentent pas une promotion, une recommandation ou une approbation de l’auteur de ce document. Tous les articles ou sites spécialisés les présentant et les évaluant (indiqués en référence dans la partie annexe) n’engagent donc que leurs auteurs respectifs.

De nombreuses références détaillant les techniques et modèles d’IA utilisés dans des applications sont proposées dans la partie annexe « Pour en savoir plus », que le lecteur intéressé pourra consulter. Ce sont en général des documents au format PDF ou des blogs rédigés par des chercheurs, des grands acteurs de l’IA, à l’exception de sociétés commercialisant des produits et ne publiant pas de détails techniques sur leur modèle d’IA. Certains documents du Web offrent des photos, des vidéos ou des animations illustrant les applications et techniques d’IA utilisées.

Le lecteur trouvera en fin d’article une liste des principaux acronymes et abréviations utilisés tout au long de ce document, ainsi que des renvois vers des glossaires. Des termes (en caractères italiques) et le texte de quelques figures ont été conservés en anglais, soit parce qu’ils sont couramment utilisés dans le milieu professionnel, soit pour éviter toute ambiguïté de la traduction française qui en est proposée, soit enfin pour aider à la lecture des nombreux documents en anglais référencés.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-te5897


Cet article fait partie de l’offre

Le traitement du signal et ses applications

(160 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais English

3. Applications sons

Les principales applications de l’IA présentées dans le domaine des sons couvrent :

  • le traitement automatique de la parole (§ 3.1) ;

  • l’audio spatial (§ 3.2) ;

  • la musique (§ 3.3) ;

  • la compression audio (§ 3.4).

3.1 Traitement automatique de la parole

Le traitement automatique de la parole recouvre un vaste ensemble d’activités, souvent complémentaires, que l’on peut classer en cinq grands thèmes ([H 3 728] § 1) :

  • codage et compression de la parole, intervenant en transmission et en restitution de parole ;

  • synthèse de la parole, consistant à produire un signal vocal à partir d’un dictionnaire d’éléments phonétiques et/ou de règles ;

  • reconnaissance de la parole, revenant à faire interpréter par une machine des mots ou des phrases prononcés par un locuteur humain, dans le but de réaliser une action précise ;

  • reconnaissance et vérification du locuteur, problème dual du précédent dans lequel on cherche à authentifier une personne par sa voix ;

  • identification de la langue dans laquelle un locuteur s’exprime.

On se limitera dans cette section aux...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Le traitement du signal et ses applications

(160 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Applications sons
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - KAVLAKOGLU (E.) -   What’s the difference ?.  -  AI vs. Machine Learning vs. Deep Learning vs. Neural Networks. https://www.ibm.com/cloud/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networks (2020).

  • (2) - ROBINS (M.) -   The Difference between Artificial Intelligence, Machine Learning and Deep Learning.  -  https://www.intel.com/content/www/us/en/artificial-intelligence/posts/difference-between-ai-machine-learning-deep-learning.html (2020).

  • (3) - LAZZERI (F.) -   Aide-Mémoire de l’algorithme Machine Learning pour le concepteur Azure Machine Learning.  -  https://docs.microsoft.com/fr-fr/azure/machine-learning/algorithm-cheat-sheethttps://docs.microsoft.com/en-us/azure/machine-learning/algorithm-cheat-sheet (2020).

  • (4) - LAZZERI (F.) -   Apprentissage profond et apprentissage automatique dans Azure Machine Learning.  -  https://docs.microsoft.com/fr-fr/azure/machine-learning/concept-deep-learning-vs-machine-learninghttps://docs.microsoft.com/en-us/azure/machine-learning/concept-deep-learning-vs-machine-learning (2021).

  • (5) - Microsoft -   Tout...

NORMES

  • Moving Picture, Audio, and Data Coding by Artificial Intelligence. https://mpai.community/standards/. - MPAI - 2020

  • JPEG AI Learning-based Image Coding System. https://www.iso.org/standard/81984.html. - ISO/IEC AWI 6048 - 2020

  • Information technology – Multimedia content description interface – Part 17 : Compression of neural networks for multimedia content description and analysis. https://www.iso.org/standard/78480.htmlhttps://www.mpegstandards.org/standards/MPEG-7/17/. - ISO/IEC 15938-17 - 2019-07

1 Sites Web et logiciels pour apprendre l’IA

Sources : Un site spécialisé, animé par un jeune ingénieur en AI au Canada, offre un panorama détaillé de différentes ressources pour s’initier ou se perfectionner en AI : livres, vidéos YouTube, cours en ligne gratuits ou payants…

https://www.louisbouchard.ai/learnai/ (en anglais)

https://www.louisbouchard.ca/apprendre-ia (en français)

https://github.com/louisfb01/start-machine-learning (en anglais avec liste des ressources et des liens)

L’EBU News Report 2019 (p. 137-138 Courses on AI and Data) liste également des cours en ligne.

Tableau A (liste non exhaustive)

HAUT DE PAGE

2 Logiciels IA & médias

Source : Patrick ARNECKE – Dive into AI and machine learning. EBU tech-I 35, 1er Mar 2018

https://tech.ebu.ch/publications/tech-i-035

Tableau B (liste non exhaustive)

Tableau C (liste non exhaustive)

...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Le traitement du signal et ses applications

(160 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS