Présentation

Article

1 - REPRÉSENTATION DES DONNÉES EN 3D

2 - NOTIONS DE BASE DE L’APPRENTISSAGE PROFOND POUR L’ANALYSE D’IMAGES

3 - ANALYSE D’IMAGES 3D

4 - GÉNÉRATION DE DONNÉES 3D

5 - DÉFIS, PERSPECTIVES ET CONCLUSION

6 - ASPECTS ENVIRONNEMENTAUX

7 - GLOSSAIRE

8 - SIGLES, NOTATIONS ET SYMBOLES

Article de référence | Réf : RE186 v1

Génération de données 3D
Apprentissage profond pour les images tridimensionnelles

Auteur(s) : Petr DOKLADAL, Étienne DECENCIÈRE

Date de publication : 10 sept. 2023

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

RÉSUMÉ

L’apprentissage profond a provoqué une révolution technologique dans l’analyse et la génération d’images à deux dimensions, permettant le développement de nouvelles applications. Dans cet article, il est question de l’application de ces méthodes aux données tridimensionnelles, comme les tomographies utilisées en imagerie médicale ou dans l’étude de matériaux. L’analyse de données 3D, mais aussi leur génération, sont abordées. Les difficultés théoriques et pratiques de ces approches sont expliquées et leurs perspectives développées.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Deep learning for 3D images

Deep learning has brought a technological revolution in the analysis and generation of two-dimensional images, enabling the development of new applications. This article discusses the application of these methods to three-dimensional data, such as the tomographies used in medical imaging or in the study of materials. The analysis of 3D data, as well as their generation, are addressed. The theoretical and practical difficulties of these approaches are explained, and their prospects are developed.

Auteur(s)

  • Petr DOKLADAL : Maître de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France

  • Étienne DECENCIÈRE : Directeur de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France

INTRODUCTION

L’apprentissage profond (deep learning, en anglais) est une discipline qui fait appel aux réseaux de neurones artificiels pour apprendre automatiquement des transformations. Depuis une dizaine d’années, cette discipline a bouleversé différents domaines des sciences des données, comme l’analyse d’images ou le traitement du langage naturel, au point de provoquer un renouveau de l’intelligence artificielle (IA). Cette révolution technologique a poussé des grandes sociétés à recruter à prix d’or des chercheurs et des ingénieurs pour constituer ou renforcer des équipes en IA. De nombreuses start-ups ont aussi été créées pour développer des solutions à des problèmes qui étaient considérés, il y a seulement quelques années, comme hors de portée.

Les images tridimensionnelles (3D) occupent aussi une place croissante dans les applications industrielles, grâce aux progrès de méthodes d’acquisition de plus en plus performantes, comme la tomodensitométrie par rayons X, l’imagerie par résonance magnétique ou la télédétection par laser (plus communément connue sous l'appellation LiDAR, de l’anglais Light Detection And Ranging). Notons qu’un autre domaine de recherche porte sur l’extraction d’informations 3D à partir d’images 2D.

C’est donc naturellement que des applications de l’apprentissage profond pour les images 3D ont été développées ces dernières années. Cet article a pour objectif de présenter de façon synthétique et accessible ces méthodes. Pour cela, nous commençons par introduire les différentes représentations 3D considérées : nous nous limitons ici aux représentations sous forme de tableau à trois dimensions ou de graphe. Nous présentons ensuite brièvement les bases de l’apprentissage profond pour les images et les graphes, puis nous expliquons comment elles sont appliquées aux images 3D. Nous abordons dans la section suivante un sujet plus prospectif : la génération d’images 3D. Enfin, avant de conclure, nous discutons des perspectives et des défis de ces méthodes.

Nota

le lecteur trouvera en fin d’article un glossaire des termes et expressions importants de l’article, ainsi qu’un tableau des sigles, notations et symboles utilisés tout au long de l’article.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

KEYWORDS

deep learning   |   Mesh   |   convolutional neural network   |   3D image

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re186

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil Ressources documentaires Technologies de l'information Technologies logicielles Architectures des systèmes Intelligence artificielle Apprentissage profond pour les images tridimensionnelles Génération de données 3D

Accueil Ressources documentaires Technologies de l'information Le traitement du signal et ses applications Traitement du signal : bases théoriques Apprentissage profond pour les images tridimensionnelles Génération de données 3D

Accueil Ressources documentaires Innovation Innovations technologiques Innovations en électronique et TIC Apprentissage profond pour les images tridimensionnelles Génération de données 3D

Accueil Ressources documentaires Électronique - Photonique Technologies radars et applications Géomatique Apprentissage profond pour les images tridimensionnelles Génération de données 3D


Cet article fait partie de l’offre

Technologies radars et applications

(69 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

4. Génération de données 3D

S’il est facile, pour un humain, de déduire la forme 3D d’un objet à partir d’une seule perspective, c’est extrêmement difficile pour un algorithme. En effet, contrairement à la vision par ordinateur, la vision humaine est intensément aidée par la mémoire et l’intelligence.

Or, il y a une demande pour l’extraction automatique d’objets 3D de haute qualité à partir d’une seule photographie. Les applications sont nombreuses, allant de la manipulation d’images à la réalité virtuelle et augmentée, en passant par l’impression 3D. Par exemple, dans le commerce électronique, il serait très intéressant de pouvoir récupérer automatiquement et rapidement le modèle 3D d’un produit commercial à partir de sa photographie (par exemple, dans la publicité). De plus, la géométrie et la texture doivent être de haute qualité pour être utiles. Dans ce qui suit, nous présenterons des travaux qui ont permis des avancées qualitatives vers cet objectif.

Limitées par la nature du réseau neuronal profond, les premières méthodes représentent généralement une forme 3D en grille de voxels ou en nuage de points et il n’est pas trivial de les convertir en un maillage prêt à l’emploi. Les méthodes ultérieures ont généré directement un maillage 3D triangulaire correct. Une étape qualitative suivante consistait en la génération de maillages 3D composés de primitives éditables par l’homme. Une étape nouvelle a été franchie avec un transformer capable de produire des maillages polygonaux où l’objet 3D généré est très proche d’un modèle CAO généré par un designer humain.

Une première question à se poser est comment un modèle peut représenter un objet 3D ? Selon Girdhar et al. , une bonne représentation doit être générative en 3D dans le sens où elle peut créer de nouveaux objets 3D. Elle doit aussi être prédictive à partir de...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies radars et applications

(69 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Génération de données 3D
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - ROSENBLATT (F.) -   The perceptron : A probabilistic model for information storage and organization in the brain.  -  Psychol. Rev., vol. 65, n° 6, p. 386-408, DOI : 10.1037/h0042519 (1958).

  • (2) - AZENCOTT (C.-A.) -   Introduction au machine learning.  -  Dunod (2019).

  • (3) - CHOLLET (F.) -   Deep Learning with Python.  -  Second Edition, Simon and Schuster (2021).

  • (4) - LECUN (Y.), BENGIO (Y.), HINTON (G.) -   Deep learning.  -  Nature, vol. 521, n° 7553, p. 436-444 (2015).

  • (5) - CYBENKO (G.) -   Approximations by superpositions of a sigmoidal function.  -  Math. Control Signals Syst., vol. 2, p. 183-192 (1989).

  • (6) - FUKUSHIMA (K.) -   Neocognitron : A self-organizing neural network model for a mechanism of pattern...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies radars et applications

(69 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS