Présentation
EnglishRÉSUMÉ
Cet article est consacré à l’apprentissage statistique supervisé, en tant qu’outil pour l’ingénieur. D’abord sont présentés et expliqués succinctement les grands principes théoriques et méthodologiques. Puis l’article décrit les modèles et algorithmes les plus couramment utilisés en apprentissage supervisé. Y sont présentées et expliquées d’une part les principales techniques « classiques » (Perceptron Multi-Couche, Séparateur à Vaste Marge, Arbres de Décision et Forêts Aléatoires, Boosting), et d’autre part l’apprentissage profond de réseau convolutionnel.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Fabien MOUTARDE : Professeur - Centre de Robotique, Mines ParisTech, PSL Université, Paris, France.
INTRODUCTION
L’objet de cet article est de présenter les grands principes de l’apprentissage artificiel statistique supervisé, ainsi qu’un panorama des principaux algorithmes et techniques de ce domaine.
Ce sont ces techniques d’apprentissage statistique qui ont rendu possible l’automatisation de tâches de plus en plus complexes, et donc permis le développement puis le déploiement dans la vie courante d’applications telles que :
-
la lecture automatisée d’écriture, par exemple pour les chèques bancaires et adresses sur des enveloppes ;
-
la reconnaissance vocale, notamment pour les automates téléphoniques ;
-
les « systèmes de recommandation » capables de proposer des sélections personnalisées (i.e. adaptées aux goûts et/ou centres d’intérêt de chacun) de musiques, vidéos ou informations.
De même, l’apprentissage artificiel est au cœur de futurs systèmes encore plus sophistiqués comme :
-
la robotique « intelligente » (par opposition aux robots-automates des années 1970 exécutant à l’identique des actions répétitives) ;
-
la conduite automatisée de voitures sans conducteur ;
-
les « agents conversationnels » et la traduction automatisée, etc.
Par ailleurs, du fait de la « numérisation » croissante du monde, et de l’avalanche de données qui en résulte, l’apprentissage statistique prend depuis une vingtaine d’années un essor grandissant en couvrant un champ de plus en plus vaste. En effet, les informations de quasiment tous les secteurs (activités humaines telles que commerce, économie, culture, loisirs, etc., mais aussi santé et environnement) étant de plus en plus encodées, enregistrées et transmises sous forme informatique, il devient possible d’accéder pour un coût quasi-nul à une grande quantité de données auxquelles peuvent être appliquées des analyses statistiques, et donc une modélisation empirique par apprentissage artificiel. Enfin, les algorithmes d’apprentissage ont très significativement progressé dans le même temps, et plus encore ces cinq dernières années avec le développement de l’apprentissage profond, ce qui permet de traiter avec des performances « industrialisables » une large palette de problèmes d’ingénierie.
Nota : le lecteur trouvera en fin d’article un glossaire des termes et expressions importants de l’article, ainsi qu’un tableau des sigles, notations et symboles utilisés tout au long de l’article.
MOTS-CLÉS
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Intelligence artificielle > Apprentissage Statistique Supervisé > Apprentissage profond (deep-learning)
Accueil > Ressources documentaires > Innovation > Innovations technologiques > Innovations en électronique et TIC > Apprentissage Statistique Supervisé > Apprentissage profond (deep-learning)
Accueil > Ressources documentaires > Automatique - Robotique > Automatique et ingénierie système > Méthodes et outils > Apprentissage Statistique Supervisé > Apprentissage profond (deep-learning)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Apprentissage profond (deep-learning)
Nous nous limitons ici volontairement à une présentation synthétique de la spécificité de l’apprentissage profond supervisé et des réseaux neuronaux convolutionnels effectuant de la classification d’images.
3.1 Principe et originalité
Comme expliqué dans le § 1.2.2 et illustré sur la figure 3, les techniques « classiques » d’apprentissage supervisé sont fréquemment appliquées non pas sur les entrées brutes des exemples, mais sur des caractéristiques (features) destinées à caractériser/décrire le contenu du vecteur d’entrée. Ces caractéristiques sont obtenues en effectuant des calculs sur des sous-ensembles de composantes brutes, et/ou en évaluant sur l’ensemble du vecteur d’entrée des quantités globales supposées pertinentes. Les features sont souvent spécifiques au type de données, par exemple histogramme de gradient sur une sous-partie d’une image, nombre d’occurences de tels ou tels mots sur un texte, etc. Par opposition à cela, l’apprentissage profond (deep-learning) a pour principe d’apprendre une succession de transformations partant des entrées brutes pour créer une hiérarchie de représentations de plus en plus abstraites jusqu’à estimation finale de la sortie (figure 21). Ceci présente deux intérêts principaux :
-
éviter la phase délicate et experte de choix/conception « à la main » de bonnes caractéristiques à calculer sur les entrées ;
-
la hiérarchie de transformations étant apprise conjointement avec le modèle d’estimation de la sortie, cela permet de construire automatiquement une...
TEST DE VALIDATION ET CERTIFICATION CerT.I. :
Cet article vous permet de préparer une certification CerT.I.
Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.
de Techniques de l’Ingénieur ! Acheter le module
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Apprentissage profond (deep-learning)
BIBLIOGRAPHIE
-
(1) - RUMELHART (D.E.), HINTON (G.E.), WILLIAMS (R.J.) - Learning representations by back-propagating errors. - Nature, 323 (6088) : 533-536 (1986).
-
(2) - CYBENKO (G.) - Approximation by superpositions of a sigmoidal function. - Mathematics of Control, Signals, and Systems, 2(4), 303-314 (1989).
-
(3) - QUINLAN (J.R.) - Induction of Decision Trees. - Machine Learning 1: 81-106 (1986).
-
(4) - BREIMAN (L.), FRIEDMAN (J.H.), OLSHEN (R.A.), STONE (C.J.) - Classification and regression trees. - Monterey, CA : Wadsworth & Brooks/Cole Advanced Books & Software (1984).
-
(5) - BREIMAN (L.) - Random Forests. - Machine Learning 45 (1) : 5-32 (2001).
-
(6) - FREUND (Y.), SCHAPIRE (R.) - A decision-theoretic generalization of on-line...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Pour les algorithmes « classiques » d’apprentissage statistique, l’outil logiciel le plus riche (contenant des implémentations de la pluparts des modèles et algorithmes) et très couramment utilisé est :
Sci-Kit Learn (librairie Python), http://scikit-learn.org
Pour l’apprentissage profond de réseaux convolutionnels, les principales librairies utilisées (qui intègrent toutes une utilisation transparente des GPUs sur les ordinateurs qui en ont) sont :
-
Lasagne, http://lasagne.readthedocs.io
-
TensorFlow, https://www.tensorflow.org
-
KERAS, https://keras.io
-
PyTorch, https://pytorch.org/
NB : tous ces outils logiciels sont gratuits
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE
1/ Quiz d'entraînement
Entraînez vous autant que vous le voulez avec les quiz d'entraînement.
2/ Test de validation
Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.
Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive