1 - CADRE GÉNÉRAL DE L’APPRENTISSAGE ARTIFICIEL STATISTIQUE

1.1 - Apprentissage artificiel = statistique + optimisation
1.2 - Principes méthodologiques pour l’apprentissage supervisé
- Quiz d'entraînement

2 - TECHNIQUES « CLASSIQUES » D’APPRENTISSAGE SUPERVISÉ

2.1 - Classification vs régression
2.2 - Réseaux neuronaux à couches

Figure 7 - Neurone sommateur dérivable
2.3 - Séparateurs à Vastes Marges (SVM, Support Vector Machines)
- Quiz d'entraînement
2.4 - Arbres de décision
2.5 - Forêts Aléatoires
2.6 - Boosting
- Quiz d'entraînement

3 - APPRENTISSAGE PROFOND (DEEP-LEARNING)

3.1 - Principe et originalité
3.2 - Réseaux neuronaux convolutionnels
3.3 - Apprentissage des réseaux neuronaux convolutionnels
3.4 - ConvNets pré-appris et apprentissage « par transfert »
3.5 - Hyper-paramètres des réseaux convolutionnels
3.6 - Points forts et points faibles des réseaux convolutionnels

4 - SYNTHÈSE COMPARATIVE

Quiz d'entraînement

5 - CONCLUSION

6 - GLOSSAIRE

7 - SIGLES, NOTATIONS ET SYMBOLES

Bibliographie & annexes

Quiz & test

Article de référence | Réf : H5010 v1

Cadre général de l’apprentissage artificiel statistique
Apprentissage Statistique Supervisé

Auteur(s) : Fabien MOUTARDE

Relu et validé le 05 janv. 2021 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

RÉSUMÉ

Cet article est consacré à l’apprentissage statistique supervisé, en tant qu’outil pour l’ingénieur. D’abord sont présentés et expliqués succinctement les grands principes théoriques et méthodologiques. Puis l’article décrit les modèles et algorithmes les plus couramment utilisés en apprentissage supervisé. Y sont présentées et expliquées d’une part les principales techniques « classiques » (Perceptron Multi-Couche, Séparateur à Vaste Marge, Arbres de Décision et Forêts Aléatoires, Boosting), et d’autre part l’apprentissage profond de réseau convolutionnel.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Fabien MOUTARDE : Professeur - Centre de Robotique, Mines ParisTech, PSL Université, Paris, France.

INTRODUCTION

L’objet de cet article est de présenter les grands principes de l’apprentissage artificiel statistique supervisé, ainsi qu’un panorama des principaux algorithmes et techniques de ce domaine.

Ce sont ces techniques d’apprentissage statistique qui ont rendu possible l’automatisation de tâches de plus en plus complexes, et donc permis le développement puis le déploiement dans la vie courante d’applications telles que :

la lecture automatisée d’écriture, par exemple pour les chèques bancaires et adresses sur des enveloppes ;
la reconnaissance vocale, notamment pour les automates téléphoniques ;
les « systèmes de recommandation » capables de proposer des sélections personnalisées (i.e. adaptées aux goûts et/ou centres d’intérêt de chacun) de musiques, vidéos ou informations.

De même, l’apprentissage artificiel est au cœur de futurs systèmes encore plus sophistiqués comme :

la robotique « intelligente » (par opposition aux robots-automates des années 1970 exécutant à l’identique des actions répétitives) ;
la conduite automatisée de voitures sans conducteur ;
les « agents conversationnels » et la traduction automatisée, etc.

Par ailleurs, du fait de la « numérisation » croissante du monde, et de l’avalanche de données qui en résulte, l’apprentissage statistique prend depuis une vingtaine d’années un essor grandissant en couvrant un champ de plus en plus vaste. En effet, les informations de quasiment tous les secteurs (activités humaines telles que commerce, économie, culture, loisirs, etc., mais aussi santé et environnement) étant de plus en plus encodées, enregistrées et transmises sous forme informatique, il devient possible d’accéder pour un coût quasi-nul à une grande quantité de données auxquelles peuvent être appliquées des analyses statistiques, et donc une modélisation empirique par apprentissage artificiel. Enfin, les algorithmes d’apprentissage ont très significativement progressé dans le même temps, et plus encore ces cinq dernières années avec le développement de l’apprentissage profond, ce qui permet de traiter avec des performances « industrialisables » une large palette de problèmes d’ingénierie.

Nota : le lecteur trouvera en fin d’article un glossaire des termes et expressions importants de l’article, ainsi qu’un tableau des sigles, notations et symboles utilisés tout au long de l’article.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Innovations technologiques

(190 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Techniques « classiques » d’apprentissage supervisé

1. Cadre général de l’apprentissage artificiel statistique

1.1 Apprentissage artificiel = statistique + optimisation

L’apprentissage artificiel statistique est un sous-ensemble de l’Intelligence Artificielle, et correspond à diverses méthodes s’appuyant sur une modélisation empirique (c’est-à-dire fondée sur des exemples ou données) pour réaliser de façon automatisée une classification ou une approximation continue ( régression ), ou encore un partitionnement. Son originalité par rapport aux modèles « de connaissance » (obtenus par une mise en équation, issue par exemple de la physique) est d’être « dirigé par les données ».

En ce sens, la plupart des ingénieurs ont déjà fait de l’apprentissage statistique « sans le savoir ». Un des exemples les plus simples et anciens est en effet la régression linéaire, qui consiste à approximer une relation entre une grandeur et un ensemble de « variables explicatives » (ou « entrées ») grâce à la technique des « moindres carrés » : étant donné un ensemble de valeurs scalaires y_n (n variant de 1 à N) observées pour les vecteurs d’entrée ${\vec{x}}_{n} =^{t} (X_{n,1}, X_{n,2}, \dots, X_{n,d})$ , on utilise une approximation linéaire de la forme $y \approx \vec{a} \cdot \vec{x} + b$ ...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

TEST DE VALIDATION ET CERTIFICATION CerT.I. :

Cet article vous permet de préparer une certification CerT.I.

Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.

Obtenez CerT.I., la certification
de Techniques de l’Ingénieur ! Acheter le module

Cet article fait partie de l’offre

Innovations technologiques

(190 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Cadre général de l’apprentissage artificiel statistique

Page
précédentePrésentation

Page
suivante

Techniques « classiques » d’apprentissage supervisé

BIBLIOGRAPHIE

(1) - RUMELHART (D.E.), HINTON (G.E.), WILLIAMS (R.J.) - Learning representations by back-propagating errors. - Nature, 323 (6088) : 533-536 (1986).
(2) - CYBENKO (G.) - Approximation by superpositions of a sigmoidal function. - Mathematics of Control, Signals, and Systems, 2(4), 303-314 (1989).
(3) - QUINLAN (J.R.) - Induction of Decision Trees. - Machine Learning 1: 81-106 (1986).
(4) - BREIMAN (L.), FRIEDMAN (J.H.), OLSHEN (R.A.), STONE (C.J.) - Classification and regression trees. - Monterey, CA : Wadsworth & Brooks/Cole Advanced Books & Software (1984).
(5) - BREIMAN (L.) - Random Forests. - Machine Learning 45 (1) : 5-32 (2001).
(6) - FREUND (Y.), SCHAPIRE (R.) - A decision-theoretic generalization of on-line...

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Outils logiciels

1 Outils logiciels

Pour les algorithmes « classiques » d’apprentissage statistique, l’outil logiciel le plus riche (contenant des implémentations de la pluparts des modèles et algorithmes) et très couramment utilisé est :

Sci-Kit Learn (librairie Python), http://scikit-learn.org

Pour l’apprentissage profond de réseaux convolutionnels, les principales librairies utilisées (qui intègrent toutes une utilisation transparente des GPUs sur les ordinateurs qui en ont) sont :

Caffe, http://caffe.berkeleyvision.org/
Theano, http://www.deeplearning.net/software/theano/
Lasagne, http://lasagne.readthedocs.io
TensorFlow, https://www.tensorflow.org
KERAS, https://keras.io
PyTorch, https://pytorch.org/

NB : tous ces outils logiciels sont gratuits

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Innovations technologiques

(190 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE

1/ Quiz d'entraînement

Entraînez vous autant que vous le voulez avec les quiz d'entraînement.

Accédez au Quiz 1
Accédez au Quiz 2
Accédez au Quiz 3
Accédez au Quiz 4

2/ Test de validation

Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.

Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.

TEST DE VALIDATION

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Innovations technologiques

(190 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Cadre général de l’apprentissage artificiel statistique Apprentissage Statistique Supervisé

RÉSUMÉ

Auteur(s)

INTRODUCTION

Cet article est réservé aux abonnés.Il vous reste 93% à découvrir.

L'expertise technique et scientifique de référence

MOTS-CLÉS

DOI (Digital Object Identifier)

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

1. Cadre général de l’apprentissage artificiel statistique

Cet article est réservé aux abonnés.Il vous reste 93% à découvrir.

L'expertise technique et scientifique de référence

TEST DE VALIDATION ET CERTIFICATION CerT.I. :

BIBLIOGRAPHIE

DANS NOS BASES DOCUMENTAIRES

ANNEXES

Cet article est réservé aux abonnés.Il vous reste 93% à découvrir.

L'expertise technique et scientifique de référence

QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE

1/ Quiz d'entraînement

2/ Test de validation

L'expertise technique et scientifique de référence

Cadre général de l’apprentissage artificiel statistique
Apprentissage Statistique Supervisé

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.