Présentation
EnglishRÉSUMÉ
Les machines à noyaux constituent une classe d’algorithmes permettant d’extraire de l’information à partir de données dans un cadre non paramétrique. L’intérêt suscité par ces méthodes tient d’abord aux excellentes performances qu’elles ont permis d’obtenir notamment sur les problèmes de grande taille. Cette bonne tenue à la charge est due à la parcimonie de la solution et à la faible complexité de son calcul. L’intérêt des machines à noyaux réside aussi dans leur caractère flexible et rigoureux, approche, qui recèle un grand potentiel. Cet article vise à introduire les machines à noyaux en se focalisant sur la plus populaire, le séparateur à vaste marge.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Stéphane CANU : Professeur des Universités - Directeur du LITIS, INSA de Rouen
INTRODUCTION
Les machines à noyaux constituent une classe d’algorithmes permettant d’extraire de l’information à partir de données dans un cadre non paramétrique. L’intérêt suscité par ces méthodes tient d’abord aux excellentes performances qu’elles ont permis d’obtenir notamment sur les problèmes de grande taille. Cette bonne tenue à la charge est due à la parcimonie de la solution et à la faible complexité de son calcul. L’intérêt des machines à noyaux réside aussi dans leur caractère flexible et rigoureux, approche, qui recèle un grand potentiel. Ce dossier vise à introduire les machines à noyaux en se focalisant sur la plus populaire, le séparateur à vaste marge (SVM), en faisant le point sur les différentes facettes de son utilisation. L’accent est mis sur les considérations pratiques liées à la mise en œuvre de ce type de méthode.
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Big Data > Machines à noyaux pour l’apprentissage statistique > Contexte
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Contexte
Aujourd’hui, les systèmes conçus pour vérifier si un billet est vrai ou faux, pour reconnaître une personne à partir du son de sa voix ou pour détecter les données aberrantes dans une base de données intègrent des algorithmes issus de la théorie statistique de l’apprentissage et en particulier une machine à noyaux comme outil de décision. La programmation de ces systèmes utilise un ensemble de couples observation-étiquette pour élaborer une règle de décision. On parle alors d’apprentissage statistique ou de programmation par l’exemple.
La base d’exemples utilisée constitue un échantillon de n réalisations (x i , y i ), où les x i représentent les formes et les y i les étiquettes. La règle de décision à apprendre est une fonction de l’ensemble des observations vers celui des étiquettes.
Pour l’ingénieur, le but de l’apprentissage statistique est l’extraction d’informations à partir de ces observations souvent nombreuses et complexes. Cette extraction consiste à rechercher, parmi un ensemble d’hypothèses (qui sont des règles de décision), celle qui « convient » le mieux aux exemples disponibles. C’est un problème d’optimisation. Le choix de cet ensemble d’hypothèses et des critères de qualité associés (qui explicitent comment une hypothèse « convient » aux données) doit être fait avant l’examen des observations. Ce choix est analogue à la phase de modélisation habituelle dans la démarche de l’ingénieur. On parle de « machine à noyaux » lorsque cet ensemble d’hypothèses posé a priori est défini à partir d’une fonction positive de deux variables appelée noyau.
Cette fonction noyau, notée
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Contexte
BIBLIOGRAPHIE
-
(1) - VAPNIK (V.) - Statistical Learning Theory - . Wiley, 1998.
-
(2) - HASTIE (T.), TIBSHIRANI (R.), FRIEDMAN (J.) - The elements of statistical learning - . Data Mining, inference and predictions, Springer, 2001.
-
(3) - HERBRICH (R.) - Learning Kernel Classifiers - . The MIT Press, 2002.
-
(4) - SCHOELKOPF (B.), SMOLA (A.J.) - Learning with Kernels - . The MIT Press, 2002.
-
(5) - SHAWE-TAYLOR (J.), CRISTIANIN (N.) - Kernel Methods for Pattern Analysis - . Cambridge Univ. Press, 2004.
-
(6) - * - Trois sites de référence : http://www.kernel-machines.org, http://jmlr.csail.mit.edu, http://www.nips.cc.
-
(7)...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive