Présentation
EnglishRÉSUMÉ
Discipline à la fois ancienne de par son histoire et très jeune de par ses multiples évolutions au cours des dernières décennies, la reconnaissance des formes (RDF) a pour but de concevoir des outils automatiques informatiques capables de reconnaître des formes. La RDF a longtemps été considérée comme une composante du domaine de l’intelligence artificielle, donc de la production de robots possédant la capacité d’apprendre, de raisonner, mais aussi d’interagir avec le monde extérieur, donc de reconnaître les objets. Dans ce cadre, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.). Progressivement, elle a étendu son champ d’action à des cadres d’apprentissage, tels que la régression. Aujourd’hui, la RDF est devenue une discipline fondatrice du domaine de l’apprentissage automatique numérique aux côtés entre autres de l’algorithmique, la cryptographie, la logique, la physique statistique, les probabilités, les statistiques, la théorie de l'évolution.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Thierry ARTIERES : Professeur d'informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)
INTRODUCTION
Le but de la reconnaissance des formes est de concevoir des outils automatiques, informatiques, capables de reconnaître des formes, ou patterns en anglais (où l’on parle de pattern recognition). La reconnaissance des formes (RDF dans la suite) est un domaine qui a fortement évolué ces dernières décennies si bien que ses contours sont devenus aujourd'hui plus flous. Il n’est pas simple d’en trouver une définition dans laquelle tous les chercheurs en RDF se reconnaîtront.
Il s'agit d'une discipline ancienne, Bishop rapporte par ailleurs que c’est la collection systématique d’observations astronomiques par Tycho Braha au XVIe siècle qui a permis à Johann Kepler la découverte de lois empiriques sur le mouvement des planètes. On peut multiplier de tels exemples et remonter très loin dans notre passé.
Si l’on s’intéresse à l’histoire moderne de la RDF, disons depuis les années 1980, et à ses développements récents liés bien entendu au développement des machines informatiques, on constate qu’elle s’est tout d’abord attachée à l’automatisation de tâches perceptives. Une des applications phares du domaine fut la reconnaissance de l’écriture, qui reste un champ d’application et de recherche actif aujourd’hui. Au-delà, la vision, à travers la reconnaissance d’objets dans des images, mais également l’audition et la reconnaissance automatique de la parole sont des applications emblématiques et historiques de la reconnaissance des formes.
C’est une des raisons pour laquelle la reconnaissance des formes a longtemps été considérée comme une composante du domaine plus vaste, et également fortement pluridisciplinaire, de l’intelligence artificielle (IA), dont un but ultime pourrait être de produire des robots doués d’intelligence, capables non seulement d’apprendre et de raisonner mais également d’interagir y compris physiquement avec le monde extérieur, donc de se mouvoir, de reconnaître leurs interlocuteurs et les objets d’une pièce, de parler, d’entendre, de comprendre, raisonner, etc. Dans ce schéma, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.) à partir de senseurs sur le monde extérieur.
Progressivement, la RDF s’est émancipée de la tutelle de l’IA. En s’intéressant à des formes ou des patterns quelconques elle a permis d’aborder d’autres tâches de classification et a été étendue à d’autres cadres d’apprentissage supervisés tels que la régression. Aujourd’hui la RDF est une discipline fondatrice du domaine de l’apprentissage automatique (machine learning en anglais), avec d’autres telles que l’algorithmique, la complexité, la cryptographie, la logique, l’optimisation, la physique statistique, les probabilités, les sciences cognitives, les statistiques, la théorie de l'évolution, etc.
L’histoire moderne de la reconnaissance des formes est donc mouvementée, il s’agit finalement d’une discipline jeune qui a déjà subi de multiples influences et cheminements et dont le spectre d’applications et de techniques a crû au sein de ce que l’on nomme aujourd’hui l’apprentissage automatique numérique. Cette présentation se veut une introduction au domaine et ne peut être considérée comme exhaustive. Elle vise essentiellement à introduire les problématiques fondamentales mises en jeu ainsi que les concepts essentiels à la compréhension des techniques. Le lecteur intéressé pourra avantageusement consulter des livres de référence tels que , , , .
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Sciences fondamentales > Mathématiques > Applications des mathématiques > Reconnaissance des formes > Apprentissage à partir de données
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Apprentissage à partir de données
Les modules de RDF sont mis au point par des techniques d’apprentissage automatique. Nous distinguons ici deux cadres d’apprentissage correspondant à deux types de systèmes, le cadre de l’apprentissage supervisé et le cadre de l’apprentissage non supervisé (à noter que d’autres cadres existent, notamment le cadre semi-supervisé).
Nous présentons rapidement ces deux cadres puis détaillons les éléments nécessaires à l’apprentissage d’un module de classification (cadre supervisé) et d’un module de partitionnement (cadre non supervisé).
3.1 Cadre supervisé et non supervisé
L’apprentissage supervisé vise à concevoir un module capable d’apprendre une association entrée sortie à partir d’une collection d’exemples d’apprentissage sous forme de paires (entrée, sortie désirée). En présence d’une entrée (un stimulus particulier) on dispose d’une information de supervision (la sortie désirée) pour orienter l’apprentissage du module. Les deux applications les plus importantes de ce cadre sont la régression (la prédiction d’une variable réelle non observée en fonction d’autres variables réelles observées) et la classification qui diffère par la nature de la variable prédite, nominale.
À l’inverse, dans le cadre non supervisé, on ne dispose d’aucune information de supervision, on ne dispose dans la base d’apprentissage que de stimuli d’entrée. L’apprentissage a alors pour but de détecter des régularités dans ces données et de les partitionner en groupes homogènes. D’une certaine façon, le partitionnement a pour but conjoint de déterminer automatiquement les classes présentes dans les données et l’apprentissage du classifieur correspondant.
HAUT DE PAGE3.2 Classification
Les algorithmes de classification automatique visent à concevoir des logiciels capables de reconnaître la classe d’un exemple à partir de l’observation de ses caractéristiques. Par exemple on reconnaît le caractère représenté par une image dont on connait la valeur de chacun des pixels, on reconnaît le mot prononcé à partir du signal sonore, etc.
Le module de classification (on parle de classifieur ou de...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Apprentissage à partir de données
BIBLIOGRAPHIE
-
(1) - BAKIR (G.H.), HOFMANN (T.), SCHOLKOPF (B.), SMOLA (A.J.), TASKAR (B.), VISHWANATHAN (S.V.N.) - Predicting Structured Data - Gökhan H. Bakir, Thomas Hofmann, Bernhard Schölkopf,Alexander J. Smola, Ben Taskar and S. V. N. Vishwanathan Eds, The MIT Press (2007).
-
(2) - BILMES (J.) - A Gentle Tutorial on the EM Algorithm Including Gaussian Mixturesand Baum-Welch - International computer science institute, ICSI Technical ReportTR-97-021, Université de Berkeley (May 1997).
-
(3) - BISHOP (C.) - Pattern Recognition and Machine Learning (Information Science andStatistics) - Springer (October 1, 2007).
-
(4) - BUNKE (H.), SANFELIU (A.) - Syntactic and strucral pattern recognition, theory and applications - H Bunke & A Sanfeliu eds., World Scientific Series in ComputerScience – Vol. 7 (1990).
-
(5) - DUDA (O.), HARDT (P.), STORK (G.) - Pattern Classification - Wiley-Interscience ; 2 edition (October 2000).
-
...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive