Présentation
En anglaisRÉSUMÉ
Discipline à la fois ancienne de par son histoire et très jeune de par ses multiples évolutions au cours des dernières décennies, la reconnaissance des formes (RDF) a pour but de concevoir des outils automatiques informatiques capables de reconnaître des formes. La RDF a longtemps été considérée comme une composante du domaine de l’intelligence artificielle, donc de la production de robots possédant la capacité d’apprendre, de raisonner, mais aussi d’interagir avec le monde extérieur, donc de reconnaître les objets. Dans ce cadre, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.). Progressivement, elle a étendu son champ d’action à des cadres d’apprentissage, tels que la régression. Aujourd’hui, la RDF est devenue une discipline fondatrice du domaine de l’apprentissage automatique numérique aux côtés entre autres de l’algorithmique, la cryptographie, la logique, la physique statistique, les probabilités, les statistiques, la théorie de l'évolution.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Although this discipline has a long history it can be considered as fairly young due to the multiple recent evolutions it has undergone over the last decades. The aim of pattern recognition (PR) is to design IT tools able to recognize patterns. PR has long been considered as a comment of the artificial intelligence domain and thus of the design of robots having the capability to learn, reason and also interact with the outside world and therefore to recognize objects. Within this framework, the initial role of PR has been to produce any and all algorithms necessary to the abstract perception of the environment (obstacles, individuals, etc.). Its scope of action has been gradually extended to learning environments such as regression. PR has currently become a founding discipline for the sector of automatic digital learning together with algorithmics, cryptography, logics, statistical physics, probabilities, statistics and the theory of evolution.
Auteur(s)
-
Thierry ARTIERES : Professeur d'informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)
INTRODUCTION
Le but de la reconnaissance des formes est de concevoir des outils automatiques, informatiques, capables de reconnaître des formes, ou patterns en anglais (où l’on parle de pattern recognition). La reconnaissance des formes (RDF dans la suite) est un domaine qui a fortement évolué ces dernières décennies si bien que ses contours sont devenus aujourd'hui plus flous. Il n’est pas simple d’en trouver une définition dans laquelle tous les chercheurs en RDF se reconnaîtront.
Il s'agit d'une discipline ancienne, Bishop rapporte par ailleurs que c’est la collection systématique d’observations astronomiques par Tycho Braha au XVIe siècle qui a permis à Johann Kepler la découverte de lois empiriques sur le mouvement des planètes. On peut multiplier de tels exemples et remonter très loin dans notre passé.
Si l’on s’intéresse à l’histoire moderne de la RDF, disons depuis les années 1980, et à ses développements récents liés bien entendu au développement des machines informatiques, on constate qu’elle s’est tout d’abord attachée à l’automatisation de tâches perceptives. Une des applications phares du domaine fut la reconnaissance de l’écriture, qui reste un champ d’application et de recherche actif aujourd’hui. Au-delà, la vision, à travers la reconnaissance d’objets dans des images, mais également l’audition et la reconnaissance automatique de la parole sont des applications emblématiques et historiques de la reconnaissance des formes.
C’est une des raisons pour laquelle la reconnaissance des formes a longtemps été considérée comme une composante du domaine plus vaste, et également fortement pluridisciplinaire, de l’intelligence artificielle (IA), dont un but ultime pourrait être de produire des robots doués d’intelligence, capables non seulement d’apprendre et de raisonner mais également d’interagir y compris physiquement avec le monde extérieur, donc de se mouvoir, de reconnaître leurs interlocuteurs et les objets d’une pièce, de parler, d’entendre, de comprendre, raisonner, etc. Dans ce schéma, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.) à partir de senseurs sur le monde extérieur.
Progressivement, la RDF s’est émancipée de la tutelle de l’IA. En s’intéressant à des formes ou des patterns quelconques elle a permis d’aborder d’autres tâches de classification et a été étendue à d’autres cadres d’apprentissage supervisés tels que la régression. Aujourd’hui la RDF est une discipline fondatrice du domaine de l’apprentissage automatique (machine learning en anglais), avec d’autres telles que l’algorithmique, la complexité, la cryptographie, la logique, l’optimisation, la physique statistique, les probabilités, les sciences cognitives, les statistiques, la théorie de l'évolution, etc.
L’histoire moderne de la reconnaissance des formes est donc mouvementée, il s’agit finalement d’une discipline jeune qui a déjà subi de multiples influences et cheminements et dont le spectre d’applications et de techniques a crû au sein de ce que l’on nomme aujourd’hui l’apprentissage automatique numérique. Cette présentation se veut une introduction au domaine et ne peut être considérée comme exhaustive. Elle vise essentiellement à introduire les problématiques fondamentales mises en jeu ainsi que les concepts essentiels à la compréhension des techniques. Le lecteur intéressé pourra avantageusement consulter des livres de référence tels que , , , .
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Sciences fondamentales > Mathématiques > Applications des mathématiques > Reconnaissance des formes > Méthodes basées sur les distances et le voisinage
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Méthodes basées sur les distances et le voisinage
Nous examinons ici une première famille de méthodes, intuitives et performantes, basées sur la notion de distance entre formes. Nous étudions successivement une méthode de classification et une méthode de partitionnement toutes deux basées sur cette idée.
Parmi la multitude de méthodes de RDF, la méthode de classification par le plus proche voisin et son extension immédiate la méthode des K plus proches voisins tiennent une place à part. Elles sont à la fois naturelles et justifiées par certains résultats théoriques. Nous en décrivons tout d’abord le principe puis nous en donnons certaines propriétés.
Enfin nous abordons le cadre du partitionnement et décrivons une méthode usuelle de partitionnement basée sur la notion de distance, l’algorithme des K-Moyennes.
4.1 Classification par le plus proche voisin
-
Méthode du plus proche voisin
Imaginons que l’on cherche à mettre au point un système capable de reconnaître un caractère manuscrit écrit dans une imagette. Imaginons également que l’on dispose d’une collection d’imagettes d’ores et déjà annotées, c'est-à-dire que l’on sait quel caractère est représenté sur chacune de ces imagettes. Nous notons cet ensemble de données B = {(xi, yi)i=1...N}.
En présence d’une nouvelle imagette x, non annotée, on peut exploiter une règle très simple qui consiste à considérer l’imagette de B la plus proche de x, et de décider que le caractère représenté par l’imagette x est le même que celui représenté par l’imagette , c'est-à-dire
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Méthodes basées sur les distances et le voisinage
BIBLIOGRAPHIE
-
(1) - BAKIR (G.H.), HOFMANN (T.), SCHOLKOPF (B.), SMOLA (A.J.), TASKAR (B.), VISHWANATHAN (S.V.N.) - Predicting Structured Data - Gökhan H. Bakir, Thomas Hofmann, Bernhard Schölkopf,Alexander J. Smola, Ben Taskar and S. V. N. Vishwanathan Eds, The MIT Press (2007).
-
(2) - BILMES (J.) - A Gentle Tutorial on the EM Algorithm Including Gaussian Mixturesand Baum-Welch - International computer science institute, ICSI Technical ReportTR-97-021, Université de Berkeley (May 1997).
-
(3) - BISHOP (C.) - Pattern Recognition and Machine Learning (Information Science andStatistics) - Springer (October 1, 2007).
-
(4) - BUNKE (H.), SANFELIU (A.) - Syntactic and strucral pattern recognition, theory and applications - H Bunke & A Sanfeliu eds., World Scientific Series in ComputerScience – Vol. 7 (1990).
-
(5) - DUDA (O.), HARDT (P.), STORK (G.) - Pattern Classification - Wiley-Interscience ; 2 edition (October 2000).
-
...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive