Présentation

Article

1 - THÉORIE DE LA DÉCISION BAYÉSIENNE

2 - ARCHITECTURE ET CONCEPTION D’UN SYSTÈME DE RDF

3 - APPRENTISSAGE À PARTIR DE DONNÉES

4 - MÉTHODES BASÉES SUR LES DISTANCES ET LE VOISINAGE

5 - APPROCHES GLOBALES POUR LA CLASSIFICATION

6 - APPROCHES SYNTAXIQUES ET STRUCTURELLES POUR LA CLASSIFICATION

7 - APPROCHE STRUCTURELLE VERSUS APPROCHE STATISTIQUE

8 - CONCLUSION ET PERSPECTIVES

Article de référence | Réf : AF1510 v1

Méthodes basées sur les distances et le voisinage
Reconnaissance des formes

Auteur(s) : Thierry ARTIERES

Date de publication : 10 oct. 2011

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais English

RÉSUMÉ

Discipline à la fois ancienne de par son histoire et très jeune de par ses multiples évolutions au cours des dernières décennies, la reconnaissance des formes (RDF) a pour but de concevoir des outils automatiques informatiques capables de reconnaître des formes. La RDF a longtemps été considérée comme une composante du domaine de l’intelligence artificielle, donc de la production de robots possédant la capacité d’apprendre, de raisonner, mais aussi d’interagir avec le monde extérieur, donc de reconnaître les objets. Dans ce cadre, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.). Progressivement, elle a étendu son champ d’action à des cadres d’apprentissage, tels que la régression. Aujourd’hui, la RDF est devenue une discipline fondatrice du domaine de l’apprentissage automatique numérique aux côtés entre autres de l’algorithmique, la cryptographie, la logique, la physique statistique, les probabilités, les statistiques, la théorie de l'évolution.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Thierry ARTIERES : Professeur d'informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)

INTRODUCTION

Le but de la reconnaissance des formes est de concevoir des outils automatiques, informatiques, capables de reconnaître des formes, ou patterns en anglais (où l’on parle de pattern recognition). La reconnaissance des formes (RDF dans la suite) est un domaine qui a fortement évolué ces dernières décennies si bien que ses contours sont devenus aujourd'hui plus flous. Il n’est pas simple d’en trouver une définition dans laquelle tous les chercheurs en RDF se reconnaîtront.

Il s'agit d'une discipline ancienne, Bishop rapporte par ailleurs que c’est la collection systématique d’observations astronomiques par Tycho Braha au XVIe siècle qui a permis à Johann Kepler la découverte de lois empiriques sur le mouvement des planètes. On peut multiplier de tels exemples et remonter très loin dans notre passé.

Si l’on s’intéresse à l’histoire moderne de la RDF, disons depuis les années 1980, et à ses développements récents liés bien entendu au développement des machines informatiques, on constate qu’elle s’est tout d’abord attachée à l’automatisation de tâches perceptives. Une des applications phares du domaine fut la reconnaissance de l’écriture, qui reste un champ d’application et de recherche actif aujourd’hui. Au-delà, la vision, à travers la reconnaissance d’objets dans des images, mais également l’audition et la reconnaissance automatique de la parole sont des applications emblématiques et historiques de la reconnaissance des formes.

C’est une des raisons pour laquelle la reconnaissance des formes a longtemps été considérée comme une composante du domaine plus vaste, et également fortement pluridisciplinaire, de l’intelligence artificielle (IA), dont un but ultime pourrait être de produire des robots doués d’intelligence, capables non seulement d’apprendre et de raisonner mais également d’interagir y compris physiquement avec le monde extérieur, donc de se mouvoir, de reconnaître leurs interlocuteurs et les objets d’une pièce, de parler, d’entendre, de comprendre, raisonner, etc. Dans ce schéma, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.) à partir de senseurs sur le monde extérieur.

Progressivement, la RDF s’est émancipée de la tutelle de l’IA. En s’intéressant à des formes ou des patterns quelconques elle a permis d’aborder d’autres tâches de classification et a été étendue à d’autres cadres d’apprentissage supervisés tels que la régression. Aujourd’hui la RDF est une discipline fondatrice du domaine de l’apprentissage automatique (machine learning en anglais), avec d’autres telles que l’algorithmique, la complexité, la cryptographie, la logique, l’optimisation, la physique statistique, les probabilités, les sciences cognitives, les statistiques, la théorie de l'évolution, etc.

L’histoire moderne de la reconnaissance des formes est donc mouvementée, il s’agit finalement d’une discipline jeune qui a déjà subi de multiples influences et cheminements et dont le spectre d’applications et de techniques a crû au sein de ce que l’on nomme aujourd’hui l’apprentissage automatique numérique. Cette présentation se veut une introduction au domaine et ne peut être considérée comme exhaustive. Elle vise essentiellement à introduire les problématiques fondamentales mises en jeu ainsi que les concepts essentiels à la compréhension des techniques. Le lecteur intéressé pourra avantageusement consulter des livres de référence tels que .

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-af1510


Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Version en anglais English

4. Méthodes basées sur les distances et le voisinage

Nous examinons ici une première famille de méthodes, intuitives et performantes, basées sur la notion de distance entre formes. Nous étudions successivement une méthode de classification et une méthode de partitionnement toutes deux basées sur cette idée.

Parmi la multitude de méthodes de RDF, la méthode de classification par le plus proche voisin et son extension immédiate la méthode des K plus proches voisins tiennent une place à part. Elles sont à la fois naturelles et justifiées par certains résultats théoriques. Nous en décrivons tout d’abord le principe puis nous en donnons certaines propriétés.

Enfin nous abordons le cadre du partitionnement et décrivons une méthode usuelle de partitionnement basée sur la notion de distance, l’algorithme des K-Moyennes.

4.1 Classification par le plus proche voisin

HAUT DE PAGE

4.1.1 Principe

  • Méthode du plus proche voisin

    Imaginons que l’on cherche à mettre au point un système capable de reconnaître un caractère manuscrit écrit dans une imagette. Imaginons également que l’on dispose d’une collection d’imagettes d’ores et déjà annotées, c'est-à-dire que l’on sait quel caractère est représenté sur chacune de ces imagettes. Nous notons cet ensemble de données B = {(xi , yi ) i=1…N }.

    En présence d’une nouvelle imagette x, non annotée, on peut exploiter une règle très simple qui consiste à considérer l’imagette xi* de B la plus proche de x, et de décider que le caractère représenté par l’imagette x est le même que celui représenté par l’imagette xi* ...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Méthodes basées sur les distances et le voisinage
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - BAKIR (G.H.), HOFMANN (T.), SCHOLKOPF (B.), SMOLA (A.J.), TASKAR (B.), VISHWANATHAN (S.V.N.) -   Predicting Structured Data  -  Gökhan H. Bakir, Thomas Hofmann, Bernhard Schölkopf,Alexander J. Smola, Ben Taskar and S. V. N. Vishwanathan Eds, The MIT Press (2007).

  • (2) - BILMES (J.) -   A Gentle Tutorial on the EM Algorithm Including Gaussian Mixturesand Baum-Welch  -  International computer science institute, ICSI Technical ReportTR-97-021, Université de Berkeley (May 1997).

  • (3) - BISHOP (C.) -   Pattern Recognition and Machine Learning (Information Science andStatistics)  -  Springer (October 1, 2007).

  • (4) - BUNKE (H.), SANFELIU (A.) -   Syntactic and strucral pattern recognition, theory and applications  -  H Bunke & A Sanfeliu eds., World Scientific Series in ComputerScience – Vol. 7 (1990).

  • (5) - DUDA (O.), HARDT (P.), STORK (G.) -   Pattern Classification  -  Wiley-Interscience ; 2 edition (October 2000).

  • ...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS