Présentation

Article

1 - THÉORIE DE LA DÉCISION BAYÉSIENNE

2 - ARCHITECTURE ET CONCEPTION D’UN SYSTÈME DE RDF

3 - APPRENTISSAGE À PARTIR DE DONNÉES

4 - MÉTHODES BASÉES SUR LES DISTANCES ET LE VOISINAGE

5 - APPROCHES GLOBALES POUR LA CLASSIFICATION

6 - APPROCHES SYNTAXIQUES ET STRUCTURELLES POUR LA CLASSIFICATION

7 - APPROCHE STRUCTURELLE VERSUS APPROCHE STATISTIQUE

8 - CONCLUSION ET PERSPECTIVES

Article de référence | Réf : AF1510 v1

Apprentissage à partir de données
Reconnaissance des formes

Auteur(s) : Thierry ARTIERES

Date de publication : 10 oct. 2011

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais English

RÉSUMÉ

Discipline à la fois ancienne de par son histoire et très jeune de par ses multiples évolutions au cours des dernières décennies, la reconnaissance des formes (RDF) a pour but de concevoir des outils automatiques informatiques capables de reconnaître des formes. La RDF a longtemps été considérée comme une composante du domaine de l’intelligence artificielle, donc de la production de robots possédant la capacité d’apprendre, de raisonner, mais aussi d’interagir avec le monde extérieur, donc de reconnaître les objets. Dans ce cadre, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.). Progressivement, elle a étendu son champ d’action à des cadres d’apprentissage, tels que la régression. Aujourd’hui, la RDF est devenue une discipline fondatrice du domaine de l’apprentissage automatique numérique aux côtés entre autres de l’algorithmique, la cryptographie, la logique, la physique statistique, les probabilités, les statistiques, la théorie de l'évolution.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Thierry ARTIERES : Professeur d'informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)

INTRODUCTION

Le but de la reconnaissance des formes est de concevoir des outils automatiques, informatiques, capables de reconnaître des formes, ou patterns en anglais (où l’on parle de pattern recognition). La reconnaissance des formes (RDF dans la suite) est un domaine qui a fortement évolué ces dernières décennies si bien que ses contours sont devenus aujourd'hui plus flous. Il n’est pas simple d’en trouver une définition dans laquelle tous les chercheurs en RDF se reconnaîtront.

Il s'agit d'une discipline ancienne, Bishop rapporte par ailleurs que c’est la collection systématique d’observations astronomiques par Tycho Braha au XVIe siècle qui a permis à Johann Kepler la découverte de lois empiriques sur le mouvement des planètes. On peut multiplier de tels exemples et remonter très loin dans notre passé.

Si l’on s’intéresse à l’histoire moderne de la RDF, disons depuis les années 1980, et à ses développements récents liés bien entendu au développement des machines informatiques, on constate qu’elle s’est tout d’abord attachée à l’automatisation de tâches perceptives. Une des applications phares du domaine fut la reconnaissance de l’écriture, qui reste un champ d’application et de recherche actif aujourd’hui. Au-delà, la vision, à travers la reconnaissance d’objets dans des images, mais également l’audition et la reconnaissance automatique de la parole sont des applications emblématiques et historiques de la reconnaissance des formes.

C’est une des raisons pour laquelle la reconnaissance des formes a longtemps été considérée comme une composante du domaine plus vaste, et également fortement pluridisciplinaire, de l’intelligence artificielle (IA), dont un but ultime pourrait être de produire des robots doués d’intelligence, capables non seulement d’apprendre et de raisonner mais également d’interagir y compris physiquement avec le monde extérieur, donc de se mouvoir, de reconnaître leurs interlocuteurs et les objets d’une pièce, de parler, d’entendre, de comprendre, raisonner, etc. Dans ce schéma, la RDF a eu initialement pour rôle de produire tous les algorithmes nécessaires à la perception abstraite de l’environnement (obstacles, individus, etc.) à partir de senseurs sur le monde extérieur.

Progressivement, la RDF s’est émancipée de la tutelle de l’IA. En s’intéressant à des formes ou des patterns quelconques elle a permis d’aborder d’autres tâches de classification et a été étendue à d’autres cadres d’apprentissage supervisés tels que la régression. Aujourd’hui la RDF est une discipline fondatrice du domaine de l’apprentissage automatique (machine learning en anglais), avec d’autres telles que l’algorithmique, la complexité, la cryptographie, la logique, l’optimisation, la physique statistique, les probabilités, les sciences cognitives, les statistiques, la théorie de l'évolution, etc.

L’histoire moderne de la reconnaissance des formes est donc mouvementée, il s’agit finalement d’une discipline jeune qui a déjà subi de multiples influences et cheminements et dont le spectre d’applications et de techniques a crû au sein de ce que l’on nomme aujourd’hui l’apprentissage automatique numérique. Cette présentation se veut une introduction au domaine et ne peut être considérée comme exhaustive. Elle vise essentiellement à introduire les problématiques fondamentales mises en jeu ainsi que les concepts essentiels à la compréhension des techniques. Le lecteur intéressé pourra avantageusement consulter des livres de référence tels que .

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-af1510


Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Version en anglais English

3. Apprentissage à partir de données

Les modules de RDF sont mis au point par des techniques d’apprentissage automatique. Nous distinguons ici deux cadres d’apprentissage correspondant à deux types de systèmes, le cadre de l’apprentissage supervisé et le cadre de l’apprentissage non supervisé (à noter que d’autres cadres existent, notamment le cadre semi-supervisé).

Nous présentons rapidement ces deux cadres puis détaillons les éléments nécessaires à l’apprentissage d’un module de classification (cadre supervisé) et d’un module de partitionnement (cadre non supervisé).

3.1 Cadre supervisé et non supervisé

L’apprentissage supervisé vise à concevoir un module capable d’apprendre une association entrée sortie à partir d’une collection d’exemples d’apprentissage sous forme de paires (entrée, sortie désirée). En présence d’une entrée (un stimulus particulier) on dispose d’une information de supervision (la sortie désirée) pour orienter l’apprentissage du module. Les deux applications les plus importantes de ce cadre sont la régression (la prédiction d’une variable réelle non observée en fonction d’autres variables réelles observées) et la classification qui diffère par la nature de la variable prédite, nominale.

À l’inverse, dans le cadre non supervisé, on ne dispose d’aucune information de supervision, on ne dispose dans la base d’apprentissage que de stimuli d’entrée. L’apprentissage a alors pour but de détecter des régularités dans ces données et de les partitionner en groupes homogènes. D’une certaine façon, le partitionnement a pour but conjoint de déterminer automatiquement les classes présentes dans les données et l’apprentissage du classifieur correspondant.

HAUT DE PAGE

3.2 Classification

Les algorithmes de classification automatique visent à concevoir des logiciels capables de reconnaître la classe d’un exemple à partir de l’observation de ses caractéristiques. Par exemple on reconnaît le caractère représenté par une image dont on connait la valeur de chacun des pixels, on reconnaît le mot prononcé à partir du signal sonore, etc.

Le module de classification (on parle de classifieur ou de...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Apprentissage à partir de données
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - BAKIR (G.H.), HOFMANN (T.), SCHOLKOPF (B.), SMOLA (A.J.), TASKAR (B.), VISHWANATHAN (S.V.N.) -   Predicting Structured Data  -  Gökhan H. Bakir, Thomas Hofmann, Bernhard Schölkopf,Alexander J. Smola, Ben Taskar and S. V. N. Vishwanathan Eds, The MIT Press (2007).

  • (2) - BILMES (J.) -   A Gentle Tutorial on the EM Algorithm Including Gaussian Mixturesand Baum-Welch  -  International computer science institute, ICSI Technical ReportTR-97-021, Université de Berkeley (May 1997).

  • (3) - BISHOP (C.) -   Pattern Recognition and Machine Learning (Information Science andStatistics)  -  Springer (October 1, 2007).

  • (4) - BUNKE (H.), SANFELIU (A.) -   Syntactic and strucral pattern recognition, theory and applications  -  H Bunke & A Sanfeliu eds., World Scientific Series in ComputerScience – Vol. 7 (1990).

  • (5) - DUDA (O.), HARDT (P.), STORK (G.) -   Pattern Classification  -  Wiley-Interscience ; 2 edition (October 2000).

  • ...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(167 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS