Présentation
Auteur(s)
-
Jean-Pierre CRETTEZ : CNRS URA 820, Département Images, ENST Paris
-
Guy LORETTE : IRISA, CNRS UPRES-A 6074, Université de Rennes 1
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Malgré le développement accéléré des modes de communication, l’écriture manuscrite constitue toujours un lien étroit et privilégié entre les êtres humains, leur permettant d’échanger de façon naturelle des sentiments, des informations, des idées. De manière plus prosaïque, elle relie les citoyens à leur administration, les clients à leur organisme bancaire, les consommateurs aux sociétés de distribution. Son importance peut être évaluée de façon permanente, par le volume du courrier manuscrit acheminé chaque jour par la Poste, par le nombre de formulaires de l’URSSAF, de feuilles de déclaration d’impôts, etc.
La reconnaissance et l’interprétation de l’écriture manuscrite sont des techniques relativement récentes, qui s’inscrivent dans le cadre général de la communication écrite homme-machine (figure 1).
La lecture automatique de l’écriture manuscrite présente un intérêt indéniable dans l’accomplissement des tâches fastidieuses comme celles que l’on rencontre dans certains domaines : le tri postal, la lecture de chèques bancaires, la lecture des bordereaux, des bons de commande, des feuilles de déclaration... Elle offre aujourd’hui un surcroît d’intérêt avec le développement des nouvelles méthodes permettant de communiquer directement avec la machine de manière plus naturelle, grâce à l’essor des agendas, des blocs-notes électroniques et des ordinateurs sans clavier.
A priori, on pourrait concevoir la reconnaissance du manuscrit comme une émanation de la reconnaissance de l’écriture imprimée ou dactylographiée, pour laquelle les principaux obstacles semblent avoir été surmontés. Mais le passage de la reconnaissance de l’imprimé à celle du manuscrit n’est pas aussi évident que certains avaient pu le supposer initialement. Sa mise en œuvre est beaucoup plus complexe. Les difficultés rencontrées proviennent principalement de la nature même de l’écriture manuscrite, de son caractère cursif et de son extrême variabilité.
Cependant, malgré ces difficultés, la particularisation des problèmes à résoudre et la spécification des tâches à accomplir ont permis de parvenir aujourd’hui à un nombre de plus en plus important de réalisations tangibles.
VERSIONS
- Version courante de mai 2010 par Éric ANQUETIL
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Bases de données
Afin de pouvoir tester et évaluer les performances des logiciels développés, les chercheurs disposent maintenant de bases de données conséquentes qui comportent des milliers de caractères imprimés, manuscrits hors ligne et en ligne notamment les bases de données :
-
du SRTP (Service de recherche technique de la Poste, Nantes, France) ;
-
du CEDAR (Center of Excellence for Document Analysis and Recognition, State University of New York at Buffalo, États-Unis) ;
-
du CENPARMI (CENtre for PAttern Recognition and Machine Intelligence, Concordia University, Montréal, Canada) ;
-
de l’ETL (Electro Technical Laboratory, Tsukuba, Japon) ;
-
du NIST (National Institute of Standards and Technology, États-Unis) ;
-
de l’université d’Essex (Grande-Bretagne) ;
-
de la TUAT (Tokyo University of Agriculture and Technology) ;
-
de l’UW (université de Washington) ;
-
du projet international UNIPEN (benchmark pour les systèmes de reconnaissance en ligne), etc.
Toutefois certaines difficultés subsistent, qui sont liées notamment à la très grande quantité d’informations à gérer, à l’absence d’outils logiciels adaptés à l’utilisation de ces bases de données, aux problèmes suscités par le choix d’un type de format de données (ex. : UNIPEN et JOT, cf. Pour en savoir plus) ou d’un protocole de test et d’évaluation commun à tous. Ces problèmes sont actuellement en cours d’étude et en discussion dans les différentes équipes de recherche afin de rendre l’utilisation de ces bases de données totalement opérationnelle.
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Bases de données
ANNEXES
1 Produits existants et sites internet
-
Matériels
Une liste des scanners et des systèmes industrialisés de reconnaissance hors ligne de caractères est donnée par Impedovo .
Pour les tablettes d’acquisition d’écriture, on pourra consulter notamment les sites :
-
Pour les PDA (Personal Digital Assistant)
On pourra consulter les sites aux URL :
http://www.pcwebopaedia.com/PDA.htm
http://www.com1.fr/uk/products/pda/
http://www.yahoo.com/text/Business_and_Economy/Companies/Computers/ Hardware/PDAs
-
Pour les styles particuliers d’écriture en ligne, et des systèmes commercialisés de reconnaissance d’écriture manuscrite
« Allegro » et « Graffiti » on-line, on consultera :
La rubrique : « Pen & Mobile Computing »...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive