Décryptage

Numériser un livre, un jeu d’enfant !

Posté le 6 février 2013
par La rédaction
dans Informatique et Numérique

Alors qu’une polémique concernant le géant Google avait remis sur le devant de la scène la question de la numérisation des biens culturels et des livres, attardons-nous un peu sur l’une de ces machines, capable de numériser près de 250 pages par minute.

Parvenir à numériser plus de 250 pages par minute : la prouesse réalisée par le laboratoire Ishikawa Oku, situé au cœur de la capitale japonaise, a de quoi laisser pantois. Leur machine, baptisée de manière transparente « Book Flipping Scanning Auto » (BFS-Auto) est un petit bijou d’ingéniosité et de technologie. BFS-Auto est en effet capable de numériser en haute définition plus de 250 pages par minute, à partir du format original du livre ou du document, en trois étapes clés : faire défiler à grande vitesse et de manière entièrement automatique les pages du livre, reconnaissance en temps réel et en trois dimensions des pages qui défilent, et enfin restitution d’une image plane « standard », haute définition, à partir de l’image d’une page recourbée.

Faire défiler 250 pages par minute

Les chercheurs japonais derrière BFS-Auto ont dû relever deux défis de taille lors du développement du système de défilement automatique : concevoir un mécanisme ultra-rapide ne faisant pas obstruction à l’étape de numérisation, et garantir l’intégrité du document numérisé. Habituellement, le document que l’on souhaite numériser – prenons l’exemple d’un livre – est « altéré » par découpage. Les pages du livre sont donc généralement séparées de la tranche par souci de commodité, laissant le scanner numériser les pages une à une comme autant de feuilles volantes et de documents séparés, ce qui pose bien évidemment problème lorsqu’on souhaite conserver l’intégrité d’un livre fragile, rare ou précieux. Pourtant, les cerveaux du laboratoire Ishikawa Oku ont réussi à surmonter la difficulté avec brio, sans toutefois révéler les détails techniques du système de défilement automatique. Il est néanmoins possible de se faire une idée en regardant la vidéo qui suit :

 

 

Une numérisation ultra-rapide et haute définition

La deuxième étape clé est celle de la numérisation 3D haute définition des pages défilant à grande vitesse. Le système utilisé par BFS-Auto suit la déformation en trois dimensions de chacune des pages tournées, à raison de 500 fois par seconde, et utilise en temps-réel un algorithme spécialement conçu pour déterminer le meilleur moment pour une numérisation optimale. Au moment choisi, les deux appareils prennent chacun une photo de l’une des deux pages du livre grand ouvert, en haute définition (près de 400 ppi), sans manquer la moindre page et au même rythme que le défilement de celles-ci.

Restitution d’une page plane à partir d’une page recourbée

Enfin, troisième et dernier élément clé : la restitution d’une page plane à partir de la photo d’une page courbée. Le poulain du laboratoire tokyoïte possède un programme capable d’aplanir l’image déformée de chaque page, transformation également effectuée en temps réel. Chaque page est en conséquence numérisée sous sa forme « plane ». Prochaine étape, doter cette machine d’un logiciel de Reconnaissance Optique de Caractères (ROC), permettant de décrypter une image de texte imprimé ou dactylographié afin de la convertir en fichier texte ?

 

Par Moonzur Rahman

 

Découvrez les formations Techniques de l’Ingénieur :