Présentation
RÉSUMÉ
L'indexation consiste à caractériser le contenu d'un document et l'information qu'il détient de manière à le retrouver quand on effectue des recherches sur l'un des sujets dont il traite. Mais que devient-elle quand d'une part on la met en œuvre sur des documents informatisés ou électroniques, et d'autre part quand on considère des contenus non textuels comme les vidéos ou les sons ? Outils techniques pour la sémantique, instruments pour l'interprétation et la recherche, les techniques d'indexation sont au croisement de l'informatique et de l'information, de la modélisation logico-mathématique et de l'interprétation linguistique et sémiotique.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Indexing consists in characterizing the content of a document and the information it contains in order to be able to find it when carrying out research on one of the subject matters it deals with. However, what becomes of it when it is implemented on computerized or electronic documents or when the contents are not textual such as videos or sounds? Technical tools for semantics, instruments for interpretation and research, indexing techniques are at the crossing of computing and information as well as at that of logico-mathematical modeling and linguistic and semiotic interpretation.
Auteur(s)
-
Bruno BACHIMONT : Ingénieur civil des Mines, docteur en informatique et en épistémologie, HDR, Directeur à la recherche, - Université de technologie de Compiègne (UTC) - Directeur scientifique, Institut national de l'audiovisuel (INA)
INTRODUCTION
L'indexation n'est traditionnellement pas un sujet relevant de l'ingénierie et s'adressant à un public formé aux technologies issues des sciences de la nature auxquelles sont rompus les ingénieurs. Pratique documentaire et bibliothécaire, l'indexation relève avant tout d'un travail sur le contenu, où l'interprétation et le discernement sont la clé pour représenter un document de manière à pouvoir le retrouver.
En effet, l'indexation est cette technique consistant à caractériser le contenu d'un document et l'information qu'il détient de manière à le retrouver quand on effectue des recherches sur l'un des sujets dont il traite. La difficulté est donc de savoir caractériser et représenter l'information documentaire pour qu'il soit aisé de la mettre en rapport avec des sujets d'investigation. Mise en rapport d'une requête et d'un contenu représenté et synthétisé, l'indexation permet de s'orienter dans la masse des documents et d'organiser ses connaissances. L'indexation appartient donc à ce qu'on appelle depuis quelques années les techniques intellectuelles Indexation et archivage de contenus multimédias[1] Indexation et archivage de contenus multimédias[2] Indexation et archivage de contenus multimédias[3].
L'indexation est un besoin ancien mais une pratique récente thématisée par des disciplines jeunes, la documentation et la bibliothéconomie. Élaborée ces deux derniers siècles (au XXe siècle en ce qui concerne la documentation), l'indexation a concerné de manière privilégiée les contenus textuels et c'est sur ce type de contenu qu'elle a mis au point ses procédés, élaboré ses concepts et fourbi ses méthodes.
L'objet de cet article est de rendre compte de ce que devient l'indexation quand d'une part on la met en œuvre sur des documents informatisés ou électroniques, et d'autre part quand on considère des contenus non textuels comme les vidéos ou les sons. Même si on a pratiqué de longue date l'indexation des documents non textuels sur des supports analogiques comme les photographies, les films, les dessins et autres schémas, l'introduction des techniques numériques a profondément modifié l'indexation qui est ainsi devenue « recherche d'information » et permis d'élaborer un nouveau paradigme, « l'indexation fine des contenus » ou « l'indexation par le contenu ».
Si bien qu'aujourd'hui, l'indexation est à la fois un sujet pour les ingénieurs et pour les documentalistes ou bibliothécaires. Abordée depuis les techniques informatiques et mathématiques, ou selon des principes documentaires et interprétatifs, l'indexation peut revêtir des allures fort différentes. L'objectif de cet article n'est pas de répéter ce qui est déjà connu et publié sur le thème de la recherche d'information. Son objectif est bien plutôt de montrer l'enjeu de l'indexation documentaire quand il s'agit de contenus électroniques non textuels pour expliquer aux ingénieurs, lecteurs traditionnels de ces publications, les difficultés qu'ils rencontreront tant au niveau des objets qu'ils auront à manipuler qu'au niveau des personnes avec lesquelles ils auront à collaborer. Outils techniques pour la sémantique, instruments pour l'interprétation et la recherche, les techniques d'indexation sont au croisement de l'informatique et de l'information, de la modélisation logico-mathématique et de l'interprétation linguistique et sémiotique. Nous nous attacherons donc à décrire les concepts nécessaires à la compréhension de ces techniques, pour que leur utilisation par les ingénieurs soit au bénéfice du contenu des documents et des pratiques documentaires.
Cet article adopte le plan suivant. Après avoir redéfini la notion de document et caractérisé les difficultés propres aux contenus audiovisuels et sonores, nous présentons la problématique de l'indexation. Nous la situons de manière précise vis-à-vis de ses voisines, à savoir l'archivage d'une part, le catalogage d'autre part. En effet, alors que l'archivage s'intéresse à la préservation des supports et des contenus, la bibliothéconomie fait l'inventaire et le catalogue des contenus pour que finalement la documentation les indexe en considérant les documents comme source d'information, en fonction de ce qu'ils signifient. Ces trois niveaux sont souvent confondus et restent confus pour la plupart alors qu'ils sont distincts même s'ils sont complémentaires et tous trois indispensables.
Nous poursuivons en montrant combien la mutation numérique a permis de reconsidérer l'indexation des contenus audiovisuels et sonores, notamment en permettant le passage d'une indexation documentaire traditionnelle à une indexation fine du contenu. Nous évoquons les principales techniques utilisées en donnant davantage un point de vue d'utilisateur qu'un point de vue de concepteur.
Enfin, nous abordons notre dernière section consacrée à l'archivage, en revenant sur les principaux enjeux de l'archivage multimédia. Nous verrons en effet que si le numérique est souvent apparu ces dernières années comme une solution permettant d'aborder la conservation des contenus analogiques, il est désormais davantage considéré pour les problèmes qu'il pose. Nous conclurons donc sur une discipline émergente, la préservation numérique dont le volet théorique est assuré par l'archivistique numérique.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Conclusion
L'archivage et l'indexation des contenus multimédias se sont banalisés ces dernières années du fait de la prolifération des contenus et de la diversification des acteurs. Mais si de plus en plus de personnes se posent la question, et si de plus en plus de contenus se trouvent concernés, cela n'implique pas que les problèmes liés à l'archivage et à l'indexation aient été résolus. On a tout au plus pris conscience de leur difficulté et de leur importance.
On peut aborder ces tâches de deux manières : en fonction de la finalité poursuivie, pour avoir une compréhension globale des solutions à mettre en œuvre, en fonction des techniques qu'on peut mobiliser au sein de ces solutions. Nous avons choisi la première approche : notre propos n'était pas en effet de faire le catalogue des principes techniques des algorithmes d'extraction du contenu, ou des formats d'archivage, sujets qu'on trouvera traités dans les articles consacrés par exemple à l'indexation automatique ou aux formats audiovisuels.
Or, ce que l'approche choisie permet de montrer, c'est la nécessité de prendre en compte le contexte culturel et organisationnel des projets d'archivage et d'indexation dans la mesure où l'on a affaire à des contenus. La réussite de ces projets et la pertinence des choix opérés en dépendent.
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Conclusion
BIBLIOGRAPHIE
-
(1) - LÉVY (P.) - Les technologies de l'intelligence, l'avenir de la pensée à l'ère de l'informatique. - La Découverte (1990).
-
(2) - STIEGLER (B.) - Philosopher par accident ; Entretiens avec Elie Düring. - Galilée (2004).
-
(3) - DEBRAY (R.) - Introduction à la médiologie. - PUF (2000).
-
(4) - BACHIMONT (B.) - Système numérique et documentation des contenus audiovisuels. - Dossiers de l'Audiovisuel, 83 (Métiers de l'audiovisuel et numérique : évolution ou révolution ?) (1999).
-
(5) - ROUSSEAU (J.-Y.), COUTURE (C.) - Les fondements de la discipline archivistique. - Presses Universitaires du Québec (1994).
-
(6) - COEURÉ (S.), DUCLERT (V.) - Les archives - . La Découverte, Collection Repères...
ANNEXES
Loi no 2006-961 du 1er août 2006 relative aux droits d'auteur et aux droits voisins dans la société de l'information.
HAUT DE PAGE
Institut national de l'audiovisuel http://www.ina.fr/
Union européenne de radio-télévision (UER) http://www.ebu.ch/
Internet Archive http://www.archive.org/
HAUT DE PAGECet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive