Présentation
RÉSUMÉ
L'indexation consiste à caractériser le contenu d'un document et l'information qu'il détient de manière à le retrouver quand on effectue des recherches sur l'un des sujets dont il traite. Mais que devient-elle quand d'une part on la met en œuvre sur des documents informatisés ou électroniques, et d'autre part quand on considère des contenus non textuels comme les vidéos ou les sons ? Outils techniques pour la sémantique, instruments pour l'interprétation et la recherche, les techniques d'indexation sont au croisement de l'informatique et de l'information, de la modélisation logico-mathématique et de l'interprétation linguistique et sémiotique.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Indexing consists in characterizing the content of a document and the information it contains in order to be able to find it when carrying out research on one of the subject matters it deals with. However, what becomes of it when it is implemented on computerized or electronic documents or when the contents are not textual such as videos or sounds? Technical tools for semantics, instruments for interpretation and research, indexing techniques are at the crossing of computing and information as well as at that of logico-mathematical modeling and linguistic and semiotic interpretation.
Auteur(s)
-
Bruno BACHIMONT : Ingénieur civil des Mines, docteur en informatique et en épistémologie, HDR, Directeur à la recherche, - Université de technologie de Compiègne (UTC) - Directeur scientifique, Institut national de l'audiovisuel (INA)
INTRODUCTION
L'indexation n'est traditionnellement pas un sujet relevant de l'ingénierie et s'adressant à un public formé aux technologies issues des sciences de la nature auxquelles sont rompus les ingénieurs. Pratique documentaire et bibliothécaire, l'indexation relève avant tout d'un travail sur le contenu, où l'interprétation et le discernement sont la clé pour représenter un document de manière à pouvoir le retrouver.
En effet, l'indexation est cette technique consistant à caractériser le contenu d'un document et l'information qu'il détient de manière à le retrouver quand on effectue des recherches sur l'un des sujets dont il traite. La difficulté est donc de savoir caractériser et représenter l'information documentaire pour qu'il soit aisé de la mettre en rapport avec des sujets d'investigation. Mise en rapport d'une requête et d'un contenu représenté et synthétisé, l'indexation permet de s'orienter dans la masse des documents et d'organiser ses connaissances. L'indexation appartient donc à ce qu'on appelle depuis quelques années les techniques intellectuelles Indexation et archivage de contenus multimédias[1] Indexation et archivage de contenus multimédias[2] Indexation et archivage de contenus multimédias[3].
L'indexation est un besoin ancien mais une pratique récente thématisée par des disciplines jeunes, la documentation et la bibliothéconomie. Élaborée ces deux derniers siècles (au XXe siècle en ce qui concerne la documentation), l'indexation a concerné de manière privilégiée les contenus textuels et c'est sur ce type de contenu qu'elle a mis au point ses procédés, élaboré ses concepts et fourbi ses méthodes.
L'objet de cet article est de rendre compte de ce que devient l'indexation quand d'une part on la met en œuvre sur des documents informatisés ou électroniques, et d'autre part quand on considère des contenus non textuels comme les vidéos ou les sons. Même si on a pratiqué de longue date l'indexation des documents non textuels sur des supports analogiques comme les photographies, les films, les dessins et autres schémas, l'introduction des techniques numériques a profondément modifié l'indexation qui est ainsi devenue « recherche d'information » et permis d'élaborer un nouveau paradigme, « l'indexation fine des contenus » ou « l'indexation par le contenu ».
Si bien qu'aujourd'hui, l'indexation est à la fois un sujet pour les ingénieurs et pour les documentalistes ou bibliothécaires. Abordée depuis les techniques informatiques et mathématiques, ou selon des principes documentaires et interprétatifs, l'indexation peut revêtir des allures fort différentes. L'objectif de cet article n'est pas de répéter ce qui est déjà connu et publié sur le thème de la recherche d'information. Son objectif est bien plutôt de montrer l'enjeu de l'indexation documentaire quand il s'agit de contenus électroniques non textuels pour expliquer aux ingénieurs, lecteurs traditionnels de ces publications, les difficultés qu'ils rencontreront tant au niveau des objets qu'ils auront à manipuler qu'au niveau des personnes avec lesquelles ils auront à collaborer. Outils techniques pour la sémantique, instruments pour l'interprétation et la recherche, les techniques d'indexation sont au croisement de l'informatique et de l'information, de la modélisation logico-mathématique et de l'interprétation linguistique et sémiotique. Nous nous attacherons donc à décrire les concepts nécessaires à la compréhension de ces techniques, pour que leur utilisation par les ingénieurs soit au bénéfice du contenu des documents et des pratiques documentaires.
Cet article adopte le plan suivant. Après avoir redéfini la notion de document et caractérisé les difficultés propres aux contenus audiovisuels et sonores, nous présentons la problématique de l'indexation. Nous la situons de manière précise vis-à-vis de ses voisines, à savoir l'archivage d'une part, le catalogage d'autre part. En effet, alors que l'archivage s'intéresse à la préservation des supports et des contenus, la bibliothéconomie fait l'inventaire et le catalogue des contenus pour que finalement la documentation les indexe en considérant les documents comme source d'information, en fonction de ce qu'ils signifient. Ces trois niveaux sont souvent confondus et restent confus pour la plupart alors qu'ils sont distincts même s'ils sont complémentaires et tous trois indispensables.
Nous poursuivons en montrant combien la mutation numérique a permis de reconsidérer l'indexation des contenus audiovisuels et sonores, notamment en permettant le passage d'une indexation documentaire traditionnelle à une indexation fine du contenu. Nous évoquons les principales techniques utilisées en donnant davantage un point de vue d'utilisateur qu'un point de vue de concepteur.
Enfin, nous abordons notre dernière section consacrée à l'archivage, en revenant sur les principaux enjeux de l'archivage multimédia. Nous verrons en effet que si le numérique est souvent apparu ces dernières années comme une solution permettant d'aborder la conservation des contenus analogiques, il est désormais davantage considéré pour les problèmes qu'il pose. Nous conclurons donc sur une discipline émergente, la préservation numérique dont le volet théorique est assuré par l'archivistique numérique.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Contenus multimédias et leur unité documentaire
1.1 Notion de document
La notion de document est délicate : familière à tous, elle se montre rétive devant toute définition. Plutôt que de tenter d'avoir une définition exacte et exhaustive, adoptons une caractérisation qui reprend les traits essentiels des documents, ceux que l'on veut que les traitements documentaires prennent en compte et préservent.
Un document peut se définir comme un contenu fixé sur un support matériel.
Analysons cette caractérisation. Un contenu est un objet matériel possédant une valeur culturelle. Il est matériel car il correspond à l'inscription d'une forme perceptive (visuelle, auditive) sur un objet matériel (papier, bande magnétique, support optique, etc.). Il est culturel car la forme perceptive s'interprète comme un message ou une communication, c'est-à-dire comme l'expression d'une intention de communication. Bref, un objet est un contenu car on considère que sa forme matérielle nous dit quelque chose.
Le support matériel correspond à n'importe quel support physique qui prête à la forme perceptive sa matérialité. On le trouve mobilisé dans toute communication, car nous ne pouvons entendre et percevoir que des contenus sensibles, c'est-à-dire matériellement perceptibles.
Il en résulte que la notion clé ici est celle de fixation, quand on dit que le contenu est fixé sur un support. Ce qui fait qu'on a affaire à un document et pas seulement à une expression mobilisée dans une communication, c'est que le contenu est fixé et devient stable et permanent grâce au support matériel. Il donne en effet au contenu sa pérennité et sa délimitation :
-
pérennité car le contenu dure aussi longtemps que dure son support. C'est d'ailleurs pourquoi l'essentiel des pratiques d'archivage consiste dans la préservation et la conservation des supports : si l'on prend soin du support, le contenu suivra ! Cela s'est traduit d'ailleurs par un principe, le principe de l'inhérence du contenu au support. Puisque le contenu est un objet matériel associé à un support physique, il lui est inhérent et il est impossible de le considérer indépendamment de ce support ;
-
délimitation, car le support permet d'assigner un début et une fin au contenu et de le considérer comme une entité différenciée de son contexte.
Cette caractérisation permet déjà de tirer quelques conclusions intéressantes :
- ...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Contenus multimédias et leur unité documentaire
BIBLIOGRAPHIE
-
(1) - LÉVY (P.) - Les technologies de l'intelligence, l'avenir de la pensée à l'ère de l'informatique. - La Découverte (1990).
-
(2) - STIEGLER (B.) - Philosopher par accident ; Entretiens avec Elie Düring. - Galilée (2004).
-
(3) - DEBRAY (R.) - Introduction à la médiologie. - PUF (2000).
-
(4) - BACHIMONT (B.) - Système numérique et documentation des contenus audiovisuels. - Dossiers de l'Audiovisuel, 83 (Métiers de l'audiovisuel et numérique : évolution ou révolution ?) (1999).
-
(5) - ROUSSEAU (J.-Y.), COUTURE (C.) - Les fondements de la discipline archivistique. - Presses Universitaires du Québec (1994).
-
(6) - COEURÉ (S.), DUCLERT (V.) - Les archives - . La Découverte, Collection Repères...
ANNEXES
Loi no 2006-961 du 1er août 2006 relative aux droits d'auteur et aux droits voisins dans la société de l'information.
HAUT DE PAGE
Institut national de l'audiovisuel http://www.ina.fr/
Union européenne de radio-télévision (UER) http://www.ebu.ch/
Internet Archive http://www.archive.org/
HAUT DE PAGECet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive