Présentation
En anglaisRÉSUMÉ
L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe de savoir analyser. Les métadonnées « électroniques » sont des informations sur des objets numériques qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes ».
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
The beginning of the twenty-first century coincides with an unprecedented increase in the volume of digital data which requires analyzing."Electronic" metadata is information on digital data which describes the content of these objects as well as their structure, context or access conditions. Although metadata can facilitate access to certain documents, the use of ontologies which allow for organizing and structuring knowledge has become essential in order to obtain "more intelligent" information.
Auteur(s)
-
Hélène RICHY : Maître de conférences, université de Rennes-1
-
Sylvie DESPRÉS : Maître de conférences, université Paris-Nord
INTRODUCTION
L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques. Cette surabondance d'informations nécessite de disposer de nouvelles méthodes, de nouveaux modèles capables d'extraire des informations d'un fatras de connaissances mal structurées.
Les métadonnées « électroniques » sont des informations sur des objets numériques (image, texte, son) qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées, utilisées abondamment par les professionnels de la documentation, peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes » et appliquées à certains domaines (juridique, médical, pédagogique, etc.).
Après quelques rappels sur l'usage traditionnel des métadonnées dans les archives patrimoniales et les bibliothèques, le recours aux métadonnées est analysé dans le contexte du Web. Une place importante est donnée à la description des technologies basées sur XML qui jouent un rôle fondamental, aussi bien pour décrire les informations que pour les traiter. Enfin, dans une dernière partie sont présentées les nouvelles solutions visant à rendre les métadonnées compréhensibles par les machines, notamment les perspectives offertes par l'usage des ontologies.
VERSIONS
- Version archivée 1 de mai 2002 par Hélène RICHY
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Représentation et traitement des documents numériques > Métadonnées, ontologies et documents numériques > Du catalogage aux métadonnées
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Du catalogage aux métadonnées
Préambule
Le mot « Web » peut être considéré comme intégré à la langue française, nous l'utiliserons donc de préférence au terme « toile », choisi par les Québécois. Le terme « métadonnées » est utilisé pour désigner toutes les informations, tous les renseignements qui peuvent être associés à une ressource réelle ou virtuelle (œuvre littéraire ou artistique, image, film, page Web...).
1.1 Qu'est-ce que le concept de métadonnées ?
Le concept de métadonnées a évolué avec l'utilisation de l'Internet. Elles étaient initialement limitées aux informations d'archivage, permettant de retrouver un ouvrage ou un document dans une bibliothèque ou un service d'archives. Les métadonnées peuvent aussi répondre à d'autres objectifs : savoir quel usage peut être fait d'un ouvrage ou découvrir ce que contient effectivement une ressource.
Avec l'informatisation de la gestion des établissements publics ou commerciaux, les métadonnées ne sont plus seulement utilisées pour retrouver un ouvrage ou un enregistrement sonore, mais aussi pour stocker d'autres informations, invisibles au lecteur : l'état du stock, le nombre d'emprunts ou le prix d'achat par exemple. En particulier, lorsqu'il s'agit de documents à diffusion limitée, des métadonnées peuvent être pertinentes pour la sécurité ou la fiabilité des informations.
HAUT DE PAGE1.1.1 Comment trouver une information ?
On peut considérer qu'il y a actuellement des millions de pages accessibles par leur adresse sur le Web. Cette adresse joue le rôle d'un numéro de référence dans une gigantesque bibliothèque. Mais, pour connaître les adresses des pages cherchées, il faut généralement interroger les sites qui proposent des moteurs de recherche, tels que Exalead, Google, Lycos ou Yahoo. Ces sites utilisent un robot qui recherche sur tout l'Internet, regardant le contenu des documents à la place du lecteur.
La plupart des moteurs de recherche ignorent les métadonnées. Ils se contentent généralement d'examiner le texte contenu dans le titre, l'adresse, l'en-tête ou le début d'un document...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Du catalogage aux métadonnées
DANS NOS BASES DOCUMENTAIRES
-
A Translation Approach to Portable Ontology Specifications
-
Knowledge Engineering : Principles and Methods
-
The CIDOC CRM, an Ontological Approach to Schema Heterogeneity
-
Ontological Engineering with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web
-
*...
NORMES
-
Information et documentation. Format pour l'échange d'information. (MARC) - ISO 2709:1996 - 8-96
-
Traitement de l'information. Systèmes bureautiques. Langage normalisé de balisage généralisé (SGML) (rectificatifs en 1996 et 1999) - ISO 8879:1986 - 10-86
-
Systèmes de transfert des informations et données spatiales. Système ouvert d'archivage d'information. Modèle de référence (OAI-PMH) - ISO 14721:2003 - 3-03
-
Technologies de l'information. Interface de description de contenu multimédia. Partie 6 : logiciel de référence (MPEG-7) - ISO/CEI 15938-6:2003 - 7-03
-
Information et documentation. Une ontologie de référence pour l'échange d'informations sur l'héritage culturel - ISO 21127:2006 - 9-06
-
Uniform Resource Identifier (URI) : Generic Syntax - IETF RFC 3986 - 1-05
ANNEXES
American Memory http://memory.loc.gov/ammem/
DAML http://www.daml.org
DC, Dublin Core Metadata Initiative http://dublincore.org/
DC, Dublin Core, Tools http://dublincore.org/groups/tools/
DocBook http://www.docbook.org/
DOI, Digital Object Identifier http://www.doi.org/
EAD, Encoded Archival Description http://www.loc.gov/ead/
Gallica, la bibliothèque numérique de la Bibliothèque nationale de France http://gallica.bnf.fr/
HAL, Hyper Article en Ligne http://hal.archives-ouvertes.fr
Handle, CNRI Handle System http://www.handle.net/
IETF, Internet Engineering Task Force http://www.ietf.org
LC, The Library of Congress http://www.loc.gov/
MARC, Machine Readable Cataloging http://www.loc.gov/standards/
METS, Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets
MICHAEL, inventaire multilingue du patrimoine culturel européen http://www.michael-culture.org/
OAI, Open Archives Initiative http://www.openarchives.org/
OCLC, Online Computer Library Center http://www.oclc.org/
PURL, Persistent Uniform Ressource Locator http://purl.net
SCULPTEUR http://www.sculpteurweb.org
SIMILE http://simile.mit.edu
TEI, Text Encoding lnitiative http://www.tei-c.org/
UNICODE, Universal Character enCoding http://www.unicode.org/
W3C, World Wide Web Consortium http://www.w3.org/
WebOut Working Group http://www.w3.org/2001/sw/WebOnt/
...Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive