Présentation
En anglaisRÉSUMÉ
L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe de savoir analyser. Les métadonnées « électroniques » sont des informations sur des objets numériques qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes ».
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
The beginning of the twenty-first century coincides with an unprecedented increase in the volume of digital data which requires analyzing."Electronic" metadata is information on digital data which describes the content of these objects as well as their structure, context or access conditions. Although metadata can facilitate access to certain documents, the use of ontologies which allow for organizing and structuring knowledge has become essential in order to obtain "more intelligent" information.
Auteur(s)
-
Hélène RICHY : Maître de conférences, université de Rennes-1
-
Sylvie DESPRÉS : Maître de conférences, université Paris-Nord
INTRODUCTION
L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques. Cette surabondance d'informations nécessite de disposer de nouvelles méthodes, de nouveaux modèles capables d'extraire des informations d'un fatras de connaissances mal structurées.
Les métadonnées « électroniques » sont des informations sur des objets numériques (image, texte, son) qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées, utilisées abondamment par les professionnels de la documentation, peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes » et appliquées à certains domaines (juridique, médical, pédagogique, etc.).
Après quelques rappels sur l'usage traditionnel des métadonnées dans les archives patrimoniales et les bibliothèques, le recours aux métadonnées est analysé dans le contexte du Web. Une place importante est donnée à la description des technologies basées sur XML qui jouent un rôle fondamental, aussi bien pour décrire les informations que pour les traiter. Enfin, dans une dernière partie sont présentées les nouvelles solutions visant à rendre les métadonnées compréhensibles par les machines, notamment les perspectives offertes par l'usage des ontologies.
VERSIONS
- Version archivée 1 de mai 2002 par Hélène RICHY
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Représentation et traitement des documents numériques > Métadonnées, ontologies et documents numériques > Description des ressources sur le Web
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Description des ressources sur le Web
Sans entrer dans une description détaillée du Web, il peut être utile, pour la compréhension de ce qui suit, de rappeler le fonctionnement du Web. Le Web peut être vu comme un réseau permettant des échanges d'information basés sur :
-
un mécanisme d'identification des ressources (les URI) : une « ressource » désigne tout ou partie d'une page Web, qu'il s'agisse de texte, d'image ou de son ;
-
des formats de représentation des ressources (XHTML, XML) et de codage (Unicode) : l'universalité du Web, ouvert à toutes les langues, toutes les cultures, impose de supporter différents codages de caractères, ce qui conduit à adopter le codage Unicode ;
-
un mécanisme d'échange des ressources : plusieurs protocoles de communication sont utilisables, selon qu'il s'agit d'échanger des documents HTML (HTTP : HypertText Transfer Protocol), des fichiers (FTP : File Transfer Protocol) ou des messages (SMTP : Simple Mail Transfer Protocol).
Le Web offre des facilités d'échange de documents multimédias, intégrant le texte, l'image ou le son. Cette situation conduit à développer des systèmes de conversion numérique de l'information pour diffuser toutes sortes de documents numériques par ce canal. De nombreuses campagnes de numérisation du patrimoine sont en cours, dans le monde entier. Mais la situation n'est pas tout à fait aussi idyllique qu'il y paraît : une harmonisation entre les différents systèmes d'identification des ressources et de métadonnées reste une priorité pour répondre aux besoins de cette vaste diffusion des connaissances. Afin de pouvoir partager les informations, les ressources doivent pouvoir être clairement identifiées. Le W3C préconise donc pour le Web sémantique d'utiliser un mode de désignation qui garantisse l'unicité de la ressource et sa qualité, et qui permette d'agréger des métadonnés s'y référant.
Avant d'envisager les nouvelles applications favorisées par cette initiative, nous allons rappeler comment fonctionne la désignation des ressources et analyser quel est l'apport de RDF pour la description de ces ressources.
2.1 Identification d'une ressource
La désignation...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Description des ressources sur le Web
DANS NOS BASES DOCUMENTAIRES
-
A Translation Approach to Portable Ontology Specifications
-
Knowledge Engineering : Principles and Methods
-
The CIDOC CRM, an Ontological Approach to Schema Heterogeneity
-
Ontological Engineering with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web
-
*...
NORMES
-
Information et documentation. Format pour l'échange d'information. (MARC) - ISO 2709:1996 - 8-96
-
Traitement de l'information. Systèmes bureautiques. Langage normalisé de balisage généralisé (SGML) (rectificatifs en 1996 et 1999) - ISO 8879:1986 - 10-86
-
Systèmes de transfert des informations et données spatiales. Système ouvert d'archivage d'information. Modèle de référence (OAI-PMH) - ISO 14721:2003 - 3-03
-
Technologies de l'information. Interface de description de contenu multimédia. Partie 6 : logiciel de référence (MPEG-7) - ISO/CEI 15938-6:2003 - 7-03
-
Information et documentation. Une ontologie de référence pour l'échange d'informations sur l'héritage culturel - ISO 21127:2006 - 9-06
-
Uniform Resource Identifier (URI) : Generic Syntax - IETF RFC 3986 - 1-05
ANNEXES
American Memory http://memory.loc.gov/ammem/
DAML http://www.daml.org
DC, Dublin Core Metadata Initiative http://dublincore.org/
DC, Dublin Core, Tools http://dublincore.org/groups/tools/
DocBook http://www.docbook.org/
DOI, Digital Object Identifier http://www.doi.org/
EAD, Encoded Archival Description http://www.loc.gov/ead/
Gallica, la bibliothèque numérique de la Bibliothèque nationale de France http://gallica.bnf.fr/
HAL, Hyper Article en Ligne http://hal.archives-ouvertes.fr
Handle, CNRI Handle System http://www.handle.net/
IETF, Internet Engineering Task Force http://www.ietf.org
LC, The Library of Congress http://www.loc.gov/
MARC, Machine Readable Cataloging http://www.loc.gov/standards/
METS, Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets
MICHAEL, inventaire multilingue du patrimoine culturel européen http://www.michael-culture.org/
OAI, Open Archives Initiative http://www.openarchives.org/
OCLC, Online Computer Library Center http://www.oclc.org/
PURL, Persistent Uniform Ressource Locator http://purl.net
SCULPTEUR http://www.sculpteurweb.org
SIMILE http://simile.mit.edu
TEI, Text Encoding lnitiative http://www.tei-c.org/
UNICODE, Universal Character enCoding http://www.unicode.org/
W3C, World Wide Web Consortium http://www.w3.org/
WebOut Working Group http://www.w3.org/2001/sw/WebOnt/
...Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive