Présentation

Article

1 - DU CATALOGAGE AUX MÉTADONNÉES

2 - DESCRIPTION DES RESSOURCES SUR LE WEB

3 - ONTOLOGIES

4 - CONCLUSION

Article de référence | Réf : H7155 v2

Description des ressources sur le Web
Métadonnées, ontologies et documents numériques

Auteur(s) : Hélène RICHY, Sylvie DESPRÉS

Date de publication : 10 nov. 2007

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais En anglais

RÉSUMÉ

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe de savoir analyser. Les métadonnées « électroniques » sont des informations sur des objets numériques qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes ».

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

The beginning of the twenty-first century coincides with an unprecedented increase in the volume of digital data which requires analyzing."Electronic" metadata is information on digital data which describes the content of these objects as well as their structure, context or access conditions. Although metadata can facilitate access to certain documents, the use of ontologies which allow for organizing and structuring knowledge has become essential in order to obtain "more intelligent" information.

Auteur(s)

INTRODUCTION

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques. Cette surabondance d'informations nécessite de disposer de nouvelles méthodes, de nouveaux modèles capables d'extraire des informations d'un fatras de connaissances mal structurées.

Les métadonnées « électroniques » sont des informations sur des objets numériques (image, texte, son) qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées, utilisées abondamment par les professionnels de la documentation, peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes » et appliquées à certains domaines (juridique, médical, pédagogique, etc.).

Après quelques rappels sur l'usage traditionnel des métadonnées dans les archives patrimoniales et les bibliothèques, le recours aux métadonnées est analysé dans le contexte du Web. Une place importante est donnée à la description des technologies basées sur XML qui jouent un rôle fondamental, aussi bien pour décrire les informations que pour les traiter. Enfin, dans une dernière partie sont présentées les nouvelles solutions visant à rendre les métadonnées compréhensibles par les machines, notamment les perspectives offertes par l'usage des ontologies.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h7155


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais En anglais

2. Description des ressources sur le Web

Sans entrer dans une description détaillée du Web, il peut être utile, pour la compréhension de ce qui suit, de rappeler le fonctionnement du Web. Le Web peut être vu comme un réseau permettant des échanges d'information basés sur :

  • un mécanisme d'identification des ressources (les URI) : une « ressource » désigne tout ou partie d'une page Web, qu'il s'agisse de texte, d'image ou de son ;

  • des formats de représentation des ressources (XHTML, XML) et de codage (Unicode) : l'universalité du Web, ouvert à toutes les langues, toutes les cultures, impose de supporter différents codages de caractères, ce qui conduit à adopter le codage Unicode ;

  • un mécanisme d'échange des ressources : plusieurs protocoles de communication sont utilisables, selon qu'il s'agit d'échanger des documents HTML (HTTP : HypertText Transfer Protocol), des fichiers (FTP : File Transfer Protocol) ou des messages (SMTP : Simple Mail Transfer Protocol).

Le Web offre des facilités d'échange de documents multimédias, intégrant le texte, l'image ou le son. Cette situation conduit à développer des systèmes de conversion numérique de l'information pour diffuser toutes sortes de documents numériques par ce canal. De nombreuses campagnes de numérisation du patrimoine sont en cours, dans le monde entier. Mais la situation n'est pas tout à fait aussi idyllique qu'il y paraît : une harmonisation entre les différents systèmes d'identification des ressources et de métadonnées reste une priorité pour répondre aux besoins de cette vaste diffusion des connaissances. Afin de pouvoir partager les informations, les ressources doivent pouvoir être clairement identifiées. Le W3C préconise donc pour le Web sémantique d'utiliser un mode de désignation qui garantisse l'unicité de la ressource et sa qualité, et qui permette d'agréger des métadonnés s'y référant.

Avant d'envisager les nouvelles applications favorisées par cette initiative, nous allons rappeler comment fonctionne la désignation des ressources et analyser quel est l'apport de RDF pour la description de ces ressources.

2.1 Identification d'une ressource

HAUT DE PAGE

2.1.1 Localisation

La désignation...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Description des ressources sur le Web
Sommaire
Sommaire

DANS NOS BASES DOCUMENTAIRES

NORMES

  • Information et documentation. Format pour l'échange d'information. (MARC) - ISO 2709:1996 - 8-96

  • Traitement de l'information. Systèmes bureautiques. Langage normalisé de balisage généralisé (SGML) (rectificatifs en 1996 et 1999) - ISO 8879:1986 - 10-86

  • Systèmes de transfert des informations et données spatiales. Système ouvert d'archivage d'information. Modèle de référence (OAI-PMH) - ISO 14721:2003 - 3-03

  • Technologies de l'information. Interface de description de contenu multimédia. Partie 6 : logiciel de référence (MPEG-7) - ISO/CEI 15938-6:2003 - 7-03

  • Information et documentation. Une ontologie de référence pour l'échange d'informations sur l'héritage culturel - ISO 21127:2006 - 9-06

  • Uniform Resource Identifier (URI) : Generic Syntax - IETF RFC 3986 - 1-05

ANNEXES

  1. 1 Organismes

    1 Organismes

    American Memory http://memory.loc.gov/ammem/

    DAML http://www.daml.org

    DC, Dublin Core Metadata Initiative http://dublincore.org/

    DC, Dublin Core, Tools http://dublincore.org/groups/tools/

    DocBook http://www.docbook.org/

    DOI, Digital Object Identifier http://www.doi.org/

    EAD, Encoded Archival Description http://www.loc.gov/ead/

    Gallica, la bibliothèque numérique de la Bibliothèque nationale de France http://gallica.bnf.fr/

    HAL, Hyper Article en Ligne http://hal.archives-ouvertes.fr

    Handle, CNRI Handle System http://www.handle.net/

    IETF, Internet Engineering Task Force http://www.ietf.org

    LC, The Library of Congress http://www.loc.gov/

    MARC, Machine Readable Cataloging http://www.loc.gov/standards/

    METS, Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets

    MICHAEL, inventaire multilingue du patrimoine culturel européen http://www.michael-culture.org/

    OAI, Open Archives Initiative http://www.openarchives.org/

    OCLC, Online Computer Library Center http://www.oclc.org/

    PURL, Persistent Uniform Ressource Locator http://purl.net

    SCULPTEUR http://www.sculpteurweb.org

    SIMILE http://simile.mit.edu

    TEI, Text Encoding lnitiative http://www.tei-c.org/

    UNICODE, Universal Character enCoding http://www.unicode.org/

    W3C, World Wide Web Consortium http://www.w3.org/

    WebOut Working Group http://www.w3.org/2001/sw/WebOnt/

    ...

    Cet article est réservé aux abonnés.
    Il vous reste 93% à découvrir.

    Pour explorer cet article
    Téléchargez l'extrait gratuit

    Vous êtes déjà abonné ?Connectez-vous !


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Cet article fait partie de l’offre

    Documents numériques Gestion de contenu

    (76 articles en ce moment)

    Cette offre vous donne accès à :

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques

    Des services

    Un ensemble d'outils exclusifs en complément des ressources

    Un Parcours Pratique

    Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

    Doc & Quiz

    Des articles interactifs avec des quiz, pour une lecture constructive

    ABONNEZ-VOUS