Présentation

Article

1 - ÉVOLUTION CONCEPTUELLE DES LANGAGES DOCUMENTAIRES

2 - CONTEXTE HISTORIQUE ET GÉNÉALOGIE DE L’XML

  • 2.1 - GML
  • 2.2 - SGML
  • 2.3 - HTML

3 - STRUCTURATION XML

4 - UNIVERSALITÉ XML : ESPACES DE NOMMAGE ET SCHÉMAS

5 - USAGES DU XML

6 - MANIPULATION DE COLLECTIONS XML

7 - CONCLUSION ET OUVERTURE

Article de référence | Réf : H3502 v2

Universalité XML : espaces de nommage et schémas
XML et son écosystème

Auteur(s) : Gérald Kembellec, Nicolas TRAVERS

Date de publication : 10 juin 2021

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais En anglais

RÉSUMÉ

Cet article traite de la structuration de fichiers XML, de la manière de les produire, de les utiliser, de les requêter à travers divers prismes. En effet, après une courte introduction historique sur les causes industrielles et intellectuelles qui ont amené à l’avènement d’XML comme format de stockage de données et d’informations, l’article revient sur les grammaires et vocabulaires qui permettent la structuration et la qualification documentaire dans l’industrie ou la culture. L’article se poursuit par l’application des règles du XML dans la gestion des connaissances et par une incursion dans le Web des données liées. Enfin, l’article présente XML comme structure, vecteur de stockage et de partage de données : il explore le potentiel d’XML comme base de données, les méthodes de requêtage, d’échange et de flux de données.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

XML and its ecosystem

This article deals with the structuring of XML files, how to produce, use, and to query them through various prisms. After a short historical introduction on the industrial and intellectual causes that led to the rise of XML as a data and information storage format. Then the article introduces to the grammars and vocabularies that allow the structuring and documentary qualification in industry or culture. The article continues by applying the rules of XML in knowledge management and by an incursion into the Web of linked data. Finally, the article presents XML as a structure, a vector for storing and sharing data: it explores the potential of XML as a database, methods for querying, exchanging and flow of data.

Auteur(s)

  • Gérald Kembellec : Chargé de recherche au Centre Historique Allemand, Département des Humanités Numériques - Maître de conférences au CNAM en détachement - Laboratoire Dicen-IdF (EA 7339) / Thématique(s) de recherche : Data, médiation, valorisation - Paris, France

  • Nicolas TRAVERS : Enseignant-Chercheur au Léonard de Vinci Research Center, Pôle Universitaire - Maître de conférences au CNAM en détachement - Laboratoire DVRC / Pôle Universitaire, Paris, France - Chercheur associé au laboratoire CEDRIC / CNAM, Paris, France

INTRODUCTION

L’apparition des systèmes d’information dans l'industrie a conduit à la création des langages informatiques pour stocker des données au sein de dispositifs et créer de l’information, mais aussi décrire cette dernière et effectuer des computations. Enfin, d’autres langages furent inventés pour présenter les données ou les informations qui en sont issues. Dans cet article, nous présentons une focale sur un langage en particulier, le XML, qui offre la particularité de se décliner pour répondre à la plupart des besoins cités – hors la programmation. Le XML et ses dialectes offrent la possibilité de stocker, décrire, filtrer, interroger et présenter les contenus. De plus, il s’agit d’un langage libre et ouvert, ne nécessitant pas de logiciel spécifique pour son utilisation.

Nous présentons ici un aspect historique expliquant l’apparition de XML, ses évolutions et sans être exhaustif, les différents cadres d’usage. Cet article est illustré par de nombreux exemples techniques pour mieux appréhender les dialectes les plus représentatifs de ce langage.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

MOTS-CLÉS

XML XPath XQuery RDF

KEYWORDS

XML   |   XPath   |   XQuery   |   RDF

VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h3502


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais En anglais

4. Universalité XML : espaces de nommage et schémas

4.1 Un document valide ?

Pour qu’un document soit déclaré « valide », c’est-à-dire exempt d’erreurs et donc d’une compatibilité maximale, il doit bien sûr valider le prérequis du formalisme : le document doit donc être « bien formé », sur le modèle de ce qui a été évoqué précédemment. Pour valider les problématiques de syntaxe et d’imbrication de balises, il existe plusieurs méthodes. Un outil simple et officiel est le validateur du W3C ( https://www.w3schools.com/xml/xml_validator.asp) en ligne qui va vérifier point par point ces aspects. Pour les utilisateurs de systèmes d’exploitation basés sur Linux (dont Mac OS), un bon outil de vérification en ligne de commande est xmllint. Les éditeurs de code source ne sont pas égaux face à la détection d’erreurs, mais certains comme XML Spy, Oxygen ou JEdit, avec le plug-in XML, sont tout à fait aptes à déboguer les erreurs de syntaxe, les chevauchements de balises ou les erreurs d’encodages (Voir section « Logiciels »). Cependant, le site du W3C a une vocation didactique complémentaire.

Pour qu’un document soit valide et prêt à être partagé dans de bonnes conditions, le fait d’être bien formé est une condition nécessaire, mais pas toujours suffisante. En effet, dans certains cas, des communautés de pratiques ayant des besoins spécifiques vont devoir se doter d’outils complémentaires. Ces compléments vont être des « garde-fous » pour encadrer les pratiques d’XML. Par analogie avec les outils du linguiste, on va pouvoir les comparer de manière triviale à des dictionnaires (les termes que l’on utilise) et des grammaires (la manière d’agencer les termes), voire les deux : des manuels qui vont à la fois présenter les termes et leurs usages. Dans les quatre parties qui vont suivre, nous introduisons les concepts de DTD (Document Type Definition), de namespaces (dictionnaires), de schémas de données et son alternative : RELAX-NG.

HAUT DE PAGE

4.2 Les DTD

La première étape d’uniformisation dans le formalisme d’un document XML est le document type definition ou DTD. Ce type d’informations permet...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Universalité XML : espaces de nommage et schémas
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - OTLET (P.) -   Traité de documentation : le livre sur le livre, théorie et pratique,  -  Bruxelles, Editions Mundaneum, p. 238, point 243.54.e) (1934).

  • (2) - BUSH (V.) -   « As we may think », The atlantic monthly,  -  176-1, p. 101-108 (1945).

  • (3) - BERNERS-LEE (T.), FISCHETTI (M.) -   Weaving the Web: the past, present and future of the World Wide Web by its inventor,  -  Londres, Texere, p. 45-46 (2000).

  • (4) - ABITEBOUL (S.), MANOLESCU (I.), RIGAUX (P.), et al -   Web data management.  -  Cambridge University Press, p. 72.-92 (2011).

NORMES

  • ISO Traitement de l’information – Systèmes bureautiques – Langage normalisé de balisage généralisé (SGML) - ISO 8879 1986 ISO - 1986

  • ISO Technologies de l’information – Description des documents et langages de traitement – Formats de fichier "Office Open XML" – Partie 1 : Principes essentiels et référence de langage de balisage - ISO/IEC 29500-1 - 2016

  • ISO Information et documentation – L’ensemble des éléments de métadonnées Dublin Core - ISO 15836-2 - 2019

  • (éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler et François Yergeau) Extensible Markup Language (XML)1.0, - W3C - 1998

  • (éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler, François Yergeau et John Cowan), Extensible Markup Language (XML) 1.1 (Second Edition), - W3C - 2006

  • (éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler et François Yergeau) Extensible Markup Language (XML) 1.0 (Fifth Edition) - W3C - 2008

  • ...

1 Logiciels et outils

Éditeurs génériques

JEdit est un éditeur multiplateformes sous licence GNU GPL écrit en Java qui autorise l’édition de fichiers XML, permet de générer des DTD à partir d’un modèle XML.

Voir https://www.sourceforge.net/projects/jedit/files/jedit/

Emacs est un éditeur multiplateformes sous licence GNU GPL avec beaucoup d’extensions,

Voir https://www.gnu.org/software/emacs/

Notepad++ est un éditeur pour Microsoft sous licence GNU GPL écrit en C++

Voir https://www.notepad-plus-plus.org/

Bibliothèques de programmation spécialisées

Java API for XML Processing (JAXP) est l’interface de programmation Oracle permettant la création, la manipulation et le traitement de fichiers XML en DOM (ou SAX ou StAX,) et la transformation transformer avec XSL.

Voir https://docs.oracle.com/javase/tutorial/jaxp/index.html

Xerces est un ensemble de bibliothèques logicielles l’Apache Software Foundation pour la lecture et le traitement XML DOM et SAX en C++, Perl et Java.

Voir https://xerces.apache.org/

Libxml2 est un analyseur XML en C (et langages dérivés) libre disponible sous la licence du MIT. Il contient également ensemble d’outils annexes élaborés pour le traitement XML.

Voir http://www.xmlsoft.org/

xml.dom est une bibliothèque Python pour accéder et modifier les documents XML en DOM

Voir https://docs.python.org/fr/3/library/index.html...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS