Présentation
EnglishAuteur(s)
-
François CHAHUNEAU : Directeur des Technologies Groupe Berger-Levrault
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
XML (eXtensible Markup Language) est une méthode universelle de représentation textuelle de données structurées selon une syntaxe normalisée. XML a été conçu pour permettre d’échanger et de stocker des données indépendamment des programmes ou des processus qui les produisent, et de les produire indépendamment des programmes ou des processus qui les utilisent.
La notion de représentation sous forme textuelle, c’est-à-dire sous la forme séquentielle d’un flux de caractères balisé, s’oppose ici à celle de représentation binaire. XML a été développé sous l’égide du World Wide Web Consortium (W3C) depuis fin 1996 ; le langage XML, c’est-à-dire l’ensemble des règles de syntaxe régissant la représentation balisée de l’information, est défini très précisément dans une recommandation du W3C [1] dont la version 1.0 est datée du 10/02/98. (Une seconde édition de cette spécification, corrigeant certaines erreurs rédactionnelles, a été publiée le 6/10/00).
Par convention, on appelle document XML le résultat de cette représentation, même dans les cas où le flux textuel balisé n’a aucun caractère narratif et n’est en rien destiné à être appréhendé par un lecteur humain après mise en forme sur un média. Si XML a de nombreuses applications dans le monde documentaire, héritées de son ancêtre SGML [2], il est également applicable à une large variété de problèmes concernant la représentation, l’échange et le traitement de données structurées hors du champ documentaire. On peut utiliser XML pour représenter un extrait de base de données, une feuille de calcul, l’ensemble des paramètres de configuration d’une application informatique, les flux de données échangés lors de transactions financières, les données complexes d’un système d’information géographique, des graphiques, etc. XML a ainsi vocation à devenir le format d’échange universel pour les flux de données structurées qui transiteront, dans des volumes sans cesse croissants, sur le World Wide Web.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Présentation de XML
le terme « language » qui apparaît dans le développé de l’acronyme XML (littéralement : « langage de balisage extensible ») peut prêter à confusion, car XML n’est aucunement un langage de programmation. Les règles syntaxiques définissent en fait un métalangage, qui permet de définir des systèmes de balisage spécifiques, donc des langages spécifiques de représentation de données.
1.1 Exemple simple de codage XML
La figure 1 présente un court exemple de document XML : il s’agit de la représentation XML d’un bloc de données structurées véhiculant des informations météorologiques. Nous allons le parcourir brièvement pour illustrer les principes de XML.
Les caractères en gras constituent le balisage, les autres constituent les données textuelles. Les données sont structurées par l’alternance de balises ouvrantes, de forme <xxx>, et de balises fermantes appariées, de forme </xxx>. L’ensemble constitué par une balise ouvrante, la balise fermante appariée et le contenu qu’elles encadrent constitue la représentation balisée d’un élément XML.
la forme syntaxique de ce codage pourra sembler familière aux lecteurs connaissant HTML, bien que plusieurs différences existent et que XML ne se situe pas sur le même plan. Nous reviendrons sur cette distinction.
L’étiquette « xxx » est le nom de type d’élément XML, appelé parfois « identificateur générique » (en anglais : generic identifier, abrégé en GI). Cette notion de type d’élément est essentielle en XML : chaque élément XML est ainsi considéré comme appartenant à une catégorie générique, ou type, dont il constitue une instance. Dans le court fragment XML considéré en exemple, on voit apparaître une seule instance d’élément de chaque type, mais il faut en réalité imaginer un document plus long constitué d’une concaténation de fragments similaires dans lesquels se répèteraient les mêmes types d’éléments, matérialisés par les mêmes balises encadrant des données différentes....
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation de XML
ANNEXES
La masse d’information disponible sur XML est considérable, qu’il s’agisse d’ouvrages, d’articles ou d’information en ligne. Les ouvrages actuellement disponibles couvrent tout le spectre qui s’étend des ouvrages introductifs jusqu’aux guides avancés pour programmeurs portant sur les normes et standards, les outils et les API.
Parmi les sites Internet les plus intéressants, on retiendra les trois suivants, qui jouent un rôle de portail d’entrée dans le monde XML.
http://www.oasis-open.org/cover/xml.html : ce site, maintenu par Robin Cover, tente de répertorier et de classifier l’ensemble de l’information disponible en ligne sur XML. Il liste notamment un très grand nombre d’applications XML, dans le secteur académique comme dans le secteur privé, qui donneront une idée de la variété des domaines d’applications actuels.
http://www.xmlsoftware.com : c’est le portail du logiciel XML. La plupart des outils disponibles sont classifiés et brièvement présentés, qu’il s’agisse de progiciels commerciaux, d’outils du domaine public, ou de prototypes de la boratoire. Des liens permettent d’accéder aux sites des entreprises ou des institutions qui développent ces outils.
http://msdn.microsoft.com/xml/default.asp : la partie du site Microsoft consacrée à XML est riche d’informations, et propose notamment des tutoriels en ligne de bonne qualité pédagogique et de portée plus générale que le...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive