Présentation
En anglaisAuteur(s)
-
François CHAHUNEAU : Directeur des Technologies Groupe Berger-Levrault
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
XML (eXtensible Markup Language) est une méthode universelle de représentation textuelle de données structurées selon une syntaxe normalisée. XML a été conçu pour permettre d’échanger et de stocker des données indépendamment des programmes ou des processus qui les produisent, et de les produire indépendamment des programmes ou des processus qui les utilisent.
La notion de représentation sous forme textuelle, c’est-à-dire sous la forme séquentielle d’un flux de caractères balisé, s’oppose ici à celle de représentation binaire. XML a été développé sous l’égide du World Wide Web Consortium (W3C) depuis fin 1996 ; le langage XML, c’est-à-dire l’ensemble des règles de syntaxe régissant la représentation balisée de l’information, est défini très précisément dans une recommandation du W3C [1] dont la version 1.0 est datée du 10/02/98. (Une seconde édition de cette spécification, corrigeant certaines erreurs rédactionnelles, a été publiée le 6/10/00).
Par convention, on appelle document XML le résultat de cette représentation, même dans les cas où le flux textuel balisé n’a aucun caractère narratif et n’est en rien destiné à être appréhendé par un lecteur humain après mise en forme sur un média. Si XML a de nombreuses applications dans le monde documentaire, héritées de son ancêtre SGML [2], il est également applicable à une large variété de problèmes concernant la représentation, l’échange et le traitement de données structurées hors du champ documentaire. On peut utiliser XML pour représenter un extrait de base de données, une feuille de calcul, l’ensemble des paramètres de configuration d’une application informatique, les flux de données échangés lors de transactions financières, les données complexes d’un système d’information géographique, des graphiques, etc. XML a ainsi vocation à devenir le format d’échange universel pour les flux de données structurées qui transiteront, dans des volumes sans cesse croissants, sur le World Wide Web.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Syntaxe du langage XML
L’objet de ce paragraphe est de résumer les aspects les plus importants de la syntaxe de balisage des instances XML, à l’exclusion de la syntaxe des déclarations qui constituent le prologue. La terminologie française adoptée ici pour les termes techniques XML est celle utilisée dans la traduction française de la norme XML (http://babel.alis.com/web_ml/xml). Pour une définition formelle et exhaustive de la syntaxe du langage, on se reportera à la spécification W3C [1].
3.1 Constituants syntaxiques du balisage XML
3.1.1 Représentation des caractères en XML
XML étant une méthode de représentation textuelle de données structurées, la représentation des caractères eux-mêmes (constituants à la fois du balisage et des données textuelles) revêt une importance essentielle.
Né à l’ère de l’internationalisation des contenus liée au Web, XML a adopté d’emblée comme référence le jeu de caractères défini par la norme ISO 10646/Unicode.
le lecteur se reportera à l’article Codage des caractères . La norme ISO/IEC 10646 et le standard Unicode définissent des jeux de caractères strictement identiques pour les caractères codables sur 16 bits (« Basic Multilingual Plane » de l’ISO 10646), soit la totalité des 47 000 caractères (environ) actuellement définis. Les deux standards peuvent être considérés comme identiques pour les besoins courants d’usage de XML.
Les caractères présents dans un document XML sont supposés être représentés par l’un des encodages standards de l’ISO 10646/Unicode : encodage UTF-8, basé ASCII et utilisant des octets de 8 bits, ou encodage UTF-16 (alias UCS-2) sur 16 bits. La norme XML stipule que tous les processeurs doivent être à même de traiter des documents XML encodés en UTF-8 ou en UTF-16. Ils peuvent savoir traiter optionnellement d’autres encodages couramment et traditionnellement utilisés...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Syntaxe du langage XML
ANNEXES
La masse d’information disponible sur XML est considérable, qu’il s’agisse d’ouvrages, d’articles ou d’information en ligne. Les ouvrages actuellement disponibles couvrent tout le spectre qui s’étend des ouvrages introductifs jusqu’aux guides avancés pour programmeurs portant sur les normes et standards, les outils et les API.
Parmi les sites Internet les plus intéressants, on retiendra les trois suivants, qui jouent un rôle de portail d’entrée dans le monde XML.
http://www.oasis-open.org/cover/xml.html : ce site, maintenu par Robin Cover, tente de répertorier et de classifier l’ensemble de l’information disponible en ligne sur XML. Il liste notamment un très grand nombre d’applications XML, dans le secteur académique comme dans le secteur privé, qui donneront une idée de la variété des domaines d’applications actuels.
http://www.xmlsoftware.com : c’est le portail du logiciel XML. La plupart des outils disponibles sont classifiés et brièvement présentés, qu’il s’agisse de progiciels commerciaux, d’outils du domaine public, ou de prototypes de la boratoire. Des liens permettent d’accéder aux sites des entreprises ou des institutions qui développent ces outils.
http://msdn.microsoft.com/xml/default.asp : la partie du site Microsoft consacrée à XML est riche d’informations, et propose notamment des tutoriels en ligne de bonne qualité pédagogique et de portée plus générale que le...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive