Présentation
En anglaisAuteur(s)
-
François CHAHUNEAU : Directeur des Technologies Groupe Berger-Levrault
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
XML (eXtensible Markup Language) est une méthode universelle de représentation textuelle de données structurées selon une syntaxe normalisée. XML a été conçu pour permettre d’échanger et de stocker des données indépendamment des programmes ou des processus qui les produisent, et de les produire indépendamment des programmes ou des processus qui les utilisent.
La notion de représentation sous forme textuelle, c’est-à-dire sous la forme séquentielle d’un flux de caractères balisé, s’oppose ici à celle de représentation binaire. XML a été développé sous l’égide du World Wide Web Consortium (W3C) depuis fin 1996 ; le langage XML, c’est-à-dire l’ensemble des règles de syntaxe régissant la représentation balisée de l’information, est défini très précisément dans une recommandation du W3C [1] dont la version 1.0 est datée du 10/02/98. (Une seconde édition de cette spécification, corrigeant certaines erreurs rédactionnelles, a été publiée le 6/10/00).
Par convention, on appelle document XML le résultat de cette représentation, même dans les cas où le flux textuel balisé n’a aucun caractère narratif et n’est en rien destiné à être appréhendé par un lecteur humain après mise en forme sur un média. Si XML a de nombreuses applications dans le monde documentaire, héritées de son ancêtre SGML [2], il est également applicable à une large variété de problèmes concernant la représentation, l’échange et le traitement de données structurées hors du champ documentaire. On peut utiliser XML pour représenter un extrait de base de données, une feuille de calcul, l’ensemble des paramètres de configuration d’une application informatique, les flux de données échangés lors de transactions financières, les données complexes d’un système d’information géographique, des graphiques, etc. XML a ainsi vocation à devenir le format d’échange universel pour les flux de données structurées qui transiteront, dans des volumes sans cesse croissants, sur le World Wide Web.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
7. Outils XML
7.1 Parsers XML
Un parser XML représente la couche logicielle de base indispensable dans toute application informatique qui exploite une représentation XML des données : c’est lui qui permet de passer de la représentation externe normalisée de l’information, sous forme de flux textuel balisé, à une représentation interne propre à l’application.
Un parser XML ne peut traiter dans sa globalité qu’un document bien formé, et doit signaler comme erreur fatale toute malformation du flux balisé. On distingue par ailleurs les parsers validants, capables de confronter un document XML à sa DTD et de signaler les erreurs dites de validité. Avec l’émergence des schémas XML, cette catégorie de parsers sera progressivement supplantée par des outils capables de confronter un document XML à son schéma.
La définition précise de l’information qu’un parser XML doit pouvoir communiquer à une application fait l’objet de la norme XML Information Set [4] en cours d’élaboration. La manière dont cette information est transmise peut cependant varier. L’ensemble des outils disponibles se standardise progressivement autour de deux interfaces de programmation (API) courantes :
-
l’interface « SAX » (Simple API for XML) propose une vision « événementielle » de la transmission d’information, en définissant un protocole simple qui associe des événements à la rencontre de certaines structures syntaxiques dans le flux balisé, et notamment la traversée des frontières d’éléments XML matérialisées par les balises. À chaque événement est associé un certain nombre d’items d’information (par exemple, les noms et valeurs d’attributs associés à une balise ouvrante) qui sont rendus accessibles à l’application. L’API SAX fait l’objet d’une spécification publique [26] largement suivie par la communauté des développeurs d’outils XML, bien qu’il ne s’agisse pas d’une...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Outils XML
ANNEXES
La masse d’information disponible sur XML est considérable, qu’il s’agisse d’ouvrages, d’articles ou d’information en ligne. Les ouvrages actuellement disponibles couvrent tout le spectre qui s’étend des ouvrages introductifs jusqu’aux guides avancés pour programmeurs portant sur les normes et standards, les outils et les API.
Parmi les sites Internet les plus intéressants, on retiendra les trois suivants, qui jouent un rôle de portail d’entrée dans le monde XML.
http://www.oasis-open.org/cover/xml.html : ce site, maintenu par Robin Cover, tente de répertorier et de classifier l’ensemble de l’information disponible en ligne sur XML. Il liste notamment un très grand nombre d’applications XML, dans le secteur académique comme dans le secteur privé, qui donneront une idée de la variété des domaines d’applications actuels.
http://www.xmlsoftware.com : c’est le portail du logiciel XML. La plupart des outils disponibles sont classifiés et brièvement présentés, qu’il s’agisse de progiciels commerciaux, d’outils du domaine public, ou de prototypes de la boratoire. Des liens permettent d’accéder aux sites des entreprises ou des institutions qui développent ces outils.
http://msdn.microsoft.com/xml/default.asp : la partie du site Microsoft consacrée à XML est riche d’informations, et propose notamment des tutoriels en ligne de bonne qualité pédagogique et de portée plus générale que le...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive