Sylvie CALABRETTO
Maître de conférences HDR au LIRIS, INSA de Lyon
Comment gérer les contenus Web, dont les volumes ne cessent de croître ? Cet article commence par passer en revue les différents types de gestion de documents : basés sur la structure ou sur le contenu, XML natif ou classique. Les langages, permettant d’exprimer des requêtes sur les documents XML, sont ensuite traités, avant d’aborder le langage XQuery, langage de requête proposé par le W3C. Pour terminer, sont présentés les éléments fondateurs du Web sémantique : ontologies, métadonnées, annotations et les langages associés (RDF, OWL...).
C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux avantages, notamment la capacité à normaliser des documents grâce à un balisage sémantique indépendant des langages de programmation. Ce métalangage répond également très favorablement aux attentes de formats d’échanges de données via le Web. Cet article présente la structure des documents XML, son modèle de document DTD et les outils de base XPath et XSLT.