Présentation
EnglishRÉSUMÉ
Cet article traite de la structuration de fichiers XML, de la manière de les produire, de les utiliser, de les requêter à travers divers prismes. En effet, après une courte introduction historique sur les causes industrielles et intellectuelles qui ont amené à l’avènement d’XML comme format de stockage de données et d’informations, l’article revient sur les grammaires et vocabulaires qui permettent la structuration et la qualification documentaire dans l’industrie ou la culture. L’article se poursuit par l’application des règles du XML dans la gestion des connaissances et par une incursion dans le Web des données liées. Enfin, l’article présente XML comme structure, vecteur de stockage et de partage de données : il explore le potentiel d’XML comme base de données, les méthodes de requêtage, d’échange et de flux de données.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Gérald Kembellec : Chargé de recherche au Centre Historique Allemand, Département des Humanités Numériques - Maître de conférences au CNAM en détachement - Laboratoire Dicen-IdF (EA 7339) / Thématique(s) de recherche : Data, médiation, valorisation - Paris, France
-
Nicolas TRAVERS : Enseignant-Chercheur au Léonard de Vinci Research Center, Pôle Universitaire - Maître de conférences au CNAM en détachement - Laboratoire DVRC / Pôle Universitaire, Paris, France - Chercheur associé au laboratoire CEDRIC / CNAM, Paris, France
INTRODUCTION
L’apparition des systèmes d’information dans l'industrie a conduit à la création des langages informatiques pour stocker des données au sein de dispositifs et créer de l’information, mais aussi décrire cette dernière et effectuer des computations. Enfin, d’autres langages furent inventés pour présenter les données ou les informations qui en sont issues. Dans cet article, nous présentons une focale sur un langage en particulier, le XML, qui offre la particularité de se décliner pour répondre à la plupart des besoins cités – hors la programmation. Le XML et ses dialectes offrent la possibilité de stocker, décrire, filtrer, interroger et présenter les contenus. De plus, il s’agit d’un langage libre et ouvert, ne nécessitant pas de logiciel spécifique pour son utilisation.
Nous présentons ici un aspect historique expliquant l’apparition de XML, ses évolutions et sans être exhaustif, les différents cadres d’usage. Cet article est illustré par de nombreux exemples techniques pour mieux appréhender les dialectes les plus représentatifs de ce langage.
VERSIONS
- Version archivée 1 de août 2006 par Sylvie CALABRETTO, Tiphaine ACCARY
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Représentation et traitement des documents numériques > XML et son écosystème > Évolution conceptuelle des langages documentaires
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Évolution conceptuelle des langages documentaires
Le temps des grands explorateurs, celui de l’imprimerie et plus tard celui de la révolution industrielle ont grandement modifié le rapport de l’humain à son environnement. Les distances se sont raccourcies dans la perception du commun, le savoir s’est démocratisé, puis industrialisé, n’étant plus le fait d’une élite de copistes lettrés garants de l’inscription et de la transmission des écritures saintes et doctes ou encore de celle des chartes. Le XXe siècle a amené bon nombre de modifications dans la relation de l’homme à l’écrit, avec une volonté de structurer l’information et de la formaliser par un ancrage dans des inscriptions compréhensibles à la fois par les humains, mais aussi par les machines mécaniques puis électroniques, nouveaux acteurs de l’industrie.
Dans un premier temps, des penseurs de différentes disciplines ont théorisé la structuration des connaissances et l’accès indexé à l’information, y compris à distance et les possibles contextes d’utilisation.
Paul Otlet avait imaginé à la fin des années 1930 un dispositif utopique permettant de lire à domicile, à distance donc, des pages de documents stockés dans de grandes bibliothèques grâce à un télescope électrique pointé vers une salle d’exposition dédiée . L’ingénieur américain Vannevar Bush, chercheur au MIT, décrivit ensuite en 1945 dans son article fondateur « As we may think », le Memex, un dispositif documentaire technique imaginaire posant les bases théoriques des documents numériques hypertextes . En 1968 Douglas Engelbart, le père des interfaces hommes-machines, présenta NLS (oNLine System) le premier dispositif d’édition...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Évolution conceptuelle des langages documentaires
BIBLIOGRAPHIE
-
(1) - OTLET (P.) - Traité de documentation : le livre sur le livre, théorie et pratique, - Bruxelles, Editions Mundaneum, p. 238, point 243.54.e) (1934).
-
(2) - BUSH (V.) - « As we may think », The atlantic monthly, - 176-1, p. 101-108 (1945).
-
(3) - BERNERS-LEE (T.), FISCHETTI (M.) - Weaving the Web: the past, present and future of the World Wide Web by its inventor, - Londres, Texere, p. 45-46 (2000).
-
(4) - ABITEBOUL (S.), MANOLESCU (I.), RIGAUX (P.), et al - Web data management. - Cambridge University Press, p. 72.-92 (2011).
NORMES
-
ISO Traitement de l’information – Systèmes bureautiques – Langage normalisé de balisage généralisé (SGML) - ISO 8879 1986 ISO - 1986
-
ISO Technologies de l’information – Description des documents et langages de traitement – Formats de fichier "Office Open XML" – Partie 1 : Principes essentiels et référence de langage de balisage - ISO/IEC 29500-1 - 2016
-
ISO Information et documentation – L’ensemble des éléments de métadonnées Dublin Core - ISO 15836-2 - 2019
-
(éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler et François Yergeau) Extensible Markup Language (XML)1.0, - W3C - 1998
-
(éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler, François Yergeau et John Cowan), Extensible Markup Language (XML) 1.1 (Second Edition), - W3C - 2006
-
(éditeurs. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler et François Yergeau) Extensible Markup Language (XML) 1.0 (Fifth Edition) - W3C - 2008
-
...
ANNEXES
Éditeurs génériques
JEdit est un éditeur multiplateformes sous licence GNU GPL écrit en Java qui autorise l’édition de fichiers XML, permet de générer des DTD à partir d’un modèle XML.
Voir https://www.sourceforge.net/projects/jedit/files/jedit/
Emacs est un éditeur multiplateformes sous licence GNU GPL avec beaucoup d’extensions,
Voir https://www.gnu.org/software/emacs/
Notepad++ est un éditeur pour Microsoft sous licence GNU GPL écrit en C++
Voir https://www.notepad-plus-plus.org/
Bibliothèques de programmation spécialiséesJava API for XML Processing (JAXP) est l’interface de programmation Oracle permettant la création, la manipulation et le traitement de fichiers XML en DOM (ou SAX ou StAX,) et la transformation transformer avec XSL.
Voir https://docs.oracle.com/javase/tutorial/jaxp/index.html
Xerces est un ensemble de bibliothèques logicielles l’Apache Software Foundation pour la lecture et le traitement XML DOM et SAX en C++, Perl et Java.
Voir https://xerces.apache.org/
Libxml2 est un analyseur XML en C (et langages dérivés) libre disponible sous la licence du MIT. Il contient également ensemble d’outils annexes élaborés pour le traitement XML.
xml.dom est une bibliothèque Python pour accéder et modifier les documents XML en DOM
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive