Présentation
En anglaisAuteur(s)
-
François ROLE : Conservateur des bibliothèques - Chargé de recherche à l’université Paris 8
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Depuis l’Antiquité, il est courant de marquer et d’annoter des textes en vue d’en faciliter l’étude ou la critique (pensons par exemple aux systèmes d’annotation médiévaux ou à l’appareil de symboles imaginé dès le III e siècle avant J.-C. par les philologues alexandrins).
Dans l’univers numérique, le marquage électronique (défini ici comme l’insertion dans un fichier électronique de marques liées au texte mais n’en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d’impression ou d’affichage (photocopieuses, imprimantes, écran). C’est ce marquage qu’utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO du commerce.
(*) « implicitement » dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d’une manière ou d’une autre les informations de balisage physique sur lesquelles le logiciel de PAO s’appuie pour effectuer les opérations qu’on lui demande.
Malgré ses mérites, ce marquage est, comme nous l’avons dit, orienté vers la production ou l’affichage du texte, et n’est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s’est donc imposée l’idée qu’il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu’en décrivant la structure logique.
SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l’écriture d’une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins.
La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de « recommandations » ; les TEI « Guidelines » expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l’historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d’étudier la stylistique ou la genèse d’un texte, etc.
Après quelques rappels historiques et une présentation informelle de la structure d’un texte TEI, nous décrivons les mécanismes mis en œuvre dans l’écriture de la DTD TEI (modularité, héritage, extensibilité).
Cette partie plus technique que les autres nécessite une bonne connaissance de SGML.
A la fin de cet article nous présentons quelques exemples de balisage TEI.
Les concepts et techniques liés au SGML sont exposés dans l’article « SGML » du présent traité.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Mécanismes d’adressage
La DTD TEI définit des types de pointeurs sophistiqués permettant de dépasser les limites imposées par le mécanisme ID/IDREF de SGML (voir SGML[7, § 3.1.2.1.6]). Nous présentons les deux grands types de pointeurs définis par la DTD TEI puis le système d’adressage qui sous-tend le fonctionnement de ces pointeurs.
Le fait que nous traitons à part de cet aspect de la TEI est justifié par le fait que les mécanismes hypertextuels de la TEI ont largement influencé des techniques en émergence comme XML (la recommandation XML récemment adoptée par le consortium W3, voir SGML[7, § 3.5.2]).
4.1 Présentation générale
Pour supporter des applications hypertextuelles complexes, la TEI a prévu des mécanismes d’adressage plus puissants que ceux qui sont proposés par défaut dans la norme SGML, notamment le mécanisme des ID/IDREF.
ces mécanismes définis dans la TEI sont proches de ceux de la norme HyTime et ont directement influencé les spécifications XLink et XPointer élaborées par le consortium W3.
Rappelons que le mécanisme ID/IDREF disponible en SGML permet de faire référence à un passage d’un document en respectant les contraintes suivantes :
-
le passage auquel on fait référence doit être dans le même document que l’endroit depuis lequel on le référence ;
-
le passage auquel on fait référence doit être repéré par un attribut de type ID.
Cependant, dans des applications complexes, on peut avoir besoin de désigner des passages situés dans un autre document, ou des passages qui n’ont pas d’attribut ID.
Pour surmonter cette difficulté, la TEI a défini deux éléments : <xptr> et <xref>. Conformément à la démarche classificatoire propre à la TEI, ces éléments sont rattachés à la classe des éléments pointeurs qui comprend également des pointeurs d’un type plus simple (<ptr>, <ref>, <link>). Les éléments <xptr> et <xref> héritent de...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Mécanismes d’adressage
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive