Présentation

Article

1 - ORIGINES DU PROJET TEI

  • 1.1 - Historique et motivations
  • 1.2 - Publication des « Recommandations de la TEI »

2 - STRUCTURATION D’UN TEXTE TEI

3 - PRÉSENTATION DE LA DTD TEI

  • 3.1 - Introduction
  • 3.2 - Structure modulaire de la DTD TEI
  • 3.3 - Regroupement des éléments et des attributs en classes
  • 3.4 - Extensibilité
  • 3.5 - Structure générale de la DTD
  • 3.6 - Enseignements méthodologiques

4 - MÉCANISMES D’ADRESSAGE

  • 4.1 - Présentation générale
  • 4.2 - Notation de pointage étendue

5 - EXEMPLES D’UTILISATION DE LA TEI

6 - QUEL AVENIR POUR LA TEI ?

Article de référence | Réf : H7158 v1

Origines du projet TEI
TEI (Text Encoding Initiative)

Auteur(s) : François ROLE

Relu et validé le 01 juil. 2018

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais En anglais

Auteur(s)

  • François ROLE : Conservateur des bibliothèques - Chargé de recherche à l’université Paris 8

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Depuis l’Antiquité, il est courant de marquer et d’annoter des textes en vue d’en faciliter l’étude ou la critique (pensons par exemple aux systèmes d’annotation médiévaux ou à l’appareil de symboles imaginé dès le III e siècle avant J.-C. par les philologues alexandrins).

Dans l’univers numérique, le marquage électronique (défini ici comme l’insertion dans un fichier électronique de marques liées au texte mais n’en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d’impression ou d’affichage (photocopieuses, imprimantes, écran). C’est ce marquage qu’utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO du commerce.

Nota :

(*) « implicitement » dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d’une manière ou d’une autre les informations de balisage physique sur lesquelles le logiciel de PAO s’appuie pour effectuer les opérations qu’on lui demande.

Malgré ses mérites, ce marquage est, comme nous l’avons dit, orienté vers la production ou l’affichage du texte, et n’est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s’est donc imposée l’idée qu’il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu’en décrivant la structure logique.

SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l’écriture d’une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins.

La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de « recommandations » ; les TEI « Guidelines » expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l’historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d’étudier la stylistique ou la genèse d’un texte, etc.

Après quelques rappels historiques et une présentation informelle de la structure d’un texte TEI, nous décrivons les mécanismes mis en œuvre dans l’écriture de la DTD TEI (modularité, héritage, extensibilité).

Cette partie plus technique que les autres nécessite une bonne connaissance de SGML.

A la fin de cet article nous présentons quelques exemples de balisage TEI.

Les concepts et techniques liés au SGML sont exposés dans l’article « SGML » du présent traité.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7158


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais En anglais

1. Origines du projet TEI

1.1 Historique et motivations

Au cours des années 1980, une partie de la communauté des chercheurs en sciences humaines prit conscience des possibilités et en même temps des limites de l’informatique. En effet, si par exemple dans le cas des linguistes, l’utilisation de la PAO rendait à priori plus facile la constitution de corpus de textes électroniques, en réalité la très grande variété des systèmes de codage et des équipements mis en œuvre constituait souvent un obstacle pour les équipes de recherche. De cette constatation naquit l’idée de définir un format de représentation des textes neutres par rapport aux équipements et aux systèmes informatiques, et en même temps suffisamment expressif pour permettre de travailler sur des textes dans de nombreuses disciplines. Les principes devant présider à la définition d’un tel format furent arrêtés dès novembre 1987, lors d’une conférence organisée au Vassar College (Poughkeepsie, New York) à laquelle participèrent des chercheurs représentatifs d’un grand nombre de disciplines.

Conformément à ces principes, le futur format devait avoir les caractéristiques suivantes :

  • ne dépendre d’aucun logiciel particulier pour assurer la cir-culation et la pérennité des informations ;

  • être rigoureusement défini ;

  • être clair et simple ;

  • être ouvert à des extensions et évolutions ;

  • respecter les normes documentaires en vigueur.

Comme il fallait une syntaxe pour mettre en œuvre ces principes et que l’ISO venait juste d’adopter SGML comme norme internationale (la norme SGML fut adoptée en 1986), les chercheurs présents à Poughkeepsie décidèrent de baser leur format de représentation des textes sur SGML. Le soutien apporté rapidement par plusieurs institutions importantes (Association for Computers and the Humanities, Association for Computational Linguistics, Association for Literary and Linguistic Computing, Commission européenne, Fondation Andrew W. Mellon, Social Sciences and Humanities Research Council du Canada, etc.) permit aux travaux de démarrer officiellement dès 1988, sous le nom de Text Encoding Initiative (TEI).

HAUT DE PAGE

1.2 Publication des « Recommandations de la TEI »

Les...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Origines du projet TEI
Sommaire
Sommaire

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS