Présentation

Article

1 - QU'EST-CE QU'UN THÉSAURUS ?

  • 1.1 - Définitions
  • 1.2 - Composantes
  • 1.3 - Thésaurus et autres répertoires langagiers

2 - STRUCTURE

3 - CONCEPTION ET DÉVELOPPEMENT

  • 3.1 - Normes et directives
  • 3.2 - Analyse des besoins et spécifications
  • 3.3 - Collecte des termes
  • 3.4 - Premiers regroupements sémantiques
  • 3.5 - Identification des équivalents
  • 3.6 - Sélection des descripteurs
  • 3.7 - Forme des termes
  • 3.8 - Définitions et notes
  • 3.9 - Relations hiérarchiques
  • 3.10 - Relations associatives
  • 3.11 - Concepts et descripteurs « orphelins »
  • 3.12 - Utilisation du thésaurus en développement pour l'indexation et la recherche

4 - ENREGISTREMENT ET PRÉSENTATION DES DONNÉES

5 - ÉVALUATION ET MISE À JOUR

  • 5.1 - Types et modalités d'évaluation
  • 5.2 - Mise à jour

6 - LOGICIELS POUR LE DÉVELOPPEMENT ET LA GESTION DES THÉSAURUS

  • 6.1 - Catégories de logiciels
  • 6.2 - Évaluation et sélection

7 - À QUOI ET À QUI SERT LE THÉSAURUS ?

  • 7.1 - Aide à l'indexation
  • 7.2 - Aide à la recherche
  • 7.3 - Exploitation par les moteurs de recherche
  • 7.4 - Traitement automatique de la langue naturelle
  • 7.5 - Référentiel terminologique et sémantique

8 - PERSPECTIVES

Article de référence | Réf : H7250 v1

Structure
Thésaurus documentaire

Auteur(s) : Michèle HUDON

Date de publication : 10 nov. 2012

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais En anglais

RÉSUMÉ

Cet article décrit la nature, les origines et la structure du thésaurus documentaire contemporain. Il détaille ensuite les étapes, les opérations et les instruments de son développement et de sa gestion, notamment à travers ses différentes normes, directives, analyses, relations. Il aborde finalement la question de son utilisation dans les systèmes d'information automatisés (par exemple l’enregistrement et la présentation des données), sans toutefois retenir des systèmes et de modalités d'utilisation particulières. Pour conclure cet article, les utilités du thésaurus sont précisées : son aide à l’indexation, à la recherche, ou encore son exploitation par moteurs de recherche.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

This article describes the nature, the origins, and the structure of the contemporary documentation thesaurus. It provides details on the successive phases and the diverse tasks and tools related to its construction and management. Finally, it addresses matters relating to the use of the thesaurus in computerized information systems without, however, characterizing specific systems or applications. To conclude this article, the thesaurus’ utilities are specified: aid to indexing, searching, or its use by search engines.

Auteur(s)

  • Michèle HUDON : Professeur agrégé École de bibliothéconomie et des sciences de l'information Université de Montréal (Canada)

INTRODUCTION

Le thésaurus est un langage documentaire, c'est-à-dire un langage artificiel conçu pour permettre de générer la représentation formalisée des sujets dont traite un document d'une part, et du libellé des questions d'un utilisateur d'autre part, afin que ce dernier puisse repérer l'information ou les documents qui lui seront pertinents et utiles. Le thésaurus appartient à la grande variété de systèmes d'organisation des connaissances (SOC) disponibles pour faciliter la communication d'information.

Le thésaurus est désormais exploitable sous forme numérique et il constitue l'une des composantes importantes des systèmes d'information contemporains, dans les bases de données traditionnelles comme sur le web. Alors qu'il était à l'origine utilisé par des spécialistes formés à l'indexation et à la recherche d'information, le thésaurus se décline maintenant en versions utilisables par toute personne en quête d'information. Sa structure en permet également l'exploitation par des moteurs de recherche et par des logiciels de traitement de la langue naturelle au sein desquels il sert de base de connaissances.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

KEYWORDS

thesaurus of descriptor   |   information retrieval   |   indexing and searching languages   |   knowledge organization systems KOS

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7250


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais En anglais

2. Structure

Plus que toute autre caractéristique, c'est sa structure relationnelle qui distingue le thésaurus d'autres langages documentaires utilisés pour la représentation et la recherche, les schémas de classification et les listes de mots-clés par exemple. Dans un thésaurus, les relations entre concepts sont de nature paradigmatique, c'est-à-dire qu'elles sont permanentes, nécessaires et toujours vraies dans l'environnement sémantique décrit. La relation paradigmatique s'oppose à la relation syntagmatique. La relation syntagmatique recrée le contexte d'utilisation d'un concept en juxtaposant des concepts qui n'entretiennent entre eux aucune relation permanente au moment de l'indexation ou du développement d'une stratégie de recherche.

2.1 Équivalence intralinguistique

La langue naturelle met à la disposition des locuteurs plusieurs mots ou expressions évoquant le même concept. Cette richesse lexicale est un obstacle à l'efficacité de la communication scientifique. Dans un thésaurus, la relation d'équivalence entre termes d'une même langue naturelle lie tous les mots ou expressions utilisés pour exprimer la même idée ou nommer le même objet. La relation d'équivalence transforme la langue naturelle en langage normalisé pour la représentation et la recherche. En regroupant tous les termes pointant vers le même concept, elle assure l'uniformité et la cohérence de la représentation et permet un repérage exhaustif.

Dans les thésaurus de langue française, la relation d'équivalence intralinguistique est symbolisée par les abréviations EM (Employer) et sa réciproque EP (Employé pour) (figure 1).

Dans les thésaurus de langue anglaise, l'équivalence intralinguistique est exprimée par la directive USE et l'abréviation UF (Used for ) qui en est la réciproque.

HAUT DE PAGE

2.2 Hiérarchie

Le thésaurus est un langage documentaire à structure hiérarchique. La relation hiérarchique, dite aussi relation d'inclusion, exprime un rapport de supériorité et de subordination entre concepts, et par conséquent entre les termes qui les représentent. La relation hiérarchique facilite la navigation verticale dans le thésaurus et permet...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Structure
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AITCHISON (J.), GILCHRIST (A.), BAWDEN (D.) -   Thesaurus construction and use.  -  4th ed., Aslib IMI, London (2000).

  • (2) - BROUGHTON (V.) -   Essential thesaurus construction  -  . Facet, London (2006).

  • (3) - DA SYLVA (L.) -   Thésaurus et systèmes de traitement automatique de la langue.  -  Documentation et bibliothèques, 52(2), p. 149-156 (2006).

  • (4) - DALBIN (S.) -   Thésaurus et informatiques documentaires : partenaires de toujours ?  -  Documentaliste, Sciences de l'information, 44(1), p. 42-55 (2007).

  • (5) - GANZMANN (J.) -   Criteria for the evaluation of thesaurus software.  -  International Classification, 17, p. 148-157 (1990).

  • (6) - GROUPE LANGAGES DOCUMENTAIRES DE L'ADBS -   Les normes de conception, gestion et maintenance de thésaurus : évolutions récentes et perspectives.  -  ...

1 Outils logiciels(liste non exhaustive)

MTM (gratuit) http://www.icie.com.pl/

The W32 (gratuit) http://publish.uwo.ca/~craven/freeware.htm

AGROVOC Thesaurus tools (logiciel libre) http://sourceforge.net/projects/agrovoct

ThManager (logiciel libre) http://thmanager.sourceforge.net

Cognatrix (logiciel commercial) http://www.lgosys.com/products/Cognatrix/index.html

ITM T3 (Terminologie, Thésaurus, Taxonomie, Dictionnaire de métadonnées) (logiciel commercial) http://www.mondeca.com/fr/Produits/ITM-T3

Multites (logiciel commercial) http://www.multites.com

MyThesaurus (logiciel commercial) http://www.mythesaurus.fr/fr/index.php

Thesaurus Builder (logiciel commercial) http://www.thesaurusbuilder.com/Default.aspx

Thesaurus Master (Data Harmony) (logiciel commercial) http://www.dataharmony.com/products/thesaurus_master.html

...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(76 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS