Présentation
En anglaisRÉSUMÉ
Cet article décrit la nature, les origines et la structure du thésaurus documentaire contemporain. Il détaille ensuite les étapes, les opérations et les instruments de son développement et de sa gestion, notamment à travers ses différentes normes, directives, analyses, relations. Il aborde finalement la question de son utilisation dans les systèmes d'information automatisés (par exemple l’enregistrement et la présentation des données), sans toutefois retenir des systèmes et de modalités d'utilisation particulières. Pour conclure cet article, les utilités du thésaurus sont précisées : son aide à l’indexation, à la recherche, ou encore son exploitation par moteurs de recherche.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
This article describes the nature, the origins, and the structure of the contemporary documentation thesaurus. It provides details on the successive phases and the diverse tasks and tools related to its construction and management. Finally, it addresses matters relating to the use of the thesaurus in computerized information systems without, however, characterizing specific systems or applications. To conclude this article, the thesaurus’ utilities are specified: aid to indexing, searching, or its use by search engines.
Auteur(s)
-
Michèle HUDON : Professeur agrégé École de bibliothéconomie et des sciences de l'information Université de Montréal (Canada)
INTRODUCTION
Le thésaurus est un langage documentaire, c'est-à-dire un langage artificiel conçu pour permettre de générer la représentation formalisée des sujets dont traite un document d'une part, et du libellé des questions d'un utilisateur d'autre part, afin que ce dernier puisse repérer l'information ou les documents qui lui seront pertinents et utiles. Le thésaurus appartient à la grande variété de systèmes d'organisation des connaissances (SOC) disponibles pour faciliter la communication d'information.
Le thésaurus est désormais exploitable sous forme numérique et il constitue l'une des composantes importantes des systèmes d'information contemporains, dans les bases de données traditionnelles comme sur le web. Alors qu'il était à l'origine utilisé par des spécialistes formés à l'indexation et à la recherche d'information, le thésaurus se décline maintenant en versions utilisables par toute personne en quête d'information. Sa structure en permet également l'exploitation par des moteurs de recherche et par des logiciels de traitement de la langue naturelle au sein desquels il sert de base de connaissances.
MOTS-CLÉS
Thesaurus documentaire Recherche d'information langage documentaire Système d'organisation des connaissances SOC
KEYWORDS
thesaurus of descriptor | information retrieval | indexing and searching languages | knowledge organization systems KOS
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
8. Perspectives
L'intérêt d'imposer un certain niveau de contrôle sémantique et terminologique à la langue naturelle est reconnu aussi bien par les producteurs que par les utilisateurs des systèmes d'information contemporains. Le thésaurus documentaire est un instrument dont l'utilité n'est plus mise en doute, même en présence de moteurs de recherche capables de manipuler la langue assez efficacement. Le thésaurus est un système d'organisation et de représentation des connaissances et de l'information fiable, prévisible et stable. La disponibilité d'un thésaurus logiquement structuré et régulièrement mis à jour contribue à une amélioration marquée de la précision, de la cohérence et de la qualité de la représentation des sujets aussi bien que des résultats de la recherche d'information.
Parce qu'ils rendent possibles la représentation et le repérage très pointus, on considère que les thésaurus disciplinaires et les thésaurus d'entreprise sont plus efficaces que les langages encyclopédiques comme outil d'aide à la recherche d'information. Pour satisfaire les besoins exprimés dans leur milieu, les gestionnaires ont pris le parti de doter chacune de leurs bases de données d'un thésaurus approprié, unique, spécifique et bien sûr très performant. Ces thésaurus ont été développés dans plusieurs langues naturelles et dans le respect de caractéristiques liées à l'environnement immédiat d'utilisation. Or, l'arrivée du web et des systèmes d'information en grands réseaux a accru la nécessité et la difficulté d'utiliser plus d'un thésaurus pour exploiter plusieurs bases de données et accéder à l'information requise. L'ouverture des systèmes et la transformation des canaux traditionnels de circulation de l'information peuvent donc être coûteuses en temps, en efforts intellectuels et en argent, et cela sans même garantir une exploitation optimale des banques d'information disponibles.
La communication et le partage d'information ne sont pleinement efficaces que si les langages documentaires utilisés dans diverses bases de données sont identiques, similaires ou à tout le moins compatibles. La nécessité d'assurer l'efficacité de la recherche fédérée dans plusieurs bases de données a suscité la renaissance d'un mouvement, discrètement présent au début des années 1970, de recherche d'une solution optimale aux problèmes d'incompatibilité des lexiques et des structures ; ce...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Perspectives
BIBLIOGRAPHIE
-
(1) - AITCHISON (J.), GILCHRIST (A.), BAWDEN (D.) - Thesaurus construction and use. - 4th ed., Aslib IMI, London (2000).
-
(2) - BROUGHTON (V.) - Essential thesaurus construction - . Facet, London (2006).
-
(3) - DA SYLVA (L.) - Thésaurus et systèmes de traitement automatique de la langue. - Documentation et bibliothèques, 52(2), p. 149-156 (2006).
-
(4) - DALBIN (S.) - Thésaurus et informatiques documentaires : partenaires de toujours ? - Documentaliste, Sciences de l'information, 44(1), p. 42-55 (2007).
-
(5) - GANZMANN (J.) - Criteria for the evaluation of thesaurus software. - International Classification, 17, p. 148-157 (1990).
-
(6) - GROUPE LANGAGES DOCUMENTAIRES DE L'ADBS - Les normes de conception, gestion et maintenance de thésaurus : évolutions récentes et perspectives. - ...
ANNEXES
1 Outils logiciels(liste non exhaustive)
MTM (gratuit) http://www.icie.com.pl/
The W32 (gratuit) http://publish.uwo.ca/~craven/freeware.htm
AGROVOC Thesaurus tools (logiciel libre) http://sourceforge.net/projects/agrovoct
ThManager (logiciel libre) http://thmanager.sourceforge.net
Cognatrix (logiciel commercial) http://www.lgosys.com/products/Cognatrix/index.html
ITM T3 (Terminologie, Thésaurus, Taxonomie, Dictionnaire de métadonnées) (logiciel commercial) http://www.mondeca.com/fr/Produits/ITM-T3
Multites (logiciel commercial) http://www.multites.com
MyThesaurus (logiciel commercial) http://www.mythesaurus.fr/fr/index.php
Thesaurus Builder (logiciel commercial) http://www.thesaurusbuilder.com/Default.aspx
Thesaurus Master (Data Harmony) (logiciel commercial) http://www.dataharmony.com/products/thesaurus_master.html
...Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive