Présentation
EnglishRÉSUMÉ
Le Web sémantique propose dorénavant un saut qualitatif par rapport au Web actuel. Il permet de connecter différentes ressources du Web (documents et données, au sens large) par des liens sémantiques en construisant ainsi des graphes de connaissances structurés. Ceux-ci sont ensuite exploitables pour différentes tâches, en déployant ces structures et la sémantique ainsi créée. Le modèle de représentation RDF (Resource Description Framework) aide à réaliser aisément cette approche dans le Web distribué. La standardisation de ce modèle, mais aussi celle des vocabulaires décrivant les notions utilisées, permettent d'obtenir une interopérabilité généralisée. Les ontologies, au sens de l'ingénierie des connaissances, jouent alors un rôle majeur. Ces notions de Web sémantique et d'ontologie sont ainsi étroitement liées.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Philippe LAUBLET : Maître de conférences à l'université Paris-Sorbonne (Paris-4)
INTRODUCTION
En 1989, Tim Berners-Lee, futur fondateur du W3C, imagine pour le CERN, une organisation novatrice des ressources internes sous forme d'un réseau informatique distribué. La structure proposée est celle d'un graphe dont les nœuds représentent les ressources (personnes, groupes de personnes, projets, concepts, documents, objets du hardware, entités de natures diverses) et les arcs des liens étiquetés connectant les nœuds. Des exemples d'étiquettes proposées, en 1989, sont : dépend de, est partie de, réalise, réfère à, utilise, est un exemple de... Cette vision, reprenant la notion d'hypertexte est à l'origine du Web. Pourtant, malgré la rapidité de son expansion avec un nombre impressionnant de sites et d'utilisateurs, le Web actuel ne reflète qu'imparfaitement la vision initiale. Le Web ne connecte que des documents (nœuds non typés) et les liens eux-mêmes ne sont pas munis d'étiquettes typées. Les utilisateurs humains ont appris à faire avec ces limitations en s'appuyant sur leur compréhension du contenu des documents connectés et en attribuant, si possible, un sens aux liens à l‘aide du texte des ancres. Par contre, ces capacités restent largement inaccessibles aux logiciels faute d'une sémantique interprétable par les machines.
L'initiative du Web sémantique (WS), impulsée par le W3C, propose un saut qualitatif à partir du Web actuel qui, d'une certaine manière, reprend la vision originelle de Berners-Lee. Pour reprendre Berners-Lee et al. dans The Semantic Web, « le Web sémantique est une extension du Web actuel dans laquelle l'information est munie d'une signification bien définie, permettant aux ordinateurs et aux personnes de mieux travailler en coopération ».
Les promoteurs du WS proposent la construction systématique d'un niveau supplémentaire de description explicite des ressources et des liens pour une meilleure utilisation par les machines. Ce niveau spécifique de représentation est composé de ce qu'il est souvent convenu d'appeler des métadonnées ou annotations sémantiques. Il obéit à un modèle de graphe simple, le modèle RDF (cf. § 2.1), qui permet de lier sémantiquement les ressources. Mais il permet aussi des représentations complexes. Dans la suite, ressource signifie tout ce qui peut être identifié par une URI (Uniform Ressource Identifier). Ces URIs ont deux rôles, le premier d'identification, le second d'adressage (lié à un protocole dans le cas des URL), donc, dans ce cas, de localisation et d'accès. Ainsi, ressource, donnée au sens large, signifie aussi bien un livre ou un document, un lieu géographique, une notion dans un schéma conceptuel mais bien sûr aussi une page Web ou une partie de cette page, en fait toute donnée manipulée à travers son URI et ses représentations (cf. pour des exemples la note en § 2.1).
Les réalisations WS doivent le plus souvent s'appuyer sur des vocabulaires logiques standardisés pour des communautés d'utilisateurs ou même à l'échelle du Web tout entier. Dans le cas du WS, ces vocabulaires découlent d'ontologies dans un sens que nous préciserons dans la section 2.4.
À partir de ce socle commun, de nombreuses technologies ont été construites. Intéressantes en tant que telles, elles trouvent leur emploi aujourd'hui, d'une part dans des projets qui structurent et connectent des parties de plus en plus importantes du Web, comme de vastes projets en biologie ou bien encore l'initiative « Linking Open Data » (cf. WS II), d'autre part dans des applications d'entreprise déployées « localement » (cf. WS II).
Bien sûr, les perspectives ouvertes par le WS ne sont pas simplement technologiques, mais elles sont aussi sociales et économiques. Elles peuvent modifier et enrichir beaucoup d'activités individuelles et collectives, particulièrement coopératives, en facilitant la production, l'accès et l'exploitation des ressources numériques dans leur diversité.
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Big Data > Web sémantique - Principes, représentations sémantiques et ontologies > Projet du Web sémantique Web sémantique comme extension du Web actuel
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Représentation et traitement des documents numériques > Web sémantique - Principes, représentations sémantiques et ontologies > Projet du Web sémantique Web sémantique comme extension du Web actuel
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Projet du Web sémantique Web sémantique comme extension du Web actuel
Le consortium « World Wide Web » (W3C) est à l'initiative, depuis le milieu des années 1990, de la mise en place des technologies nécessaires, pour le Web, comme des protocoles de communication et des langages à balises, (X)HTML pour la présentation, XML pour certaines formes de descriptions de contenu et bien d'autres langages dont la liste serait fort longue. Le rôle du W3C, qui associe de nombreuses organisations, est d'abord de produire des recommandations pour le Web qui deviennent souvent des standards de fait après de larges processus de discussions ouverts et complexes. Pourtant, malgré la puissance des outils réalisés dans le monde entier et la mise à disposition de multiples sources d'information, on ne peut que constater que l'accès et l'exploitation de ces ressources restent fondamentalement à la charge des utilisateurs humains et constituent des processus fortement consommateurs de temps même si certains traitements informatiques de surface peuvent aider les utilisateurs humains.
Ceux-ci peuvent traiter ces informations en créant leurs propres associations et en faisant différentes inférences. Pour cela, ils ont besoin de combiner de nombreuses informations provenant souvent de sources de données multiples et hétérogènes, de plus en plus souvent accessibles par le Web, dans beaucoup de secteurs comme le tourisme ou la biologie pour donner des exemples fort différents. Par contre, les logiciels actuels ne peuvent que difficilement manipuler le sens (information partielle, documents non textuels) et ne peuvent que difficilement combiner les informations automatiquement et par des mécanismes standards. L'enjeu principal du WS est sans doute d'offrir aux machines la capacité de fusion et de combinaison des informations d'une manière standardisée.
« Pour dépasser ces limites, les propositions du Web sémantique (WS), dues au W3C, font d'abord référence à la vision du Web de demain comme un vaste espace d'échange de ressources entre êtres humains et machines, interagissant entre elles d'abord mais aussi avec leurs utilisateurs humains, permettant une exploitation, qualitativement supérieure, de grands volumes d'informations et de services variés. Pour arriver à ce résultat, le Web doit d'abord être muni de protocoles de communications communs et de langages informatiques de représentation de connaissances consensuelles qui doivent permettre d'exprimer informatiquement les connaissances descriptives ou opérationnelles associées à ces ressources, connaissances qui vont permettre leur utilisation par des agents logiciels. » ...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Projet du Web sémantique Web sémantique comme extension du Web actuel
BIBLIOGRAPHIE
-
(1) - BERNERS-LEE (T.), HENDLER (J.), LASSILA (O.) - The Semantic Web. - Scientific American, p. 34-43, mai 2001.
-
(2) - BIZER (C.), HEATH (T.), BERNERS-LEE (T.) - Linked Data. The story so far. - IJSWIS, vol. 5, Issue 3, p. 1-22 (2009).
-
(3) - LAUBLET (P.), REYNAUD (C.), CHARLET (J.) - Sur quelques aspects du Web sémantique. Assises du GDR I3. - Éditions Cépaduès, Nancy (2002).
-
(4) - USCHOLD (M.) - Where are the semantics in the Semantic Web. - AI Magazine, Fall, 24(3) (2003).
-
(5) - BERNERS-LEE (T.) - Le Web va changer de dimension. - La Recherche, p. 34-38, nov. 2007.
-
(6) - DOERR (M.), HUNTER (J.), LAGOZE (K.) - Toward a Core Ontology for Information Integration. - Journal of Digital Information, vol. 4, no 1 (2003).
-
...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive