Présentation
RÉSUMÉ
Dans un document, forme et contenu ne sont pas de même nature et doivent être gérés séparément. : tels sont les rôles du XHTML, dédié à l'expression de la structure et de son contenu, et des CSS pour la présentation. Cette séparation est poussée en avant aussi bien par les protagonistes des libres formats que par les publicitaires. L'une des conséquences indirectes de cette séparation, et non la moindre, est de faciliter l'expression et l'identification de la structure des documents, et, par suite, d'avoir une meilleure indexation de leur contenu. Ceci va dans le sens d'une caractérisation sémantique des documents attendue dans le web2.0.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Nadine SAINT-AMAND : Professeur à « Les formations Accent Net » - Ingénieure en informatique
INTRODUCTION
La syntaxe du langage de description du web a évolué depuis celle du HTML initial jusqu'à celle du XHTML basée sur XML. Toutefois, au-delà de la seule syntaxe, de mauvaises habitudes prises avec HTML se perpétuent en XHTML malgré les « recommandations » émises par le W3C (World Wide Web Consortium) pour guider son emploi. Beaucoup de documents sont décrits en XHTML de façon inefficace et peu adaptée aux besoins de maintenabilité et surtout d'adaptabilité qui seraient attendues pour favoriser la portabilité.
De façon générale, la structure interne du HTML est souvent encore utilisée directement pour déterminer l'apparence des éléments. Le rendu des documents est, certes, un critère prépondérant qui doit être considéré dans leur composition, car la forme sert avant tout à rendre perceptible la structure par le lecteur : une forme bien conçue augmente l'efficacité de la lecture. Mais forme et contenu ne sont pas de même nature et doivent être gérés séparément. Lorsque apparence et structure sont mal dissociées à la conception, l'ensemble du document souffre de leur interdépendance et devient difficilement maintenable.
L'efficacité à « faire paraître » l'information, à la mettre joliment en forme, fut le moteur d'une compétition qui a conduit les programmeurs web à souvent élaborer des pages compliquées au moyen d'ingénieux bricolages. Il est plus efficace de séparer clairement d'un document ce qui concerne son contenu et ce qui concerne sa forme. Tel est le rôle de la séparation entre le XHTML qui devrait être dédié à l'expression de la structure et de son contenu, et les CSS (Cascading Style Sheets) qui ont pour rôle de spécifier la présentation.
L'opposition être/paraître s'inscrit historiquement dans l'évolution des documents (X)HTML lors de l'apparition progressive des feuilles de style. Celles-ci s'opposèrent à des habitudes bien ancrées, et, dans cette conjoncture, leur introduction dans les plateformes existantes ne pouvait s'effectuer qu'en douceur afin de ne pas être systématiquement rejetées du marché. Leur support étant variable d'un navigateur à l'autre, divers compromis furent concédés lors des premières itérations de l'intégration des feuilles de style CSS dans les sites existants, une partie de la mise en page étant exprimée en CSS et une autre par des artifices en HTML. Du point de vue des décideurs, le critère de réussite de cette intégration est encore et toujours l'apparence visuelle.
Les feuilles de style CSS permettent de découpler la structure d'un contenu XHTML de son apparence puisque des règles simples de présentation sont énoncées pour chaque élément ou groupe d'éléments du contenu. Elles s'appliquent aussi bien à des documents HTML que XHTML ou même XML. Elles permettent, entre autres, de spécifier pour chaque objet, sa taille, sa couleur, sa police, son espacement et sa position précise dans la page.
Cette séparation entre présentation et contenu est utile et favorise l'accessibilité et l'optimisation de l'indexation. Elle est donc maintenant poussée en avant aussi bien par les protagonistes des libres formats que par les publicitaires. L'une des conséquences indirectes de cette séparation, et non la moindre, est de faciliter l'expression et l'identification de la structure des documents, et, par suite, d'avoir une meilleure indexation de leur contenu. Ceci va dans le sens d'une caractérisation sémantique des documents attendue dans le web2.0.
L'article « Feuilles de style CSS » se compose de deux fascicules :
-
[H 7 162] : « Évolution des technologies du web » ;
-
Feuilles de style CSS- Évolution des technologies du web[H 7 163] : « Aspects techniques des feuilles de style ».
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Évolution et applications des feuilles de style
4.1 Utilisation des CSS dans le contexte du web sémantique
Dans un World Wide Web sémantique idéal, on aurait un ensemble de sites avec des noms de domaines sémantiques, comportant un ensemble de pages dont la dénomination serait elle aussi significative, arborant chacune un contenu aussi riche que sémantiquement étiqueté. Ces pages seraient interreliées entre elles et avec celles des autres sites par des hyperliens <a href≥""> qui démontreraient les liens entre les concepts décrits dans les pages ou parfois entre les acteurs de l'industrie.
Les décorations : couleurs, tailles, positions et images décoratives, seraient appliquées en une couche invisible des moteurs de recherche.
HAUT DE PAGE4.1.1 Processus de lecture et d'indexation d'une page
Le processus de lecture et d'analyse des pages est différent d'un moteur à l'autre. Une ligne directrice est pourtant la tentative d'y découvrir une sémantique non simulée.
Un moteur d'indexation, tel que Googlebot, visitera une ou plusieurs pages d'un site à chaque visite, mais peut-être pas toutes les pages. Le contenu de la page index et des pages directement pointées par l'index importe le plus. Ce contenu se veut le plus accessible possible. On peut vérifier en visitant la page avec le navigateur lynx si le contenu est accessible, ou encore mesurer la distance d'accès du premier mot clé à partir du début du fichier. L'accès au fichier est séquentiel. Les moteurs tendent à accorder une plus grande importance aux mots du début de la page qu'à ceux qui sont à la fin. Il importe donc dans le document d'ordonner le contenu selon son importance, quitte à repositionner ce contenu dans la présentation, si, par exemple, on voulait le titre en bas de la page !
Même s'il est vrai qu'un document XML accompagné d'une DTD ou d'un XML Schema comporte une sémantique mieux maîtrisée, l'apport des CSS a déjà permis de faire un pas de géant, en entraînant la communauté web dans l'extraction et l'identification sémantique des contenus prolifiques des sites web, devenue ainsi accessible aux moteurs de recherche. Ceci permet le développement implicite de bases de connaissances à l'intérieur même des sites web détenus par la collectivité.
L'écart...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Évolution et applications des feuilles de style
BIBLIOGRAPHIE
-
(1) - GUILLOIS (J.-P.) - Compression de données. Compression des images. - [E 5 340] Base « Traitement du signal et ses applications » (1998).
-
(2) - CHAHUNEAU (F.) - XML. - [H 7 148] Base « Documents numériques. Gestion de contenu » (2001).
-
(3) - SAINT-AMAND (N.) - XSLT. Principe et applications. - [H 7 160] Base « Documents numériques. Gestion de contenu » (2006).
ANNEXES
1 Sites Internet (en anglais et en français)
http://www.jmir.org/2000/2/e12/
http://ksi.cpsc.ucalgary.ca/archives/WWW-TALK/www-talk-1993q2.messages/443.html
http://www.w3.org/Style/LieBos2e/history/
http://www.archive.org/index.php (Wayback machine)
http://www.hotdesign.com/seybold/everything.html
http://fr.wikipedia.org/wiki/XHTML
http://www.w3.org/Style/CSS-vs-XSL
HAUT DE PAGE
http://www.w3.org/TR/1998/REC-CSS2/
http://meyerweb.com/eric/css/edge/
http://www.vanillart.net/ala/fr/worldgrowssmall/
...Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive