Présentation
Auteur(s)
-
Olivier ANDRIEU : Consultant, éditeur du site Abondance.com
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Les moteurs de recherche rythment la vie numérique des internautes actuels. Carrefours indispensables pour mener à bien toute investigation sur la Toile, ils ont fortement évolué depuis les premiers outils (Excite, Webcrawler, Lycos, Altavista, etc.) jusqu'au leader actuel, Google et son challenger, Bing, que bien peu de concurrents arrivent à talonner pour l'instant. Mais l'avenir sera peut-être différent. En tout état de cause, il est intéressant de se pencher sur le fonctionnement de ces outils et leur évolution au cours des années, car la connaissance de ce que l'on peut trouver « sous le capot des moteurs » peut également nous aider à mieux mener à bien nos recherches sur le web...
VERSIONS
- Version archivée 2 de mars 2017 par Olivier ANDRIEU
- Version courante de avr. 2022 par Olivier ANDRIEU
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. Affichage des résultats
Bien sûr, tous les systèmes précédemment décrits dans cette fiche sont totalement invisibles aux internautes. Ceux-ci ne voient que le côté visible de l'iceberg :
-
le moteur d'interrogation ou interface frontale (formulaire de recherche) proposée aux utilisateurs. Plusieurs niveaux de requête (interface de recherche simple ou avancée) sont en général offerts, la recherche simple étant celle proposée par défaut ;
-
à chaque question, une requête est générée dans l'index et une page web dynamique (SERP) restitue les résultats, généralement sous forme de listes de 10 résultats par défaut (figure 9).
Tous les moteurs fonctionnent donc ainsi et la plupart des interfaces utilisateurs de rendu de résultats se ressemblent plus ou moins avec, pour certains, quelques variantes notables.
5.1 Clustering
Lancé en 1997, Northernlight proposait le classement automatique des documents trouvés dans des dossiers ou sous-dossiers (clustering) constitués en fonction des réponses. Celles-ci, intégrées à chaque dossier, étaient également triées par pertinence. Cette technique de « clusterisation » thématique des résultats est aujourd'hui notamment utilisée, entre autres :
-
par le français Exalead http://www.exalead.com/ ;
-
les américains Vivisimo http://www.vivisimo.com/ et Yippy (figure 10) http://search.yippy.com/ ;
-
sur la version américaine de Bing http://www.bing.com/ grâce à la technologie de la société Powerset http://www.powerset.com/, entreprise rachetée par Microsoft en 2008.
En 2010, Google semblait encore travailler sur de telles techniques sans qu'elles soient encore affichées dans ses résultats.
HAUT DE PAGE5.2 Recherche universelle
Petit à petit, les moteurs font évoluer leur interface « client » et intègrent d'autres...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Affichage des résultats
BIBLIOGRAPHIE
-
(1) - BRIN (S.), PAGE (L.) - The anatomy of a large-scale hypertextual web search engine. - Google http://infolab.stanford.edu/~backrub/google.html
-
(2) - FORD (D.), GRIMES (C.), TASSONE (E.) - Keeping a search engine index fresh : risk and optimality in estimating refresh rates for web pages. - Google http://www.google.com/research/pubs/archive/34570.pdf
-
(3) - O'BRIEN (S.), GRIMES (C.) - Microscale evolution of web pages. - In WWW'08 : Proceedings of the 17th International World Wide Web Conference (2008) http://www.google.com/research/pubs/archive/34428.pdf
-
(4) - GURMEET (S.M.), JAIN (A.), SARMA (A.D.) - Detecting near-duplicates for web crawling. - Stanford University, Google Inc. http://research.compaq.com/SRC/mercator/papers/www10.ps
-
(5) - NAJORK (M.), WIENER (J.L.) - Breadth-first search crawling yields high-quality pages. - Compaq http://research.compaq.com/SRC/mercator/papers/www10.ps
-
(6)...
ANNEXES
ComScore http://www.comscore.com/
Baromètres du référencement d'AT Internet http://www.atinternet.com/Ressources/Etudes/Barometre-des-moteurs/index-1-1-6-0.aspx
Abondance http://www.abondance.com
Secrets2Moteurs http://www.secrets2moteurs.com
HAUT DE PAGE
SEO Campus http://www.seo-campus.org
SMX Paris http://www.smxparis.com
HAUT DE PAGE
Veille disponible sur http://www.seobythesea.com/
HAUT DE PAGECet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive