Présentation
EnglishRÉSUMÉ
Les traces de l'activité du monde socio-économique sont l'objet d'analyse de toutes sortes pour mesurer des tendances ou prédire des directions futures. Le succès de la fouille de ces données tient à la découverte de motifs structuraux et à leur interprétation, qui reste l'affaire d'un utilisateur humain. Lui seul peut juger de la pertinence d'un résultat, en apprécier le sens et l'impact potentiel, et le cas échéant prendre les bonnes décisions. La visualisation d'information mise sur notre capacité à repérer facilement ces motifs graphiques. Le défi est donc de proposer à l'utilisateur une cartographie des données mettant en scène ces motifs, et lui donner le pouvoir d'agir sur la visualisation pour accéder aux données sous-jacentes.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Guy MELANÇON : CNRS UMR 5800 LaBRI et Université de Bordeaux
INTRODUCTION
Toute activité aujourd'hui – des entreprises, des organisations, des institutions – est synonyme de production ou de récolte de données pour conserver une trace de cette activité ou de celles de ses acteurs. Le monde de la recherche développe des méthodes propres à tirer profit de ces données, pour les fouiller, les analyser, les modéliser. L'activité de veille, qui conjugue récolte et analyse des données, est au cœur d'un processus permettant aux acteurs socio-économiques d'ajuster en permanence leur position et leur stratégie par rapport à leur environnement.
Les données ainsi récoltées et stockées sont souvent complexes, tout autant que les phénomènes dont elles dérivent, mais aussi souvent parce qu'elles sont non structurées. Les algorithmes de la fouille permettent de faire émerger de ces données des motifs structuraux ou des règles d'association, première forme de connaissances gagnées sur les données. Des entreprises sont intéressées à dessiner les profils de leurs clients pour mieux cibler leurs actions commerciales, par exemple ; des observateurs du débat public voudront identifier les acteurs déterminant les barycentres des opinions. Parce que les données sont massives et complexes, les résultats de la fouille le sont souvent tout autant. Il faut trier et classer ces résultats pour arriver à une synthèse utile pour la prise de décision, ou pour formuler une hypothèse explicative du phénomène étudié.
Le succès de l'opération de fouille tient à la possibilité de lire les motifs découverts. L'interprétation de ces motifs, l'évaluation de leur pertinence et du potentiel applicatif des résultats de la fouille reste une affaire bien humaine, dont la complexité et la subtilité ne peuvent à ce jour être confiées à un automate. Seul l'humain peut in fine juger de la pertinence d'un résultat, en apprécier le sens et l'impact potentiel, et le cas échéant prendre les bonnes décisions.
Le domaine de la visualisation d'information s'appuie au départ sur une observation fondamentale : environ 20 % de nos activités cérébrales sont consacrées au traitement de signaux visuels . Le défi qui se pose est donc de proposer à l'utilisateur une cartographie des données qui lui permet, d'une part de repérer visuellement les motifs devenus graphiques, et d'autre part de pouvoir agir sur la visualisation pour accéder aux données sous-jacentes ou modifier la représentation afin de comprendre la structure qui est exposée. C'est là le défi de la visualisation et l'enjeu qu'il y a à bien la concevoir et l'utiliser.
Il n'est donc pas étonnant de trouver la visualisation au rang des piliers technologiques des grands programmes de recherche nationaux et européens. Il y a 20 ans déjà, les agences américaines NIH et NSF en faisaient une priorité . La valeur ajoutée de la donnée et la valeur ajoutée de son exploitation dans toutes les sphères sociales et industrielles sont aujourd'hui le moteur du développement de la visualisation analytique.
Cet article commence par poser un regard historique sur les motivations du développement de la science de la visualisation analytique. La visualisation est ensuite présentée comme un processus issu de l'analyse de proximités entre les entités étudiées. Des exemples de visualisations maintenant classiques viennent illustrer le texte : projection de données multidimensionnelles, coordonnées parallèles, dessin de graphes, paradigme de pavage (« space-filling »), visualisation orientée pixel, vue matricielle. L'article se clôt sur une présentation d'approches émergentes proposant la combinaison de vues classiques de manières diverses : les visualisations hybrides. Les articles cités au long de l'article sont un bon point de départ pour connaître le détail des techniques présentées ici.
MOTS-CLÉS
projection multi-dimensionnelle calcul de similarités dessin de graphes analyse de données statistiques exploratoires exploration de données cartographie de données
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Documents numériques Gestion de contenu > Gestion de contenus numériques > Visualisation d'information > C'est une affaire de distances…
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. C'est une affaire de distances…
Pour les besoins de l'exposé, nous plaçons dans un même cadre la théorie de la communication et celle des interfaces homme- machine. Construire une visualisation, c'est construire une interface dont l'objectif est de communiquer l'intention de son auteur qui, elle-même, s'appuie sur les données dont la carte révèle une interprétation.
La difficulté à communiquer tient aux déformations potentielles que peut connaître le message depuis l'émetteur (le concepteur de la visualisation) jusqu'au récepteur (l'utilisateur), définissant implicitement une distance entre l'information émise et l'information reçue. On peut reprendre et identifier trois niveaux auxquels cette distance s'installe :
-
le premier niveau correspond à la perception. La carte se doit de tenir compte des contraintes imposées par notre dispositif visuel en jouant de manière adéquate avec les couleurs, les contrastes, la luminosité, entre autres choses. L'œil peut être trompé par des effets intentionnels ou non-intentionnels (on peut penser aux nombreuses illusions d'optique dont on s'amuse parfois ). L'auteur peut aussi introduire des biais en ignorant les limitations de certains utilisateurs (daltonisme). De manière générale, l'œil et le cerveau répondent à des mécanismes pré-attentifs nous procurant une terrible efficacité perceptive dont il faut savoir jouer avec justesse (Voir le site de P. Healey indiqué dans le [H 7 417 doc]). Il existe de nombreuses préconisations pour l'utilisation des couleurs, notamment dans le contexte de la cartographie, comme...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
C'est une affaire de distances…
BIBLIOGRAPHIE
-
(1) - AHLBERG (C.), SCHNEIDERMAN (B.) - Visual information seeking : tight coupling of dynamic query filters with starfield displays. - ACM Press, p. 313-317 (1994).
-
(2) - AUBER (D.), NOVELLI (N.), MELANÇON (G.) - Visually mining the data cube using a pixel-oriented technique. - IEEE Computer Society, p. 3-10 (2007).
-
(3) - AUBER (D.), ARCHAMBAULT (D.), BOURQUI (R.), DELEST (M.), DUBOIS (J.), PINAUD (B.), LAMBERT (A.), MARY (P.), MATHIAUT (M.), MELANÇON (G.) - Tulip III. - Encyclopedia of Social Network Analysis and Mining, éd. ALHAJJ (R.S.) et ROKNE (J.G.), Springer, p. 2216-2240 (2014).
-
(4) - AUPETIT (M.) - Visualizing distortions and recovering topology in continuous projection techniques. - Neurocomputing, 70(7-9), p. 1304-1330 (2007).
-
(5) - BALZER (M.),, DEUSSEN (O.) - Voronoi treemaps. - IEEE Computer Society (2005).
-
...
ANNEXES
GapMinder (Hans Rosling) – A fact-based worldview http://www.gapminder.org
Site web de Patrick Healey http://www.csc.ncsu.edu/faculty/healey/PP/
Color Brewer http://www.colorbrewer2.org/
Exemples de cartes interactives ou statiques http://www.visualcomplexity.com
Site maintenu par Claude Aschenbrenner http://www.serialmapper.com
Site de Daniel Huffman http://www.cartastrophe.wordpress.com
New York Times – Présentation des grandes masses budgétaires du gouvernement Obama http://www.nytimes.com/packages/html/newsgraphics/2011/0119-budget/
Site Market Watch http://www.marketwatch.com/tools/stockresearch/marketmap
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive