Présentation
EnglishRÉSUMÉ
Les traces de l'activité du monde socio-économique sont l'objet d'analyse de toutes sortes pour mesurer des tendances ou prédire des directions futures. Le succès de la fouille de ces données tient à la découverte de motifs structuraux et à leur interprétation, qui reste l'affaire d'un utilisateur humain. Lui seul peut juger de la pertinence d'un résultat, en apprécier le sens et l'impact potentiel, et le cas échéant prendre les bonnes décisions. La visualisation d'information mise sur notre capacité à repérer facilement ces motifs graphiques. Le défi est donc de proposer à l'utilisateur une cartographie des données mettant en scène ces motifs, et lui donner le pouvoir d'agir sur la visualisation pour accéder aux données sous-jacentes.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Guy MELANÇON : CNRS UMR 5800 LaBRI et Université de Bordeaux
INTRODUCTION
Toute activité aujourd'hui – des entreprises, des organisations, des institutions – est synonyme de production ou de récolte de données pour conserver une trace de cette activité ou de celles de ses acteurs. Le monde de la recherche développe des méthodes propres à tirer profit de ces données, pour les fouiller, les analyser, les modéliser. L'activité de veille, qui conjugue récolte et analyse des données, est au cœur d'un processus permettant aux acteurs socio-économiques d'ajuster en permanence leur position et leur stratégie par rapport à leur environnement.
Les données ainsi récoltées et stockées sont souvent complexes, tout autant que les phénomènes dont elles dérivent, mais aussi souvent parce qu'elles sont non structurées. Les algorithmes de la fouille permettent de faire émerger de ces données des motifs structuraux ou des règles d'association, première forme de connaissances gagnées sur les données. Des entreprises sont intéressées à dessiner les profils de leurs clients pour mieux cibler leurs actions commerciales, par exemple ; des observateurs du débat public voudront identifier les acteurs déterminant les barycentres des opinions. Parce que les données sont massives et complexes, les résultats de la fouille le sont souvent tout autant. Il faut trier et classer ces résultats pour arriver à une synthèse utile pour la prise de décision, ou pour formuler une hypothèse explicative du phénomène étudié.
Le succès de l'opération de fouille tient à la possibilité de lire les motifs découverts. L'interprétation de ces motifs, l'évaluation de leur pertinence et du potentiel applicatif des résultats de la fouille reste une affaire bien humaine, dont la complexité et la subtilité ne peuvent à ce jour être confiées à un automate. Seul l'humain peut in fine juger de la pertinence d'un résultat, en apprécier le sens et l'impact potentiel, et le cas échéant prendre les bonnes décisions.
Le domaine de la visualisation d'information s'appuie au départ sur une observation fondamentale : environ 20 % de nos activités cérébrales sont consacrées au traitement de signaux visuels . Le défi qui se pose est donc de proposer à l'utilisateur une cartographie des données qui lui permet, d'une part de repérer visuellement les motifs devenus graphiques, et d'autre part de pouvoir agir sur la visualisation pour accéder aux données sous-jacentes ou modifier la représentation afin de comprendre la structure qui est exposée. C'est là le défi de la visualisation et l'enjeu qu'il y a à bien la concevoir et l'utiliser.
Il n'est donc pas étonnant de trouver la visualisation au rang des piliers technologiques des grands programmes de recherche nationaux et européens. Il y a 20 ans déjà, les agences américaines NIH et NSF en faisaient une priorité . La valeur ajoutée de la donnée et la valeur ajoutée de son exploitation dans toutes les sphères sociales et industrielles sont aujourd'hui le moteur du développement de la visualisation analytique.
Cet article commence par poser un regard historique sur les motivations du développement de la science de la visualisation analytique. La visualisation est ensuite présentée comme un processus issu de l'analyse de proximités entre les entités étudiées. Des exemples de visualisations maintenant classiques viennent illustrer le texte : projection de données multidimensionnelles, coordonnées parallèles, dessin de graphes, paradigme de pavage (« space-filling »), visualisation orientée pixel, vue matricielle. L'article se clôt sur une présentation d'approches émergentes proposant la combinaison de vues classiques de manières diverses : les visualisations hybrides. Les articles cités au long de l'article sont un bon point de départ pour connaître le détail des techniques présentées ici.
MOTS-CLÉS
projection multi-dimensionnelle calcul de similarités dessin de graphes analyse de données statistiques exploratoires exploration de données cartographie de données
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Big Data > Visualisation d'information > Accompagner un virage scientifique
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Accompagner un virage scientifique
ce paragraphe est entièrement inspirée des écrits de Gray à qui l'on doit d'avoir promu la vision qui est exposée ici. J'emprunte aussi la plume de Benjamin Renoust pour commenter Gray, en reprenant les paragraphes introductifs de son manuscrit de thèse .
La science née au millénaire dernier s'est efforcée de décrire les phénomènes du monde physique par une maîtrise des techniques nécessaires à leur explication ou à leur reproduction : cette science était fondamentalement empirique . Quelques siècles plus tard, la science apportait un pouvoir prédictif en développant des modèles et en formulant des lois. Cette science s'était donné des outils théoriques lui permettant de postuler des théories qui pouvaient alors être confirmées ou réfutées par l'observation. Les dernières décennies ont vu un accroissement de la complexité des modèles formulés pour expliquer des phénomènes, complexes eux aussi. La démarche analytique a laissé la place à la simulation des modèles profitant de moyens de calculs grandissants : la science a accéléré son développement en devenant computationnelle. Ces mêmes moyens de calculs autorisent aujourd'hui la production de données abstraites sans géométrie intrinsèque, issues de capteurs ou de traces d'activités numériques par exemple, dont le volume croît de manière exponentielle. La science d'aujourd'hui apporte un nouveau paradigme, celui de l'exploration des données qui vise à unifier expériences, théories et simulations.
Le défi posé à cette nouvelle science consiste à gérer des données complexes, diverses et volumineuses. On reconnaît là les axiomes du « Big...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Accompagner un virage scientifique
BIBLIOGRAPHIE
-
(1) - AHLBERG (C.), SCHNEIDERMAN (B.) - Visual information seeking : tight coupling of dynamic query filters with starfield displays. - ACM Press, p. 313-317 (1994).
-
(2) - AUBER (D.), NOVELLI (N.), MELANÇON (G.) - Visually mining the data cube using a pixel-oriented technique. - IEEE Computer Society, p. 3-10 (2007).
-
(3) - AUBER (D.), ARCHAMBAULT (D.), BOURQUI (R.), DELEST (M.), DUBOIS (J.), PINAUD (B.), LAMBERT (A.), MARY (P.), MATHIAUT (M.), MELANÇON (G.) - Tulip III. - Encyclopedia of Social Network Analysis and Mining, éd. ALHAJJ (R.S.) et ROKNE (J.G.), Springer, p. 2216-2240 (2014).
-
(4) - AUPETIT (M.) - Visualizing distortions and recovering topology in continuous projection techniques. - Neurocomputing, 70(7-9), p. 1304-1330 (2007).
-
(5) - BALZER (M.),, DEUSSEN (O.) - Voronoi treemaps. - IEEE Computer Society (2005).
-
...
ANNEXES
GapMinder (Hans Rosling) – A fact-based worldview http://www.gapminder.org
Site web de Patrick Healey http://www.csc.ncsu.edu/faculty/healey/PP/
Color Brewer http://www.colorbrewer2.org/
Exemples de cartes interactives ou statiques http://www.visualcomplexity.com
Site maintenu par Claude Aschenbrenner http://www.serialmapper.com
Site de Daniel Huffman http://www.cartastrophe.wordpress.com
New York Times – Présentation des grandes masses budgétaires du gouvernement Obama http://www.nytimes.com/packages/html/newsgraphics/2011/0119-budget/
Site Market Watch http://www.marketwatch.com/tools/stockresearch/marketmap
HAUT DE PAGECet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive