Les données massives (ou Big data) font référence aux très grandes
quantités de données, générées très rapidement par un grand nombre de
sources très variées. Ces données peuvent être crées par des individus
ou générées par des machines, comme des capteurs collectant des
informations sur le climat, l'imagerie par satellite, les images et
vidéos numériques, les enregistrements des transactions d'achats, les
signaux GPS, etc. Les données massives recouvrent de nombreux secteurs,
de la santé aux transports et à l'énergie.
Les données sont devenues un facteur clé de l'économie et de nos
sociétés, à l'image des domaines plus classiques tels que les ressources
humaines et financières. Les analystes sont aujourd'hui confrontés à
d'énormes quantités de données, qu'ils doivent trier pour trouver des
solutions aux problèmes actuels.
Qu'il s'agisse d'informations géographiques, statistiques, de
données météorologiques, de données issues de la recherche, des
transports, de la consommation énergétique ou encore de la santé, la
nécessité d'extraire le sens de ces données massives conduit à des
innovations technologiques, au développement de nouveaux outils et à de
nouvelles compétences. C'est de fait l'un des grands défis du volet
«TIC» d'Horizon 2020, le nouveau programme de recherche et d'innovation
de l'UE.
Mais l'évaluation des données massives et leur gestion pourraient
bénéficier de l'aide inattendue de notre subconscient. Nous n'avons
conscience que d'environ 10% de l'activité de notre cerveau, aussi le
projet CEEDS cherche à exploiter les 90% restants, afin de voir s'ils
pouvaient nous aider à trouver ce que nous cherchons.
En utilisant des outils de réalité virtuelle pour effectuer la saisie de grands volumes de données, le projet
CEEDS
(«Collective Experience of Empathic Data Systems») essaie d'établir une
«perception» du subconscient en évaluant les réactions physiologiques
et sensorielles face à un afflux de données massives. Les chercheurs ont
construit une plateforme qui exploite des outils de réalité virtuelle
pour la saisie de ces grands ensembles de données. Cette plateforme
s'appuie sur toute une gamme de systèmes sensoriels: visuels, sonores et
tactiles, et surveille les réactions du sujet soumis à l'expérience
pour déterminer sur quels éléments se porte son attention et dans quelle
mesure.
La plateforme XIM (eXperience Induction Machine) de CEEDS, située au
centre de systèmes autonomes et de neuriobiotique sous la direction du
professeur Paul Verschure de l'Universitat Pompeu Fabra de Barcelone,
est conçue pour aider les analystes à mieux assimiler les ensembles
complexes de données massives. Mais en surveillant leurs réactions, elle
fournit aussi un retour qui pourrait servir à concevoir des
présentations de données plus accessibles.
Les premiers «cobayes» des
chercheurs de CEEDS ont été des spécialistes des neurosciences. La
plateforme a utilisé les ensembles de données habituellement générés par
cette discipline scientifique, et les a animés avec des stimuli visuels
et sonores.
Les sujets sont placés dans la salle d'immersion 3D de la
plateforme, dans laquelle divers dispositifs et capteurs servent à
examiner leurs réactions. Des capteurs permettent de suivre les
positions et les mouvements du corps. Un oculomètre indique au sujet où
regarder et surveille les dilatations de la pupille pour détecter les
signes de stress. Un gant «ressent» les mouvements de la main, mesure la
préhension et les réactions de la peau. Des caméras analysent les
expressions du visage. Un équipement vocal reconnaît les
caractéristiques émotionnelles du discours et des réactions vocales du
sujet. Et une veste spécialement conçue surveille la fréquence cardiaque
et le rythme de la respiration.
Le système a mesuré les réactions des neurologues face aux données
et, avec des indices subliminaux, tels que des flèches clignotantes,
elle les a guidés vers des zones qui pourraient les intéresser
davantage. Le système les a aussi aidés lorsqu'ils étaient fatigués ou
débordés par les informations, en changeant la présentation en fonction
de leur humeur. Le professeur Jonathan Freeman, psychologue à la
Goldsmiths University de Londres et coordinateur de CEEDS, commente: «La
plateforme aide les sujets en simplifiant la visualisation des données
lorsqu'elle est trop complexe ou difficile à assimiler, et intensifie la
présentation lorsqu'ils semblent s'ennuyer.»
Le fait d'accélérer l'analyse des données est très utile
La nouveauté de l'approche du CEEDS est d'avoir associé pour la
première fois des composants déjà disponibles séparément, dans le but de
faciliter la compréhension des données massives par l'homme.
La plateforme CEEDS ne manque pas d'applications possibles, comme
l'inspection d'imagerie par satellite, la prospection pétrolière,
l'astronomie, l'économie ou la recherche en histoire. «Partout où l'on
trouve une masse de données, qui demande beaucoup de temps ou d'effort,
le système peut être utile», ajoute le professeur Freeman. «Nous
constatons qu'il est très difficile d'analyser toutes les données qui se
présentent à un sujet, simplement à cause du temps de traitement
nécessaire. Aussi, tout système capable d'accélérer le processus et de
le rendre plus efficace serait d'une grande valeur.»
Les développements de la plateforme CEEDS pourraient s'appliquer
au-delà des données massives. Ils pourraient faciliter la collecte des
commentaires des utilisateurs dans des contextes réels comme des
magasins, des musées ou des bibliothèques. Les artistes de scène et les
DJ pourraient obtenir un retour en temps réel d'information de leurs
auditeurs s'ils portent, par exemple, des bracelets mesurant l'intensité
de leurs mouvements de danse, leur température et leur taux de
sudation. Et en classe, les enseignants pourraient être plus efficaces
en reliant leurs étudiants à leurs propres réactions inconscientes face à
des schémas ou autres représentations de données. Les chercheurs de
CEEDS ont aussi exploré comment utiliser leur système pour intégrer dans
une base de données l'expérience d'un archéologue qui identifie, par
exemple, des tessons de poterie vieux de 2000 ans, afin d'accélérer les
identifications ultérieures.
Avec 16 partenaires originaires de 9 pays, le projet CEEDS a reçu
6,5 millions d'euros au titre du 7e programme-cadre, dans le domaine
des Technologies futures et émergentes.
Lien au projet sur CORDISLien au site web du projetTwitterFET: Technologies futures et émergentes