De nouvelles méthodes d'exploration des données massives

Dans un contexte où la société se doit de comprendre des ensembles de données toujours plus gros et complexes, des chercheurs de l'UE se tournent vers le subconscient pour aider à débrouiller ce déluge d'informations.

Les données massives (ou Big data) font référence aux très grandes quantités de données, générées très rapidement par un grand nombre de sources très variées. Ces données peuvent être crées par des individus ou générées par des machines, comme des capteurs collectant des informations sur le climat, l'imagerie par satellite, les images et vidéos numériques, les enregistrements des transactions d'achats, les signaux GPS, etc. Les données massives recouvrent de nombreux secteurs, de la santé aux transports et à l'énergie.

Les données sont devenues un facteur clé de l'économie et de nos sociétés, à l'image des domaines plus classiques tels que les ressources humaines et financières. Les analystes sont aujourd'hui confrontés à d'énormes quantités de données, qu'ils doivent trier pour trouver des solutions aux problèmes actuels.

Qu'il s'agisse d'informations géographiques, statistiques, de données météorologiques, de données issues de la recherche, des transports, de la consommation énergétique ou encore de la santé, la nécessité d'extraire le sens de ces données massives conduit à des innovations technologiques, au développement de nouveaux outils et à de nouvelles compétences. C'est de fait l'un des grands défis du volet «TIC» d'Horizon 2020, le nouveau programme de recherche et d'innovation de l'UE.

Mais l'évaluation des données massives et leur gestion pourraient bénéficier de l'aide inattendue de notre subconscient. Nous n'avons conscience que d'environ 10% de l'activité de notre cerveau, aussi le projet CEEDS cherche à exploiter les 90% restants, afin de voir s'ils pouvaient nous aider à trouver ce que nous cherchons.

En utilisant des outils de réalité virtuelle pour effectuer la saisie de grands volumes de données, le projet CEEDS («Collective Experience of Empathic Data Systems») essaie d'établir une «perception» du subconscient en évaluant les réactions physiologiques et sensorielles face à un afflux de données massives. Les chercheurs ont construit une plateforme qui exploite des outils de réalité virtuelle pour la saisie de ces grands ensembles de données. Cette plateforme s'appuie sur toute une gamme de systèmes sensoriels: visuels, sonores et tactiles, et surveille les réactions du sujet soumis à l'expérience pour déterminer sur quels éléments se porte son attention et dans quelle mesure.

La plateforme XIM (eXperience Induction Machine) de CEEDS, située au centre de systèmes autonomes et de neuriobiotique sous la direction du professeur Paul Verschure de l'Universitat Pompeu Fabra de Barcelone, est conçue pour aider les analystes à mieux assimiler les ensembles complexes de données massives. Mais en surveillant leurs réactions, elle fournit aussi un retour qui pourrait servir à concevoir des présentations de données plus accessibles.
Les premiers «cobayes» des chercheurs de CEEDS ont été des spécialistes des neurosciences. La plateforme a utilisé les ensembles de données habituellement générés par cette discipline scientifique, et les a animés avec des stimuli visuels et sonores.

Les sujets sont placés dans la salle d'immersion 3D de la plateforme, dans laquelle divers dispositifs et capteurs servent à examiner leurs réactions. Des capteurs permettent de suivre les positions et les mouvements du corps. Un oculomètre indique au sujet où regarder et surveille les dilatations de la pupille pour détecter les signes de stress. Un gant «ressent» les mouvements de la main, mesure la préhension et les réactions de la peau. Des caméras analysent les expressions du visage. Un équipement vocal reconnaît les caractéristiques émotionnelles du discours et des réactions vocales du sujet. Et une veste spécialement conçue surveille la fréquence cardiaque et le rythme de la respiration.

Le système a mesuré les réactions des neurologues face aux données et, avec des indices subliminaux, tels que des flèches clignotantes, elle les a guidés vers des zones qui pourraient les intéresser davantage. Le système les a aussi aidés lorsqu'ils étaient fatigués ou débordés par les informations, en changeant la présentation en fonction de leur humeur. Le professeur Jonathan Freeman, psychologue à la Goldsmiths University de Londres et coordinateur de CEEDS, commente: «La plateforme aide les sujets en simplifiant la visualisation des données lorsqu'elle est trop complexe ou difficile à assimiler, et intensifie la présentation lorsqu'ils semblent s'ennuyer.»

Le fait d'accélérer l'analyse des données est très utile

La nouveauté de l'approche du CEEDS est d'avoir associé pour la première fois des composants déjà disponibles séparément, dans le but de faciliter la compréhension des données massives par l'homme.

La plateforme CEEDS ne manque pas d'applications possibles, comme l'inspection d'imagerie par satellite, la prospection pétrolière, l'astronomie, l'économie ou la recherche en histoire. «Partout où l'on trouve une masse de données, qui demande beaucoup de temps ou d'effort, le système peut être utile», ajoute le professeur Freeman. «Nous constatons qu'il est très difficile d'analyser toutes les données qui se présentent à un sujet, simplement à cause du temps de traitement nécessaire. Aussi, tout système capable d'accélérer le processus et de le rendre plus efficace serait d'une grande valeur.»

Les développements de la plateforme CEEDS pourraient s'appliquer au-delà des données massives. Ils pourraient faciliter la collecte des commentaires des utilisateurs dans des contextes réels comme des magasins, des musées ou des bibliothèques. Les artistes de scène et les DJ pourraient obtenir un retour en temps réel d'information de leurs auditeurs s'ils portent, par exemple, des bracelets mesurant l'intensité de leurs mouvements de danse, leur température et leur taux de sudation. Et en classe, les enseignants pourraient être plus efficaces en reliant leurs étudiants à leurs propres réactions inconscientes face à des schémas ou autres représentations de données. Les chercheurs de CEEDS ont aussi exploré comment utiliser leur système pour intégrer dans une base de données l'expérience d'un archéologue qui identifie, par exemple, des tessons de poterie vieux de 2000 ans, afin d'accélérer les identifications ultérieures.

Avec 16 partenaires originaires de 9 pays, le projet CEEDS a reçu 6,5 millions d'euros au titre du 7e programme-cadre, dans le domaine des Technologies futures et émergentes.

Lien au projet sur CORDIS
Lien au site web du projet
Twitter
FET: Technologies futures et émergentes

publié: 2015-01-22
date d'une dernière modification: 2015-01-23
Commentaires


Privacy Policy