Une impulsion pour le traitement des données et l'extraction «à la volée»

Un moyen plus rapide de collecter et de traiter des données permettrait d'améliorer l'efficacité des équipements dans le domaine biomédical et au-delà.

Dans un monde où l'information explose, la tâche de la collecte et de l'extraction des données est capitale pour créer des applications haute technologie plus puissantes et concevoir des équipements plus rapides. Une méthode importante dans ce cadre consiste à éliminer les données redondantes via une meilleure modélisation moins dense, un secteur qui connaît un développement rapide qui réunit statistiques, apprentissage machine et traitement du signal. En termes informatiques, les modèles peu denses comprennent principalement des zéros et seulement quelques paramètres différents de zéro, exploitant de nouveaux outils théoriques et algorithmiques pour atteindre ses objectifs.

Dans ce cadre, le projet financé par l'UE SOL (Sparse Online Learning) a travaillé au développement d'une nouvelle théorie et d'algorithmes pour l'apprentissage à la volée sensible à la faible densité. Au lieu de se fier au stockage des données et ensuite de les traiter, le projet a cherché à les traiter immédiatement en temps réel dès leur disponibilité.

Pour atteindre cet objectif, l'équipe du projet a élaboré les algorithmes requis sensibles à la faible densité d'une manière qui permet un fonctionnement efficace en temps réel. L'équipe a intégré des structures de densité de pointe dans le cadre d'apprentissage en ligne et a amélioré le processus d'apprentissage en récoltant des données d'appareils à plusieurs capteurs et des topologies qui exploitent des structures de faible densité communes. Cela a impliqué le développement d'une plateforme pour évaluer avec précision les nouvelles techniques articulées contre d'autres acteurs ou concurrents sur le terrain.

En appliquant les dernières techniques développées à l'industrie biomédicale, SOL a développé un électrocardiogramme (ECG) sans fil innovant plus économique en énergie et potentiellement plus puissant que la technologie ECG existante.

L'équipe a également étudié des cas plus généraux où la faible densité et les structures de pointe sont utilisées dans la factorisation matricielle et l'analyse des données. Elle a étudié des tâches générales impliquant un suivi sous-spatial robuste, un apprentissage de dictionnaire en ligne et distribué et une factorisation matricielle basée sur l'apprentissage de dictionnaire dans l'analyse de l'imagerie par résonance magnétique fonctionnelle (IRMf).

De nouveaux outils mathématiques alternatifs impliquant des projections aléatoires ont été appliqués à la réduction de la dimensionnalité et adaptées à des algorithmes développés précédemment, réduisant le temps de calcul pour l'analyse des données d'IRMf. L'équipe a ensuite développé une nouvelle méthode de régression linéaire robuste basée sur des projections aléatoires pour de grandes applications de données.

Les nouveaux algorithmes et techniques de modélisation, d'analyse et/ou de reconstruction des signaux se sont révélés très utiles, en particulier depuis qu'ils fonctionnent en ligne plutôt que par lots. Ils peuvent stocker de grandes quantités de données très efficacement, ouvrant la porte à de nombreuses nouvelles applications et applications émergentes requérant une telle complexité. Les résultats intéressants du projet ont été publiés dans des magazines de pointe, plusieurs chapitres de livres et de nombreuses publications de conférences.

publié: 2016-04-29
Commentaires


Privacy Policy