Une interface vocale réaliste

Une équipe de l'UE a travaillé sur l'amélioration de la reconnaissance du langage humain par ordinateur. Pour cela, les chercheurs ont alimenté des ordinateurs avec de grandes quantités de matériaux sources sous format préstructuré, traitées à l'aide de nouveaux algorithmes permettant une autostructuration.

Les ordinateurs restent très limités dans le domaine de l'interprétation des communications humaines naturelles. L'une des raisons est que la principale méthode utilisée pour instruire les ordinateurs, l'annotation par des experts, est elle-même lente, coûteuse et sans souplesse.

Le projet HELENLP (Heterogeneous learning for natural language processing), financé par l'UE, avait pour objectif de développer des systèmes aux capacités améliorées pour interagir avec les humains. Le projet s'est concentré sur l'amélioration des performances en ajoutant une nouvelle gamme large de sources numériques, avec des degrés variés d'annotation. À l'aide des algorithmes prévus, les ordinateurs doivent pouvoir être capables d'interpréter automatiquement les sources en effectuant des requêtes à un annotateur. L'équipe avait pour intention de développer des algorithmes d'annotation supplémentaires avec pour objectif final d'améliorer la compréhension par la machine du langage naturel et des textes.

Le travail s'est concentré sur de nouvelles méthodes de calcul et de statistiques pour intégrer et analyser les sources numériques. Les chercheurs ont développé des moyens passifs d'annoter des données partiellement annotées, sans annotateur, ainsi que des méthodes actives utilisant un annotateur. Les nouveaux algorithmes permettent également un apprentissage simultané par combinaison de plusieurs sources de données annotées. Les applications incluent la catégorisation des textes ainsi que la segmentation et la reconnaissance des phonèmes.

L'entreprise a atteint son objectif de réintégration d'un groupe de recherche puissant. Cela a abouti à la création d'un ensemble de chercheurs, des financements supplémentaires et des publications de recherche.

Les nouveaux algorithmes HELENLP pourraient améliorer le traitement informatique des communications humaines naturelles.

publié: 2016-03-15
Commentaires


Privacy Policy