Le projet ENEUS («Testing the portability of techniques to handle
dissimilar source and target languages in MT»), financé par l'UE, a
réuni des experts en linguistique, en informatique et en traduction. Les
travaux réalisés sont importants pour les utilisateurs de la traduction
automatique et pour l'étude des interactions entre les ordinateurs et
les langages humains.
Le projet ENEUS a mesuré la capacité à porter vers différentes
paires de langues l'architecture de traduction automatique Matxin. Il a
évalué la capacité du système à utiliser comme source des langues
analytiques (comme l'anglais), et des langues agglutinantes (comme le
basque) en tant que cible. L'architecture Matxin s'est avérée adaptée à
la traduction de langues de même type car elle utilise une analyse
approfondie axée sur la morphosyntaxe.
Un prototype de traduction automatique basée sur des règles a été
conçu au terme d'un travail visant à transposer le système actuel de
traduction, qui va de l'espagnol vers le basque, à une traduction de
l'anglais vers le basque. Le prototype contient 35 000 entrées. Il peut
traduire des phrases simples affirmatives, négatives et interrogatives
aux temps de l'indicatif pour les quatre types de relation sujet-objet,
aux voix passive et active, et aux temps de l'impératif.
L'équipe du projet ENEUS a étudié les caractéristiques de langues
agglutinantes que sont le basque, le finnois et le hongrois, ainsi que
l'ordre des mots de ces langues et de l'anglais.
Les travaux du projet ont montré clairement que les systèmes de
traduction automatique ne gèrent pas de manière égale toutes les langues
agglutinantes, et qu'une approche plus orientée sur la langue source
devrait être envisagée en raison des avantages qu'elle présenterait.
L'étude de l'alignement des paires anglais-finnois, anglais-hongrois et
anglais-basque a conduit à la conception de systèmes de traduction
automatique ENEUS adaptés à toutes les paires.
Dans le cadre du programme de sensibilisation ENEUS, plus de 500
utilisateurs ont contribué à la campagne d'évaluation par l'humain. Ils
ont comparé quatre systèmes de traduction automatique anglais-basque
développés par le projet, ainsi que l'outil de traduction avancée de
Google. Les résultats ont montré que le système morphologique et l'outil
de traduction de Google étaient équivalents, mais supérieurs aux autres
solutions.
Le système ENEUS le plus performant a été intégré au Bologna
Translation Service à Elhuyar, et les utilisateurs pourront accéder aux
prototypes ENEUS depuis le site web Matxin (accessible via
Elhuyar).
Le système de traduction automatique basé sur des règles est le premier
système open source de traduction automatique anglais-basque.
Disponible aux développeurs via
sourceforge, il permet de concevoir des solutions et de traduire depuis l'anglais et l'espagnol vers n'importe quelle autre langue.