Bruxelles veut des logiciels de traduction plus performants
La Commission européenne vient épauler les développeurs d'outils de traduction assistée par ordinateur en leur offrant un accès libre à sa base de données comprenant plus d'un million de phrases traduites dans 22 des 23 langues officielles de l'UE (seul le gaélique est mis de côté). Bruxelles espère que ces éléments permettront d'améliorer les outils linguistiques, comme les vérificateurs orthographiques et grammaticaux, les dictionnaires en ligne et les traducteurs automatiques, notamment dans les langues les moins utilisées, comme le letton ou le roumain.
La plupart des phrases sont issues de l'acquis communautaire, le socle commun de droits et obligations liant les Etats membres. Dans ce spicilège figurent ainsi les législations nationales adoptées pour transposer les dispositions communautaires, les traités, directives ou décisions prises par les tribunaux européens. Traduites par une armée de 1750 professionnels, les phrases mises à disposition couvrent différents sujets, notamment l'IT ou les télécoms.
La publication du corpus sera particulièrement utile aux développeurs d'outils basés sur la traduction statistique laquelle, à partir d'une association de mots, détermine la bonne tournure au regard du nombre d'occurrences répertoriées dans une base de données. Plus celle-ci est riche, meilleure sera la traduction.
L'initiative de Bruxelles n'est pas uniquement motivée par un élan d'altruisme. La Commission espère en effet que l'apparition de logiciels de traduction moins chers et plus performants profitera aux ressortissants des Etats membres parlant les langues les moins répandues de l'UE. Ils pourraient ainsi avoir accès à des informations en ligne dans leur propre langage, alors qu'elles n'étaient jusqu'alors disponibles que dans les idiomes les plus courants.