À propos
En 2012-2014, l’Université de Vilnius a mis en œuvre le projet " Développement des systèmes de traduction automatique anglais-lituanien-anglais et français-lituanien-français sur la base de méthodes statistiques ", financé par les Fonds structurels de l’Union européenne. Le système de traduction automatique (TA) ALPMAVIS a été créé et le service statistique de TA en ligne (https://www.versti.eu/) a été mis à la disposition du public, et est également accessible par le biais du système d’information intégré sur les ressources linguistiques et écrites en langue lituanienne, " Raštija.lt " (www.raštija.lt). La création et le développement de systèmes de traduction automatique constituent un défi intellectuel moderne qui intéresse non seulement les milieux universitaires, mais aussi l’ensemble de la société qui utilise les technologies modernes d’information. En 2013, des réseaux neuronaux artificiels ont été utilisés pour la traduction automatique (TA) et l’idée d’utiliser des cartes graphiques pour le calcul des réseaux neuronaux a ouvert de nouvelles voies pour exécuter des tâches concrètes, notamment la traduction automatique. Des millions de neurones artificiels sont utilisés pour la TA neuronale ; la traduction automatique est de plus en plus associée au développement de l’intelligence artificielle et la qualité de la traduction se rapproche de plus en plus de celle d’un humain.
Les nouvelles possibilités ont permis d’améliorer le système de traduction automatique de l’Université de Vilnius. L’équipe du projet, dirigée par le Dr. Arūnas Samuilis, a terminé un nouveau projet intitulé " Amélioration et développement des systèmes de traduction automatique et des services de localisation " et a créé un nouvel environnement de traduction en libre-accès et gratuit. Les tâches suivantes ont été effectuées :
-
De nouvelles technologies et des ressources linguistiques supplémentaires ont été mises au point pour améliorer la qualité des systèmes de TA précédents :
- Des solutions nouvellement développées ont été intégrées à l’infrastructure de traduction automatique de l’Université de Vilnius, permettant ainsi au système de TA d’apprendre automatiquement à partir des résultats des traductions éditées par les utilisateurs. Cette fonctionnalité permet d’obtenir de meilleurs résultats de TA chaque fois qu’une traduction est éditée. Il est particulièrement important que les utilisateurs qui traduisent et éditent le texte puissent immédiatement observer les avantages de cette fonctionnalité (il ne sera pas nécessaire de mettre en place des processus distincts de formation au système, ce qui prend beaucoup de temps).
- Des ressources linguistiques supplémentaires (textes et dictionnaires, listes de termes, thésaurus lituanien et outils de pré-édition, méthodes linguistiques contrôlées, etc.) ont été mises au point, traitées et révisées afin d’améliorer la qualité du système de TA précédent.
- Pour obtenir une polyvalence et une application plus larges du système de traduction (également pour les travaux professionnels), la traduction fluide du texte a été complétée par une fonctionnalité de traduction de dictionnaire plus précise des mots/expressions individuels.
- Lors de la collecte et du traitement des ressources linguistiques, une attention particulière a été accordée aux textes traitant des domaines de la médecine, du droit et de la communication.
- Un module de TA a été mis au point pour le progiciel d’applications bureautiques OpenOffice/LibreOffice, qui permet de communiquer avec les systèmes de traduction automatique sur www.versti.eu et de traduire les textes des utilisateurs.
- Des technologies basées sur des réseaux neuronaux ont été utilisées et des possibilités ont été créées pour les utiliser afin d’améliorer la qualité des systèmes de TA existants.
- Les paires de langues de traduction automatique suivantes ont été installées dans l’infrastructure existante : Lituanien-anglais-lituanien, lituanien-français-lituanien, lituanien-polonais-lituanien, lituanien-russe-lituanien et lituanien-allemand-lituanien. Ces paires de langues sont choisies en fonction des besoins réels de la société.
- L’infrastructure de TA est adaptée pour fournir des services gouvernementaux en ligne, car les solutions et outils de TA doivent non seulement être accessibles au public, mais aussi facilement adaptables à la prestation de services gouvernementaux en ligne. Des programmes s’exécutant sur l’ordinateur et/ou le serveur du client ont été élaborés et sont capables de traduire et présenter les informations délivrées par les institutions fournissant des services gouvernementaux en ligne dans la langue choisie (par exemple, " epaslaugos.lt "). Des systèmes de TA spécifiques à chaque domaine ont également été mis au point et intégrés au service. L’installation d’infrastructures pour la prestation de services en ligne de TA a été préparée.
Des solutions de reconnaissance et de synthèse vocales mises au point dans le cadre du projet de l’UV " Développement de services de gestion vocale en lituanien – LIEPA 2 " ont été mises en œuvre dans la plateforme de traduction automatique. Cela permet aux utilisateurs de www.versti.eu de dicter le texte lituanien, le corriger, le traduire dans les langues choisies, l’entendre, corriger le texte traduit et le diffuser par d’autres canaux de communication (par exemple, transfert vers un éditeur de texte, rédaction d’e-mails, diffusion sur les réseaux sociaux).