Informacje
W 2012–2014 r. Uniwersytet Wileński wdrożył projekt „Rozwój systemów tłumaczenia maszynowego w parach językowych angielski-litewski-angielski oraz francuski-litewski-francuski opartych na metodach statystycznych” finansowany z Funduszy strukturalnych Unii Europejskiej. Został utworzony system tłumaczenia maszynowego (MT) ALPMAVIS. W ramach projektu publicznie udostępniono usługę statystycznego tłumaczenia maszynowego (https://www.versti.eu/), która jest też dostępna przez zintegrowany system informacyjny języka litewskiego i zasobów pisemnych „Raštija.lt” (www.raštija.lt). Utworzenie i rozwój systemów tłumaczenia maszynowego jest wyzwaniem intelektualnym, które przynosi korzyści nie tylko społeczności naukowej, ale także całemu społeczeństwu korzystającemu z technologii informacyjnych. W 2013 roku wykorzystano sieci neuronowe do tłumaczenia maszynowego (MT). Koncepcja wykorzystania procesorów graficznych do obliczania sieci neuronowych otworzyła nowe możliwości rozwiązywania zadań w czasie rzeczywistym, w tym tłumaczenia maszynowego. Miliony sztucznych neuronów są wykorzystywane do neuronowego tłumaczenia maszynowego. Do tłumaczenia maszynowego coraz częściej wykorzystywana jest sztuczna inteligencja, a jego jakość jest coraz bliższa tłumaczeniu wykonanemu przez człowieka.
Nowe możliwości pozwoliły usprawnić system tłumaczenia maszynowego Uniwersytetu Wileńskiego. Zespół projektu, kierowany przez dr Arūnas Samuilis, ukończył nowy projekt „Ulepszenie i rozwój systemów tłumaczenia maszynowego i usług lokalizacyjnych” i stworzył nowe, otwarte i bezpłatne środowisko tłumaczeniowe. Wykonane zostały następujące czynności:
-
Opracowane zostały nowe technologie i dodatkowe zasoby językowe, aby poprawić jakość poprzednich systemów tłumaczenia maszynowego:
- Nowo opracowane rozwiązania zostały zintegrowane z infrastrukturą tłumaczenia maszynowego Uniwersytetu Wileńskiego, co pozwala systemowi MT na automatyczne uczenie się na podstawie wyników edycji tłumaczeń przez użytkowników. Ta funkcja umożliwia też osiąganie lepszej jakości tłumaczeń po każdej edycji tłumaczenia. Jest to szczególnie ważne, ponieważ korzyści wynikające z zastosowania tej funkcji są od razu dostępne dla użytkowników tłumaczących i edytujących tekst (nie ma potrzeby korzystania z osobnych procesów uczenia systemu, które zajmują bardzo dużo czasu).
- Opracowano dodatkowe zasoby językowe (teksty i słowniki, listy terminów, słownik wyrazów bliskoznacznych języka litewskiego i narzędzia wstępnej edycji, kontrolowane metody językowe itd.), a następnie je przetworzono i skorygowano, aby poprawić jakość poprzedniego systemu tłumaczenia maszynowego.
- Aby zapewnić lepszą wszechstronność i szersze spektrum zastosowań systemu tłumaczenia (również do zastosowań profesjonalnych), płynne tłumaczenie tekstów zostało uzupełnione przez dokładniejszą funkcję tłumaczenia słownikowego poszczególnych słów/zwrotów.
- Podczas gromadzenia i przetwarzania zasobów językowych zwrócono szczególną uwagę na teksty z medycyny, prawa i komunikacji.
- Opracowano wtyczkę MT do pakietu aplikacji biurowych OpenOffice/LibreOffice, która umożliwia komunikację z systemami tłumaczenia maszynowego www.versti.eu i tłumaczenie tekstów użytkownika.
- Zastosowano technologie wykorzystujące sieci neuronowe, które pozwoliły na zwiększenie jakości tłumaczenia istniejących systemów tłumaczenia maszynowego.
- W istniejącej infrastrukturze zainstalowane zostały następujące pary językowe tłumaczenia maszynowego: litewski-angielski-litewski, litewski-francuski-litewski, litewski-polski-litewski, litewski-rosyjski-litewski i litewski-niemiecki-litewski. Te pary językowe zostały dobrane na podstawie rzeczywistych potrzeb społeczeństwa.
- Infrastruktura tłumaczenia maszynowego została dopasowana, aby zapewniać usługi e-administracji, ponieważ rozwiązania i narzędzia MT muszą być nie tylko dostępne publicznie, ale również umożliwiać łatwe świadczenie usług e-administracji. Zostały opracowane programy pracujące na komputerze klienta i/lub serwerze. Umożliwiają one tłumaczenie i wyświetlanie informacji dostarczanych przez instytucje świadczące usługi e-administracji w wybranym języku (np. „epaslaugos.lt”). Opracowane zostały również systemy tłumaczenia maszynowego z konkretnych dziedzin i zintegrowane z usługą. Przygotowano też instalację infrastruktury na potrzeby świadczenia usług elektronicznych tłumaczenia maszynowego.
Platforma tłumaczenia maszynowego została wyposażona w rozwiązania rozpoznawania mowy i jej syntezy opracowane w ramach projektu UW „Rozwój usług zarządzanych mowy litewskiej— LIEPA 2”. Pozwala to użytkownikom witryny www.versti.eu na głosowe wprowadzanie tekstów litewskich, poprawianie ich, tłumaczenie ich na wybrane języki, odsłuchanie ich, skorygowanie przetłumaczonego tekstu i rozpowszechnianie ich przez inne kanały komunikacyjne (np. przesłanie do edytora tekstów, napisanie wiadomości e-mail, rozpowszechnienie przez kanały społecznościowe).