2012–2014 m. Vilniaus universitetas įvykdė Europos Sąjungos Struktūrinių fondų finansuojamą projektą "Anglų–lietuvių–anglų ir prancūzų–lietuvių–prancūzų kalbų mašininio vertimo, paremto statistiniais metodais, sistemos sukūrimas". Buvo sukurta mašininio vertimo (MV) sistema ALPMAVIS, ir visuomenei tapo prieinama vieša internetinė statistinio MV paslauga (https://www.versti.eu/), pasiekiama taip pat ir per integruotų lietuvių kalbos ir raštijos išteklių informacinę sistemą "Raštija.lt" (www.raštija.lt). Mašininio vertimo sistemų kūrimas ir plėtra yra modernus intelektualinis iššūkis, dominantis ne tik akademinius sluoksnius, bet ir visą šiuolaikinėmis informacinėmis technologijomis besinaudojančią visuomenę. 2013 m. mašininiam vertimui (MV) panaudoti dirbtiniai neuroniniai tinklai, idėja neuroninių tinklų skaičiavimui pasitelkti kompiuterių grafinius procesorius atvėrė galimybes spręsti realius uždavinius, tarp jų – atlikti ir mašininį vertimą. Neuroniniam MV realizuoti naudojami milijonai dirbtinių neuronų, mašininis vertimas vis glaudžiau siejamas su dirbtinio intelekto kūrimu., o vertimo kokybė vis labiau artėja prie žmogiškojo.

Atsivėrusios naujos galimybės paskatino tobulinti Vilniaus universiteto mašininio vertimo sistemą. Projekto komanda, vadovaujama dr. Arūno Samuilio, įvykdė naują projektą "Mašininio vertimo sistemų ir lokalizavimo paslaugų tobulinimas ir plėtra" ir sukūrė naujos kokybės atvirą ir nemokamą vertimo aplinką. Buvo atlikti šie darbai:

  1. Sukurtos naujos technologijos ir papildomi lingvistiniai resursai, skirti pagerinti ankstesnių MV sistemų kokybę:
    1. Naujai sukurti ir į Vilniaus universiteto mašininio vertimo infrastruktūrą integruoti sprendimai, kurie suteikė galimybę MV sistemai automatiškai mokytis iš vartotojų redaguojamo vertimo rezultato. Toks funkcionalumas leidžia gauti geresnį MV rezultatą, kiekvieną kartą atliekant vertimo redakcijas. Ypač svarbu, kad tokio funkcionalumo naudą iš karto galės pajusti vartotojai, verčiantys ir redaguojantys tekstą (nereikės atskirų sistemos apmokymo procesų, kurie trunka labai ilgai).
    2. Sukurti, apdoroti ir patikslinti papildomi lingvistiniai resursai (tekstynai ir žodynai, terminų sąrašai, lietuvių kalbos tezauras bei pirminio redagavimo priemonės, kontroliuojamos kalbos metodais ir kt.), skirti pagerinti ankstesnės MV sistemos kokybę.
    3. Siekiant vertimo sistemos universalumo ir platesnio taikymo (taip pat ir profesionaliam darbui), sklandus teksto vertimas buvo papildytas tikslesniu atskirų žodžių/frazių žodyninio vertimo funkcionalumas.
    4. Renkant ir apdorojant lingvistinius resursus, ypatingas dėmesys buvo skiriamas medicinos, teisės ir komunikavimo sričių tekstams.
    5. Sukurtas MV įskiepis "OpenOffice/LibreOffice" biuro programų paketui, kuris geba komunikuoti su www.versti.eu mašininio vertimo sistemomis ir verčia vartotojų tekstus.
    6. Panaudotos neuroninių tinklų pagrindu veikiančios technologijos ir sukurtos galimybės jas panaudoti didinant esamų MV sistemų kokybę.
  2. Esamoje infrastruktūroje įdiegtos šios mašininio vertimo kalbų poros: lietuvių-anglų-lietuvių, lietuvių-prancūzų-lietuvių, lietuvių-lenkų-lietuvių, lietuvių-rusų-lietuvių ir lietuvių-vokiečių-lietuvių. Tokios kalbų poros buvo atrinktos remiantis realiu visuomenės poreikiu.
  3. MV infrastruktūra pritaikyta elektroninės valdžios paslaugoms teikti, nes MV sprendimai ir įrankiai turi būti ne tik viešai prieinami vartotojams, tačiau ir lengvai adaptuojami e. valdžios paslaugų teikimui. Sukurtos kliento kompiuteryje ir/ar serveryje veikiančios programos, kurios geba e. valdžios paslaugas teikiančių institucijų pateiktą informaciją išversti ir pateikti pasirinkta kalba (pvz., "epaslaugos.lt"). Taip pat sukurtos ir į teikiamą paslaugą integruotos konkrečiai sričiai pritaikytos MV sistemos. Paruošta diegimo infrastruktūra MV e. paslaugų teikimui.

VU projekte "Lietuvių šneka valdomų paslaugų plėtra – LIEPA 2" sukurti šnekos atpažinimo ir sintezės sprendimai įdiegti mašininio vertimo platformoje. Tai leidžia www.versti.eu vartotojams įvesti lietuvišką tekstą balsu, jį koreguoti, išsiversti į norimas kalbas, išgirsti balsu, pakoreguoti išverstą tekstą ir platinti jį kitais komunikacijos kanalais (pvz., perkelti į teksto redagavimo programą, rašyti el. laiškus, platinti socialiniais kanalais).