Latvijas Universitātes Matemātikas un Informātikas institūts ir noslēdzis līgumu ar Centrālo finanšu un līguma aģentūru (CFLA) par projekta “Daudzslāņu valodas resursu kopa teksta semantiskai analīzei un sintēzei latviešu valodā” (Nr.1.1.1.1/16/A/219) īstenošanu.
Projekta sadarbības partneris ir Nacionālā informācijas aģentūra LETA.
Projekta vispārīgais mērķis ir attīstīt pētniecību un inovācijas valodas automātiskā sapratnē un tekstradē, nostiprinot latviešu valodas tehnoloģisko atbalstu Eiropas daudzvalodu digitālajā vienotajā tirgū.
Projekta specifiskais mērķis ir izveidot jaunu, fundamentālu daudzslāņu latviešu valodas resursu kopu un nodemonstrēt šo resursu izmantošanas potenciālu jaunu, inovatīvu tehnoloģiju izstrādē valodas sapratnes un tekstrades lietojumiem.
Projektā ir plānotas piecas galvenās darbības. Pirmās trīs darbības ir saistītas ar mašīnlasāmu, sintaktiski un semantiski anotētu tekstu korpusu izveidi un novērtēšanu valodas sapratnes lietojumiem. Ceturtā darbība ir apjomīgas skaidrojošās un sinonīmu vārdnīcas formalizēšana un integrēšana semantiskā tīmekļa saistīto atvērto datu mākonī. No formalizētās vārdnīcas tiks atvasināti multilingvāli skaitļojamie leksikoni, kas nepieciešami tekstradē. Šie rezultāti tiks izmantoti piektajā darbībā, izstrādājot teksta automātiskās rezumēšanas tehnoloģijas laboratorisku prototipu.
Projekts tiks īstenots no 01.12.2016. līdz 30.11.2019., un tā kopējas izmaksas ir 649 417,19 EUR, tajā skaitā ERAF finansējums – 550 871,56 EUR.
Projekts norisinās darbības programmas “Izaugsme un nodarbinātība” 1.1.1.specifiskā atbalsta mērķa “Palielināt Latvijas zinātnisko institūciju pētniecisko un inovatīvo kapacitāti un spēju piesaistīt ārējo finansējumu, ieguldot cilvēkresursos un infrastruktūrā” 1.1.1.1. pasākuma “Praktiskas ievirzes pētījumi” ietvaros.