Pabeigta latviešu valodas sintaktiski marķētā pilotkorpusa (~4000 teikumu) transformēšana atbilstoši Universal Dependencies (UD) 2.0 modelim. Dati ir pieejami publiskajā daudzvalodu UD repozitorijā (http://universaldependencies.org/#lv); tie šobrīd tiek izmantoti starptautiskajās CoNLL-2017 zinātniskajās sacensībās (http://universaldependencies.org/conll17/).
Izstrādāta pirmā eksperimentālā versija programmrīkam, kuru attīstot tiks veikta līdzsvarotā latviešu valodas tekstu korpusa (LVK) automatizēta papildināšana, strukturēšana un kvalitātes kontrole. Metode un rīks tiek testēti, automātiski papildinot vienu no LVK daļām - normatīvos aktus.
Pilnveidots verbu lietojumpiemēru atlasīšanas (no LVK) un sākotnējās automātiskās sintaktiskās marķēšanas programmrīks un datu repozitorijs. Izstrādāta pirmā versija pusautomātiskam konvertoram no UD modeļa uz hibrīdo atkarību-frāžu modeli, būtiski uzlabojot sintaktiski marķētā tekstu korpusa izveides produktivitāti.
Turpināts darbs pie latviešu valodas biežāk lietoto verbu nozīmju sastatīšnas ar PropBank un FrameNet freimiem.
Pētītas teikumu marķēšanas iespējas WebAnno vidē atbilstoši PropBank un FrameNet semantiskajiem modeļiem, balstoties uz UD sintaktiskajām anotācijām.
Turpināts darbs pie datu izvērtēšanas un sagatavošanas paplašināta latviešu valodas Core WordNet izveidei.
Pētītas dažādas metodes apjomīga GF (Grammatical Framework) skaitļojamā leksikona ģenerēšanai no esošajiem latviešu valodas leksiskajiem resursiem un šāda leksikona sastatīšanai ar citu valodu skaitļojamajiem GF leksikoniem; veikti pirmie eksperimenti.
Turpināta vairākvārdu savienojumu automātiskās izguves metožu izpēte un veikti pirmie eksperimenti, izgūstot vairākvārdu savienojumus ar pētījumam atlasītajiem verbiem.
Veikts pirmais eksperiments AMR (Abstract Meaning Representation) grafu multilingvālā verbalizēšanā, izmantojot GF ietvaru. AMR paredzēts izmanot kā semantisko interlingvu projektā izstrādājamajā teksta viedās rezumēšanas prototipā.
Par AMR multilingvālu verbalizēšanu sagatavota starptautiski recenzēta publikācija, kas tiks iekļata SemEval-2017 zinātnisko sacensību rakstu krājumā.
Informācija ievietota 30.04.2017.