Pārskata periodā daudz darba ir veltīts projekta līdzšinējo rezultātu publicēšanai:
• sagatavots zinātniskais raksts “Deriving enhanced Universal Dependencies from a hybrid dependency-constituency treebank”, kas pieņemts publicēšanai starptautiskās konferences “Text, Speech, Dialogue” (TSD 2018) rakstu krājumā;
• sagatavoti trīs zinātniskie raksti: “NLP-PIPE: Latvian NLP Tool Pipeline”, “Latvian FrameNet: Cross-Lingual Issues” un “Extending Tēzaurs.lv online dictionary into a morphological lexicon”, kas pieņemti publicēšanai starptautiskās konferences “Human Language Technologies – The Baltic Perspective” (BalticHLT 2018) rakstu krājumā;
• sagatavots zinātniskais raksts “Looking for the Needle in a Haystack: Semi-automatic Creation of Latvian Multi-word Dictionary from Small Monolingual Corpora”, kas pieņemts publicēšanai 18. starptautiskā EURALEX kongresa (Euralex 2018) rakstu krājumā.
Pētījumu rezultāti ir prezentēti vairākās starptautiskās konferencēs:
• “Language Resources and Evaluation Conference” (LREC 2018);
• “International FrameNet Workshop” (IFNW 2018);
• “XVIII EURALEX International Congress” (Euralex 2018).
Izveidota sākotnējā versija modulārai valodas analīzes rīku platformai NLP-PIPE, kurā ir integrētas latviešu valodas teksta analīzes komponentes, kas apmācītas, izmantojot projektā izstrādāto daudzslāņu datu kopu. Platforma ļauj ērti iegūt visu komponenšu analīzes rezultātus un selektīvi izmantot dažādas apmācīto moduļu versijas.
Līdzsvarotā latviešu valodas tekstu korpusa LVK2018 beta versija ir pieejama vietnē http://nosketch.korpuss.lv. Tajā ir iekļauta jaunizstrādātā periodikas sadaļa un katram korpusa avotam ir pieejami automātiski ģenerēti metadati.
Informācija ievietota 31.07.2018.