Pārskata periodā veikta izpēte par SIA “LETA” ziņu apstrādē izmantotās informācijas strukturu – kādus faktus (piemēram, uzņēmuma nosaukums, amatpersonas, to izglītība) ir nepieciešams izgūt no ziņu arhīva vai aktuālākajām ziņām. Šīs izpētes rezultāti ir apkopoti pārskata ziņojumā IT KC zinātniskā virziena “Dabīgās valodas tehnoloģijas“ pētījumu vadošo pētnieku sanāksmei, kur tie tika harmonizēti ar citos pētījumos veiktajām aktivitātēm.
Veikta arī plaša zinātniskā priekšizpēte par iespējamajiem mākslīgā intelekta risinājumiem dabiskās valodas teksta sapratnes jomā, kuri ir apkopoti divās publikācijās:
• RDF* Graph Database as Interlingua for the TextWorld Challenge (CoG 2019); http://ieee-cog.org/papers/paper_223.pdf
• LinkedSaeima: a Linked Open Dataset of Latvia's Parliamentary Debates (SEMANTiCS 2019); https://2019.semantics.cc/linkedsaeima-linked-open-dataset-latvias-parliamentary-debates
Uzsākts arī projektēšanas darbs pie Minimums Viable Product (MVP) prototipa, kuru paredzēts integrēt kā API jaunajā SIA “LETA” ziņu apstrādes sistēmā. Izstrādājamā API galvenais akcents būs uz augstu datu kvalitāti, kuru iecerēts nodrošināt līdztekus mākslīgā intelekta tehnoloģijām lietojot arī manuālu datu verificēšanu jau ziņas rakstīšanas laikā.
Informācija ievietota 30.08.2019.