Pārskata periodā sagatavota starpversija sintaktiski marķētajam latviešu valodas UD korpusam, kura izmērs nu jau pārsniedz 11 000 teikumu. Notiek apjomīgs darbs pie korpusa automātiskās transformācijas procedūras pilnveides, lai to saskaņotu ar jaunajiem UD v2.4 datu validācijas kritērijiem.
Aktīvi turpinās FrameNet un PropBank freimu un semantisko lomu pusautomātiska sastatīšana, balstoties uz marķētajiem UD un FrameNet datiem.
Uzsākta latviešu valodas FrameNet korpusa marķēšanas otrā kārta, par pamatu ņemot būtiski papildinātā UD korpusa datus. Šajā kārtā marķējamo piemēru skaits ir lielāks nekā pirmajā kārtā, taču freimu un to elementu piekārtošana notiek ātrāk, jo kā paraugi tiek izmantoti pirmās kārtas marķēšanas rezultāti. Paralēli norit eksperimenti FrameNet parsera apmācībā uz marķētajiem datiem, dažādos griezumos analizējot treniņpiemēru apjoma un izkliedētības ietekmi uz apmācības rezultātiem.
Sagatavota latviešu valodas gramatiskās un semantiskās analīzes rīkkopas NLP-PIPE pirmā versija, kas pieejama gan kā tīmekļa API, gan izmantojot lietotāju saskarni:http://nlp.ailab.lv. Uzsākts darbs pie latviešu valodas FrameNet parsera eksperimentālas integrēšanas NLP-PIPE rīkkopā.
Informācija ievietota 31.01.2019.