Pārskata periodā veikta manuāli anonimizētu radioloģisko izmeklējumu un epikrīžu aprakstu un audio ierakstu paraugu analīze. Metodikas izstrāde vēsturisko izmeklējumu un epikrīžu aprakstu un audioierakstu automātiskai anonimizēšanai: teksta un audio paraugu masveida iegūšanai, lai izstrādātu specializētu runas korpusu, pielāgotus akustiskos un valodas modeļus, un specializētu izrunas vārdnīcu. Uzsākta programmatūras izstrāde izmeklējumu un epikrīžu aprakstu automātiskai anonimizēšanai.
Pētīti esošie tekstu segmentēšanas risinājumi un apzinātas to nepilnības medicīnas tekstu analīzē, t.sk. specifisko apzīmējumu un mērvienību atpazīšanā. Veikti sākotnējie eksperimenti automātiski ģenerētas izrunas vārdnīcas izveidē. Secināts, ka galveno problēmu rada apzīmējumu un latīņu valodas terminu fonētiskā transkripcija, un to būs nepieciešams sagatavot manuāli vai pusautomātiski. Apzināti resursi latīņu valodas vārdu izrunas vārdnīcas pusautomātiskai iegūšanai un latīņu valodas vārdu atpazīšanai runas datos.
Veikti sabiedrības informēšanas pasākumi: par valodas resursiem un to lomu valodas tehnoloģiju attīstībā nolasīts referāts LU MII Zinātniskajā seminārā, lielu uzmanību veltot tieši runas tehnoloģijām un problemātikai medicīnas jomā; LU VFF filozofijas maģistra studiju programmas studentiem un studentu grupai no Ķelnes Lietišķo zinātņu universitātes (TH Köln, Vācija) nolasītas lekcijas par mākslīgo intelektu dabiskās valodas sapratnē un tekstradē, t.sk. runas tehnoloģijās un to lietojumā medicīnas nozarē; individuālas tikšanās ar komersantiem, kurus interesē inovatīvu produktu un pakalpojumu izstrāde Latvijas tirgum, balstoties uz runas atpazīšanas tehnoloģiju.
Informācija ievietota 28.06.2019.