Pārskata periodā paveiktais:
• Reprezentatīvas izlases datu kopas sagatavošana, aptverot dažāda veida radioloģijas izmeklējumus un epikrīzes. Aprakstiem atbilstošo audio datu sistemātiska uzkrāšana. Paraugdatu manuāla pseidonimizācija un anonimizācija. Programmatūras izstrāde izmeklējumu un epikrīžu aprakstu automātiskai apstrādei un anonimizēšanai. Apstrādes un anonimizēšanas procedūru pielāgošana dažādiem dokumentu formātiem.
• Turpināta literatūras izpēte un eksperimenti automātiski ģenerētas izrunas vārdnīcas izveidē. Uzsākta izrunas vārdnīcas izveides darba vides izstrāde. Metodikas izstrāde vārdnīcas ieejas datu automatizētai izguvei no tekstu korpusiem un no svešvārdu vārdnīcām. Darbs pie izrunas vārdnīcas izveides un saīsinājumu izvēršanas metodikas izstrādes.
• Sākotnējā eksperimentālā valodas modeļa izveide no salīdzinoši nelielās, manuāli atlasītās paraugdatu kopas (izmeklējumu un epikrīžu apraksti). Iegūtā sākotnējā valodas modeļa novērtēšana.
• Metodikas izstrāde tekstu korpusā balstītai specifisko tekstvienību – apzīmējumu un saīsinājumu – automātiskai izvēršanai (valodas modeļa pielāgošanai) un saīsināšanai (automātisko transkripciju noformēšanai). Korpusa šablonu lingvistiska un statistiska analīze.
Informācija ievietota 27.09.2019.