2021. gada jūlijs–septembris
Pārskata periodā paveiktais:
• Būtiski pilnveidots medicīnisko diktātu automātiskās transkribēšanas un pēcrediģēšanas platformas prototips, t.sk. runas atpazīšanas sistēmas valodas modelis, diktātu iesūtīšanas vai ierunāšanas modulis, integrētais teksta redaktors. Sākts darbs pie darbplūsmas un datu plūsmas modeļa realizācijas.
• Būtiski pilnveidots transkripciju automātiskās segmentēšanas valodas modelis un izstrādāts interpunkcijas ģenerēšanas valodas modelis. Būtiski pilnveidota transkripciju automātiskās saīsināšanas un teksta formatēšanas instrukciju apstrādes gramatika; integrēta kopējā datu plūsmā.
• Starptautiskās zinātniskās konferences WorldS4 2020 sekcijā “INTELLIGENT SYSTEMS & HEALTH INFORMATICS” prezentēta projektā izstrādātā LU MII un RAKUS koppublikācija “Adapting Automatic Speech Recognition to the Radiology Domain for a Less-Resourced Language: The Case of Latvian”. Sagatavots arī kopīga zinātniskā raksta “Specializēta latviešu valodas runas korpusa un izrunas vārdnīcas izveide vizuālās diagnostikas izmeklējumu lingvistiskai analīzei un sistemātiskai transkribēšanai” melnraksts un iesniegts izvērtēšanai žurnāla “Letonica” speciālizdevuma “Digitālās humanitārās zinātnes Latvijā” redkolēģijai.
Informācija ievietota 29.09.2021.
2021. gada oktobris–decembris
Pārskata periodā paveiktais:
• Pabeigta ortogrāfiski transkribētā radioloģijas izmeklējumu diktātu korpusa izveide: vairāk nekā 34 stundas audioierakstu sastatīti ar manuāli sagatavotām, precīzām diktātu ortogrāfiskajām transkripcijām un izrunas marķējumu. Katram diktātam pievienoti arī metadati: modalitāte un nozare.
• Pabeigta mašīnlasāmās izrunas vārdnīcas izveide. Tās apjoms: vairāk nekā 105 tūkst. vārdformu, t.sk. abreviatūras, latīņu termini, zāļu nosaukumi u.c. Katrai vārdformai pievienota izruna starptautiskajā IPA formātā.
• Izstrādāta platformas RUTA:MED būtiski pilnveidota versija: pilnveidotas runas transkribēšanas un transkripciju pēcapstrādes komponentes, uzlabota integrētā redaktora funkcionalitāte un stabilitāte, izstrādāts darbplūsmas nodrošinājums visam diktāta dzīves ciklam: diktēšana, pēcrediģēšana, diktāta nodošana rediģēšanai diktofonu centram vai rezidentam, rezultāta nodošana atpakaļ ārstam, galīgā apraksta verificēšana.
• Aktīvi norit RUTA:MED prototipa testēšana un novērtēšana laboratorijas vidē, un testēšanā tiek pakāpeniski iesaistītas dažādas RAKUS struktūrvienības.
Informācija sagatavota 29.12.2021.