2021. gada janvāris–marts
Pārskata periodā paveiktais:
• Būtiski papildināta radioloģijas izmeklējumu un epikrīžu aprakstos sastopamo terminu, saīsinājumu un simbolu izrunas vārdnīca. Pilnveidotas un precizētas ortogrāfiski atšifrētā runas korpusa transkripcijas.
• Pilnveidota un precizēta vēsturisko izmeklējumu aprakstu izvēršanas likumu kopa un atbilstošais programmatūras pirmkods: izveidots divu līmeņu galīgo stāvokļu pārveidotājs, kas nodrošina kontekstuālu locījumu saskaņošanu, izvēršot skaitļus, datumus, speciālos simbolus u.c. tekstvienības. Atbilstoši sagatavota jauna versija izvērsto vēsturisko izmeklējumu tekstu korpusam. Rezultātā ir uzlaboti korpusa interpolācijas rādītāji un ir iegūts precīzāks valodas modelis – ir samazināts indikatīvais kļūdu īpatsvars izmeklējumu diktātu automātiskajās transkripcijās.
• Veikta diktēšanas platformas prototipu P1, P2 un P3 bāzes pirmkoda pilnīga refaktorizācija, kas turpmāk nodrošinās šo prototipu elastīgāku un produktīvāku attīstīšanu un pielāgošanu.
• Sākts darbs pie sistēmas lietojamības un darba produktivitātes novērtēšanas: sagatavota sākotnēja testa vide un veikti sākotnējie lietotāju mērījumi, iegūstot datus par darba produktivitāti bāzes scenārijā – testa transkripciju manuālā sagatavošanā.
Informācija ievietota 29.03.2021.
2021. gada aprīlis–jūnijs
Pārskata periodā paveiktais:
• Izstrādāta diktēšanas platformas prototipa servera puses (back-end) programmatūras bāzes versija. Tā nodrošina diktātu augšupielādi dažādos audio formātos, automātisku konvertēšanu WAV formātā, augšupielādēto diktātu prioritāru rindošanu apstrādei, runas atpazīšanas sistēmas uzturēšanu nepārtrauktā darba režīmā, kā arī diktātu nodošanu runas atpazīšanas sistēmai un automātisko transkripciju atgriešanu lietotāja saskarnei (front-end).
• Izstrādāta jauna, integrēta lietotāju saskarnes versija, kas nodrošina medicīnisko diktātu pēcrediģēšanā nepieciešamo teksta manuālas apstrādes un formatēšanas funkcionalitāti un ērtu navigēšanu, saglabājot teksta un audio sastatījumu segmentu līmenī.
• Sagatavota zinātniskā publikācija “Adapting Automatic Speech Recognition to the Radiology Domain for a Less-Resourced Language: The Case of Latvian”, kas pieņemta iekļaušanai starptautiskās zinātniskās konferences WorldS4 2020 sekcijā “INTELLIGENT SYSTEMS & HEALTH INFORMATICS” un tiks publicēta Scopus indeksētajā Springer rakstu krājumu sērijā “Lecture Notes in Networks and Systems”.
Informācija ievietota 29.06.2021.