Wiedemanni keeleauhinna laureaat: eestlaste masintõlge on isegi Google'i omast parem

Foto: ERR

Neljapäeval tunnustati Wiedemanni keeleauhinnaga arvutilingvistika spetsialisti Mare Koitu, kes kinnitas, et viimase aja üks positiivsemaid arenguid tema valdkonnas on masintõlge, millega on Tartu Ülikoolis väga head tööd tehtud.

Mare Koit selgitas, et arvutilingvistika on hübriidala, mis on ühelt poolt seotud informaatika ja teiselt poolt keeleteadusega. "Eesmärk on panna arvutid keelt mõistma ja keeles suhtlema, jutt on siis loomulikust keelest," ütles ta ja tõi välja, et sellel alal on ka mitmeid atraktiivseid rakendusi. "Näiteks masintõlge, mis on ilmselt kõigile arusaadav, samuti kõnetuvastus, kus arvuti suudab tavalisest inimkõnest genereerida elektroonilise teksti ja kõnesüntees, kus arvuti moodustab elektroonilisest tekstist tehiskõne."

"Siis on veel väiksemaid rakendusi, näiteks kui me tekste loome arvuti abil, siis tihti on meil vaja õigekirja kontrolli, see on ka üks arvutilingvistika võimalik rakendus, samuti grammatikakontroll, näiteks kuhu panna komad, siis ka stiilikontroll," mainis Koit ja lisas, et eesti keele jaoks on õigekirja kontroll ammu juba Tartu Ülikooli teadlase kaasabil ammu olemas. "Tegeletakse ka grammatikakontrolliga, mis on üsna kaugele jõudnud ning viimasel ajal on erilist tähelepanu pälvinud masintõlge, mida arendatakse samuti Tartu Ülikoolis."

Tema hinnangul on masintõlke vallas Tartu Ülikoolis väga head tööd tehtud. "On leitud, et meie masintõlge on kvaliteedilt isegi parem kui Google'i oma," ütles ta ja kui inimesed omavahel suhtlevad, siis pole ka alati lihtne aru saada, millest kaasvestleja kõneleb, kui ta räägib segaselt. "Aga kui rääkida kõnetuvastusest, siis kui vestleja räägib ja hääldab selgesti, siis meie masintõlge, mida arendatakse TalTechis, on niivõrd kvaliteetne, et suudab sellisest kõnest aru saada."

"Üks huvitav rakendus on see, et meil riigikogus stenografeeritakse parlamendi arutelusid ja juba alates 2020. aastast rakendatakse stenografeerimisel kõnetuvastust, nii et see arvutiprogramm tuvastab selle kõne ja inimene pärast kohendab ja toimetab seda arvuti genereeritud elektroonilist teksti," selgitas ta ja mainis, et see võimaldab väga palju inimtööjõudu kokku hoida.

Koit ei pea end aga mitte arvutilingvistika eestvedajaks Eestis, pigem nimetab ta end meeskonnaliikmeks. "Viimasel ajal olen üsnagi tagasi tõmbunud, aga eradamad hetked viimasest ajast on masintõlke edu, selle kvaliteedi tõus, kus mina küll ei ole osaline olnud, vaid noored kolleegid praegu juba," ütles ta ja tõdes, et minevikus on kõige rohkem rõõmu teinud õpetamine ja tudengid, kes on soovinud sellest valdkonnast teada saada. "Kui mul on õnnestunud neile see sõnum edasi anda, siis see on mind väga õnnelikuks teinud."

Wiedemanni keeleauhind on talle väga suur tunnustus. "Ma olen väga tänulik, aga ma ei tea, kas ma olen seda väärt, ebalev tunne on sellega seoses, aga ma tänan väga neid, kes on otsustanud selle mulle anda," ütles ta ja lisas, et tegemist on ikkagi meeskonnatööga ning ta on vaid üks osaline.

Toimetaja: Kaspar Viilup

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: