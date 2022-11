Varsti on käes jõuluaeg ja on tavaks saanud, et sel ajal aidatakse ja toetatakse abivajajaid. Sellel aastal saab igaüks meist aidata ja toetada ka eesti keele arenemist digimaailmas, annetades oma häält ja oma kõnet, mainis EKI keeletehnnoloogia kompetentsikeskuse juht Kadri Vare.

Kõik tänapäeva keeletehnoloogilised vahendid – masintõlge, kõnetehnoloogiad ja tekstianalüüs – kasutavad toimimiseks suurel hulgal andmestikke. Mida rohkem andmestikke, seda uhkem. Eesti Keele Instituudis loodud tehishäälte jaoks kasutatakse ilmekalt ette loetud, kauni kõla ja ilusa lauseehitusega eestikeelset kõnet.

Seevastu on kõnetuvastuses, kus inimeste kõnest tehakse tekst, vaja hoopis teistsuguse kvaliteediga kõneandmestikke. Kõnetuvastuse arendamiseks on vaja kõnekatkeid võimalikult paljude erinevate inimeste käest, kes räägivad võimalikult erinevates mürarikastes keskkondades. Samamoodi on oluline, et kõneandmestike hulgas on esindatud murdekeelt rääkivate inimeste keelenäited, aktsendiga kõnelejate kõnematerjal ning ka nende kõne, kel erinevatel meditsiinilistel põhjustel kõnelemine keeruline on.

Inimesed suhtlevad ju igasugustes keskkondades ja tingimustes ning väga mitmekesiste hääleomadustega – tehnoloogia peab toime tulema just selliste päriselu tingimustes kõneldust arusaamisega. Mida rohkem on tehnoloogiale õppematerjale anda, seda parem ja täpsem on tulemus.

Ajal, mil me järjest enam oma igapäevaseadmetega loomulikus emakeeles suhtleme, on väga oluline, et tehnoloogiad saaksid aru just eesti keelest. Juba praegu on õpetatud kõnetehnoloogiad mitmel pool kasutusel, näiteks ERR kasutab aasta algusest saadikotsesaadetel eestikeelsed subtiitreid ning vaegkuuljatel on olemas kauaoodatud võimalus operatiivsele infole kohe ligi pääseda. Vaid vähestel Euroopa riikidel on midagi sarnast ette näidata. Aga et ka tuleviku vestlusrobotid ja isejuhtivad autod eesti keelt mõistaksid, siis tulebki kõneandmeid veel ja veel rohkem koguda ning nende abil tehnoloogiat õpetada.

Kõnematerjalide kiiresti ja laialdaselt kogumiseks algatas Majandus- ja Kommunikatsiooniministeerium koos Riigi Infosüsteemi Ametiga sügisel kampaania "Anneta kõnet"1. Oma panuse projekti õnnestumisse on andnud mitmed Eesti keeleteadlased ning Eesti Keele Instituudi keeletehnoloogid. Annetamine on lihtne – avada tuleb kampaania koduleht, vajutada vaid ühte nuppu ning rääkida endale sobival teemal või kasutada spikrina etteantud suunavaid küsimusi. Toetame oma emakeelt ja annetame kõnet!

1 https://annetakonet.ee/