Aleksei Kelli ja Kadri Vider: Kas külmikule tohib õpetada eesti keelt?

Keeletehnoloogia ja õiguse maailm
Keeletehnoloogia ja õiguse maailm Autor/allikas: Kairit Leibold/ERR

Aleksei Kelli ja Kadri Vider kirjutavad reedeses Sirbis, et keeletehnoloogia arendamine ei ole võimalik eesti keele suulise ja kirjaliku keeleandmestiku kasutamiseta.

Keeleandmestiku õiguslik olemus. Põhiseadusega on seatud eesmärgiks eesti keele säilimine läbi aegade. Tänapäeval tähendab see ka eesti keele digimist, mis hõlmab suulise ja kirjaliku keeleandmestiku (keeleressursid) kogumise ja kasutamise keeletehnoloogia tarvis. Keeleandmestiku varal loodud tehnoloogilisi lahendusi saab rakendada eri eesmärkidel, muu hulgas ka suhtlemiseks külmikuga.

Keele digimisel kerkivad aga õiguslikud küsimused, kuna keeleandmestik on sageli kaetud õigustega, nagu autoriõigus, autoriõigusega kaasnevad õigused ja isikuandmete kaitsest tulenevad õigused. Need õigused kuuluvad nii keeleandmestiku autorile kui ka kogujale.

Autoriõigus kaitseb isiku loomingut kirjanduse, kunsti või teaduse valdkonnas. Seega võib igasugune digikujul tekst või kõne (blogi, kommentaar, salvestatud loeng, raadiosaade jms) olla ka looming ehk autoriõigusega kaitstav teos. Suulise kõne esitaja puhul lisanduvad ka esitaja õigused.

Autoriõigus ei kaitse kõiki tekste, kuid keeletehnoloogias ei saa piirduda nende õnnelike eranditega. Näiteks ei kaitse autoriõigus seadusi ja haldusdokumente, kuid külmkapiga rääkides huvitab inimest pigem, kas piima on, mitte haldusõiguse põhimõtted. Seega on külmikuga suhtlemise rakenduse loomisel dokumentidest vähe kasu. Vaja on hoopis igapäevast suhtluskeelt, mida saab koguda veebivestlustest, aga ka näiteks infotelefonide salvestatud dialoogidest.

Keeleandmestik sisaldab tihti ka isiku­andmeid (nt viited teksti autorile või kõnelejale, isiku hääl). Kui kirjaliku keeleandmestiku saab isikuandmete kaitse eesmärgil pseudonüümida ja muuta anonüümseks (anonüümsed andmed ei allu isikuandmete kaitse korrale), siis häälega on olukord keerulisem. Kõneleja hääl kuulub praegu biomeetriliste isikuandmete hulka ning selle töötlemisel, et treenida näiteks selliseid kõnetehnoloogia rakendusi nagu kõnetuvastus, peab järgima isikuandmete kaitse nõudeid.

Keeleandmestiku kasutamine. Lihtsustatult öeldes saab keeleandmestiku kogumine ja kasutamine tugineda kas isiku nõusolekule või seadusest tulenevatele autoriõiguse ja isikuandmete kaitse piirangutele (nt teadustöö erand). Mõlemal on praktikas oma tugevused ja nõrkused.

Nõusolek kaitseb isikuandmete töötlemisel ja autoriõiguslikult kaitstavate teoste kasutamisel isiku õigusi paremini, ühtlasi võimaldab ka keele­andmestikku avalikult (näiteks veebis) levitada ning kasutada keeletehnoloogiliste äriliste rakenduste loomisel. Nõusoleku puhul on mureks aga kohati ebamõistlik halduskoormus ning ka võimatus see nõusolek hankida. Kes jõuab näiteks raadios kõlavate vaidluste või tänava­intervjuude korral korrektselt nõusoleku vormistada? Digieelsel ajal kogutud keeleandmestiku puhul ei ole aga sageli võimalik tuvastada isikuid, kellelt üldse nõusolekut tuleks küsida, sest keelejuhte või kõnelejaid puudutav dokumentatsioon on poolik või olematu. Ka ei saa internetist kogutud keele­andmestikku (nt veebikommentaarid, blogid jms) seostada tingimata autori või konkreetse isikuga.

Teadustöö erandile tuginev keeleandmestiku loomine ja kasutus ei eelda nõusolekut, kuid selle võimalused on piiratumad. Teadustöö erand lubab küll keeleandmestikku luua ja koguda, kuid see peab toimuma teadustöö raames ilma ärilise eesmärgita ning loodud andmestikku ei tohi teha avalikkusele kättesaadavaks. Jutt avatud teadusest ja alusandmete kontrollitavusest on seega nonsenss.

Eraldi küsimus on, kuivõrd allub keelelise sisendmaterjali abil loodud rakendus samadele piirangutele, mis on tehnoloogilise lahenduse allikaks olnud keeleandmestikul, või on keelematerjali abiga treenitud või arendatud rakendus käsitletav iseseisva ja sõltumatu objektina. Vastus sellele küsimusele sõltub sellest, kuivõrd saab rakendusest eraldada selle loomiseks kasutatava keeleandmestiku.

Keeletehnoloogia ja õiguse maailm. Keeletehnoloogia arendaja ja juristi arusaam keeletehnoloogia arendamisest lähevad kaunikesti lahku. Selle näiteks võib pidada arutelu hea kolleegi ja keele­tehnoloogia arendaja Arvi Tavastiga, kes tahtis teada, miks tohib lapsele raamatut lugeda, kuid arvutile mitte. Mõlemal juhul on ju eesmärk õpetamine. See on nii-öelda keeletehnoloogia arendaja vaate­nurk.

Õigusliku vaatenurga esindaja tahab loomulikult teada, kuidas arvutile lugemine ikkagi välja näeb. Arutelu käigus selgus, et arvuti ei anna märku, et ta tahab, et keegi loeks talle huvitavat raamatut. Protsess on tehnilisem ning sisaldab vähemalt raamatu teksti kopeerimist (tänapäeval sageli otse pilveteenuse jagatud arvutusressurssidega) ja kopeeritud teksti töötlemist (analüüsimist, märgendite lisamist, lõikumist lauseteks, sõnadeks, tähejadadeks jne). Õiguslikust seisukohast on nii kopeerimine kui ka töötlemine seotud autorile kuuluvate õigustega ja eeldavad autori luba või tuginemist autoriõiguslikule piirangule. Keeletehnoloogia arendajal on siinkohal ikkagi tohutu kiusatus hakata juristiga arendama teemat, kas tehnilist protsessi, kus inimene teose sihipärase kasutajana ei osale, on ikka õige ja õiglane tõlgendada XXI sajandil kopeerimise ja muutmisena autori­õiguslikus mõttes.

Siit jõuame küsimuseni, kas erialaspetsiifiliste maailmade olemasolu on eesti keele digimise seisukohalt hea või halb. Keeletehnoloogia arendamisele (vähemalt algusaegadel) tuli see isegi kasuks. Keeleteadlased "lugesid" arvutile raamatu ette ega lasknud õiguslikel küsimustel oma tegevust mõjutada. Juristid jällegi tegelesid oma probleemidega ega sekkunud keeletehnoloogia arendamisse. Praegu ja ka tulevikus peab olema võimalik need maailmad ühendada. Oluline on seejuures võtta arvesse ka ebapiisavat ärihuvi arendada kulukad keeletehnoloogilised tooted välja eesti keele jaoks. See tähendab, et inimesi, kes tahavad inglise või prantsuse keeles külmkapiga suhelda, on palju rohkem kui neid, kes eelistavad seda teha eesti keeles. Seega tuleb eesti keele digimisel lähtuda ennekõike avalikust huvist. Eesti keele õpetamine (isegi külmikule) peaks ju olema igati põhjendatud ja õiguspärane tegevus.

Loe artiklit Sirbist.

Toimetaja: Rutt Ernits

Allikas: Sirp

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: