Juba mõned aastad naudib keelevaldkond talle ootamatult osaks saanud tähelepanu, mis endiselt ei ilmuta vaibumise märke. Muidugi on areng oma olemuselt alati ohtlik ja teadmised tuleviku kohta alati ebakindlad. Kuna aga maailma peatada ja maha astuda ei saa, tasub muutustega pigem kursis olla, et leida neist võimaluse korral nii avastamisrõõmu kui ka tööalast kasu, kirjutab Eesti Keele Instituudi direktor Arvi Tavast "Keeleminutites".

On küll hästi teada, et keel on üks inimeseks olemise keskseid tunnuseid, kuid sedavõrd kiire tähelepanu kasv on siiski olnud üllatav tegijaile endilegi. Ollakse harjunud nokitsema oma teaduse kallal vaikselt, eriti lootmatagi, et see kellelegi korda võiks minna. Ka Eesti keeletehnoloogias oleme praeguste suurte keelemudelite otseseid eellasi ehitanud juba vähemalt kümmekond aastat, rääkimata sellele eelnenud poole sajandi pikkustest ettevalmistustest. Avalikkuse jaoks tuli aga murrang hetkega, kui üks välismaine eraettevõte (OpenAI) pakendas ühe niisuguse mudeli (GPT3) igaühele kättesaadavasse vormi (ChatGPT) ja tegi veebis avalikuks.

Sisuliselt needsamad mudelid töötlevad igasuguseid jada vormis andmeid: pilte, heli, videot, genoome, liiklusvoogusid, ilmavaatlusi, majandusnäitajaid, luureandmeid jne. Kuna aga alguse said nad just inimkeele töötlemisest ja keeleline suhtlus on siiani nende oluliste funktsioonide hulgas, siis ongi keelemudeli nimi neile külge jäänud.

Mudelite algne eesmärk oli lihtsalt ennustada jada järgmist liiget, näiteks järgmist sõna või homset ilma, ja sama lihtne on nende tööpõhimõtte keskne osa tänini. Rakendusi aga tekib kiires tempos juurde. Järjest raskem on läbi näha, kuidas või miks suudab üks ainult jada järgmist liiget ennustama programmeeritud masin kõiki neid asju teha. Näiteid on palju, nad ilmuvad kiiresti ja kaotavad kiiresti ka oma uudsuse. Minu viimase aja üks lemmikuid on katkise kodumasina pildi järgi selle parandamise juhendamine, küsides enne üle, millised tööriistad inimesel kodus olemas on.

Juba praegu ei ole need enam eraldiseisvad mänguasjad, vestlusrobotid või otsingumootorid. Nad on integreeritud või kohe integreeritakse kõigisse mõeldavatesse toodetesse. Lisaks, kuna inimese jaoks on tema emakeel loomulik suhtlusviis, saame üha enamaid tooteid ja teenuseid edaspidi kasutada mingi vestlusliidese kaudu. Seega muudavad keelemudelid paratamatult ära kogu meie asjade ajamise viisi.

Muidugi kaasneb uute tööriistadega alati ohte, eriti sellise arengutempo puhul. Kuna keelemudelid jäljendavad inimeste käitumist nii heas kui ka halvas, võivad nad küll osata kirjavigu parandada või matemaatikat seletada maailma parimate õpetajate tasemel, aga kannavad edasi ka inimestelt õpitud eelarvamusi ja sallimatust.

Üks suur küsimus seoses jäljendamisega on sellest väljakasvamine. Kas masin, mis on programmeeritud ainult jäljendama, võiks põhimõtteliseltki kunagi luua midagi uut? Juristid ja maailma autoriõiguste alane kohtupraktika on viimasel ajal kaldunud eitava vastuse poole. Ka tehniliselt, teades keelemudelite tööpõhimõtet, on seni olnud raske näha vastavat mehhanismi. Samas, alustab ju inimlapski vanemaid jäljendades, mis ei takista teda hiljem midagi uut välja mõtlemast. Võrdluse teeb eriti kohaseks keelemudelite ehituslik sarnasus inimajuga ning asjaolu, et loovust neuronite elektrokeemia tasemel ära seletada ei ole me seni osanud ka inimese puhul.

Niisuguse kiire arengu ajal ei ole võimalik ette teada, millise maailmaga peavad toime tulema praegused lapsed pärast oma koolide lõpetamist. Enam-vähem kindel on ainult tolle maailma suur erinevus praegusest. Otsapidi on selle maailma alged kooli juba jõudnud. Kas õppetöö tegemine keelemudelite abil on plagiaat, spikerdamine või tänapäevaste tööriistade oskuslik ja sihipärane kasutus? Kas õpetaja peaks seda keelama, ignoreerima, soodustama või lausa ise õpetama? Kas õpetaja saaks keelemudeleid kuidagi oma töös kasutada? Viimane on üks teemadest, millest tuleb juttu EKI emakeeleõpetajate teabepäeval 4. oktoobril, kuhu kõik huvilised on oodatud registreeruma siin.