Keeleminutid. Miks on vaja tehisaru terminoloogiat?

Uute terminite loomiseks või olemasolevate mugandamiseks tuleb paika panna selged põhimõtted ja seejärel süsteemselt koguda võimalikke vasteid, kirjutab EKI keeletehnoloog Silver Vapper "Keeleminutites
"Tehisintellekt", "tehisaru", "tehismõistus", "AI", "TI" – need on vaid mõned terminid, mis viimastel aastatel on üha enam igapäevases kõnepruugis kasutust leidnud. Kuigi sünonüümide olemasolu võib näidata keelelist rikkust, tekitab see kiiresti arenevas valdkonnas ka segadust. Nagu varasemate tehnoloogiliste läbimurrete puhul, on ka siin hulganisti uusi avastusi ja metoodikaid, mis vajavad täpset oskussõnavara.
IT-maailma lingua franca on paratamatult inglise keel, mistõttu on ka tehisintellekti valdkonna terminoloogia inglise keele poole kaldu. Võtame näiteks hetkel väga aktuaalse termini AI agent. See tähistab tehisintellektil põhinevat süsteemi, mis suudab iseseisvalt tegutsedes ja otsuseid tehes täita etteantud ülesandeid. Kõige tuntum näide sellisest lahendusest on ChatGPT vestlusrobot, kuid sarnaseid rakendusi on teisigi – alates koodi kirjutavatest kuni klienditeenindust pakkuvate süsteemideni.
Kuidas aga selliseid süsteeme eesti keeles täpsemalt nimetada? Sõna "agent" on eesti keeles kasutusel ning Sõnaveebis defineeritud kui "ettevõtte või asutuse esindaja, kes täidab selle ülesandeid". See definitsioon sobiks justkui hästi ka tehisintellekti konteksti, kuid eesti keeles leidub ka märksa värvikamaid võimalusi. Näiteks kaaluti kunagi mütoloogilist "kratti" üldise tehisintellekti sünonüümina, kuid see ei juurdunud. Miks mitte rakendada seda aga nüüd. Ühe positiivse näitena võib tuua termini "suur keelemudel" ning selle lühendi "SKM", mis on eesti vasted terminitele large language model ja LLM ning on valdkonnas laialdaselt kasutusel.
Terminoloogilisi väljakutseid on aga veel ning olukorda teeb keerulisemaks valdkonna killustatus – tehisintellektist kirjutatakse nii ajakirjanduses, sotsiaalmeedias kui ka teadustöödes, igaühel oma keelekasutus ja terminid. Kui teadusartiklites kohtame täpseid, kuid tihti kohmakaid termineid nagu "masinõppe mudelite järelõpe" või "keelemudelite eeltreening", siis ajakirjanduses eelistatakse lihtsamaid ja emotsionaalsemaid väljendeid nagu "tehisarukas abiline" või "nutikas õpirobot". Sotsiaalmeedias levivad jällegi anglitsismid ja otsetõlked. Ühtse oskussõnavara kujunemist pärsib lisaks vastuolu tehnoloogia kiire arengu ja terminoloogia aeglase kinnistumise vahel.
Lahenduseks on sihipärane töö terminoloogia ühtlustamisel. See tähendab, et uute terminite loomiseks või olemasolevate mugandamiseks tuleb paika panna selged põhimõtted ja seejärel süsteemselt koguda võimalikke vasteid. Siiski tuleb meeles pidada, et see on vaid toetav tegevus – lõplikult otsustab terminite püsimajäämise siiski keelekasutajate igapäevapraktika.
Tehisintellektist – täpsemalt suurtest keelemudelitest nagu ChatGPT – oli juttu ka EKI taskuhäälingu "Keelehääling" viimatises osas.
Toimetaja: Kaspar Viilup
Allikas: "Keeleminutid"