Ajaloolane Kaarel Piirimäe: usun, et tehisintellekt aitab valenarratiive vähendada
Kultuurisaates "Kultuuristuudio. Arutelu" oli sel korral vaatluse all tehisaru ning sellega seotud mured ja rõõmud. Ajaloolane Kaarel Piirimäe tõdes, et see eelis, mis inimesel veel mõni aeg tagasi tehisintellekti ees oli, on kiirelt kadumas.
TLÜ digihumanitaaria ja tehisaru lektor Andres Karjus selgitas, et kui otsingumootorid otsivad infot veebilehekülgedelt, keelemudelite puhul oleneb, mille põhjal nad treenitud on. "Tihti praegused keelemudelid on interneti peal treenitud, sest see on teksti- ja pildimaterjal, mida saab lihtsasti ja palju kätte, see, kui korrektne või juriidiliselt õige see on, et kõike kokku kraapida, aga keelemudeleid võib treenida ka mis iganes keele- või tekstimaterjali peal."
Karjus kinnitas, et seda me hetkel ei tea, mille peal on täpselt treenitud ChatGPT. "See on kommertsprodukt, neil ei ole mingit põhjust neid treeningandmeid avaldada, kui just keegi seadusega ei sunni," mainis ta ja lisas, et keelemudelite puhul sõltubki seega väga sellest, kes on tootja. "Praegu ma tean, et Tartu Ülikoolile on antud raha, et teha eestikeelne keelemudel või kohandada juba olemasolev keelemudel paremaks."
"Selleks, et saada head suurt keelemudelit, ei lähe vaja tuhandeid ega sadu tuhandeid sõnu, pigem sadu miljoneid või isegi sadu miljardeid sõnu," rõhutas Karjus ja mainis, et oluline aspekt keelemudelite puhul on tuunimine või kohandamine. "See, kui neid üritatakse ühelt poolt viisakalt vastama saada, et ta mingeid asju ütleb või ei ütle, aga samas ka see, et kui ta ütleb vale ajaloolise fakti, siis võiks joondada teda sinna poole, et ta ütleks õigesti."
Andres Karjuse sõnul on ka väga lihtsasti mõistetav, kuidas keelemudeleid õpetatakse ning selle väitega, et keelemudelid õpivad ise, ta nõus ei ole. "Esimene samm on baasmudeli treenimine, kus sa paned mudeli ennustama väga pikka aega väga suure materjali pealt järgmist sõna ja kui seda piisavalt palju treenida, siis kui ta hakkab vastama, siis vastavalt õpitud tõenäosustele."
Kaarel Piirimäe: inimese eelis tehisintellekti ees hakkab kiiresti kaduma
Ajaloolane Kaarel Piirimäe sõnas, et tehisintellekti eelis on see, et ta haarab tekste tohutult kiiresti ja ükski inimene ei saa ligilähedalgi. "Üks eelis, mis inimesel veel on, hakkab kiiresti kaduma," tõdes ta ja mainis, et ta on ChatGPT-d kontrollinud päris palju ning tõdenud, et ta on päris hea. "Me ei saa seda alahinnata, üldse mitte, ka Eesti ajaloo vähetuntud faktide puhul või ka vastuoluliste faktide korral, näiteks Eesti-Vene suhted, ütleb nii- ja naapidi, teda on tuunitud nii, et ta oleks poliitkorrektne, ei oleks rassistlik, arvestaks vähemustega."
Andres Karjus tõdes, et juturobotitest ja keelemudelitest saadava info uskumine või mitteuskumine on kriitilise mõtlemise kogemus, mis tema arvates võiks tulla vanematelt või koolist. "Ideaalses maailmas õpetatakse inimesi hindama erinevaid allikaid, mis on usaldusväärne ja mis mitte, mis tundub loogiline ja mis ei tundu, aga kui hästi see päriselt toimib, see on omaette küsimus.
Ka Piirimäe arvates on see probleem. "Meie oleme koolihariduse saanud hoopis teistsuguses keskkonnas ning suudame nende riskidega oma teadmiste baasil paremini toime tulla kui noor, kes hakkabki õppima tehisintellekti baasil," tõdes ta ja lisas, et tema on tehisintellekti osas pigem optimist. "Ma arvan, et see pigem aitab valenarratiive vähendada ja harib inimesi, ma soovitaks neid pigem kasutada enne seda, kui sa midagi säutsud või Facebookis postitad."
Karjus rõhutas, et mitte kunagi ei saa olla võimalik tuvastada, kas tekst on loodud tekstiroboti abil või mitte. "See on mõttetu üritus," tõdes ta ja lisas, et kuigi teoreetiliselt võiks tehisaru toodetud tekstidele lisada vesimärgi, aga seda saaksid teha vaid keelemudeli tootjafirmad. "Kuni neid keegi ei sunni, ei ole eriti lootust, et keegi seda teeks, sest neil pole põhjust seda teha."
Andres Karjus: hea keelemudeli jaoks on vaja häid andmeid
"Praegused suured keelemudelid ei ole matemaatilised mudelid või loogikamudelid, need on eelkõige keelemudelid, mis on treenitud keelemustrite peal, seega kui treeningmaterjalis on piisavalt kõnekäände või vanasõnu, siis need suudavad samasuguseid genereerida ning neist jutumärkides ka aru saada," tõdes Karjus.
See, kuivõrd manipuleeritavad oma meie teadmised ja mälu tehisintellektide ajastul, on tema arvates lahendatav läbipaistvusega. "Kui mingi mudeli treeningandmed on avalikud, igaüks saab minna vaatama, mille peal ta on treenitud, kui see kõik on läbipaistev, siis probleem on ka väiksem, sest kui midagi on valesti, siis keegi saab öelda," selgitas Karjus ja mainis, et see on põhimõtteliselt nagu vabavaraline avatud lähtekoodiga tarkvara. "See on see ideaal."
Tema arvates võiks seda teha ka Eestis, aga seal on probleem. "Selleks, et saada head keelemudelit, on vaja häid andmed ning head andmed on Eesti kirjandus, ajalehed, õpikud ja seadused, millel on autoriõigused ja mida ei tohi avaldada, seega kumb on olulisem, kas see, et me avaldame asjad, millel on autoriõigused või jätame asja läbipaistmatuks, millel on teised riskid."
Selle kõige kõrval on Karjuse sõnul väga oluline parem haridus ning ennekõike arendada ka noorte digioskusi. "Seda ei tule teha mitte ülikoolis või keskkoolis, vaid pigem algkoolis," mainis ta.
Toimetaja: Kaspar Viilup
Allikas: "Kultuuristuudio. Arutelu", intervjueeris Maarja Vaino