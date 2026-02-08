Kui oma eelmistes säutsudes rääkis Lydia Risberg EKI kolleegidega tehtud katsest, milles võrreldi suuri keelemudeleid, siis seekord toob ta paar lõbusat näidet sellest, mida mudelid seal genereerisid.

Ütlen alustuseks siiski ära, et kui mudelid uurisid etteantud materjali ehk keelekorpuse kontekste, siis pakkus Claude Opus 4.1 sõnadele tähendusi 85 protsendil juhtudest adekvaatselt, GPT-4o 81 protsendil ja Gemini 2.5 Pro 73 protsendil juhtudest. Tulemused olid palju kehvemad siis, kui mudelid toetusid üksnes oma eeltreeningus nähtud tekstidele: sõnadele pakutud tähendustest hindasid meie töörühma liikmed adekvaatseks vaid 45–55 protsenti (Gemini 55 protsenti, GPT 48 protsenti ja Claude 45 protsenti).

Järeldasime, et korpuseandmetega rikastamine pakkus mudelitele täiendavat konteksti ja empiirilist tuge, nii-öelda ainult enda sisse vaadates kippusid mudelid rohkem oletusi tegema ja seeläbi genereerima ebaadekvaatseid tähendusi. Samas olid need oletused ka pisut lõbusad.

GPT kohta pole näiteid siiski tuua, sest see oli ainus mudel, mis tunnistas, kui ei osanud sõna kohta midagi pakkuda. Gemini oli aga näiteks kimpus lastekeelsete sõnadega. See pakkus, et sõna jänku kasutatakse 'argpüksi' tähenduses ja tõi seda ilmestavaks lauseks "Ta sai endale jänku maine, sest vältis alati vastutuse võtmist". Meie aga ei kasuta ju nunnut pisikest jänkukest 'argpüksi' tähenduses, selleks on ikkagi konkreetselt jänes, nagu lauses "Jänesed šampanjat ei joo".

Sõna pepu kohta genereeris Gemini, et tegu on "osaga piltlikust väljendist, nt "Pepu alla tuld tegema", ja põhjendas, et "tegu on pika ajalooga, üldtuntud ja rahva seas levinud fraseologismiga, mis on osa ühisest keelelisest kultuuripärandist". Enesekindel, pole midagi öelda.

Tore oli ka nääl, keda meie teame kui 'abikaasa venda', ent kes Gemini arvates on 'väike kiskja perekonnast kärp'. Või siis tegusõna kihvtitama 'mürgitama', mille tähenduseks pakkus mudel hoopis 'maitsestama, vürtsitama, paremaks tegema'. Mudeli jutu järgi on see "laialt levinud ja rahva seas omaks võetud loov väljend toidu paremaks muutmise kohta" – no võib ka nii võtta, kuigi ega ikka ei või küll. Kihvtitatud toit, olgugi siis hästi maitsestatud, jäägu ikkagi söömata.

Vahel oletasid mudelid tähendust tõenäoliselt sõnakuju järgi, pakkudes endale tuntumat sõna. Näiteks vissi 'lehm' oli Claude'i arvates 'viski' ja burks 'hamburger' oli 'purk', nagu genereeritud näitelauses "Keldris seisid read burkse hoidistega".

Võiksin näiteid veelgi tuua, ent mis neist mudeleist ikka naerda. Ütlen lõpetuseks hoopis, et Claude pakkus sõna leivaline tähenduseks adekvaatselt 'kellegi ülalpeetav' ning leidis, et "Sõna kannab endas traditsioonilist eesti keele vaimu". Täitsa kena mõte, kandku sõnad ikka jätkuvalt edaspidigi eesti keele vaimu!