Anti Saar. Masintõlke väljavaatest ilukirjanduse alal

Kogu masintõlke kaunist tulevikku varjutab tõsiasi, et ilukirjandus rajaneb määratluse poolest millelgi muul kui lingvistilisel vastavusel asjade korraga, ütleb Anti Saar aastaraamatus "Tõlkija hääl".
MASINTÕLKE VÄLJAVAADETEST ILUKIRJANDUSE ALAL
ANTI SAAR
Lühidalt ajaloost
Nagu väga paljud tänapäeva tsiviilotstarbelised leiutised, oli ka masintõlge algul mõeldud sõjaliseks rakenduseks.
Turingi masin, mis pidi lahti hammustama natsiarmee siseinfot, põhines mehaanilisel arvutusjõudlusel, konkreetselt lingvistilise tõlke masinad aga tulid päevakorrale külma sõja algusajal, kui ameeriklased üritasid silma peal hoida Nõukogude ajakirjandusel ning selles kajastuvatel militaartehnilistel edusammudel. Projekt lähtus eeldusest, et tekstis edastatud tähendused on võimalik lahti kodeerida lähtekeele sõnavara ja grammatikat tundes. Valitses ettekujutus teatava interlingua, eri keelte võimaliku ühise aluse olemasolust.
Warren Weaver, üks toonase ettevõtmise eestkõnelejaid, väljendas neid praegu naiivsena tunduvaid eeldusi järgmiselt:
"Mõelgem indiviididele, kes elavad erinevates kõrvuti paiknevates tornmajades, mis kõik on ehitatud samale vundamendile. Üksteisega suhelda proovides hõiguvad nad sõnumeid edasi-tagasi, igaüks oma tornist. Isegi lähimate tornide vahel on kuuldavus väga vilets ja suhtlus toimub tõesti vaevaliselt. Kui aga indiviid läheb tornist alla, leiab ta end avaralt keldrikorruselt, mis on kõigil tornidel ühine. Seal saab ta kasulikku teavet lihtsalt vahetada teiste isikutega, kes on samuti oma tornidest alla tulnud."[1]
Projekt mõistagi nurjus. Esiteks selgus, et ühele masinale kogu ühe keele grammatika selgekstegemisele kuluks määratult rohkem energiat kui kogu tõlkijatearmee väljakoolitamisele. Teiseks, mis veel lohutum, tuli välja, et ka kõige lihtsamate lausungite tõlkimisel ei piisa täielikust sõnavarapangast, vaid lisanduma peaksid elementaarsed teadmised selle kohta, mida need sõnad tähistavad. Toonastele infotehnoloogidele käis lihtsalt üle jõu masinale selgeks teha, millest üks või teine lause räägib, panna masinat vahet tegema lausetel "kass on puu otsas" ja "puu on kassi otsas".
Jätan vahele Euroopa Ühenduse vahepealsed katsetused ja hüppan otse tänasesse (või vähemalt eilsesse) päeva, statistikapõhiste tõlkeprogrammide juurde, nagu seda oli varane Google Translate (GT), kindlasti võimsaim omataoline, olgu vaba- või piiratud kasutuses.
See on midagi radikaalselt uut, kirjutab tuntud tõlkija ja tõlketeoreetik David Bellos kümmekond aastat tagasi.[2] Selle asemel, et näha lingvistilises fraasis midagi, mis nõuab dekodeerimist, käsitleb GT seda millenagi, mida pole kunagi varem öeldud. Tohutu arvutusjõudlusega programm valgustab silmapilguga läbi kogu interneti, otsides etteantud väljendit tekstidest, mis eksisteerivad kõrvuti oma tõlgetega. Korpus, mida GT skaneerib, sisaldab kogu Euroopa Majandusühenduse dokumentatsiooni alates 1957. aastast, kogu ÜRO paberimaterjali selle kuues ametlikus keeles, tuhandeid mitmekeelseid veebilehekülgi, kohturaporteid, uudis- ja teadusartikleid, raamatuid jne. Nende olemasolevate mustrite alusel valib GT statistilise tõenäosuse järgi igale sõnale või väljendile kõige vastuvõetavama vaste.
Enamasti, suuri keeli üksteiseks pöörates, see töötaski, süstides tõlkeringkondadesse uut optimismi. Ent ka statistikapõhised tõlkeprogrammid on nüüdseks vaid tõlketehnoloogia eelviimane sõna. Esimene teadusartikkel neurovõrgustikele toetuva tõlketehnoloogia kasutamise kohta ilmus aastal 2014. See uus tehnoloogia, neural machine translation (NMT) ei ole varasemast radikaalselt erinev, kuid kätkeb siiski märkimisväärseid uuendusi: NMT programm (ka praegune GT) on suuteline üles ehitama n-ö kunstliku närvivõrgustiku. See läheb sõnasõnalisest tõlkest edasi, vaadeldes tõlke elementaarüksusena terviklikku lauset ja jõudes lähtekeelest sihtkeelde vektorkorrutise meetodil. Programmi ennustusvõime on varasemast suurem ja ta arvestab paremini sõnade konteksti.
Tõepoolest, peame tunnistama, et näiteks tänapäevase GT toimimismudel sarnaneb professionaalse tõlketegevusega palju rohkem kui too aeglane laskumine puhta tähenduse "keldrikorrusele", millest unistasid masintõlke varased arendajad. Ka uute programmide õppimisprotsess (deep learning) meenutab suuresti inimlapse lingvistilise pädevuse arengut. Meiegi pole oma emakeelt omandanud sõnaraamatu ega grammatikaõpiku abil, vaid katse-eksituse meetodil.
Masintõlke perspektiivikust mööndes püüan järgnevalt ometi näidata, et selle rakendusala oli, on ja jääb võrdlemisi piiratuks. Kui inimlaps õpib ajapikku muude tekstide ja sõnumite kõrval lugema, kirjutama ja tõlkima ka ilukirjandust, siis ei paista küll kusagilt, et ükski tõlkeprogrammi laadne tehisintellekt sellega toime võiks tulla. Tähendab, ka minusugustele romantilistele skriptoritele, kes püha Hieronymuse vaimus kirjutuspuldi taga hanesulge närivad, jätkub endiselt lootust ja leiba.
Uute tõlkeprogrammide tutvustusklippe vaadates torkab silma, kuivõrd lapselikult innustunud ja elevil on arendajad ja turundajad nende tehnilisest geniaalsusest ja üha kasvavast võimekusest. Väga vähe teenivad selle kõrval tähelepanu märkimisväärsed erinevused lähtetekstide formaliseeritavuses. Ka minu rõhuasetused edasises on ilmselgelt kallutatud, aga püüan neid siiski mõningal määral nüansseerida. Minu põhiline, rohkem või vähem vaistlik, rohkem või vähem põhjendatav väide tuleneb kultuurisemiootika algtõdedest, kolmetisest eristusest loomulike keelte, tehiskeelte ja kunstikeele kui sekundaarse modelleeriva süsteemi vahel. Piirid tekstiliikide vahel pole muidugi alati selged: ka teadusartiklit võib ilmestada kunstiline efekt, samas leidub luuleteoseid, mis meenutavad keelekasutuse poolest manuaali või meditsiinilist epikriisi. Aga see selleks, et üldse kuhugi jõuda, tuleb nüüd pisut üldistada, pisut karikeerida.
Millest sõnad vaikivad?
Niisiis, kogu masintõlke kaunist tulevikku varjutab tõsiasi, et ilukirjandus rajaneb määratluse poolest millelgi muul kui lingvistilisel vastavusel asjade korraga, mis omakorda iseloomustab kõiki tarbetekste, õigustekste, uudistekste ja enamikku loomuliku keele väljendustest (välja arvatud kõnekeelne iroonia, eufemism, ellips jms). See põhineb nimelt poeetilisel nihkel, hälbimusel lingvistiliste tähendusüksuste tavakasutusest. Öeldu kehtib ka proosa, mitte ainult luuleteksti kohta. Lihtsamalt (ja segasemalt) öeldes: kirjandustekstil on väärtust vaid niivõrd, kui sõnad ei ütle täpselt seda, mida nad ütlevad. Ja isegi kui masina abil on võimalik ühest loomulikust keelest teise üle kanda see, mida sõnad ütlevad, siis kas tuleks masin toime ka selle ülekandmisega, mida nad ei ütle, millest nad vaikivad?
Walter Benjamin küsib essees "Tõlkija ülesanne": "Mida siis üks kirjandusteos "ütleb"? Mida annab ta teada? Väga vähe sellele, kes teda mõistab. Kirjanduse olemus ei seisne teadaandmises ega ütlemises. Tõlge, mis tahab vahendada, ei suuda ometigi vahendada muud kui teavet – seega siis mitteolemuslikku. See on ühtlasi üks kehva tõlke tunnuseid. Kas ei peeta aga seda, mis leidub sõnaloomingus lisaks teabele – ja kehvgi tõlkija tunnistab, et olemuslik on just see –, üldiselt tabamatuks, saladuslikuks, "luuleliseks"? Millekski, mida tõlkija saab ainult luues edasi anda."[3]
See võib mõjuda hõllanduslikult, aga ma usun, et mu kolleegid oleksid minuga nõus: kirjandustekstis ja selle tõlkes ei ole ainult otstarbekohased ütlused ja statistiliselt üldistatavad vasted, vaid just nimelt väga individuaalsed hirmud ja ihad, lõhnad ja maitsed, mälu, südamelöögid ja vereringe.
Ilukirjandust pole vaja, see on otstarbetu tekst. Ja kratt (sest kes see muu üks tõlkeprogramm on?) jääb sellise tekstiga jänni, kuumeneb üle ja läheb pauguga lõhki. Luuletus, see on nagu liivast köis. Ja siit klišee, millele ma meeleldi alla kirjutan: dokumente tõlkigu bürokraadid, filosoofiat filosoofid, luulet luuletajad jne.
Kõigile või igaühele?
Kui seniöelduga nõustuda, tuleks teha veel järgmine eristus.
Dokumenditõlge peab eesmärgiks võtma ühese ehk objektiivse tõlgenduse. Tõlkija seisukohast võib seda tõesti nimetada ka ümberkodeerimiseks. Ümber kodeeritud sõnumi tunnuseks on muu hulgas see, et ta on moonutusteta tagasi tõlgitav. Kui ta seda ei ole, on midagi tõlkes kaduma läinud. Üheks tõlkeprogrammi usaldusväärsuse kriteeriumiks võikski olla see ümberpööratavus. Praegused masintõlkehiiud, näiteks GT, selleni kaugeltki ei küündi, isegi mitte suuri keeli omavahel tõlkides. Uued, täppisteaduslikuma lähenemisega deep learning-tehnoloogiad võiksid selles aspektis osutuda võimekamaks. Võib arvata, et toiduretseptid ja kodumasinate kasutusjuhendid leiavad tulevikus tee ühest keelest teise senisest ladusamalt (iseasi, kas selle aja peale kodumajapidamine ja kokkamine juba läbinisti robotiseerunud pole).
Ilukirjanduse tõlkimine seevastu allub pigem termodünaamika teisele seadusele, mis nendib looduslike protsesside mittepööratavust. Siin on eesmärgiks mitte objektiivne, vaid intersubjektiivne tõlgendus. Teisisõnu: seadus, retsept või manuaal peab kõnetama kõiki, ilukirjandustekst igaüht. Kui luuletus osutub tagasi tõlgitavaks, ei pruugi see öelda mitte midagi tõlkeprogrammi, küll aga luuletuse kohta: see ütleb, et tegemist ei ole luuletusega, kunstilise tekstiga. Termodünaamika 2. seadust ei nimetanud ma ainult edvistamiseks, analoogia peaks olema arusaadav: GTs ehk isoleeritud süsteemis mõnd luuletust kahe keele vahel edasi-tagasi peegeldades on tulemuseks entroopia, arusaamatu sõnapudru. Tähenduse loomiseks peab ülekandesse ühest keelest teise panustama vaimset energiat väljastpoolt.
Niisiis, ilukirjanduse tõlkija mitte pelgalt ei dekodeeri etteantud teksti, vaid kirjutab selle omas keeles uuesti. Sedasama teeb ka lugeja: hea kirjandustekst teeb lugemisest aktiivse kogemuse.
Või veel muud moodi, tõlkijast edasi lugeja juurde liikudes: dokumendid (ka muud tarbetekstid, ka teadusartiklid) kõnetavad lugejas ilukirjandusest erinevaid fakulteete: loogilist ja lingvistilist pädevust, varasemaid teadmisi, üldist eruditsiooni. Ka ilukirjandus eeldab lugejalt enamasti üldkultuurilist pädevust, kuid on lisaks sellele adresseeritud isiklikule mälule, psühholoogilisele samastumisvõimele, empaatiale, aistilisele erksusele. Kuni masinal sellised võimed puuduvad, kuni ta ei suuda ilukirjandusteksti lugeda, ei suuda ta seda ka tõlkida.
Mööndusi
Minu vaenulikule hoiakule võib siin tuua vastuväite: vähe sellest, et ükskõik missuguse inimese sõnavara on võrratult väiksem kui näiteks GT käsutuses olev leksika (sama võib öelda inimkogemuse kohta selle taga), hoopis märkimisväärsem on see, et töökogemuse kasvades kipuvad ka inimtõlkijal välja kujunema stambid, ka tema töö kipub mõneti automatiseeruma. Mul on paar korda juhtunud, et tõlgin sama lõiku kogemata mitu korda – ja ikka olen ma seda avastades hämmeldunud, kui sarnane, peaaegu sõna-sõnalt kattuv on minu hilisem tõlge varasemaga. Samas olen ma veendunud, et mõni teine tõlkija annaks vastavast lõigust teistsuguse (ja võib-olla korduvalt ühesuguse) eestinduse. Ennast lohutades võiksin ma seda efekti nimetada väljakujunenud tõlkijakäekirjaks, kuid ometi muudab mind rahutuks tunne, et tõlkima asudes käivitub minu sees masin, mis tuletab statistilisi tõenäosusi mu enda varasema "tõlkekorpuse" põhjal.
Kas ei jää ma selles, häälte paljususe aspektis siiski alla GT-le, sellele üleelusuurusele lingvistilisele reservuaarile, millel pole ei sõnaraamatut ega interlingua't, vaid tohutu hulk arvele võetud inimkogemust selle kõige mitmekesisemates väljendustes? Kas ei piisaks tõesti ühe indiviidi subjektiivseks kõnetamiseks kõigi subjektiivsete kogemuste ehk intersubjektiivse kogemuse tõenäosuslikust maksimumist? Või oleks see siiski nagu keskmise maitse järgi timmitud tänavatoit või keskmine city-bike, millesarnased eelmisest suvest vuravad tartlaste rõõmuks ka meie tänavatel – city-bike, mis oma disainis ja konstruktsioonis koondab kõigi sõitjate eelistused ja ergonoomilise keskmise, millele aga paljud (kaasa arvatud mina) eelistavad siiski oma isiklikku vokki? Ja siit võrdlusega edasi minnes: kas ei eelista sõitjad oma ratast koguni mingi teadvustamatu trotsi tõttu, hirmu tõttu anda city-bike'ile ära midagi oma individuaalsusest, erilisusest? Ja kas seesama trots ei hoiaks neid eemal ka masintõlgitud kirjandusteostest?
Teisisõnu: ühe inimese kogemus on milleski väga olulises alati rohkemat kui kõigi inimkogemuste summa ja ühe inimese eelistused irduvad alati kas või ivakese võrra kõigi inimeelistuste keskmisest. Olen kaarega tagasi oma eelmise järelduse juures. Masintõlge ei rahulda, kuna peab paratamatult kogemust nivelleerima ja sõnavara standardiseerima.
Tõlke genees
Vene formalist Juri Tõnjanov nimetab artiklis "Kirjanduse evolutsioonist" (1927) kirjandusteksti struktuurielementide kahetist seostumist:
- Teiste elementidega samas süsteemis/tekstis (sünfunktsioon).
- Sarnaste elementidega teistes süsteemides/tekstides (autofunktsioon).[4]
Lausest suurema tähendusüksuse puhul on tõlketehnoloogiatele jätkuvalt jõukohane töötada vaid autofunktsioonis. Juriidilist teksti tõlkiv masin võib sünfunktsiooni eirata, õieti peabki seda tegema – oleks väga ohtlik, kui rangelt formaliseeritud õigusterminid võimaldaksid eri tekstide lõikes erinevaid tõlgendusi.
Ilukirjandusteksti puhul ei saa aga sünfunktsiooni haakuvustest kuidagi mööda vaadata. Kui autofunktsioon tagab teksti mõistetavuse semantilisel tasandil, siis julgen väita, et teksti naudinguline aspekt on fraasi-, sõna-, ja häälikukorduste, rütmi ja meloodia kaudu tihedalt seotud just nimelt sünfunktsiooniga.
Lev Tolstoi kirjutab seoses "Anna Karenina" retseptsiooniga: "Kõiges, peaaegu kõiges, mida ma kirjutasin, juhtis mind vajadus koondada enese väljendamiseks omavahel haakuvad ideed, kuid iga idee, kui teda väljendada eraldi, kaotab oma mõtte, muutub kohutavalt labaseks, niipea kui piirduda ühega nendest haakumistest."[5]
Siit küsimus: kuidas õpetada tõlkemasinat autofunktsiooni kõrval arvesse võtma ka sünfunktsiooni, s.t kõiki neid tekstisiseseid "haakumisi"? Kuidas õpetada tehisaju keskenduma üheleainsale tekstile – kogu selle rikkuses? Kuidas õpetada teda tegema "autori häält"?
Halb tõlkija kuuleb etteheidet, et ta pole lähteteksti enne mõttega läbi lugenud, et on tõlkinud sõna sõna, lause lause haaval, lineaarselt, nägemata teksti stereoskoopiliselt.
Praegusele tõlketehnoloogiale võiks ette heita "vastupidist": et ta ei suuda jälgida teksti lineaarset arengut, vaid näeb seda momentvõttes, ruumiliselt. Ja paraku on sellise tõlke tulemus just teksti sisemiste arengute eiramise tõttu lame ja tasapinnaline. Pingutus ja mõnu on protsessuaalsed nähtused, mis on seotud nii kirjutamise, tõlkimise kui ka lugemisega. Võimas masin ei tea neist nähtustest midagi, sest ta ei tea, mis on protsess.
Veel mööndusi
Olen juba päris pikalt masintõlke väljavaateid alavääristanud, prooviksin nüüd veel kord oma positsioone pisut mahendada.
Esiteks: olgugi et olen sõimanud tõlkemasinaid düsgraafiliseks ja düslektiliseks, olen ma meeleldi valmis möönma, et masin on suuteline (kas või tõlkeprotsessis) tekitama uusi kunstiliselt põnevaid tekste. Kui Lotman ütleb, et "luule on keerukalt ehitatud mõte" ja et iga element kirjandusteoses on motiveeritud, siis ei saa ma lugejana ega ka kirjutajana sellega täielikult nõustuda. Minu lugemiselamustesse on kaasatud ka juhuslikkus, mille võib olla tekitanud trükiviga, keelevääratus või möödalugemine, vaba assotsiatsioon või loop, faasinihe masinas. Ma ei jõua siin näidetel pikemalt peatuda, ent soovitan kõigil, keda huvitab, mida ma silmas pean, lugeda näiteks Pideva ja Silmnähtava Pöögelmanni alias Erkki Luugi "Kogutud teoseid", Kiwa "Lennuki kõrval toas" vms.
Teiseks: leidub autoreid, kes oma loomingust teadlikult välistavad selle, mis võiks masintõlke ummikusse ajada. Siin võime näiteks tuua Prantsuse Uue Romaani koolkonna esindajad, ka eesti keeles tuttavad Michel Butori, Natalie Sarraute'i, Alain Robbe-Grillet' jt, kelle kirjutusest jääb välja traditsiooniline psühhologism ja kujundlikkus, kes just nimelt vahendavad maailma sündmusi ja ka tundeid, üksikasjalikult, kiretult, masinlikult (ehkki igaüks neist väga isikupärasel viisil); või mõned teised autorid, Cormac McCarthy, William Gibsoni, John Graham Ballardi, kes truuna kosmopoliitse, üleilmastunud maailma moodsale hüperreaalsusele annavadki edasi just nimelt ebaisikulist, ajalootut, igal silmapilgul meedias reflekteeritud kogemust.
Ja seega: võib-olla on meie ootused üldse valesti mõtestatud? Võib-olla on vale oodata tõlkemasinate programmeerimist inimteadvuse ajast ja arust mudeli järgi? Võib-olla oleme vaikimisi tunnistajaks hoopis n-ö vastassuunalisele protsessile: inimteadvuse ümbermodelleerumisele uute vastuvõtustandardite järgi, mille käigus hakkab ka kunstitekst lähenema masintõlkega sarnanevale nullstiilile?
Inimene skrollib Facebookis oma uudisvoogu: kellegi peenramaal kasvas hiigelkõrvits; Lihulas tulistati inimesi; keegi on abiellunud; järjekordne tippjuht on sattunud seksiskandaali; keegi on küpsetanud lasajnet; keegi tuleb lagedale vaimuka kalambuuriga; Rootsi koolitüdruk kõneleb pisaraid tagasi hoides maailma liidrite ees... Kõik see on siin ja praegu, kõik on ühtviisi oluline ja tühine, kõik on läbisegi kauge ja isiklik, kõik on korraga kauge ja isiklik.
Meil kõigil on üks ja sama mälestus Nôtre-Dame'i katedraali põlengust 2019. aasta kevadel. Me kõik oleme selle läbi elanud ühtmoodi intiimselt, ühe ja sama rakursi alt, reaalajas ja kõrgresolutsioonis, tundmatu pealtnägija dramaatiliselt hüplevas pildis ja tundmatu hääle kaadritagustes ahhetustes. Veel võib meile meenuda midagi isiklikku, aga peagi saab juba sellest videoklipist endast päris mälestus, mida me jagame kogu võrgustunud inimkonnaga. Meie mälu, meie kogemus ja meie isedus on kiires muutumises. Näis, ehk oleme peagi ka lugejatena valmis vastu võtma tõlkeprogrammide ebaisikulist, silmapilkset toodangut.
***
Käesolev artikkel tugineb suuresti ettekandele, mille pidasin möödunud aasta septembris Euroopa Komisjoni kirjaliku tõlke peadirektoraadi seminaril "Tõlkimine digiajastul – keeletehnoloogia mõju eri tõlkevaldkondadele". Teadsin, et astun tarbetõlkijate seltskonda väljastpoolt, ilukirjandustõlke alamakstud ja boheemlikust seltskonnast. Oma toonast ettekannet üle vaadates ja ümber kirjutades näen, et üritasin kõigiti vastata eelarvamusele, mida ma ise – eelarvamuslikult – oletasin kuulajaskonnal enda kohta olevat. Oma leppimatuse, koguni põlglikkuse kiuste kohtasin siiski valdavalt mõistvat ja soosivat vastuvõttu ning sain kõneldule tänuväärseid kommentaare. Sellest hoolimata ei lähe mul meelest, et kui olin oma jutu kokku võtnud retoorilise küsimusega: "Miks peaksimegi meie, ilukirjanduse tõlkijad, tahtma oma tööd lihtsamaks ja kiiremaks teha, kui me selleks kuluvat aega ja sellelt nõutavat pingutust sedavõrd naudime," kuulsin publikust sosinat: "Ta pole lihtsalt proovinud [tõlkeprogramme kasutada]…"
Nüüd, märksa vaguramas meeleolus, otsustasin oma segastele muljetele selgust paluda TÜ keeletehnoloogia professorilt Mark Fishelilt, ühelt meie omamaise võimekaima neurotõlkeprogrammi Tartu NLP väljatöötajalt. Saatsin talle oma artikli põhipunktide kohta mõned teadlikult provokatiivsed küsimused. Järgnevalt esitan tervikuna meie kirjavahetuse, mis vähemalt mind palju leplikumaks muutis:
Anti Saar: Mis on need peamised kvalitatiivsed erinevused, mille poolest TÜ neurotõlge erineb teistest vabakasutuses olevatest ja kumuleeruva dokumendipangaga programmidest (nagu Google Translate)?
Mark Fishel: Tehnoloogia, mida kasutame, on üldjoontes sama, kuid erinevusi ikka on. Üks meie eripära on tekstivaldkonna eksplitsiitne arvesse võtmine – seega võib küsida nt viisakat või kõnekeelset tõlget. Teiseks saab Neurotõlge hakkama ka keeleseguga nagu "Üks saldējums, пожалуйста" – kuna meie lähenemine ei käsitle igat keelepaari eraldi, vaid kõik sisend- ja väljundkeeled mahuvad ühe tõlkemudeli sisse.
Üldiselt aga, kui rääkida üldvaldkonna tekstidest, nagu uudised, siis oletan, et suurt tõlkekvaliteedi vahet ei ole või saavad Google jt suured sellega isegi natuke paremini hakkama.
A.S.: Kas TÜ neurotõlkeprogramm suudab jälgida dokumendi sisemist ühtsust eri sõnade või väljendite tõlkimisel, s.t ka ta eesõigustab tekstisiseseid referentse kõigile välistele (võimalik, et "statistiliselt tugevamatele") vastetele?
M.F.: Dokumendis küll mitte, ja seda ei tee ka Google Translate, Bing translator ega teised. Arvestatakse ainult lause konteksti – seega on võimalik, et erinevates lausetes kasutatud tõlkevasted on ebaühtlased.
A.S.: Kas TÜ neurotõlkeprogramm oskab lugeda?
M.F.: Ainult üksikuid lauseid. Õppimise käigus tegelikult peabki ta "lugema" miljoneid lauseid ja nende tõlkeid, et üldse tõlkima õppida; seda aga tehaksegi lausepaari kaupa. Tõlkimise ajal aga võetakse iga lause, tükeldatakse selle sõnad mõistlikeks juppideks ning "loetakse" need sisse, et leida neile lause konteksti arvestav esitus ning genereerida selle põhjal tõlkeväljund.
A.S.: Kas teie neurotõlkeprogrammist võiks kasu olla ka ilukirjanduse tõlkimisel?
M.F.: Tavaliselt kasutatakse masintõlget praktikas nii, et masin tõlgib ning inimene seejärel parandab ("järeltoimetamine"). Järeltoimetamine on mõistlik tekstide puhul, mille tõlkimine on suures osas korduv või rutiinne; lisaks aitab, kui tekste peab tõlkima otse ilma varieeruvuseta. Järeltoimetamise peamine eesmärk on teha tõlkimine kiiremaks ja efektiivsemaks. Ilukirjandus ei sobi ühegi sellise kriteeriumi alla, ning seega ei ole mõtet järeltoimetamist ilukirjandusega teha – seega oleks efektiivsus seejuures palju väiksem.
Kaudselt võib aga ikka kasu olla: mitmekeelseid masintõlke masinaid saab kasutada nt selleks, et saada paremini aru mingist konkreetsest tekstilõigust või näha mitut erinevat viisi, kuidas mõnda fraasi tõlkida saaks. See tähendab, et masintõlge ei asenda mingit osa inimese tööd, kuid töötab nagu üks nutikas lisasõnastik.
A.S: Kirjutan artiklit just ilukirjanduse tõlkija positsioonilt. Mu kolleegid on tõlkeprogrammide suhtes üsna kriitilised ja mis seal salata, ka mina ei kujuta hästi ette, mis abi võiks mul olla masintõlkest näiteks mu praeguse töö, Marcel Prousti tõlkimise juures. Aga ma katsun olla avatud meelega, sest kogu AI teema tundub mulle iseenesest väga põnev.
M.F: Pean tunnistama, et ilukirjanduse, luule ja paljude teiste tekstitüüpidega ei ole masintõlge üldse otstarbekas. Sellel on oma kindel nišš ning sellised "keerulised" tekstid sinna ei kuulu, seal on ikka vaja inimaju ja -loomingulisust.
Tekst on esmalt ilmunud Eesti Kirjanike Liidu Tõlkijate sektsiooni aastaraamatus "Tõlkija hääl VIII".
[1] David Bellos, Is that a Fish in your Ear. Particular Books, 2012, lk 258.
[2] Samas, lk 263.
[3] Walter Benjamin, Valik esseid. Tlk Tiiu Relve. Kultuurileht, Loomingu Raamatukogu, 2010, nr 26–29, lk 38.
[4] Vt: Juri Tõnjanov, Kirjanduse evolutsioonist. Tlk Märt Väljataga. Rmt-s Kirjandus kui selline. Valik vene vormikoolkonna tekste. Koost ja toim Märt Väljataga. Tallinna Ülikooli Kirjastus, 2014, lk 224.
[5] Juri Lotman, Kultuurisemiootika. Luule olemus. Tlk Pärt Lias. Olion, 1990, lk 70.
Toimetaja: Valner Valme