Käännetään rautalangasta -podcast, 4. jakso: Kone kääntää (myös kaunokirjallisuutta)

Haastattelu: Toimittaja Juha Roiha

Puhujat: Kännösviestinnän professori Kristiina Taivalkoski-Shilov Turun yliopiston kieli- ja käännöstieteiden laitokselta ja käännöstieteen professori Maarit Koponen Itä-Suomen yliopistosta

Tuotanto: SKTL:n viestintäasiantuntija Maarit Laitinen 

Käsikirjoitus: Sari HokkanenTuija Kinnunen, Maarit KoponenMaarit LaitinenEsa PenttiläJuha Roiha, Kristiina Taivalkoski-Shilov ja Gun-Viol Vik

 

[kesto 35 min 45 s]

Jaksossa keskustellaan konekääntämisestä ja siitä, miten kone onnistuu erilaisissa käännöstehtävissä.

Litterointi:

[tunnusmusiikkia]

Juha Roiha: Tervetuloa taas kuuntelemaan asiantuntevaa puhetta kielestä ja kielen kääntämisestä, tulkkaamisesta ja kaikesta, mikä siihen liittyy. Tällä kertaa tässä podcastissa puhumme siitä, mitä konekääntäminen on, miten kone kääntää ja mikä se on, mikä koneesta tekee kääntäjän, vai voiko kone tehdä sen monella tavalla, ihmisavusteisesti tai ilman ihmisavustusta, ja mitä tästä kaikesta seuraa. Uppoammeko Matrixin maailmaan?

Minä olen Juha Roiha ja tässä kanssani ovat keskustelemassa käännösviestinnän professori Kristiina Taivalkoski-Shilov Turun yliopiston kieli- ja käännöstieteiden laitokselta. Terve, Kristiina!

Kristiina Taivalkoski-Shilov: Hei, Juha!

Juha: Ja käännöstieteen professori Maarit Koponen Itä-Suomen yliopistosta. Hei, Maarit!

Maarit Koponen: Hei vaan!

Juha: Heittelin tässä jo eteen tämmöisen kysymyksen tästä koneesta. Jokainen meistä on törmännyt tähän vieraillessaan esimerkiksi pahamaineisissa tai vähemmän pahamaineisissa verkkokaupoissa, esimerkiksi tuon ison Kiinan markkinoilla. Siellä on ihan yllättävän hyviäkin käännöksiä, mutta koneeseen törmää paljon muussakin. Mutta mistä me puhutaan, kun me puhutaan konekääntämisestä, mikä se kone on, joka kääntää?

Maarit: Niin, tämä on sinällään ihan mielenkiintoinen kysymys. Tosiaan kuten ehdit jo mainita, ehkä tutuimpana ihmisille ehkä tulevat mieleen tällaiset Google-kääntäjät ja vastaavat, eli sellaiset, joita meistä jokainen pääsee netissä käyttämään, tai sitten juuri nämä erilaisten nettikauppojen tai vaikka sosiaalisen median konekäännökset siellä taustalla. Periaatteessahan nämä ovat sellaisia koneita, nämä Google Translate ja kumppanit, että näissä on niin sanottuja oppimisalgoritmeja, joille annetaan valtavat määrät ihmisten jo kääntämiä tekstejä ja niistä ne sitten tietynlaisilla, voisi sanoa vähän niin kuin tilastollisilla menetelmillä, muodostavat todennäköisyyksiä. Jos meillä on lähtökielen puolella joku sana tai ilmaus, niin mitä siellä kohdekielen puolella sitten on. Tämä on ehkä se tutuin. Mutta, jos lähdemme puhumaan siitä, mitä kääntäjät tekevät, niin kääntäjäthän käytävät monia muunkinlaisia koneita ja eri tavalla.

Juha: Esimerkiksi, kun kääntää kaunokirjallisuutta, Kristiina, niin voiko siinä olla koneavusteinen homma myös mukana niin, että kääntäjä tsekkaa joitakin asioita koneen kautta?

Kristiina: Kyllä. Tästä aiheesta on toistaiseksi hyvin vähän tutkimusta, mutta jonkin verran tutkimusta alkaa jo olla. Minun tiedossani on kolme kyselytutkimusta, jotka on suunnattu nimenomaan kaunokirjallisuuden kääntäjille. Heiltä on tiedusteltu, kuinka paljon he ylipäänsä käyttävät teknologiaa, yleistä teknologiaa, eli nettisanakirjoja, termityökaluja, ajanhallinnan ohjelmia, ja kuinka paljon he käyttävät käännösteknologiaa. Näiden kyselyiden perusteella voidaan päätellä, että ehkä noin kahdestakymmenestä kolmeenkymmeneen prosenttia näistä kääntäjistä, jotka ovat osallistuneet näihin tutkimuksiin, hyödyntävät ihan käännösteknologiaa.

Usein kyseessä ovat kääntäjät, jotka ovat joko perehtyneet käännösteknologian käyttöön opiskeluissaan esimerkiksi yliopistossa tai ovat myös asiatekstinkääntäjiä, jolloin he ovat asiatekstejä kääntäessään huomanneet käännösteknologisten työkalujen, esimerkiksi käännösmuistien, hyvät puolet, ja hyödyntävät sitten luovasti käännösteknologiaa myös kääntäessään kaunokirjallisuutta. Tällaista esimerkiksi Suomessa tapahtuu. Esimerkiksi tällainen kaunokirjallisuuden kääntäjä kuin Nina Mäki-Kihniä, jota olen haastatellut yhtä tutkimustani varten, sanoi, että hän käyttää aina projektikohtaisia käännösmuistiohjelmia, kun hän kääntää kaunokirjallisuutta. Eli kaunokirjallisuuden kääntäjät siis hyödyntävät jo nyt teknologiaa, mutta ihmiskääntäjähän... Kone ei ymmärrä, mitä se kääntää, vaan se etsii vastaavuuksia pienille tekstisegmenteille. Kun taas ihmiskääntäjä miettii ensimmäisenä, että ahah, kenelle tämä tulee luettavaksi ja sitten hän miettii tekstiä kokonaisuudessaan. Siinä on se suurin ero ihmiskääntäjän ja koneen välillä.

Juha: Voikos kone sitten oppia miten paljon jotakin. En nyt voi ihan heti kuvitella, että kone voisi oppia kulttuurillisia sisältöjä, jollei siihen syötetä koko kulttuuria, ja sehän kai on kohtuullisen mahdotonta. Muuta se voi oppia jotain sen maailman sisältä, mitä sille syötetään.

Maarit: Niin, no sanotaan niin, no… Me tulemme nyt tietyllä tavalla hyvin filosofisiin kysymyksiin. Alamme olla sellaisissa kysymyksissä kuin, mitä itseasiassa tarkoittaa oppiminen ja mitä itseasiassa tarkoittaa ymmärtäminen. Nythän on hirveän jännittävää se, minkä itse asiassa jokainen, jos näitä konekääntimiä käyttää, on huomannut, että konekäännösten laatuhan on parantunut tässä muutaman vuoden säteellä selkeästi. Jos me ajattelemme tuonne jonnekin vaikka kymmenen vuoden päähän taaksepäin, niin jos käänsi melkein mistä kielestä tahansa koneella suomeen päin, niin eihän siitä ollut kuin lähinnä huumoriarvoa. Käännökset olivat tosi tönkköjä ja ihan kummallisia ja ihan mitä sattuu tulee sieltä ulos. Nyt meillä on yhtäkkiä sellaisia konekäännöksiä, jotka alkavat jo olla ihan sellaisenaan hyödyllisiä moneen tarkoitukseen, kun esimerkiksi niitä nettikauppoja selaa tai, olen käyttänyt ennenkin sellaista esimerkkiä, että kun joku vaikka katsoo hotellien arvosteluja tai vastaavia sivuja, niin siitähän saa ihan selvää, mistä tässä puhutaan. Mutta se saattaa toisaalta olla myös hirmu arvaamatonta. Siellä on paljon sellaista, mikä on tosi hyödyllistä ja tosi selkeää, periaatteessa sisältö käy hyvin ilmi, ja sitten siellä yhtäkkiä on jotakin aivan kummallista tai aivan pielessä. Eli tässä tulee tämä, että onko kone niin sanotusti oppinut jotain vain ei.

Itse teen etupäässä töitä asiatekstien kanssa, joten ehkä katson enemmän sieltä informaatiosisällön kautta tätä asiaa. Mutta jos mietimme esimerkiksi kulttuurisia asioita ja erilaisia ilmauksia ja vastaavia, niin tulee sellainen ongelma, että konekäännöksissä saattaa olla välillä sellaisia, jotka näyttävät ihan hyvältä ja tulee tunne, että hei, en minäkään tähän tämän parempaa ratkaisua keksisi. Sieltä saattaa tulla vaikka jonkinlainen kulttuurinen näkökulma ihan oikein käännettynä, ja sitten seuraavassa kohdassa ollaankin taas ihan pahasti metsässä. Mutta onko kone varsinaisesti oppinut, jos nyt laittaisin lainausmerkit tähän sanan oppinut ympärille ja lainausmerkit sanaan ymmärtämään, kulttuuria, niin se on sitten eri asia. Jos kone onnistuu jossakin kohdassa näiden todennäköisyyksiensä avulla jäljittelemään sitä, että kun esiintyy tällainen ilmaus, sen ympärillä on tyypillisesti tällaisia muita ilmauksia, ja niistä sitten rakentuu sellainen teksti, joka näyttää ihan uskottavalta, niin mitä siis tarkoittaa ymmärtäminen.

Juha: Jos kone ei voi oppia, ja jos se ymmärtää jonkun asian, jos jälleen kerran käytämme sanaa ymmärtäminen, jos se tajuaa jonkin merkityssisällön väärin, niin sehän on tavallaan pommi, jonka purkaminen on aika mahdotonta. Kun me emme tiedä, mitä me olemme sinne syöttäneet, minkä se on tavallaan oppinut tai ymmärtänyt tai vastaavalla tavalla saanut itselleen sisälleen, mitä se käsittää väärin ja minkä takia se työntää vääriä tuloksia.

Maarit: Näitä vääriä tulkintojahan, tai käännösvirheitä tai miten sen nyt haluaa ilmaista, tulee yleensä sellaisissa tilanteissa, joissa on jotakin odottamatonta, sellaista, mikä ei ole ihan se tyypillisin tai ensimmäinen todennäköisin tai yleisin merkitys. Eli helposti nousee pinnalle joko yleisimpiä tulkintoja, mikä on jossain kohdassa itseasiassa väärin ja olisikin pitänyt kääntää jollakin muulla tavalla. Toinen ongelma on, että tätä niin sanottua opetusaineistoa ei ole tarpeeksi, ja kone rupeaa keksimään omiaan. Niin sanotut neuroverkkokääntimet pystyvät esimerkiksi kehittämään todennäköisen sanan, jos ne eivät ole koskaan nähneet aineistoissa jotain sanaa. Sen pohjalta, mitä tämä todennäköisesti olisi, mitä sen lähellä on, se kehittää oman sanan, joka saattaa olla aivan kummallinen eikä kuulu aisaan millään tavalla. Näitä on kaikenlaisia kummallisia, kai sitä voisi sanoa väärinkäsitykseksi.

Juha: [naurahdus] Kone käsittää väärin. Miten, Kristiina, sinun näkökulmasi tähän? Voiko kone siis käsittää väärin? Onko tätä tutkittu esimerkiksi kaunokirjallisuuden kääntämisen puitteissa?

Kristiina: Kaunokirjallisuuden kääntämisen puitteissa tällaista ei ole vielä tutkittu, koska tutkimus, joka koskee konekääntämisen ja ylipäänsä käännösteknologian hyödyntämistä kaunokirjallisuuden kääntämisessä, on aika nuorta. Sitä on tehty systemaattisemmin vasta hieman yli viisi vuotta. Mutta alkaa olla tutkimusta esimerkiksi siitä, millä tavalla raakaa konekääntämistä voitaisiin hyödyntää kaunokirjallisuuden kääntämisessä. Voitaisiinko konekääntämistä hyödyntää kaunokirjallisuuden kääntämisessä siten, että ensin kone tekisi raakakäännöksen ja sitten ihminen jälkieditoisi sen kaunokirjallisen tekstin? Mutta on todettu, että se soveltuu huonosti kaunokirjallisuuteen. Se aiheuttaa kognitiivista ja emotionaalista stressiä ja lopputuloksena on vähemmän tyyli- ja sanarikas teksti.

Mutta yhtenä uutena vaihtoehtona, josta puhutaan nyt konekääntämisen osalta, on se, että kone, kun se välillä tekee näitä hulluja keksintöjään, voisi välillä toimia inspiraation lähteenä kaunokirjallisuuden kääntäjälle. Hän voisi hyödyntää… Hän itse kääntää kaunokirjallista tekstiä ja vierellä voi olla auki ikkuna, jossa kone antaa omia ratkaisujaan. Kaunokirjallisuuden kääntäjän ei tarvitse katsoa sitä, kunnes sitten hänelle tulee vaikka pohtimisen paikka. Sitten hän voi katsoa, mitäs kone tähän tarjoaa. Se voisi toimia yllättävän hauskanakin inspiraation lähteenä. Mutta se, että kone olisi koko ajan tuputtamassa omia ratkaisujaan, ei tunnu toimivan kaunokirjallisuuden kääntämisessä. Mutta Maarit haluaa sanoa tästä lisää.

Maarit: En itse asiassa suoraan tuohon kaunokirjallisuuden kääntämiseen, mutta mietin, että tässä tulee mielenkiintoisesti eri tekstilajien ja erilaisten käännöstilanteiden peilaaminen, juuri tämä jälkieditointi, mihin Kristiina tuossa juuri edellä viittasi, eli se, että tehdään koneella raakaversio, joka annetaan kääntäjälle, joka työstää sitä eteenpäin. Tätähän monessa asiatekstiyhteydessä tehdään jo hyvinkin paljon, ja on paljon asiatekstinkääntäjiä, jotka ovat itseasiassa hyvin tyytyväisiä tällaiseen työkaluun. Se toimii vaikka jossain tietynlaisten teknisten tekstien tai tietynlaisten hallinnollisten tekstien kääntämisessä hirveän hyvin. Meillä esimerkiksi Suomessa varmaan yksi isoimpia organisaatiota, joka on ottanut sen käyttöön, on Valtioneuvoston kanslia, joka tekee Suomen valtiolle, ministeriöille ja muille käännöksiä. Mitä olen heidän kanssaan keskustellut, pääosin kokemus on varsinkin tämän uusimman version kanssa ollut erittäin positiivinen. Sielläkin tätä on kokeiltu moneen kertaan, eivätkä aiemmat koneet ole olleet vielä ihan kypsiä. Mutta nyt on saatu sellainen versio, josta on tykätty.

Mutta tosiaan tässä nousee esille se, että kaikki kääntäminen ei ole samanlaista. Se, että kone toimii jossakin asiatekstiyhteydessä hirveän hyvin, ei välttämättä tarkoita, että se kaunokirjallisuudessa toimisi yhtä hyvin. Tai toinen, minkä kanssa olen itse vähän ollut tekemisissä, on audiovisuaalinen kääntäminen. Eli jos lähdettäisiin vaikka televisiotekstityksiä kääntämään, niin siinä on sitten niin paljon muita asioita, jotka pitää ottaa huomioon. Esimerkiksi se, miten televisiotekstitystä tai elokuvien tekstitystä täytyy tietyllä tavalla tiivistää, muokata vähän eri tavalla, ottaa huomioon se, että se näkyy ruudulla tietyn aikaa ja sillä on vain tietty tila. Konekäännös ei ainakaan nykytekniikalla vielä pysty ottamaan tällaisia asioita huomioon. Olemme tietyissä kokeissa huomanneet, että av-kääntäjälle on melkein enemmän riesaa siitä, että tulee konekäännös tarjolle, verrattuna siihen, että hän tekisi oman prosessinsa mukaan suoraan toimivan av-käännöksen.

Kristiina: Kaunokirjallisuuden käännöksessä konekääntäminen on ehkä sen vuoksi erityisen haastavaa, että kaunokirjallisuudessa tekstimuoto ja sisältö ovat erityisen läheisessä suhteessa keskenään. Totta kai ihmiskääntäjäkin joutuu puuttumaan tekstimuotoon, kun hän pukee sen toiselle kielelle, mutta hänen täytyykin ottaa kirjailijan rooli ja luoda erittäin tasokasta tekstiä kohdekielellä. Sen vuoksi kaunokirjallisuuden kääntäjä ei voi unohtaa tekstimuotoa ja sen vuoksi konekääntäminen sopii huonosti kaunokirjallisuuteen.

Juha: Jos ajatellaan sitten, että jossain vaiheessa se voisi toimia, tai missä se sitten parhaiten toimisi, niin olenko ymmärtänyt oikein, että esimerkiksi sukulaiskielten välillä tätä voisi jollakin tavalla harrastaa myös kaunokirjallisuudessa.

Kristiina: No tätä on ainakin tutkittu. Esimerkiksi alan pioneeri Hollannissa tällä hetkellä vaikuttava espanjalaistutkija Antonio Toral on tehnyt tutkimuksia, joissa hän on nimenomaan ensin konekääntänyt tekstiä katalaanista espanjaan tai toisin päin ja sen jälkeen esimerkiksi jälkieditoinut tätä tekstiä, mutta nyt hän on, ehkä nimenomaan siitä johtuen, että, vaikka käännetään sukulaiskielten välillä, niin konekääntämisen ja jälkieditoinnin yhdistelmässä tuntuu tapahtuvan tekstin köyhtymistä, hänen viimeaikainen tutkimuksensa on suuntautunut aivan toisaalle. Mutta mä tiedän, että vastaavaa tutkimusta on myöskin tehty esimerkiksi käännettäessä gaelista iiriin päin, että tällaista tutkimusta vähän tehdään, mutta kuitenkin, vaikka toimitaan sukulaiskielten välillä, siinä on kuitenkin ne samat riskit siitä, että se tekstityyli köyhtyy. Maarit, ole hyvä.

Maarit: On paljon erilaisia toisaalta teorioita siitä, mikä toimisi, ja toisaalta käytännön kokemuksia, ja tämä läheiset sukukielet on tosi mielenkiintoinen ala. Kuten tuossa tuli jo mainittuakin, juuri tuo espanja–katalaani on sellainen, mitä on tutkittu paljonkin. Käsitykseni mukaan yksi syy, miksi juuri sitä on tutkittu niin paljon, on se, että siitä kieliparista on jo olemassa paljon aineistoa. On paljon heitelty, että samalta pohjaltahan suomen ja viron välinen käännös pitäisi toimia tosi hyvin, mutta tätä on käytännössä pystytty aika vähän tutkimaan. Siis on kyllä tutkijoita, jotka ovat tarkastelleet suomi–viro-käännöstä, ei tietääkseni kaunokirjallisuudessa suoranaisesti, mutta yleisesti ottaen. Tai sitten vaikka suomen ja eri saamen kielten välistä kääntämistä on tutkittu esimerkiksi Norjassa, ja Suomessakin Helsingin yliopistolla on tätä kyllä jonkin verran tutkittu. Mutta ongelma on, että tarvittavat aineistot ovat niin pieniä. Ei löydy riittävästi rinnakkaistekstejä eli käännettyjä tekstejä, vaikka sitten suomen ja viron tai suomen ja saamen väliltä, mikä on ehkä vähän hassu ajatus, kun kuitenkin puhutaan tällaisista kielistä, sillä suomen ja vironkin välillä varmaan paljonkin tapahtuu esimerkiksi kauppaa ja näin. Miksei niitä ole käännetty? Mutta siinä tullaan tähän, että neuroverkkojärjestelmät vaativat niin valtavia aineistoja, että aineistot eivät ole riittäviä, ja nekin käännökset, jotka ovat olemassa, eivät välttämättä ole koneelle hyödyllisessä muodossa.

Tästä on ollut mielenkiintoinen projekti suomen ja ruotsin välisissä käännöksissä, joita tästä maassa kyllä löytyy paljon, mutta niiden saaminen ensinnäkin käyttöön ja toiseksi sellaiseen muotoon, että niitä voidaan soveltaa kääntimen kehittämisessä, ei ole ollut ihan yksinkertainen hanke. Siitä on ollut tutkimushanke nyt käynnissä muutaman viime vuoden aikana nimenomaan Helsingin yliopiston vetämänä. Mielenkiintoisia pointteja ovat, että toisaalta läheiset sukukielet olisivat plussan puolella, että kääntäminen todennäköisesti toimisi, mutta aineisto-ongelmat tulevat toisesta suunnasta vastaan.

Juha: Mitenkäs sitten, jos otetaan esimerkkinä, että kone kääntää konetta? Kone on pystynyt tekemään myös tarinoita ja niitähän on kokeiltu jo aika paljon. Koneen kirjoittama tarina esimerkiksi suomeksi ja sitten kone kääntäisi sen englanniksi. Päästäänkö siinä hyvää lopputulemaan vai meneekö se tähän kuuluisaan rikkinäinen puhelin -efektiin?

Maarit: Tässä täytyisi varmaan määritellä se, mikä on hyvä. [naurua] Sanotaan, että ne koneiden tuotokset alkavat olla niin… Se on niin oma, voisi sanoa jopa taiteenlajinsa, että miten määritellään, onko se hyvää vai huonoa. Voin ihan anekdotaalisesti kertoa, että olin itse muistaakseni se oli viime keväänä seuraamassa eurooppalaista hanketta, jonka nimi on ELITR, kirjoitetaan E, L, I, T, R. Heillä oli demoesitys, jossa oli ensinnäkin tällainen tekoälyn tuottama, tietynlaisen koneen, joka generoi tekstiä yhdellä kielellä. Ja se generoi sitä, muistaakseni ensimmäinen lähtökohta oli kai tšekin kieli, ja sitten oli myös englantia. Eli kone ensin generoi teatteriesityksen, eli oli täysin koneellisesti kehitetty narratiivi, kerronta, joka oli sitä teatteriesitystä varten heidän välineillään käännetty vielä eri kielille. Siellä oli muun muassa myös suomenkielinen konekäännös tästä teatteriesityksestä, ja sehän oli aivan valtavan hauska.  Nauroin varmaan sen, mitähän se olisi kestänyt, se ollut kovin pitkä, olisikohan se ollut joku parinkymmenen minuutin esitys. Nauroin ihan vedet silmissä sen koko esityksen ajan sen takia, että jo se koneen kehittämä tarina oli niin absurdi, ja sitten se koneellisesti käännetty dialogi oli vielä tasoa absurdimpi. Eli olihan se sinällään hauska, mutta mitä tarkoittaa, että oliko se hyvä, että haluaisinko sellaisia teatteriesityksiä katsoa enemmän? Kerran kaksikymmentä minuuttia oli valtavan hauska kokemus, mutta kyllä edelleenkin arvosta ihan ihmisen käsikirjoittamaan ja kääntämää nykyteatteria. [naurua]

Kristiina: Kyllä. Konekääntämistä on siis hyödynnetty muun muassa runoudessa ja sitten todellakin, kuten Juha mainitsit, tällaisia tarina-algoritmeja on kehitelty jo monta vuosikymmentä, mutta niiden ongelmana on se, että ne nimenomaan saattavat toimia kuriositeettina, hauskana kertakäyttötuotteena, mutta usein esimerkiksi niiden kehittämät juonet ovat tosi kaavamaisia, ja jos pohditaan kaunokirjallisia piirteitä, niin se kokemuksellisuus jää jotenkin hyvin latteaksi eivätkä henkilöhahmot eivät ole samastuttavia. Eli nämä ovat sellaisia tekstejä, jotka eivät voi kovin kauaa yleensä kiinnostaa lukijoita. Ne eivät tempaa mukaansa.

Juha: Eli niin kauan, kun ihminen on se vastaanottava osapuoli, pelkkä konekäännös ei todennäköisesti tyydytä.

Maarit: Kyllä.

Juha: [naurahdus] No voisitteko te kuvitella sitten, mikä olisi ihanteellinen käännöstyökalu? Minkälaisia komponentteja siinä voisi olla? Semmoinen, jolla voisi kääntää vaikka, no mennään ensin asiatekstiin. Mitä siinä tarvitsisi olla?

Maarit: Siitä on hieman aikaa, kun olen itse tehnyt viimeksi aktiivista asiatekstikääntämistä, niin voi olla, että muilla kollegoilla olisi eri mielipiteet. No varmasti muutenkin eri ihmisten mielipiteet saattavat olla erilaiset, mikä on kenellekin sellainen ideaali työkalu ja toimintaympäristö. Mutta tutkimuksissa, kun on tehty vaikka kyselytutkimuksia siitä, miten kääntäjät käyttävät teknologiaa ja minkälaisia ominaisuuksia he toivovat näiltä työkaluilta, niin niissä on toivottu selkeyttä, että tulee riittävästi informaatiota, että tulee esimerkiksi sellaisia käännösmuisteja, jotka Kristiinakin jo mainitsi jossain aikaisemmassa puheenvuorossa, joista näkee suoraan, että jossain aikaisemmassa tekstissä on käännetty tämä sama pätkä tai hyvin samantyyppinen pätkä tällä tavalla ja tulee ehdotus, että haluatko tätä tai samantyyppistä uudestaan. Se, että tulee relevantteja ehdotuksia ja niistä näkee myös, mistä ne ovat peräisin. Vaikka jokin virke olisi pinnalta hyvin samantyyppinen, se, missä kontekstissa se on esiintynyt, että mistä asiakirjasta esimerkiksi jokin käännös on peräisin, on tärkeä tieto kääntäjälle. Eli se, että siinä on sopivasti relevanttia informaatiota.

Jos taas informaatiota tulee ihan hirveästi koko ajan ja joka suunnasta, niin sekään ei ole hyvä asia. Eli kun esimerkiksi näihin asiatekstinkääntäjien käyttämiin ympäristöihin, niihin yhä enemmän tulee sitä konekäännöstä rinnalle, eli sieltä tulee näitä ehdotuksia sekä sieltä muistista, että miten jotain on aikaisemmin käännetty, ja sitten siihen tulee myös konekäännöksen ehdotus, että näin sen voisi kääntää. Kun erilaisia ehdotuksia rupeaa tulemaan hirveän paljon ja eri lähteistä, niin siitä tulee ylimääräistä kognitiivista työtä, kun niitä pitää sitten tarkistaa ja arvioida ja päättää, että mitä minä tälle teen. Informaatiotulva saattaa myös olla melkoinen, eli se, mitä konekääntämisen puolella myös tutkitaan on se, miten saataisiin suodatettua niitä konekäännösehdotuksia niin, että jos siellä on jotakin, mikä on aivan luokattoman huonolaatuista, ei ollenkaan sovellu tähän, millä ne saataisiin jo suodatettua pois, ettei näytetä niitä ollenkaan kääntäjälle. Koska siinä tulee sellainen raja, jossa on jo parempi tai helpompi tai nopeampi, miten sen nyt haluaa ilmaista, vaan kääntää se itse suoraan alusta asti sen sijaan, että yrittää ruveta parsimaan kasaan jotain kummallista ehdotusta. Nämä ovat sellaisia tasapainotteluja. Ja vielä yhden tekijän mainitsen. Asiatekstikääntämisessä terminologia on yleensä hirveän tärkeää asia, eli jokin sellainen teknologinen palikka, joka pystyy kertomaan, mikä on se oikea termivastine, sillä melkein kaikilla termeillä on yleensä eri vaihtoehtoja, jotka saattavat sopia johonkin tiettyyn yhteyteen tai jollekin tietylle asiakkaalle vaikka, mutta eivät sitten sovikaan muualle. Eli sellainen, joka pystyisi kertomaan helposti ja luotettavasti, että tämä on nyt juuri tähän kohtaan oikea vastine. Ja se, että ne termit eivät vaihtelisi siellä koko ajan ihan sekalaisesti. Siinä on nyt ainakin joitain ominaisuuksia.

Jaha: Hienoa! No ihmisen päähän on semmoinen, että se on tehty juuri suodattamaan näitä ylimääräisiä hälyjä pois. Me fokusoidumme johonkin ja sitten me tehdään, ja niin kauan kun koneella ei ole tätä samaa ominaisuutta, niin se on asiatekstinkääntämisessäkin varmasti aikamoinen ongelma. Kristiina, mitenkäs sitten, jos kaunokirjallisuuden puolelta lähdetään, näetkö siinä semmoisia hyödyllisiä työkaluja vai on onko se samanlainen sekamelska, jossa kääntäjä menee vielä enemmän sekaisin?

Kristiina: Mä näen samoja piirteitä, joita Maarit tuossa äsken mainitsi, eli tähänastinen tutkimus, nyt sitä tutkimusta ei toistaiseksi ole kovin paljon ja Suomessa sitä kartoitusta ei ole tehty, mutta näissä kyselytutkimuksissa, joita nyt on olemassa, niin kääntäjät haluavat teknologialta apua nimenomaan tiedonhaussa, eli esimerkiksi tekstin analyysissä, intertekstuaalisten viittausten tunnistamisessa tekstistä, esimerkiksi sanaleikkien kääntämisessä, ja tähän on itse asiassa jo olemassa tällainen työkalu. Se on kehitetty ja siitä on tulossa artikkeli kirjassa, jota mä olen toimittamassa. Se ilmestyy vuonna 2022. Näiden lisäksi toivotaan että käännösympäristössä, joka ei siis ole mikään yksittäinen työkalu, olisi sosiaalisen median komponentti, koska kääntäjät tunnetusti ovat kautta aikojen tehneet yhteistyötä ja auttaneen kollegaa, jos kollega etsii jotakin tiettyä käännösratkaisua tai hänellä on jokin vaikea nimenomaan kulttuuriviittaus tai intertekstuaalinen viittaus, niin tämän tyyppiseen nimenomaan kaunokirjallisuuden kääntäjät haluavat apua. Mutta he eivät myöskään halua, että kone tulee koko ajan keskeyttämään käännösprosessin, koska silloin he eivät koe flow-tilaa. Eli tämän pitäisi olla nimenomaan tällainen hienotunteinen käännöstyökalu, joka pysyttelee taustalla ja on siinä juuri saatavilla, kun kääntäjä tarvitsee apua.

Maarit: Myös siitä, mistä jo tuli tuossa aikaisemmin sanottuakin, että se saattaa olla eri ihmisille ja eri tilanteissa eri asia, mikä on se ihanteellinen kone, joten tää on itseasiassa joissain näissä selvityksissä, missä on kysytty esimerkiksi, mitä mieltä olette jostain tietyn työkalun käyttöliittymästä ja ominaisuuksista tai sellaisista yleisistä toivotuista aisoista, niin hyvin toistuva kommentti on se, että kääntäjät toivovat, että se olisi mahdollisimman hyvin säädettävissä, että he pystyvät itse päättämään, että nyt en halua nähdä noita ehdotuksia ollenkaan, että tilanne olisi heidän halussaan ja se, mitä kaikkea sieltä tulee.

Kristiina: Ja sitten tähänastinen tutkimus nimenomaan… On selvitetty kaunokirjallisuuden kääntäjien asenteita käännösteknologiaa kohtaan, niin kaikkein negatiivisimmat liittyvät siihen ajatukseen, että käännösteknologia vie kääntäjältä hänen itsemääräämisoikeutensa, että tällaiset työkalut tulevat pakollisesti käyttöön ja ne sanellaan jollakin tavoin yläpuolelta. Tämä on se pahin skenaario tänhetkisten tutkittujen kaunokirjallisuuden kääntäjien mielestä. Toivottavasti näiden työkalujen, jotka nyt ovat yleistymässä, työkalujen suunnittelussa sitten otetaan huomioon kaunokirjallisuuden kääntäjien mielipiteet. Se olisi erittäin tärkeää.

Maarit: Jos mä vähän vielä jatkan tohon sen verran, että näitä tietynlaisia ongelmakohtia on jo asiatekstikääntämisen ja myös av-kääntämisen puolella havaittu. Juuri tähän että ne tulevat jostakin ulkopuolelta pakotettuina ja sitten saatetaan vielä tehdä niitä asioita näin, että todetaan, että tässä on nyt teille tällainen työkalu ja olemme päättäneet, että tämä tulee nopeuttamaan teidän työtänne nyt niin paljon, että palkkioita lasketaan automaattisesti kolmekymmentä prosenttia, tai jotain vastaavaa. Ja tää on aina sillä lailla, että minäkin tutkijana olen sitä mieltä, että mä haluaisin nähdä ne tutkimukset, joihin nämä kolmenkymmenen prosentin vähennykset perustuvat, sillä mä en itse ole sellaisia nähnyt. Siellä on taustalla tällaisia oletuksia, että nyt kun teillä on tällainen työkalu, niin kaikki on automaattisesti nopeampaa ja helpompaa, mutta se ei välttämättä toimi sitten kuitenkaan niin. On tosiaan tilanteita, joissa se saattaa jopa hidastaa työntekoa.

Juha: Jos vetää tätä jollakin tavalla yhteen, voisi ajatella, että sellainen kone, joka olisi tullut käyttöön ei-pakotettuna, että ostava taho, kustantaja tai joku vastaava tai muu yhteisö ei ole sitä määrännyt, se olisi sopiva, eli personoisi itsensä sen käyttäjän mukaan, oppisi, että nyt tuolle kannattaa tyrkyttää jotakin tai että aha, nyt toi ei halua missään tapauksessa, kun se kerran käytti jotakin tiettyä ilmaisua, se jättää sen pois, semmoisesta tekstistä ja semmoisesta koneesta voisi olla käsittelyapua myös kääntäjälle. Mutta missään tapauksessa ihmiskääntämistä kone ei pysty korvaamaan, koska kone ei siinä mielessä, kuten me tällä hetkellä tajuamme, pysty oppimaan eikä havainnoimaan eikä ymmärtämään kulttuurisia, kielellisiä ja muita ympäristöjä.

Maarit: Joo, tämähän on… Esimerkiksi asiatekstinkääntämisen puolella meille tulee näitä kysymyksiä esimerkiksi vastuusta. Jos konekäännöksessä on virhe, jonka perusteella joku toimii täysin väärin, aiheuttaa jonkinlaista vahinkoa. Esimerkiksi ihan käytännön tilannehan on se, että jos vaikka konekäännetyssä käyttöohjeessa on virhe ja sitä ei käyttäjä tajua, hän saattaa toimia täysin väärällä tavalla ja siitä saattaa aiheutua loukkaantuminen tai jonkinlaisia materiaalisia vahinkoja, niin kuka on vastuussa siitä, että siinä konekäännöksessä on virhe? Toki ihminenkin saattaa tehdä virheitä, mutta yleensä meillä on näihin kuitenkin, että on tietynlaiset prosessit, millä pyritään tarkistamaan niitä virheitä. Esimerkiksi ihmisen käännökset tällaisissa tilanteissa hyvin usein kulkee useamman ihmisen käsien läpi niin, että pyritään siihen, että joku tässä prosessissa huomaa tällaisen virheen. Jos me luotetaan ihan pelkästään konekäännökseen, niin silloinhan se oletus on oikeastaan, että kone on parempi kuin ihminen, että se tuottaisi sellaista jälkeä, jossa ei ole yhden ainutta virhettä. Reaalimaailman tilannehan ei ole tämä.

Maarit jatkaa: Ja toisaalta sitten, kun me tullaan tänne kaunokirjallisuuden kääntämisen puolelle, niin mitä me, mitä lukija hakee kaunokirjallisuudesta? Ei hän välttämättä hae siitä sellaista, että mä suurin piirtein ymmärrän, mitä tässä tämä sisältö sanoo, vaan hän ehkä haluaa siitä jotakin muuta arvoa irti. Vai mitä sanois Kristiina?

Kristiina: Kyllä nimenomaan. Tämä on ehkä yllättävästi asia, jota ensimmäiset tutkijat, jotka pyrkivät hyödyntämään konekääntämistä kaunokirjallisuuden kääntämisessä, eivät tulleet ajatelleeksi, mitä lukija tekstiltä hakee ja miten tavattoman tärkeä tekstin muoto on. Sen takia he saattoivat käyttää konekääntämisen laatukriteereitä arvioidessaan omia aikaansaannoksiaan ja tulla siihen tulokseen, että tämä teksti on lähellä ihmiskääntämistä, eli tämä on laadukas konekäännös tästä kaunokirjallisesta tekstistä. Usein he saattoivat nimenomaan kääntää vain ihan lyhyitä tekstinpätkiä, ja sen takia heille syntyi tämä harhaluulo, että kone itseasiassa kääntää jo vallan mainiosti kaunokirjallisia tekstejä. Mutta nyt sitten on tullut realismin aika ja konekääntämisen tutkijat ovat perehtyneet esimerkiksi kaunokirjallisuuden kääntämiseen ja käännöstieteeseen ja ovat sen takia todenneet, että tarvitaan muunlaisia arviointikriteerejä [naurahdus], kun tarkastellaan konekäännöksen aikaansaannoksia.

Juha: Kääntäjät, älkää siis pelätkö leipänne puolesta. Kone ei teitä päihitä, ei ainakaan, sanotaan nyt muutamaan sukupolveen. Kiitoksia käännösviestinnän professori Kristiina Taivalkoski-Shilov Turun yliopiston kieli- ja käännöstieteiden laitokselta ja käännöstieteen professori Maarit Koponen Itä-Suomen yliopistosta. Palataan seuraavassa podcastissa siihen filosofiseen kysymykseen, mikä on hyvä käännös.