fbpx
0
Jutut

Kääntäjien merkitys digitaalisella aikakaudella

By 29.1.20166 marraskuun, 20192 Comments

Tulevaisuuden kääntäjä ei ole tekoäly, vaan miljoonien ihmiskääntäjien työ yhdistettynä tekoälyyn.
Tilastolliseksi konekääntämiseksi kutsutaan teknologiaa, jossa tekoäly tekee arvauksia valtavaan kaksi- tai useampikieliseen rinnakkaiseen aineistoon perustuen. Tekoäly arvaa tekstille käännöksen vertaamalla tilastollisesti samansisältöisiä tekstejä.
Muun muassa Google-kääntäjä perustuu tilastolliseen konekääntämiseen ja se osaa kääntää uudet ajatukset vasta, kun sen tietokannassa on riittävä määrä erikielisiä vastineita.
Yksinkertaisia asioita koskevien tai rakenteellisesti yksinkertaisten tekstien konesuomennokset ovat useimmiten käyttökelpoisia, kun lukija tietää jo etukäteen, mistä niissä on suurin piirtein kyse. Kömpelöitä ne toki usein ovat.
Uusia ajatuksia koskevan käännöksen voi kuitenkin tehdä ainoastaan asiantunteva ihminen. Konekäääntäjä pystyy tuottamaan tolkullisia uusia ajatuksia koskevia käännöksiä vasta, kun erikielisiä tekstivastineita on riittävästi konekääntäjän tietokannassa.
Tilastollisen konekääntäjän taustalla oleva tekoäly ei millään tavalla ”ymmärrä” käännettävän tekstin merkitystä. Se ei myöskään hyödynnä minkäänlaista kielioppia. Kielioppiin tai merkitykseen perustuvia konekääntäjiä on yritetty rakentaa pitkään, mutta ainakaan tällä hetkellä ne eivät pysty kilpailemaan tilastollisen konekääntämisen kanssa.
Seuraavassa videossa muun muassa termin virtuaalitodellisuus esittäjänä tunnettu tietojenkäsittelytieteilijä ja teknologiakriitikko Jaron Lanier avaa noin kohdasta 9:20 eteenpäin konekääntäjien globaalista kulttuurisesta merkityksestä.

Yhteenvetona:
Google-kääntäjän taustalla ei ole ”puhdas” tekoäly, vaan se vaatii miljoonia ihmisten tekemiä käännöksiä päivittäin.
Jos tietokantoja ei pidetä yllä, käännökset eivät vastaa alkutekstiä. Kuten Lanier kertoo, esimerkiksi sanaa selfie on melko tuore sana. Siihen liittyviä käännöksiä ei siis voi tehdä tietokannoilla, jotka ovat yli kymmenen vuotta vanhoja.
Toisin sanoen ennen kuin uusia ajatuksia koskevista kirjoituksista on ihmisten tekemiä asiantuntevia käännöksiä konekääntäjän tietokannassa, niistä ei voi lukea napin painalluksella suomeksi.
Nähtävässä tulevaisuudessa konekäännökset tehdään todennäköisesti jonkinlaisella hybridimallilla, joka tilastollisten menetelmien lisäksi prosessoi kielen syvärakennetta. Nämäkin mallit vaativat toimiakseen valtavia ajantasaisia tekstiaineistoja.
Ei siis kannata odottaa, että konekääntäjät tekisivät inhimillisen käännöstyön lähiaikona tarpeettomaksi. Lanier kutsuu moista ajatusta tekoälyfantasiaksi.
Kääntäjiä ja käännöksiä tarvitaan edelleen, jos suomen kieli halutaan pitää elävänä.
Konekääntäjät ovat hieno ja voimaannuttava teknologia. Kuten Lanier videossa sanoo, ne tekevät maailmasta tehokkaamman ja tasaisemman. Käännösteknologia myös auttaa pieniä kieliä säilymään hengissä.*
Muistetaan kuitenkin, että uusia ajatuksia suomen kieleen tuovien kääntäjien työ on edelleen olennaista, vaikka se onkin verhottu teknologian taakse.

*Sivuhuomautus
Käännösteknologian mahdollisuuksista ja haasteista kiinnostuneen kannattaa tutustua Helsingin yliopiston professori Kimmo Koskeniemen työryhmineen vuonna 2012 julkaisemassa Suomen kieli digitaalisella aikakaudella.
Suomen kielellä on erityispiirteitä – muun muassa erittäin rikas taivutusjärjestelmä – joiden takia muille kielille rakennetut kieliteknologiat eivät sovi suoraan suomen kielen kääntämiseen. Teknologiat eivät rakenna itse itseään, vaan niiden tekemiseen pitäisi satsata.
Suomenkielisen käännösteknologian kehittämisen ulkoistaminen amerikkalaiselle mainosmyyjälle ei vaikuta pitkällä aikavälillä kovin kestävältä strategialta.
Kiitos Jesse Soiniselle linkistä Lanier-videoon.
Kuvalähde: Tom Stohlman, Flickr, CC-BY.

Juha Pietiläinen

Author Juha Pietiläinen

More posts by Juha Pietiläinen

Join the discussion 2 Comments

  • Heikki sanoo:

    Jännään suuntaan mennään maailmassa. Googlekin osaa kääntää suomea jo kohtalaisen hyvin englanniksi, mutta toisin päin se on edelleen kauheaa. Ehkä pari vuotta riittää ja tekstiä ei enää erota käännetyksi!

    • Juha Pietiläinen sanoo:

      Joo, vielä ei ole kääntäminen suomen kielelle Googlella hallussa. Kehitystä rajoittaa ennen kaikkea saatavilla olevien suomenkielisten vastintekstien lukumäärä ja tyyppi. Ne tehdään käsityönä muiden kustannuksella mm. julkisissa laitoksissa ja Google nappaa ne sitten käyttöönsä ”fair use” -pykälien perusteella tms.

Leave a Reply