Konekääntäminen

Konekääntämisestä on eniten apua lähikielten välillä. Keski-Euroopassa se on jo monilla kääntäjillä osa käännösprosessia. Eri tutkimusten mukaan 5-20 % geneeristen konekäännösohjelmien tuottamista käännöksistä on käyttökelpoisia sellaisinaan, ja 40 % pienellä muokkauksella. Jos ohjelmaa 'kouluttaa' tietyn alan aineistoilla (aiemmilla käännöksillä ja terminologialla) prosenttiosuus kasvaa entisestään. Valitettavasti tämä pätee vain muihin kuin suomen kielen kääntämiseen. Suomen sisältävissä kielipareissa vastineen saaminen konekäännösohjelmasta on erittäin harvinaista (jos nyt aivan lyhyitä muutaman sanan lauseita ei oteta huomioon).

Ensimmäisessä vaiheessa konekääntäminen perustui lähde- ja kohdekielen kieliopilliseen analysoimiseen, toisessa vaiheessa ratkaisua etsittiin puhtaasti tilastollisista menetelmistä, jotka edellyttivät suuria lähde- ja kohdekielisten segmenttien massoja, ja tällä hetkellä tutkitaan neuraaliverkkoja, joilla pyritään sisällyttämään konteksti käännösehdotuksiin.

Konekääntämisestä on tullut mantra, jota toistetaan ja johon uskotaan, mutta käytännössä sillä on vielä hyvin pitkä matka kuljettavanaan. Hyväkin konekäännös edellyttää viimeistelyä, joka periaatteessa vaatii saman ajatustyön kuin 'inhimillinen' kääntäminen. Tekstin viimeistelijän onkin aina oltava lähde- ja kohdekielen perusteellisesti hallitseva henkilö, sillä konekäännösohjelmat saattavat tuottaa silminnähden moitteettomia lauseita, jotka ovat kuitenkin merkitykseltään täysin päinvastaisia.

Syitä siihen, että suomen kielelle ei toistaiseksi ole pystytty kehittämään konekäännösohjelmia, joista olisi ammattikääntäjälle todellista hyötyä, löytyy niin suomen kielen poikkeuksellisesta syntaktisesta rakenteesta kuin pienen kielialueen tekstimassan vähäisyydestä ja kehitysresurssien pienuudesta. Tarjolla olevat konekäännösohjelmat antavat kuitenkin jonkinlaisen käsityksen vieraskielisen tekstin sisällöstä. Ammattikääntäjät eivät tosin voi käyttää tällaista raakakäännöstä edes kääntämisen pohjana, sillä huonon raakakäännöksen ja lähdekielen vertailuun ja raakakäännöksen korjaamiseen menee enemmän aikaa kuin kääntämiseen suoraan lähdekielestä. Konekäännösohjelmat joutuvat myös kilpailemaan aina vain parempia käännösmuistiohjelmia vastaan.

Aiemmin omia konekäännösjärjestelmiä ovat voineet rakentaa vain suuret yritykset, joilla on ollut varaa panostaa kehitystyöhön. Precision Translation Tools on nyt kuitenkin julkaissut Slate Desktop -työkalun, jonka avulla kuka tahansa voi ottaa edullisesti käyttöön Moses-järjestelmään perustuvan konekäännösohjelman ja kouluttaa sitä omilla käännöksillään. Testasimme tätä työkalua siirtämällä siihen valtavia käännösmuisteja (vuosikymmenien kuluessa keräämiämme omia muistejamme, EU-muisteja ja Microsoft-muisteja), mutta valitettavasti täytyy sanoa, että suomen kielen kääntämiseen tästäkään työkalusta ei ollut mitään hyötyä. Hyödylliset käännösvastineet jäivät hyvin vähäisiksi, ja itse asiassa työkalun edellyttämä CAT-laajennus käännösmuistiohjelmaamme vain hidasti käännösprosessia.

Alla on linkkejä joihinkin tarjolla oleviin geneerisiin konekäännöspalveluihin:

Lisätietoja eri kieliyhdistelmille tarjolla olevista ratkaisuista löydät täältä (katso lopussa olevaa kielipareittain järjestettyä hakemistoa).