Kääntäminen ja tulkkaus ovat nopeasti muuttuvassa maailmassa mielenkiintoinen ala, jolla tapahtuu jatkuvasti uutta. Siksi kirjoitamme blogissamme alamme uusimmista kehityksistä ja mielenkiintoisista uutisista - tietysti monikielisesti!

42 pianoa

Julkaistu: May 12, 2017

Lupasin viimeksi tulkkausalan tulevaisuuden pohdintoja, ja tämä onkin kova pähkinä purtavaksi, sillä onhan kyse tavallisen tulkin omasta leipäpuusta, lisäksi itse asiassa on vielä paljon keinoälyn kehitykseen liittyviä epävarmuustekijöitä.

Simultaanitulkkauksen ongelmana ovat puhutun kielen haasteet, joita on monenlaisia. Laitetaan tähän niistä muutamia. Ihmisten kielen ääntäminen on hyvin erilaista, jotkut puhuvat sitä kyllä äidinkielenään, mutta ehkä whiskyn tuoksuisella skottiaksentilla Sean Conneryn tapaan. Tai sitten kyseessä ei olekaan henkilön äidinkieli. Kyseessä saattaa olla aasialainen, joka hapuilee englannin tavuja, tai afrikkalaisen kurkku pulputtaa ranskan äänteitä hienoisella aksentilla. Koska nämä aksentit ovat meille vieraita, myös niiden ymmärtäminen tuottaa meille ongelmia. Tähän haasteeseen törmäämme ammatissamme päivittäin.

Tai otetaan sanojen monimerkityksellisyys. Samalle sanalle saattaa olla monia eri käännöksiä, mitä niistä puhuja saattaa juuri nyt tarkoittaa? Italian hyvin yleinen sana ”piano” voi suomeksi tarkoittaa eri asiayhteyksissä ainakin seuraavia: tasainen, selkeä, lauluton, hitaasti, varovainen, hiljempaa, tasanko, pinta, kerros, taso, ala, aikomus ja tietysti yhtenä mahdollisuutena monista muista myös se piano, jolla voi soittaa. Vaatii aimo annoksen tilanneälyä, jotta osaa valita niistä oikean asiayhteyteen sopivan käännöksen. Tässä ongelmana saattaisi koneälylle olla myös pienten kielten, kuten suomen, sähköisessä muodossa olevan kielimateriaalin suhteellisen vähäinen saatavuus.

Oikean painotuksen löytäminen on koneelle ongelmallista, sillä jos puheessa ei ole painotuksia, sen ymmärtäminen on vaikeaa ja sen lisäksi kuulija on vaarassa nukahtaa. Jotta osaa painottaa puheessa oikeita asioita, pitää myös pystyä ymmärtämään suusta suollettujen sanojen merkitys. Vitsiä kerrottaessa äänen väri on aivan toinen kuin surunvalitteluja välitettäessä. Ja miten kone selviäisi ironian tulkkaamisesta?

Siinä oli muutamia konetulkkauksen ongelmia. Mitä mahdollisia ratkaisuja niihin saataisi löytyä tulevaisuudessa?

Ensin pieni katsaus näin yleisellä tasolla, millainen tietokone tai tekoäly pystyisi tehtävään. Tekoäly voidaan jakaa kahteen eri tasoon, heikkoon ja vahvaan tekoälyyn. Heikkoa tekoälyä ovat ohjelmat, jotka tukevat ihmisen toimintaa ongelmien ratkaisussa, mutta niissä ei saavuteta tietoisuuden tasoa. Tästä ovat esimerkkeinä tekstin- ja kuvantunnistus, sekä Deep Blue -shakkitietokone. Jotta tekoäly pystyisi tulkkaamaan ihmisen tuottamaa puhetta, ajoittain epäloogistakin, sen pitää saavuttaa seuraava taso. Silloin puhutaan vahvasta tekoälystä, eli kone saavuttaa ihmisen älykkyyden tason tai jopa ylittää sen. Sen lisäksi se tekee ihmiselle tyypillisiä asioita, se osaa soveltaa laajoja taustatietoja ja sillä on jonkintasoinen tietoisuus. Juuri tämä viimeinen vaatimus on mielestäni ratkaiseva, sillä pitäähän tulkkaavan keinoälyn pystyä ymmärtämään juuri sanomansa, muuten sen tulkkaus on vain tyhjää sanahelinää!

Ennen kuin keinoäly alkaa tulkata, on kuitenkin vielä monta mutkaa matkassa. Koneen tietokantojen pitäisi kattaa valtavia määriä puhuttuja puheita, joista koneen olisi mahdollista oppia erilaisia lausuttuja sanoja ja mieluiten vielä tunnetun galaksin kaikilla mahdollisilla aksenteilla lausuttuina. Niitä kone käyttäisi ensin harjoitteluun, mutta silti siltä puuttuisi vielä palaute harjoittelun tuloksista. Muistathan viime blogin AlphaGo-tietokoneen, joka harjoitteli pelaamalla itseään vastaan go-peliä. Tässä metodissa on yksinkertaista mitata tuloksen laatu, se on tietenkin pelin voitto. Joten se saavutti tason, jota voidaan pitää jo merkittävänä, koska ihmiset alkoivat matkia sen ratkaisuja omissa pelistrategioissaan. Se voisi tarkoittaa sitä, että se on saavuttanut pelissä ihmisen älykkyyden tason, jopa ehkä ylittänyt sen, mutta onko sillä tietoisuus? Miten tulevaisuuden BabelFishGo-keinoälyohjelma saataisiin treenatuksi haastamaan ihminen simultaanitulkkauksessa? Mikä palautemekanismi olisi tulkkausta treenaavalla tietokoneella? Pitäisikö sille järjestää yleisö, joka olisi kiinni tulkkausta kuunnellessaan kiinni antureissa ja yleisön reaktioita koneen tuottamaan tulkkaukseen mitattaisiin reaaliajassa? Näin yleisön erilaisista reaktioista selvitettäisiin tulkkauksen osuvuus, menikö naulan kantaan vai osuiko sormeen? Vai riittäisikö tekoälylle, että etsitään arkistoista mahdollisimman suuri määrä eri kieliparien tulkkauksia ja annetaan koneelle mahdollisuus matkia oikeiden tulkkien suorituksia?

Mikä on siis ratkaisu keinoälyn tietoisuuteen, simultaanitulkkaukseen, Elimäen tarkoitukseen ja kaikkeen muuhun sellaiseen?

Rakkaat lukijat, oikea vastaus on 42! Nyt kaikki maailman googlet ja naamakirjat saavat alkaa pohtia sitä oikeaa kysymystä, millä saataisiin luoduksi tulevaisuuden keinoälylle oikea tietoisuus. Ilman tietoisuutta ei kuulijalle heru tasokasta tulkkausta. Ja nyt tavallinen tulkki lähtee avartamaan omaa tietoisuuttaan ansaitulle lomalle! Tapaamme taas avarien ja syvien mietteiden äärellä tulevilla tulkkauskentillä.

Esa Hartonen