Vasemmalla näkyy yhdellä jatkuvalla viivalla piirretty ihmisen pään sivuprofiilin ääriviiva. Oikealla on teksti 'Lingsoft talks AI', jossa 'AI' on suurilla kirjaimilla ja lihavoituna.

Lingsoft on hyödyntänyt tekoälyä toiminnassaan jo 40 vuoden ajan. Lingsoft talks AI on artikkelisarja, jossa omat asiantuntijamme antavat näkemyksensä tekoälystä sekä sen käytöstä ja mahdollisuuksista kielialalla.

“Ihmisellä on edelleen vastuu sisällöstä”

Tekoäly tuo kielialalle tuo poikkeuksellista potentiaalia – mutta myös roppakaupalla kysymyksiä. Lingsoftilla Solutions Architectina työskentelevällä Tiina Lindh-Knuutilalla on sekä käytännön työn että tieteellisen tutkimuksen tuoma näkemys tekoälyn hyödyntämiseen kieliteknologiassa.

Lindh-Knuutila on tekniikan tohtori, joka yhdistää arjessaan päivätyön Lingsoftilla sekä tutkimustyön. Osa työviikosta vierähtää akateemisen maailman puolella, osana työryhmää Aalto-yliopistossa.

– Teemme laskennallisia malleja sananmuodostuksesta, ja työryhmämme tarkastelee merkityksen esittämistä laskennallisesti, vektoreiden avulla. Mutta ei mennä siihen liian syvällisesti, Lindh-Knuutila naurahtaa.

Apua suurten tekstimäärien käsittelyyn

Lindh-Knuutilan mukaan on hyvä ymmärtää, että kielialalla suuri osa työstä on “raskasta louhimista”, jossa käsitellään laajoja tekstimassoja, jota sitten käännetään ja tiivistetään. Tällaiseen työhön tekoälyllä on hänen mukaansa erityinen tilaus.

– Kielimateriaalia on valtava määrä, ja sen myötä syntyy jatkuva tarve poimia oleellinen ja mahdollistaa kommunikointi tarkoituksenmukaisesti ja nopeasti. Puheentunnistus, konekäännökset, tiivistäminen ja tarkistaminen sekä automaattinen laadunvarmistus ovat niitä isoja juttuja, joihin tekoälyä tarvitaan.

“Human in the loop”

Lindh-Knuutilan mukaan kieliteknologiat ovat kehittyneet huomattavasti sitten sanasta sanaan -kääntämisen aikojen. Neuroverkkopohjaisen konekäännöksen tulokset  alkoivat olla jo lähempänä luonnollista kieltä verrattuna tilastolliseen konekäännökseen. Tuoreimmat generatiiviset kielimallit puolestaan pystyvät luomaan hyvinkin luonnolliselta vaikuttavaa kieltä.

Generatiivisilla kielimalleilla  kyetään luomaan esimerkiksi urheilu-uutisiin otteluraportteja tilastotiedoista, tai vaikkapa tiivistelmiä artikkeleista. Lindh-Knuutila uskoo silti, että laadulliset aspektit ratkaisevat jatkossakin, ja että ihmistä ja ihmisen tuottamaa kieltä tarvitaan tulevaisuudessakin.

– En näe, että kone korvaisi ihmistä esimerkiksi kirjallisuudessa. Mutta toisaalta, kaikkihan riippuu meistä ihmisistä – mihin asti me olemme valmiita sallimaan tekoälyn käytön?

Vaikka tekoäly voi automatisoida rutiininomaisia tehtäviä, Lindh-Knuutila korostaa, että ihminen on edelleen välttämätön osa prosessia.

– Meillä Lingsoftilla on käytössä ‘human in the loop’ -malli, jossa ihminen on vastuussa siitä, että tekstissä on kaikki kunnossa, ja että tekoälyn tuottama sisältö on laadukasta ja kaikin puolin sisällöllisesti järkevää.

Tietoturva on ykkösprioriteetti

Tekoälyn käytön yhteydessä tietoturva on avainasemassa. Lingsoft käyttää ainoastaan luotettaviksi todennettuja ja varmennettuja palvelimia, eikä puheentunnistuksessa tai konekäännöksessä käytetä kolmansien osapuolten palveluita.

– Lienee päivänselvää, että tietoturva on meille äärimmäisen tärkeää, ja varmistamme, ettei asiakkaiden data vuoda ulkopuolisten käsiin. Esimerkiksi puheentunnistuksessa kaikki data säilyy luottamuksellisena, eivätkä puhe tai tunnistustulokset tallennu järjestelmiin, mikä on tärkeä osa tietosuojaa.

Tulevaisuuden suhteen Lindh-Knuutila uskoo, että nopea kehitys jatkuu, mutta samalla hän myös toivoo, että ymmärrys datan itsehallinnasta ja itsenäisestä kieliteknologian kehittämisestä vahvistuu.

– Uskon, että tulevaisuudessa pystymme entistä paremmin hyödyntämään omaa dataamme ja välttämään liiallista riippuvuutta suurista teknologiayrityksistä. Kaikkea ei kannata ulkoistaa, ja pienempien toimijoiden vahvuutena on erikoistuminen sekä modulaariset mallit. Ja tässäkin ihmisen ja koneen yhteistyö on tärkeää.

Categories:

Lisää uutisia Lingsoftilta