Tiedätkö, mikä on niin sanottu Turingin testi? Sen esitti 1950-luvulla kuuluisa englantilainen matemaatikko ja tietojenkäsittelytieteen isä Alan Turing (1912–1954) pohtiessaan, miten voisi päätellä, onko tietokoneohjelma älykäs. Turingin testin asetelmassa kuulustelija kysyy kysymyksiä näppäimistön avulla kirjoittamalla joko todelliselta ihmiseltä tai testattavana olevalta tietokoneohjelmalta siten, että kuulustelija ei tiedä, kumpi niistä hänen kysymyksiinsä vastaa. Tietokoneohjelma läpäisee testin, mikäli kuulustelija ei pysty varmuudella erottamaan, vastaako hänen kysymyksiinsä kone vai ihminen.
Turingin testiä pidettiin pitkään hyvin haastavana tietokoneille, mutta viimeaikaiset tekoälyä hyödyntävät ChatGPT:n kaltaiset chatbottiohjelmat näyttävät ainakin jossain määrin pääsevän lähelle tuota Turingin testin vaatimaa älykkyyden tunnetta. Tämä on johtanut suoranaiseen tekoälybuumiin, ja tekoälystä puhutaan julkisuudessa paljon. Päättelystä koneoppimiseen Mitä tekoäly oikein on? Hieman yksinkertaistaen voi sanoa, että tekoäly on tietokoneohjelma, joka ihmisen sille syöttämien tietojen perusteella kykenee tuottamaan sille asetettuihin kysymyksiin vastauksia, jotka tuntuvat meistä ihmisistä älykkäiltä. Käsite tekoäly (artificial intelligence, Künstliche Intelligenz) on peräisin jo 1950-luvulta. Alkuvuosien tekoälytutkimus perustui pääasiassa loogisen päättelyyn, ja sen avulla pystyttiin ratkomaan erilaisia päättelytaitoa vaativia tehtäviä kuten tammen tai šakin peluun automatisointia.
Useimmat nykyiset tekoälyjärjestelmät perustuvat kuitenkin ns. koneoppimiselle. Koneoppimisessa koulutetaan tekoälymallia, eräänlaista matemaattista tilastollista mallia, syöttämällä sille suuri määrä koulutusdataa eli esimerkkitapauksia, joiden perusteella malli omaksuu sille syötettyjen tietojen tilastolliset ominaisuudet mahdollisimman hyvin.
Tekoäly ratkoo tehtäviä
Kun malli on koulutettu, sitä voi käyttää monenlaisten tehtävien ratkaisemiseen. Erilaisia malleja voi käyttää esimerkiksi puhutun puheen muuttamiseen tekstiksi, tekstin kääntämiseen kielestä toiseen, tulkitsemaan käsin kirjoitettua tekstiä, tunnistamaan kohteita valokuvissa, tunnistamaan syöpäsoluja tietokonetomografiakuvista, luokittelemaan kemiallisia näytteitä jne.
Viimeisten kolmen vuoden aikana julkisuudessa eniten huomiota ovat kuitenkin herättäneet ns. generatiiviset mallit. Tekoälymallin voi nimittäin virittää siten, että se pystyy itse tuottamaan tekstiä, kuvia, ääntä tai videoita. Yksinkertaisin esimerkki tällaisesta on ennakoiva tekstinsyöttö, johon varmaan monet ovat törmänneet syöttäessään hakusanaa verkkohakukoneen hakukenttään. Kun siihen syöttää yhden tai muutaman sanan, hakukone arvaa, mitkä seuraavat sanat voisivat olla, jotka käyttäjä haluaa syöttää. Tässä hakukone hyödyntää tekoälymallia, joka laskee, mikä sana on todennäköisin sana, joka yleensä tulee käyttäjän näppäilemien sanojen jälkeen. Näin hakukone saa mallilta sanaehdotuksia, jotka se näyttää käyttäjälleen.
Chatbotit suoltavat tekstiä
Tekoälychatbotit, kuten ChatGPT noudattavat pitkälti samaa periaatetta. Käyttäjä syöttää tällaiselle botille lyhyen tekstipyynnön, johon botti vastaa tulostamalla järkevän kuuloista tekstiä. Myös botin vastaus generoidaan samalla tavala: mallille syötetään käyttäjän pyynnön teksti ja malli laskee, mikä on todennäköisin sana, joka voisi seurata käyttäjän syöttämien sanojen jälkeen vastauksena. Tämä sana näytetään käyttäjälle ja mallilta kysytään heti uudestaan, mikä olisi seuraava sopiva sana vastauksessa. Tätä toistamalla tekoälymalli generoi sana sanalta vastauksen käyttäjän kyselyyn. Malli ei siis tee mitään muuta kuin sana sanalta laskee, mikä olisi todennäköisin sana, joka sopii edeltävän tekstin jatkeeksi. Hämmästyttävää tässä on se, että tuloksena on tekstiä, joka usein jopa antaa jossain määrin järkevän vastauksen käyttäjän kysymykseen!
Älykkyyden illuusio syntyy datamassoista
Miten tekoälymallit sitten pystyvät vastaamaan järkevän tuntuisesti niin moniin hyvin erilaisiin kysymyksiin? Vastaus piilee datassa, jolla malleja on koulutettu. Ns. laajoja kielimalleja, joihin chatbotit perustuvat, koulutetaan valtavan suurilla datamassoilla. Malleja kouluttavat yritykset haalivat lähestulkoon kaiken tekstin, johon he internetin välityksellä pääsevät käsiksi ja syöttävät sen malliinsa. Näillä malleilla on hämmästyttävän suuri kapasiteetti omaksua koulutusdatassa olevaa informaatiota. Sen takia mallit tuntuvat joiltakin osin tietävän lähes kaiken kaikesta. Totuus kuitenkin on, että tekoälymalli voi tietää vain korkeintaan sen, mitä sen koulutusdatassa on ollut. Malli ei aidosti pysty luomaan mitään uutta, se ainoastaan yhdistelee tietoja, joita sen koulutusdatassa on esiintynyt.
Tarvittavan koulutusdatan hamstraukseen liittyy kuitenkin tekijänoikeuksien kannalta ongelmia: missä määrin tekstien ja kuvien luojilla, joiden luo muksia tekoäly-yhtiöt hyödyntävät malliensa kouluttamiseen, on oikeus korvaukseen luovan työnsä tulosten hyödyntämisestä? Tämä on kysymys, johon lainsäätäjät ovat vasta hiljalleen heräämässä ja joka pitää lähivuosina jotenkin ratkaista.
Tekoäly on energiasyöppö
Jatkuvasti kehittyneempien kielimallien kouluttaminen ja käyttö vaatii aina vain enemmän dataa, laskentatehoa ja sähköenergiaa. Se on myös äärimmäisen kallista. Suurten mallien kouluttaminen voi pahimmillaan maksaa satoja miljoonia euroja. Hyvä kysymys on, missä määrin tällainen energiankulutus ja sen mukanaan tuomat ilmastopäästöt ovat eettisesti hyväksyttäviä, varsinkin jos tekoälymalleja käytetään hupitarkoituksiin, joita ilmankin voisimme elää.
Ilmastopäästöjä voi jokainen omalta osaltaan vähentää minimoimalla tekoälychatbottien käyttöä. Yksinkertainen hakukonehaku kuluttaa vain murto-osan siitä energiasta, jonka chatbotille asetettu kysymys vaatii, joten yksinkertaisia kysymyksiä ei aina tarvitse tekoälyltä kysyä.
Tekoälyyn ei voi aina luottaa
Vaikka tekoälychatbotin antamat vastaukset ovat usein hyvin vakuuttavan kuuloisia, on tärkeää tiedostaa, että tekoälymalli ei nimestään huolimatta oikeasti ymmärrä yhtään mitään kyselystä, joka sille annetaan. Se vain orjallisesti generoi sana sanalta tekstiä, joka sopii mahdollisimman hyvin kyselyn jatkeeksi. Tässä onkin sudenkuoppa, joka tällaisiin generatiivisiin malleihin liittyy. Kun ihmiseltä kysyy jotain, jota hän ei tiedä, hän yleensä vastaa ’en tiedä’. Tekoälymallit eivät näin osaa tehdä. Mikäli mallilta kysytään jotain, johon se ei koulutusaineistonsa perusteella osaa vastata, malli ei sano ’en tiedä’, vaan se vastaa jotain sattumanvaraista, joka ehkä voisi kuulostaa tässä yhteydessä järkevältä. Kun malli antaa tällaisia vastauksia, sanotaan, että tekoälymalli hallusinoi eli keksii aivan omiaan. Tekoälymallien vastauksiin tulee siksi aina suhtautua varauksella ja tarkistaa viime kädessä itse, ovatko mallin antamat vastaukset tosia vai eivät.
Tekoälybuumin varjopuolia
Kuten moniin muihinkin teknisiin innovaatioihin, myös tekoälyyn liittyy haittapuolia. Parhaat tekoälymallit kykenevät esimerkiksi tuottamaan hämäävän aidon näköisiä mutta täysin fiktiivisiä valokuvia ja videoita, joissa esiintyy julkisuuden henkilöitä tai poliitikkoja väärennetyissä tilanteissa, tai he vaikuttavat sanovan jotain, mitä eivät tosiasiassa ole sanoneet. Valokuvien ja videoiden kanssa pitää siis olla entistäkin kriittisempi, ovatko ne todella aitoja ja tulevatko ne luotettavasta lähteestä.
Kaikkein suurin tekoälyyn liittyvä riski liittyy kuitenkin ehkä meihin itseemme. Alammeko luottaa sokeasti tekoälyyn ja annammeko sen ratkaista hankalat ja työläät ongelmat puolestamme ja lakkaammeko lopulta kokonaan käyttämästä omaa aitoa älyämme?
Markus Miettinen
Tekoäly kuuluu kaikille
Suomen evankelis-luterilaisen kirkon ja yhteistyökumppaneiden Heräys-seminaarissa 13.3.2026 Vantaan Heurekassa tekoälyn inhimillisistä puolista keskustelevat mm. Euroopan komission varapuheenjohtaja Henna Virkkunen ja yritysjohtaja Risto Siilasmaa. Seminaaria voi seurata maksutta etänä, lisätiedot www.heräys.fi

