Riitta Alkula toimii semanttisen yhteentoimivuuden edistämiseksi

Anu Ylisalmi

Riitta Alkula työskentelee johtavana asiantuntijana Digi- ja väestötietovirastossa. Hänen vastuullaan ovat Yhteentoimivuusalustan omistajan tehtävät, joita ovat palvelun toiminnan, kehityksen sekä asiakastyön ohjaaminen, koordinointi, suunnittelu sekä palvelun budjetointi sekä käyttäjien opastaminen ja koulutukset.

Alkula on kotoisin Päijät-Hämeestä Padasjoelta. Pienellä paikkakunnalla ei ollut paljon harrastusmahdollisuuksia, mutta siellä oli kirjasto, joten Alkula innostui lukemisesta. Ylioppilaaksi kirjoitettuaan Alkula lähtikin opiskelemaan suomen kieltä, kirjastotiedettä ja tietojenkäsittelyoppia Tampereen yliopistoon. Pääaine vaihtui kirjastotieteeksi ja Alkula valmistui ensin yhteiskuntatieteiden maisteriksi. Hän siirtyi välillä opiskelemaan myös Helsingin yliopistoon ja valmistui sieltä pari vuotta myöhemmin filosofian maisteriksi pääaineenaan yleinen kielitiede. Alkula väitteli yhteiskuntatieteiden tohtoriksi informaatiotutkimuksesta Tampereen yliopistossa vuonna 2000.

Pitkä ura semanttisen yhteentoimivuuden parissa

Riitta Alkula on jo pitkään ollut työssään tekemisissä semanttisen yhteentoimivuuden ja sanastojen parissa. ”Tämän vuosituhannen alkupuolella tarve siirtää tietoa tietojärjestelmästä toiseen alkoi kasvaa ja huomattiin, ettei siirto rajapintojen kautta toimi, jos eri tietojärjestelmissä käytetään samasta asiasta eri termejä”, Alkula taustoittaa. ”Samoihin aikoihin julkaistiin ensimmäisiä versioita eurooppalaisista yhteentoimivuusperiaatteista (European Interoperability Framework, EIF) ja alettiin ymmärtää, ettei tekninen yhteentoimivuus riitä, vaan tarvitaan myös semanttista yhteentoimivuutta.” Työskennellessään TietoEnatorilla 2000-luvun alussa Alkula oli mukana valtiovarainministeriön Julkishallinnon XML-strategian toteuttaminen -hankkeessa, jossa selvitettiin tietojärjestelmien semanttisen yhteentoimivuuden ongelmia ja ratkaisuja niihin. Hankkeen tuloksiin kuului myös valtiovarainministeriön vuonna 2005 julkaisema raportti Sanastot siltana saumattomalle tiedonvaihdolle – Tietojärjestemien semanttisen yhteentoimivuuden kehittämismalli, jota Alkula oli mukana kirjoittamassa.

Alkula oli TietoEnatorin jälkeen muutaman vuoden sosiaali- ja terveysministeriössä hoitamassa Kanta-palveluiden arkkitehtuuria ja siirtyi sitten SAS Instituteen, jossa työskenteli analytiikan, tietovarastojen ja liiketoimintatiedonhallinnan parissa. ”Olen kokenut hyödylliseksi, että olen ollut työssäni tekemisissä operatiivisen tietojenkäsittelyn lisäksi myös analytiikan ja tietovarastojen kanssa”, Alkula miettii.

Alkula hakeutui vuonna 2015 Goforelle palveluarkkitehdiksi huomattuaan, että siellä tehdään mielenkiintoisia tietoarkkitehtuuriprojekteja. Alkula työskenteli konsulttina muun muassa sosiaali- ja terveydenhuoltoon liittyvissä projekteissa ja valtiovarainministeriön Yhteinen tiedon hallinta -hankkeessa (YTI). YTI-hankkeessa muun muassa kehitettiin yhteentoimivuusmenetelmä eli yhteinen tapa hallita, tuottaa ja ylläpitää digitaalisten palveluiden ja tietovirtojen taustalla tarvittavia tietomäärityksiä ja metatietoja.

Kesällä 2019 Alkula aloitti johtavana asiantuntijana semanttisen yhteentoimivuuden ja Yhteentoimivuusalustan parissa silloisessa Väestörekisterikeskuksessa, nykyisessä Digi- ja väestötietovirastossa.

Semanttinen yhteentoimivuus ja Yhteentoimivuusalusta

Semanttisella yhteentoimivuudella tarkoitetaan sitä, että eri tahot ymmärtävät yhteiset käsitteet samalla tavalla ja tietojen merkitys säilyy, kun tietoja siirretään eri tietojärjestelmien välillä. Riitta Alkula viittaa edesmenneeseen Timo Honkelaan, joka puhui ”merkitysneuvotteluista”. Honkela tarkoitti merkitysneuvottelulla keskustelua, jolla haetaan yhteinen tapa tulkita jokin ilmaisu. Alkulan mielestä merkitysneuvottelut ovat sekä ihmisten että koneiden välisen ymmärryksen keskiössä. Sanastotyö tarjoaa työkaluja merkitysneuvotteluun ja siten sanastotyötä tekemällä voidaan edistää semanttista yhteentoimivuutta.

Digi- ja väestötietovirasto ylläpitää Yhteentoimivuusalustaa, joka on tarkoitettu yhteentoimivien tietosisältöjen määrittelyyn. Alustan työkalut ovat maksuttomasti käytettävissä terminologiseen sanastotyöhön, koodistojen hallintaan ja tietomallinnukseen. Yhteentoimivuusalustan työkaluja voi käyttää niin julkinen hallinto kuin yksityissektorikin.

Yhteentoimivuusalustalla tietosisältöjen tuottajat vastaavat omista tietomäärityksistään sekä niiden ajantasaisuudesta ja laadusta. Yhteentoimivuusalustalla on tähän mennessä julkaistu yli 60 sanastoa, vajaat 500 koodistoa ja liki 200 tietomallia. Alustalle tietosisältöjä tuottaa noin 40 organisaatiota.

Alkulan mukaan Yhteentoimivuusalusta ei ole vielä kovin tunnettu suomalaisessa julkishallinnossa. Aktiivisimmat tietosisältöjen tuottajat ovat sellaisia, jotka kokevat, että Yhteentoimivuusalustasta on hyötyä, kun ei tarvitse rakentaa vastaavaa järjestelmää itse. Tavoitteena on kehittää Yhteentoimivuusalustan rajapintoja niin, että tietojärjestelmät voisivat vaihtaa tietoja keskenään automaattisesti.

Alkula harmittelee, että on haastavaa houkutella tietosisältöjen tuottajia julkaisemaan aineistojaan Yhteentoimivuusalustalla, koska siihen ei ole mitään lakisääteistä velvoitetta. Alkula rohkaisee organisaatioita kuitenkin aineistojensa julkaisuun, koska julkaistusta aineistosta voi olla paljon hyötyä toisille organisaatioille, vaikkei tietosisällön tuottanut organisaatio sitä itse käyttäisikään Yhteentoimivuusalustan kautta. ”Yhteentoimivuusalustalta voi hyödyntää yksittäistäkin työkalua, ei ole välttämätöntä ottaa käyttöön koko pakettia”, Alkula muistuttaa. Digi- ja väestötietovirastolla on henkilöitä, jotka kiertävät markkinoimassa Suomi.fi-palveluita ja näiden esittelyn yhteydessä he kertovat myös Yhteentoimivuusalustasta. Myös Alkulan tehtäviin kuuluu Yhteentoimivuusalustan markkinointi ja sen käytön edistäminen tukemalla tietosisältöjen tuottajia sisällöntuotannossa ja sisällön tuonnissa alustalle.

Tietomallit-työkalulla kuvataan tietojen rakennetta ja sisältöä, jotta tiedetään, millä tavalla tietoja voidaan vaihtaa tietojärjestelmien välillä. ”Sanastot- ja Koodistot-työkalujen alkuperäinen tarkoitus oli tukea Tietomallit-työkalun toimintaa. Sanastot-työkalun on todettu palvelevan muutakin käyttöä kuin tietojärjestelmien rakentamista, joten tekeillä olevassa Sanastot-työkalun käyttöliittymäuudistuksessa pyritään siihen, että Sanastot-työkalusta tulee kaikkia hyödyttävä yleistyökalu ja käyttöliittymän selailu on mahdollisimman helppoa myös ilman terminologin tai tietomallintajan asiantuntemusta”, Alkula kertoo. Uudistettu Sanastot-työkalu on tarkoitus julkaista vuoden 2022 alkupuolella. Tietomallit-työkalu ja Koodistot-työkalut on tarkoitettu sen sijaan lähinnä tietojärjestelmien toteuttajille.

Julkisen hallinnon yhteentoimivuuden edistäminen

Julkisen hallinnon yhteentoimivuuden edistämiseksi eri toimialoille tarvittaisiin Alkulan mukaan organisaatioiden yhteisiä yhteistyöryhmiä samaan tapaan kuin rakennetun ympäristön puolella on semanttisen yhteentoimivuuden teemaryhmä alaryhmineen tai sosiaali- ja terveydenhuollon puolella on Terveyden ja hyvinvoinnin laitoksen koodistopalvelu, joka yhtenäistää koodistoja.

Tiedonhallintalain myötä tuli vaatimus, että tietojen omistajien pitää kuvata tietosisältönsä, joita luovutetaan toisille tahoille. Eri tahot ovat viime vuosina kuvanneet omia sisältöjään eli tehneet ns. tiedonhallintamalleja ja valtiovarainministeriö on tehnyt tiedonhallintakarttaa. Alkula toivoo, että jatkossa tehtäisiin kahden toimijan välisten rajapintojen sijaan yleisiä rajapintoja ja käyttöoikeuksilla säädeltäisiin, kuka voi hakea mitäkin tietoa. ”Tietoa pitäisi ajatella abstraktimmin, ei pelkästään konelukuisena tiedonsiirtona tietojärjestelmien välillä, vaan niin että looginen eli semanttinen taso olisi mukana”, Alkula pohtii.

EU-ydinkäsitteet ja Julkisen hallinnon yhteentoimivuussanasto

Sanastokeskus ja Digi- ja väestötietovirasto aloittivat marraskuussa 2020 yhteistyön EU Core Vocabulary -sanastojen käsitteiden määrittelemiseksi osana julkisen hallinnon yhteistä sanastotyötä. EU Core Vocabulary -sanastoista valituille 90 käsitteelle valmisteltiin suomenkieliset termit, määritelmät ja huomautukset. Julkisen hallinnon yhteentoimivuussanasto – EU-ydinkäsitteet -sanasto valmistui kesäkuussa 2021 ja se julkaistiin Sanastot-työkalussa. Riitta Alkula oli mukana sanaston laatineessa työryhmässä.

Julkisen hallinnon yhteentoimivuussanastoa on tarkoitus laajentaa. ”Meillä on myös aikaisempi julkishallinnon tietomalli ja Julkisen hallinnon yhteinen sanasto, mutta ne kaipaisivat päivitystä. Meidän pitäisi tehdä EU-ydinkäsitteille alisteinen suomalainen ydinsanasto, jossa olisi ytimenä EU-käsitteet ja sitä olisi laajennettu suomalaisilla käsitteillä”, Alkula kaavailee.

Semanttinen yhteentoimivuus on tärkeää myös Euroopan unionin eri jäsenvaltioiden siirtäessä tietoja toisilleen. Tiedonsiirrossa avainasemassa ovat myös yhteiset ydinkäsitteet. ”Jos menee töihin tai opiskelemaan toiseen jäsenmaahan, niin on hyvä, että järjestelmät voivat vaihtaa tietoja keskenään automaattisesti, ettei tarvitse itse hankkia hillitöntä määrää allekirjoitettuja ja leimattuja paperisia asiakirjoja ja kuljettaa niitä mukanaan”, Alkula miettii. ”Vaikka käytännöt ovat eri maissa erilaisia, on helpottavaa, jos tiedot siirtyvät oikeanmuotoisina ja oikealla tavalla ymmärrettyinä, ettei tarvitse myöskään korjailla tietoja vastaanottajapäässä. Esimerkiksi passissa ja ajokortissa on tiedot esitetty EU:n alueella tietyissä samoissa kohdissa, joten suomen tai ruotsin kieltä osaamaton henkilö osaa löytää vaikkapa etunimet suomalaisesta ajokortista, vaikkei ymmärtäisi etunimet- tai förnamn-sanaa.” Alkula kertoo Digitaalisesta palveluväylästä (Single Digital Gateway, SDG), joka on yksi ratkaisu tietojen siirtämiseen eri jäsenmaiden välillä. Palveluväylää varten määritellään jatkuvasti uusia asiakirjoja tai asiakirjallisia tietoja. Nyt siellä on esimerkiksi syntymätodistus ja vihkitodistus, mutta sinne tulee koko ajan uusia asiakirjoja, jotka liittyvät työntekoon, koulunkäyntiin ja eläkkeisiin.

Tekoäly ei osaa tehdä sanastotyötä

Alkulan mukaan sanastotyön tekeminen on hidasta ja melko työlästä, kun sitä tehdään ihmisten kanssa, mutta tämä ei ole vältettävissä, sillä tekoäly ei vielä taivu sanastotyön tekemiseen: ”Tietojen peruskäsittelyä koneet voivat tehdä, mutta lopullinen silaus pitää tehdä ihmisvoimin, jotta ymmärretään, mihin asiat liittyvät. Tarvitaan myös ihmisen etiikkaa ja ymmärrystä maailmasta.” Alkula nostaa esimerkkinä lauseen ”Tiputin kahvikupin lattialle, se meni rikki”, josta ihminen ymmärtää automaattisesti, että kahvikuppi meni rikki eikä lattia, vaikka viittaussuhde lauseessa jää epämääräiseksi. Tämän ratkaisemiseksi on kehitelty automaattisia päättelyjärjestelmiä (ns. asiantuntijajärjestelmät), mutta ne ovat toistaiseksi kaatuneet siihen, että päättelysääntöihin olisi pitänyt kirjata liian paljon sellaisia tietoja, joita ihmiset tietävät oman kokemuksensa kautta. Tekoälyn käytössä olennaista on myös se, millaisia tekstimassoja käytetään koneen opettamisessa: ”Jos lähdetään vaikka käsittelemään verkossa olevaa tekstiä ja satutaan osumaan johonkin vihapuhekeskittymään, niin tuloksena voi olla ihan vinoutunut ihmiskuva.”

Sanastokeskuksen toiminta tärkeää

Riitta Alkula muistelee kuulleensa ensimmäistä kertaa Sanastokeskuksesta, kun oli aikanaan silloisen työnantajansa TietoEnatorin edustajana FinnONTO – Suomalaiset semanttisen webin ontologiat -hankkeen ohjausryhmässä ja Sanastokeskuksen Katri Seppälä oli hankkeessa ”lainassa” tekemässä ontologiatyötä. Toimiessaan JUHTAn asettaman julkisen hallinnon sanastojen määrittelyn koordinoinnista ja käsitekuvausten harmonisoinnista vastanneen ydinsanastoryhmän (YSR) sihteerinä vuosina 2016–2019 Alkula pääsi tutustumaan Sanastokeskuksen toimintaan paremmin, kun Katri Seppälä oli mukana ydinsanastoryhmässä ja ”piti tolkkua, että ydinsanastoryhmän tuotokset olisivat myös terminologisesti asianmukaisia”.

Alkula pitää tärkeänä, että Suomessa on edelleen Sanastokeskuksen kaltainen terminologisen sanastotyön asiantuntijaorganisaatio, kun muissa Pohjoismaissa aiemmin toimineiden sanastokeskusten toiminta on jouduttu ajamaan alas ja sanastotyö on siirtynyt osaksi muiden organisaatioiden toimintaa. Sanastokeskuksella on sanastotyön alan asiantuntemusta ja sopiva välineistö sanastotyön tekemiseen.

Lukemista ja taimikonhoitoa

Espoossa asuvan Riitta Alkulan perheeseen kuuluu aviomies ja aikuinen lapsi, joka on jo muuttanut omilleen.

Nyt korona-aikaan Alkula on harrastanut erityisesti lukemista. Alkulalla on maaseudulla, Padasjoen maisemissa, mökki ja metsäpalsta, jolla hän harrastaa taimikonhoitoa. ”Taimikkoa hoitaessa pääsee liikkumaan ulkona ja olemaan luonnossa ja se on myös hyödyllistä työtä, kun auttaa puuntaimia kasvamaan”, Alkula hehkuttaa.

Lisää uusi kommentti

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • HTML-merkit ovat kiellettyjä.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.