Ontologiat palvelutietovarannon palveluksessa: tavoitteena siilottomat palvelutiedot

Marko Latvanen

Ensi vuoden lopulla päättyvä Kansallinen palveluarkkitehtuuriohjelma (KaPA) rakentaa parhaillaan Suomeen alustoja, ympäristöjä ja toimintamalleja, joihin lähivuosina tapahtuva kattava julkisen hallinnon ja palvelujen digitalisointi perustuu.

Koko julkishallintoa koskevan KaPA-ohjelman tavoitteena on ennen vuotta 2020 luoda alusta Suomelle, jossa palvelut perustuvat tietojen ”siilottomaan” liikkumiseen eri toimijoiden ja hallinnon alojen välillä ja automaattiseen, fiksuun asiakaskohdentamiseen. Digitaalisen palvelukoneiston on lähitulevaisuudessa alettava toimia henkilö- ja yhteisöasiakkaan kanssa kuin Downton Abbeyn hovimestari Carson: diskreetisti, ennakoivasti ja palveltavaa aina henkilökohtaisesti huomioiden.

Tähän ei tietenkään päästä vain ohjelmoinnin keinoin, vaan tarvitaan ihmisen ymmärrettäviä (ja samalla myös koneluettavia) käsitteitä ja käsitekokonaisuuksia . Luotavaan kansalliseen palvelutietovarantoon kuvataan yhteisen tietomallin mukaan kansalaisille, yrityksille ja viranomaisille kohdistetut palvelut ja niiden asiointikanavat yhdenmukaisesti ja asiakaslähtöisesti. Palvelujen löytämisen, älykkään kohdentamisen ja vertailtavuuden kannalta merkittävä ongelma on ollut se, että eri tahojen tuottamista hallinnon kansalaispalveluista ei ole ollut käytössä yhtenäistä kansallista tietokantaa tai rekisteriä. Palvelujen kuvauksissa käytetyissä käsiteavaruuksissa, tietorakenteissa ja tiedon koneellisessa saatavuudessa on ollut eri organisaatioissa suuria eroja eikä tilanne ole vielä juuri parantunut. Yrityspalvelujen suhteen tilanne on ollut kuitenkin parempi Yrityssuomi.fi-palvelun puitteissa pitkään jatkuneen toiminnan ansiosta.

Palvelutietovaranto: ontologiat palvelujen kuvaamisessa

Nykytilaan on tulossa muutos, kun kansallinen palvelutietovaranto (tästä eteenpäin PTV) tuli 15.7.2016 ns. KaPA-lain (Laki hallinnon yhteisistä sähköisen asioinnin tukipalveluista) myötä velvoittavaksi kaikille julkisen hallinnon palveluntuottajille. Velvoittavuus ulottuu isosta ministeriöstä ja keskusvirastosta aina siihen kuuluisaan ”Pieneen Kuntaan”. KaPA-laki edellyttää, että julkiset palveluntuottajat kuvaavat kaikki vastuullaan olevat kansalais- ja yrityspalvelut kaikkine asiointikanavineen PTV-tietorakenteen mukaisesti ja vastaavat niiden ajantasaisesta ylläpidosta itse.

Tiedot voidaan tallentaa suoraan PTV-kantaan tai jakaa ne sinne organisaation oman järjestelmän rajapinnasta. Hallinnolla on vajaa vuosi aikaa tuottaa kaikki nämä tiedot. Käytännössä tämä merkitsee sitä, että 460 organisaatiota on tuottanut kaikista palveluistaan tiedot 1.7.2017 mennessä, olettaen että kaikki menee täysin kohdalleen ja ajallaan.

PTV:n ensimmäinen käyttökohde on Suomi.fi-palvelun tuleva versio, ns. palvelunäkymä, joka korvaa ensi vuonna nykyiset Suomi.fi- ja Yrityssuomi.fi-palvelut. Uudessa Suomi.fi-palvelussa PTV-tiedot muodostavat palveluista ja niiden käytöstä perusasiat kertovan sisällön, jota Suomi.fi-verkkotoimitus käyttää toimitettujen sisältökokonaisuuksien ja -formaattien luomisessa. PTV on samalla avointa dataa, jota myös yksityiset toimijat voivat käyttää omissa palveluissaan ja sovelluksissaan.

Ontologiat ja luokitukset palvelukuvausten ytimessä

PTV:n tietosisältö on monipuolinen ja runsas. Tavoitteena on pystyä kuvaamaan kukin palvelu ja sen asiointikanavat niin hyvin, että palvelua ei ainoastaan löydä helposti ja oikeassa kontekstissa, vaan asiakkaalle tarjotaan yhdessä paketissa palvelun keskeinen sisältö, tarkoitus, asiointiajat ja -edellytykset, mahdolliset liittyvät palvelut yms. Kuvausmetatiedoissa on myös kenttiä, joita asiakas ei suoraan näe, mutta jotka auttavat palvelujen kohdentamisessa ja ryhmittelyssä asiakkaille; näitä ovat ennen muuta elämäntilanne- ja kohderyhmäluokitukset.

Kustakin palvelusta ihmisasiakkaalle kertovat eniten kuvausteksti ja käyttötiedot, mutta kuvausvoiman ja ennen muuta hakulöydettävyyden takia PTV sisältää pakollisen asiasana- eli ontologiakäsitekentän. PTV on liitetty kuuteen Finto-ontologiaan: YSO, JUPO, LIITO, JUHO, TERO ja TSR-sanasto. Näiden sisältö PTV:hen tulee KOKO-ontologian kautta ja sillä tulisi kattaa palvelujen käsitteellisen kuvailun tarve.

Käytännössä palvelua kuvaileva henkilö noudattaa rakenteellista prosessia, jonka tietyssä vaiheessa hän saa asiasanakentän, joka alkaa kolmen syötetyn merkin jälkeen tarjota em. aineistoista ontologiakäsitteitä. Kun käsite valitaan tarkasteluun, tiedon tuottaja näkee käsitteen ylä- ja alakäsitehierarkian, jonka avulla hän voi sekä varmistua, että kyseessä on tarkoitettu käsite, että mahdollisesti hoksata sen tarkemman käsitteen, jolla tätä palvelua voidaan täsmällisesti kuvata. Tämä ominaisuus ei tosin ole vielä PTV:n tuotantoversiossa, vaan tulee siihen jatkokehityksessä. Ontologiakäsitteitä on suositeltu annettavaksi palvelua kohden 3–5, mutta sallittu määrä on välillä 1–10. Nolla ei ole vaihtoehto.

Ontologiakäsitteiden avulla hyvin tehty asiasanoitus nostaa relevantin palvelun esille hakutuloksissa niin tulevassa Suomi.fi-palvelussa kuin keskeisissä verkon hakukoneissa. Tämä on itsestään selvää, mutta asiasanoituksella on muitakin käyttötarkoituksia palvelunäkymän ja koko kansallisen palveluarkkitehtuurin puitteissa. Se luo mahdollisuuksia, jos ei nyt aivan mihin tahansa, niin ainakin palveluja koskevan tiedon paljon nykyistä parempaan hyödynnettävyyteen. Muutamia esimerkkejä:

  • Verkkotoimitus voi käyttää PTV:n ontologiakäsitteitä ja niiden klustereita löytääkseen keskeiset palvelut työn alla olevaa uutta sisältökokonaisuutta varten.
  • Systemaattisesti käytetyillä ontologiakäsitteillä ja muilla metatietoelementeillä palveluja voidaan ryhmitellä ja jäsentää palvelukentän analytiikkaa ja tiedolla johtamista varten.
  • Käsitteiden avulla järjestelmä voi nostaa käyttäjän valitseman palvelun tietoihin vastaavia tai täydentäviä palveluja ”katso myös” -periaatteella.
  • Kansallisessa palveluväylässä ontologiakäsitteet voivat auttaa järjestelmiä tunnistamaan ja yhdistämään itsenäisiä aineistoja toisiinsa.

Maastouttamisen haaste alkaa vaikeasta sanasta

Sanastojen ja formaalien tietoaineistojen kanssa työskenteleville ontologiat ja niiden tarkoitus ovat selviä ainakin jollain tasolla. Itse olen edelleen innokkaan amatöörin tasolla, mutta olen sentään oppinut muun muassa, mitä ovat alakäsitteet, ekvivalenssit ja korvaavat käsitteet, miten Finto-ontologiapalvelu toimii ja miksi käsitteillä pitää olla URI-tunniste. Peruskauraa ehkä, mutta haaste konkretisoituu, kun ontologiamaailmaa tuodaan sellaisiin organisaatioihin, joissa palvelukuvaus on tähän asti tarkoittanut joko kahta tekstikappaletta verkkosivulla tai vaihtoehtoisesti pitkää hallinnollista esitystä ilman yhtään vakioitua metatietoa.

Ensimmäinen kuoppa tiessä on termi ontologia. Sen merkitys ei yleensä ole tuttu kenellekään palvelurajapinnassa työskentelevälle, ja nuorena filosofiaa huvikseen sivuaineopiskellut tietohallintopomokin muistaa, että ontologia tarkoittaa oppia olevaisesta. Ja nyt sitten pitäisi ryhtyä käyttämään joitakin ontologiakäsitteitä? Just just. Ensimmäinen reaktio palvelutuottajan edustajalla on usein paniikki.

PTV-käyttöönottoprojektin aivan ensimmäisissä koulutuksissa tämä tuli esille sen verran vahvasti, että teimme hieman kerettiläisen päätöksen puhua ontologiakäsitteiden sijaan asiasanoista. Lisäksi verbinä asiasanoittaa on tolkullinen ja ihan oikeaa suomea, toisin kuin ontologiakäsitteistää.

Ontologioista kyllä puhumme ja totutamme hallinnon väkeä tuohon käsitteeseen, joka ajan mittaan varmaankin asettuu hallinnon kenttään. Tällä hetkellä käynnissä ovat PTV:n käyttöönottokoulutukset organisaatioille ja niiden osana on PTV-metatietokoulutus, jossa ontologiat ovat esillä. Kokemuksemme mukaan käytännönläheisellä, oikein ajoitetulla ja esimerkkipohjaisella opetuksella voidaan vieraiden käsitteiden hetteikkö läpäistä varsin hyvin.

Ontologiakäsitteiden valintamyymälässä

Vaikka teknisenä suorituksena kuvaavan ontologiakäsitteen valinta on yksinkertainen, se voi olla kognitiivisena suorituksena vaikea, ainakin aluksi. Valitettavasti yhä edelleen on tavallista, että organisaation oma näkökulma näkyy vahvasti metatietojen käytössä, mutta kun palvelua kuvaillaan PTV:n vaatimusten mukaan, näkökulman on oltava tiukasti asiakaslähtöinen. Palvelua on katsottava suoraan asiakkaan kantilta: mitä minä kansalais- tai yhteisöasiakkaana odotan löytäväni ja saavani, ja mitä päämäärää varten. Avainkäsitteiden valinta organisaation omasta suoriteseurantatiedostosta ei yksinkertaisesti ole hyväksyttävää.

Tässä tilanteessa ollaan eräänlaisessa valintamyymälässä: kauppias (palvelusta vastaava organisaatio) kertoo kaupan tiloissa (PTV:ssä) tuotteista (palveluista), joita juuri tässä putiikissa on tarjolla (organisaation tuottamat palvelut). Jos kauppias ei käytä niitä käsitteitä, joita kadulta sisään kävellyt asiakas ymmärtää, tuotteet jäävät hyllyyn, koska asiakas ei löydä niitä.

Kauppias ei voi käyttää tavaraa myydessään tuotteista niitä koodeja ja lähetyslistalyhenteitä, joita hän käyttää tilatessaan tavaraa tukusta. Valitettavasti palvelujen suhteen hallinto aika usein toimii juuri näin, ja tässä on toimintatavan muutos arvattavasti edessä aika monessa paikassa. Kun organisaatiossa valitaan sopivimpia ontologiakäsitteitä kuvaamaan palvelua ja sen erilaisia asiointikanavia, joudutaan tekemään aitoa ajatustyötä ja asettumaan asiakkaan rooliin. Organisaatiossa joudutaan myös käymään ajatuksella läpi, mitkä ne ”meidän palvelut” itse asiassa ovat, voidaanko joitain yhdistää ja joistakin jopa luopua, ja miten asiointikanavia voisi ja pitäisi kehittää. Prosessi voi vaatia paljon, mutta myös antaa paljon.

Käsiteharmonian vaikeus ja helpottaminen

Vaikka Finto-palvelun ontologioista PTV-käytössä on vain kuusi ontologiaa, tietojen tuottajille tulee käyttöön kymmeniä tuhansia ontologiakäsitteitä. Näillä määrillä pyrkimys yhdenmukaiseen asiasanoitukseen organisaatioiden välillä olisi vain hurskas toive, mutta PTV-hankkeessa on tultu merkittävällä tavalla vastaan etenkin kuntia. Niihin kuntien lakisääteisiin tehtäviin (n. 450) liittyvät palvelut, joita kaikki kunnat järjestävät (runsas sata), on jo tuotettu ministeriöiden avulla ns. pohjakuvaukset, joihin on liitetty valmiiksi asianmukaiset ontologiakäsitteet. Kunta voi lisätä ontologiakäsitteitä, jos katsoo tarpeelliseksi, mutta ei poistaa valmiiksi annettuja. Sama pätee näiden palvelujen tekstimuotoisiin kuvauksiin.

Tämän menettelyn avulla vastaava palvelu eri kunnissa löytyy samoilla käsitteillä. Pohjakuvaukset antavat kunnille samalla mallin ja sapluunan, jota voi soveltaa myös kunnan vapaaehtoisesti tehtäväksi ottamien palvelujen kuvaamiseen.

Jatkossa myös muista kuin lakisääteisistä palveluista voidaan tehdä PTV-pohjakuvauksia. Nyt esimerkiksi seudullisista yrityspalveluista aiotaan mahdollisuuksien mukaan näin tehdä.

On selvää, että laatimalla PTV-pohjakuvauksia lakisääteisistä palveluista ei luoda harmonista ontologiakäsitteiden käyttöä valtion puolella yksittäisten virastojen välille. Koulutuksen, toimivien yhteistyöverkostojen ja kansalliseen palveluarkkitehtuuriin kuuluvan raja-aitojen purkamisen avulla voidaan luoda maaperä, jossa julkishallinnon yhteinen näkemys ja pelisäännöt ulottuvat myös ontologioiden hyödyntämiseen ja yhteiseen kehittämiseen.

Tähän on kieltämättä matkaa, mutta suunta lienee selvä. Jatkossa semanttista harmoniaa voidaan kenties edistää yhdistämällä taustaprosesseissa vakioituja ja määriteltyjä käsitteitä toisiinsa. Tällä hetkellähän Finto-palvelussa julkaistujen ontologioiden käsitteiltä puuttuvat määrittelyt lähes kokonaan, mihin on käytännössä välttämätöntä saada muutos. Jotta määriteltyjen käsitteiden välille tulevaisuudessa voidaan luoda merkityssuhteita järjestelmätasolla, tarvitaan teknisen alustan lisäksi sellaista laajempaa tiedon yhteentoimivuuden raamia, jota on jo alettu työstää hallituksen digitalisaatio-kärkihankkeessa (yhteinen tiedon hallintamalli ja -työväline).

Suomi on monikielinen maa

Kun ontologioita aletaan soveltaa kansallisella tasolla sellaisiin palvelurakenteisiin, joista on säädetty lailla, emme voi ohittaa sen paremmin kansalliskielten asemaa kuin Suomen kansainvälistymistäkään. Ontologiaresurssien on oltava käytettävissä suomen lisäksi vähintään ruotsiksi ja englanniksi; tämä on se taso, jolla Suomi.fi ja Yrityssuomi toimivat tällä hetkellä ja joka siirtyy myös tulevalle Suomi.fi-palvelulle ensi vuonna.

Tosiasia on, että kansallisista ontologioista osa on julkaistu vain suomeksi ja tarve niiden kieliversioille on muuttumassa akuutiksi KaPA-lain ja palveluarkkitehtuurin myötä. Tästä seuraa työtä ja sen organisointia varsin erikoistuneessa sektorissa; käsitteistöjen kieliversiointi ei ole kevyttä työtä etenkään silloin, kun niiden sovellusala on koko maa ja sen asukkaat.

Ontologia on käyttötavaraa

Ontologioissa on kaksi ulottuvuutta, joita on kehitettävä ja ylläpidettävä koko ajan. Käsiteavaruuden sisällön on oltava relevantti maailman tilaan nähden, mikä on varsin valtava prosessi. Ontologioiden sisällönkehitykseen on syytä saada mukaan koko palvelutietoja tuottava yhteisö ja heille on tarjottava selkeät välineet käsitetarpeiden välittämiseen sinne, missä ontologioiden sisällöstä varsinaisesti päätetään. Itse käsittelyprosessi kaivannee myös hieman tuunausta nykyisestä.

Kun sisältö on laadukasta, sitä on voitava myös käyttää. Digitalisaatio merkitsee käsitteiden ja semantiikan aina vain syvenevää kotiutumista sähköiseen maailmaan, niin tallentamisen kuin käyttötapausten osalta. Tästä seuraa, että ontologiat on julkaistava luotettavassa teknisessä ympäristössä, josta niitä voidaan käyttää suoraan rajapintakyselyillä, ladata toisiin järjestelmiin ja tarkastella raportointien yhteydessä. Palvelutietovarannon ja muun kansallisen palveluarkkitehtuurin välineistön yhteydessä 404- ja ”rajapinta ei vastaa” -tilanteille ei voi jättää tilaa.

Kiitokset Yrityssuomen Eeva Koivistolle faktojen tarkistuksesta ja muokkauksista!

Kirjoittajasta:
Marko Latvanen työskentelee Valtiokonttorin Suomi.fi-ryhmässä verkkotoimittajana ja ”KaPA-duunarina”. Latvanen on myös Sanastokeskus TSK:n hallituksen jäsen.

Lisää uusi kommentti

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • HTML-merkit ovat kiellettyjä.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.