Paikkatieto-ontologian Inspire-laajennus

Riina Kosunen

Maanmittauslaitoksen ja Sanastokeskus TSK:n koordinoimassa sanasto- ja ontologiahankkeessa1 laaditusta Paikkatieto-ontologiasta (PTO) julkaistaan joulukuussa 2015 toinen, laajennettu versio.

Ontologian ensimmäinen versio julkaistiin kesäkuussa 2015. Se sisälsi noin 650 paikkatietoon liittyvää käsitettä, joista noin 220 oli peräisin Geoinformatiikan sanastosta (TSK 42, 2011) ja loput Paikkatietohakemiston hakusanastosta.

PTO:n toisessa versiossa ontologiaa on laajennettu lisäämällä siihen Inspire-direktiivin mukaisia paikkatietokohdetyyppejä2. Laajennuksen myötä ontologiaan tuli lähes 400 uutta käsitettä. Esimerkkejä lisätyistä paikkatietokohdetyypeistä ovat palsta, suojelukohde, meritie, geofysikaalinen mittaus, vesistöalue ja tuotantorakennus. Paikkatietokohdetyypit puolestaan kuuluvat Inspire-aineistoteemoihin, joita ovat esimerkiksi kiinteistöt, suojellut alueet, liikenneverkot, geologia, hydrografia ja tuotanto- ja teollisuuslaitokset. Yhteensä teemoja on yli 30, ja ne kattavat suuren osan eurooppalaisen yhteiskunnan ilmiöistä, joihin liittyy sijaintitietoa. Paikkatieto-ontologian laajennus on tehty pääasiassa Maanmittauslaitoksen ja Sanastokeskuksen asiantuntijoiden voimin.

Paikkatietokohdetyypeille paikka

Kun Inspire-paikkatietokohdetyyppien ripustamista Paikkatieto-ontologiaan aloitettiin, oli ensin selvitettävä, mitä paikkatietokohdetyypit ovat, mikä on niiden suhde muihin ontologian käsitteisiin ja mihin kohtaan ontologian hierarkkista rakennetta ne kuuluvat. Inspiressä on esimerkiksi paikkatietokohdetyyppi tie ja YSOssa käsite tiet, ja ensiajattelemalta paikkatietokohdetyypin ja käsitteen voisi ajatella olevan jotain melko samaa. Eikö ne siis voisi merkitä ontologiaan keskenään ekvivalenteiksi eli samoiksi käsitteiksi?

Kuitenkin jo tieto, että Inspiren tietoyksiköitä nimitetään paikkatietokohdetyypeiksi eikä käsitteiksi, panee hiukan varuilleen. Määritelmien avulla voi hahmottaa, mistä on kyse:

paikkatietokohdetyyppi
tietoyksiköiden tai -rakenteiden ja niihin liittyvien toimintojen määrittely, joka määrittelee paikkatietokohteita
[lähde: Geoinformatiikan sanasto (TSK 45, 2014; tietoja hiukan muokattu)]

käsite
tiedon yksikkö, joka muodostuu käsitepiirteiden ainutkertaisesta yhdistelmästä
[lähde: Terminologian sanasto (TSK 36, 2006)]

Paikkatietokohdetyypit ovat siis tietoyksiköiden tai -rakenteiden määrittelyjä: niiden avulla tietojärjestelmien tietomalleissa kerrotaan muun muassa, mitä ominaisuuksia esimerkiksi järviä ja jokia koskevissa tietoyksiköissä tulee olla. Esimerkiksi Inspiren tie-paikkatietokohdetyypin kuvaus on ”järjestetty kokoelma tielinkkisarjoja ja/tai yksittäisiä tielinkkejä, joita luonnehtii yksi tai useampi temaattinen tunniste ja/tai ominaisuus”.

Käsitteet puolestaan ovat ihmisen ajattelun avulla muodostettuja mielikuvia reaalimaailman tarkoitteista. YSOn tiet-käsite viittaa siis reaalimaailman liikenneväylään, jollainen on määritelty vaikkapa Kielitoimiston sanakirjassa: ”maastoon kulkureitille muodostunut tai varsinkin liikennettä varten rakennettu väylä”.

Kun paikkatietokohdetyypin ja käsitteiden välistä suhdetta pohdittiin, tultiin siihen tulokseen, ettei paikkatietokohdetyyppejä ja käsitteitä voi merkitä keskenään ekvivalenteiksi. Sen vuoksi Inspire-paikkatietokohdetyypeistä luotiin vain assosiatiivinen suhde niitä vastaaviin reaalimaailman käsitteisiin, jollaisia Paikkatieto-ontologian muut, YSOsta, Paikkatietohakemiston hakusanastosta ja Geoinformatiikan sanastosta peräisin olevat käsitteet ovat. Esimerkiksi tie-paikkatietokohdetyypille merkittiin assosiatiivinen suhde YSO-käsitteeseen tiet. Kaikille paikkatietokohdetyypeille ei löytynyt vastaavaa reaalimaailman käsitettä muusta ontologiasta. Näissä tapauksissa paikkatietokohdetyypeistä merkittiin assosiatiivinen suhde reaalimaailman käsitehierarkiasta löytyviin yläkäsitteisiin. Esimerkiksi paikkatietokohdetyypille merikerrostuma, jota vastaavaa käsitettä YSOsta ei löytynyt, merkittiin assosiatiivinen suhde YSOsta löytyvään yläkäsitteeseen kerrostumat.

Ontologiassa paikkatietokohdetyypille merkittiin myös tietomallin mukainen ylityyppi. Esimerkiksi meri-paikkatietokohdetyypin ylityyppi on merialue, jonka ylityyppi on puolestaan hydrokohde. Merialue–meri-esimerkki osoittaa, ettei tietomalleissa käytetty ylityyppi–alityyppi-suhde ole täysin vastaava kuin terminologian hierarkkinen ylä–alakäsitesuhde: terminologisesti ei voi ajatella, että meri olisi yhdentyyppinen merialue. Tietomallissa meri-tietoelementti kuitenkin perii kaikki merialue-tietoelementin ominaisuudet, jollaisia voivat olla esimerkiksi ”laajuus tietyssä vuoroveden vaiheessa” ja ”keskimääräinen vuotuinen pintalämpötila”.

Miksi Inspire-käsitteitä ontologiaan?

Inspire-paikkatietokohdetyyppien luettelo on yhteinen kaikille Euroopan unionin jäsenmaille, ja näin ollen se sisältää myös sellaisia ilmiöitä, joita Suomessa ei esiinny. Esimerkiksi paikkatietokohdetyyppi vuorovesialue on hyvinkin yleinen vaikkapa Isossa-Britanniassa ja Ranskassa, joilla on pitkät valtamerirannikot. Suomen rantoja huuhteleva Itämeri puolestaan on niin pieni, että tällaisen nousu- ja laskuveden väliin jäävän alueen voi ilman teknisiä apuvälineitä havaita vain Varsinais-Suomessa sijaitsevassa Strömman kanavassa.

Mihin näitä ontologisoituja Inspire-käsitteitä sitten tarvitaan? Ensinnäkin samaan kuin kaikkia muitakin Paikkatieto-ontologian käsitteitä3, eli asiasanoitukseen ja kuvailuun. Esimerkiksi Inspire-direktiivin piiriin kuuluvat paikkatietoaineistot tulee kuvailla Inspire-aineistoteemojen nimillä.Tältä osin Inspire-käsitteiden hyödyntäminen on siis samanlaista kuin muidenkin PTO:n käsitteiden. Ennen kaikkea Inspire-paikkatietokohdetyyppien lisääminen ontologiaan mahdollistaa paikkatietokäsitteiden linkittämisen yli organisaatiorajojen ja siten parantaa paikkatietojen ja paikkatietoaineistojen yhteentoimivuutta suomalaisessa yhteiskunnassa.

Suomalaiset organisaatiot (kuten julkinen hallinto ja yritykset) tuottavat tietoa reaalimaailman kohteista. Esimerkiksi Suomen ympäristökeskus SYKE tuottaa tietoa maamme järvistä, ja Lappeenrannan kaupunki tuottaa tietoa erityisesti Saimaa-nimisestä järvestä. Suomalaiset viranomaiset on velvoitettu antamaan paikkatietokohteille yksilöivät URI-tunnukset. Samalla kun viranomaiset antavat jollekin paikkatietokohteelle URI-tunnuksen, ne voivat perustaa URI-tunnuksen myös vastaavalle reaalimaailman kohteelle, kuten Saimaa-järvelle. Eri viranomaisten samalle reaalimaailman kohteelle luomat tunnukset voidaan linkittää Paikkatieto-ontologian Inspire-paikkatietokohdetyyppeihin, joilla reaalimaailman kohteita mallinnetaan. Saimaa-järven mallintamiseen käytettävä paikkatietokohdetyyppi Inspiressä on seisova tai vakavesi.

Esimerkissämme alla sekä SYKEn että Lappeenrannan kaupungin Saimaa-järvestä tehdään viittaus ontologian Inspire-paikkatietokohdetyyppiin seisova vesi tai vakavesi, ja siitä on puolestaan viittaus YSOn käsitteeseen vesistöt, jolla taas on ontologiassa alakäsitteinä muun muassa järvet ja joet. Tällä tavoin ontologia auttaa linkittämään samaa reaalimaailman kohdetta koskevat tiedot toisiinsa ja lisäksi vastaavia käsitteitä sekä käsitteiden välisiä suhteita koskeviin tietoihin.

paikkatietokuva
Yhteentoimivuuden toteuttaminen reaalimaailman kohteen, paikkatietokohteen ja käsitteen välisillä viittauksilla.
Lähde: JHS 193 Paikkatiedon yksilöivät tunnukset (http://docs.jhs-suositukset.fi/jhs-suositukset/JHS193/JHS193.pdf, liite 4)1Ks. artikkeli Paikkatiedon sanasto- ja ontologiahankkeen kuulumisia Terminfossa 2/2014.
2Paikkatietokohdetyypit ovat peräisin paikkatietoaineistojen ja -palvelujen yhteentoimivuutta koskevista Euroopan komission asetuksista 1089/2010 ja 1253/2013.
3Vrt. artikkeli Paikkatieto-ontologia Terminfossa 3/2012.