Paikkatiedon sanasto- ja ontologiahankkeen kuulumisia

Riina Kosunen

Hankkeen taustaa

Sanastokeskus TSK ja Maanmittauslaitos ovat vuoden 2010 alusta saakka yhtäjaksoisesti tehneet paikkatiedon sanasto- ja ontologiatyötä. Aiemminkin sanastotyötä oli tehty muutamissa projekteissa, mutta tämänkertaisen pitkän yhteistyörupeaman aloittamisen taustalla oli niin sanottu INSPIRE-direktiivi eli vuonna 2007 Euroopan yhteisön paikkatietoinfrastruktuurin perustamisesta annettu direktiivi. Direktiivin tavoitteena on saattaa Euroopan unionin maiden paikkatieto saataville yhtenäisessä muodossa ja näin edesauttaa paikkatietojen yhteiskäyttöisyyttä euroopanlaajuisesti. Maanmittauslaitos vastasi direktiivin täytäntöönpanosta Suomessa ja totesi, että täytäntöönpanon tueksi tarvitaan myös sanastotyötä.

Sanastohanke aloitettiin vuosina 2010‒2011 toteutetulla terminologisen sanastotyön vaiheella, jossa vuonna 2005 julkaistua Geoinformatiikan sanastoa (TSK 32) päivitettiin ja täydennettiin INSPIRE-direktiiviin liittyvillä käsitteillä. Direktiivin vuoksi sanastoon lisättyjä aihealueita olivat paikkatiedon metatieto, paikkatietopalvelut, paikkatiedon mallintaminen ja tietotuotteiden määrittely. Vuonna 2011 työn tuloksena julkaistiin Geoinformatiikan sanaston toinen laitos (TSK 42).

Vuonna 2012 sanastohankkeessa keskityttiin Paikkatieto-ontologian rakentamiseen. Terminologin ja asiantuntijatyöryhmän yhteistyönä muodostettiin ontologia, jonka pohjarakenteena on Yleinen suomalainen ontologia (YSO) ja joka sisältää Geoinformatiikan sanaston toisen laitoksen sekä paikkatietoalan asiasanastona toimivan Paikkatietohakemiston hakusanaston käsitteet. Paikkatieto-ontologiaa on tarkoitus käyttää asiasanoituksen apuvälineenä perinteisen asiasanaston sijaan. Lisäksi ontologian tavoitteena on semanttisen webin osana muun muassa parantaa tiedonhakutuloksia. Paikkatieto-ontologian käsitteiltä puuttuvat toistaiseksi käsitteiden osoitteina toimivat pysyvät tunnisteet. Tämän vuoksi ontologiaa ei ole vielä julkaistu yleisölle. Ontologia on kuitenkin ollut Maanmittauslaitoksen sisäisessä käytössä erilaisia teknisiä kokeiluja varten.

Komission kääntäjien tukena

Vuosina 2012 ja 2013 sanastohankkeessa oli vuorossa työ, jossa haettiin suomenkielisiä vastineita tuhansille INSPIRE-direktiiviin liittyvien tietotuoteskeemojen englanninkielisille termeille. Paikkatietotuoteskeemat ovat malleja, joilla kuvataan paikkatietotuotteiden (jollaisia voivat olla vaikkapa maastomallit, maaperäkartat ja eliölajien levinneisyyskartat) tietosisältö ja -rakenne. Skeemojen avulla on tarkoitus saada eurooppalaiset paikkatietotuotteet rakenteeltaan yhdenmukaisiksi.

Tehtävänä oli hakea suomenkieliset vastineet tietoelementeille – tarkemmin sanottuna kohdetyyppien ja arvojoukkojen tai koodiluetteloiden nimille – jotka esiintyivät muun muassa INSPIRE-direktiivin täytäntöönpanoon liittyvässä komission asetuksessa (EU) N:o 1253/2013. Työn tavoitteena oli tukea komission kääntäjien työtä asetuksen parissa käymällä läpi heidän tekemänsä käännösluonnokset ja tarvittaessa täydentämällä tai korjaamalla niissä esiintyvät termit sekä oikaisemalla ainakin karkeimmat asiavirheet.

Esimerkki vastinepulmasta on asetuksessa määriteltynä esiintyvä käsite elevation (alla englanninkielinen termi suomenkielisen määritelmäkäännöksen kanssa):

elevation
paikkatietokohteen pystysuunnassa rajattu ulottuvuusominaisuus

Määritelmänsä perusteella elevation kääntyisi luontevasti korkeus, mutta tämä vastine ei tullut kysymykseen, koska asetuksessa esiintyi myös käsite height, joka oli täsmällisemmän määritelmänsä perusteella käännettävä termillä korkeus.

height
"elevationia" kuvaava ominaisuus, joka on mitattu luotisuoraa pitkin Maan vetovoimakentän vastaiseen suuntaan (ylöspäin)

depth
"elevationia" kuvaava ominaisuus, joka on mitattu luotisuoraa pitkin Maan vetovoimakentän suuntaan (alaspäin)

Kääntäjä ehdotti elevation-termin kääntämistä lainasanalla elevaatio, mutta alan suomalaiset asiantuntijat eivät pitäneet tätä hyvänä vaihtoehtona, koska sanaa ei käytetä suomalaisessa ammattikielessä. Suomalaisten asiantuntijoiden vastaehdotus oli korkeus ja/tai syvyys (koska elevation kattaa edellä mainitut käsitteet height ja depth, siis suuntautuu yhtäältä maanpinnasta ylöspäin ja toisaalta siitä alaspäin). Komission kääntäjä ja juristi-lingvistit eivät kuitenkaan voineet hyväksyä useasta sanasta koostuvaa ilmaisua, koska se ei sellaisenaan sopisi käännöksen muihin elevation-termin sisältäviin kohtiin ja sen taivuttaminen olisi hankalaa. Kääntäjän, terminologin ja suomalaisten substanssiasiantuntijoiden yhteistyössä päädyttiin käyttämään elevation-termistä kompromissivastinetta korkeussijainti.

Suomenkielisten vastineiden hakuun ja edellä mainitun asetuskäännöksen tarkistamiseen osallistui seitsemän niin sanottua tietotuotetyöryhmää, jotka INSPIRE-verkosto oli muodostanut suomalaisten paikkatietoa omaavien viranomaisten asiantuntijoista. Sanastotyö oli vain yksi pienehkö osa näiden ryhmien työtä. Ryhmien varsinainen tavoite oli tunnistaa suomalaiset tietoaineistot, jotka kuuluvat INSPIRE-direktiivin liitteissä mainittuihin tietotuoteaihepiireihin. Tällaisia olivat esimerkiksi geologia, luonnonriskialueet, energiavarat, rakennukset ja väestöjakauma. Lisäksi ryhmien tavoitteena oli selvittää, miten suomalaiset aineistot vastaavat direktiivin vaatimuksia sekä muodostaa direktiivin vaatimusten mukaisia tietotuotteita.

Sanastotyöllä oli kuitenkin suuri vaikutus asetuksen käännökseen. Asetus sisälsi runsaasti eri erikoisalojen hyvinkin erikoistuneita termejä, joita kääntäjien olisi ollut hankala selvittää ilman asiantuntijoiden apua. Alla olevassa taulukossa on esimerkkejä siitä, miten komission kääntäjät olivat ehdottaneet eräitä englanninkielisiä termejä käännettäviksi ja siitä, miten suomalaiset substanssiasiantuntijat korjasivat näitä ehdotuksia.

Englanninkielinen termi Kääntäjien vastine-ehdotus Suomalaisten asiantuntijoiden
korjaama vastine
biogeographical region biomaantieteellinen alue eliömaantieteellinen alue
geologic feature geologinen piirre geologinen kohde
soil maaperä maannos
runway kiitorata kiitotie
basic igneous material perusmagmamateriaali emäksinen magmamateriaali
bedrock kalliopohja kallioperä

Geoinformatiikan sanaston kolmas laitos

Vuonna 2013 ehdittiin jälleen terminologisen sanastotyön pariin. Geoinformatiikan sanaston toinen laitos sisälsi vuonna 2005 ilmestyneen ensimmäisen laitoksen Paikkatiedon laatu -luvun tiedot lähes muuttamattomina. Paikkatiedon laatuun liittyviin ISO-standardeihin tulleiden muutosten vuoksi alalle oli kuitenkin tullut käsitteiden lisäyksiä, poistumisia ja käsitteiden määritelmien muutoksia.

Sanaston toisessa laitoksessa laatuun liittyviä käsitteitä oli 16 kappaletta; kolmannessa laitoksessa niitä on peräti 50. Sanastoon päätettiin lisätä esimerkiksi käsitteet oikeellisuus, tarkkuus, ajallinen eheys, aikaavastaavuus, ajantasaisuus, käytettävyystekijä, luotettavuus, edustavuus ja homogeenisuus. Käsitteet laatukuvaus, mitattava laatutieto ja kuvaileva laatutieto poistuivat.

Määritelmiä myös korjattiin. Esimerkiksi laatutulos-käsitteen määritelmä kaipasi muutosta, sillä päivitetyn standardin mukaan laatutulos voi olla myös tekstimuotoinen, subjektiiviseen arvioon perustuva kuvaus.

Vuoden 2011 sanasto:

laatutulos
en data quality result
arvo tai arvojoukko, joka saadaan soveltamalla laatumittaria tai vertaamalla arvioituja tuloksia ennalta määrättyyn laatuvaatimustasoon

Raportoitavalla laatutuloksella on tyyppi (esimerkiksi totuusarvo, prosenttiluku tai suhdeluku) ja yksikkö (esimerkiksi metri).

Vuoden 2014 sanasto:

laatutulos
sv datakvalitetsresultat
en data quality result
arvo tai arvojoukko, joka saadaan soveltamalla laatumittaria tai vertaamalla mitattuja tuloksia ennalta määrättyyn laatuvaatimustasoon, tai tekstimuotoinen, subjektiiviseen arvioon perustuva kuvaus laadusta

Raportoitavalla laatutuloksella on tyyppi (esimerkiksi totuusarvo, prosenttiluku tai suhdeluku) ja yksikkö (esimerkiksi metri).

Sanaston kolmannen laitoksen käsitteiden ruotsinkielisten vastineiden hakemiseen saatiin arvokasta apua Ruotsin Lantmäterietista.

Paikkatiedon viitearkkitehtuurikäsitteet

Geoinformatiikan sanaston toisen laitoksen (2011) julkaisemisen jälkeen INSPIRE-direktiivin täytäntöönpano oli edennyt Suomessa vaiheeseen, jossa oli voitu alkaa laatia julkisen hallinnon paikkatiedon viitearkkitehtuuria.

Julkisen hallinnon paikkatiedon viitearkkitehtuuri on kuvaus paikkatiedoista ja niihin liittyvistä teknologioista sekä paikkatietoa käsittelevistä prosesseista ja tietojärjestelmistä, ja se tukee valtiovarainministeriön ohjaamaa kokonaisarkkitehtuurityötä julkisen hallinnon organisaatioissa. Kokonaisarkkitehtuurityö ja paikkatiedon viitearkkitehtuuri tähtäävät tietojärjestelmien yhteentoimivuuteen julkishallinnossa ja laajemmin koko yhteiskunnassa.

Geoinformatiikan sanaston kolmanteen laitokseen piti siis lisätä myös julkisen hallinnon paikkatiedon viitearkkitehtuuriin liittyviä käsitteitä. Lisättyihin käsitteisiin kuuluivat muun muassa karttakuvapalveluiden käsitteet (ks. kaavio 1).

Karttakuvapalveluiden käsitteiden osalta työryhmä saikin tehdä terminluontityötä. Ensiksi päänvaivaa aiheutti englanninkielinen termi tile, joka viittaa karttakuvapalveluissa esiintyvään kuvapalaan. Olisiko se suomeksi esimerkiksi ruutu, tiili tai laatta? Työryhmän pohdintojen mukaan sana ruutu ei ollut selkeä, koska se voi viitata yhtä hyvin ruudun sisäosaan kuin ruudun reunoihinkin. Tiili taas ainakin terminologin mielestä kuulosti kolmiulotteiselta kappaleelta. Laatta olisi saattanut antaa suunnilleen oikean mielikuvan, mutta koska englannista lainattua sanaa tiili oli jo alettu alan asiantuntijoiden kielessä käyttää, päädyttiin siitä hiukan täsmennettyyn vastineeseen karttatiili.

Entä mikä on tile matrix ja mikä on käsitteen suhde karttatiili-käsitteeseen? Onko niin, että tile matrix koostuu karttatiilistä vai onko käsitteillä jokin muu suhde? Mikä termi olisi hyvä kuvaamaan käsitettä suomeksi? Olisiko jakoruudukko sellainen?

Entä käsite tile matrix set, missä suhteessa se on tile matrixiin? Ja jos tile matrix on suomeksi jakoruudukko, sopisiko tile matrix setin olla suomeksi jakoruudukosto?

Tätä käsiteryhmää pohdittiin aluksi pitkään sähköpostitse. Viimein kokouksessa, johon saatiin useita asiantuntijoita yhtä aikaa saman pöydän ääreen, päästiin yhteiseen sopimukseen määritelmistä ja suomenkielisistä termeistä:

karttatiili.jpg

Kaavio 1. Karttakuvapalveluiden käsitteitä

karttakuva
sv kartbild
en map image
ulottuvuudeltaan rajattu kuvallinen esitys paikkatiedosta

karttatiili; tiili
sv kartruta
en map tile; tile
karttakuva, jonka ulottuvuuden määrää karttatiiliruudukko

karttatiiliruudukko; jakoruudukko
sv rutnät n
en tile matrix
alueen säännöllinen jako suorakaiteen muotoisiin osiin

Karttatiiliruudukon määrittävät käytettävä koordinaattijärjestelmä, ruudukon origo ja ulottuvuus sekä ruudun koko käytettävässä koordinaattijärjestelmässä.

karttatiilimalli; ~ kuvapyramidi
sv rutnätsuppsättning; rutnätssortiment n
en tile matrix set
joukko samaa aluetta kattavia karttatiiliruudukoita, jotka vastaavat eri mittakaavatasoja

Datalla täytettyä karttatiilimallia kutsutaan kuvapyramidiksi.

Kaikkiaan Geoinformatiikan sanaston kolmanteen laitokseen lisättiin noin 60 uutta käsitettä toiseen laitokseen verrattuna, eli tuoreimmassa laitoksessa käsitteitä on yhteensä 275.

Sanaston kolmatta laitosta työstäneeseen työryhmään kuului asiantuntijoita Sanastokeskuksen ja Maanmittauslaitoksen lisäksi muun muassa Geodeettisesta laitoksesta ja Luonnontieteellisestä keskusmuseosta. Sanastotyön rahoitti Maanmittauslaitos.

Geoinformatiikan sanaston kolmas laitos (TSK 45) julkaistiin huhtikuussa 2014 Sanastokeskus TSK:n verkkosivuilla PDF-muodossa, ja samalla sen sisältö vietiin myös Sanastokeskus TSK:n TEPA-termipankkiin.

Jatkosuunnitelmia

Paikkatiedon termit ja ontologiat -työryhmän työ jatkuu edelleen. Kesän ja syksyn 2014 aikana Paikkatieto-ontologiaa täydennetään Geoinformatiikan sanaston kolmannen laitoksen käsitteillä ja ontologia julkaistaan Kansalliskirjaston ylläpitämässä Finto-ontologiapalvelussa.

Jatkossakin komissiosta saattaa silloin tällöin tulla terminologille pyyntö, että suomalaiset asiantuntijat auttaisivat INSPIRE-direktiivin täytäntöönpanoon liittyvissä termipulmissa. Syksyllä 2013 komissiosta otettiin yhteyttä, kun käyttöliittymään tarvittiin sopiva suomenkielinen käännös englanninkieliselle items per page -ilmaukselle. Suomalaiset asiantuntijat totesivat, että kyseinen ilmaus kääntyisi osuvimmin tietokohteita sivulla.

Maanmittauslaitos ja Sanastokeskus ovat myös sopineet, että Sanastokeskus osallistuu vuoden 2014 lopulla käsitemäärittely- ja termityöhön, jota tehdään Paikkatiedon yksilöivät tunnisteet -julkisen hallinnon suosituksen (JHS) valmistelun yhteydessä. Geoinformatiikan sanastosta julkaistaan seuraava, täydennetty laitos mahdollisesti vuoden 2014 aikana tai vuoden 2015 puolella, kun toisessa työryhmässä kesken oleva geodesian käsitteiden sanastotyö saadaan valmiiksi.