Päivi Kouki
Ontologioissa kuvataan käsitteitä ja käsitteiden välisiä suhteita sekä ihmisen että koneen tulkittavissa olevassa muodossa. Tyypillisesti ontologiat on tarkoitettu hyödynnettäviksi aineistojen sisällönkuvailussa ja tiedonhaussa. Suomessa Kansalliskirjasto ylläpitää Yleistä suomalaista ontologiaa (YSO) ja tarjoaa Finto-ontologiapalvelussa julkaisualustan esimerkiksi YSOn hierarkiarakenteen pohjalle laadituille erikoisalan ontologioille, jotka keskittyvät tietyn alan käsitteistöön ja sopivat erityisesti kyseisen alan aineistojen kuvailuun.
Yhdistetty Museoalan ja taideteollisuusalan ontologia (MAO/TAO) on erikoisontologia, jonka ylläpitämisestä vastaa nykyään Museovirasto. Museovirasto ja Sanastokeskus ovat kehittäneet etenkin Museoalan ontologian osuutta useissa eri projekteissa vuosien 2015–2020 aikana. Näissä kehitysprojekteissa on ensisijaisesti laajennettu ontologian käsitevalikoimaa, mutta samalla on tehty myös muita tarpeellisia muutoksia, kuten päivitetty MAO/TAOn rakenne vastaamaan Yleisen suomalaisen ontologian (YSO) viimeisimmän ajallisesti jäädytetyn version rakennetta.
Viimeisin Museoviraston ja Sanastokeskuksen yhteisistä ontologiaprojekteista käynnistyi alkuvuodesta 2019 ja keskittyy arkeologiseen esineistöön liittyviin käsitteisiin. Alkusysäyksen ontologiatyön aloittamiselle antoi Suomen arkeologisten löytöjen linkitetty avoin tietokanta (SuALT) -hanke: hankkeessa kehitetään metallinetsijöille ja muille arkeologian harrastajille suunnattua Löytösampo-verkkopalvelua, ja MAO-ontologian toivottiin sopivan Löytösammon käyttöön. Arkeologisiin esineisiin liittyville käsitteille on toki tarvetta myös Museoviraston sisäisessä käytössä, ja meneillään oleva ontologiatyö onkin laajentanut MAOn käsitevalikoimaa erityisesti esihistoriallisen ajan esineistön osalta.
Yhteistyöllä laadukasta sisältöä
Sanastokeskuksen asiakkaidensa kanssa toteuttamiin ontologiaprojekteihin osallistuu yleensä yksi terminologi ja asiakkaan valitsemat erikoisalan asiantuntijat. Tyypillisesti ontologiaprojektin alkaessa asiakas on valinnut yhden tai useamman aineiston, esimerkiksi asiasanaluettelon, joiden sisältämä käsitteistö halutaan lisätä ontologiaan. Terminologi käsittelee ensin aineistoa itsenäisesti: uudet käsitteet viedään ensin koneellisesti osaksi ontologiatiedostoa, jonka jälkeen terminologi käy käsitteet yksitellen läpi ja etsii niille sopivan yläkäsitteen – siis sopivan paikan ontologian hierarkiassa. Terminologinen asiantuntemus ja terminologin tiedonhakutaidot eivät kuitenkaan yksin riitä, kun käsiteltävänä on erikoisalaan liittyviä käsitteitä. Siksi Sanastokeskuksessa ontologiaprojektit toteutetaankin aina yhteistyössä kohdealan asiantuntijoiden kanssa.
Ontologiaprojektia varten kootaan tyypillisesti ontologian kohdealan asiantuntijoista työryhmä, joka työskentelee yhdessä terminologin kanssa. Terminologin ohjaamissa työpajoissa tarkistetaan uusien käsitteiden sijainti ontologiahierarkiassa ja keskustellaan mahdollisista muista lisättävistä tai poistettavista käsitteistä. Lisäksi asiantuntijat sopivat yhdessä esimerkiksi siitä, mitä termejä ontologiassa käytetään sellaisista käsitteistä, joihin on totuttu viittaamaan useammalla kuin yhdellä termillä. Vaikka työryhmätyöskentely vie aikaa, se on keskeinen osa ontologiaprojektia. Työpajoissa käyty keskustelu ja asiantuntijoiden yhdessä tekemät päätökset auttavat varmistamaan, että ontologiaan tuotetaan laadukasta sisältöä, joka vastaa asiakkaan ja muiden ontologian käyttäjien tarpeita.
Hyvin suunniteltu työ on mielekästä
Arkeologisen esineistön ontologiaprojektissa MAOon lisätään sekä esihistoriallisiin että historiallisiin esineisiin liittyviä käsitteitä. Koska käsiteltävänä on suuria määriä monen eri aikakauden käsitteitä, Museovirasto on suunnitellut työn toteutettavaksi useampana osaprojektina: vuonna 2019 toteutettiin kivi- ja rautakauden osaprojektit, ja keväällä 2020 oli historiallisen ajan ontologiatyön vuoro. Jokaisella osaprojektilla on oma työryhmänsä, joista kuhunkin on osallistunut asiantuntijoita sekä viraston sisältä että sen ulkopuolelta. Varsin laajan käsitevalikoiman vuoksi osaprojektit ovat olleet toimiva tapa edistää työtä. Kun kukin asiantuntija osallistuu nimenomaan oman erikoisalansa käsitteiden käsittelyyn, työpajoihin osallistuminen on asiantuntijoille mielekästä ja niissä pystytään edistämään työtä tehokkaasti. Näin myös säästetään kaikkien työhön osallistuvien aikaa, ja osaprojektit ovatkin enimmäkseen valmistuneet etuajassa.
Osaprojektien sujuva toteuttaminen on ollut mahdollista, koska Museovirastossa ontologiaprojektia koordinoidaan onnistuneesti. Projektin koordinaattori suunnittelee työn eri vaiheita, kokoaa työryhmät ja osallistuu työpajoihin sekä pitää jatkuvasti huolta siitä, että projekti etenee sen tavoitteiden mukaisesti. Tämä onkin ensisijaisen tärkeää työn sujumisen kannalta.
Työryhmätyöskentelyn lisäksi ontologiaprojektissa on ollut tarvetta myös yksittäisten asiantuntijoiden konsultoimiseen. Näin on tehty niissä tapauksissa, kun jokin tietty esineryhmä vaatii lähempää tarkastelua ja juuri kyseiseen esineistöön perehtyneen asiantuntijan apua. Tällaisia ryhmiä ovat esimerkiksi rahat sekä aseet ja aseiden osat. Tarkkaan rajatusta aihealueesta huolimatta asiantuntija ja terminologi saattavat käydä läpi varsin suuren määrän käsitteitä: esimerkiksi metallirahoihin liittyviä käsitteitä ontologiaan on lisätty yhteensä noin 280 kappaletta!
Kuinka käsitteet valitaan
MAO-ontologiaan on meneillään olevan projektin aikana lisätty tähän mennessä noin 1 400 käsitettä. Uusia käsitteitä on koottu varsin monista lähteistä: Museoviraston oman luettelointitietokannan lisäksi käytössä on ollut esimerkiksi Helsingin yliopiston opetusmateriaalia sekä museoiden, kuten Helsingin ja Vantaan kaupunginmuseoiden sekä Aboa Vetuksen, tietokantoja. Myös ontologiatyöhön osallistuneet asiantuntijat ovat luonnollisesti saaneet vaikuttaa käsitevalikoimaan, ja he ovatkin ehdottaneet runsaasti lisäyksiä. Uusien käsitteiden lisäksi työn aikana on myös tarkistettu ontologiasta jo ennestään löytyviä arkeologiseen esineistöön liittyviä käsitteitä.
Kunkin aikakauden tyypilliset esinelöydöt ovat vaikuttaneet siihen, millaisia käsitteitä on katsottu tarpeelliseksi lisätä ontologiaan. Kivikauden työryhmässä käsiteltiin etenkin erilaisiin työkaluihin liittyviä käsitteitä, kuten erityyppisiä kivikirveitä ja -veitsiä. Rautakauden esineistöä lähestyttiin erityisesti metallinetsinlöytöjen näkökulmasta, ja siksi ontologiaan haluttiin lisätä ensisijaisesti metalliesineitä: erilaisia koruja, aseita ja aseiden osia kuten nuolen- ja keihäänkärkiä. Historiallisen ajan työryhmä puolestaan laajensi ontologiaa varsinkin astioihin liittyvillä käsitteillä, koska niissä ontologiassa oli suurimpia puutteita.
Työryhmät ovat käyneet ontologiaprojektin aikana läpi suuren määrän käsitteitä ja punninneet, mitkä käsitteistä ovat tarpeen ontologiassa. Tästä huolimatta on vaikea arvioida, onko ontologiaan tosiaan osattu lisätä kaikki keskeiset käsitteet. Lopullisesti tämä selvinneekin vasta, kun uudistettu ontologia julkaistaan ja sitä aletaan käyttää aineiston kuvailussa. Siksi ontologian kehittämisen pitäisikin jatkua, vaikka laajennusprojekti päättyy. Olisi tärkeää, että ontologian käyttäjiltä kerättäisiin palautetta mahdollisista puutteista ja että ontologiaa voitaisiin edelleen kehittää tämän palautteen perusteella.
Ontologiatyö haastaa tekijänsä
Ontologiatyö on poikkeuksetta haastavaa sekä työhön osallistuvalle terminologille että kohdealan asiantuntijoille. Terminologille vieraan erikoisalan käsitteisiin syventyminen on aina vaativaa, ja MAO-ontologian tapauksessa lisähaasteena on se, että ontologia on erikoisontologiaksi varsin laaja ja sitä on kehitetty useassa eri vaiheessa. Vaikka periaatteet ontologian laatimiseen ovatkin projektista riippumatta samat, eri toimijoiden toteuttamissa projekteissa tulee esiin erilaisia tarpeita ja näkökulmia. Terminologin tehtävä on pohtia, kuinka ontologia pysyisi sisäisesti johdonmukaisena ja kuitenkin vastaisi kussakin projektissa esiin tuleviin tarpeisiin.
Vaikka arkeologisen esineistön ontologiaprojektissa kaikki työryhmät käsittelevät esinelöytöihin liittyviä käsitteitä, on eri työryhmissä silti ollut erilaisia käsityksiä siitä, mikä olisi paras tapa esittää tietoa ontologiassa. Keskustelua on syntynyt esimerkiksi siitä, ryhmitelläänkö jokin esineiden ryhmä ensisijaisesti esineen valmistusmateriaalin vai jonkin muun piirteen mukaan, ja onko muidenkin esineiden kohdalla tarpeen tai edes mahdollista noudattaa samaa periaatetta. Terminologin näkökulmasta toistaiseksi haastavin esineryhmä on ollut rahat, joiden ryhmittely aiheutti päänvaivaa: pitäisikö liki 300 erilaista rahaa ryhmitellä ensisijaisesti materiaalin mukaan kulta-, hopea- ja kuparirahoihin? Vai olisiko parempi ryhmitellä rahat niiden käyttöajankohdan mukaan? Lisähaasteita aiheutti se, että joitakin nimityksiä – esimerkiksi dukaatti ja penninki – on käytetty useista erilaisista rahoista, osin eri aikoihin ja osin samanaikaisesti. Kuinka nämä käsitteet pitäisi nimetä ontologiassa, jotta ne olisi mahdollista erottaa toisistaan? Kaikeksi onneksi ontologisointiin saatiin apua rahoihin perehtyneeltä asiantuntijalta, ja lopulta kaikki käsitteet löysivät oman paikkansa.
Asiantuntijoilta käsitteiden välisiin hierarkkisiin suhteisiin perustuva ontologiatyö vaatii puolestaan tuttujen käsitteiden uudenlaista tarkastelua. Ihmisille on luontevaa yhdistellä käsitteitä myös muiden kuin hierarkkisten suhteiden perusteella, ja tämä näkyy myös monista ontologiatyön pohjana käytetyistä sanalistoista. Siksi ontologiatyön tapa tarkastella käsitteitä nimenomaan niiden hierarkkisten yläkäsitteiden kautta voi joskus tuntua hankalalta ja jopa nurinkuriselta. Hyvä esimerkki tällaisesta tapauksesta on astioihin liittyvät käsitteet, joiden sijoittaminen ontologiaan aiheutti melkoista päänvaivaa historiallisen ajan esineitä käsitelleelle työryhmälle ja terminologille. Astialöytöjen kuvailuun tarvitaan monia eri tyyppisiä käsitteitä: paitsi erilaisia astiatyyppejä, kuten erityyppisiä pulloja ja pikareita, myös käsitteitä, jotka liittyvät astioiden yksityiskohtiin, valmistusmateriaaliin tai koristeluun. Nämä käsitteet yhdistyvät ihmismielessä kokonaisuudeksi: pikari on valmistettu lasista, se koostuu erilaisista osista kuten sääri ja jalkalevy ja siinä on maalatut koristeet. Ontologiassa samat käsitteet sijoittuvat kuitenkin kaikki eri hierarkioihin: pikarit ovat astioita, sääri ja jalkalevy ovat eräänlaisia (astian) osia ja lasi on ainetta. Erilaisten koristeiden sijaan ontologiaan päädyttiin lopulta pitkän pohdinnan jälkeen lisäämään koristelumenetelmiä kuten koristemaalaus.
Ontologia tiedonhallinnan tukena
Ontologian käyttäminen aineiston kuvailussa helpottaa sekä kuvailijan työtä että aineiston löydettävyyttä. Perinteinenkin asiasanaluettelo toki ohjaa kuvailua, mutta ontologiaa käyttävä sovellus voi antaa tietoa käsitteiden välisistä suhteista ja auttaa kuvailijaa löytämään sopivan käsitteen niiden avulla. Ontologia asettaa kuvailulle tietyt raamit, mikä johtaa ajan mittaan yhtenäisemmin kuvailtuun aineistoon. Mitä yhtenäisemmin aineisto on kuvailtu, sitä helpompi se taas on löytää koneellisten hakujen avulla. Sen sijaan jos kuvailulle ei ole ollut selkeitä suuntaviivoja, osa aineistosta voi jäädä hakujen ulkopuolelle – ja ainakin tiedon hakija joutuu käyttämään aikaa sen arvailuun, millaisilla eri hakusanoilla hänen tulisi hakemaansa aineistoa etsiä.
Hyvä esimerkki kuvailun yhtenäistämisen tarpeesta on tietyntyyppiset rautakautiset soljet. Tällaisia solkia on voitu kuvailla esimerkiksi sanoilla soljet, pronssisoljet, kupurasoljet, soikeat kupurasoljet, soikeat pronssisoljet, A-tyypin soljet, Ailion A-tyypin soljet, nastakoristeiset soljet ja niin edelleen. MAO-ontologiassa tähän solkityyppiin päädyttiin lopulta viittamaan ensisijaisesti termillä A-tyypin soikeat kupurasoljet ja lisäksi synonyymilla nastakoristeiset soikeat kupurasoljet.
Arkeologisen esineistön ontologiaprojektin vuonna 2019 valmistunut osuus (kivi- ja rautakausien osaprojektien työ) julkaistiin Finto-palvelussa joulukuussa 2019. Työ on vielä kesken muutamien tarkistusten osalta, jotka valmistuvat vuoden 2021 alkupuoliskolla. Projektissa lisätyt uudet käsitteet tulevat olemaan kaikkien käytettävissä Finton tarjoamien rajapintojen sekä aikanaan myös Finton eri ontologioita kokoavan KOKO-ontologian kautta. Tällä hetkellä MAO-ontologian käsitteitä hyödynnetään jo Museovirastossa kokoelmanhallintajärjestelmässä, jossa käsitteitä voi valita tiettyihin kenttiin. Ontologian laajempaa käyttöä esineistön kuvailussa esimerkiksi esinenimien kohdalla vasta selvitetään. Joka tapauksessa nimenomaan arkeologisen esineistön kuvailun lähtökohdista tehty MAO-ontologian päivitys tulee tarjoamaan mahdollisuuksia Museoviraston kokoelmanhallinnan tehostamiseen. Tulevaisuudessa Museoviraston tavoitteena onkin ottaa ontologia huomioon kaikessa järjestelmäkehityksessä. Ontologian hyödyntäminen eri järjestelmissä tarkoittaisi myös nykyistä parempaa yhteentoimivuutta erilaisten järjestelmien välillä, millä on puolestaan positiivisia vaikutuksia tiedon hallintaan ja saavutettavuuteen.
Tätä tekstiä varten on haastateltu Museoviraston yli-intendentti Jutta Kuitusta, joka koordinoi arkeologisen esineistön käsitteiden parissa tehtävää ontologiatyötä.
Kirjoittajasta:
Päivi Kouki on Sanastokeskuksen terminologi, joka on osallistunut Museoviraston ontologiaprojekteihin vuodesta 2016 lähtien.
Lisää uusi kommentti