ONKI-projekti luo kansallista ontologiapalvelua

Matias Frosterus

Ontologia on koneymmärrettävä, hierarkkinen käsitteistö. Koneymmärrettävyys ja termeistä käsitteisiin siirtyminen vaatii, että käsitteisiin voidaan viitata yksilöivällä tunnisteella. Tästä syntyy sekä haasteita että mahdollisuuksia kuvailun tekniselle toteutukselle. Kun aiemmin metatietoihin talletettiin yksinkertaisesti kuvailussa käytetyt termit, niihin voidaan nyt tallettaa käsitteitä vastaavat tunnisteet. Tällöin esimerkiksi tietystä käsitteestä käytetyn termin muuttuessa tunniste pysyy samana eikä aiheuta muutospaineita käsitettä käyttäviin kuvailuihin. Toisaalta tunnisteet eivät ole ihmisluettavia, vaan ne pitää aina loppukäyttäjälle esitettäessä tulkita hakemalla ontologiasta tunnistetta vastaavan käsitteen nimi.

Ontologiapalvelun tavoitteena on tarjota rajapinnat, joiden avulla tunnisteiden kanssa toimiminen sekä niiden tallentaminen ja käsittely olisi mahdollisimman helppoa. Ontologioiden kehittäjät voivat julkaista omat ontologiansa palveluun muiden saataville ja päivittää niitä, annotoijat eli aineistojen kuvailijat voivat käyttää ontologisia käsitteitä sisällönkuvailussa palvelun kautta ja sovelluskehittäjät voivat kytkeytyä palveluun sen rajapintojen kautta ja hyödyntää annotoijien tuottamaa metadataa omissa sovelluksissaan, joita varsinaiset loppukäyttäjät sitten vuorostaan hyödyntävät.

ONKI-projekti

ONKI-projektin tavoitteena on luoda pysyvä, keskitetty, Kansalliskirjaston ylläpitämä luotettava kansallinen ontologiapalvelu, jonka avulla muut toimijat voivat luoda omia sovelluksiaan. Keskitetyn palvelun etuna on, että palvelussa julkaistut ontologiat löytyvät samasta paikasta ja että niihin pääsee käsiksi samoilla rajapinnoilla, jolloin useiden ontologioiden käyttäminen samassa sovelluksessa on helppoa.

ONKI-projekti perustuu Aalto-yliopistossa ja Helsingin yliopistossa vuosina 2003–2012 toimineen FinnONTO-tutkimushankkeen saavutuksiin ja siellä luotuun ONKI-teknologiaan. Nyt tutkimushankkeesta ollaan siirtymässä tuotantokäyttöön, jolloin esimerkiksi palvelun nopeus ja luotettavuus ovat ensiarvoisen tärkeitä. Tuotantokäyttöön siirtyminen tarkoittaa myös muutoksia toimintatavoissa ja tavoitelluissa lopputuloksissa.

Ensimmäisen vuoden aikana luodaan vankka pohja ja ymmärrys

Projektin ensimmäisen vuoden tavoitteena on ollut luoda kestävä pohja jatkokehitykselle sekä toteuttaa keskeisimmät ontologiapalvelun toiminnallisuudet uuteen tekniikkaan perustuvalla ONKI Light -ohjelmistolla. Palvelu on tarkoitus julkaista vuoden vaihteessa, jolloin myös vanhojen ONKI-käyttäjien liikenne siirtyy Kansalliskirjaston palvelimille.

Ohjelmistopuolella kehittäminen perustuu avoimeen lähdekoodiin ja tapahtuu Google Codessa (https://code.google.com/p/onki-light/), jossa kuka tahansa voi seurata kehitystyötä tai vaikkapa halutessaan asentaa ONKIn omalle palvelimelleen. Uutta selailukäyttöliittymää on myös alettu testata käyttäjillä eli aineistojen kuvailijoilla ja ontologioiden kehittäjillä. Ensimmäisen testikierroksen tulokset saatiin loppusyksystä ja nyt käyttöliittymää kehitetään edelleen tulosten perusteella. Testauksen on tarkoitus olla jatkuvaa, eli testikierros käyttäjien parissa uusitaan uusien versioiden ilmestyessä.

Myös sisällön suhteen projekti on jalkautunut käyttäjien keskuuteen ja toteuttanut laajan haastattelurupeaman, jossa on kartoitettu ontologioiden nykykäyttöä ja sitä, mitä niiltä toivotaan tulevaisuudessa. Haastattelukierros on nyt saatu päätökseen ja havainnoista kirjoitetaan parhaillaan raporttia, joka on tarkoitus julkaista vielä tämän vuoden puolella.

Päivitystyön ohella Yleisen suomalaisen ontologian eli YSOn kehittämiselle on alettu kirjaamaan periaatteita ja käytäntöjä, ja tavoitteena on muodostaa selkeä dokumentaatio jatkoa varten. YSO perustuu YSAan eli Yleiseen suomalaiseen asiasanastoon. YSAssa käyttöön otettujen uusien asiasanojen ontologisoinnin lisäksi YSOon ollaan toteuttamassa ylärakenteen uudistusta, jossa pyritään selkiyttämään ylimpiä tasoja ja tuomaan niitä lähemmäs DOLCE-mallia1. Lisäksi YSOn englannin käännös tarkistetaan ja täydennetään ja siltaus kansainvälisiin ontologioihin aloitetaan.

Jatkossa tiivistyvää yhteistyötä

Kun ontologiapalvelu on julkaistu ja toiminnassa, on yleisen kehittämisen lisäksi keskeisessä asemassa ontologioiden yhteiskäytön mahdollistaminen. Projektin aikana luodaan pohja ontologiatyön koordinoinnille eri organisaatioiden välillä sekä kehitetään työkaluja, joita ontologioiden yhteiskäytössä tarvitaan.

Rakenneuudistus, dokumentointi, käännöstyö ja siltaus tehdään YSOn osalta valmiiksi, minkä jälkeen on tarkoitus lähteä tutkimaan mahdollisuuksia assosiatiivisten suhteiden lisäämiseen käsitteiden välille. YSOn rooli erikoisalojen ontologioiden solmukohtana korostuu, ja eräs keskeisimmistä kehityskohteista onkin YSOn ja siihen liitetyt erikoisontologiat yhdistävän KOKO-ontologian luomiseen ja ylläpitämiseen liittyvät työkalut ja prosessit.

1Lisätietoa DOLCE-mallista: Aldo Gangemi, Nicola Guarino, Claudio Masolo, Alessandro Oltramari & Luc Schneider: Sweetening Ontologies with DOLCE. Saatavilla PDF-tiedostona osoitteessa http://www.loa.istc.cnr.it/Papers/DOLCE-EKAW.pdf.Kirjoittajasta:
DI Matias Frosterus työskentelee Kansalliskirjaston ONKI-projektin projektipäällikkönä. Hän valmistelee väitöskirjaa perinteisten järjestelmien rikastamisesta semanttisen webin teknologioilla.