Tieteen termipankki viisi vuotta: Crossing Borders -konferenssin satoa

Päivi Kouki

Tieteen kansallinen termipankki on infrastruktuurihanke, joka käynnistyi Helsingin yliopiston suomen kielen oppiaineessa alkuvuodesta 2011. Hankkeessa on rakennettu semanttiselle MediaWiki-alustalle kaikkien Suomessa harjoitettavien tieteenalojen yhteinen termipankki. Termipankkia kehitettiin aluksi pilottihankkeilla, joissa kartoitettiin kolmen eri tieteenalan – kasvitieteen, kielitieteen ja oikeustieteen – termistöä ja koottiin sitä termipankkiin yhdessä tieteenalojen asiantuntijoista koottujen työryhmien kanssa. Hankkeen edistyessä termipankkiin on lisätty uusia tieteenaloja, ja tällä hetkellä Tieteen termipankki sisältää suomenkielisiä termitietueita yhteensä 29 alalta. Lisäksi termipankissa on kaksi ruotsinkielistä aihepiiriä sekä englannin- ja romaninkieliset aihepiirit.

Vuodenvaihteessa Tieteen termipankki täyttää viisi vuotta, minkä juhlistamiseksi järjestettiin 29.–30. lokakuuta Crossing Borders -konferenssi. Kaksipäiväinen tapahtuma pidettiin Helsingin yliopiston tiloissa, ja konferenssissa kuultiin sekä Tieteen termipankkiin liittyviä että termipankkeja ja sanastotyötä yleisemmin sivuavia esityksiä. Lisäksi molempina päivinä järjestettiin posterisessio. Konferenssin kutsuttuina puhujina olivat Henrik Nilsson Ruotsin Terminologicentralen TNC:stä, Marita Kristiansen Norjan kauppakorkeakoulusta (Norwegian School of Economics, NHH) ja Rita Temmerman Terminologian ja viestinnän tutkimuskeskuksesta (Centrum voor Vaktaal en Communicatie, CVC) Brysselin Erasmuskorkeakoulusta.

Termipankkikokemuksia muista maista

Henrik Nilsson vertaili Tieteen termipankkia ja ruotsalaista kansallista termipankkia Rikstermbankenia. Siinä, missä Tieteen termipankki on rakennettu helposti muokattavalle semanttiselle MediaWiki-alustalle ja sen sisällön laatimiseen voi periaatteessa osallistua kuka tahansa asiantuntija, Rikstermbankenin sisältö on aina rajattujen asiantuntijaryhmien tuottamaa ja sisällön julkaisemista ja päivittämistä kontrolloidaan tarkemmin. Nilsson pohti erilaisten lähestymistapojen etuja ja haittoja. Tieteen termipankin rakentamisessa käytetty asiantuntijoiden kohdennettu joukkoistaminen (niche-sourcing) mahdollistaa laajemman näkökulman kuin perinteisessä sanastotyössä käytetyt, usein varsin pienet asiantuntijaryhmät. Lisäksi MediaWiki-alusta sallii nopeammat muutokset termipankkiin kuin perinteisemmällä alustalla tarjottava Rikstermbanken. Nilsson huomautti kuitenkin, että suuri osanottajajoukko voi vaikuttaa yhteisen mielipiteen löytämisessä ja termitietueiden muuttuva luonne voi joillekin käyttäjille näyttäytyä epäluotettavuutena.

Norjassa vastuu erikoiskielten kehittämisestä on korkeakouluilla, ja NHH kehittää termitietokanta Termportalenia. Termportaleniin on kerätty sisältöä eri lähteistä ja sieltä löytyvät myös ohjeet niille, jotka haluaisivat aloittaa sanastotyön omalla alallaan. Tarkoitus on, että Termportalenista tulisi liike- ja talouselämän termien kansallinen termitietokanta. Marita Kristiansen kertoi Termportalenista sekä tekemästään tutkimuksesta, jossa hän tutkii sitä, kuinka norjan kieleen tulee uusia liike- ja talouselämän termejä. Tutkimustulosten perusteella Kristiansen pitää erikoiskielen korpuksia/tekstikokoelmia hyvänä mittarina sille, mitä alan termejä voi pitää suositettavina. Hän uskoo, että Termportalenin ja Tieteen termipankin kaltaiset kaikkien saatavilla olevat alustat tarjoavat mahdollisuuden saada suositettavat termit laajaan käyttöön.

Tieteen termipankista monesta näkökulmasta

Konferenssissa kuultiin myös monia esityksiä, jotka liittyivät suoraan Tieteen termipankkiin. Professori Tiina Onikki-Rantajääskö Helsingin yliopistosta johtaa Tieteen termipankki -hanketta. Hän kertoi termipankin kehittämisestä ja erityisesti kohdennetun joukkoistamisen käytöstä hankkeessa. Eri tieteenalojen asiantuntijoille suunnatun joukkoistamisen avulla on laadittu noin 20 prosenttia termipankin tämänhetkisestä sisällöstä. Tulevaisuudessa tätä toimintatapaa on tarkoitus hyödyntää enemmän ja myös kansainvälisesti, sillä termipankin laajentaminen monikieliseksi on tärkeä tulevaisuuden kehittämiskohde.

Myös tutkijatohtori Kaarina Pitkänen-Heikkilä on toiminut Tieteen termipankki -hankkeessa alusta lähtien. Hän kertoi hankkeessa tehdystä sanastotyöstä ja esitteli semanttisen MediaWiki-alustan käyttöä työssä. Esimerkkinä Pitkänen-Heikkilä käytti kasvitieteen käsitteistöä, jonka kokoaminen oli yksi pilottihankkeista. Hän otti Nilssonin tapaan kantaa alustan hyviin ja huonoihin puoliin. Hyvinä puolina hän toi esiin joustavuuden lisäksi myös työn läpinäkyvyyden sekä termitietueiden hyvän hakukonelöydettävyyden, mutta huomautti, että muokattavuuden kääntöpuoli on se, etteivät tietueet periaatteessa saa koskaan lopullista muotoa.

Kasvitieteen termipankin lisäksi saimme kuulla myös toisesta Tieteen termipankin pilottihankkeesta, kun oikeuslingvistiikan emeritusprofessori Heikki E. S. Mattila kertoi oikeustieteen käsitteistön kokoamisesta Oikeustieteen termipankin pohjana on käytetty 1990-luvulla laadittua laajaa oikeustietosanakirjaa, Encyclopaedia Iuridica Fennicaa (EIF). Sanakirjassa annetut tiedot on sisällytetty myös termipankkiin, joten oikeustieteen termipankin sisältö eroaa muodoltaan muiden tieteenalojen käsitteistöistä. EIF sisältää noin 2 700 sanakirja-artikkelia, joista pilottihankkeen aikana 1 685 lisättiin Tieteen termipankkiin. Loput artikkelit tullaan lisäämään nekin lisäämään osaksi termipankkia.

Tohtorikoulutettava Antti Kanner Helsingin yliopistosta esitteli semanttista MediaWiki-alustaa (SMW) sekä Niklas Laxströmin kanssa tekemäänsä SMW:n kehitystyötä monikielistä termipankkia varten. SMW:n rakenne mahdollistaa tietojen järjestämisen ja selaamisen useilla eri tavoilla niin, että wikin käyttäjien on entistä helpompi löytää tietoa ja hyödyntää toisten tuottamaa tietoa omissa teksteissään. SMW sallii myös kaiken toisesta lähteestä saatavan terminologisen tai leksikografisen tiedon tallentamisen, sillä siinä ei ole ennalta määrättyjä ominaisuuksia, jotka rajoittaisivat sitä, mitä tietoja sivulla pystytään esittämään. Tulevaisuuden monikielistä Tieteen termipankkia varten Kanner ja Laxström ovat kehittäneet monikielistä semanttista MediaWiki-kehystä, joka tukee sisällön lisäämistä ja esittämistä useilla eri kielillä.

Konferenssin ohjelma kokonaisuudessaan on nähtävissä Crossing Borders -konferenssisivulla. Suurin osa konferenssin esityksistä on myös katsottavina sivuston kautta joko esityksen nimeä tai ”View recording” -linkkiä napsauttamalla.

Lisää aiheesta: Kaarina Pitkänen-Heikkilä kirjoitti Tieteen termipankista Terminfossa 1/2012.