Nordterm 2013: valmistelusta hallinnointiin – sanastotyö vaihe vaiheelta

Päivi Kouki & Sirpa Suhonen

Pohjoismainen terminologisen työn sekä terminologian koulutuksen tai tutkimuksen parissa toimivien organisaatioiden yhteistyöelin Nordterm järjestää joka toinen vuosi Nordterm-päivät. Tänä vuonna tapahtuma järjestettiin jo 21. kerran.

Nordterm-päivistä vastasi tällä kertaa ruotsalainen Terminologicentrum TNC, ja tapahtuma järjestettiin Tukholmassa aivan juhannuksen kynnyksellä 13.–17.6. Nordterm-päivien ohjelmaan kuului tuttuun tapaan kurssi, kaksipäiväinen seminaari, Nordterm-organisaation yleiskokous sekä Nordtermin johtoryhmän ja työryhmien kokoukset. Ensimmäisen seminaaripäivän iltana tiistaina osanottajilla oli lisäksi tilaisuus osallistua saaristoristeilylle.

Seminaariin osallistui noin 80 osanottajaa, joista suurin osa tuli eri Pohjoismaista. Suomalaisia tapahtumaan osallistui noin 20, Sanastokeskus TSK:n lisäksi muun muassa Helsingin ja Vaasan yliopistoista.

Kurssi tietomalleista terminologeille

Ennen Nordterm-seminaaria järjestettiin terminologeille suunnattu päivän kurssi tietomallinnuksesta ”Kursus i datamodellering for terminologer”. Kurssin vetäjänä toimi apulaisprofessori Hanne Erdman Thomsen DANTERMcentretistä. Kurssilla käytiin läpi mm. erilaisia tietomalleja ja vertailtiin terminologisia käsitejärjestelmiä tietomalleihin. Vertailussa tarkasteltiin esimerkiksi sitä, mitkä terminologian ja tietomallinnuksen käsitteet vastaavat toisiaan. UML-tietomallissa esimerkiksi luokka vastaa käsitettä, luokan nimi termiä, attribuutti käsitepiirrettä ja assosiaatio käsitesuhdetta. Kaikilla tietomallien käsitteillä ei kuitenkaan ole vastaava käsitettä terminologiassa. Tällainen käsite on esimerkiksi tietomalleissa esiintyvä lukumäärä. Sanastotyössä ei yleensä ole tarvetta kertoa, että käsitteitä voi olla monta, kun taas tietomallissa tieto voi olla tärkeä, esimerkiksi se että henkilöllä voi olla useita puhelinnumeroita.

Erdman Thomsen oli valinnut kurssin ryhmätöiksi erilaisia havainnollisia harjoituksia . Harjoitusten aiheena oli videovuokraus. Ensimmäiseksi erilaisista videoihin liittyvistä käsitteistä, kuten videokasetista, videon nimestä, videotyypeistä (esimerkiksi toiminta-, kauhu- ja draamavideo), videon vuokrasta, videovuokraamoista jne., tehtiin pienryhmissä terminologeille tuttu käsitejärjestelmäkaavio. Sen jälkeen käsitekaaviot käytiin yhdessä läpi, ja ne olivatkin lähes samanlaisia keskenään.

Käsitejärjestelmäkaavion piirtämisen jälkeen samasta aiheesta tehtiin UML-muotoinen tietomalli. Se olikin jo haastavampaa terminologeille, vaikka tietomalleja oli juuri käyty läpi kurssilla. Tämä oli tietysti odotettavaa, sillä eihän yhdellä kurssilla voi tulla tietomallinnuksen asiantuntijaksi. Eri ryhmien tekemät tietomallit poikkesivatkin toisistaan huomattavasti enemmän kuin käsitekaaviot.

Konkreettiset harjoitukset olivat kurssin parasta antia, sillä niissä huomasi selvimmin, miten terminologinen sanastotyö ja tietomallinnus kuvaavat samaa reaalimaailman tilannetta. Molemmat ovat loogisia ja systemaattisia ajatusrakennelmia, joiden tapa käsitellä todellisuutta ja viestiä siitä muistuttaa hieman toisiaan, muttei kuitenkaan ole ihan samanlainen.

Kurssille oli tarvetta, sillä sanastoja tehdään nykyisin usein tietomalleja varten. Näiden sanastoryhmien työhön osallistuu sekä terminologeja että tietomallintajia, ja on tärkeää, että nämä omien alojensa asiantuntijat ymmärtävät paitsi omaa alaansa, myös toisiaan. Terminologien ei tarvitse olla tietomallinnuksen asiantuntijoita, mutta terminologienkin on hyvä tiedostaa, mistä tietomalleissa on kyse ja miten viestiä terminologisesta sanastotyöstä mallintajille ilman, että syntyy väärinkäsityksiä sanastoprojektiin osallistuvien asiantuntijoiden erilaisten taustatietojen vuoksi.

Sanastotyön suunnittelusta sen toteuttamiseen

Nordterm-seminaari alkoi Terminologicentrum TNC:n johtajan Anna-Lena Bucherin tervetulosanojen jälkeen kutsutun puhujan Ingemar Strandvikin esityksellä. Esitys käsitteli käännösten laadun varmistamista Euroopan komission käännöksissä. Strandvik toimii Euroopan komissiossa käännöstoimen pääosaston direktoraatti A:n laatupäällikkönä. Hän puhui esitelmässään varsinkin direktiivien käännöksistä, sillä niiden kääntäminen on erityisen haasteellista: direktiivien täytyy toimia samalla tavoin kaikissa EU:n 28 jäsenvaltiossa riippumatta siitä, mille unionin 24 kielestä ne on käännetty. Kääntämistä hankaloittaa se, että jäsenvaltioiden omat oikeusjärjestelmät eroavat toisistaan. Näin ollen joidenkin juridisten termien merkitys voi kansallisella tasolla poiketa huomattavasti siitä, mitä samalla termillä tarkoitetaan EU:n piirissä. Myös tapa kirjoittaa juridisia tekstejä voi vaihdella eri maiden välillä. Kääntäjien onkin oltava tarkkana, etteivät he ala käännöksissään tulkitsemaan säädöksiä, vaan pelkästään välittävät säädösten sisällön.

Seminaarin aiheena oli tänä vuonna sanastotyön eri vaiheet. Seminaarin esityksetkin oli jaettu sanastotyön eri vaiheiden mukaan neljään eri ryhmään: työn suunnitteluun ja toteuttamiseen sekä sen tulosten käyttöönsaattamiseen ja hallinnointiin.

Hans Söderlund Ruotsin opintotukiasiain keskuslautakunnasta (Centrala studiestödsnämnden, CSN) kertoi, miksi ja millaisin tavoittein CSN oli aloittanut sanastotyön. Termistön yhtenäistäminen nähtiin Söderlundin mukaan keinona parantaa ja tehostaa asioiden käsittelyä, palvelua ja tiedonkulkua sekä toiminnan kehittämistä ja seurantaa. Sanastotyöhön kannusti myös CSN:n tarve uudistaa IT-järjestelmänsä, johon sanastotyöstä nähtiin olevan suurta hyötyä. Sanastotyö päätettiin toteuttaa vaiheittain: työn ensimmäiseen vaiheeseen kuului esitutkimus, jonka tarkoituksena oli vakiinnuttaa uusi työmenetelmä. Toisessa vaiheessa menetelmää ja siihen liittyviä rooleja testattiin pilottihankkeessa, jonka jälkeen työmenetelmää arvioitiin ja paranneltiin tarpeen mukaan. Söderlund arvelee sanastotyön vaiheittaisen aloittamisen olleen menestyksekästä, ja seuraavassa, kolmannessa vaiheessa paranneltu työmenetelmä on tarkoitus ottaa käyttöön koko organisaatiossa.

Karin Hanssonin esitelmä taas käsitteli sanastoprojektia, joka on aloitettu Ruotsin Tilastollisessa keskustoimistossa (Statistiska centralbyrån, SCB) vuonna 2012. Pilottiprojektin tavoitteena on ollut tarjota SCB:n verkkosivuston käyttäjille sanasto, joka auttaa käyttäjiä ymmärtämään ja hyödyntämään sivuston sisältöä entistä paremmin. Projektin onnistumisen kannalta tärkeitä seikkoja olivat Hanssonin mielestä selkeä tavoite, työmenetelmien yhtenäistäminen ja hyvin toteutettu laadun tarkkailu. Sanastotyön laadusta vastasivat sisältöasiantuntija, projektia konsultoinut terminologi sekä kieliasiantuntija, jonka tehtävänä oli vastata määritelmien selkeäkielisyydestä. Hansson kertoi, että projektin aikana paitsi saavutettiin konkreettisia tuloksia, myös luotiin perusta pitkäkestoiselle sanastotyölle SCB:ssä.

Koordinaattori ja vanhempi neuvonantaja Jan Hoel Norjan Språkrådetista kertoi Norjassa korkeakoulusektorilla käynnistetystä sanastotyöstä, jonka tarkoitus on ylläpitää ja kehittää akateemisten erikoisalojen termistöä ja rohkaista yliopistojen ja korkeakoulujen toimijoita käyttämään kansalliskieliä kirjoittaessaan ja puhuessaan omasta alastaan. Aiheesta kuultiin vielä lisää ensimmäisen seminaaripäivän lopuksi, kun Språkrådetin vanhempi neuvonantaja Ole Våge esitteli osana sanastotyöprojektia toteutettua hanketta, jossa selvitettiin parhaan käytännön mallia sanastotyön toteuttamiseen. Samanaikaisesti kehitettiin wikipohjainen käyttäjäystävällinen työväline termien tallentamista ja käyttöönsaattamista varten.

Myös muualla on kehitetty sanastotyön toteuttamisen malleja: Mats Nilsson kertoi esityksessään Ruotsin Puolustusvoimien materiaalivirastossa tehtävää sanastotyötä varten kehitetystä järjestelmästä, joka tukee käsitejärjestelmäkaavioiden käyttöä sanastotyön lähtökohtana. .Järjestelmä perustuu vapaasti käytettävissä oleviin ohjelmiin.

Ensimmäisenä seminaaripäivänä ehdittiin kuulla myös muutama sanastotyön toiseen vaiheeseen, työn toteuttamiseen, liittyvä esitys. Terminologi Claudia Dobrina Terminologicentrum TNC:stä pohti esityksessään, mitkä ovat sanastoprojektille tunnusomaisia piirteitä. Hän selvitti, mitä eroja ja yhtäläisyyksiä erilaisilla sanastoprojekteilla on. Näiden perusteella Dobrina oli jakanut projektit seitsemään erilaiseen tyyppiin. Yhteistä kaikille projekteille oli terminologisen tiedon kerääminen, terminologinen käsiteanalyysi sekä työn tulosten kokoaminen terminologiseksi lähteeksi.

Sanastokeskus TSK:n johtaja Katri Seppälä vertaili asiasanastopohjaista ontologiatyötä ja perinteistä sanastotyötä. Sanastokeskuksen terminologit olivat mukana Aalto-yliopistossa vuosina 2003–2012 toteutetussa FinnONTO-projektissa asiantuntijoina, ja Sanastokeskuksella on ollut 2000-luvulla myös omia ontologiatoimeksiantoja. Vaikka FinnONTO-projektissa ontologioihin ei otettu mukaan käsitteiden määritelmiä, omissa projekteissaan Sanastokeskus on yhdistänyt asiasanastopohjaiseen ontologiatyöhön myös käsitteiden määrittelyn. Esityksessään Seppälä kertoi näistä projekteista ja niissä kohdatuista haasteista.

Hanne Erdman Thomsen Kööpenhaminan kauppakorkeakoulusta (Copenhagen Business School, CBS) kertoi CBS:n toteuttamasta DanTermBank-projektista, jossa kehitetään kansallisen termipankin tueksi menetelmiä ja prototyyppejä, jotka mahdollistavat esimerkiksi käsitejärjestelmien puoli?automaattisen rakentamisen ja päivittämisen. DanTermBankista voi lukea lisää DanTermBank-työryhmän artikkelista sivulla 10.

Sanastotyön toteuttamisesta jatkettiin vielä toisen seminaaripäivän, keskiviikon, aamuna. Lehtori Lotte Weilgaard Christensen tanskalaisesta Syddansk Universitet -yliopistosta kertoi pilottitutkimuksestaan, jossa hän analysoi puhuttua talouden alan kieltä ja pyrkii löytämään siitä uudissanoja. Weilgaard Christensen haluaa selvittää, voisiko puhuttua kieltä käyttää terminologisen aineiston lähteenä.

Sanastokeskus TSK:n terminologi Mari Suhonen puhui omassa esityksessään Sanastokeskuksen projekteista, joissa sanastotyötä on yhdistetty tietojärjestelmien kehittämiseeen. Suhonen käytti esimerkkinä sosiaalihuollon asiakasasiakirjauokituksessa käytettävien käsitteiden selvittämiseksi tehtyä sanastotyötä. Suhosen mukaan työn tavoite eroaa perinteisestä sanastotyön tavoitteesta: siinä, missä perinteinen sanastotyö pyrkii selkeyttämään viestintää tietyllä erityisalalla yleisesti, asiakasasiakirjasanaston sanastotyössä halutaan selkeyttää viestintää tietyssä erikoisalan tietoa sisältävässä tietomallissa.

Aamulla kuultiin myös Niina Nissilän esitys hänen Suvi Isohellan kanssa tekemästään tutkimuksesta termistön vaikutuksesta erilaisten käyttöliittymien käytettävyyteen. Nissilän ja Isohellan tutkimuksesta voi lukea lisää tämän numeron Vieraskynä-palstalta sivulla 9.

Työn tulosten säilyttäminen ja hallinnointi

Moni keskiviikon esityksistä liittyi sanastotyön kolmanteen vaiheeseen, sanastotyön tulosten säilyttämiseen ja jakamiseen. Vemund Olstad, Marita Kristensen ja Gisle Andersen Norjan kauppakorkeakoulusta (Norges Handelshøyskole, NHH) esittelivät NHH:ssa tehtävää kehitystyötä. Tarkoituksena on kehittää portaalia terminologisille lähteille sekä termihakua?, joka mahdollistaisi haun kaikista näistä lähteistä samanaikaisesti. Sisällölliset ja tekniset ratkaisut pyritään vakiinnuttamaan, jotta erilaiset lähteet voitaisiin harmonisoida.

Antti Kanner Helsingin yliopistosta kertoi monitieteisen Tieteen termipankin kehittämisestä. Tieteen termipankki -projektissa on kehitetty MediaWikiin perustuva alusta, jota käytetään sekä apuvälineenä sanastotyössä että työn tulosten loppusijoituspaikkana. Kanner kertoi projektin vaiheista sekä tarpeesta terminpankin monikielisyydelle, joka tuo omat haasteensa Tieteen termipankin rakentamiseen.

Helsingin yliopiston tutkija Igor Kudashev esitteli IMU-projektia, jossa kehitetään monikielisiä verkkopalveluja suomalaisten ja venäläisten matkailijoiden käyttöön. Projektissa on tarkoitus luoda useita kieliteknologiaratkaisuja, joista tärkein on suomalais-venäläinen verkkopalvelu, johon sisältyy sähköinen sanakirja, fraasisanakirja ja käännösohjelma. Palvelun luomiseksi tarvitaan terminologista sisältöä.

Seminaarin lopuksi kuultiin vielä esityksiä, jotka liittyivät sanastotyön tulosten hallinnointiin. Mats Granström sanastojen hallinnan ratkaisuja suunnittelevasta Interverbum Tech AB:stä puhui esityksessään siitä, kuinka valmiiden sanastojen käyttäminen voidaan varmistaa. Granströmin mukaan on tärkeää, että aineistot ovat helposti saatavilla.

Aineiston hallinnoinnista kertoivat myös Niklas Jonsson ja Sofie Sundholm Scanialta. Scanialla tehdään paljon yrityksen sisäistä sanastotyötä, ja Jonssonin ja Sundholmin mukaan aineiston hallinnointiin käytetään jopa enemmän aikaa kuin sanastotyön muihin vaiheisiin. Myös Jonsson ja Sundholm totesivat, että sanastojen täytyy olla helposti käytettävissä, jotta niitä hyödynnettäisiin . He myös korostivat järjestelmällisen päivitystyön merkitystä sanaston käytettävyydelle.

Edellä on mainittu vain osa Nordterm-seminaarissa kuulluista esitelmistä. Kaikkien esitelmien abstrakteihin pääsee tutustumaan Sanastokeskuksen verkkosivuston kautta osoitteessa http://www.tsk.fi/tsk/fi/nordterm_2013_esitelmät_verkossa-758.html. Seminaariesitelmien pohjalta kirjoitetuista artikkeleista kootaan raportti, joka julkaistaan Nordterm-sarjassa vuonna 2014.

Kuulumisia Pohjoismaista ja muualta

Nordterm-päivien viimeisenä päivänä järjestettiin Nordtermin yleiskokous. Kokouksessa Nordtermin jäsenorganisaatiot raportoivat viime vuosien toiminnasta sanastotyön ja terminologian alalla. Nordtermin työryhmät AG1 Terminologinen tutkimus ja koulutus, AG 2 Termistönhallintatyökalut sekä AG5 Nordtermin internetinformaatio raportoivat tapahtuman ensimmäisenä päivänä pitämistään kokouksista. Lisäksi kuultiin Eurooppalaisen terminologiyhdistyksen EAFT:n ja kansainvälisen standardisoimisjärjestö ISOn terminologikomitean TC 37:n kuulumisia.

Tuttuun tapaan Nordtermin puheenjohtajuus siirtyi seuraavana vuorossa olevalle organisaatiolle, joka tällä kertaa on islantilainen Stofnun Árna Magnússonar í íslenskum fræðum (Islannintutkimuksen Árni Magnússon-instituutti). Odotamme jo innolla vuoden 2015 Nordterm-tapahtumaa Reykjavikissa!