Tietolinja

Tietolinja
02/2006

Kansalliskirjaston DSpace-projekti etenee

Jyrki Ilva
Kansalliskirjasto

URN:NBN:fi-fe20061592


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Kansalliskirjasto on rakentanut keväästä lähtien DSpace-ohjelmistoon pohjautuvaa julkaisuarkistoympäristöä, joka tulee käyttöön alkuvuoden 2007 aikana. Uusi järjestelmä on osa Kansalliskirjaston kirjastoille tarjoamaa Doria-palvelua.

 

DSpace ja Manakin

Kansalliskirjasto päätti toukokuussa 2006 ryhtyä rakentamaan korkeakouluille ja tutkimuslaitoksille tarjottavaa julkaisuarkistosovellusta avoimeen lähdekoodiin perustuvan DSpace-ohjelmiston varaan. Päätöksen taustalla vaikutti mm. Kansalliskirjaston aiemmin käyttöön ottaman ENCompass-ohjelmiston odotettua hitaampi kehitys ja sen etenkin julkaisuarkistojen tarpeiden kannalta puutteellisiksi osoittautuneet ominaisuudet. Kansalliskirjaston DSpace-projekti sai rahoitusta osana OPM:n tukemaa laajempaa OA-JES-hanketta, jota esiteltiin alustavasti jo Tietolinjan kevään numerossa (../0106/openaccess.html).

Miksi päädyimme juuri DSpace-ohjelmistoon? DSpace on tarkoitettu nimenomaan julkaisuarkistokäyttöön, ja sen perustoiminnot osoittautuivat keväällä tehdyissä testeissä vakaiksi ja järkevästi rakennetuiksi. Halusimme lisäksi valita ohjelmiston, joka toimii jo nyt, eikä kenties vasta kolmen vuoden päästä. DSpace on tällä hetkellä maailmanlaajuisesti käytetyin julkaisusarkisto-ohjelmisto, ja sillä on tukenaan vahva kehittäjäyhteisö, minkä olemme voineet myös käytännössä havaita oman kehitysprojektimme aikana. Valinnan puolesta puhui sekin, että ohjelmistolla oli jo ennestään muita käyttäjiä myös Suomessa (mm. Helsingin yliopiston Viikin kampuksella jo parin vuoden ajan toiminut DViikki).

DSpacen lisäksi Kansalliskirjasto on ottanut käyttöön myös sen päälle rakennetun Manakin-ohjelmiston, joka mahdollistaa palvelun käyttöliittymän ja ulkoasun joustavan muokkaamisen ja räätälöinnin. DSpacen perusasennuksen tarjoama käyttöliittymä on näet varsin kömpelö, ja sen muokkaaminen on käytännössä hankalaa, ei vähiten sen vuoksi, että siihen tehdyt muokkaukset saattavat hävitä versionvaihdosten yhteydessä. Manakinin avulla samaan DSpace-asennukseen on myös mahdollista rakentaa useita erilaisia käyttöliittymiä ja yksilöllisiä ulkoasuja kunkin aineiston tarpeiden mukaan. Tämä helpottaa luonnollisesti myös useiden eri organisaatioiden aineistojen sijoittamista samaan Dspace-instanssiin.

DSpace on ollut maailmalla käytössä jo vuodesta 2002 lähtien, mutta Texasin yliopiston kehittämä Manakin sen sijaan on vielä beta-vaiheessa, ja sen ensimmäistä virallisempaa versiota on lupailtu alustavasti helmikuuksi 2007. Kansalliskirjaston kokemusten perusteella ohjelmisto on jo nyt varsin käyttökelpoinen, vaikkei se vielä sisällä aivan kaikkia lopulliseen versioon lupailtuja toimintoja. Manakinin tarjoama käyttöliittymien muokkaamisen helppous on toki jossain määrin suhteellista, eli sekin vaatii työtä ja myös hyvää XSL-osaamista.

Kuva 1: Kansalliskirjaston DSpace-palvelun etusivu. Palvelun ulkoasua ja valikkoja on muokattu Manakin- ohjelmiston avulla.

 

Kehitystyötä Kansalliskirjastossa

Kansalliskirjastossa järjestelmän teknisestä kehitystyöstä ovat vastanneet Pasi Kurvinen, Samu Viita ja pilottiprojektina toimivan E-thesis-palvelun puolesta myös Jani Saijos. Työ on edennyt kesän ja alkusyksyn aikana joutuisasti, ja moniin aluksi visaisiltakin näyttäneisiin ongelmiin on löytynyt vähän kerrallaan tyydyttäviä ratkaisuja. Manakinin osalta runsaasti työtä ovat aiheuttaneet mm. kieliversiot ja merkistöongelmat sekä ohjelmiston istunnonhallintaan liittyvät viritykset, joita on viilattu kuntoon osin yrityksen ja erehdyksen kautta.

Oma ongelmavyyhtensä on liittynyt siihen, että DSpace käyttää julkaisujen pysyvänä tunnisteena Handlea, joka on myös sidottu kiinteästi ohjelmiston rakenteeseen. Vaikka Handle olisi teknisesti aivan toimiva ratkaisu, osoitteiden pysyvyys ei kuitenkaan ole kirjaston omassa hallinnassa, ja maksullisena tunnisteena siihen liittyy muitakin epävarmuustekijöitä. Niinpä Kansalliskirjasto on selvittänyt OA-JES-projektin puitteissa myös mahdollisuuksia URN-tunnisteiden hyödyntämiseen DSpacen yhteydessä. Käytännössä tämä on tarkoittanut mm. Ruotsissa kehitetyn ja jo aiemmin Teknillisessä korkeakoulussa käytetyn URN-resolveriohjelmiston testaamista.

DSpacen oma hakukäyttöliittymä mahdollistaa metadataan kohdistuvien hakujen lisäksi suoraan itse dokumentteihin kohdistuvan kokotekstihaun, joka pystyy indeksoimaan mm. PDF-tiedostoja. DSpaceen tallennettujen aineistojen metadataa on myös mahdollista haravoida OAI-PMH-protokollan avulla muihin palveluihin. Järjestelmän OAI-PMH-käyttöliittymä toimii alustavien testien perusteella luotettavasti, vaikka haravoinnin rajaaminen perustuu ainakin DSpacen perusasennuksessa suoraan arkiston kokoelmarakenteeseen. Järkevien rajausmahdollisuuksien tarjoaminen edellyttäisi monissa tapauksissa joustavampia ratkaisuja. Lisäksi Kansalliskirjaston Dspaceen on asennettu myös SRU-moduuli, jonka ansiosta julkaisuarkistoon kohdistuvia hakuja on mahdollista tehdä esim. Nelli-portaalin kautta.

 

Palveluita kirjastoille

Kansalliskirjaston DSpace-projektin yleisenä päämääränä on ollut tarjota sekä valmis julkaisuarkistoympäristö siitä kiinnostuneille että tukea muillekin ohjelmiston käyttäjille. Tavoitteena on se, ettei kaikkien kirjastojen tarvitsisi tehdä samoja asioita omin voimin uudestaan. Teknisen ylläpidon keskittäminen tarjoaa luonnollisesti parempia mahdollisuuksia kustannussäästöihin ja teknisesti yhdenmukaisten ratkaisujen kehittämiseen yhteisvoimin.

Kansalliskirjaston DSpace-palvelun ensimmäisenä pilottiprojektina on toiminut Helsingin yliopiston opinnäytteitä julkaisevan E-thesis-palvelun siirtäminen uuteen ympäristöön. Palvelun julkaisuja on syksyn kuluessa siirretty DSpace-palvelimelle ja sille on rakennettu Manakinin avulla omaa käyttöliittymää, joka noudattaa Helsingin yliopiston ulkoasusuosituksia. Tavoitteena on, että E-thesiksen uusi Manakin-käyttöliittymä ja uusi ulkoasu voidaan julkistaa tammikuussa 2007.

Uuteen ympäristöön siirretty E-thesis tarjoaa jokaiselle tiedekunnalle ja laitokselle oman sivun (DSpace-terminologian mukaan yhteisön), joiden alta kunkin laitoksen erityyppisiä julkaisuja sisältävät kokoelmat löytyvät. Julkaisujen metatiedot ja tiivistelmät kerätään suoraan opinnäytteiden tekijöiltä verkkolomakkeilla, jotka tulostavat julkaisujen tiedot automaattisesti kansallista opinnäytteiden metadataformaattia noudattavaan XML-muotoon.

Kuva 2: Helsingin yliopiston opinnäytejulkaisuille on rakennettu Manakinin avulla Helsingin yliopiston graafisen ilmeen mukainen ulkoasu.

Tavoitteena on se, että Kansalliskirjaston DSpace-palveluun saataisiin alkuvuoden 2007 aikana mukaan Helsingin yliopiston lisäksi myös muiden korkeakoulujen aineistoja. Yksi potentiaalinen ryhmä ovat nykyisin ENCompassissa sijaitsevat kokoelmat, siltä osin kuin DSpace-ympäristö soveltuu niiden tallentamiseen. Periaatteena on se, että Kansalliskirjasto tarjoaa kirjastoille valmiin DSpace-alustan, jossa palvelimen, levytilan ja julkaisuarkistosovelluksen tekninen ylläpito hoidetaan keskitetysti. Jokainen kirjasto voi silti toimia omassa ympäristössään, määritellä itselleen oman graafisen ilmeen sekä huolehtia itse julkaisujensa tallentamisesta ja kuvailusta.

Keskitetysti ylläpidetyn DSpace-palvelun lisäksi Kansalliskirjasto tarjoaa teknistä tukea myös niille DSpace- ja Manakin-ohjelmistoja käyttäville kirjastoille, jotka eivät halua lähteä mukaan yhteiseen järjestelmään. DSpacen kaltaisen avoimen lähdekoodin ohjelmiston asentaminen ja saaminen toimintakuntoon ei näet ole aivan yksinkertaista. Muun muassa erilaisista laitteistoratkaisuista johtuen ohjelmistojen asennuksia ei voi valitettavasti täysin standardoida, mutta Kansalliskirjasto pyrkii kuitenkin tarjoamaan ohjeita ja neuvoja palveluiden rakentamiseen ja ongelmatilanteiden selvittelyyn.

Ohjelmistoihin liittyvän teknisen avun lisäksi Kansalliskirjasto tarjoaa tukea metadataformaattien ja kuvailukäytäntöjen sekä identifikaatiotunnisteiden yhdenmukaiseen soveltamiseen. Metadatan yhdenmukaisuus on tärkeää etenkin sen vuoksi, että julkaisuarkistoihin tallennetuista aineistoista voidaan koota haravoimalla järkeviä ja käyttökelpoisia palveluita. Lisäksi Kansalliskirjaston intresseihin kuuluu myös elektronisten julkaisujen vapaakappaleluovutuksen prosessien ja pitkäaikaissäilytyksen ratkaisujen kehittäminen yhteistyössä kirjastojen kanssa.

 

Oma vai yhteinen?

Vaikka organisaatiokohtaisten julkaisuarkistojen perustaminen saattaa tuntua muoti-ilmiöltä, vaikuttaa kuitenkin todennäköiseltä että ne ovat tulleet jäädäkseen. Sekä korkeakoulujen että tutkimuslaitosten kirjastot joutuvat kukin tahollaan pohtimaan sitä, kannattaako julkaisuarkistoa ryhtyä perustamaan kokonaan omin voimin vai olisiko se järkevämpää tehdä yhteistyössä muiden organisaatioiden kanssa.

Julkaisuarkiston teknisen kehittämisen tekeminen itse antaa kirjastolle luonnollisesti vapaammat kädet juuri omia tarpeita ja omaa näkemystä vastaavan julkaisuarkistoympäristön rakentamiseen. Toisaalta tämä vaatii kuitenkin sekä resursseja että teknistä osaamista. Niinpä on syytä pohtia sitä, kuuluuko oman julkaisuarkistosovelluksen tekninen ylläpito kirjaston ydintoimintoihin. Onko omin voimin tehdyn ylläpidon kirjastolle mahdollisesti tuoma lisäarvo sen vaatimien ylimääräisten resurssien arvoista? Vai onko julkaisuarkistosovellus järkevämpää pystyttää yhdessä muiden kirjastojen kanssa tai kannattaako hyödyntää Kansalliskirjaston tarjoamaa valmista julkaisuarkistoympäristöä?

Julkaisuarkistojen perustamista näytetään edelleen usein pohtivan liiaksi pelkästään tekniikan näkökulmasta. Tiedostojen tallentamiseen ja jakeluun soveltuva tekninen järjestelmä on kuitenkin vain yksi toimivan julkaisuarkiston edellytyksistä. Julkaisuarkisto ei ole julkaisuarkisto, ellei sinne saada myös sisältöä eli julkaisuja. Maailmalta löytyy yhä valitettavan paljon esimerkkejä hienoistakin julkaisuarkistosovelluksista, joihin ei ole saatu kerättyä juuri lainkaan julkaisuja.

Käytännössä julkaisuarkistojen kehittämisen suurimmat haasteet liittyvätkin sähköisen julkaisutoiminnan käytäntöjen luomiseen ja palvelun markkinointiin tutkijoille ja opiskelijoille. Yhteisesti hoidettu tekninen ylläpito voi parhaimmillaan tarjota kirjastoille mahdollisuuden keskittää resurssejaan nimenomaan omien palveluidensa ja digitaalisten kokoelmiensa sisällön kehittämiseen.

 


Tietolinja 02/2006

Jyrki Ilva, sovellussuunnittelija
Kansalliskirjasto / Tietokantapalvelut
PL 26 (Teollisuuskatu 23), 00014 Helsingin yliopisto
Email: etunimi.sukunimi (at) helsinki.fi