Tietolinja

Tietolinja
02/2003

Kokoelmien kuvailu yliopistokirjastojen tietokarttahankkeessa

Vuokko Palonen
Vaasan tiedekirjasto TRITONIA

URN:NBN:fi-fe20031950


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Tietokartan tavoitteet

Suomen yliopistokirjastojen verkoston strategiassa vuosille 2004-2007 verkoston tärkeimmäksi tehtäväksi on katsottu tietoaineistojen saatavuuden ja kattavuuden parantaminen. Tavoitteen saavuttamiseksi strategiassa on esitetty joukko toimenpiteitä, joista ensimmäisenä mainitaan kokoelmien yhteiskäytön tehostamiseksi laadittava aihealoittainen aineiston ja palveluiden tietokartta. Hanke sisältyy yliopistokirjastojen neuvoston vuosien 2003-2004 toimintasuunnitelmaan. Sen toteutusta tukevat kansalliskirjaston Nelli-portaalin rakentaminen ja digitaalisten dokumenttien hallintajärjestelmä (DOMS). Tehtävään on saatu rahoitusta opetusministeriöltä.

Yliopistokirjastojen neuvoston työvaliokunta on nimittänyt hankkeelle ohjausryhmän johon kuuluvat: Anneli Ahtola (Tampereen yliopiston kirjasto), Esa-Pekka Keskitalo (Helsinki yliopiston kirjasto, DOMS-hanke), Vuokko Palonen, puheenjohtaja (Vaasan tiedekirjasto), Sara von Ungern-Sternberg (Åbo Akademi, Informationsförvaltning), Pentti Vattulainen (Varastokirjasto), Raine Wilen (Helsingin yliopiston kirjasto) ja asiantuntijana Ari Rouvari (Helsingin yliopiston kirjasto, Nelli-portaali). Asiantuntijoina ovat mukana myös yliopistokirjastojen neuvoston sihteeri Irma Reijonen sekä Juha Hakala (Helsingin yliopiston kirjasto), joka on kutsuttu amerikkalaista kokoelmien kuvailun NISO-standardia laativan työryhmän puheenjohtajaksi. Sihteerinä toimii hankkeen suunnittelija Merja Hyödynmaa Tampereen yliopiston kirjastosta.

Hankkeella on ulkomaisia esikuvia erityisesti Isossa-Britanniassa. Skotlannissa kirjastojen yhteistä kokoelmien kehittämistyötä on tehty jo 1980-luvulta alkaen useissa hankkeissa, joiden saavutukset on tarkoitus koota yhteen vuosina 2003-2004 SPEIR-projektissa (Scottish Portals for Education, Information and Research). Hankkeiden avulla on pyritty löytämään menetelmiä erityisesti painettujen kokoelmien hallintaan, luomaan kokoelmien vahvuuksia kuvaavaa metatietoa ja kehittämään yhteisiä hakujärjestelmiä (ks. http://cdlr.strath.ac.uk/projects/projects.htm).

Tietokartan tavoitteena on luoda kokonaiskuva Suomen kirjastojen aineistontarjonnan vahvuuksista ja heikkouksista aihealueittain. Sen avulla kirjastot voivat suunnitella sekä omaa että valtakunnallista kokoelmien kehittämistä, hankintayhteistyötä ja uusien palveluiden luomista. Asiakkaalle tietokartan on tarkoitus osoittaa, mistä hänen oman alansa kokoelmien vuoret, laaksot, valtaväylät ja polut löytyvät.

Kokoelmien tuntijaksi ja kehittäjäksi kasvaminen vaatii useimmiten vuosikausien kokemuksen. Kokoelmien kuvailu ja evaluointi auttavat kirjastoissa tietämyksen ja asiantuntijuuden siirtämistä uusille työntekijöille. Lisäksi kuvailu tarjoaa uuden mahdollisuuden tiedottaa sellaisistakin kokoelmista, joiden luettelointi dokumenttien tasolla olisi vaikea toteuttaa, kuten pienpainatteet tai lahjoituskokoelmat. Verkkoaineiston määrän nopea kasvaminen voi vaikuttaa siihen, että yksittäisten dokumenttien ja dokumenttikokoelmien kuvailun suhde saattaa muutenkin muuttua.

Alkuvaiheessa Tietokarttahanke koskee yliopistokirjastojen kokoelmia, mutta siihen voidaan myöhemmin sisällyttää myös erikoiskirjastojen ja muiden kirjastojen aineistoja. Hankkeen keskustelutilaisuuksissa nimenomaan erikoisaineistoja ja tieteiden välisiä aineistoja on pidetty asiakkaiden ja kirjastojen kannalta tärkeänä osana karttaa. On myös katsottu, että kartan piirtäminen kannattaa aloittaa konkreettisista ja selkeästi määriteltävistä kokoelmista. Olisi hyödyllistä saada mukaan arkistojen ja museoiden kokoelmatietoja, jolloin asiakas pääsisi yhtä aikaa samaa aihepiiriä tai kohdetta käsittelevien erilaisten aineistojen lähteille. Arkistoilla ja museoilla on jo vanhastaan kokemusta nimenomaan kokoelmien kuvailusta yksittäisten esineiden tai asiakirjojen kuvailun sijasta.

Tietokarttahankkeessa on tarkoituksena yhdistää perinteiset kokoelmat, digitaaliset ja digitoidut aineistot sekä lisensioidut ja valikoidut vapaat verkkoaineistot. Myös verkkokurssit, kuva-aineistot ja erilaiset pienpainatteet voivat muodostaa kokoelmia tai sisältyä laajempiin kokoelmiin.

 

Kokoelmien kuvailun välineet

Kokoelmien kuvailutiedoilla tarkoitetaan suunnilleen samaa kuin metatiedoilla verkkodokumenteissa ja luettelointitiedoilla tai bibliografisella valvonnalla perinteisten dokumenttien luetteloinnissa; kohteena vain ovat yksittäisiä dokumentteja laajemmat yksiköt.

Lähtökohtana on, että tietokarttaan liitettävät kuvailut soveltuvat yhteen kirjastojen tietojärjestelmien ja muiden muistiorganisaatioiden järjestelmien kanssa sekä kotimaassa että kansainvälisesti. Siksi kokoelmien kuvailussa oletetaan hyödynnettävän kansainvälisessä käytössä olevia malleja. Yhtään valmista standardoitua kokoelmien kuvailuformaattia ei vielä ole olemassa. Yhdysvalloissa kansallisen informaatioalan standardointiorganisaation NISOn tavoitteena on määritellä tällainen standardi. Tässä Juha Hakala on aktiivisesti mukana.

Tietokartta-hanketta varten olen vertaillut neljää eri formaattia:

  • Dublin Core Collection Description: proposed collection description properties (versio 25.08.2003)
  • ROADS (=Resource Organisation And Discovery in Subject-based services). Version 1.0
  • RSLP (=Research Support Libraries Programme) Collection Description (May 2000)
  • TEL (=The European Library) Application Profile for Collection Descriptions, version 1.1.

Dublin Coren perusversio on verkkojulkaisujen metatietostandardi (ANSI/NISO ja SFS, nyttemmin myös ISO), josta kokoelmien kuvailun työryhmä kehittää sovellusta (ks. http://dublincore.org/groups/collections/). Brittiläisissä hankkeissa Dublin Coren alkuperäisestä formaatista on tehty useita muunnelmia, joissa perusversioon on lähinnä lisätty elementtejä.

ROADS on eurooppalaisen Renardus-hankkeen käyttämä kuvailumalli, joka on tehty erityisesti verkkodokumentteja varten. ROADSia käyttää Suomessa Virtuaalikirjasto-projekti.

RSLP on Britanniassa toimineiden ja toimivien kokoelmien kehittämisprojektien käytössä oleva kokoelmien kuvailun väline. Se on laadittu alunperin painettujen kokoelmien hallintaan, mutta on käytettävissä myös digitaalisiin kokoelmiin. Sen ohjeistuksessa viitataan useissa kohdissa Dublin Coreen.

TEL on useiden Euroopan maiden yhteinen projekti; Suomesta kansalliskirjasto osallistuu projektiin. Formaatti on rakennettu Dublin Coren ja RSLP:n kokoelmien kuvailuformaattien pohjalle. TELiä on testattu erityisesti verkkokokoelmilla.

Kun Dublin Core on kolmen formaatin perustana, näissä formaateissa ei ole suuria eroja, paitsi että TEL on muita laajempi. Siihen samoin kuin ROADS-formaattiin sisältyy noin 50 tietoelementtiä; Dublin Coressa ja RSLP:ssä elementtejä on noin 30. ROADSissa terminologia eroaa jonkin verran muista ja siinä on myös tiettyjä muista puuttuvia elementtejä. Tietojen järjestys kuvailumalleissa vaihtelee, mutta sillä ei ole merkitystä tietojen haettavuuden tai lopullisen käyttöliittymässä toteutettavan näytön kannalta. TEL-formaatissa ja Virtuaalikirjaston ROADS-sovelluksessa on määritelty tietojen pakollisuus ja vapaaehtoisuus, TELissä lisäksi suositeltavuus. Pakollisiin tietoihin kuuluvat vain kokoelman nimi, kokoelman tunnus ja tietueen tunnus. Ne tuskin kuitenkaan riittävät palvelemaan Tietokartan käyttäjiä, joten hankkeessa on määriteltävä oma ohjeistus pakollisuudesta. Erityisesti kokoelman sisällön kuvaaminen on käyttäjän ja kirjastojen kannalta välttämätöntä.

Formaattien tietoelementtejä voidaan ryhmittää eri tavoin, esimerkiksi jakamalla ne neljään ryhmään:

Kokoelmien ominaisuuksia kuvaavat tiedot, jotka sisältävät:
Kokoelman nimi ja mahdolliset vaihtoehtoiset nimimuodot
Kokoelman tunnus

Kokoelman kuvailu eli tiivistelmä (myös graafinen kuvaus on mahdollinen)
Sisällönkuvailu: aihealue, asiasanat, luokitukset, kokoelman kohde (esim. julkaisutyypin, kielen tai ajanjakson mukaan), henkilöt ja yhteisöt kokoelman aiheina, vahvuudet, kattavuus: aika ja paikka
Kartuntatilanne
Kokoelman oikeudellinen asema, hallinnointihistoria
Huomautukset

Aikamääreet (sisältöön liittyvien aikamääreiden lisäksi alkuperäiset ja eri versioiden julkaisuajat, digitoimisen tai aineiston verkostosta haravoimisen aika, kokoelman kartunta-aika)
Kokoelmatyypit, muoto ja laajuus, lähde, kieli

Kokoelmaan liittyvät toimijat, joita ovat
Kokoelman luoja eli kokooja
Avustaja, muu vaikuttaja
Kustantaja
Omistaja
Tekijänoikeuksien haltija
Käyttöön asettaja eli palvelusta vastaava taho.

Kokoelman sijainti- ja saavutettavuustiedot eli
Sijainti
Saavutettavuus: yleiset käyttöoikeudet, aineistoon pääsyn valvonta, käytön ehdot, käyttöajat, käyttäjäryhmät

Kokoelman suhteet muihin kokoelmiin
Hierarkkiset suhteet laajempaan tai suppeampaan kokoelmaan, kokoelman luettelo tai tietokanta, kokoelman edeltäjä tai seuraaja, kokoelmaa koskevat julkaisut tai muu informaatio, sijainti toisen kokoelman tiloissa (deponoitu kokoelma)jne.

Tiedot kuvailujen ylläpidosta, ajantasaisuudesta, vastuuyksiköistä ja vastuuhenkilöistä sekä tietueiden syöttöön ja muuttamiseen liittyvät ajat ja toimijat toteutettaneen ohjelmallisesti.

 

Mikä on kokoelma

Kokoelman käsite voi kirjastoissa tuntua aluksi selvältä ja konkreettiselta, mutta erilaisten kokoelmien määrittäminen tietoverkkojen ja painettujen kokoelmien yhteisessä ympäristössä ei ole kovin yksinkertaista. Verkkokokoelmiin voi sisältyä myös muuta aineistoa kuin dokumentteja; esimerkiksi Virtuaalikirjastossa kokoelmaan liittyy verkkopalveluita ja instituutioita.

Formaattien vertailussa tarkastelin esimerkkeinä:

  • yhden yliopistokirjaston eli Vaasan tiedekirjaston koko kokoelmaa ja kahta siihen sisältyvää osakokoelmaa, joista toinen on laaja perinteinen kokoelma, toinen pieni verkkokokoelma
  • verkkokokoelmaa eli Virtuaalikirjastoa ja sen osakokoelmana Taloustieteen virtuaalikirjastoa
  • tiettyä kohdetta - teemaa/aihetta/dokumenttityyppiä - koskevaa materiaalia, jonka asiakas voi koota eri lähteistä.

Tärkeä kysymys on, mitkä kokoelmat kuvaillaan. Yliopistokirjastoissa ongelmallisia voivat olla esimerkiksi laitos- tai osastokirjastojen kokoelmat suhteessa pääkirjastoon. Ohjausryhmän mielestä ratkaiseva kriteeri kuvailtavien kokoelmien valinnassa on kokoelman julkinen käytettävyys.

Toinen alkuvaiheessa esiin tuleva määritysongelma on, kuvaillaanko kokoelmia hierarkkisesti tai miten laajoja kokonaisuuksia kuvaillaan. Omien esimerkkieni perusteella näyttää siltä, että esimerkiksi yliopistokirjaston yleiskokoelman kuvailu ei riitä, vaan kokoelma tulee jakaa pienempiin kokonaisuuksiin, jotta sen vahvuudet eri aloilla tulisivat riittävästi esille. Kun mitään yhtenäisiä sääntöjä tai käytäntöjä aineiston ryhmittelystä kokoelmiksi ei yliopistokirjastoilla ole, näistä kysymyksistä on keskusteltava perusteellisesti.

Siihen, mitä tietoja kustakin kokoelmasta kerrotaan, voivat pakollisiksi määriteltyjen tietojen ohella vaikuttaa oletettu käyttötarve, kokoelman ikä ja laajuus sekä muut kirjastoissa arvioitavat seikat. Joskus tiedot kokoelman ominaisuuksista voivat olla suppeat, mutta tiedot käyttöoikeuksista ja saavutettavuudesta yksityiskohtaiset tai päinvastoin. Joskus taas kokoelmaan liittyvät toimijat kuten kokoelman luoja, omistaja ja käyttöön asettaja voivat olla tärkeitä kokoelman ominaisuuksien kuvaajia.

Digitaaliset ja perinteiset kokoelmat eroavat esimerkkieni perusteella toisistaan sijainti- ja saatavuustietojen sekä kokoelman fyysisten ominaisuuksien perusteella, mutta sisällönkuvailun ja kokoelmien muiden ominaisuuksien kannalta niiden välillä ei välttämättä ole eroja. Sama kuvailuformaatti sopii siis yhtä hyvin sekä digitaalisten että perinteisten kokoelmien kuvailuun.

 

Kuvailuformaatin valinta

Kokoelmien kuvailuformaattien kehittäminen on kansainvälisesti ajankohtainen aihe. Dublin Coren kokoelmien kuvailuformaatti ja TEL ovat molemmat toistaiseksi keskeneräisiä. Suuria mullistavia muutoksia niihin tuskin kuitenkaan on enää tulossa. RSLP on hyvin samantapainen kuin edelliset; sen lähtökohtana on ollut Dublin Coren perusversio. Käytössä jo olleena RSLP lähinnä tukee kansainvälisempään käyttöön suunniteltujen Dublin Coren tai TELin valintaa Tietokartan formaatiksi. Näistä Dublin Core on kansainvälisempi.

ROADSia on käytetty useassa maassa usean vuoden ajan ja Virtuaalikirjaston välityksellä sen käyttäminen on jo tuttua monille kirjastoille Suomessa. ROADSia ylläpitänyt Renardus-projekti on kuitenkin päättynyt eikä ROADSin kehittämisestä liene päätöksiä. Jos Dublin Core yleistyy verkkotiedon ja dokumentteja koskevan tiedon hallinnan välineenä nykyistä laajemmin, siihen perustuva formaatti tarjoaa tulevaisuudessa ehkä ROADSia turvallisemman lähtökohdan myös Tietokarttahankkeelle.

Vertailussa ei varsinaisesti käsitelty yksittäisten dokumenttien luetteloinnista tuttua MARC-formaattia. MARCista puuttuvat sellaiset tiedot kuin kartuntatilanne, kokoelman vahvuudet, kokoelman historiaa tai omistajuutta koskevat tiedot sekä pääosin käyttöoikeuksia ja -mahdollisuuksia kuvaavat tiedot. Teoriassa tällaisia tietoja voitaisiin sijoittaa erilaisiin huomautuskenttiin. Sovelluksia jouduttaisiin kuitenkin tekemään myös niissä kohdissa, joissa MARC on yksityiskohtaisempi kuin kokoelmien kuvailun formaatit, kuten erilaisissa nimekkeissä ja tekijöissä. MARC-formaatti sellaisenaan ei näillä perusteilla ole yhtä sopiva kokoelmien kuvailuun kuin tähän tehtävään luodut kuvailuformaatit.

Kokoelmien kuvailun formaatin valinnassa tärkeä kriteeri on todennäköisesti näkemys kansainväliseen käyttöön tehtyjen formaattien tulevaisuudesta. Dublin Coren tyyppiset formaatit sopivat myös teknisesti esimerkiksi DOMSiin, johon kuvailut ajatellaan tallennettavan. Dublin Coresta pystytään melko hyvin kääntämään dataa tarvittaessa esimerkiksi MARC-formaatteihin.

 

Kokoelmien kuvailun toteuttaminen

Formaattien käyttökokeilut osoittivat, että kokoelmien kuvailutyössä tarvitaan luettelointisääntöjen, formaattien ja sisällönkuvailun menetelmien tuntemusta, jota kaikissa yliopistokirjastoissa on jo ennestään. Kirjastojen henkilökunnan tottuminen yhdenmukaisiin vaatimuksiin yhteisissä tietokannoissa ja muissa yhteisissä hankkeissa helpottaa Tietokartan yhdenmukaista toteuttamista. Lisäksi tarvitaan kokoelma-asiantuntijoiden erinomaista omien kokoelmien tuntemusta ja näkemystä niiden suhteesta eri alojen kirjallisuuden tarpeisiin ja aineiston tarjontaan perinteisessä muodossa ja Internetissä.

Tietokartasta keskusteltaessa on luonnollisesti mietitty sen vaatimia resursseja. On selvää, että näin tärkeä palvelun parantaminen vaatii paljon työtä. Työ tulee kuitenkin suhteuttaa saavutettavissa oleviin hyötyihin. Tällä hetkellä kirjastojen kokoelmista saatavissa olevat tiedot ovat usein riittämättömiä niin kirjaston henkilökunnalle kuin asiakkaillekin. Määrälliset tiedot kokoelmista voitaisiin dokumentoida jo projektin alkuvaiheessa. Ne muodostaisivat perustan myös kokoelmien paikalliselle ja valtakunnalliselle laadulliselle arvioinnille.

 

Toimenpide-ehdotukset kokoelmien kartoituksessa ja kuvailussa vuonna 2004

Kokoelmien kuvailun formaattien tarkastelu ja kokeilu muutaman erilaisen kokoelman kuvaamisella osoittivat, että kokoelmiin kuvailuun liittyy useita asioita, joista on tehtävä päätökset heti projektin alkuvaiheessa. Näitä ovat:

  1. Kuvailun formaatin valinta, formaatin soveltamisohjeen laatiminen, kuvailujen kieli/kielet, kokoelmien tunnusten määrittäminen, ohjeellisten nimitiedostojen hyödyntäminen
  2. Sisällönkuvailusta päättäminen: aihealueiden perusta, asiasanastojen käyttö
  3. Kuvailtavien kokoelmien valinnan kriteerit ja mahdollinen prioriteettijärjestys
  4. Määrällisten kartoitusten toteuttaminen
  5. Teknisten ja taloudellisen resurssien turvaaminen.

Kokoelmien kuvailua koskeva raportti on luettavissa Yliopistokirjastojen neuvoston Tietokarttaa koskevilta kotisivuilta, http://www.lib.helsinki.fi/kirjastoala/neuvosto/kokoelmien%20kuvailuRaportti2003.pdf 



Lähteet

DCMI Type Vocabulary. 2003-02-12. 
http://dublincore.org/documents/2003/02/12/dcmi-type-vocabulary/  (27.10.2003)

Dublin Core Collection description application profile summary / creator: Dublin Core Collection Description Working Group. Date Issued: 2003-08-25.
http://www.ukoln.ac.uk/metadata/dcmi/collection-ap-summary/2003-08-25/  (27.10.2003)

ROADS Cataloguing Guidelines, revised version (v. 1.0) by Michael Day;
http://www.ukoln.ac.uk/metadata/roads/cataloguing/cataloguing-rules.html  (24.9.2003)

RSLP Collection Description. CLDT enumerated list of collection types / maintained by Andy Powell.
Last updated: 21-May-2000.
http://www.ukoln.ac.uk/metadata/rslp/types  (23.10.2003).

RSLP Collection Description. Collection Description Schema / by Andy Powell. Last-updated: May-2000.
http://www.ukoln.ac.uk/metadata/rslp/schema/  (23.10.2003).

RSLP collection description. Tool / maintained by Andy Powell. Version 1.0 (2000-10).
URL: http://www.ukoln.ac.uk/metadata/rslp/tool  (23.10.2003).

TEL Application Profile for Collection Descriptions, version 1.1. 
www.europeanlibrary.org  (4.9.2003)

Yliopistokirjastojen neuvosto, Kirjastojen kokoelmien aihealoittainen tietokartta - hankkeen tausta, tavoitteet ja sisältö. http://www.lib.helsinki.fi/kirjastoala/neuvosto/tietokartta_hankesuunnittelu.htm
#Tietokartta%20-%20esitysaineistot
  (4.11.2003).

 

 


Tietolinja 02/2003

Vuokko Palonen, kirjastonjohtaja
Vaasan tiedekirjasto TRITONIA
PL 331, 65101 Vaasa
Email: vpa osoitteessa @uwasa.fi