Tietolinja

Tietolinja
02/2003

Nelli-portaali - kansallista tiedonhakua

Ari Rouvari ja Henri Ryhänen
Helsingin yliopiston kirjasto

URN:NBN:fi-fe20031948


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


"Connecting databases - connecting services - connecting people"

Nelli-portaali on tiedonhakujärjestelmä. Tavoitteena on parantaa elektronisten dokumenttien käytettävyyttä ja saatavuutta. Nellihaun voin kohdistaa useisiin eri tietokantoihin: kirjastoluetteloihin, kokotekstitietokantoihin tai vaikkapa oppimisalustoihin. Siihen voi määritellä myös personoituja palveluita (oma aineistolista ja e-kirjahylly ja uutuusvahti). Nelli-portaali avataan Suomen yliopistojen käyttöön vuoden 2004 alkupuolella.

Varsin todennäköisesti ammattikorkeakoulukirjastot lähtevät mukaan vielä vuoden 2004 aikana. Yleiset kirjastot testaavat portaalia pilottiprojekteissa aluksi ainakin Lapin alueella (Pohjan portti) ja Hämeenlinnan maakuntakirjastossa.

Nelli-portaali toteutetaan Metalib ja SFX -ohjelmistolla. Portaalin käyttöönotosta vastaa FinELib/Kansalliskirjasto.

 

Taivasko rajana - kirjastopalveluiden tekninen ympäristö?

Nelli-portaali, kirjastojärjestelmä (Voyager) ja digitaalisten objektien hallintajärjestelmä (otetaan käyttöön vuoteen 2005 mennessä) muodostavat kirjastopalveluiden teknisen alustan. Toistaiseksi kaupallisten kirjastojärjestelmien käyttämät rajapinnat eivät ole riittävän standardeja, joten eri toimittajien järjestelmien saumaton liittäminen on haasteellista. Kolmen erilaisen järjestelmän yhteiskäyttö tarjoaa kuitenkin melkeinpä rajattomat mahdollisuudet kehittää kirjastopalveluja.

Palveluja ei pidä suunnitella tekniikan ehdoilla, vaan taivuttaa järjestelmät palvelujen mukaisiksi varsinkin nyt kun siihen on mahdollisuus.

Digitaalisten kirjastopalveluiden kehittämisen koordinointia varten suunnitellaan ohjausmekanismia, joka voisi koostua eri järjestelmien yhteisistä asiantuntijaryhmistä sekä ns. verkkopalveluryhmästä, jonka tehtävinä olisi verkkopalvelujen kehittäminen, uusien palvelujen ennakointi, ohjelmistojen yhteensopivuuden varmistaminen ja toimenpide-ehdotusten laatiminen. Verkkopalveluryhmässä tulisi olla edustajia eri kirjastosektoreilta ja digitaalisten kirjaston ohjelmistojen koordinoijia ja vastuuhenkilöitä. Palveluja tulee kehittää asiakaslähtöisesti.

 

Käyttäjien tunnistus

Personoituja palveluja varten asiakkaat pitää tunnistaa. Tunnistauduttaessa tarkistetaan onko asiakas yliopiston rekisterissä (opiskelija, henkilökunta, tutkija). Asiakkaat voidaan tarkistaa yliopistonrekisterin lisäksi vaikkapa Voyagerin asiakastietokannasta. Tällöin ongelmana on, että yleensä yliopistokirjastot jakavat kirjastokortin kaikille halukkaille, mutta FinELib hankkii elektronisen aineiston käyttölisenssejä vain instituutioiden jäsenille.

Nelli-portaali tukee LDAPia (Lightweight Directory Access Protocol). LDAP on yhteyskäytäntö, joka määrittelee kommunikointitavan henkilöhakemiston kanssa. Jotta kirjastot voisivat käyttää LDAPia tunnistamiseen, pitää kehysorganisaation asiakasrekisterissä olla LDAP-hakemistorakenne.

Metalib ohjelmistossa on myös Exlibriksen oma yksinkertainen tunnistamisalgoritmi Remote Autentication Hook eli "kapteenikoukku". Koukkutunnistamisessa ei tarvita LDAP-hakemistorakennetta mutta jonkin verran senkin käyttöönotto vaatii asiakasrekisterien räätälöintiä.

Elektronisen aineiston käytön rajaus on perinteisesti tehty IP-osoitteiden avulla. FinElib ilmoittaa asiakkaittensa käyttämien tietokoneiden IP-osoitteet (yleensä ns. yliopiston IP-avaruudet) aineiston myyjälle. Tämä kirjaa omaan tietokantaansa IP-numerot, joista aineistoa voi käyttää. Jos yliopisto haluaa tarjota kampusalueen ulkopuolisen aineiston käyttömahdollisuuden, on käytettävä esimerkiksi proxy-palvelinta.

 

Standardit oikotie onneen

Nelli-portaalin tärkein verkkoprotokolla on Z39.50. Se on yhteyskäytäntö etätietokantoihin tehtäviä hakuja varten. Standardissa on määritelty kentät, joihin haku kohdistuu. Yleisimpiä hakuattribuutteja ovat isbn, issn, nimeke, tekijä, aihe, julkaisuvuosi ja vapaatekstihaku. Z-protokollan avulla on helppo suorittaa haut erilaisiin tietokantoihin. Ilman standardia joutuisimme rakentamaan hakualgoritmit jokaista kohdetietokantaa varten erikseen.

Vaihtoehtoisia yhteyskäytäntöjä on XML ja HTTP/HTML. XML:n käyttö on huomattavasti Z39.50-standardia mutkikkaampaa. HTML parserointi on strukturoimaton tapa tehdä haut ja siksi hyvin joustava, mutta myös työläs.

Linkitykseen käytetään SFX-ohjelmistoa, joka on OpenURL-sovellus. OpenURL on perinteisen url-osoitteen kaltainen. Se sisältää dokumentin kuvailutiedot, joiden avulla oikea dokumentti löytyy. Standardissa on määritelty tiedot ja se miten ne siirretään. OpenURL jakautuu linkityspalvelimen osoitteeseen ja kuvailutietoihin, joilla dokumentti yksilöidään (ISSN, vuosikerta, julkaisuvuosi, tekijä, nimeke ja sivunumero). SFX-palvelimelle määritellään myös asiakkaille tarjottavat palvelut esimerkiksi ne e-lehdet, joihin on hankittu käyttölisenssi.

Portaalissa käytetään OpenURL 0.1 versiota. Vuonna 2004 siirrymme käyttämään versiota 1.0 (NISO standardi). Uuden version ominaisuuksia ovat muun muassa uudet aineistotyypit, enemmän metadataa, version hallinta sekä työkaluja asiayhteyden kuvailuun.

Kirjastojen näyttöluetteloiden käytössä tavallinen ongelma on url-osoitteiden vanheneminen: dokumentin paikan muuttuessa (palvelin tai kansio) linkki hajoaa ja dokumenttia ei löydy. Urlien ylläpito on työlästä, sillä päivitys tehdään käsityönä. OpenURL kootaan vaikkapa kirjaston näyttöluettelossa olevasta dokumentin viitetiedosta. OpenURLeihin liittyvät päivitykset, kuten kohdetietokannan palvelimen muutos tehdään keskitetysti SFX-palvelimelle. OpenURL ei vanhene.

OpenURL on dynaaminen - linkki näytetään asiakkaalle vain, jos hänellä on oikeus käyttää dokumenttia. SFX-palvelimelle on määritelty instituutioittain asiakkaiden käyttöoikeudet. Ohjelmisto mahdollistaa tarkemmankin käyttöoikeuksien määrittelyn asiakkaan roolin mukaan (tutkija, opettaja, opiskelija).

 

Mitä ostettiin

SFX- ja Metalib-ohjelmistoilla on omat tietämystietokannat (knowledge base). Emme ostaneet pelkästään ohjelmistoja vaan huomattavan määrän bibliografista tietoa (SFX) ja valmiita hakujäsentimiä (Metalib). Nämä palvelut madaltavat portaalin käyttöönottokynnystä huomattavasti. Ohjelmistontoimittajat päivittävät tietämyskantoja kuukausittain.

Kaupalliseen toimijaan sitoutuminen on ainakin nykyisin järkevin vaihtoehto, sillä yksistään FinElibin kautta on hankittu Suomen yliopistokirjastoille yli 120 viite- ja kokotekstitietokantaa, joissa on mm. yli 11 000 e-lehteä. Tietokantojen käyttöönotto kotikonstein olisikin käytännössä mahdotonta: tietokantapalvelujen kehittyessä järjestelmät vaihtuvat, jolloin yleensä joudutaan päivittämään myös hakujäsentimet.

 

Keskitetyt palvelut / paikalliset palvelut

Taloudellisista ja tehokkuus syistä kannattaa osa portaalin käyttöönottotehtävistä keskittää Kansalliskirjastoon. Näitä ovat palvelimen ylläpidosta vastaaminen, ohjelmistojen ja tietämyskantojen päivitykset, FinELibin hankkimien elektronisten lehtien asennusohjeet ja listat asennettavista lehdistä. Hakujäsentimet tehdään keskitetysti, samoin käyttöliittymän eri kieliversiot ja aineistojen perusluetteloinnit. Suomen- ja englanninkieliset ovat valmiit. Ruotsinkielinen käyttöliittymä tehdään vuoden 2004 alussa. Lisäksi Kansalliskirjasto vastaa käyttöönottoprojektin koordinoinnista, konsultoinnista, markkinoinnista ja palvelujen kehittämisestä. Tiedonhaunopetusmateriaaleja voitaisiin tehdä yhdessä kansallisen informaatiolukutaidon opintosuunnitelma -hankkeen kanssa.

Paikallisia tehtäviä ovat asiakkaiden autentikointi, paikallisten aineistojen käyttöönotto ja palvelujen räätälöinti: tarjottavien palvelujen valinta, esimerkiksi kaukopalvelulomake, ja käyttöliittymän räätälöinti.

 

Asiakkaan haasteet

Hakuprosessi voi olla haastava Nelli-portaalin käyttäjälle. Ensin on valittava aineistot/tietokannat, joihin haku kohdistetaan. Ne valitaan aineiston nimen, aineistoryhmän tai -tyypin mukaan. Niitä voidaan hakea myös asiasanoilla tai sanahaulla aineistokuvauksesta. Varsinaisen haun tekemistä vaikeuttaa se, että tietokannat ovat erilaisia ja erikielisiä. Hakutulokset ovat usein suuria, mikä vaikeuttaa etsityn tiedon tai dokumentin löytymistä.

Aineiston valinta hankaloittaa tiedonhakua, mutta toisaalta aineistot on koottu yhteen paikkaan, mikä on tiedonhaun kannalta oleellista ja portaalifilosofian perusta. Nelli-portaali parantaa kirjastojen tarjoamia tiedonhakupalveluita, mutta asettaa samalla elektronisen kirjaston käyttäjille ja varsinkin tiedonhaun koulutukselle paljon haasteita.

 

Tietokarttahanke ja Nelli

Yliopistokirjastojen neuvoston tietokarttahankkeen tavoitteena on kartoittaa kirjastojen erilaiset aineistot ja kokoelmat sekä määritellä ne aihealuekokonaisuuksiksi. Lisäksi tavoitteena on kuvailla kokoelmat ja luetteloida ne DOMSiin. Osana hanketta on kokoelmien evaluointi. Kokoelmalähtöisen tarkastelun vastapainoksi on tavoitteena asiakkaan tietokartan piirtäminen, jossa käyttöliittymänä käytetään Nelli-portaalia. Tietokarttaprojektin ohjausryhmä on päätynyt käyttämään kokoelmien ryhmittelyssä Nelli-portaalin aineistoryhmittelyn päätasoa (13 ryhmää). Tietokarttahankkeessa haasteellisinta on yhdistää kokoelmalähtöinen ja asiakaslähtöinen lähestymistapa.

 

Open Access - tiedon saatavuuden turvaaminen

Kustantajat/välittäjät mm. Elsevier ovat saaneet lähes monopolistisen aseman elektronisten lehtien jakelussa. Elsevierin tarjonta on niin laadukas ja runsas etteivät yliopistot ja kirjastot voi toimia ilman sitä. Kustantajat ovat etulyöntiasemassa palvelun hinnan määrittelyssä. Kirjastojen ei auta kuin tyytyä ja ostaa tuotteet: Mitä tutkija tekisikään, jos kyseisiä e-lehtiä ei enää tilattaisikaan kirjastoihin.

Open Access on vaihtoehto tilausperusteiselle julkaisumallille. Asiakas saa OA-lehdet maksutta käyttöönsä. Julkaisukulujen rahoittamismalleja on jo useita, mutta ne ovat vasta kehitteillä. Kirjoittajat tai useimmiten heidän taustaorganisaationsa maksavat julkaisukulut itse tai ne katetaan vaihtoehtoisesti erilaisten yhdistysten rahoituksella.

Tiedonhakuportaalit ovat tärkeässä roolissa OA-julkaisemisen vakiinnuttamisessa, sillä aineistojen pitää olla helposti saavutettavissa. Vieläkin tärkeämpää on saada merkittäviä tieteellisiä julkaisuja OA-käytännön piiriin, jotta muutkin rohkaistuisivat tulemaan mukaan. Sisältö ratkaisee ei tekniikka.

Nellille on asetettu paljon odotuksia, jotka se varmasti lunastaa. Paljon työtä pitää vielä tehdä, mutta toisaalta palvelut paranevat ja asiakkaat tulevat yhä vaativimmiksi, mikä lisää työtä - ja se on hyvä.

  

Z vai Zing?


Tietolinja 02/2003

Ari Rouvari, pääsuunnittelija
Helsingin yliopiston kirjasto, Kansallisen elektronisen kirjaston palvelut

Henri Ryhänen, atk-suunnittelija
Helsingin yliopiston kirjasto, Tietokantapalvelut

PL 26, 00014 Helsingin yliopisto
Email: muotoa etunimi.sukunimi@helsinki.fi