Tietolinja

Tietolinja
02/2003

E-thesis - verkkojulkaisuja jo vuodesta 1999

Jyrki Ilva
Helsingin yliopiston kirjasto

URN:NBN:fi-fe20031963


Pääkirjoitus
Artikkelit
Uutisia,
ajankohtaista


Mitä tapahtuu Schrödingerin kissalle?
Mitä yhteistä on ritarilla ja samurailla?
Miksi marokkolaiset siirtolaiset pyrkivät Gibraltarin salmen yli Eurooppaan?
Millaista on masennuksen arki?

Myös tällaisiin kysymyksiin löytyy vastauksia Helsingin yliopiston opinnäytteitä ja sarjajulkaisuja julkaisevan E-thesis-palvelun sivuilta. E-thesiksen sivuilla käy päivittäin satoja koti- ja ulkomaisia tiedonhakijoita tutustumassa Helsingin yliopistossa tehtävään tutkimustyöhön. Syksyyn 2003 mennessä tämän Helsingin yliopiston kirjaston yhdessä Yliopistopainon ja tiedekuntien kanssa ylläpitämän palvelun kautta on ilmestynyt jo toista tuhatta verkkojulkaisua.

 

Opinnäytteitä verkkoon?

Ajatus tieteellisten julkaisujen levittämisestä elektronisessa muodossa verkon kautta alkoi saada tuulta siipiensä 1990-luvun puolivälin tienoilla. Osittain tämä kehitys oli sidoksissa maailmanlaajuisen Internet-verkon kehitykseen ja sen mahdollistamiin utopistisiin visioihin, osittain kyse oli aivan konkreettisista perinteisiin painetun julkaisutoiminnan väyliin kohdistuneista paineista, jotka pakottivat miettimään uudenlaisia ratkaisuja myös akateemisten opinnäytteiden julkaisukäytännöissä.

Suomessa väitöskirjojen määrän nopea lisääntyminen oli johtanut 1990-luvun kuluessa siihen, että monet perinteiset kotimaiset tieteelliset julkaisukanavat olivat tukkeutumassa yhä pahemmin, kun väitöskirjojen "pakkojulkaiseminen" söi aina vain suuremman osan resursseista. Lisäksi perinteinen väitöskirjavaihto koettiin monilta osin epätyydyttäväksi - huolimatta yliopiston kirjastolle luovutettavien ja maailmalle lähetettävien väitöskirjojen määrästä se ei taannut niille merkittävää julkisuutta. Päinvastoin useimpien väitöskirjojen kohtalona oli päätyä varastojen täytteeksi muun erittäin vähän kysytyn aineiston joukkoon. Niinpä väitöskirjojen levittäminen elektronisessa muodossa verkon kautta alkoi näyttäytyä yhä luontevampana väitöskirjojen julkaisuprosessia keventävänä ratkaisuna.

Suomessa verkkojulkaisemisen pioneereja olivat Helsingin yliopiston ohella Jyväskylän, Oulun ja Tampereen yliopistot, jotka kaikki käynnistivät omat julkaisupalvelunsa viimeistään vuoden 1999 kuluessa. Sittemmin myös Teknillinen korkeakoulu on ryhtynyt julkaisemaan väitöskirjojaan verkossa, ja useimmilla muillakin yliopistoilla on vähintään jonkinasteisia suunnitelmia opinnäytteiden verkkojulkaisemisen aloittamisesta.

Yliopistojen elektronisen julkaisutoiminnan tilanteesta on tehty vuosien kuluessa useita yleisen tason selvityksiä, mm. Tuija Sonkkilan kaksi kartoitusta (19.11.1999 ja 20.12.2000), FinELibin rahoittama Elektronisen julkaisemisen tekniset ohjeet (kevät 2000) ja Désirée Räsäsen Selvitys elektronisesta julkaisemisesta ja sisällöntarjonnan nykytilasta Suomen yliopistoissa ja korkeakouluissa (RTF, syksy 2002). Käytännössä suomalaisten yliopistojen sähköistä julkaisutoimintaa on toistaiseksi leimannut hajanaisuus, sillä kukin yliopisto on puuhastellut oman julkaisujärjestelmänsä parissa. Niinpä rakenteilla oleviin kansallisen ja kansainvälisen tason tiedonhakujärjestelmiin kohdistuu opinnäytteidenkin osalta runsaasti odotuksia.

 

Julkaisupankki-hankkeesta E-thesis-palveluun

Helsingin yliopiston kirjastotoimikunta asetti keväällä 1997 työryhmän valmistelemaan suunnitelmaa yliopiston elektronisen julkaisutoiminnan käynnistämiseksi. Työryhmä sai seuraavan vuoden kuluessa aikaan muistion ja hanke-esityksen yliopiston kirjaston koordinoimaa elektronisen julkaisemisen kokeilua varten. Helsingin yliopiston elektroninen julkaisupankki -hanke sai rahoitusta vuosiksi 1998 ja 1999 ja se käynnistettiin 24.3.1998. Hankkeen tärkeimpänä tavoitteena oli sellaisen palvelun luominen, jonka avulla Helsingin yliopiston opinnäytteitä ja julkaisusarjoja julkaistaan elektronisessa muodossa ja jaellaan verkon välityksellä.

Toista vuotta kestäneen selvitys- ja suunnittelutyön jälkeen hankkeen tuloksena syntynyt E-thesis-palvelu aloitti toimintansa syyskuun lopulla 1999. Toisin kuin monissa muissa yliopistoissa, Helsingin yliopiston kirjastolla ei ollut aiemmin ollut aktiivista roolia väitöskirjojen julkaisemisessa, vaan eri tiedekunnissa ja eri laitoksilla oli hyvin erilaisia julkaisutraditioita. Tämä mutkisti osaltaan E-thesiksen kaltaisen keskitetyn, koko yliopiston kattavan julkaisupalvelun suunnittelua.

Elektroninen julkaiseminen jätettiin ainakin toistaiseksi vapaaehtoiseksi, eikä siitä - osittain jo opinnäytteiden suuren määrän vuoksi - pyritty kehittämään mitään kaikenkattavaa tai pakollista järjestelmää. Optimistisena oletuksena oli, että elektronisen julkaisemisen suosio lisääntyisi vähitellen itsestään, kun palvelu saavuttaisi riittävän kriittisen massan. Tätä kehitystä pyrittiin tukemaan sillä, että julkaiseminen pidettiin tekijöiden kannalta ilmaisena ja mahdollisimman vaivattomana.

Aluksi E-thesiksen julkaisutoiminta oli opinnäytteiden tekijöiden kannalta täysin ilmaista, sillä yliopiston kirjasto huolehti alkuperäistiedostojen muuntamisesta julkaistavaan muotoon. Lisäksi väittelijöitä motivoi se, että elektroninen versio oikeutti yliopistolle luovutettavien painettujen kappaleiden määrän alentamiseen. Yliopiston konsistorin 5.5.1999 tekemän päätöksen mukaisesti yliopiston palvelimella julkaistusta väitöskirjasta täytyi näet aiemman 160 kirjan sijasta luovuttaa (tiedekunnasta riippuen) enää 30-50 painettua kappaletta.

Väitöskirjojen julkaiseminen verkossa yleistyi hyvin nopeasti. Jo pian E-thesiksen virallisten avajaisten jälkeen syksyllä 1999 lähes puolet uusista väitöskirjoista ilmestyi myös elektronisessa muodossa. Väitöskirjojen lisäksi E-thesis-palvelu pyrki luomaan toimintamallia myös gradujen ja lisensiaatintöiden julkaisemista varten. Julkaistavia töitä kerättiin alkuvaiheessa tuoreille, hyvän arvosanan saaneille graduntekijöille lähetetyllä kirjeellä. Tiedekunta- ja laitossarjojen julkaiseminen ei sen sijaan vielä tässä vaiheessa ennättänyt päästä vauhtiin, ja koko E-thesis-palvelun tilanne muuttui ennen kuin asiaan ennätettiin paneutua.

E-thesiksen pitkäjänteisempää kehittämistä vaikeutti se, että yliopiston kirjaston Julkaisupankki-hanketta varten yliopistolta saama rahoitus päättyi vuoden 2000 alussa, ja koko palvelun tulevaisuus oli tämän vuoksi pitkän aikaa hämärän peitossa. Lopulta E-thesiksen toimintaa muutettiin yliopiston johdon päätöksestä siten, että verkkojulkaisujen tuottaminen siirrettiin huhtikuun 2000 alusta lähtien Yliopistopainolle, jolloin siitä samalla tuli maksullista toimintaa.

Projektirahoituksen loputtua E-thesiksen käytössä olevat resurssit yliopiston kirjastossa kutistuivat dramaattisesti. Kevään 2000 jälkeen palvelulla ei enää ollut lainkaan kokopäivätoimista henkilökuntaa, vaan sitä pyöritettiin seuraavat kolme vuotta vastuuhenkilöiden muiden töiden ohessa. Käytännössä tämä resurssien väheneminen johti väistämättä siihen, että palvelun kehittäminen hidastui merkittävästi. Vertailun vuoksi voi mainita, että esim. Helsingin yliopistoa kooltaan vastaavan Uppsalan yliopiston verkkojulkaisuista huolehtivalla, vuonna 2000 perustetulla Enheten för digital publisering -yksiköllä on tällä hetkellä peräti yhdeksän työntekijää. Tämän Uppsalan yliopiston kirjastossa toimivan yksikön tehtävät ovat tosin jonkin verran E-thesistä laajemmat.

 

Julkaisuprosessi

E-thesiksen julkaisut sijaitsevat Helsingin yliopiston kirjaston ylläpitämällä palvelimella, jonka verkko-osoite on http://ethesis.helsinki.fi. Julkaisut ovat vapaasti kaikkien kiinnostuneiden luettavissa, ja ne voi myös tulostaa omaan käyttöönsä. Julkaisujen lisäksi palvelun verkkosivuilla on myös runsaasti opinnäytteiden tekijöille tarkoitettuja ohjeita, ja sivut ovatkin monille väittelijöille ja graduntekijöille tärkein tietolähde E-thesiksen toiminnasta ja julkaisemisen pelisäännöistä.

E-thesiksen toiminnan perusperiaatteena on se, että opinnäytteiden julkistaminen E-thesis-palvelimella on tekijälle ilmaista. E-thesis-palvelu ei kuitenkaan muunna tiedostoja julkaistavaan muotoon (PDF-tiedostoksi), sillä tämä työ on annettu Yliopistopainon tehtäväksi. Yliopistopainon kautta kulkevan maksullisen väylän lisäksi tekijöillä on myös mahdollisuus toimittaa teoksensa suoraan yliopiston kirjastoon, edellyttäen että se on muokattu valmiiksi verkkojulkaisuksi. Pro gradujen, lisensiaatintöiden ja sarjajulkaisujen tiedostojen tuottamiseen Yliopistopaino ei ole yleensä osallistunut, vaan ne ovat enimmäkseen tulleet suoraan tekijöiltä tai niiden julkaisemisesta vastanneilta laitoksilta.

Viime aikoina Yliopistopainon markkinaosuus kaikista elektronisista väitöskirjoista on ollut hieman yli puolet. Esim. vuoden 2003 ensimmäisen puoliskon 123 väitöskirjasta 66 tuli julkaistavaksi Yliopistopainon kautta ja 57 suoraan tekijöiltä. Eri alojen opiskelijoiden julkaisuteknisissä valmiuksissa on kuitenkin silmiinpistäviä eroja: matemaattis-luonnontieteellisessä tiedekunnassa enemmistö väittelijöistä teki teoksensa verkkoversion itse, kun taas esim. lääketieteellisessä tai valtiotieteellisessä tiedekunnassa valtaosa julkaisuista tuli Yliopistopainon kautta. Huomattava osa myös suoraan tekijöiltä tulleista julkaisuista on kuitenkin painettu Yliopistopainossa, eli tällaisissa tapauksissa kyse on yleensä siitä, että tekijä on jo toimittanut teoksen PDF-muodossa Yliopistopainoon, eikä ole enää halunnut maksaa erikseen verkkoversion tekemisestä.

Väitöskirjat julkaistaan E-thesiksen sivuilla normaalisti riiputusajan alkaessa kymmenen päivää ennen väitöstilaisuutta. Osa väittelijöistä julkistaisi teoksensa mieluusti jo aiemmin, mutta tämä selkeä aikataulu on kuitenkin osoittautunut palvelun toiminnan kannalta käytännölliseksi. Tässä aikataulussa on myös se hyvä puoli, että riiputusajan alkamisen jälkeen voidaan ryhtyä kyselemään mahdollisten puuttuvien väitöskirjojen perään, jos niiden tulo vain on ollut etukäteen tiedossa.

Ennakkotiedot tulossa olevista elektronisista väitöskirjoista kerätään E-thesiksen www-sivujen uutuuslistaan, sitä mukaa kun väitöskirjan tiedot ilmestyvät yliopiston viestintäosaston ylläpitämään väitöskalenteriin tai kun julkaisusopimus tai julkaistava aineisto saapuvat yliopiston kirjastoon. Väitöskirjan virallinen riiputuskappale on edelleen painettu versio, eli aikataulusta lipsuminen ei sinällään ole mikään katastrofi. Gradujen, lisensiaatintöiden ja sarjajulkaisujen kohdalla tällaista tiukkaa aikataulua ei normaalisti ole, ja ne on muiden kiireiden salliessa julkaistu välittömästi sen jälkeen kun kaikki tarvittava materiaali on tullut perille ja tietojen paikkansapitävyys on saatu tarkistettua.

Tekijän ja kirjaston välillä solmittavan julkaisusopimuksen mukaisesti väitöskirjan tulee olla sisällöltään identtinen tiedekunnalle jätetyn version kanssa, eikä sisältöä voida enää jälkikäteen muuttaa, vaikka se sisältäisi virheellistä tietoa. Väittelijä on kuitenkin halutessaan voinut liittää väitöskirjansa yhteyteen erillisen errata-sivun, jolla virheet on eritelty ja korjattu. Sama sääntö on koskenut myös E-thesiksessä julkaistuja graduja ja lisensiaatintöitä - myös niiden tulee olla sisällöltään identtisiä tiedekunnassa hyväksytyn version kanssa. Toisaalta julkaisujen ulkoasu saattaa poiketa huomattavasti painetusta versiosta, ja täydellisen samankaltaisuuden saavuttaminen on usein jo teknisistä syistä käytännössä mahdotonta.

Käytännössä tätä painetun julkaisun ja verkkoversion identtisyyttä ei ole mahdollista kontrolloida ainakaan kattavasti, eli koko systeemi perustuu pohjimmiltaan luottamukseen. Tavallaan tässä tekstien identtisyyttä ja muuttumattomuutta korostavassa politiikassa on omat ongelmansa, sillä jos mahdollisia teksteihin sisältyviä virheitä ei jälkeenpäin saa korjata, ne saattavat jatkaa elämäänsä verkossa ja olla satunnaisten, tekstien kontekstia tuntemattomien lukijoiden kannalta hämääviä. Lisäksi on mahdollista argumentoida sen puolesta, että opinnäytteen muokkaaminen vielä hyväksymisen jälkeen paremmin verkkojulkaisuksi soveltuvaan muotoon voisi olla hyödyllinen osa oppimisprosessia. Tämä edellyttäisi kuitenkin laajempia muutoksia nykyisiin opinnäytteiden ohjaus- ja hyväksymisprosesseihin.

 

Teknisiä ratkaisuja

Helsingin yliopiston elektronisen julkaisupankin kaikkien julkaisujen oli alunperin tarkoitus olla saatavilla sekä PDF- että HTML-muodossa. Jo projektin varhaisvaiheessa vuonna 1999 alkoi kuitenkin käydä selväksi, että opinnäytteiden muuntaminen riittävän laadukkaaksi HTML:ksi oli monissa tapauksissa hyvin työläs prosessi, jopa niin ettei se aina lainkaan maksanut vaivaa. Lopullisesti HTML syrjäytyi sen jälkeen kun julkaisujen tuottaminen siirtyi yliopiston kirjastolta Yliopistopainon maksulliseksi toiminnaksi. HTML-version tuottaminen oli niin kallista, ettei väittelijöillä ollut halukkuutta kustannusten maksamiseen.

E-thesiksen pääasiallinen julkaisuformaatti on siis ollut PDF - muutamaa yksittäistä poikkeusta lukuun ottamatta kaikki julkaisut ovat saatavilla tässä muodossa. PDF sopiikin erinomaisesti paperilla julkaistavaksi tarkoitettujen tekstien sähköiseen levitykseen, sillä PDF-tiedosto säilyttää julkaisun ulkoasun ja mahdollistaa sen tulostamisen paperille alkuperäisen kaltaisena. Lisäksi PDF-tiedoston tuottaminen on automaattista ja useimmissa tapauksissa ongelmatonta (olettaen että tarvittavat ohjelmat ovat käytettävissä), eli se ei vaadi sen paremmin kohtuutonta työmäärää kuin kovin merkittävää teknistä erityisosaamistakaan.

Julkaisujen pitkäaikaissäilytyksen kannalta PDF ei ole optimaalinen ratkaisu, mutta ainakin E-thesiksen nykyresursseilla se on käytännössä ainoa realistinen mahdollisuus. PDF säilyttää sekä tekstin sisällön että ulkoasun, mutta toisaalta sitä on hankala enää kääntää johonkin muuhun, pitkäaikaissäilytyksen kannalta mahdollisesti soveltuvampaan muotoon. E-thesiksen aineiston "lopulliseksi" tallennusformaatiksi on tarjottu esim. XML:ää, mutta kuten jo HTML-versioiden kohdalla kävi ilmi, tieteellisten tekstien kaltaiset kompleksiset ja heterogeeniset dokumentit soveltuvat usein huonosti automaattiseen käännökseen, eikä tällä hetkellä ole saatavilla sellaisia ohjelmistoja, jotka pystyisivät tekemään riittävän luotettavia ja laadukkaita käännöksiä erilaisista tiedostoformaateista.

Monista muista vastaavista palveluista poiketen E-thesiksellä ei ole ollut käytössään mitään tietokantaratkaisua, vaan julkaisut sijaitsevat omissa hakemistoissaan tavallisella Linux-palvelimella, ja palvelun www-sivut ovat aivan tavallisia käsin koodattuja HTML-sivuja. Jos tilanteesta haluaa etsiä hyviä puolia, kiinteät HTML-sivut ovat soveltuneet hyvin hakukoneiden robottien haravoitavaksi, eli julkaisujen löydettävyys tätä kautta on kuitenkin ollut hyvä.

 

Aineisto

E-thesis-palvelussa on vuoden 2003 loppuun mennessä julkaistu lähes 1200 nimekettä. Suurin osa julkaisuista (noin 950) on väitöskirjoja, mutta mukaan mahtuu myös noin 170 gradua ja jonkin verran lisensiaatintöitä ja erilaisia sarjajulkaisuja. Seuraavassa taulukossa on eritelty vuosittain ja julkaisun tyypin mukaan palvelussa ilmestyneet nimekkeet:

Vuosi Väitöskirjat Lisensiaatintyöt Pro gradut Sarjajulkaisut
1999 78 3 56 -
2000 197 2 28 2
2001 215 3 18 4
2002 229 2 31 4
2003 237 3 37 35

Julkaisujen vuosittainen kokonaismäärä on siis pysynyt alusta lähtien melko vakaana. Verkkojulkaisuna ilmestyvien väitöskirjojen osuus kaikista väitöskirjoista on tosin hiljalleen kasvanut, ja nykyään jo yli kaksi kolmasosaa kaikista Helsingin yliopiston väitöskirjoista ilmestyy verkossa. Gradujen julkaiseminen on jäänyt palvelun alkuvaiheiden jälkeen taka-alalle ja niiden määrä on pysynyt potentiaaliseen volyymiin verrattuna vähäisenä, noin yhdessä prosentissa kaikista vuosittain hyväksyttävistä graduista. Gradujulkaisujen määrässä on tosin tapahtunut hienoista kasvua vuosien 2000-2001 aallonpohjan jälkeen, ja on ilmeistä, että määrä voisi kasvaa hyvinkin nopeasti, jos palvelua markkinoitaisiin graduntekijöille. Sarjajulkaisujen osalta alkuvuonna 2003 tapahtunut määrän lisääntyminen johtuu käytännössä kokonaan yhden uuden, aiempia aktiivisemman sarjan siirtymisestä verkkojulkaisuksi.

Väitöskirjat

E-thesis-palvelussa vuoden 2003 ensimmäisen puoliskon aikana julkaistut 123 väitöskirjaa jakautuivat tiedekunnittain seuraavasti:

TiedekuntaLukumäärä
Lääketieteellinen 40
Matemaattis-luonnontieteellinen 37
Maatalous-metsätieteellinen 12
Valtiotieteellinen 10
Kasvatustieteellinen 9
Humanistinen 8
Eläinlääketieteellinen 4
Teologinen 2
Erillislaitokset 1

Suurin osa elektronisessa muodossa ilmestyneistä väitöskirjoista oli siis lääketieteellisestä ja matemaattis-luonnontieteellisestä tiedekunnasta, joissa muutenkin julkaistaan vuosittain eniten väitöskirjoja. Elektronisten julkaisujen jakauma ei silti vastaa suoraan kaikkien julkaistujen väitöskirjojen tiedekuntakohtaista jakaumaa, vaan eri tiedekuntien välillä on huomattavia eroja siinä miten suuri osa väitöksistä päätyy elektroniseen muotoon.

Enemmistö E-thesiksessä julkaistuista väitöskirjoista on tieteellisissä lehdissä aiemmin ilmestyneistä artikkeleista koostuvia ns. artikkeli- tai nippuväitöskirjoja. Artikkeliväitöskirjoista palvelussa julkaistaan tekijänoikeussyistä ainoastaan yhteenveto-osa - vaikka julkaisuluvan saaminen kustantajalta olisi sinällään useimmissa tapauksissa mahdollista, tekijänoikeuksien ja mahdollisten kustantajien erityisvaatimusten hallinnointi olisi hyvin työlästä. Suomalaista yliopistoista toistaiseksi ainoastaan Teknillinen korkeakoulu on julkaissut verkkopalvelussaan myös väitöskirjoihin sisältyvät artikkelit.

Artikkeliväitöskirjoja koskevasta säännöstä on E-thesiksessä poikettu vain muutamassa tapauksessa erityisen perustelluista syistä, ja tällöinkin tekijän on täytynyt toimittaa kirjallisena kustantajien antamat julkaisuluvat. Käytännössä tämä on tarkoittanut sitä, että monet E-thesiksessä ilman artikkeleita julkaistuista väitöskirjoista ovat hyvinkin suppeita, lyhimmillään jopa vain kymmenkunta sivua. Verkossa julkaistavaan artikkeliväitöskirjaan tulee kuitenkin sisältyä alkuperäisten artikkelien julkaisutiedot, joiden perusteella lukija voi saada ne käsiinsä.

Artikkeliväitöskirjat ovat erityisen tavallisia etenkin lääketieteessä ja luonnontieteissä, kun taas monografiat ovat edelleen tyypillisiä mm. humanistisissa ja yhteiskuntatieteissä. Tämä jako on monilta osin yhteneväinen myös E-thesiksen julkaisujen tiedekuntajakauman kanssa, sillä lähes kaikki lääketieteen ja luonnontieteiden väitöskirjat ilmestyvät verkossa, kun taas esim. humanistisessa tai teologisessa tiedekunnassa verkkojulkaiseminen on yhä selkeästi harvinaisempaa. Osittain tämä selittyy sillä, että monet näiden tieteenalojen väitöskirjat tulevat erilaisten kaupallisten kustantajien kautta, jolloin kustantaja ei välttämättä anna lupaa teoksen elektronisen version julkaisemiseen vapaasti verkossa. Toisaalta tähänastisten kokemusten perusteella näyttää siltä, että verkossa saatavilla oleva PDF-versio usein pikemminkin lisää väitöskirjaan kohdistuvaa kiinnostusta kuin kilpailee painetun version kanssa. Tästä kertoo sekin, että suuri osa E-thesis-palveluun tulevasta palautteesta on nimenomaan kyselyitä siitä, mistä kirjaa mahdollisesti saa ostaa.

Verkkojulkaisemiseen on monessa yhteydessä liitetty visioita hypertekstimuotoisista väitöskirjoista, jotka hyödyntäisivät audiovisuaalista aineistoa ja kokeilisivat muutenkin uuden tekniikan ja ilmaisukeinojen rajoja. Tähänastisen kokemuksen perusteella näyttää kuitenkin siltä, että sähköisen julkaisemisen avantgarde on jossain aivan muualla kuin akateemisissa väitöskirjoissa. Väitöskirjojen konsepti on jo niiden rituaalisen funktion vuoksi korostetun konservatiivinen - kun tärkeintä on toisaalta intellektuaalinen sisältö ja toisaalta perinteisten muodollisten kriteerien noudattaminen, muotokokeiluihin tai riskien ottamiseen ei yleensä riitä motivaatiota. Niinpä verkossa julkaistut teokset ovat pysyneet uskollisina perinteiselle painetun julkaisun formaatille, mitä myös tekniseksi julkaisuformaatiksi vakiintunut PDF-muoto palvelee hyvin.

Pro gradut

Verkkojulkaisujen tuottamisen siirryttyä keväällä 2000 Yliopistopainon maksulliseksi toiminnaksi gradujen julkaiseminen E-thesiksessä loppui hetkeksi lähes kokonaan. Tämän vuosien 2000-2001 aallonpohjan jälkeen gradujulkaisujen määrä on lähtenyt hitaaseen kasvuun, vaikka E-thesikseen päätyy edelleen vain häviävän pieni otos kaikista Helsingin yliopistossa vuosittain hyväksyttävistä graduista. Kovin paljon suurempia määriä ei E-thesiksen nykyresursseilla olisi edes mahdollista käsitellä, ja tämän vuoksi palvelua ei ole sen ilmeisestä potentiaalista huolimatta markkinoitu opiskelijoille muuten kuin E-thesiksen omilla kotisivuilla olevan ohjeistuksen avulla. Kaikki julkaistavaksi tarjotut, teknisesti riittävän hyvätasoiset opinnäytteet on kuitenkin haluttu ottaa mukaan. Julkaiseminen onkin perustunut tyystin opiskelijoiden - tai joissakin tapauksissa heidän opettajiensa - omaan aktiivisuuteen.

Käytännössä suuri osa elektronisesta muodossa julkaistuista graduista on ollut huomattavan tasokkaita - joukossa on runsaasti laudaturin ja eximian graduja. Gradujulkaisujen tieteenalakohtainen profiili poikkeaa merkittävästi väitöskirjoista ja tavallaan myös paikkaa väitöskirjojen epätasaista jakaumaa: siinä missä lääketiede ja luonnontieteet dominoivat väitöskirjoissa, suurin osa verkossa julkaistuista graduista on ns. pehmeiltä tieteenaloilta. Väitöskirjoista poiketen enemmistö graduista on myös suomenkielisiä.

Tähänastisten kokemusten perusteella gradujen julkaiseminen verkossa vaikuttaa mielekkäältä toiminnalta. Jos palvelun markkinointiin, graduntekijöiden opastamiseen ja julkaistavan materiaalin käsittelyyn vain olisi resursseja, julkaistavien töiden määrää olisi todennäköisesti mahdollista kasvattaa hyvinkin nopeasti. Sekä käyttötilastoista että käyttäjiltä tulevista kyselyistä päätellen gradut kiinnostavat lukijoita, ja niitä toivotaan saataville lisää. Samoin tiedekuntakirjastojen päivittäisen kokemuksen mukaan monien oppiaineiden gradut ovat olleet hyvinkin kysyttyä aineistoa.

Vaikka gradujen julkaisemisessa olisi runsaasti potentiaalia, vaikuttaa kuitenkin siltä, että niitä koskevaa yhtenäistä, koko Helsingin yliopiston kattavaa poliittista tahtoa on vaikeampi löytää kuin väitöskirjojen kohdalla. Tämä johtuu todennäköisesti osaltaan siitäkin, että gradujen asema ja merkitys vaihtelevat huomattavasti eri tiedekunnissa ja eri oppialoilla. Lääketieteellisessä tiedekunnassa varsinaisia pro gradu -töitä ei edes tehdä.

Gradujen suuren määrän ja tieteenalakohtaisten erojen vuoksi tuntuisikin luontevalta hajauttaa niitä koskevaa toimintaa osittain tiedekuntiin ja kampuksille, vaikka itse aineisto kannattaa toki kerätä yhteen koko yliopiston kattavaan järjestelmään. E-thesiksen nykyisinkin tarjoama vapaaehtoisuuteen ja graduntekijöiden omaan aktiivisuuteen perustuva julkaisumahdollisuus voisi säilyä entisellään, mutta tiedekunnat voisivat sen lisäksi halutessaan päättää myös omien opinnäytteidensä laajemmasta julkaisemisesta. Ensisijaisena lyhyen tähtäimen tavoitteena voisi ehkä pitää sitä, että edes opinnäytteiden tiivistelmät olisivat tavalla tai toisella saatavilla elektronisessa muodossa. Esim. Helsingin yliopiston valtiotieteellisessä tiedekunnassa tiivistelmät on jo nyt koottu tiedekunnan omaan tietokantaan.

Sarjajulkaisut

E-thesis on hyväksynyt julkaistavaksi kaikki sille tarjotut laitos- ja tiedekuntasarjojen julkaisut. Koska Helsingin yliopisto ei ole toistaiseksi määritellyt omaa politiikkaansa verkossa ilmestyvien sarjajulkaisujen suhteen eikä sarjoilla yleensä ole erikseen nimettyjä toimituskuntia, on katsottu kunkin laitoksen/tiedekunnan olevan omalla alallaan riittävä auktoriteetti arvioimaan julkaisujen tasoa. Lisäksi on syytä huomata, että osa julkaisuista on erilaisia oppaita ja raportteja, joiden tasoa ei välttämättä muutenkaan tarvitse arvioida tieteellisin kriteerein.

Tähän mennessä on käynyt ilmi ainakin se, että nykymuotoinen E-thesis soveltuu ensisijaiseksi pysyväksi tarkoitettujen teosten julkaisemiseen. Sen sijaan opinto-oppaat ja esim. jatkuvasti päivitettävät opetusmonisteet sopivat paremmin laitosten tai tiedekuntien omille kotisivuille. Vaikka sama teos voi toki ilmestyä uudestaan uutena painoksena, tällainen olisi usein päivitettävän julkaisun kohdalla kohtuuttoman hankalaa ja aiheuttaisi helposti turhia sekaannuksia, jos lukijat voivat edelleen päätyä teoksen vanhan version pariin. Lisäksi tekstien päivittäminen on oleellisesti helpompaa, jos ne ovat suoraan tekijöiden ulottuvilla - E-thesis-palvelimella sijaitsevia tiedostoja ei ole tällä hetkellä mahdollista päivittää muualta kuin yliopiston kirjastosta käsin.

Sarjajulkaisut ovat tulleet pääasiassa valmiiksi PDF-muotoisina suoraan laitoksilta. Julkaisujen vaihtelevan formaatin vuoksi niiden nimiösivut ja muu esillepano ovat vaatineet joissakin tapauksissa huomattavaa soveltamista verrattuna väitöskirjoihin. Esim. helmikuussa 2003 Metsävarojen käytön laitoksen julkaisusarjassa ilmestynyt ECOWOOD studies made at the University of Helsinki sisältää koosteen kaikista yhden tietyn projektin yhteydessä laitoksella tehdyistä tutkimuksista. Lukuisien artikkelien ja raporttien lisäksi julkaisuun sisältyy myös kolme tietokoneohjelmaa.

Julkaisujen määrän puolesta merkittävin E-thesiksen julkaisusarjoista on Kansantaloustieteen laitoksen Discussion papers, joka siirtyi helmikuussa 2003 painetusta muodosta verkkojulkaisuksi. Sarjassa ilmestyy vuosittain arviolta 40-50 nimekettä. Suurin osa muista sarjajulkaisuista on ilmestynyt sekä painettuna että verkkoversiona, eli niiden osalta kyse on rinnakkaisjulkaisemisesta. Yleensä elektroniset julkaisut ovat ilmestyneet vanhan painetun sarjan osana tai jatkona (samalla ISSN-numerolla), joissakin tapauksissa niitä varten on perustettu kokonaan uusi, pelkästään elektronisille julkaisuille varattu sarja.

 

E-thesis ja käyttäjät

E-thesis-palvelun käytöstä on kerätty kuukausittaisia palvelimen lokitietoihin perustuvia tilastoja syksystä 2000 lähtien. Yleisenä trendinä on ollut se, että sekä kävijämäärät että julkaisujen käyttö ovat lisääntyneet tasaisesti, ainakin jos vuodenajoista johtuvat vaihtelut suodatetaan tilastoista pois. Yksittäisten julkaisujen keskimääräinen lukijamäärä on pysynyt lähes vakiona mutta julkaisujen määrän jatkuva lisääntyminen on kuitenkin kasvattanut kokonaisvolyymia huomattavasti. Siinä missä palvelimelta lokakuussa 2000 ladattiin tiedostoja 4,5 GB:n edestä, määrä oli kolme vuotta myöhemmin kasvanut jo 38,9 GB:iin. Samana aikana palvelun suomenkielisen pääsivun kuukausittaisten latauskertojen määrä kasvoi noin neljästä tuhannesta yli yhdeksään tuhanteen.

Keväästä 2002 alkaen E-thesiksen www-sivuille on koottu tilastoja suosituimpien yksittäisten julkaisujen kävijämääristä. Suurimmat kuukausittaiset kävijämäärät ovat yltäneet muutamaan sataan, ja keskiarvo lienee tällä hetkellä noin 40-50 kävijän tienoilla. On tosin ilmeistä, että sivustoa säännöllisesti haravoivat hakurobotit aiheuttavat jo sinällään sen verran liikennettä, että niiden aiheuttaman "taustakohinan" vuoksi luvuista voi leikata pois arviolta parisenkymmentä kuukausittaista kävijää. Erilaiset hakurobotit aiheuttavatkin nykyään noin 20-30% E-thesis-palvelimen kaikesta liikenteestä.

Yksi yllättävimmistä tilastojen paljastamista ilmiöistä on gradujen suhteettoman suuri suosio verrattuna väitöskirjoihin. Vaikka graduja on vain noin 15% kaikista E-thesiksen julkaisuista, niiden osuus 50 suosituimmasta julkaisuista on kuitenkin huomattavasti suurempi, lukukausien aikana ajoittain jopa lähes puolet. Osittain tämä epäsuhta johtuu varmaankin siitä, että gradut painottuvat erilaisille tieteenaloille kuin väitöskirjat, ja monet niistä käsittelevät keskivertoväitöskirjaa yleistajuisempia aiheita, joilla on mielenkiintoa myös ns. suuren yleisön keskuudessa.

Vastaava ilmiö on nähtävissä myös muiden suomenkielisten julkaisujen kohdalla: vaikka englanninkielisiä julkaisuja on monin verroin enemmän, suomenkieliset tekstit keräävät keskimäärin selvästi enemmän lukijoita. Se, onko tämä positiivinen vai negatiivinen asia, riippuu suurelta osin näkökulmasta. Toisaalta suomenkielisten julkaisujen suhteettoman suuri suosio kertoo siitä, ettei palvelu ole välttämättä tavoittanut kovin suurta kansainvälistä yleisöä, toisaalta kotimaassa kiinnostusta tuntuu löytyvän myös yliopisto- ja tiedemaailman ulkopuolelta.

Julkaisujen yleisö

E-thesiksen kaltaisella Open Access -palvelulla on väistämättä useita erilaisia yleisöjä. Sen julkaisut ovat yhtä lailla yliopiston oman väen, kansainvälisen tiedeyhteisön kuin aivan satunnaisten verkonkäyttäjien löydettävissä ja luettavissa. Kenelle palvelu oikeastaan on suunnattu? Ovatko kaikki sivuille päätyneet tiedonhakijat yhtä merkittäviä? Tällaisille kysymyksille ei välttämättä ole helppoa löytää aivan yksiselitteisiä vastauksia. Yhtä lailla myös yliopistolla itsellään on useita erilaisia rooleja sekä yhteiskunnallisena vaikuttajana että kansainvälisen tiedeyhteisön osana.

Tilastojen mukaan enemmistö E-thesiksen julkaisujen käyttäjistä tulee edelleen Suomesta, vaikka myös ulkomaisten käyttäjien osuus on vähitellen lisääntynyt. Useat seikat viittaavat siihen, että suuri osa kotimaisista kävijöistä tulee katsomaan E-thesis-palvelua kokonaisuutena ja etsimään sieltä kiinnostavia julkaisuja, kun taas ulkomaiset käyttäjät päätyvät E-thesis-palvelimella sijaitseviin tiedostoihin usein enemmänkin sattumanvaraisesti, jonkin tekemänsä nettihaun kautta. Tämä lienee jokseenkin väistämätöntä sen vuoksi, että kansallisella tasolla E-thesis on jo sinällään merkittävä palvelu, kun taas harvoja ulkomailta tulevia tiedonhakijoita kiinnostaa, mitä jostakin asiasta on kirjoitettu juuri Helsingin yliopistossa. Toisaalta useimpien tiedonhakijoiden kannalta lienee yhdentekevää minkä nimisellä tai missä maassa sijaitsevalla palvelimella heidän löytämänsä dokumentti sijaitsee, jos se sisältää heidän etsimänsä informaation tai on muuten mielenkiintoinen.

Vaikka Internetin maakohtaiset domain-päätteet eivät aina kerro aivan luotettavasti mistä kukin käyttäjä on todella tullut, niiden pohjalta tehty E-thesiksen käyttäjien jaottelu antaa kuitenkin viitteitä siitä, että palvelun sivuille riittää kävijöitä lähes kaikista maailman maista. Suurin osa ulkomaisista kävijöistä tulee toki USA:sta ja muista läntisistä teollisuusmaista, mutta toista sataa domain-päätettä käsittävän listan loppupäästä löytyy useita sellaisia kehitysmaita joissa Internetin käyttö ei todennäköisesti ole kovin arkipäiväistä huvia.

Käyttötilastojen lisäksi myös erilaiset sähköpostitse ja puhelimitse tulevat kyselyt antavat viitteitä aineiston käytöstä ja käyttäjien toiveista. Tavallisimmista palveluun tulevista kysymyksistä saa jonkinlaisen kuvan esim. E-thesiksen Usein kysytyt kysymykset -sivulta. Erilaisia teknisiä toimintahäiriöitä koskevien valitusten jälkeen yleisin kyselyjen aihe on se, mistä kirjojen painettuja versioita voi ostaa. Ulkomailta tulee ajoittain kyselyitä jonkin E-thesiksessä julkaisseen tutkijan yhteystiedoista tai jonkin yksittäisen julkaisussa mainitun artikkelin saatavuudesta. Toisinaan kysellään myös olisiko vanhempia vuosikymmenten takaisia julkaisuja saatavilla sähköisessä muodossa.

E-thesiksen julkaisujen markkinointi on toistaiseksi ollut hyvin vähäistä. Suurelta osin se on jäänyt julkaisujen tekijöiden omalle vastuulle - osa tekijöistä on mainostanut julkaisuaan aktiivisesti, osalle taas riittää, että se on ylipäänsä saatavilla. On todennäköistä, että verkkojulkaisemisen arkipäiväistyessä mielenkiinto yksittäisiä verkkojulkaisuja kohtaan on vähentynyt. Siinä missä uuden julkaisun ilmestyminen saattoi vielä viisi vuotta sitten olla uutinen, nyt uutuusjulkaisuja koskevien viestien lähettäminen vaikkapa tieteenalakohtaisille sähköpostilistoille saatettaisiin jossain vaiheessa jo tulkita ei-toivotuksi viestinnäksi. Tiede- ja kulttuuriuutisia kirjoittavilta toimittajilta on tullut jonkin verran kyselyitä ajankohtaisista väitöskirjoista, mutta tällaisissa jutuissa ei yleensä mainita lainkaan sitä, että teos on saatavilla myös E-thesiksen kautta. Sinällään E-thesikseen viittaava linkki sopisi ainakin verkkomediassa julkaistuihin juttuihin hyvin, sillä se antaisi uutisen lukijalle mahdollisuuden päästä suoraan alkuperäisen tekstin ääreen.

Tiedonhaun väline?

E-thesiksen verkkosivut tarjoavat tällä hetkellä käyttäjilleen vain melko rajallisia selailumahdollisuuksia. Tilannetta kohentaa oleellisesti se, että julkaisuihin on mahdollista päästä käsiksi muitakin reittejä. Palvelun omien kotisivujen julkaisulistojen lisäksi E-thesiksen julkaisemat väitöskirjat on näet luetteloitu myös Helka-, Fennica- ja Linda-tietokantoihin, joissa kunkin väitöskirjan tietueesta on hyperlinkki suoraan itse julkaisun nimiösivulle.

Näiden kotimaisten kirjastotietokantojen lisäksi julkaisut rekisteröityvät moniin verkkoa haravoivien hakurobottien keräämiin tietokantoihin, ja ne ovat löydettävissä myös näiden kautta. Kansainvälisistä hakukoneista ainakin Google ja AlltheWeb indeksoivat myös PDF-tiedostojen sisällön, eli tiedonhakija voi löytää PDF-muotoiset julkaisut myös silloin kuin hakutermi sijaitsee ainoastaan tiedoston sisällä. Kotimaisista hakukoneista on syytä mainita Helsingin yliopiston oma, yliopiston sivuihin kohdistuva hakupalvelu, joka on myös käytettävissä E-thesiksen omilla sivuilla palvelun julkaisuihin rajattuna versiona. Lisäksi E-thesiksen julkaisuihin ja E-thesis-palveluun itseensä on epälukuinen määrä linkkejä myös erilaisilla muilla www-sivuilla, eli osa tiedonhakijoista päätyy palvelun sivuille myös niiden kautta.

E-thesiksen palvelimen keräämistä referrer-tiedoista koottu tilasto osoittaa, että valtaosa kävijöistä on päätynyt E-thesiksen sivuille jonkin verkon yleisen hakukoneen kautta. Googlen ja sen kansallisten versioiden ylivoimainen suosio muihin hakukoneisiin verrattuna on erityisen silmiinpistävää. Googleen verrattuna kirjastotietokantojen osuus näyttää suhteessa lähes masentavan pieneltä. Jopa Helsingin yliopiston kirjastojen yhteisen Helka-tietokannan kautta tulleiden hakujen määrä on vain pieni murto-osa Googlen luvuista, ja muiden kirjastotietokantojen osalta luvut ovat vielä vähäisempiä.

Osittain tämä epäsuhta johtuu E-thesis-palvelun erityisluonteesta avoimena verkkopalveluna, sillä toisin kuin jossain tietyssä kirjastossa sijaitsevilla painetuilla julkaisuilla, verkon välityksellä vapaasti saatavilla olevilla kokotekstijulkaisuilla on aivan toisella tavalla potentiaalista kansainvälistä mielenkiintoa. Google ja muut laajassa käytössä olevat hakukoneet tavoittavat aivan toisenlaisen yleisön kuin Helkan kaltaiset paikalliset tai kansalliset tietokannat, eikä niitä tämän vuoksi kannata ajatella toistensa kilpailijoina. Lisäksi on syytä huomata, että toisin kuin kirjastotietokannat, Google ei hyödynnä asiasanoja tai dokumentteihin liittyvää metadataa, eli niiden tarjoamat hakuominaisuudet poikkeavat tässäkin suhteessa.

 

Aavistuksia tulevasta

Rahoituksen ja riittävien henkilöresurssien puuttuessa elektronisen julkaisemisen eteneminen Helsingin yliopistossa on ollut monilta osin paljon hitaampaa kuin olisi toivottavaa. Vaikka myös E-thesiksen tekninen infrastruktuuri kaipaisi monilta osin uudistamista ja ajanmukaistamista, suurempi ongelma on kuitenkin se, ettei palvelulle ole määritelty selkeää mandaattia toimintansa organisoimiseen ja kehittämiseen. Elektroninen julkaiseminen on jäänyt irralleen muusta yliopiston toiminnasta omaksi erilliseksi saarekkeekseen, ja monet siihen liittyvät mahdollisuudet ovat toistaiseksi jääneet hyödyntämättä.

Yliopisto on kuitenkin strategioissaan korostanut johdonmukaisesti sähköisen julkaisemisen merkitystä, ja yliopiston julkaisuneuvottelukunta on pohtinut periaatteellisella tasolla julkaisutoiminnan järjestämistä jo parin vuoden ajan. Tilanne näyttää olevan vähitellen kohentumassa myös E-thesiksen kannalta, sillä yliopisto on luvannut yliopiston kirjastolle rahoituksen atk-suunnittelijan palkkaamiseen sitä varten vuodeksi 2004.

E-thesiksen kehittämissuunnitelmat kytkeytyvät läheisesti useisiin muihin ajankohtaisiin projekteihin, joiden kautta palvelu voi integroitua aiempaa luontevammin osaksi kansallisia ja kansainvälisiä informaatiojärjestelmiä. Yliopistokirjastojen yhteistyönä on tekeillä useita kunnianhimoisia kehittämishankkeita, jotka tulevat mullistamaan yliopistolaisten käyttämän tiedonhakuympäristön ja tarjoavat samalla myös uusia mahdollisuuksia elektronisten aineistojen käsittelyyn ja julkaisemiseen. Vuoden 2004 aikana tulevat käyttöön mm. kansallinen (Metalib-ohjelmistoon perustuva) Nelli-tiedonhakuportaali ja elektronisten vapaakappaleiden käsittelyä varten tarkoitettu digitaalisten objektien hallintajärjestelmä DOMS (ks. Esa-Pekka Keskitalon artikkeli tässä samassa numerossa). Etenkin DOMS tarjoaa E-thesiksen kehittämisen kannalta kiinnostavia mahdollisuuksia.

Toinen E-thesiksen kiinnostava lupaava ilmiö on Open Access Initiative (OAI), jonka päämääränä on mahdollistaa eri palvelujen sisältämien dokumenttien metadatan kokoaminen tietyn standardoidun protokollan avulla yhteisiin tietokantoihin. Tämä tekee ennen pitkää mahdolliseksi sellaisten kansallisten ja kansainvälisten yhteistietokantojen kokoamisen, joissa voisi tehdä hakuja esim. kaikista jollain alalla, jossain maassa tai jopa koko maailmassa tehdyistä väitöskirjoista.

Suomessa OAI-yhteensopivia teknisiä ratkaisuja on jo kokeiltu käytännössä VTT:n tietopalveluissa. Periaatteessa tällainen järjestelmä kuulostaa akateemisten tiedonhakijoiden kannalta lähes ihanteelliselta, mutta sen maailmanlaajuiseen toteuttamiseen tarvittavan poliittisen tahdon löytymisestä ei valitettavasti välttämättä ole varmoja takeita, etenkin kun asiaan liittyy monenlaisia osin ristiriitaisia kaupallisia ja kansallisia intressejä.

 

Artikkeli perustuu elokuussa 2003 laadittuun laajempaan raporttiin E-thesis-palvelun vuosien 1999-2003 toiminnasta. Koko raportti on PDF-muotoisena luettavissa osoitteessa http://ethesis.helsinki.fi/arkisto/ethesis2003.pdf.


Tietolinja 02/2003

Jyrki Ilva, suunnittelija
Helsingin yliopiston kirjasto, Tietokantapalvelut
PL 26, 00014 Helsingin yliopisto
Email: muotoa etunimi.sukunimi@helsinki.fi