Sami Määttä 29.2.2012

 

Suomalainen verkkoaineisto Kansalliskirjastossa

Kansalliskirjasto on arkistoinut kotimaista verkkoaineistoa vuodesta 2006. Nettiä "haravoidaan" keräysrobotin avulla. Julkaisijat voivat itsekin luovuttaa digitaalisia aineistojaan arkistoon.

Osoitteessa http://verkkoarkisto.kansalliskirjasto.fi/ voi tarkistaa ne päivät, jolloin tietty Web-sivu tai -sivusto om tallentunut arkistoon. Arkistoitunutta aineistoa voi kuitenkin tutkia vain Kansalliskirjastossa ja muissa nk. vapaakappalekirjastoissa sekä Eduskunnan kirjastossa. Onneksi on myös nettiarkisto Wayback Mahcine, josta löytyy myös suomalaisia sivustoja. Ks. http://www.archive.org.


Arkistossa 450 miljoonaan tiedostoa v. 2010

Kansalliskirjasto arkistoi verkkosivustot, joiden verkkotunnus on ".fi" tai ".ax" (Ahvenanmaa). Esimerkiksi osoitteen www.ytv.fi aineisto on tallentunut arkistoon 21 kertaa vuosina 2006 - 2011. Viimeisin nk. Suomi-keräys tehtiin kesä-heinäkuussa 2011.

Kesällä 2010 Verkkoarkiston koko oli 450 miljoonaa tiedostoa ja määrä kasvaa jatkuvasti. Aineisto on kokoteksti-indeksoitua.

Kaikki aineisto ei tule kerätyksi. Jos sivu vaatii rekisteröitymistä tai on maksullinen, sen tallentuminen ei näy hakemistossa. Automaattisella keruulla ei saada talteen myöskään tietokantojen sisältöä. Jos sivusto on dynaamisesti tuotettu tai vaatii käyttäjän syötteitä, sitä ei saada kerättyä talteen kokonaisuudessaan. Automaattinen "haravointi" on kehitetty ennen kaikkea staattisten sivujen tallentamiseen.

Kansalliskirjaston suunnitelmissa on kehittää käytäntöjä aineistojen, kuten e-kirjojen talteen saamiseksi. Näitä ei "verkkoharava" voi käsitellä. Comellus-hankkeessa tutkitaan digitaalisen kopion, "digitaalisesta painolaatan" keräämistä sanomalehtien kustantajilta tai kirjapainoilta.


Aineiston tutkiminen

Verkkoaineistoa voi tutkia Kansalliskirjastossa, eräissä yliopistokirjastoissa sekä Eduskunnan kirjastossa. Kansalliskirjaston kolmella työasemalla on käytettävissä suomalainen verkkoarkisto, radio- ja tv-arkisto, sekä tekijänoikeuden alaisia digitoituja aikakauslehtiä vuosilta 1911-1944 ja sanomalehtiä vuosilta 1911-1917. Aineistojen sisältöä voi lukea, kuunnella ja katsella. Sisällöstä ei voi valmistaa digitaalista kopiota. Aineistoa voi myös kuvata suoraan näyttöruudulta ja äänittää kaiuttimien kautta. Verkkosivuja ja digitoituja lehtiä voi tulostaa paperille (maksullinen). Aikavaraukset Kansalliskirjaston työasemille: puhelin (09) 191 23196 ja sähköposti kk-palvelu(at)helsinki.fi.


Julkaisija voi itsekin luovuttaa aineistoa

Tiettyjä aineistoryhmiä pyritään tallentamaan kattavasti. Tällaisiin valikoituihin aineistoihin kuuluu esim. sähköisessä muodossa olevat ISSN-tunnuksen saaneet julkaisut. Kansalliskirjasto saa ko. aineistoja kohdennettujen keräysten kautta tai aineistoja voidaan luovuttaa.

Julkaisija voi siis myös itse luovuttaa aineistoa. Verkkojulkaisijoilta otetaan vastaan ensisijaisesti sähköisessä muodossa olevia:
•ISBN-tunnuksen saaneita kirjoja,
•ISSN-tunnuksen saaneita julkaisuja,
•virallisjulkaisuja,
•karttajulkaisuja,
•vain verkossa julkaistavaa tai muuten kansalliskokoelmasta puuttuvaa musiikkia (äänitteitä, nuottijulkaisuja).

ISBN-tunnuksen saaneita verkkojulkaisuja otetaan vastaan lomakkeella http://evapaa.kansalliskirjasto.fi/isbnarkistointi/ ja muita elektronisia julkaisuja lomakkeella http://evapaa.kansalliskirjasto.fi/arkistointi/.

Sähköpostiosoitteeseen e-vapaa(at)helsinki.fi voi lähettää suomalaisen verkkoaineiston arkistointiin liittyviä kommentteja ja kysymyksiä.


Muuta

Kansalliskirjaston kokoelmista on digitoitu sanoma- ja aikakauslehtiä sekä pienpainatteita. Tämän aineiston selailu- ja hakumahdollisuudet ovat Webin käyttäjien ulottuvilla. Päivän sanomalehtiä on 150 vuoden takaa. Ks. http://digi.kansalliskirjasto.fi/index.html.

Internet Archive on kerännyt verkossa olevaa aineistoa jo vuodesta 1996 ja sisältö on suoraan käytettävissä. Ks. http://www.archive.org.


Lähteet

http://www.kansalliskirjasto.fi/julkaisuala/vapaakappaleet/ -sivusto
http://www.kansalliskirjasto.fi/kokoelmatjapalvelut/dgitaalisetvapaakappaleet/verkkoarkisto.html
http://verkkoarkisto.kansalliskirjasto.fi/info.jsp?lang=fi
http://verkkoarkisto.wordpress-kk.lib.helsinki.fi/
http://blogs.helsinki.fi/digikirjasto/2011/02/14/e-vapaakappaleet-kulttuuriperinto-hae-ja-tallenna/

 

http://www.kaapeli.fi/~smaatta/
suomalainen_verkkoaineisto.html