Painettu sana muuttuu hyvää vauhtia biteiksi Pursialassa

Suomalaiset sanomalehdet vuoteen 1939 saakka ovat vapaasti kaikkien luettavissa digitaalisessa muodossa Kansalliskirjaston verkkopalvelussa. Sanomalehtien digitointiurakka jatkuu Mikkelin Pursialassa kahden miljoonan sivun vuositahtia.

Kansalliskirjaston mikrokuvaus- ja konservointilaitos perustettiin Mikkelin Pursialaan vuonna 1990. Sen jälkeen alan ammattilaiset ovat muuntaneet siellä yli 17 miljoonaa sivua painettua sanaa sanomalehtipaperilta ja mikrofilmeiltä biteiksi.

Palvelupäällikkö Hanna Arpiainen Kansalliskirjaston Mikkelin toimipisteestä sanoo, että lehtien digitointi aloitettiin lehtihistorian aikojen alusta eli vuodesta 1771, jolloin Suomen ensimmäinen sanomalehti ilmestyi ja nyt on päästy jo 1940-luvulle.

– Sanomalehtien digitointi etenee rivakkaa tahtia. Kaikista nopein tahti on ollut ruotsinkielisillä lehdillä, joita on digitoitu nykypäivään saakka suomenruotsalaisten säätiöiden varoilla, Arpiainen sanoo.

Osa suomalaisista sanomalehdistä, muun muassa Mikkelissä ilmestyvä Länsi-Savo, tulee nykyisin suoraan toimitusjärjestelmästä Kansalliskirjastoon tallennettavaksi.

Töitä on silti runsaasti edessä. Kansalliskirjasto digitoi pääasiassa suomalaisista julkaisuista koostuvaa kansalliskokoelmaa. Kansalliskokoelman aineiston tarkkaa nimekemäärää ei tiedetä, koska osa siihen kuuluvista kokoelmista on luetteloimatonta.

Digitointiurakka ei koske vain sanomalehtiä, vaan mukana on myös kirjoja, nuotteja ja paljon muuta. Valmiiksi digitoidun aineiston tarkkaa prosenttiosuutta on mahdotonta tietää, mutta karkean arvion mukaan kansalliskokoelmasta on digitoitu 3 – 5 prosenttia.

Digitoidut vanhat sanomalehdet vuoteen 1939 saakka ovat Kansalliskirjaston verkkopalvelussa: digi.kansalliskirjasto.fi, kenen tahansa vapaasti luettavissa. 

– Sen jälkeen julkaistujen aineistojen käyttöä rajoittavat tekijänoikeudet, ja ne ovat luettavissa vapaakappalekirjastoissa, joista lähimmät ovat Kuopiossa ja Jyväskylässä, Arpiainen toteaa.

Myös menneisyyden äänet halutaan säilyttää tuleville sukupolville. Äänitedigitoinnin suunnittelija Juha Korvenpää kertoo, että äänitteidenkin digitoinnissa riittää urakkaa, vaikkakin määrä on paljon kirjallista aineistoa vähäisempi.

Digitointi aloitettiin Pursialassa C-kaseteista vuonna 2008. Sitten ovat vuorossa olleet CD-levyt ja viimeisenä viedään talteen vinyylilevyt. Myös levykannet digitoidaan. Kutakin formaattia on varastoissa kymmeniä tuhansia kappaleita.

CD:t ovat Korvenpään mukaan muutaman vuoden juttu, vaikka talteen otetaan kaikki mahdolliset äänitteet veteraaneista nuorisokuoroihin.

– Vinyylien digitointi voi kestää kauan, kun siihen päästään käsiksi. Se on iso urakka.

Arpiainen sanoo, että Kansalliskirjasto noudattaa perustehtävänsä eli painetun kulttuuriperinnön säilyttämistä ja käyttöön saattamista. Tätä tehdään digitoimalla niin paljon kuin resurssit mahdollistavat.

Mikkelin toimipisteessä työskentelee tällä hetkellä 35 henkilöä, joista kaikki eivät ole digitoija. Joukossa on myös muun muassa konservaattoreita ja tietojärjestelmäasiantuntijoita.

– Tarkoitus on saada aineistot laajasti käytettäviksi ja säilytettäväksi. Periaate on, että tehdään kerralla ja laadukkaasti kansainvälisten standardien mukaisesti. 

Vuosikymmenien aikana ala on Arpiaisen mukaan kehittynyt todella paljon, ja kehitys jatkuu yhä muun muassa tekstintunnistuksen tarkentumisen myötä.

– Sanomalehtien mikrofilmituotanto loppuu vuoden 2023 lopussa. Entiset filmit kyllä säilyvät hyvänä varmuusvarastona, sillä ne pysyvät 500 vuotta kunnossa.

Arpiainen kertoo, että vanhoja aineistoja kaipaavien joukko on laaja: tutkijat, sukututkijat ja kaikki historiasta kiinnostuneet kansalaiset.

– Sillä on iso merkitys, että kaikki on tallennettu tuleville sukupolville.

Teksti: Tapio Honkamaa
Kuvat: Ulla Jurvanen

Digi.kansalliskirjasto.fi -palvelu sisältää Suomessa julkaistuja historiallisia sanoma- ja aikakauslehtiä, kirjoja, pienpainatteita ja muita Kansalliskirjaston aineistoja digitaalisina. Selailun ja hakutoimintojen lisäksi on käytettävissä lataustyökalu ja valmiita avoimen datan aineistopaketteja. 

Palvelu sisältää yli 27 miljoonaa sivua aineistoja: sanomalehtiä 17,5 miljoonaa, aikakauslehtiä 7 miljoonaa, kirjoja 2 miljoonaa sivua sekä nuotteja, karttoja, käsikirjoituksia ja kortistoja.