Asiakirjahallinta uuden ajan kynnyksellä

keskiviikko 4.5.2022 Jätä kommentti

(Esitys Kunnallisarkistoyhdistyksen koulutustilaisuudessa 28.4.2022)

Ensiksi kiitän Kunnallisarkistoyhdistystä mahdollisuudesta tulla puhumaan ja onnittelemaan 40 +2 vuodesta. En ole aivan varma siitä, mistä ajatus kutsumiseeni tuli, mutta epäilen idean nousseen siitä, että puhuin syksyllä Tiedon- ja arkistonhallinnan ammattiyhdistyksen juhlassa ammattikunnan menneisyydestä ja tulevaisuudesta.

Koska en ole vielä puolessa vuodessa hyljännyt entisiä näkemyksiäni, tässä esityksessä on toistoa. Aloitan palaamalla tuon esityksen teemoihin (se löytyy blogistani Asiakirjahallinnan reunamerkintöjä). Lohdutan kuitenkin niitä, jotka tuon puheenvuoron jo kuulivat sillä, että siirryn melko nopeasti tämän esityksen teemaan. Kaikki ei siis ole vanhaa ja tuttua, älkää huolehtiko.

Kun sanon, etten ole vielä puolessa vuodessa hyljännyt entisiä näkemyksiäni, niin se on ymmärrettävä sarkasmiksi. Nimittäin, kun olen käynyt läpi omaa henkilökohtaista yksityisarkistoani – ja sellainenhan toki on jokaisella itseään kunnioittavalla ammattilaisella – huomasin, että esitin hyvin samanlaisen näkemyksen alan kehityksestä jo vuonna 2005. Eikä tässä vielä kaikki – sama perusidea on löydettävissä kirjoituksestani arkistolaitoksen henkilökuntalehti Remissistä vuonna 1998 – siis neljännes vuosisata sitten!

Tämä osoittanee ensiksikin sen, että ihmisellä on yleensä elämänsä aikana vain muutama ajatus. Toiseksi se osoittaa, että jos olenkin ehkä kehityksen ennustajana huono, olen ainakin johdonmukainen. Aina kun kysytään kerron saman näkemyksen. Jonakin päivänä saatan sitten viimein olla oikeassa, jos en ole jo.

Se teema, jota olen tuonut esille jo neljännesvuosisadan, on alan pirstoutuminen. Kun aloitin alalla melko esidigitaalisina aikoina 1980-luvun lopulla, asiakirjatietoa oli kärjistäen kahdenlaista. Oli A4-kokoista tietoa ja sitten sitä hieman suurempaa ja vanhempaa, foliokokoa.

Olennaista on, että tuohon oltiin tekemisissä aineistojen kanssa, jotka olivat olemassa fyysisessä muodossa. Se asetti rajat sille, mitä saattoi tehdä. Asiakirjatietoa käytettiin ja hallittiin aina samalla tavalla, olipa elinkaaren vaihe mikä tahansa.

Oli virasto suuri tai pieni, tai oli sen tehtäväkenttä mikä tahansa, aina oli arkistonmuodostussuunnitelma, aina oli paperiasiakirjoja, aina oli diaari, joka toimi hakemistona aineistoihin, ja jos kyse oli pitkäaikaisesti säilytettävistä asiakirjoista, aina oli arkistoluettelo, joka samanlaisena palveli yhtä hyvin— tai yhtä huonosti – sekä viranomaista kuin tutkimusta.

Kuten tiedämme, tilanne on aivan toinen tänään. Digitaalista dataa on dokumenttipohjaista, tutkimusaineistoja, tietokantoja, oppimisympäristöjä, nettisivuja, sosiaalista mediaa ja kaikkea muuta, ihan vain muutaman esimerkin mainitakseni. Kun yhteiskunta kehittyy, eri muotoja ja uusia erityisalueita tulee lisää. Yhteentoimivuus, open data, big data, my data, yksityisyys, digitointi, tekoäly, pilvipalvelut, lohkoketjut – jokainen avaa uuden matopurkin, jossa on omia asiakirjahallintaan liittyviä kysymyksiä.

Samalla tietoa ei enää käytetä samalla tavalla sekä viranomaisessa että päätearkistossa. Usein datan luovuttaminen päätearkistoon tarkoittaa sen muuntamista jollain tavalla samalla kun data siirretään uuteen järjestelmään, jonka toiminnallisuus ja kenties tapa esittää tiedotkin ovat erilaiset. Näin ei aina ole. Mutta olennaista tässä onkin, että digitaalisen tiedon hallintaan ja käyttöön on sekä viranomaisessa kuin päätearkistossa eri vaihtoehtoja.

Samalla se ennen vallinnut käytäntöjen jatkumo, joka alkoi aineiston synnystä ja jatkui päätearkistossa, on murtunut. Perinteisten aineistojen ollessa kyseessä ei voinut tehdä kovin väärin, jos toimi kuin Kansallisarkisto. Digitaalisessa ympäristössä asia on päinvastoin. Viranomainen, joka koittaisi aktiivivaiheessa hallita dataansa sähköisen pitkäaikaissäilytyksen keinoin, tekisi useimmiten suuren virheen. Tiedon käyttäjien tarpeet ovat aktiivi- ja passiiviaiheessa niin erilaiset.

Tämä tarkoittaa sitä, että jos puhutaan ”uudesta ajasta” asiakirjahallinnassa, se merkitsee eri asioita eri vaiheissa elinkaarta ja murros tapahtuu myös elinkaaren eri vaiheissa eri aikaan.

Lähes 35 vuotta sitten tästä tulevaisuudesta oli vasta aavistus. Aloittelin silloin  uraani silloisessa valtionarkistossa. Mekaaninen kirjoituskone löytyi jokaisesta työhuoneesta, mutta PCeitä oli hankittu vasta muutama, nekin yhteiskäyttöön.

Tuolloin puhuttiin vielä ”arkistokelpoisuudesta.” Nuoremmille täytyy termiä varmaan selittää: kyse oli siitä, että jo 1800-luvun lopulta lähtien pysyvästi säilytettävät asiakirjat oli laadittu käyttäen sopivia kestäviä välineitä. Ennen EU-aikaa Kansallisarkisto testautti VTT:llä papereita, kyniä, tulostimien värikasetteja ja vastaavia tuotteita ja julkaisi aika ajoin listan välineistä, joita sopi käyttää silloin kun laadittiin pitkään tai pysyvästi säilytettäviä asiakirjoja. Kuulostaa nykyisin vanhanaikaiselta. Se oli kuitenkin tärkeää, koska joka arkistosta löytyi esimerkkejä hajoavista ja haalistuvista asiakirjoista.

Kuten aina, vanhoja malleja jatkettiin uudessa tilanteessa osaamatta sopeuttaa niitä uuteen aikaan. Verrattuna vuosisatoja kestävään lumppupaperiin, jota saattoi pestä vedessä juuriharjalla sen liiemmin siitä kärsimättä, magneettinauhojen kestävyys – joka oli ja tietääkseni on edelleen siinä 15 vuotta – oli surkea. Tämä herätti hillittyä kauhistelua, samoin kuin se, että sähköisen tiedon muuttaminen oli niin helppoa. Edelleen muistan, miten valtionarkiston toimistopäällikkö huokaili tätä kahvipöydässä.  – Toki eri pöydässä kuin minä, koska olin vain pahainen korkeakouluharjoittelija.

Ensimmäinen asia, joka täytyi oppia, oli ettei arkistokelpoisuudella ollut sähköisessä toimintaympäristössä merkitystä. Laitteisto- ja ohjelmistoriippuvuus ymmärrettiin pian ongelmaksi. Mitä hyödytti tehdä kestäviä tallenteita, kun laitteistot ja ohjelmistot vanhenevat kuitenkin?

Seuraavaksi, jos näille asioille kronologiaa voi antaa, alettiin kiinnittää huomiota dokumentaatioon. Ei auta, jos data on tallessa, jos ei ymmärretä mitä se merkitsee. Koodaat vaikkapa vastaajan sukupuolen nollalla ja ykkösellä, mutta unohdat kirjoittaa ylös, kumpi on kumpi. Silloin data on säilynyt, mutta tieto kadonnut.

1990-luvulla alettiin myös pohtia, mikä se sellainen ”sähköinen asiakirja” oikein on ja mitä se edellyttää. Tällöin huomattiin kaksi asiaa lisää: ensiksikin, että aineisto on sidottava siihen toimintaan, missä se on syntynyt, ja että asiakirjoilla on myös keskinäisiä yhteyksiä, jotka on säilytettävä.

Tässä onkin aika tiivistettynä se, mille sähköinen asiakirjahallinta perustuu: aineiston säilyttäminen, merkitysten säilyttäminen, yhteyden toimintaan säilyttäminen, asiakirjojen yhteyksien säilyttäminen.

Kärjistäen, mutta uskoakseni todenmukaisesti, voi sanoa, että tämä ydin on ollut olemassa jo parikymmentä vuotta eikä ole olennaisesti muuttunut. Ainoa asia uusi asia on ollut siinä, että ”yhteydet” ja ”merkitykset” on alettu ymmärtää entistä laajemmin. Enää ei ajatella, että niitä on rajattu, objektiivisesti olemassaoleva joukko, jonka arkistoammattilainen voi tunnistaa ja tuoda esiin. Mutta ei tästä tämän enempää.

Sanomastani herää kuitenkin kysymys. Jos sähköistä asiakirjahallintaa on ollut olemassa parikymmentä vuotta, miksi tämän esityksen otsikoksi olen valinnut ”asiakirjahallinta uuden ajan kynnyksellä.” Varmaankin porstuasta on kahdessakymmenessä vuodessa ehditty jo salin puolelle?

Asiaa voi tarkastella sekä organisaatioiden päivittäisen toiminnan että päätearkiston näkökulmasta. Onko viranomaisten toiminnassa jo siirrytty digitaalisuuteen? Ulkopuoliset yliarvioivat rankasti yhteiskunnan digitalisoitumisen asteen. Kun muutama vuosi sitten asiaa selvitettiin, vastanneista korkeakouluista vain yli puolet (55 %) totesi, että osa asiakirjaprosesseista on sähköistetty. Täysin sähköisiä prosesseja ei löytynyt yhdeltäkään korkeakoululta. Myös valtionhallinnon osalta tulos oli samantapainen: kokonaan digitaalisesti toimivia organisaatioita oli vähän, mutta prosesseja sähköistettiin aktiivisesti. Noin yksi kymmenestä vastaajasta vastasi sanoi elinkaaren olevan kokonaan digitaalinen ja vain noin puolet sanoi prosessien olevan osin sähköisiä.

Joten näyttää siltä, että viranomaisten tiedonhallinnassakin ollaan vasta uuden ajan kynnyksellä. En kuitenkaan rohkene sanoa tästä paljoakaan, koska te tiedätte tilanteen omissa organisaatioissanne ja sen arjessa paljon paremmin. Lähden tässä kuitenkin siitä ajatuksesta, että sähköinen asiakirjahallinto on tuttua: te tiedätte jo, millaista se on, ja millaista se tulee olemaan, hyvässä ja pahassa.

Asiaa voi tarkastella myös päätearkiston näkökulmasta. Tästä tulee mieleen muisto parikymmenen vuoden takaa. Silloinen esimieheni, Sota-arkiston johtaja Jaana Kilkki tuli takaisin maanpuolustuskurssilta, ja totesi arkiston aikasyklin olevan toisenlainen kuin muulla yhteiskunnalla.

Maanpuolustuskurssilla oli nimittäin kerrottu, miten kriisit etenevät. Ensin tilanteen kiristymisestä on merkkejä, sitten jännitteet ovat jo selvästi näkyvillä, seuraavaksi ne kohoavat ja ehkä lopuksi johtavat avoimeen yhteenottoon. Kun purkaus on ohi, kriisiä kuvaava käyrä laskee ja yhteiskunta palaa nopeasti normaali aikaan.

Jaana totesi, ettei tämä arkiston osalta pidä lainkaan paikkaansa. Suomen sotia käytiin vuosina 1939–45, ja sen jälkeen yhteiskunta kyllä palasi rauhantilaan. Sota-arkisto ei kuitenkaan tehnyt niin. Se eli ja hengitti talvi-, jatko- ja Lapin sotaa vielä vuosikymmeniä tämän jälkeen. Kun muu yhteiskunta oli jo lähes unohtanut sodan, kriisi jatkui Sota-arkistossa sotien synnyttämän valtavan aineistomassan kanssa painiskeluna sekä lukemattomina selvityksinä ja todistuksina, jotka 1950-luvulta 1970-luvulle työllistivät henkilökuntaa. Tämä on tyypillistä arkistoille. Tapahtumilla on pitkä häntä, joiden kanssa arkisto elää.

Niinpä jos ajattelee digitaalista murrosta, olemme varsinkin päätearkiston näkökulmasta selvästi vasta alussa. Tällä hetkellä Kansallisarkiston aineistoista 3,9 % on digitoitu, kerrottiin Ylen uutisissa muutama viikko sitten (Yle 23.3.2022, https://yle.fi/uutiset/3-12368434). Nykyvauhdilla digitointi kestää vielä 200 vuotta. Niinpä Kansallisarkisto on siirtynyt kokonaan uuteen aikaan ehkä vasta vuonna 2222.

Tämä tarkoittaa yhtäältä sitä, että paperiaineistot ovat niihin liittyvine toimintoineen vielä pitkään kanssamme. Samalla se tarkoittaa sitä, että digitaalisten aineistojen koko elinkaari ja digitalisoitumisen kaikki vaikutukset eivät ole vielä läheskään näkyvissä.

Kuten jo sanoin, eniten kokemusta on aktiivivaiheen sähköisten aineistojen jotain luomisesta ja hallinnasta. Sitähän tekin teette päivästä toiseen. Lähes kaikki muu sähköisiin aineistoihin liittyvä on vielä tuntematonta tai sellaista, ettei siitä ole paljon tietoa.

Kun 40 vuotta sitten huolta aiheutti sähköisten aineistojen säilyminen, oliko se aiheetonta? Huokailiko valtionarkiston toimistopäällikkö turhaan? Ehkä tällä hetkellä voisi sanoa, että huoli sekä oli ja ei ollut aiheellinen. Näyttää siltä, että jos tieto todella halutaan säilyttää, ja säilyttäminen suunnitellaan huolellisesti, ja siihen käytetään asiantuntemusta ja resursseja, silloin tieto saadaan säilymään.

Siis, jos suunnitellaan huolellisesti, käytetään asiantuntemusta ja resursseja. Tämä on suuri jos. Sattumalta säilyminen on epätodennäköistä. Paperihan säilyy kohtuullisen hyvissä säilytysoloissa ilman kummempaa huomiota. Paperi säilyy, ellei sitä hävitetä, sähköinen häviää, ellei sitä säilytetä.

On arveltu, että tämän vuosituhannen ensimmäiset vuosikymmennet ovat digitaalinen musta-aukko, jolta jää vain vähän tietoa talteen. Tämä saattaa pitää paikkansa. Dataa tästä minulla ei ole, mutta järkeilyni perustuu seuraavaan: ennen vanhaan paperia oli kaikkialla ja paperi saattoi myös säilyä kaikkialla. Nyt meillä on digitaalista dataa kaikkialla, mutta kuinka monta paikkaa tiedätte, joissa on todella valmiudet sen säilyttämiseen pidempiä aikoja? Ne ovat suhteellisen harvassa.

Netin sanotaan muistavan ikuisesti sen, mitä sinne laitetaan, mutta todellisuudessa se muistaa vain sen, minkä säilyttämisestä ja levittämisestä on jollekulle suoraan tai epäsuorasti taloudellista hyötyä. Tieto, jonka olemassaolosta kukaan ei ole valmis maksamaan edes pientä summaa, katoaa kyllä.

Samalla netissä oleva tieto saattaa kyllä säilyä pitkään. Yhden tiedon mukaan vanhin nettisivu, tai ainakin sen domain, olisi 36-vuotias ja vuodelta 1986. Netissä oleva tieto on kuitenkin harvoin staattista. Jos sisällöt eivät muutukaan, muuttuvat ainakin ne tavat, jolla tiedot esitetään käyttäjille ja jolla tietoja käytetään. Yksinkertainen 1980-luvun lopun HTML-koodaus vaikuttaa kököltä. Niinpä vanhakin data näkyy todennäköisesti nyt uudelleen ”disainatulla” sivulla ja sitä katsotaan ehkä mobiililaitteella pöytätietokoneen asemasta. Jotain on siis muuttunut, samalla kun tiedot säilyvät.

Tämä onkin yksi netin kestävyyden salaisuuksista. Palvelut muuttavat muotoaan, jotta ne vastaavat kulloisenkin käyttäjäkunnan odotuksiin. Internet muistuttaa tässä villiä luontoa. Netissä vallitsee eräänlainen luonnonvalinta, joka jättää vain parhaiten toimivat ratkaisut eloon. Kun eri tahot tarjoavat samantapaista palvelua, ne kilpailevat keskenään. Halvin ja toimivin voittaa ja syrjäyttää muut. Tämän vuoksi netissä kehitys on nopeaa, vain parhaat selviävät.

Tilanne on toinen kuin organisaatioiden omissa verkoissa, jotka ovat puutarhamaisia: niissä it-yksikkö on valinnut käytettävät välineet ja tekee parhaansa pitääkseen kilpailijat poissa. Huonokin sovellus kituuttaa elossa esimerkiksi kunnan it-puutarhassa, koska sille ei ole vaihtoehtoa.

Sähköiseen säilymiseen vaikuttaa se, minkälaiset digitaaliset ekosysteemit menestyvät. Esimerkiksi 2009 Google esitteli ”sähköpostin sellaisena mikä se olisi, jos keksittäisiin nyt.” Tuote oli nimeltään Google Wave. Wave oli yhdistelmä dokumentteja, sähköpostia, pikaviestimiä, wikiä ja sosiaalista mediaa. Näin jälkeenpäin on vaikea hahmottaa miten palvelu toimi, koska se katosi nopeasti.

Pointti tässä on se, että Wavesta ei koskaan tullut valtavirtaa ja se katosi pian Googlen palveluvalikoimasta. Jos jollakulla on nyt säilytyksessä Wave-dataa, voitte ehkä kuvitella, millaisia vaikeuksia sen hallinnassa ja antamisessa käyttöön on. Uutena tekijänä arvonmääritykseen onkin tullut sen arviointi, onko tiedon säilyttäminen ylipäänsä mahdollista, ainakaan kohtuullisin kustannuksin.

Helpointa on, kun elää internetin valtavirran mukana. Internetin valtavirta, joka tapauksessa elää. Internetissä oleva tieto muuttaa muotoaan, samoin muuttuvat tavat, jota sillä voidaan käyttää. Digitaalinen data pitkäaikaissäilytyksessä on joka tapauksessa lisäksi yleensä erilaista pitkäaikaissäilytyksessä. Mitä tämä merkitsee, siitä ei vielä ole käsitystä. Parhaiden arkistollisten periaatteiden mukaisesti dataa yritetään toki dokumentoida ja sen alkuperäistä kontekstia ja vaiheita tuoda esille. Mutta toimiiko tämä ja kuinka hyvin sitä emme lopulta tiedä.

Emme tiedä, kuinka hyvin käyttäjät osaavat lukea ja tulkita metatietoja, ja sitä kautta aineistoja. Siitä, missä määrin hyvin metatiedotettuja aineistoja on tarpeen kuvailla ja miten nämä kuvailut yhdistetään sähköisiin aineisto ei ole juuri tietoa. Kysymys on, mitä merkitsee se, että tiedon käyttö ja esitystavat saattavat vaihdella?

Tässä voisin taas muistella vanhoja aikoja Sota-arkistossa, koska sieltä on yksi, ehkä opettavainen kokemus, joka tosin liittyy perinteisiin paperiaineistoihin.

2000-luvussa Suomen sodissa 1939–45 menehtyneiden tiedosto tuli nettiin ensi kertaa käytettäväksi. (Nykyisin se on osa Sotasampoa.) Tiedosto on tietokanta sodissa kuolleista henkilöistä. Kyse oli alun perin hautapaikkarekisteristä, mutta sittemmin rekisteriin kerättiin tietoja myös muista lähteistä.

Kun Suomen sodissa menehtyneiden tiedosto avattiin nettiin, siihen kohdistui suuri ryntäys. Samalla paljastui se, että tiedoissa oli puutteita ja virheitä. Osin kyse oli suunnitteluvirheestä. Kun tietokanta oli laadittu, oli ajateltu, että henkilön äidinkieli on suomi, ellei toisin mainita. Ikävä kyllä, tietokanta oli kuitenkin koottu lähteistä, joihin ei useinkaan ollut merkitty äidinkieltä. Niinpä monet ruotsinkieliset kaatuneet olivat tietokannan mukaan suomenkielisiä.

Tässä yhteydessä olennaisempi ongelma oli, että tietokantaan oli merkitty kaatuneen lasten määrä usein väärin. Tämä lasten lukumäärä oli saatu Kotijoukkojen esikunnan rovastintoimiston asiakirjoista ja viimeisenä syntyneistä lapsista rovastintoimistolta saattoi puuttua tieto.

Niinpä palauteryöppy tietokannan avaamisen jälkeen oli melkoinen. Ihmiset olivat närkästyneitä, kun heidän kaatunut isänsä oli tietokannan mukaan lapseton tai tämän äidinkieli oli väärin. Kysymys oli, miten puolustusvoimat saattoi halventaa ihmistä tällä tavalla? Muistan edelleen elävästi, miten koetin selittää asiaa Sota-arkiston tutkijasalissa ruotsinkieliselle pariskunnalle, jonka tuohtumusta pitkä junamatka Pohjanmaalta ei ollut tippaakaan lauhduttanut.

Pointti tässä on se, että jos ihmiset saaneet luettavakseen alkuperäisen rovastintoimiston kortiston kortin (tai edes kuvan siitä), he olisivat todennäköisesti ymmärtäneet, että tieto oli peräisin historiallisista asiakirjoista ja ettei sotavuosien rovasti ollut heidän perhe-elämästään täysin selvillä. Sen sijaan he saivat saman tiedon, mutta modernilta nettisivulta, jossa alkuperä, alkuperäinen konteksti ja tiedon ikä eivät olleet ilmeisiä.

Opetus tälle päivälle. Kun digitaalinen tieto on lähtökohtaisesti kopioitavaa ja muokattavaa, voi olettaa, että ajan myötä meille tulee yhä enemmän tapauksia, joista alkuperäinen data tulee vastaan uudessa kontekstissa. Digitaalisen datan ikä ei välttämättä näy siitä. Mitä tästä seuraa? Sitä ei minun nähdäkseni vielä tiedetä.

Asiakirjojen pitkässä elinkaaressa digitaalinen murros on vielä kesken. Edellä jo totesin, että vain joitakin prosentteja analogisista aineistoista on toistaiseksi digitoitu ja että prosessi on Suomessa nykyvauhtia päätöksessä 200 vuoden päästä.

Syntysähköisten aineistojen osalta tilanne ei ole parempi. Näitä aineistoja on jo valunut päätearkistoille, mutta niiden käyttöön antaminen on harvinaista. Niinpä emme tiedä, mitä se tuo tullessaan. Syy siihen, että syntysähköisten aineistojen antamisesta käyttöön on vähän kokemusta, johtuu datan suuresta määrästä. Se vaikuttaa sekä aineiston käyttöön, käyttäjiin, että asiakirja-ammattilaisten rooliin. Jason R. Baron, joka on University of Marylandin työelämäprofessori, puhui aiheesta äskettäin Yhdysvaltain näkökulmasta.

Baronin arvion mukaan paperiarkistot tulevat marginalisoitumaan nopeasti. Suomessa Kansallisarkisto haluaa säilytykseen enää vain digitaalisesta aineistoa. Yhdysvalloissa NARA on tehnyt saman linjauksen, joka tulee voimaan tämän vuoden lopussa.

Seuraus on, että digitaalisen aineiston määrä tulee kasvamaan rajusti. Baron arveli, että vuosisadan puolivälissä ehkä 9/10 NARAn arkistoaineistoista on digitaalisessa muodossa ja ehkä enää kymmenesosa paperilla. Vuosisadan puoliväli saattaa kuulostaa teistä kaukaiselta, mutta se mahtuu monilla teistä työuraan. Ja uskokaa minua, se tulee nopeammin kuin luulettekaan.

Tämä digitalisoituminen tuo suuren haasteen. Miten antaa pääsy näihin aineistoihin? Periaatteessa sen pitäisi olla helppoa: aineistohan on sähköistä, joten laitetaan se verkkoon. Todellisuudessa tämä on usein äärimmäisen ongelmallista, koska dataa on niin paljon, ettei siitä pystytä hakemaan tietoa eikä siitä pystytä erottamaan sitä osaa, jota käyttäjä ei saa nähdä.

Valkoisen talon sähköpostiviestit antavat esimerkin tilanteesta – nimenomaan esimerkin, koska tilanne on sama koko liittovaltion hallinnossa. Sähköpostiviestejä on Reaganin kaudelta 1980-luvun alusta Obaman aikaan vuoteen 2017 tallessa 535 miljoonaa. Kuinka suuri osa on avattu käytettäväksi? Vastaus on alle yksi prosentin kymmenesosa, 410 000 viestiä.

Ongelmia on kaksi, ensiksikin miten löytää digitaalisesta massasta relevantit dokumentit, sekä toiseksi miten erottaa muista ne dokumentit, joita ei voida käyttäjälle antaa.

Baronilla oli tästä esityksestään kolme viestiä. Ensimmäinen viesti on, että ihminen ei pysty näistä tehtävistä suoriutumaan. Dataa on siihen liikaa. Ihminen ei pysty kohtuuajassa erottamaan aiheen kannalta keskeisiä viestejä tai suodattamaan pois salattavia viestejä

Toinen Baronin viesti on se, että jos vertaillaan ihmisen tekemää hakua tai tietojen suodattamista tekoälyn avulla, kumpikaan ei toimi yksin täydellisesti. Ihminen tekee väsyessään väistämättä virheitä.

Toisaalta tekoälykään ei toimi täydellisesti. Jos ajatellaan henkilötietojen ja arkaluontoisten tietojen erottamista muista, se onnistuu automatisoituna välillä hyvin, välillä huonosti. Tekoäly onnistuu melko hyvin, jos sen pitää tunnistaa tekstistä nimet, syntymäajat, puhelinnumerot, osoitteet, rekisterinumerot ja vastaavat tunnisteet (kalvolla vasemmalla). Mutta jos sen pitää tunnistaa kontekstin perusteella epäsuorasti arkaluontoiset tiedot, osumistarkkuus on heikompi (esimerkkejä oikealla). Välissä on spektri erilaisia tapauksia.

Esimerkiksi tästä käy myös jo mainitsemani Suomen sodissa menehtyneiden tiedosto. Siinä olleita merkintöjä tietokannan kokoamisessa käytetyistä lähteistä ei ole voitu näyttää käyttäjille, koska niiden joukossa saattoi olla esimerkiksi seurakunnan kuolleiden luettelo. Koska tällainen lähdemerkintä olisi epäsuorasti kertonut vainajan olleen seurakunnan jäsen, se on arkaluontoinen. Tällä tavalla arkaluontoisten tietojen tunnistamisessa tekoäly ei ole kovin hyvä.

Amerikkalainen näkökulma pääsyyn aineistoihin on hieman erilainen kuin meillä, kahdesta syystä. Ensimmäinen on ns. e-discovery. Olen ymmärtänyt e-discoveryn niin, ja toivottavasti en anna siitä tässä yksinkertaistettuna kovin väärää kuvaa, että kun organisaatiota kohtaan nostetaan oikeusjuttu, se joutuu eräänlaiseen tietohallinnolliseen poikkeustilaan: kaikki tietovarannot jäädytetään, mitään tietoa ei saa hävittää, ja vastapuolelle on annettava pääsy kaikkeen tietoon. Tällöin keskeinen kysymys on, miten löytää sekalaisesta massasta oikeustapauksen kannalta relevantit dokumentit?

Toinen amerikkalainen piirre on erilainen julkisuuskäytäntö. Meillähän viranomaisen asiakirjat ovat pääsääntöisesti julkisia, ellei ole määritelty rajoituksia. Yhdysvalloissa ja monissa muissa maissa aineistot eivät ole samalla tavalla julkisia. Ne ovat julkisia kyllä, mutta siinä mielessä, että niistä voi pyytää tietoja. Tietopyynnön yhteydessä arvioidaan, voidaanko tieto oikeasti antaa. Tällöin tiedon antamiseen liittyy toisenlaista harkintaa kuin meillä ja prosessi on erilainen.

Kuinka olennaisia tällaiset erot ovat, sitä en osaa sanoa. Jos kyse on kunnolla metatiedotetusta Sähke- tai vastaavasta aineistosta, tilanne on tietysti hyvin erilainen, mutta uskoisin, että digitaalisten tietomassojen kanssa arkistot ovat kaikkialla pohjimmiltaan samojen kysymysten edessä. Perinteinen ”luokittele ja valvo” toimintamalli tehoaa massa-aineistoihin huonosti, koska nimenomaan luokittelu on ongelma.

Mitä laajemmin arkistot ottavat digitaalista dataa vastaan, sitä kirjavampia aineistot ovat ja sitä huonommin ne ovat perinteisin menetelmin hallittavissa. Suomessakin uskoakseni tullaan tähän törmäämään.

Baronin kolmas viesti on, että ei ole kuin yksi tie. Ihmisen ja teknologian yhdistelmä, jossa molemmat työskentelevät yhdessä tuottaa luotettavimman tuloksen. Jotta arkistot voivat hoitaa tehtäväänsä ja tarjota kohtuullisessa ajassa pääsyn aineistoihin, niillä ei yksinkertaisesti ole muuta vaihtoehtoa kuin turvautua algoritmeihin. Sekä arkistonhoitajat että arkistojen käyttäjät tulevat olemaan tulevaisuus yhä enemmän algoritmien varassa.

Mutta jos ratkaisu on se, että tutkija tai arkistonhoitaja tekee työtään käyttäen tekoälyä apuna, siitä nousee kaksi kysymystä. Ensimmäinen koskee asiakirja-ammattilaisen roolia prosessissa. Perinteisesti arkistonhoitaja on ollut arkiston portinvartija. Portinvartijan tarkka rooli on vaihdellut.

Alussa päätearkiston arkistonhoitaja oli, tai ainakin melkein oli, tutkija itsekin, historioitsijan työtoveri, joka tutki asiakirjoja ja takasi niiden luotettavuuden, laati lähdejulkaisuja. Tämä historioitsijan paras ystävä arvioi asiakirjoja myös tutkimuksen näkökulmasta ja saattoi esimerkiksi arkistoluettelossa erotella tärkeimmäksi näkemänsä arkistolähteet muista.

Kun pääsy arkistoihin sitten demokratisoitui, tämä ei ollut enää mahdollista. Arkistonhoitaja ei voinut enää ottaa huomioon erilaisten tutkijoiden tulokulmia ja tarjota tutkijoille yksilöllistä palvelua. Luettelot oli laadittava yleisemmästä ja neutraalimmasta näkökulmasta, mutta edelleen arkistonhoitaja säilyi välittäjänä, joka auttoi tutkijaa oikeille lähteille ja avusti tutkijaa sekä aineistojen että arkistohakemistojen tulkinnassa.

Digitoitujen aineistojen osalta on päästy osin uuteen aikaan, jossa arkistonhoitajaa ei ole enää portinvartijana. Aineistot ovat verkossa vapaasti kaikkien käytettävissä. Arkisto saattaa periaatteessa tarjota vain alustan, jolla käyttäjät ovat kuninkaita. Käyttäjät kuvailevat ja jakavat aineistoja, ja luovat ylimääräisiä hakemistoja tarpeensa mukaan.

Arkistonhoitaja ei ole enää tässä yhtälössä enää toisaalta käyttäjän ja hakemistojen ja toisaalta käyttäjän ja aineistojen välissä. Käyttäjät ovat siis yksin. Jos heillä on ongelmia, verkossa ei ole tiskin takana päivystävää henkilökuntaa auttamassa. Tämä ei ole kaikissa suhteissa ihanteellinen asia, mutta ainakin tiedot ovat verkossa vapaasti käytettävissä.

Syntysähköiset aineistot ovat sitten toinen kysymys. Jos Baron on oikeassa:

  • Jos digitaalista dataa on niin paljon, ettei siitä pystytä tehokkaasti hakemaan ja siitä ei pystytä poistamaan käyttörajoituksen alaisia tietoja muuten kuin ihmisen ja koneen yhteistyöllä, miten näitä aineistoja voidaan antaa yleisölle käyttöön?
  • Miten saadaan online-käyttöön käyttäjän ja aineistojen välille asiakirja-ammattilaisen ja tekoälyn seulova elementti? Ihminen nimenomaan poistuu välistä, kun aineistot ovat netissä kunkin suoraan käytettävissä.
  • Ja vaikka arkiston virtuaaliseen tutkijasaliin saataisiinkin arkistonhoitaja valvomaan aineiston käyttöä tekoälyn tukemana, tämäkään vaihtoehto ei ole täydellinen: kaikkea ei löydetä, kaikkea ei pystytä seulomaan.

Kun äsken käsiteltiin uutta arkistolakiluonnosta, siinä esimerkiksi ei ole tähän ollenkaan varauduttu: henki oli, että tietoon voidaan antaa pääsy verkon yli, mutta käyttörajoitukset ja käyttäjän oikeudet huomioiden. Miten tämä onnistuu, jos ei pystytä tunnistamaan rajoitusten alaisia tai käyttäjälle relevantteja aineistoja?

Miten tämä ongelma ratkaistaan? En itse näe siihen keinoja. Totta kai, kunnolla metatiedotettu Sähke-aineisto ei ole ongelma, jos voitte luottaa siihen, että metatiedot on annettu oikein ja käyttörajoitukset ovat asianmukaisia. Mutta pointti tässä onkin se, että kun kirjaavaa, strukturoimatonta dataa alkaa tulla arkistoihin, vailla metatietoja, ja ilman, että aineistoa on luokiteltu sisällön ja käyttörajoitusten mukaan, silloin sen käyttöön antamisesta tulee ongelma.

Juuri tämän vuoksi Reaganin kauden sähköpostit ovat odottaneet tutkijoita lukkojen takana jo 40 vuotta. Jos halutaan olla varmasti turvallisilla vesillä, aineistot tulevat käyttöön vasta, kun kaikki mahdolliset salassapitoa koskevat tarpeet ovat rauenneet ja kaikki aineistossa mainitut henkilöt ovat kuolleet. Siis ehkä vasta 2080-luvulla.

Vastaavanlainen käytäntö olisi suuri muutos perinteiseen suomalaiseen hallintokulttuuriin. Näinkö meidänkin pitää toimia?

Jätän teidät pohtimaan tätä. — Näiden haasteiden äärellä, päätän tämän lohdutuksen sanaan. Professori Seppo Mustonen totesi vuosia sitten haastattelussa, että ”on kummallinen illuusio, että elämän pitää olla helppoa. Elämän pitää olla mielenkiintoista.” Tällaisia mielenkiintoisia aikoja asiakirjahallinnalle on luvassa, kun se astuu uuteen aikaan yhä syvemmälle.

Asiakirjahallinta on osa digitalisoituvaa maailmaa eikä se voi välttää digitalisoitumisesta tulevia ongelmia. Sanoisin lopuksi, että hyvä näin. Jos asiakirjahallinta voisi jatkua kuin ei mitään tapahtuisi, se osoittaisi olevansa merkityksetöntä ja täysin irrallaan kehityksestä.  Siispä ollaan ongelmista iloisia ja koetaan ratkaista niitä sitä mukaa, kun niitä tulee vastaan.

Opetusta öljymaassa

perjantai 25.3.2022 Jätä kommentti
Kuva Rob_oo (Flickr, CC BY 2.0)

Olin syksyllä etänä arvioimassa asiakirjahallinnan maisteriohjelmaa. Se oli erään maineikkaan ranskalaisen yliopiston haarakonttorin opetusta arabimaassa. Kovin tarkkaan tästä ei ole lupa kertoa. Ensiksi piti allekirjoittaa vaitiolosopimus.

Kyse oli alkuakkreditoinnista, jossa maisteriohjelmalle annettiin lupa toimia. Kokonaisuus syynättiin huolellisesti sisältä ulos. Ohjelman tarve, työmarkkinatilanne, opettajien ansioluettelot, rahoitus, johtaminen, tutkimus, opetussuunnitelma, kurssien sisällöt, oppimistavoitteet, arvostelukriteerit, prosessit, opiskelijoiden tukipalvelut, palautteen kerääminen ja käyttö, kirjastopalvelut, opetuksessa käytettävissä olevat välineet, opiskelijamäärät, laadunvalvonta, toimet ohjelman lakatessa – kaikki mahdollinen tutkittiin. Jokaisen opettajan kanssa keskusteltiin, samoin tärkeimpien sidosryhmien. Lopuksi laadittiin kahdeksankymmentäsivuinen raportti, joka sisälsi sekä ehdottomia vaatimuksia että suosituksia.

Puutteita ei ollut paljon. Ohjelma osoittautui hyvin resursoiduksi. Se ei ole suuri yllätys, kun yliopistolla on pääsy öljymaan hallitsijasuvun lompakolle. Opiskelijallekin on vapaa-ajalla tarjolla kaikenlaista oopperasta safariin. Kelpaisi kenelle vaan.

Mielenkiintoisimpia olivat kuitenkin sisällöt. Maisteriohjelmassa oli pelkästään asiakirjahallintaa, ei mitään sivuaineita, kuten meillä olisi ennen sanottu. Kurssilista oli tämän mukainen: Arkistoteorian perusteet, Asiakirjahallinnon perusteet, Asiakirjahallinnon jatkokurssi, Lainsäädäntö ja standardit (2 kurssia), Arkistot ja tietotekniikka, Tiedonhallinta (2 kurssia), Digitaalinen asiakirjahallinta, Tietokantojen suunnittelu, Tietoturvallisuus ja riskien hallinta, Asiakirjatiedon organisointi ja kuvailu (2 kurssia), Tietojärjestelmien analysointi, Digitaalinen pitkäaikaissäilytys, Aineistojen säilytys ja konservointi, Asiakirjahallinta eri toimintakonteksteissa – tässä oli kolme erikoistumisvaihtoehtoa; henkilötiedot, potilasasiakirjat ja maanpuolustus, Aineistojen käyttö ja tietopalvelu, Arvonmääritys ja aineistojen hankinta, Massadata ja sen prosessointi, Audiovisuaaliset aineistot ja Tieto-organisaatioiden johtaminen.

Näiden lisäksi tutkintoon kuului vielä harjoittelu ja tutkielma. Lähes jokainen opintojakso sisälsi niin yleisempää teoriaa kuin käytännön harjoituksia. Spesialisteja lennätettiin Euroopasta ja pohjois-Amerikasta vetämään yksittäisiä opintojaksoja. Opettajia oli siis lähes yhtä paljon kuin kurssejakin.

Niinpä sanon suoraan: olin kateudesta vihreä – ja tämän väitettiin olevan vain valikoima erään toisen yliopiston kurssipaletista.Suomalaisissa yliopistoissa on asiakirjahallinnan alueella korkeintaan yksi opettaja, jos sitäkään. Asiakirjahallinnan kaikki opintojaksot ovat ehkä reilu kymmenys tämän nimeltä mainitsemattoman ohjelman tarjonnasta. Jos Tampereen yliopistossa on yksittäinen pelle, niin tuolla muualla on koko sirkus.

Tämä ei välttämättä ole pelkästään huono asia. Kun tiettyä aluetta opetetaan vähemmän, tutkintoon tulee väistämättä jotain muuta. Laaja-alainen ymmärrys on hyväksi.

Omasta mielestäni opetus tällä alueella saisi kuitenkin olla laajempaa ja syvällisempää. Kuuntelin syksyllä konferenssissa italialaisen arkistoprofessorin esitystä pitkäaikaissäilytykseen sopivien tiedostotyyppien arvioinnista ja valinnasta. Tietääkseni kukaan ei tällä hetkellä Suomessa pidä tällaista esitystä. Se on vain yksi erityisalue monista. Harvojen yliopisto-opettajien aika ei riitä kovin syvälliseen perehtymiseen mihinkään, kun kaikki pallot on pidettävä jotenkuten ilmassa.

Taidan olla kuitenkin ainoa, joka kaipaa korjausta. Opiskelijat työllistyvät. Työnantajat näyttävät olevan tyytyväisiä. Samoin yliopistot, jotka saavat näinkin tutkintoja. Joten kenelläkään ei ole tarvetta muuttaa tilannetta.

Pakko siis tulla siihen tulokseen, että olen väärässä. Opetus on ehkä sittenkin riittävää. Tai sitten opiskelijat ovat vain niin lahjakkaita, että saamillaan valmiuksilla hoitavat työt. Kyse lienee tästä. Omia opiskelijoita ei ole tähän mennessä tarvinnut hävetä.

(Julk. Faili 1/2022, s. 8-9)

Kategoriat:Koulutus

Hyvää joulua ja uutta vuotta

keskiviikko 22.12.2021 Jätä kommentti
Kategoriat:Kevyempää

Suoraa puhetta tekoälystä ja automatisoinnista

maanantai 22.11.2021 Jätä kommentti
Kategoriat:Tekoäly

Puhe TAAY:n 100+1 vuotta -juhlaseminaarissa

tiistai 26.10.2021 Jätä kommentti

Aivan ensiksi haluan kiittää järjestäjiä mahdollisuudesta puhua tässä tilaisuudessa ja samalla lämpimästi onnitella Tiedon- ja arkistonhallinnan ammattiyhdistystä sen ensimmäisestä sadasta toimintavuodesta. Entisenä puheenjohtajana parinkymmenen vuoden takaa yhdistys on minulle erityisen tärkeä.

Sain aiheeksi tarkastella ammattilaista ”huomenna”. Tulevaisuuden ennustaminen on tunnetusti vaikeaa. Jos sitä yrittää vakavissaan tehdä, ainoa asiallinen menetelmä lienee katsoa tämän hetken heikkoja signaaleja siitä, mitä on tapahtumassa, ja sitten olettaa näiden kehityslinjojen jatkuvan ja vahvistuvan tästä tulevaisuuteen.

Tämä menetelmä ei ole täydellinen. Ensiksikin tässä ajassa voi nähdä monenlaisia asioita, ja sen mitä näkee voi tulkita monella tavalla. Tekemäni huomiot ovat subjektiivisia ja joku muu voisi nähdä toisenlaisia asioita tai antaa näille asioille toisen merkityksen.Toinen heikkous tässä menetelmässä on, että se ei kykene ennustamaan odottamattomia ja suuriakin muutoksia, ja toki niitäkin voi tulla. Lievää uskottavuutta ajatuksilleni saattaa kuitenkin antaa se, että suomalainen asiakirjahallinta on lopulta vähemmän erityislaatuista kuin ehkä joskus olemme halunneet itsellemme uskotella.

Meillä on perinteisesti lyöty rumpua siitä, miten poikkeuksellinen ja erinomainen ohjaus- ja kehitysväline ennakkoseulontaan tehdyt ja julkishallinnossa läpiviedyt arkistonmuodostussuunnitelmat ovat. Tämä on totta. Tässä on tehty uraauurtavaa ja hyvää työtä. Vaikka on hyvin vaikea sanoa, missä määrin meillä on saatu vaikutteita ulkomailta, kehitys näyttää kotoperäiseltä. Kyse on ollut eräistä takavuosikymmenien ennakkoluulottomista visiönääreistä, jotka ovat vieneet alaa eteenpäin. Silloin on oltu muuhun maailmaan nähden etukenossa ja edelläkävijöitä, vaikka sitä ei muualla ole kovin laajasti huomattukaan.   

Samalla on todettava, että tästä huolimatta Suomi on suurissa linjoissa ja suurin piirtein kulkenut käsikynkkää minusta muun maailman kanssa. Lisäksi näyttää siltä, että muu maailma on ottanut meidät kiinni.

Tehtäväpohjaisuuden tielle lähdettiin oma-aloitteisesti. Siinä oltiin muuta maailmaa edellä, ajatus omaksuttiin ennen muita, mutta sittemmin on myös muualla ymmärretty linjata tehtäväpohjaisuus tiedonhallinnan perustaksi. Tämä näkyy selvimmin ISO-standardeissa. Sähköisessä asiakirjahallinnassa ei enää ole oltu edelläkävijöitä, yrityksestä huolimatta. Pikemminkin se mikä meillä toimii ja on laajasti vaikuttavaa, on kansainvälisten mallien mukaan tehtyä ja Suomen oloihin adaptoitua. Digitaalista tiedonhallintaa hallitsee aineistojen valtava kirjo ja laajuus, emmekä ole saaneet tätä kenttää sen paremmin haltuun kuin muuallakaan. Esimerkiksi sosiaalisen median suhteen arkistot ovat täällä samassa tilanteessa kuin muuallakin.

Suomalaisessa kehityksessä on oikeastaan jännittävintä se, että silloinkin kun sivuille ei ole vilkuiltu, lopputulos on sama kuin muualla. Tämä toistaa itseään, kun katsotaan tiedonhallintalakia, joka minulle edustaa suurta mannerlaattojen muutosta siinä, miten arkistot ja asiakirjahallinto asemoituvat tiedonhallintaan yleensä.

Tiedonhallintalaki on suuri kokonaisuus, josta voi löytää monia asioita. Itse näen siinä vision, jossa tietoa hallitaan laaja-alaisesti siten että eri näkökulmat yhdistyvät. Tässä katsannossa asiakirjahallinta ja sille tärkeät asiat – elinkaaren hallinta, tiedon todistusvoimaisuuden takaaminen, pitkäaikaissäilytys ja kulttuuriperintöfunktioiden mahdollistaminen – ovat vain yksi tekijä kokonaisuudessa, jossa myös muut seikat, kuten palvelujen tuottaminen, tiedon yhteiskäyttöisyys tai tietoturva ovat vähintäänkin yhtä tärkeitä, elleivät tärkeämpiä.

Asiakirja-ammattilaiset ovat tiedonhallinnassa vain yksi ammattiryhmä muiden joukossa tarkastelemassa organisaatioissa liikkuvaa dataa omasta näkökulmastaan. Muilla on siihen muita näkökulmia. Näitä eri näkökulmia on sitten sovitettava yhteen. Se, mikä ennen oli pelkästään arkiston tai asiakirjahallinnon kenttää, ei ole sitä enää.

Takana ei näytä olleen mitään visiota uudenlaisesta tiedonhallinnasta, vaan se on tulos siitä, että erilaiset datan hallintaan liittyvät tarpeet on lakiteknisesti koottu yhteen ajattelematta asiaa sen enempää. Tuloksessa ei minusta ole mitään omaperäistä. Vaikka sitä ei ole ymmärretty, kansainvälisesti tästä monialaisesta ja integroituvasta tiedonhallinnasta on puhuttu termillä ”information governance”.

Tästä päästään viimein lähes aiheeseen, eli siihen mitä profession tulevaisuus kenties näyttää. Mutta jälleen täytyy katsoa ensin hieman historiaa. Valitettavasti minulla ei ole ollut mahdollisuutta kuunnella, mitä aikaisemmat puhujat asiasta ovat sanoneet.

Tulin alalle jo lähes esihistoriallisina aikoina, 33 vuotta sitten. Tie oli normaali. Opiskeltuani poliittista historiaa, aloitin korkeakouluharjoittelun jälkeen virkaurani suoraan pohjalta, osa-aikaisen apupäivystäjän viransijaisena. Osa-aikainen apupäivystäjä oli se henkilö, joka istui silloisen valtionarkiston vanhassa tutkijasalissa avustamassa tiedonhakijoita. Ja minulla oli siis kunnia olla alkuun hänen viransijaisensa, ennen kuin ylenin itse osa-aikaisen apupäivystäjän korkeaan asemaan.

Noina vanhoina hyvinä aikoina, näin voi ehkä sanoa, maailma oli yksinkertaisempi. Kansallisarkiston tutkijasalissa näki vain menneisyyteen; siellä törmäsi arkistoihin, jotka oli luovutettu laitokseen ainakin neljäkymmentä vuotta aikaisemmin, mutta se ei juuri haitannut. Virastoissa toimittiin edelleen pääpiirteissään samalla tavalla ja hyvin yhdenmukaisesti kaikissa, uskoisin.

Yhdenmukaisesti toimittiin, ei niinkään siksi, että se olisi ollut hyvä, vaan koska vaihtoehtoja ei ollut. Tietoa oli jokseenkin vain yhdenlaista, paperista, ja sitä käytettiin ja hallittiin aina samalla tavalla, olipa elinkaaren vaihe mikä tahansa. Oli virasto suuri tai pieni, tai oli sen tehtäväkenttä mikä tahansa, aina oli arkistonmuodostussuunnitelma, aina oli paperiasiakirjoja, aina oli diaari, joka toimi hakemistona aineistoihin, ja jos kyse oli pitkäaikaisesti säilytettävistä asiakirjoista, aina oli arkistoluettelo, joka samanlaisena palveli yhtä hyvin – tai yhtä huonosti – niin sekä viranomaista kuin tutkimusta.

Tämä kenttä oli täysin Kansallisarkiston hallinnassa. Sen ohjeet ja määräykset olivat ammattilaisten pääasiallinen ohjenuora, eikä kukaan muu heidän tekemisistään juuri ollutkaan kiinnostunut.

Pirstoutuminen on yksi selvä kehitystrendi, kun katsoo kehitystä. Kolmenkymmenen vuoden takainen lähtötilanne oli monoliittinen. Toimintamahdollisuudet olivat paperimaailmassa kaikissa elinkaaren vaiheissa samat, oltiinpa viranomaisessa tai päätearkistossa.  Stten tuli digitaalisuus ja muutti tilanteen, koska organisaatioille tuli ensi kertaa mahdollisuuksia mukauttaa tiedonhallintaa toimintaansa.

Digitaalisen tiedon diversiteetti on valtava. Jos kärjistää, niin vanhassa maailmassa tieto jakaantui kärjistäen kahteen lajiin: oli A4:sia ja sitten sitä vanhempaa ja hieman suurempaa foliokokoista arkkia. Dataa on sen sijaan dokumenttipohjaista, tutkimusdataa, tietokantoja, oppimisympäristöjä, nettisivuja, sosiaalista mediaa ja kaikkea muuta, ihan vain muutaman esimerkin mainitakseni. Kun yhteiskunta kehittyy, eri muotoja ja uusia erityisalueita tulee lisää. Yhteentoimivuus, open data, big data, my data, yksityisyys, digitointi, keinoäly, pilvipalvelut, lohkoketjut – jokainen avaa uuden matopurkin, jossa on omia asiakirjahallintaan liittyviä kysymyksiä. Niinpä on helppo ennustaa, että ainakin paine profession eriytymiseen on lisääntymään päin.

Viranomaisissa painitaan moninaisten säädösten ja niiden tulkinnan parissa sovittaen tarpeita organisaation toimintaan ja muiden tietoammattilaisten näkökulmiin. Jälkeen kysymys on hyvin erilaisista asioista, jossa vaaditaan erilaista osaamista.

Samaa koskee päätearkistotoimintaa. Kun katsoo Kansallisarkistoa, tekeillä on esimerkiksi vanhojen käsialojen tunnistamista READ-hankkeessa, uuden luettelointijärjestelmän kehittämistä AHAAssa, massadigitointia sekä määräyksien antamista viranomaisille SÄHKE2:ssa. Kaikki nämä toiminta-alueet ovat hyvin erilaisia, ja niissä vaaditaan erilaista osaamista.

Eli pirstoutumista tapahtuu. On yhä vaikeampaa vaihtaa paikkaa asiakirjahallinnan pelikentällä. Missä määrin professio sitten oikeasti eriytyy, riippuu siitä, mitä meillä on korvien välissä. Suomalaiset asiakirja-ammattilaiset ovat perinteisesti olleet harvinaisen yksituumainen ryhmä, ainakin ulospäin. Olemme saaneet saman koulutuksen, kuuluneet samoihin yhdistyksiin ja lukeneet samoja lehtiä. Vaikkei olisi koskaan ollut yhtä professiota konkreettisen tekemisen tasolla, niin koulutus, ammatti-identiteetti ja tunne yhteisestä missiosta ovat liittäneet yhteen erilaisia toimintoja ja ilmiöitä.

Nämä toiminnot ja ilmiöt olisi voitu ymmärtää myös erillisiksi ja eri ammattiryhmille kuuluviksi koetaan. Niin myös usein muualla tehdään. Tarkoitan tässä jakoa asiakirjahallintoon ja kulttuurihistorialliseen päätearkistoon. Uskoisin tämän jaon korostuvan ja tulevan entistä näkyvämmäksi myös täällä. Se, että tiedonhallintalaki tunnetusti ja meillä ennenkuulumattomasti tekee eron päätearkistoinnin ”arkistoinnin” ja viranomaisen tekemän säilyttämisen välille, on minusta oireellista. Nämä alueet ovat todella erilaisia, kun ajatellaan käyttäjiä, toiminnan päämääriä ja tiedonhallinnan toimintaympäristöä.  

Niinpä mielenkiintoista on, miten näkökulmat jatkossa muuttuvat ja mitkä niistä painottuvat alan sisäisessä keskustelussa. Mutu-tuntumalla väittäisin, että alalla kirjoittelua ovat dominoineet pysyvästi säilytettävät aineistot, mutta sillä tavoin, että arkistoammattilainen on prosessista häivytetty.  Kulttuurihistorialliset aineistot ja tutkimuskäyttö ovat alan lehdistössä esillä näkyvästi, mutta arkistoammattilainen on niistä puhuttaessa taustalla: esitellään aineistoja, kerrotaan tutkijoista. Jos arkistoammattilaisen toiminta näkyy päätearkistoaineistossa, sitä käsitellään mekaanisena ja itsestään selvänä prosessina, jota ei tarvitse pohtia.

Kun määräajan säilytettävistä aineistoista kirjoitetaan, niitä katsotaan koko asiakirjahallinnan osana. Se mikä puuttuu keskustelusta, ovat määräaikaiseen säilyttämiseen liittyvät sektorikohtaiset kysymykset. Kun Kansallisarkisto vetäytyy kulttuurihistorialliseen tehtäväänsä, tällaisten alueiden pohdinnalle olisi enemmän tilaa. Esimerkiksi terveydenhuollon aineistojen problematiikasta ei juuri kirjoiteta.

Asiakirjahallinnon ja tiedonhallinnan suhteesta on keskusteltu kansainvälisesti: onko information governance jotain mikä avaa asiakirjahallinnalle uusia mahdollisuuksia; onko se peräti uusi asiakirjahallinnan kehitysvaihe – vaiko päinvastoin vain iskusana, jolla myydään asiakirjahallintaa uudessa paketissa. Koska sanoja voidaan käyttää eri merkityksissä, tähän ei ole yhtä vastausta. Itse kuulun niihin, joiden mielestä information governancen tavoitteena on hallita kaikkia informaation aspekteja siinä missä asiakirjahallinto keskittyy joihinkin piirteisiin. Tästä näkökulmasta IG on laajempi kattokäsite, joka pitää sisällään myös asiakirjahallinnon yhtenä sen osana.

IG:n on sanottu myös korvaavan asiakirjahallinnan. Takana on ajatus, että asiakirjahallinta ei ole kyennyt vastaamaan digitaalisen informaation määrän ja kirjon kasvuun ja että se on liikaa sidoksissa paperimaailman toimintatapoihin.

Minusta tätäkin kannattaa pohtia. Missä määrin meillä on kyetty uudistamaan asiakirjahallintaa? On usein korostettu, että paperimaailman prosesseja ei ole pidä sellaisenaan muuttaa digitaalisiksi vaan niitä on uudistettava vietäessä ne sähköiseen toimintaympäristöön. Mutta en tarkoita tätä. Kysyn, missä määrin itse asiakirjahallinta on uudistunut? Minusta ei kovinkaan paljon, jos ollaan rehellisiä. Edelleen kirjaaminen on asiakirjajärjestelmien toiminnan ytimessä. Edelleen arkistonmuodostussuunnitelma on keskeinen työkalu.

Toki nyt enää emme puhu diaarista, puhumme asiarekisteristä. Emme puhu kirjaamisesta, puhumme rekisteröinnistä. Emme puhu myöskään AMSista, puhumme tiedonohjaussuunnitelmasta, mutta asiallisesti lähestymistapa ei ole muuttunut. Sähköisessä maailmassa AMS ja diaari liitettiin ensin yhdessä toimivaksi kokonaisuudeksi ja sen jälkeen uudistaminen on ollut sitä, että tätä ratkaisua on tiedonohjausjärjestelmän nimellä yritetty soveltaa yhä laajempaan joukkoon tietojärjestelmiä. Tämä tie lienee nyt kuljettu loppuun. Kyse ei ole siitä, että TOSsit ja tiedonohjausjärjestelmät olisivat täysin epäonnistuneita tai että ne eivät vastaisi ammatillisiin tarpeisiin. Ongelmana on ensiksikin se, että organisaatioiden data on usein sellaista, joka on niiden avulla huonosti, jos lainkaan hallinnoitavissa.

Ehkä vielä olennaisempaa on se, että data on yhteinen asia, mutta TOSsit ja TOJ:t ovat puhtaasti asiakirjahallinnan ratkaisu puhtaasti asiakirjahallinnan ongelmiin. Datan hallinnassa tarvittaisiin eri ryhmien yhteistyötä, mutta TOSsit ja TOJ:t eivät tarjoa tähän siihen välineitä. Ne ovat yksi piparkakkumuotti taikinalevyllä, josta halutaan tehdä myös toisenlaisia piparkakkuja. Eri ammattiryhmät käyvät datan tiimoilla taistelua siitä, kuka saa määritellä käsitteet ja ensisijaiset näkökulmat, ja arkistoalan suhteellinen painoarvo on laskenut samalla kun se on menettänyt monopolinsa asiakirjatiedon hallinnassa.  

Pohjimmiltaan uusien digitaalisen aineistojen ongelma on, että perinteinen ”luokittele ja valvo” -lähestymistapa tehoaa niihin huonosti. Ja koska asiakirjahallinnalla ei ole muita lähestymistapoja, monet lienevät alan ulkopuolella lienevät valmiita sivuuttamaan koko alueen vanhentuneena. Tältä voidaan sulkea silmät. Voidaan keskittyä vain siihen osaan datasta, joka saadaan ammattikunnan haaviin, Suomessa lähinnä asiankäsittelyjärjestelmiin, ja unohtaa muu, mutta silloin asetutaan vapaaehtoisesti yhä kapenevaan marginaaliin. Silloin jäädään niiden kysymysten ulkopuolelle, jotka korventavat koko muuta yhteiskuntaa.

Sähköposti tarjoaa tilanteesta yhden esimerkin. Sähköpostin arkistoinnin ongelma on ollut ilmeinen jo 30 vuotta. Sähköpostia on aivan liikaa. Enronin romahtaessa vuonna 2002 talteenotettu sähköposti on tiettävästi edelleen suurin julkiseksi tullut sähköpostikokoelma. Siinä on yli 1,7 miljoonaa viestiä.[1] Dataa on niin paljon, ettei kukaan voi sitä sitä hahmottaa.

Yritykset saada sähköposti hallintaan ovat epäonnistuneet. Käyttäjät tyypillisesti velvoitetaan tallentamaan ns. ”tärkeät” asiakirjat johonkin toiseen järjestelmään, mutta he eivät sitä tee. Lisäksi sähköposti on luonteeltaan keskustelevaa; sen arvo on viestiketjuissa, joista yksittäinen viesti paljastaa vain pienen osasen. Useinkaan tuloksena ei ole yhtä päätösasiakirjan kaltaista dokumenttia, joka voitaisiin erottaa muista tallennettavaksi ”arvokkaana” asiakirjajärjestelmään.

Asiakirjahallinnan pitäisi huolehtia toiminnan vastuullisuudesta ja todennettavuudesta. Alalla olevien pitäisi olla tässä toimijoita, agents of accountability, mutta vaikka kuinka puhuisimme tästä, siitä ei oikeasti pystytä suoriutumaan. Arkisto ei yksinkertaisesti ole sellainen voimatekijä, että se kykenisi tästä huolehtimaan.

Lisäksi tehtävässä on sekä teknisiä että käytännöllisiä esteitä. Ei ole välineitä, joilla varmistettaisiin, että sähköposti saadaan kaikkine metatietoineen ymmärrettävänä talteen. Tässä yhteydessä voi kertoa anekdootin. Hilary Clinton kävi aikoinaan yksityisen palvelimen kautta ulkoministerinä sähköpostikirjeenvaihtoa. Muistatte ehkä, että se oli silloin suuri skandaali. Mutta tosiassa se oli arkistonäkökulmasta svain hyvä: Yhdysvaltainen liittovaltion sähköinen arkistointi oli sillä tasolla, ettei virallisilla palvelimilla näistä viesteistä ei olisi enää mitään jäljellä.

Sähköpostin käsittely on edelleen ongelma. Yhdysvalloissa vuonna 2014 lainsäädännöllä vahvistettiin sähköpostin asemaa asiakirjoina. Suurin piirtein samaan aikaan kansallisarkisto NARA siirtyi talteenotossa ns. Capstone-strategiaan, jonka ideana on ottaa joko pysyvästi tai kolmeksi tai seitsemäksi vuodeksi säilytettäväksi pääpiirteissään kaikki organisaation avaintehtävissä tuottama sähköposti. Suuri kysymys on tietysti, mitkä ovat sellaisia avaintehtäviä, että ne otetaan Capstonessa huomioon. CIA esitti pysyvästi säilytettäväksi 22 tehtävän sähköposteja, mutta kongressin puututtua asiaan listalle tuli lopulta 426 sähköpostitiliä.

Capstone ei sisällä auditointimenettelyä ja sitä voidaan ehkä kiertää ohjaamalla asioiden hoitoa toisille tileille tai hävittämällä viestejä kaikesta huolimatta. Arkiston kannalta olennaista on, että mahdolliset ongelmat alkavat paljastua vasta vuonna 2030, kun sähköposteja aletaan siirtää NARAan viidentoista vuoden ikäisenä. Siis, lyhyesti sanoen, vaikka arkiston pitäisi olla se toiminnan todennettavuudesta huolehtiva taho, se ei todellisuudessa pysty sitä olemaan. Tapahtumat ovat muiden käsissä ja arkiston on vain odotettava kädet ristissä toivoen parasta.

Voisi ajatella, että digitaalisten aineistojen ansiosta kansalaisten pääsy viranomaistietoon helpottuu. Näin ei välttämättä kuitenkaan käy. Pääsy 2000-luvun sähköisiin viranomaisaineistoihin saattaa jäädä hyvin rajoitetuksi. Tämä johtuu siitä, ettei niitä voida avata mielekkäällä tavalla käytettäviksi. Dataa on paljon, Obaman hallinnolta jäi sitä 80 teratavua, ja erityisesti henkilötietojen tunnistaminen on ongelma – niitä ei voida erottaa aineistosta kustannustehokkaalla tavalla. Silloin aineistoa ei voida Yhdysvalloissa antaa vapaasti käyttöön 75 vuoteen. Tästä syystä ainuttakaan sähköpostikokoelmaa ei ole vielä avattu julkisesti käytettäväksi, vaikka dataa on tallessa Reaganin kaudesta 1980-luvulta saakka.

En osaa sanoa, voisiko tilanne olla sama täällä, kun sekä käytännöt että lainsäädäntö ovat hieman erilaisia. Uskon että teidän kuulijoiden joukossa on parempia asiantuntijoita arvioimaan tätä. Voi olla, että tekoäly ratkaisee tämänkin ongelman. Mutta profession näkökulmasta voi kysyä, mitä merkitsee, jos pääsyn valvonta aineistoihin ei pääsääntöisesti enää olisi sillä vaan portinvartijuus siirtyisi tekoälylle?

Mitä merkitsee se, että dataa on niin paljon, ettei sitä enää pystytä ”lukemaan” perinteisessä merkityksessä? Kun historiantutkija ei voi enää käydä perinteiseen tapaan dokumentti dokumentilta tuhansia tiedostoja läpi, hänen on turvauduttava jälleen keinoälyyn tai erilaisiin aineistosta tehtyihin visualisointeihin saadakseen siitä käsityksen. Miten se vaikuttaa profession toimintaan, esimerkiksi kuvailuihin ja arvonmääritykseen?

Niinpä, sanoisin lopuksi, että kun ajattelen ammattikunnan tulevaisuutta pitkällä aikavälillä, ainoastaan siitä voi olla varma, että ammattikunta on jollain tavalla olemassa. Asiakirjahallinta on yhteiskunnan perustehtäviä, eikä sitä ilman voida olla. Se ei kuitenkaan tarkoita, että tavat, jolla tehtävää hoidetaan, pysyisivät samanlaisina. Kun katsotaan historiaan, nähdään hyvin erilaisia tapoja toimia. Jonain päivänä tämäkin aika on kaukaista historiaa, jos maailmalle tulevaisuutta suodaan.

Esimerkin muutoksesta, jossa toisaalta asiat ovat ennallaan, saa, kun katsoo kauas taaksepäin ja asiakirjojen säilytystä antiikin Kreikassa. Herakleideksen alueella vuonna 115, siis lähes 2000 vuotta sitten, arkistorakennuksen raportoitiin sortuneen, asiakirjojen olevan huonokuntoisia ja sekaisin. Tilanteen korjaaminen ei tuntunut kiireelliseltä. – Tämähän kuulostaa tutulta tänäänkin, ei mitään uutta auringon alla. Ainahan arkistoja ja asiakirjoja on lyöty laimin ja ne ovat olleet kiireellisyysjärjestyksessä viimeisenä.

Tarkemmin lukien alkaa löytää kuitenkin eroja. Arkistorakennus oli siis sortunut. Raportissa oli kyse kunnostuskustannusten maksajasta. Arkistorakennus oli nimittäin rakennettu julkisin varoin, mutta aineistosta vastaavat eivät olleet julkisen viran haltijoita. Meille tämä tuntuu oudolta, mutta he eivät olleet arkistoammattilaisia nykymielessä, he olivat varakkaita yksityishenkilöitä, joiden huostaan asiakirjat oli uskottu ja joiden kuului huolehtia myös juoksevista kuluista. Tämä oli tuolloin yleistä.

Samanlaisia muutoksia voi tapahtua jatkossakin. Ehkä jonain päivänä tuntuu oudolta esimerkiksi, että joskus organisaatioissa oli pelkästään asiakirjahallintaan erikoistuneita ammattilaisia, tai että jokaisessa kunnassa oli oma päätearkisto. Mikään ei tietysti muutu yhdessä hetkessä, mutta lukuisat pienet muutokset tuovat ajan myötä suuren muutoksen. Meidän alalla toimivina täytyy olla herkkiä havaitsemaan ajassa tapahtuvia asioita ja valmiita reagoimaan niihin.

Uskon, että teoreettisen osaamisen merkitys nousee koko ajan. Korkeastikoulutetuilla ammattilaisilla on kysyntää, kun maailma monimutkaistuu, vanhat ratkaisut eivät enää toimi ja uusia kaikille sopivia ratkaisuja on yhä vaikeampi löytää. Silloin kysytään tavoitteiden ja periaatteiden ymmärtämistä ja uusien keinojen kehittämistä. Se ei tietysti ole helppoa, mutta sitä vartenhan akateemiset asiantuntijat ovat, että keinot keksitään.

Tästä lähtökohdasta on hyvä lähteä kohti tuntematon tulevaisuutta! Toivotan ammattiyhdistykselle ja sen jäsenille onnea menestystä nyt toisen vuosisadan alkaessa!


[1] https://en.wikipedia.org/wiki/Enron_Corpus

(Puhe juhlaseminaarissa 22.10.2021)

Tiedonhallinnan diktaattorin päiväuni

keskiviikko 22.9.2021 Jätä kommentti

Tiedonhallintalautakunnan säilytysaikoja pohtiva jaosto aloitti työnsä syyskuussa. Aloituspalaveria ja -webinaaria on juuri pidetty. Tehtävä on monimutkainen, ja jos se ei ole monimutkainen, toiveet ovat haastavia.

Vanha tapa ohjata arvonmääritystä on… vanha. Säilytysaikojen etsiminen pdf-tiedostoista ei ole nykypäivää. Suositukset ja päätökset eivät ole helposti käytettävissä. Ne ovat usein vanhentuneita. Terminologia elää ja lainsäädäntö muuttuu. Säilytysajat on yleensä määritelty asiakirjatyypeittäin ja arkistonmuodostajittain. Tarvittaisiin kokonaisvaltaisempaa ja ajantasaisempaa tiedonhallintaa, joka kohdistuu asiakirjatyyppien sijasta tietosisältöihin, ei rajaudu tiedonhallintayksiköihin vaan tarkastelee säilyttämistä tehtäväalueittain ja on sovellettavissa myös yhteisiin tietojärjestelmiin.

Tavoitteena pitäisi olla tietopalvelu

  • josta saa tiedon säilytysajasta, olipa se suositus, Kansallisarkiston tekemä päätös, tai laista tuleva määräys
  • jonka on luettavissa myös koneellisesti, että prosesseja voidaan automatisoida
  • joka on sidottu eksplisiittisesti perusteisiinsa, niin että esimerkiksi lainsäädännön muuttuessa vanhentuneet kohdat ovat helposti löydettävissä ja päivitettävissä
  • jota pidetään keskitetysti yllä.

Kuntaliiton tietokanta säilytysajoista on askel oikeaan suuntaan. Mutta muuten tavoitteesta ollaan kaukana.

Minusta tavoite konelukuisuudesta on tärkeä. Mallinnus ontologiaksi ei ole yksinkertainen tehtävä. Jos oikeasti pyritään ohjeistamaan tai määräämään tiedon säilyttämisestä konkreettisen toiminnan tasolla on myös toimintaympäristö on huomioitava. Muuten tarvitaan aina ihminen lukemaan tekstiä ja kääntämään sitä toiminnaksi, ”mitä tämä merkitsee meille”. Lisäksi toimintayksiköllä on aina oltava mahdollisuus muuttaa säilytyssääntöä, jos siihen ei ole juridista tai vastaavaa estettä. Poikkeuksia on varmasti enemmän kuin pystyy kuvittelemaan.

Tulkinnanvaraisuutta jää myös aina. Ideaalimaailmassani meillä olisi yksi tiedonhallintavirasto, joka sekä ylläpitäisi keskitettyä tietämyskantaa, että auktoritatiivisesti tulkitsisi sen sisältöä ja ohjaisi soveltamista eri tilanteissa. Mutta sen sijaan meillä on kaksi palasta; tiedonhallintayksikköjen säilyttäminen ja Kansallisarkiston ”arkistointi”. Näiden kahden hitsaaminen yhteen toimivaksi ja tehokkaaksi kokonaisuudeksi on auki.

Itseäni askarruttaa eniten, miten Kansallisarkisto saa jatkossa riittävät tiedot viranomaisten tietoaineistoista niin, että se voi toteuttaa omaa tehtäväänsä. On esitetty, että tiedonhallintalautakunnan tekemät suositukset olisivat myös seulontaesityksiä Kansallisarkistolle ja että lautakunnan jaosto hyödyntäisi arvioinnissaan Kansallisarkiston arvonmääritys- ja seulontapolitiikka-asiakirjoja. Tämä saattaa olla toimiva lähestymistapa.

Ongelmallista on, että minun ymmärtääkseni se ei ole tiedonhallintalautakunnan mandaatin mukaista. Julkaistuun suositukseen tuskin voidaan sisällyttää arvioita aineistojen arkistointitarpeesta, kun valta niistä päättämiseen lienee jatkossakin muualla. Jos niin tehtäisiin, se herättäisi hämmennystä.

Kategoriat:Arvonmääritys

Asiakirjahallinnon tutkimuksen tila on surkea

tiistai 21.9.2021 Jätä kommentti

Ensimmäinen katsaus sähköisen asiakirjahallinnon tutkimukseen pitkään aikaan ilmestyi äskettäin. Tilanne on huono. Tutkijat analysoivat kymmenen vuoden ajalta tutkimuksia tieteellisissä viitekannoissa. Kaikkiaan haaviin jäi 55 artikkelia – siis keskimäärin vähemmän kuin yksi julkaistu kirjoitus joka toinen kuukausi. Johtopäätökset ovat selvät. Alue on menettänyt kiinnostavuuttaan ja tutkimusten määrä vähentynyt.

Tähän on monta syytä. Ensiksikin asiakirjahallinnon näkyvyys on laskenut, koska alue on sulautunut sisällönhallintaan ja tiedonhallintaan.

Tämä näkyy teoriassa ja käsitteissä. Perinteinen arkistotiede oli huolissaan erottautumisesta. Siksi pohdittiin asiakirjojen ja arkistojen keskeisiä piirteitä. Näistä vedettiin ohjenuoria toiminnalle ja rajaa muihin informaatioaloihin. Vaikka tämä on yhä tarpeen, asiakirjat nähdään digiympäristössä enemmän ryhmien rajoja ylittävinä olioina, joilla on kussakin ryhmässä eri merkitys. Näin asia on silloin kun asiakirjahallinnan ammattilainen, datatieteilijä, systeemiarkkitehti, tietoturvaspesialisti ja juristi tarkastelevat samaa dataa.

Asiakirjahallinnan implementoinnista, suunnittelusta ja toteutuksesta on jokseenkin runsaasti tutkimusta verrattuna muihin alueisiin. Uudet tulokset tukevat aikaisempia: tarvitaan johdon tukea, avointa viestintää, selkeitä toiminta- ja tietojärjestelmästrategioita. Tutkimuksia tulee eniten nimenomaan kehittyvistä maista. Siellä lähtökohdat ovat joskus huonot. Laajin tutkimus on Koreasta. Siinä tutkittiin 1600 taiwanilaisen viraston tyytyväisyyttä asiakirjajärjestelmäänsä. Virasto oli tyytyväinen, kun järjestelmä täytti säädös- ja muut vaatimukset ja tuki viraston toimintaa. Tärkeää oli, että tukipalvelut ovat hyvät; silloin järjestelmää opitaan käyttämään ja siitä saadaan suurin hyöty.

Kirjoittajat ehdottavat sähköisen asiakirjahallinnan kehitystyön lakanneen siksi että sähköisten asiakirjajärjestelmien määritykset rajoittavat innovointia. Esimerkki tästä on automaattinen luokittaminen: siihen olisi välineitä, mutta koska sitä ei ole vaatimusmäärittelyissä, se puuttuu järjestelmistä. Argumentti kuulostaa minusta yleisemminkin järkeenkäyvältä: jos on jo määritelty tapa tehdä asiat, niin miksi tuhlata ruutia uuden kehittelyyn? Keskeiseksi haasteeksi nähdään nyt ihmiset ja informaatiokulttuurit. Onnistuminen on kiinni pienistä ja joskus satunnaisista tekijöistä. Siinä vaaditaan kokeilua, johtamista, hyviä vaistoja ja yhteistyötä. Pitkäaikaissäilytys on myös edelleen haaste. Sosiaalisen median osalta kehitys on lasten kengissä ja asiakirjahallinnon panos siinä olematon.

Oladejo, B., & Hadžidedić, S. (2021). Electronic records management – a state of the art review. Records Management Journal (ahead-of-print). https://doi.org/10.1108/RMJ-09-2019-0059

(Julk. Faili 3/2021, s. 9)

Hyvä arkisto, paha arkisto

tiistai 21.9.2021 Jätä kommentti

Suomalaisena tuntee joskus olonsa oudoksi ulkomaalaisten parissa. Se johtuu siitä, että meillä on omituinen näkökulma maailmaan. Pohjoismaissa yksilö on ulkoistanut hyvät puolensa valtiolle. Valtio ei edusta meillä pahaa. Se on yhteisen edun valvoja.

Tämähän on kansainvälisesti täysin vinksahtanut katsantokanta. Melkein missä tahansa muualla valtio on muuta. Se on pelottava voima, joka yrittää valvoa kansalaista. Byrokraattinen, omalakinen koneisto, joka on mahdollisesti korruptoinut. Epäilyttävä taho, jolla on yksinoikeus väkivallan käyttöön, ja jossa kiteytyvät kaikki yhteiskunnan valta- ja voimatekijät.

Ero näkyy myös arkistokentässä. ”Arkistojen tehtävä ei ole dokumentoida menneisyyttä tai rakentaa tulevaisuutta, se on vapauttaa ihmiset nyt”, julistetaan pohjois-Amerikasta. Arkisto, joka tässä tarkoittaa mitä tahansa julkisesti rahoitettua ja institutionalisoitua tahoa, on sorron välikappale. Se on Paha arkisto, joka edustaa virallista historiaa, valtakulttuuria ja kaikkea sitä voiman käyttöä, joka on sisäänrakennettu yhteiskunnan rakenteisiin ja käytänteisiin. Koska arkisto tällaisena on paha, tärkeät tapahtumat ovat sen ulkopuolella. Arkisto on liian tärkeä asia jätettäväksi arkistonhoitajille, voisi sanoa.

Kun ihmiset ottavat arkiston omiin käsiinsä ja alkavat itse omaehtoisesti koota ”yhteisöarkistoa”, eli aineistoa omasta yhteisöstään ja sen historiasta, silloin arkisto on hyvä. Se on terapeuttinen, hoitava, vapautumisen väline ja identiteetin lähde. Hyvä arkisto edustaa ihmisten omia kertomuksia ja kokemuksia. Hyvä arkisto sisältää ne asiat ja kokemukset, joita Pahaan arkistoon ei voi luovuttaa, koska Pahassa arkistossa ne hukkuisivat massaan eikä niitä siinä arvostettaisi, jos ne edes siihen huolittaisiin.

Paha arkisto voi kuitenkin eheytyä. Se voi ymmärtää oman puutteellisuutensa ja sitä ohjaavat ja rajoittavat tekijät. Se voi taistella niitä vastaan. Ennen kaikkea se voi ottaa käyttäjät mukaan täydentämään aineistojaan ja omaa näkökulmaansa niihin. Se voi myös verkostoitua Hyvien arkistojen kanssa ja tukea niitä.

Tämä on tietysti karrikoitua. Jos joku ajattelisi noin, se olisi kovin naivia. Mutta keskustelussa on tämä sävy. Suomalaisena siinä on jossain määrin hukassa. Miten sitä Kansallisarkistosta sanottaneenkin kahvipöydissä, kukaan tuskin ajattelee, ettei siellä vilpittömästi ja moraalisesti pyrittäisi tuomaan esille yhteiskunnan kokokuvaa. Se on tietysti vain yksi puoli asiasta, koska kyse on myös tiedostamattomasta toiminnasta, joka tukee joitain rakenteita ja hylkii toisia. Silti uskoisin suomalaisten luottavan arkistoihinsa.

Luottamuksesta kertoo minusta se, ettei meillä tietääkseni ole yhteisöarkistojen kaltaista liikehdintää. En ole huomannut sitä muuallakaan pohjoismaissa. Mahdollisuuksia olisi. Ehkä Kemijärven paperitehtaan jäljiltä on perustettu sellainen dokumentoimaan paikallista mennyttä maailmaa? Sukupuolivähemmistöjen aineistoja on koottu Työväen arkistoon, siis julkisesti rahoitetun arkistoalan establishmentin haltuun. Tätä ei minun käsittääkseni tapahtuisi monessa muussa maassa. Epäluottamus siihen, että aineistoja kohdeltaisiin reilusti ja niitä ei käytettäisi väärin, olisi liian suurta. Väittäisin siis, että meillä vähemmistötkin ovat valmiita luottamaan virallisiin arkistotahoihin.

Mutta mitäpä minä tiedän. Jos joku tässä maassa on lähtökohtaisesti pihalla vähemmistöistä ja vaihtoehtokulttuureista, niin se on valkoinen, koulutettu, keski-ikäinen mies, joka kuuluu enemmistöön tai hyväosaisiin kaikilla mahdollisilla mittareilla. Siksi olisi hyvä, jos joku oikeasti tutkisi asiaa. Vähemmistöjen arkistosuhteeseen liittyvälle väitöskirjaprojektille voisi saada jopa rahoitusta, vaikka se yleensä onkin erittäin vaikeaa.

Julk. Faili 3/2021, s. 7-8.

Oikean ja väärän tiedon rajamailla – arkisto sopii huonosti sisällöntuottajaksi

keskiviikko 11.8.2021 Jätä kommentti

Seuraava kirjoitus tuli vastaan, kun kävin vanhoja romppujani läpi pelastaakseni niiltä tarpeellista aineistoa pilveen. Tiedosto on päivätty 2.11.2000, joten kirjoitus lienee jo kahdenkymmen vuoden takaa ajalta, jolloin olin edesmenneessä Sota-arkistossa työssä. Koska ajatuksessa on mielestäni edelleen järkeä, julkaisen tekstin tässä. Aikanaan se jäi julkaisematta, vaikka sitä johonkin tarjosinkin. Taustalla oli jossain määrin tuohtuneiden asiakkaiden kohtaamisia tutkijasalissa.

Kun Sota-arkiston tietokanta “Suomen sodissa 1939-45 menehtyneiden tiedosto” (Databas för de stupade i finska krigen 1939-45) tuli syyskuun alussa internetiin käytettäväksi, siihen kohdistui harvinaislaatuinen ryntäys. Tietokantapalvelin tukkeutui välittömästi ja kone piti vaihtaa kaksi kertaa ennen kuin se selvisi käyttäjämäärästä kohtuullisesti. Tietokannalla oli kuukauden aikana noin 100 000 käyttäjää ja siitä tehtiin puoli miljoonaa hakua.

Arkistot ovat aina tehneet lähdejulkaisuja, mutta Suomen sodissa 1939-45 menehtyneiden tiedosto ei ole lähdejulkaisu; se ei heijasta mitään yksittäistä aineistoa. Tiedostoa koottaessa useista lähteistä saatavaa raakatietoa pyrittiin jalostamaan niin, että tuloksena olisi mahdollisimman luotettava ja tarkka tietokanta sotien seurauksena menehtyneistä 94 000 henkilöstä.

Tiedoston kokoamisessa ja sen tuomisessa internetiin on kyse puhtaasti asiakirja-aineiston pohjalta tapahtuvasta sisällöntuotannosta. Kokemuksen pohjalta voi tehdä monenlaisia huomioita. Voi esimerkiksi nostaa esiin työn kalleuden; kahdentoista toimintavuoden aikana tiedostoprojektiin upposi miljoonia markkoja. Voi myös pohdiskella sitä, miten suhteettomia odotuksia kansalaisilla on. Valtavasta työstä huolimatta tiedostossa ei ole yhdestä menehtyneestä kuin suppeat perustiedot. Ei edes valokuvaa, puhumattakaan henkilön tai hänen yksikkönsä vaiheista sodassa, joita käyttäjä alkaa seuraavaksi kaivata.

Olennaisin huomio kuitenkin on, että arkiston on vaikea olla sisällöntuottaja, vaikka asiakirjoja käytetäänkin sisällöntuotannossa. Arkisto törmää herkästi ongelmiin myös silloin, kun se antaa käytettäväksi sähköisiä aineistoja. Arkiston rooliin ei kuulu ottaa kantaa siihen, millainen on lähteiden takana oleva todellisuus, ja juuri sitä sisällöntuotanto edellyttää.

Iloa ja suuttumusta

Suomen sodissa menehtyneiden tiedoston tiedot koottiin yli kymmenen vuoden aikana projektissa, joka päättyi vuoden 1997 lopussa. Projekti ei päättynyt siksi, että tietokanta olisi ollut valmis, tiedoiltaan täydellinen ja tarkastettu. Projekti päätettiin lopettaa siksi, että sen jatkamiseen ei enää ollut rahoitusta. Tiedosto jäi osin keskeneräiseksi. Se tuotiin sellaisena myös internetiin, koska puutteistaan huolimatta sillä oli käyttöä sukututkijoille, matrikkelin laatijoille ja erilaisten historiikkien tekijöille.

Tiedoston tultua suuren yleisön ulottuville siinä olevista virheistä alettiin saada heti palautetta. Korjauspyyntöjä on tullut satoja. Määrä ei ole pieni, muttei myöskään kohtuuton tiedostossa olevaan tietomäärään nähden. Myönteistä palautetta on ollut paljon. Puutteisiin kansalaiset ovat suhtautuneet enemmän tai vähemmän ymmärtävästi.

Ruotsinkielisten suuttumusta on herättänyt, että tiedostoon on merkitty monille kaatuneille omaisille äidinkieleksi suomi. Tärkein syy siihen on, että äidinkieltä ei useinkaan ole mainittu lähteinä olleissa asiakirjoissa. Kantakortit, joissa tieto on, eivät olleet käytettävissä, kun tiedoston perustietoja koottiin 1980-luvulla. Kun lisäksi tietoja tallennettaessa oli oletuksena, että henkilön äidinkieli on suomi ellei lähteissä toisin ilmoiteta, lukuisille suomenruotsalaisille tuli tiedostoon väärä äidinkieli. Jälkikäteen katsoen oletuskielen käyttäminen oli erittäin huono ja valitettava ratkaisu. Olemme Sota-arkistossa saaneet keskustella tavattoman tuohtuneiden henkilöiden kanssa, joiden suuttumusta pitkä junamatka Pohjanmaalta ei ole tippaakaan lauhduttanut.

Toinen runsaasti yhteydenottoja Sota-arkistoon aiheuttanut tieto on kaatuneen lasten lukumäärä. Lähteenä käytetyissä talvisodan asiakirjoissa ei usein ole ollut tietoja lapsista. Jatkosodan osalta tiedot on saatu lähinnä Kotijoukkojen esikunnan rovastintoimiston kortistosta. Rovastintoimistonkin tiedot ovat palautteen valossa osoittautuneet yllättävän puutteellisiksi. Toimiston olisi pitänyt saada tieto kaikista lapsista, mutta niin ei ilmeisesti käynyt. Erityisesti kortistosta puuttuu lapsia, jotka ovat syntyneet isän kaatumisen aikoihin tai sen jälkeen. Eräät soittajat ovat olleet hyvin järkyttyneitä siitä, että tietokannan mukaan heidän isänsä on lapseton.

Tietoa ei saa korjata, sen pitää olla väärin

Sota-arkisto lähti alusta alkaen siitä, että tiedostossa olevat tiedot pyritään vähitellen korjaamaan käyttäjäpalautteen pohjalta. Tiedostoa koonneet henkilöt ovat edelleen Sota-arkiston palveluksessa, joskin toisissa tehtävissä, ja he voivat nykyisten töidensä niin salliessa paikata tiedostossa olevia puutteita. Lisäksi puolustusvoimat on osin vastuussa tiedoston sisällöstä, koska se rahoitti projektia loppuvuosina.

Tilanne voisi olla myös toisin. Alunperin Suomen sodissa menehtyneiden tiedosto ei ollut puolustusvoimien projekti, vaan Suomen Sotaveteraaniliiton ja eräiden muiden tahojen hanke, joka vähitellen lipui puolustusvoimien ja Sota-arkiston haltuun. Jos tiedosto olisi saatu valmiiksi näillä yksityisillä voimavaroilla ja luovutettu sitten Sota-arkistoon, lähtökohdat tietokannan ylläpidolle olisivat toiset. Arkisto ei voi muuttaa sen hallussa olevia alkuperäisiä asiakirjoja. Samalla periaatteella tiedostonkaan tietoihin ei voitaisi kajota, koska korjaamalla virheitä Sota-arkisto turmelisi sen haltuun uskotun historiallisen todisteen projektin toiminnasta.

Niin ammatillisesti perusteltu ja arkistoeettisesti oikea kuin tämä ratkaisu saattaisikin olla, on selvä että suuri osa ihmisistä ei koskaan ymmärtäisi sitä. Eikä se ole ihmeellistä; on tosiaankin vaikea käsittää, miksi viranomainen tieten tahtoen levittäisi julkisesti virheelliseksi tietämäänsä tietoa. Tätäkö varten tietoverkot ovat olemassa? Jos Sota-arkistolle on ilmoitettu, että sen tiedoissa miehen nimi on väärin, miksi väärä tieto on edelleen luettavissa kotisivulta? Selitäpä tämä lyhyesti ja kansantajuisesti.

On vaikeaa vaatia, että tietoverkon kautta saatavilla olevaa digitaalinen tallenne ymmärrettäisiin itsessään historialliseksi todisteeksi. Se olisi helpompaa, jos tiedot olisivat tietoverkossa niiden iän edellyttämässä arkaaisessa ulkoasussa. Mutta kun tietosisältö koostetaan tietokannaksi ja tuodaan julki nykytekniikalla, tämä katoaa.

Kysymys on myös arkiston, lähteiden ja todellisuuden välisestä suhteesta. Lähteet heijastavat todellisuutta, mutta arkiston rooliin ei ole kuulunut päättää, mikä lähteiden perusteella mahdollisista totuuksista on oikea, tai mitä lähteistä pitäisi päätellä. Tämä on jätetty tutkijoille ja oikeuslaitokselle. Arkistot eivät ole valikoineet aineistojaan sen perusteella, ovatko niiden sisältämät tiedot “oikeita” vai “vääriä”. Ristiriitaiset tiedot eri lähteissä eivät ole niiden ongelma.

Tästä asenteesta ei ole täysin voitu päästä eroon Suomen sodissa menehtyneiden tiedostossakaan. Joillain henkilöillä on esimerkiksi tiedostossa useampia hautapaikkoja. Tavallinen kansalainen ei voi ymmärtää, miten vainaja voisi levätä samanaikaisesti useassa paikassa. Jos jokin osoittaa tekijöiden hutilointia ja ajattelemattomuutta, niin se on tämä. Silti kyse ei ole virheestä. On henkilöitä, jotka on merkitty useampaan kuin yhteen sankarihautaan tai hautamuistomerkkiin. Molemmat seurakunnilta tulleet tiedot on toistettu tiedostossa.

Tältä pohjalta on vaikea ponnistaa sisällöntuottajaksi. Suurin osa ihmisistä odottaa tietoyhteiskunnan “sisällöiltä” joko huvitusta tai kiistattomia tosiseikkoja, ei joukkoa tulkinnanvaraisia väitteitä, joita yhdistelemällä ja vertailemalla saattaa päästä oikeaan lopputulokseen. Myös asiakirjoista johdetun tiedon käyttäminen edellyttää lähdekritiikkiä ja kontekstin huomioonottamista. Arkisto sisällöntuottajana on kuin museo, joka “tyypillisen 1910-luvun työläisasunnon” sisustamisen sijasta antaa vaillinaisia, ristiriitaisia ja harhaanjohtaviakin vinkkejä siitä, millainen tuo asunto on ollut, ja jättää ratkaisun vierailijalle.

Vertailu museoihin tuo esiin paradoksin. Museoiden tehtävänä on kertoa totuus siitä, millaista ennen on ollut, mutta tehdäkseen niin, niiden ei tarvitse pitäytyä todellisuudessa. Tyypillinen työläiskoti ei ole koskaan ollut kenenkään asunto. Museo voi valikoida. Jos jokin ei sovi kuvaan, sen voi jättää pois. Museo voi jopa käyttää hyväkseen fiktiota, kuten multimediarompuissa on tehty. Museon on toisin sanoen pitäydyttävä totuudessa, mutta sen ei tarvitse olla uskollinen todellisuudelle. Arkistoa taas ei kiinnosta totuus, ja siksi sillä ei ole muuta vaihtoehtoa kuin esittää todellisuuden jäänteet sellaisenaan, kaikkine ristiriitoineen ja puutteineen.

Historiallinen konteksti tietoverkossa

Historiantutkijat ja arkistoammattilaiset osaavat kunnioittaa lähdettä oman hetkensä tuotteena. Asiakirja kertoo ajastaan, myös virheineen ja puutteineen. Aivan kaikki eivät tätä ymmärrä edes nähdessään alkuperäisen asiakirjan. Tietoverkossa historiallista kontekstia on vielä vaikeampi hahmottaa. Kaikkein vaikeinta se on silloin, kun kyseessä on Suomen sodissa menehtyneiden tiedoston kaltainen, useista eri lähteistä koottu kompilaatio.

Käyttäjälle ei ole mitenkään ilmeistä, että Suomen sodissa menehtyneiden tiedosto sisältää osin vain sellaisia tietoja, jotka tietyillä puolustusvoimain viranomaisilla oli käytettävissä vuosina 1939-1945. Se olisi helpompaa, jos käyttäjä voisi nähdä tiedostoon sisältyvät merkinnät käytetyistä lähteistä ja niissä olevista ristiriitaisista tiedoista. Ikävä kyllä, näitä ns. kommenttitietoja ei ole voitu viedä internetiin. Tietosuojavaltuutetun mielestä lähdemerkinnät ovat osin arkaluontoisia, koska esimerkiksi kirkonkirjan käytöstä lähteenä voi epäsuorasti päätellä vainajan olleen uskonnollisen yhteisön jäsen.

Tämä on hyvä vastaavien projektien muistaa. Konteksti pitää tuoda esille, mutta kaikkea ei ehkä voi kertoa. Tietokanta on suunniteltava ottaen se huomioon. Suomen sodissa menehtyneiden tiedoston kaikki lähdetiedot on pidettävä piilossa, koska ei ole mahdollista erottaa mekaanisesti julkisia ja ei-julkisia kommentteja.

Lisäksi lähdemerkinnät olisi pitänyt tehdä ymmärrettävästi ajatellen tulevaa käyttäjää. Suomen sodissa menehtyneiden projektissa ei oletettu, että kommentit voisivat tulla joskus suuren yleisön ulottuville. Aloitettaessa työtä vuonna 1985 internetistä ei oltu kuultukaan, ja näytti siltä, että lähdemerkinnät olisivat ainoastaan projektin sisäistä materiaalia sen valmistellessa painettua matrikkelia. Niinpä ne ovat lakonisuudessaan ja lyhennerikkaudessaan enimmäkseen ulkopuoliselle käsittämättömiä.

Jotkut tietoyhteiskuntautopistit ovat maalailleet kuvia elektronisista kansallisarkistoista, joihin luovutetut tietovarannot ovat koko yhteiskunnan käytettävissä tietoverkkojen kautta. Tämän kauniin ajatuksen toteutumista laajassa mitassa voi epäillä. Päältä katsoen kaikki on yksinkertaista; viranomaiset luovuttavat sähköiset aineistonsa arkistolle, joka asettaa ne tietoverkkoon kaikkien ulottuville. Se, että aineisto on teknisesti helposti levitettävissä, ei kuitenkaan merkitse sitä, että se sisältönsä puolesta sopii yleisesti käytettäväksi. Lisäksi tekninen kehitys voi tuoda uusia tapoja hyödyntää digitaalista tietoa, joihin vanhempi aineisto ei enää parhaalla tavalla sovellu, vaikka se alunperin olisikin suunniteltu tietoverkkoon.

Samalla kun tietojen alkuperäinen konteksti katoaa, se saattaa käyttäjän mielessä korvautua uudella. Vaikuttaa siltä, että monen tietoverkkokäyttäjän on vaikea ymmärtää, mitä eroa on viranomaisen pitämällä rekisterillä ja arkiston käytettäväksi tarjoamalla historiallisella aineistolla.

Tällaisia kysymyksiä joudutaan pohtimaan arkistoissa, kun sähköisessä muodossa päätearkistoihin siirrettyjä tietoaineistoja annetaan yleisön käyttöön tietoverkkojen välityksellä. Monet kysymyksistä eivät ole uusia, mutta uutta on se, missä laajuudessa niitä ja arkistojen roolia yhteiskunnassa joudutaan selittämään kansalaisille uusien ja entistä laajempien käyttäjäryhmien tullessa kosketuksiin arkistojen kanssa.

Kategoriat:Sekalaista

Kun Kekkonen diaarikaavaa uudisti

torstai 27.5.2021 Jätä kommentti

Mikäpä pyhittää arkista arkistoaherrusta paremmin kuin suurmies samoissa mietteissä. Kun Mannerheim toimi Pietarissa hovitallien esimiehenä, hän korjasi tapaa, jolla tulevat ja lähtevät paperit talletettiin lukemattomiin diaareihin. Siinä oli Marskin mukaan kaiken pahan alku ja juuri.

Myös uudistuksia tehtiin. Nevski Prospektin Passage-tavaratalosta hankittiin hovin käyttöön uusia amerikkalaisia kirjoitus- ja kopiokoneita. Diaarit määrättiin täytettäväksi selkeällä käsialalla ja asiakirjat laadittavaksi kirjoituskoneella. Epäsiisteja tai allekirjoituksiltaan selviä asiakirjoja ei saanut ottaa enää vastaan. Kaikista raha-asioita koskevista dokumenteista oli otettava kopio. Marski siis haki toiminnan rationalisointia ja uudistamista!

Passage-tavaratalo on Nevskillä edelleen (Kuva: Alex ”Florstein” Fedorov, CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/)

Myös Urho Kekkonen taisteli diarioinnin kanssa virasto-asiain valtuutettuna puoli vuosisataa myöhemmin. Kekkonen yritti saada valtionhallinnossa läpi yhtenäistä diaarikaavaa. Sitä kokeiltiin ensin maatalousministeriössä, mutta kirjaaja oli nihkeä. Sitten yritettiin vakuutusoikeudessa. Siellä tulos oli parempi. Uusi kirjaamistapa otettiin käyttöön. Sillä ja muilla uudistuksilla saatiin vähennettyä kuusi kanslia-apulaisen virkaa.

Marras-joulukuussa 1943 tehtiin pikatestejä Lapin ja Mikkelin lääninhallituksissa. Niissä diariointi ei ollut ainoa ongelma. Myös konekirjoittajien huonous viivästytti töitä ja aiheutti kustannuksia. Ehdotus lääninhallitusten uudeksi kirjaamisjärjestelmäksi otettiin käsiteltäväksi, mutta virastojen kirjaamohenkilökunta piti omaa järjestelmäänsä parempana.

”Kyllä tämä diaarijuttu on toivoton! Akat pitäisi vetää ensin hirteen ja sitten uudistaa touhut,” päätteli Kekkonen.

Lähteenä mm. Sami Karhu: Virasto-oloja suursiivoamaan. Valtionhallinnon rationalisointi- ja kehittämistyö 1940-luvulta 1990-luvulle (Jyväskylä 2006).

(Julk. Faili 2/2021, s. 24-25)

Kategoriat:Arkistohistoria