Arkisto

Archive for joulukuu 2011

Se kalliimpi on kultaa

lauantai 3.12.2011 1 kommentti

Nyt kun arkistoissa on sähköisiä tilausjärjestelmiä, niissä toivottavasti ymmärretään tilausjärjestelmien keräämän datan arvo. Käyttötiedot ovat vielä kultaakin arvokkaampia rakennettaessa uusia palveluja ja tehtäessä tutkimusta. Käyttäjien itse toiminnassaan tuottama tieto on korvaamatonta, kun arvioidaan informaation relevanssia. Tähän perustuu esimerkiksi Googlen menestys ja tieteellisten julkaisujenkin ranking: paljon käytetty tai viitattu tieto on käyttäjille vähän käytettyä/viitattua arvokkaampaa. Parhaassa tapauksessa arkistojen datan keruuseen voisi yhdistyä käyttäjien profilointi ja tieto aineistojen käyttöjärjestyksestä. ”Tätä arkistoa käyttäneet tutkijat ovat yleensä tilanneet asiakirjoja ensin sarjasta X, sitten sarjasta Y”. ”Sukututkijoiden eniten käyttämät aineistot tässä arkistossa ovat…”. Mikä parasta, tämä informaatio kerääntyy itsestään ajan myötä. Sen sisältö, talteenotto ja hyödyntäminen pitää kuitenkin suunnitella. Tilastotietoja pitää anonymisoida ja ehkä kumuloida sopivalle kuvailutasolle. Monien arkistoaineistojen käyttö on niin vähäistä, että vasta pitkän ajan kuluttua dataa on niin paljon, että se on merkityksellistä. Myös tämä pitää ottaa huomioon.