Vaihto uuteen kokoelmahallintajärjestelmään - mistä aineistojen migraatiossa on kyse?
Koordinaattori Sampsa Heinonen mappaamassa aineistoja MuseumPlus RIA-kokoelmahallintajärjestelmään. Kuva: Tanja Salonen |
Suomen museoliiton Kookos-kokoelmahallinta tarjoaa museoille kattavan kokoelmahallinnan palvelupaketin, johon kuuluu muun muassa suomalaisille museoille räätälöity MuseumPlus RIA -kokoelmahallintajärjestelmä. Uudesta kokoelmahallintajärjestelmästä kiinnostuneita museoita on askarruttanut erityisesti aineistojen siirtoprosessi järjestelmän vaihtuessa. Museoliiton Kookos-tiimin koordinaattori Sampsa Heinonen kertoo nyt tarkemmin siirtoprosessista.
Minkä tahansa uuden järjestelmän käyttöönotto edellyttää aina tarkkaa etukäteissuunnittelua. IT-alalla käyttöönottoprojektissa tulee ottaa aina tietyt samat asiat huomioon, oli kyse sitten vaikkapa tehtaan tuotannonohjausjärjestelmästä tai museokentällä kokoelmahallintajärjestelmästä.
On pohdittava uuden järjestelmän tulevaa käyttöä organisaatiossa (montako lisenssiä tarvitaan, minkälaista koulutusta tarjota käyttäjille jne.) ja toisaalta huomioitava aiemmin organisaatiossa käytössä olleiden järjestelmien tilanne. Kun vanhoista järjestelmistä luovutaan, täytyy päättää, mitä niihin tallennetulle datalle tehdään. Jos vanhaan järjestelmään tallennetut tiedot päätetään siirtää uuteen järjestelmään, toimenpidettä kutsutaan migraatioksi.
Mitä se tarkoittaa käytännössä?
Migraatio ei valitettavasti ole suoraviivainen prosessi, jossa tiedot voitaisiin siirtää mekaanisesti vanhasta järjestelmästä uuteen ilman sen kummempaa valmistelutyötä. Museoalalla ei näet ole käytössä yhtenäistä formaattia, joka edellyttäisi tietojen tallentamista tiettyyn kontrolloituun muotoon (vrt. kirjastoalalla MARC21).
Museoiden luettelointiohje toki antaa tietyt raamit tiedon tallentamiselle, mutta se ei anna eksakteja kenttäkohtaisia määrityksiä metadatalle. Tästä syystä sama informaatio voidaan tallentaa järjestelmissä usealla eri tavalla, mikä tekee tietojen siirrosta eri järjestelmien välillä vähintään haastavaa. Museoiden aineistojen siirtoon liittyy siksi aina paljon erilaista siivoustyötä, joka tapauskohtaisesti voidaan tehdä eri vaiheissa joko koneellisesti tai käsin.
Jokainen tietokanta on rakennettu tietyn mallin mukaan, jota nimitetään tietomalliksi. Tietomallissa huomioidaan yksittäisten kenttien ohella koko tietokannan rakenne (tietokannan taulut ja niiden väliset linkitykset).
Museoalalla käytettävät tietokannat ovat useimmiten relaatiotietokantoja, mutta tietoja on tallennettu myös vaihtelevasti muun tyyppisiin tietokantoihin tai vaikkapa Excel-taulukkoihin. Eri järjestelmien tietomallit eivät ole suoraan toistensa kanssa yhteensopivia, sillä museoalalla ei ole de facto käytössä yhteistä tietomallia. Siksi migraatiossa joudutaan pohtimaan tarkkaan, miten aiemmin käytössä olleeseen järjestelmään tallennetut tiedot saadaan sovitettua uuteen järjestelmään.
Denormalisointi ja mappaus
Migraatio lähtee käyntiin tietokannan denormalisoinnilla, jossa tietokanta muokataan siirtokelpoiseen muotoon. Kookos-kokoelmahallinta esimerkiksi käyttää siirtoformaattina Access -tiedostomuotoa. Tietokannan denormalisoinnissa otetaan huomioon yleisten denormalisointitoimenpiteiden ohella myös kohdetietokanta, johon tiedot siirretään. Tästä syystä tietokantaa käsitellään tässä vaiheessa sellaiseen muotoon, josta tiedot saadaan siirtymään paremmin uuteen järjestelmään. Denormalisointi ei siten ole vain mekaanista ja standardoitua tietokannan rakenteen parantamista ja jalostamista siirtoa varten, vaan osana sitä analysoidaan myös tietokannan sisältöä. Tämän vuoksi palveluntarjoaja on ainoa toimija, joka voi toteuttaa koko denormalisoinnin teknisenä toimenpiteenä alusta loppuun.
Denormalisoinnin yhteydessä aloitetaan tietojen mappaus uuteen järjestelmään. Mappauksen aikana määritetään kenttäkohtaisesti, miten tiedot siirtyvät uuteen järjestelmään. Sen aikana käydään läpi, minkä tyyppistä tietoa yksittäisiin kenttiin on tallennettu ja miten eri tiedot on linkitetty toisiinsa.
Käyttäjällä on monesti optimistisempi käsitys metadatan laadusta kuin mitä tietokannan tarkempi analysointi paljastaa. Tämä on täysin inhimillistä, sillä järjestelmän käyttöliittymästä käsin käyttäjä ei näe suoraan järjestelmän tietokannan rakennetta eikä myöskään useimmiten pysty nopeasti analysoimaan, onko kenttään tallennettu virheellisesti erityyppistä tietoa kuin on yhteisesti ohjeistettu. Mappauksen yhteydessä onkin annettava kenttäkohtaisia siivousohjeita, jotta metadatan laatua saadaan parannettua aineistojen siirtoa ajatellen.
Kun aineistot on saatu käsiteltyä (denormalisointi ja mappaus) siirtoa varten, voidaan aloittaa aineistojen siirron testaus teknisen siirtoajon jälkeen. Mappauksen perusteella tietokantaa vielä jatkokäsitellään sellaiseen muotoon, että se on siirtokelpoinen uuteen tietokantaan. Vaikka varsinainen siirtoajo on puhtaasti tekninen operaatio, se on vaatinut sitä ennen suuren määrän erilaisia valmistelutoimenpiteitä.
Testaus
Testauksen aikana käydään kontrolloidusti ja hallitusti läpi jokaisen kentän siirtyminen uuteen järjestelmään. Onko tieto siirtynyt oikein ja ovatko esimerkiksi linkitykset siirtyneet uuteen järjestelmään halutulla tavalla?
Kookos-kokoelmahallinnassa asiakas pääsee osallistumaan testaukseen Kookos-tiimin rinnalla. Testaukseen annetaan asiakkaalle riittävä koulutus ennen testijakson alkua. Asiakas saa käyttöönsä myös samat tekniset työkalut kuin Kookos-tiimi: raportointidokumentin ja siirtokelpoiseen muotoon muokatun Access-tietokannan. Jokainen testin aikana havaittu virhe raportoidaan, korjataan ja lopulta katselmoidaan läpi virheenkorjauksen jälkeen.
Useimmiten ennen aineistojen viemistä tuotantoon on hyvä testata aineistojen vientiä uuteen järjestelmään testiympäristössä vähintään kerran, jotta siirtoa koskeviin sääntöihin ja testissä havaittuihin virheisiin voidaan reagoida etukäteen. Meillä Kookos-kokoelmahallinnassa tehdään aina ensin yksi testimigraatio testiympäristössä ennen varsinaista tuotantomigraatiota. Tällä tavoin varsinaiseen tuotantomigraatioon ei jää enää kuin yksittäisiä pieniä virheitä korjattavaksi.
Lopuksi
Aineistojen siirto vanhasta järjestelmästä uuteen on kaiken kaikkiaan varsin työintensiivinen prosessi. Käyttöönottoprojektin eri vaiheet edellyttävät laaja-alaisesti sekä IT- että museoalan osaamista, jotta lopputulos on asiakkaan näkökulmasta onnistunut. Tavallisesti tämä näkyy myös käyttöönottoprojektin hinnassa, sillä projektin eri vaiheiden hallittu toteuttaminen edellyttää palveluntarjoajalta riittäviä henkilöstöresursseja.
Asiakkaan tulisi järjestelmää vaihtaessaan pohtia kuitenkin ennen kaikkea tulevaisuutta. Satsaus uuteen ja aiempaa paremmin toimivaan järjestelmään kantaa jatkossa hedelmää muun muassa lisääntyneenä tehokkuutena arjessa ja yleisenä työn tuottavuuden kasvuna.
Sampsa Heinonen
Kirjoittaja on Suomen museoliiton Kookos-tiimin koordinaattori