Avoimen datan solmukohtia
Datan avaamiseen liittyy paljon hyvää. Täysin mutkatonta aineistojen aukaiseminen ei kuitenkaan ole. Monessa museossa on kohdattu keskenään samankaltaisia käytännön haasteita ja jouduttu pohtimaan sitä, miksi dataa halutaan avata ja mitä sillä halutaan tai voidaan saavuttaa.
S?MPLE-hanke on kartoittanut paitsi avoimeen dataan liittyviä, jo olemassa olevia käytäntöjä, myös siihen liittyviä solmukohtia ja kipupisteitä. Tässä tekstissä nostetaan esille joitakin keskeisiä avoimeen dataan liittyviä haasteita nimenomaan kulttuuriorganisaatioiden näkökulmasta.
Periaatekysymyksiä
Avoimeen dataan liittyvät solmut voidaan jakaa kahteen ryhmään: periaatteellisiin ja käytännön solmukohtiin. Näihin organisaatiot törmäävät, kun ajatus datan avaamisesta on ensi kertaa nostettu pöydälle. Ensimmäinen ja ehkä merkittävin avoimeen dataan liittyvä periaatekysymys on: "Miksi meidän organisaatiomme haluaisi tarjota aineistojaan maksuttomasti yleisön käyttöön?"
Vastauksia on monia. Yleisiä perusteluja aineistojen ja tietovarantojen avaamiselle ovat esimerkiksi se, että tieto aineistoista leviää paremmin ja laajemmalle tai että organisaatio tahtoo olla mukana uuden ilmiön aallonharjalla, edistää innovaatioiden ja sitä kautta mahdollisesti uusien tulonlähteiden syntyä. Tulot tulevat varmasti seuraavana monessa organisaatiossa mieleen, mutta tähän palaamme myöhemmin.
Seuraava kysymys datan avaamispäätöksen jälkeen on: "Mitä aineistoja voimme ja haluamme julkaista?" On aiheellista puntaroida, julkaistaanko kokoelmien hitit ja helmet, kuten esimerkiksi avoimen datan edelläkävijä hollantilainen Rijksmuseum (https://www.rijksmuseum.nl/) teki, vai kaivetaanko esille jotakin hieman tuntemattomampaa. Kummassakin vaihtoehdossa on puolensa, eikä ratkaisun välttämättä tarvitse edes olla joko tai. Harva kuitenkaan haluaa ja voi avata kaikkia kokoelmiaan. On hyvä miettiä, mitkä aineistot avataan ja tarjotaan maksuttomasti.
Käytännön haasteita
Periaatepäätösten jälkeen on aika kääriä hihat ja ryhtyä ratkomaan datan avaamiseen liittyvää käytännön problematiikkaa. Luvassa on pitkä lista haasteita, mutta usein ne liittyvät vain ensimmäiseen avattavaan datasettiin. Seuraavan avaaminen on jo helpompaa, kun rutiinit ovat ehtineet rakentua.
Suosittuja avattavia aineistoja ovat valokuvakokoelmat. Erityisesti näihin liittyy kiperä kysymys tekijänoikeuksista sekä henkilösuojasta. Selvitystyö voi olla erittäin työlästä, ja esimerkiksi valokuvien oikeuksien kohdalla vanhat sopimukset voivat osoittautua epäselviksi ja rajoittaviksi.
Sopimus- ja oikeusviidakon jälkeen edessä on valitun setin julkaisualustan valitseminen. Suosittu väylä julkaista valokuva-aineistoja erityisesti suomalaisten museoiden keskuudessa on ollut verkkopalvelu Flickr. Se on helppokäyttöinen sekä kuvien lataajalle että käyttäjälle ja mahdollistaa suurten tiedostojen jakamisen sekä kattavien taustatietojen julkaisemisen.
Flickr on kuitenkin kaupallinen toimija, eikä esimerkiksi aineistojen säilyvyydestä verkossa voida antaa mitään takeita. Tämä on hyvä ottaa huomioon julkaisualustaa valitessa. Jotkin museot ovat myös toteuttaneet omia alustojaan, mutta niissä haasteena on ennen kaikkea riittävä mainostaminen, jotta käyttäjät löytävät julkaistun aineiston luo. Kannattaa myös pohtia, olisiko hyödyllistä julkaista sama aineisto useammilla alustoilla. Usein tämä on toteutettavissa suhteellisen pienellä työmäärällä, ja aineisto tavoittaa näin eri kohderyhmiä.
Raha- ja henkilöstöresurssit ovat monen organisaation suurin huolenaihe avoimeen dataan liittyen. Erityisesti kuva-arkistot ovat perinteinen tulonlähde, jonka olemassaolo koetaan uhatuksi aineistojen avaamisen myötä. Toisaalta avoimen datan on koettu vähentävän kuva-arkistojen työmäärää, kun aineistot ja tieto ovat käyttäjien saatavilla verkossa. Työvoimaa datan avaamisessa sitoo eniten avaamista edeltävän selvitystyön lisäksi tiedostojen vieminen verkkoon. Avoimen datan yksi kriteeri on, että tieto on teknisesti saavutettavassa muodossa eli koneluettavaa. Tämä tarkoittaa, että esimerkiksi kokoelmatiedot on hyvä julkaista joko .csv- tai .xls-tiedostoina, jolloin ne voi ottaa käyttöön ilman pelkoa ohjelmistojen muodostamista rajoitteista. Toisinaan taulukkomuotoon vieminen tarkoittaa myös sitä, että dataa täytyy niin sanotusti siivota - tietoja siirtää oikeisiin kenttiin ja täyttää ja poistaa informaatiota. Siivousurakan työläys voi yllättää.
Opiksi ja iloksi muille
Tässä tekstissä on nostettu esille vain joitakin sellaisia avoimeen dataan liittyviä solmukohtia, joita S?MPLE-hanke on toimintansa aikana pannut merkille. Ne ovat hyvin pitkälti sellaisia, jotka koskettavat organisaatiota ja henkilökuntaa, joka toteuttaa datan avaamisen. Ideologisella, laajemmalla tasolla avoimeen kulttuuriin liittyy monisyisempiäkin kysymyksiä, joihin ei kuitenkaan tässä ole vielä aiheellista pureutua. S?MPLE-hanke on halunnut keskittyä toiminnassaan juuri käytännön haasteisiin, sillä niiden kanssa kulttuuriorganisaatiot enimmäkseen painiskelevat.
S?MPLE-hanke on kartoittanut paitsi avoimeen dataan liittyviä, jo olemassa olevia käytäntöjä, myös siihen liittyviä solmukohtia ja kipupisteitä. Tässä tekstissä nostetaan esille joitakin keskeisiä avoimeen dataan liittyviä haasteita nimenomaan kulttuuriorganisaatioiden näkökulmasta.
Periaatekysymyksiä
Avoimeen dataan liittyvät solmut voidaan jakaa kahteen ryhmään: periaatteellisiin ja käytännön solmukohtiin. Näihin organisaatiot törmäävät, kun ajatus datan avaamisesta on ensi kertaa nostettu pöydälle. Ensimmäinen ja ehkä merkittävin avoimeen dataan liittyvä periaatekysymys on: "Miksi meidän organisaatiomme haluaisi tarjota aineistojaan maksuttomasti yleisön käyttöön?"
Vastauksia on monia. Yleisiä perusteluja aineistojen ja tietovarantojen avaamiselle ovat esimerkiksi se, että tieto aineistoista leviää paremmin ja laajemmalle tai että organisaatio tahtoo olla mukana uuden ilmiön aallonharjalla, edistää innovaatioiden ja sitä kautta mahdollisesti uusien tulonlähteiden syntyä. Tulot tulevat varmasti seuraavana monessa organisaatiossa mieleen, mutta tähän palaamme myöhemmin.
Seuraava kysymys datan avaamispäätöksen jälkeen on: "Mitä aineistoja voimme ja haluamme julkaista?" On aiheellista puntaroida, julkaistaanko kokoelmien hitit ja helmet, kuten esimerkiksi avoimen datan edelläkävijä hollantilainen Rijksmuseum (https://www.rijksmuseum.nl/) teki, vai kaivetaanko esille jotakin hieman tuntemattomampaa. Kummassakin vaihtoehdossa on puolensa, eikä ratkaisun välttämättä tarvitse edes olla joko tai. Harva kuitenkaan haluaa ja voi avata kaikkia kokoelmiaan. On hyvä miettiä, mitkä aineistot avataan ja tarjotaan maksuttomasti.
Käytännön haasteita
Periaatepäätösten jälkeen on aika kääriä hihat ja ryhtyä ratkomaan datan avaamiseen liittyvää käytännön problematiikkaa. Luvassa on pitkä lista haasteita, mutta usein ne liittyvät vain ensimmäiseen avattavaan datasettiin. Seuraavan avaaminen on jo helpompaa, kun rutiinit ovat ehtineet rakentua.
Suosittuja avattavia aineistoja ovat valokuvakokoelmat. Erityisesti näihin liittyy kiperä kysymys tekijänoikeuksista sekä henkilösuojasta. Selvitystyö voi olla erittäin työlästä, ja esimerkiksi valokuvien oikeuksien kohdalla vanhat sopimukset voivat osoittautua epäselviksi ja rajoittaviksi.
Sopimus- ja oikeusviidakon jälkeen edessä on valitun setin julkaisualustan valitseminen. Suosittu väylä julkaista valokuva-aineistoja erityisesti suomalaisten museoiden keskuudessa on ollut verkkopalvelu Flickr. Se on helppokäyttöinen sekä kuvien lataajalle että käyttäjälle ja mahdollistaa suurten tiedostojen jakamisen sekä kattavien taustatietojen julkaisemisen.
Flickr on kuitenkin kaupallinen toimija, eikä esimerkiksi aineistojen säilyvyydestä verkossa voida antaa mitään takeita. Tämä on hyvä ottaa huomioon julkaisualustaa valitessa. Jotkin museot ovat myös toteuttaneet omia alustojaan, mutta niissä haasteena on ennen kaikkea riittävä mainostaminen, jotta käyttäjät löytävät julkaistun aineiston luo. Kannattaa myös pohtia, olisiko hyödyllistä julkaista sama aineisto useammilla alustoilla. Usein tämä on toteutettavissa suhteellisen pienellä työmäärällä, ja aineisto tavoittaa näin eri kohderyhmiä.
Raha- ja henkilöstöresurssit ovat monen organisaation suurin huolenaihe avoimeen dataan liittyen. Erityisesti kuva-arkistot ovat perinteinen tulonlähde, jonka olemassaolo koetaan uhatuksi aineistojen avaamisen myötä. Toisaalta avoimen datan on koettu vähentävän kuva-arkistojen työmäärää, kun aineistot ja tieto ovat käyttäjien saatavilla verkossa. Työvoimaa datan avaamisessa sitoo eniten avaamista edeltävän selvitystyön lisäksi tiedostojen vieminen verkkoon. Avoimen datan yksi kriteeri on, että tieto on teknisesti saavutettavassa muodossa eli koneluettavaa. Tämä tarkoittaa, että esimerkiksi kokoelmatiedot on hyvä julkaista joko .csv- tai .xls-tiedostoina, jolloin ne voi ottaa käyttöön ilman pelkoa ohjelmistojen muodostamista rajoitteista. Toisinaan taulukkomuotoon vieminen tarkoittaa myös sitä, että dataa täytyy niin sanotusti siivota - tietoja siirtää oikeisiin kenttiin ja täyttää ja poistaa informaatiota. Siivousurakan työläys voi yllättää.
Opiksi ja iloksi muille
Tässä tekstissä on nostettu esille vain joitakin sellaisia avoimeen dataan liittyviä solmukohtia, joita S?MPLE-hanke on toimintansa aikana pannut merkille. Ne ovat hyvin pitkälti sellaisia, jotka koskettavat organisaatiota ja henkilökuntaa, joka toteuttaa datan avaamisen. Ideologisella, laajemmalla tasolla avoimeen kulttuuriin liittyy monisyisempiäkin kysymyksiä, joihin ei kuitenkaan tässä ole vielä aiheellista pureutua. S?MPLE-hanke on halunnut keskittyä toiminnassaan juuri käytännön haasteisiin, sillä niiden kanssa kulttuuriorganisaatiot enimmäkseen painiskelevat.
Susanna Haavisto