keskiviikko 17. heinäkuuta 2013

Ensimmäiset kolmesataa riviä

Koko opuksen rivimäärä tällä hetkellä on 1087. Tässä ensimmäisessä setissä fraasi "kirjasto voi" tai "käyttäjä voi" esiintyy 97 kertaa, sen sijaan fraasia "olisi ihan kiva jos voisi jotain tehdä itsekin" ei löydy yhtään. Tunteja kulunut? Monia, sekä omia että työkavereiden, joille iso kiitos osallistumisesta verkkosessioihin sekä kärsivällisestä kuuntelusta ja hyvistä kommenteista.

Kirjastojärjestelmän vaatimusmäärittelyn vaikein asia on ajatella toisin. Vaatimusmäärittely ei ole selostus mitä nyt tapahtuu, vaan mitä pitäisi tapahtua, että asiat sujuisivat mallikkaasti ja käyttäjän aika ei kuluisi tietojen hakemiseen, moninkertaiseen klikkailuun ja turhautumiseen.

Nyt arvioinneille ja arvosteluille on tarjolla  luonnos asiakaspalvelun vaatimusmäärittelystä.

kuva MTSOfan
Osiosta puuttuu vielä tiedonhaun osuus, sillä siinä työn vetäjä huomasi eniten kipuilevansa nykytilan kanssa. Myös muut osiot ovat vielä liian keskeneräisiä katseltavaksi, mutta työ jatkuu syksyllä ja lopullinen luonnos pitäisi olla valmiina kun illat ovat pimenneet jouluun. Myös vaatimusten arviointi pakollisten ja toivottavien ominaisuuksien osalta on jätetty luonnoksesta vielä tässä vaiheessa pois. Dokumentissa on kenttä, johon voitte jättää kommentteja nimellä tai nimettömänä. Kiittäen etukäteen poistun lomalle, sillä maanantainahan täälläkin alkaa viikkojen hellejakso.





torstai 13. kesäkuuta 2013

Iteraatioilla ihannetuloksiin

Jos lyö sitkeästi päätä seinään, niin pää ei välttämättä hajoa vaan seinään tulee reikä. Alun takkuamisen jälkeen solahdin mukavaan flow-tilaan uuden Arena-verkkokirjaston rakentelussa. Ja sitten tökkäsi: vuosikausia taustalla pyyteettömästi raksutellut verkkokirjaston palvelin rikkoontui. Syy ei ollut löytynyt tällä erää tästä työpisteestä, vaan konesalimuutosta, joissa palvelin jouduttiin sammuttamaan. Tämän jälkeen se ei enää halunnut käynnistyä. Olisi pitänyt tietää: jos se toimii, älä koske siihen.

Jouduin siis koskemaan jälleen kirjastojärjestelmän vaatimusmäärittelyyn. Pieni tauko ja etäisyys oli ollut asialle vain hyväksi: katselin määrityksiä uusin silmin ja kurtistuvin otsin, ja kohta sai Excelin etsi-korvaa-toiminto töitä.Muistinvirkistys ja tietojen päivitys tulikin tarpeeseen, sillä edessä oli matka Helsinkiin, missä UKJ:n eli Uuden kirjastojärjestelmän suunnittelun kakkosvaihe pistettiin kunnolla käyntiin 6.6. Paikalle oli saapunut kokoussalillinen ammattilaisia, etänä verkossa tilaisuutta seurasi ilmeisesti reilut sata henkeä.

UKJ-hanke sai OKM:ltä tälle vuodelle hakemansa avustuksen, jolla hankkeeseen on palkattu kehittämispäällikön lisäksi 5 asiantuntijaa.  Työtä valvomaan on asetettu ohjausryhmä ja Kansalliskirjaston projektinhallintaryhmä. Ensimmäisen vaiheen kirjastojen edustajista koottuja työryhmiä on yhdistelty ja jäljellä on nyt neljä suunnittelun asiantuntijaryhmää.

Tämän vuoden aikana hankkeessa keskitytään tarkentamaan kirjastojärjestelmän määrityksiä sekä laatimaan projektisuunnitelma, missä määritellään toteutuksen tapa ja vaiheistus. Määrityksiä jatketaan kokonaisarkkitehtuurin pohjalta siten, että suunnittelun asiantuntijaryhmät keskittyvät tieto- ja toiminta-arkkitehtuurin kuvauksiin ja hankkeeseen palkatut asiantuntijat vastaavat tietojärjestelmä- ja teknologia-arkkitehtuurien suunnittelusta.

Asiantuntijaryhmissä on yhteensä 54 edustaajaa neljästä eri kirjastosektorista, joista yleisten kirjastojen  edustajia on 8.  Työ tapahtuu pääasiassa etäpalavereina ja sähköpostilla. Jotta UKJ:ssa saataisiin oikeasti myös yleisten kirjastojen ääni kuuluville, olisi yleisten kirjastojen edustajien määrää saatava vielä kasvatettua. Mukaan luvattiin ottaa kaikki halukkaat ja jälki-ilmoittautuneet, joten jos tiedät jotain kirjastojen toiminnasta ja haluat vaikuttaa uuden järjestelmän suunnitteluun, tule mukaan porukkaan! Asiantuntijaryhmien (ja koko UKJ:n) toimintaa voi myös seurata hankkeen wikissä, minne voi jättää kommentteja koko prosessin ajan.

UKJ:n pohjaratkaisu tulee olemaan avoimeen lähdekoodiin perustuva modulaarinen kokonaisuus, joka integroituu muuhun kansalliseen palvelukokonaisuuteen. UKJ:n luetteloinnin ja tietokannan perusta tulee olemaan Melinda ja verkkokirjastona toimii Finna.

UKJ:n kehittämisessä tullaan käyttämään ketteriä menetelmiä, joista seminaarissa oli kertomassa Celkee OY:stä Sami Lempinen. Ketterä kehitys on erityisesti it-hankkeisiin suunnattu menetelmä, jossa kehittäminen tapahtuu sykleittäin. Uutta julkaistaan säännöllisesti ja nopeasti ja virheet voidaan korjata heti kehittämisen ollessa käynnissä.

Valittuun menetelmään kuuluvat osaltaan käyttäjäkertomukset, joissa kuvataan mitä käyttäjä - it-tuki, kirjastovirkailija, asiakas - tekee, esim. " Asiakkaana haluan päättää, saanko lainauksestani kuitin paperisena vai sähköpostiini". Lähtökohta ei siis alkuvaiheessa vielä ole: järjestelmä tekee jotain, tai vielä pahemmin: järjestelmän on tehtävä jotain juuri näin.

Verrattuna perinteisempään vesiputousmalliin ketterillä menetelmillä on tutkimustenkin mukaan todennäköisyys epäonnistua pienempi. Perinteinen it-ohjauksen malli on ns. vesiputousmalli, jossa projektin eri vaiheet seuraavat toisiaan kuvan osoittamalla tavalla. Mikäli tässä mallissa huomataan vasta testaus - tai peräti julkaisuvaiheessa, ettei ohjelma toimi, on prosessissa palattava pitkä askelma taaksepäin.

Kuva: Sami Lempinen, Celkee Oy

Ketterässä mallissa kehittäminen tapahtuu iteraatioissa eli sykleissä, joiden jälkeen kehitettyä toimintoa katselmoidaan ja se joko hyväksytään tai palautetaan kehittelyyn - tai huomataan ettei toiminnolla ole oikeasti mitään käyttöä, ja se voidaan poistaa ohjelmasta kokonaan. Toisin kuin fyysisten esineiden, esim. talon rakentamisessa, onnistuneessa it-projektissa lähtökohta on vaikeissa kysymyksissä, talonrakennuksessa ainakin maallikko katsoo kuvastosta kivannäköisen mallin ja miettii vasta myöhemmin miten sähköpistokkeet laitetaan. UKJ:n kaltaisessa it-projektissa aluksi on selvitettävä miten yhteydet Melindaan ja Finnaan saadaan rakennettua, sillä jos näissä möhlitään, ei kivalla ulkoasulla ja näppärillä kilkkeillä kirjastossa pyöri muu kuin  it-päällikkö pitkinä unettomina öinä pakoreittejä pohtien. Ja silloin kannattaa siirtyä telkkarin ääreen ja pistää pyörimään Piin elämä.

maanantai 25. maaliskuuta 2013

Piki irti ja puhtaaksi eli tietokantasiivousta Tamperella



Kansalliskirjaston kuvailun tiedotuspäivillä 20.3. Tarja Mäkinen ja Mace Ojala ovat puhuneet kirjastojen tietokantojen laadusta. Ilmeisesti tilaisuutta ei kokonaisuudessaan videoitu, joten meille poissaolleille keskustelun sisältö näyttää jäävän arvoitukseksi. KK:n sivulta löytyy kuitenkin molempien alustukset ja muualta verkosta Macen varsinainen raportti Piki-tietokannan siivousmenetelmistä, joka onkin varsin kiinnostavaa luettavaa. Ja paikoin hidasta luettavaa, koska ilman ohjelmointitaitoja saa merkkejä tuijottaa hetkisen, ennen kuin koodeista muodostuu jotain, joka voi päänsisäisissä prosesseissa kääntyä yleiskirjastoa puhuvan ajatustasolle.

Kyseessä oli kahden kuukauden projekti, jonka tavoite oli ”parantaa PIKI-kirjatojen bibliografisen tietokannan laatua ja kehittää kirjastojärjestelmän ulkopuolisia, tietoteknisiä menetelmiä sen tekemiseen”. Kysymys herääkin oitis: miksi tietokannan ulkopuolisia menetelmiä, miksi muutoksia ei voisi tehdä suoraan tietokantaan?

Projekti meni suoraviivaistaen näin: PIKI-tietokannasta otettiin ulos dumpiksi sanottu tietueet sisältävä datapaketti, jota Mace pyöritti eri vinkkeleistä, haki virheitä, epäloogisuuksia, puutteita eli suoritti louhintaa ja analysointia. Toinen kysymykseni koskeekin seuraavaa oletettua loogista askelta: miksi siivottua dataa ei voitu laittaa takaisin tietokantaan?

Kylmä hiki selässä raporttia lukee kuin jännitysromaania - timanteista voi haaveilla, mutta tässä louhinnassa tulee pahaa tulosta. Dataa tutkittiin eri näkökulmista: teknisessä tarkastuksessa tutkittiin ovatko tietueiden koodit käytetyn MARC21-formaatin mukaisia. Sitten selvitettiin kenttiin merkittyjä arvoja ja arvojen paikkansapitävyyttä. Selvisi, että tietokannassa on esim. tietueita, joilta puuttuu kokonaan nimiö tai 008-informaatiokoodikenttä jota ei saa (ja toivottavasti ei voi) toistaa. Kenttien sisältöä on koneellisesti vaikeampi tutkia, mutta siitäkin voi selvittää esim. päivämääriä, joita ei tietueissa pitäisi olla, esimerkiksi vuodelle 2102 julkaistuksi merkitty Valtaojan uutuus. Mitä veikkaatte, onko copyright-tieto merkitty jokaisessa tietueessa samalla kirjoitusasulla? Vastaavatko kielikoodit Kansalliskirjaston listaa? Onko kontrolloimattomien asiasanojen kentässä myös kontrolloituja asiasanoja? Ei, ei, kyllä. PIKI:ssä on käytössä 25 sijaintipaikkaa, erilaisia sijaintipaikkakoodeja tietokannasta löytyi noin 2000 erilaista versiota.

No mitä sitten, jos joku kielikoodi ei ole oikein, ja kyllähän sitä ymmärtää jos vuosi on vahingossa kirjoitettu väärin. Mutta tylsämielinen apparaatti, joka orjallisesti tekee mitä käyttäjä pyytää, ei ainakaan vielä osaa päätellä Valtaojan liittyvän vuoteen 2012 vuosien 1013 ja 2103 - tai Konnun - sijaan, ja antaa hienosti muotoiltuun hakuun ikävän tuloksen nolla - tai pahempaan, olipa kysyjä kirjaston virkailija tai Pirkko kotikoneellaan.

Palataan siis laatuun. Kirjastojenkin tietokantojen laatuun pätee Macen lainaamien Ken Gleasonin ja Q. Ethan McCallumin mukaan on neljän ceen juttu:

  1. Complete (is everything here that’s supposed to be here?)
  2. Coherent (does all of the data “add up?”)
  3. Correct (are these, in fact, the right values?)
  4. aCcountable (can we trace the data?)


Mitä mielenkiintoista omasta tietokannasta löytyisi? Olisiko data siistiä ja oikeanlaista? 

 givepeaceachance http://www.everystockphoto.com/photo.php?imageId=2227513&searchId=4c85b3625c95b8bf313d47934599eef5&npos=4