Digital Humanities Hackathonissa syntyi uutta avointa koodia

Mitä hyötyä ihmistieteiden tutkijalle on aineistojen sähköisestä muodosta? Mitä iloa on datan visualisoinnista ja laskennallisista menetelmistä? Mitä käytännön apua tietojenkäsittelystä ihan oikeasti voi humanistille olla? Mitä sellaista voi koneella voi tehdä, joka tuo aitoa lisäarvoa esimerkiksi historiantutkijalle? Kaikkea kivaa datalla voi tietenkin tehdä, mutta hyödyttääkö se oikeasti humanistia?

Helsingin yliopistossa järjestettiin 11.-15.5.2015 työviikon mittainen digitaalisten ihmistieteiden tapahtuma, jossa opiskelijat ja tutkijat eri aloilta lähtivät kokeilemaan tutkimusta neljän eri aineiston tiimoilta. Aineistoina olivat englanninkielinen kirjekorpus, suomalaiset sanomalehdet, Blue Wings-lehdet sekä sadan vuoden takaisia teknisten alojen lehtiä. Tarkoituksena oli nimenomaan edetä tutkimuslähtöisesti ja kehittää teknisiä ratkaisuja varsinaisen kysymyksenasettelun ehdoilla.

Osallistujia oli lähes neljäkymmentä, mukana eri alojen humanisteja sekä tietojenkäsittelyalan opiskelijoita. Viikko oli mielenkiintoinen ja haastava. Työnteko ja luennot vuorottelivat ohjelmassa. Yhteisen kielen löytäminen ja mielekkäiden tutkimuskysymysten muotoilu täysin aineistolähtöisesti ei aina ollut helppoa, mutta yhteistyön kehittyessä päästiin moniin oivalluksiin. Joskus ennakkoon vaikealta tuntuneet asiat ratkesivat yllättävän helposti, toisaalta pienet yksityiskohdat saattavat joskus muodostua pulmallisiksi. Kokonaisuudessaan prosessi on yleensä kokeilun ja muuntelun vuorottelua, jossa edetään yhteistyössä iteroiden. Selvältä näyttää, että digitaaliset aineistot ja menetelmät voivat sekä nopeuttaa ja helpottaa humanistitutkijan työtä että auttaa uusien asioiden oivaltamisessa ja tutkimuskysymysten muotoilemisessa.

​

Ihmistieteilijän tutkimusaineistoja ovat potentiaalisesti mitkä tahansa aineistot, ainoastaan tutkimuskysymys ratkaisee sen, miten dataa lähestytään. Keskustelua eri alojen asiantuntijoiden välillä vaatiikin sen keksiminen, mitä datalla voi tehdä. Tässä Hackathonissa käytetyt aineistot olivat osin tutkijoiden aiemmin tuottamia, osin Kansalliskirjaston dataa. Erilaiset korpukset, kuten Kielipankin aineistot, tarjoavat mahdollisuuksia yhteiskunnan, historian ja kulttuurin tutkijoille käyttää laskennallisia menetelmiä. Kirjastojen, museoiden ja arkistojen sähköiset luettelot ja muut aineistot ovat suuria osin hyvin rakenteistettuja tietovarantoja, joista voisi louhia monenlaista tietoa. Silti suuri osa työstä on usein aineiston valmistelua. Tutkijoiden itsensä luomat aineistot tarvitsevatkin säilytystä, eikä tiedonhallintaa tulisi unohtaa, mikäli halutaan aineistolle jatkokäyttöä ja tutkimukselle toistettavuutta. Esitetyt kysymykset vaikuttavat datan ja menetelmien muotoon ja kehitykseen, joten riittävä kuvailu ja kontekstin dokumentointi on tärkeää.

Digital Humanities Hackathonin aikana karttui GitHubiin mielenkiintoista koodia, josta varmasti on hyötyä vastaisuudessa. Sekä aineiston että menetelmien uudelleenkäyttö on usein tehokasta, mutta vaikeutena saattaa olla niiden löytäminen.

Kokonaisuudessaan Mikko Tolosen, Eetu Mäkelän ja Timo Honkelan suunnittelema ja toteuttama tapahtuma oli innostava ja varmaan vastaavia käytännön tekemisestä lähteviä eri kokoisia hankkeita tarvitaan ja tullaan näkemään jatkossakin.

Aiheesta lisää:

CC 4.0 BY

Tämä teos on lisensoitu Creative Commons Nimeä 4.0 kansainvälinen -lisenssillä