Tietoaineistot Cernin hiukkasfysiikan kokeista avataan kaikkien saataville

Euroopan hiukkasfysiikan tutkimuskeskus Cern ja sen suuren LHC-hiukkastörmäyttimen kokeet avasivat 20.11.2014 Opendata.cern.ch-portaalin, jossa tutkimuksen tietoaineistot ovat kaikkien saatavilla. Uuden portaalin myötä maailmankaikkeuden rakenteen tutkimiseen voivat osallistua muutkin kuin tutkijat. Edelläkävijänä on CMS-koe, joka julkistaa vuonna 2010 kerättyä alkuperäistä tietoaineistoa; suomalaistutkijoiden osuus on tässä työssä ollut vahva.

Peruskirjansa mukaisesti Cernissä saavutetut tieteelliset tulokset ovat julkisia ja Cernin kokeiden tulokset ovat saatavilla Open Access -julkaisuna. Tuoreen julkistuksen myötä tietoaineistoja annetaan myös suuren yleisön vapaaseen käyttöön Opendata.cern.ch-portaalin kautta, kerrotaan Helsingin yliopiston tiedottessa.

Portaali lisää tieteen avoimuutta

Cernin LHC-kiihdyttimellä toimivat neljä suurta koetta, CMS, ATLAS, Alice ja LHCb, soveltavat avoimen datan periaatetta siten, että kokeita rahoittaneet tutkimusryhmät ehtivät seuloa tietoaineistot huolellisesti läpi ennen julkistusta. Edelläkävijänä on CMS-koe, joka julkistaa nyt vuonna 2010 kerättyä alkuperäistä tietoaineistoa. Julkistus avaa aivan uudet näköalat hiukkasfysiikan datan hyötykäyttöön tieteellisen tutkimuksen ohella.

"Hiukkasfysiikan tietoaineistojen saattaminen suuren yleisön saataville on osa yleistä ns. big data -kehitystä", korostaa alkeishiukkasfysiikan professori Paula Eerola Helsingin yliopistosta ja Fysiikan tutkimuslaitoksesta.

Cernin CMS-kokeen törmäysdataa voidaan visualisoida opendata.cern.ch-portaalissa. Kuva © 2011 CERN​​​​
Cernin CMS-kokeen törmäysdataa voidaan visualisoida opendata.cern.ch-portaalissa. Kuva © 2011 CERN​​​​

Työkaluja ja käyttöesimerkkejä aineistolle

CMS-kokeen tutkijat antavat alkuperäisen tietoaineiston ohella aineiston käsittelyyn tarvittavat työkalut, eli virtuaaliseen tietokoneympäristöön ja aineiston analyysiin tarvittavat tietokoneohjelmistot.

"Aineiston tieteellinen tulkinta vaatii hiukkasfysiikan asiantuntemusta ja melkoista laskentatehoa, joten avointen tietoaineistojen suurin käyttäjäkunta ei ehkä alkuun koostukaan tutkijoista, koska alan asiantuntijoista suurin osa on jo kokeissa mukana",sanoo CMS-kokeen Data Preservation and Open Access -koordinaattori Kati Lassila-Perini Fysiikan tutkimuslaitokselta.

"Onkin mielenkiintoista nähdä, miten näitä tietoaineistoja vielä käytetään. Tämä on uutta: emme tunne kohdeyleisöä emmekä pysty arvaamaan mahdollisia käyttösovelluksia. Sen vuoksi olemme lisänneet julkistettavaan aineistoon eritasoisia käyttöesimerkkejä yksinkertaistetusta analyysiohjelmasta online-ympäristössä toimiviin helppokäyttöisiin sovelluksiin. Toivomme, että esimerkit innostavat käyttäjiä uusien sovellusten kehitykseen ja datan käyttöön esimerkiksi opetuksessa, jolloin me voimme puolestamme oppia, miten kehittää palveluita kohdeyleisön tarpeiden mukaan."

Suomessa tehty Koulujen Cern-tiedeopetusverkoston opettajien haastattelu syksyllä 2013 (tekijänä Sanni Suoniemi) osoitti selvästi, että opettajilla olisi intoa ja kiinnostusta käyttää avointa dataa opetuksessa, jos vain on sopivia sovelluksia sen hyödyntämiseen opetustilanteessa. Tärkeänä pidetäänkin sitä, että julkistettavia aineistoja voidaan käyttää opetuksessa. Jotta siihen päästään, tarvitaan asiantuntemusta eri aloilta: pitää tietää, mitä ja miten halutaan opettaa, miten data saadaan opetussovellukseen sopivaan muotoon ja miten tehdään vaivaton käyttöliittymä.

Lähtevätkö muutkin kuin Lapin ammattikorkeakoulu mukaan?

Suomessa erityisasiantuntemusta opetuksesta on Koulujen Cern-tiedeopetusverkoston opettajilla, jotka ovat valmentaneet oppilaitaan Cern-tiedeopintoihin ja käyttäneet aikaisemmin saatavissa olleita materiaaleja opetuksessaan. Toiminta on ollut mahdollista vuodesta 2000 lähtien, koska sillä on Opetushallituksen, Fysiikan tutkimuslaitoksen ja kuntien tuki.

"Tämän takia avointen tietoaineistojen käyttöä halutaan pilotoida Suomen koululaitoksen kanssa. Toivomme, että sen ympärille syntyy monitahoisia yhteistyöhankkeita ja työvälineitä, joiden kautta opettajat saavat aineistoa luokkaopetukseen", sanoo CERN Education -ryhmässä työskentelevä pedagoginen asiantuntija Riitta Rinta-Filppula Fysiikan tutkimuslaitokselta.

Yhteistyöhankkeista on jo hyvänä esimerkkinä yhteistyö Lapin ammattikorkeakoulun Tieto- ja viestintätekniikan koulutuksen kanssa. Se toivotti tervetulleeksi Fysiikan tutkimuslaitoksen kautta tulleen CMS-kokeen yhteistyötarjouksen.

"Kesällä 2014 opiskelijamme osallistui virtualisointialustojen testaukseen ja syksyllä saimme käyttöliittymäsuunnittelun ja testauksen opintoihin www-portaalin käytettävyystestauksen testitapaukseksi kokonaiselle opiskelijaryhmälle. Opiskelijamme olivat kiinnostuneita ja motivoituneita molemmissa yhteistyöprojekteissa, ja toivomme yhteistyön jatkuvan", toteaa lehtori Kenneth Karlsson.

"Avoimen datan käyttö ja jalostaminen opetuskäyttöön ja virtuaalimalleiksi on tieto- ja viestintätekniikan laboratorion, pLabin keskeistä osaamista. Opiskelijat suorittavat laboratoriossa harjoittelua ja opinnäytteitä. Osallistumalla CMS-kokeen tietoaineistoilla tehtäviin yhteistyöprojekteihin he saavat kokemusta virtualisoinnin ja avoimen datan hyödyntämismahdollisuuksista", hän sanoo.