Nieuws

Nieuwe dataopslag WUR: vaarwel USB-stick

article_published_on_label
11 december 2020

Wie hoort over iRODS en Yoda, denkt eerder aan karakters uit een Star Wars-film dan handige software voor onderzoekers om data op te slaan. Het Wageningen Data Competence Center (WDCC) rolt de systemen de komende maanden WUR-breed uit. Coördinator infrastructuur Erik van den Bergh: “Met een paar muisklikken sla je je resultaten op, kun je ze delen met anderen én maak je ze vindbaar voor toekomstige onderzoekers.”

De afgelopen maanden heeft het WDCC diverse pilots gedraaid met de software, allen met positief resultaat, vertelt Erik van den Bergh, sinds 2017 coördinator infrastructuur van het WDCC. “iRODS (integrated Rule Oriented Data System) is ontwikkeld in de Verenigde Staten door universiteiten om data eenvormig op te slaan en onderling uit te kunnen wisselen. Maar omdat het technisch nog best een ingewikkeld programma bleek, heeft de Universiteit Utrecht Yoda (Your Data) erbij ontwikkeld. Daardoor kan een onderzoeker in een heel eenvoudige mappenstructuur zijn resultaten opslaan. Net zoals je dat doet op de W-schijf of in Dropbox.”

Je slaat je resultaten op in mappen, net zoals je doet op de W-schijf of in Dropbox
Een screenshot van de eenvoudige mappenstructuur van Yoda, de online software die het makkelijk maakt data op te slaan en te delen. Beeld: eigen foto.
Een screenshot van de eenvoudige mappenstructuur van Yoda, de online software die het makkelijk maakt data op te slaan en te delen. Beeld: eigen foto.

Voordelen centrale opslag: betrouwbaarder en toegankelijk

“De nieuwe opslagsystemen zijn een stuk betrouwbaarder dan de nu nog veelgebruikte USB-sticks,  harde schijven en online cloudopslag van Google of Dropbox.” Die apparaten en inlogcodes gaan vaak mee met een onderzoeker, ook als die persoon met pensioen gaat of elders gaat werken, weet Van den Bergh. “In publicaties staat altijd een samenvatting van de onderzoeksdata, maar de ruwe data is vaak niet beschikbaar of lastig te vinden.” En juist die hebben wetenschappers nodig als ze een studie op een later moment willen herhalen, wat vaak gebeurt om conclusies opnieuw te staven. “Overigens heb je dan ook de metadata nodig: de informatie over welke apparatuur er is gebruikt, onder welke omstandigheden et cetera. Nu moeten onderzoekers dat talloze keren invullen als tekstbestandjes bij al hun deelresultaten. In YODA hoef je dat maar één keer te doen.”

Met de nieuwe opslagmethode voldoe je aan de nieuwe eisen van de NWO

Centraal én veilig verzameld

Alle data worden via de nieuwe software op de dataservers van WUR of SURF (een nationaal IT-platform voor de wetenschap, red.) opgeslagen. “We doen het in fases, maar ik durf het wel aan om te zeggen dat we nu al meer dan genoeg ruimte hebben om álle data van WUR-onderzoekers op te slaan en dat breiden we natuurlijk ook nog verder uit.” Alles op één plek: is dat wel veilig? “Ja, we hebben back-ups en back-ups van back-ups. Plus: de systemen zijn zodanig beveiligd dat ze geschikt zijn voor vertrouwelijke data zoals persoonlijke vragenlijsten en zakelijke gegevens van bedrijven”, aldus coördinator Van den Bergh. “Het is sowieso véél veiliger dan opslag in de cloud van Google en Dropbox of op een USB-stickje dat je zomaar kwijt kunt raken.”

FAIR = voldoen aan de (internationale) eisen

Wageningse onderzoekers hebben er dus baat bij om met Yoda te gaan werken, maar houden zich op deze manier ook aan de internationale norm, benadrukt Van den Bergh. “De G20 heeft in 2016 al gezegd dat wetenschappelijke dataopslag moet voldoen aan het FAIR-principe. Findable (vindbaar), Accessible (toegankelijk), Interoperable (geschikt om in verschillende programma’s mee te werken) en Reusable (herbruikbaar). De Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) eist dat wetenschappers zich aan het FAIR-principe houden willen ze in aanmerking komen voor onderzoeksbeurzen. Door met iRODS en Yoda te beginnen, staat WUR nu in de voorhoede.”

Goed datamanagement kan de onderzoeker heel veel werk schelen

Datamanagement maakt het de onderzoeker makkelijker

Na het bekijken van een simpele Powerpointpresentatie kan elke onderzoeker al aan de slag. Maar er is nog véél meer mogelijk met datamanagement, zegt de WDCC-coördinator enthousiast. “Ik snap heel goed dat computergedoe voor de meeste onderzoekers niet bovenaan hun prioriteitenlijstje staat. Maar we kunnen samen kijken wat het WDCC voor je kan betekenen. Soms blijkt dat andere groepen op de universiteit al software hebben ontwikkeld die je heel goed kan gebruiken.” En dan kan het je zelfs een heleboel werk schelen én je onderzoek op een hoger niveau brengen. Denk maar eens aan de mogelijkheid om duizenden satellietfoto’s in een klap te analyseren.

Lees het hele interview met Erik van den Berg over de mogelijkheden van data.