by Alastair Dunning

In het kader van nieuwe onderzoeksprojecten binnen de TU Delft wordt vaak gevraagd om een tool waarmee alle soorten onderzoeksdata tijdens een project kunnen worden beheerd en dat ook geschikt is voor andere soorten data, die in de loop van een project worden gegenereerd, zoals stuurgroepnotulen, presentaties, interviews en verleende toestemmingen.

afbeelding OpenScience framework

Vaak wordt voor projecten uiteindelijk een combinatie van tools gebruikt (Basecamp, Google Drive, GitHub, SharePoint), die elk hun eigen voor- en nadelen hebben.

Met dat in het achterhoofd heb ik het wetenschappelijk georiënteerde Framework (OSF), dat tools biedt ter ondersteuning van de gehele werkstroom, kort onderzocht. Hier volgt een aantal van de voordelen.

•    Zeer korte opstarttijd: het is mogelijk om een project binnen enkele minuten op te starten.

•    Alle soorten data en bestanden kunnen worden geüpload en gecategoriseerd, bijvoorbeeld als ‘methode’, ‘hypothese’ of ‘communicatie’.

•    Het is mogelijk om verschillende versies van data op te slaan, inclusief de revisies aan elk bestand.

•    Aan verschillende bestanden kunnen verschillende permissieniveaus worden toegekend. Het OSF introduceert het concept ‘component’, waarmee bestanden en data op verschillende manieren kunnen worden georganiseerd. Aan elk component kunnen verschillende toegangsniveaus worden toegekend (bijv. beheerder, lezen/schrijven, alleen-lezen). Dat is met name nuttig voor projecten waarbij meerdere instanties betrokken zijn en waarvoor databeveiliging is vereist.

•    Het is mogelijk om publieksversies te maken van delen van projecten, inclusief citaties. Dat is met name aantrekkelijk voor volgroeide projecten die data willen uitwisselen en correcte verwijzingen willen garanderen.

Het gebruik van het OSF roept ook vragen op:

•    Hoe efficiënt gaat het OSF om met grote datasets? Individuele bestanden kunnen niet groter zijn dan 5 GB. Voor grotere bestanden is het mogelijk om te linken naar voorzieningen als Dropbox, maar het is nog niet duidelijk of het OSF snel genoeg blijft werken bij gebruik van meerdere grote datasets.

•    Kan het goed in combinatie met andere tools worden gebruikt? Integratie met veelgebruikte cloud-apps zoals Google Drive is al ingebouwd, maar voor sommige onderzoeksprojecten zal het OSF vooral bruikbaar zijn als het mogelijk is om verbinding te maken met gespecialiseerde code, tools en instrumenten. Dergelijke integratie is echter niet eenvoudig. Hoe kan bijvoorbeeld een sensor die dagelijks meteorologische data vastlegt die data automatisch doorgeven aan het OSF? En hoe kan het OSF worden gebruikt om verkeersgegevens inzichtelijk te maken voor visuele analyse van de bewegingen van auto’s, bussen en vrachtwagens door een stad? Het OSF heeft voor zulke toepassingen een API beschikbaar gesteld, maar er is ontwikkeltijd voor nodig om die te integreren.

•    Als er data openbaar worden gemaakt en van een DOI wordt voorzien voor citaties, zal dat veel van het OSF vergen om te garanderen dat die data ook op lange termijn duurzaam en betrouwbaar blijven. Het zal voor onderzoeksprojecten nuttig blijven om de definitieve gepubliceerde data voor de lange termijn op te slaan in een repository die voldoet aan de eisen van het Data Seal of Approval.