Wat moet er bewaard worden

Het is niet altijd even duidelijk geweest welke data je moet bewaren of hoe lang de data moet bewaard worden.  Op deze pagina vind je een overzicht van wat het UGent-beleid en het Horizon2020-reglement hierover zeggen.  Je hoeft ook niet alles te bewaren en daarom zijn op deze pagina ook een aantal tools beschikbaar die helpen om te bepalen welke data je moet bewaren en hoe je data daarop moet voorbereiden. 

Beleidskader UGent

In het UGent Beleidskader voor Research Data Management (RDM) vind je het beleid over bewaring onder punt '11. Bewaring en vernietiging van onderzoeksdata'.

Het belangrijkste hieruit is:

"11.1 Tenzij anders bepaald hetzij door wettelijke, contractuele, ethische of andere specifieke verplichtingen, hetzij door vereisten van externe onderzoeksfinanciers, moeten relevante Onderzoeksdata en bijbehorende Documentatie voor minimum 5 jaar bewaard worden na afloop van het onderzoeksproject of de projectfinanciering, of na publicatie van de op de data gebaseerde conclusies (de latere datum is hier van toepassing). [...]"

Horizon2020 - Europese Commissie

Het "Article 29.3 Open access to research data" (p. 222) van het H2020 - Annotated Model Grant Agreement V2.2 - 25.11.2016 stelt:

 

"[...] for actions participating in the the open research data pilot: regarding the digital research data generated in the action ('data'), the beneficiaries must:

(a) deposit in a research data repository and take measures to make it possible for third parties to access, mine, exploit, reproduce and disseminate - free of charge for any user - the following:

(i) the data, including associated metadata, needed to validate the results presented in scientific publications as soon as possible;

(ii) other data, including associated metadata, as specified and within the deadlines laid down in the 'data management plan' (see Annex 1);

(b) provide information - via the repository - about tools and instruments at the disposal of the beneficiaries and necessary for validating the results (and - where possible - provide the tools and instruments themselves). [...]

 

Opmerkingen:

  • Ondertussen is deelname aan de pilot in principe standaard maar er is een mogelijkheid tot opt-out vóór het tekenen van de GA.
  • Het Datamanagementplan is voor H2020 verplicht
  • Meer info vanaf p. 226

Welke data moeten er bewaard worden?

Niet alle data kan/moet bewaard worden en dus is het nodig om een selectie te maken.  Niet alle versies van de data moeten bewaard worden, enkel degene die relevant zijn voor de verificatie van het onderzoek. 

 

UGent

Voor de universiteit betekent dit in eerste instantie "alle Onderzoeksdata en bijbehorende Documentatie die redelijkerwijs nodig of aangewezen zijn voor het verifiëren (en reproduceren) van de door de Onderzoeker kenbaar gemaakte wetenschappelijke claims: het gaat dus doorgaans om Ruwe of om zo min mogelijk Bewerkte Data.  De mate van  bewerking van de te bewaren Onderzoeksdata zal onder andere afhangen van het type onderzoek, het soort Onderzoeksdata, eventueel praktische overwegingen, enz.  Onderzoeksdata kunnen daarnaast ook vanuit het oogpunt van mogelijk hergebruik relevant zijn voor bewaring."

 

Selectiecriteria

Andere selectiecriteria kunnen zijn:

  • De wetenschappelijke waarde van een dataset: Kan men er nog op verder bouwen? Zou het een ander/nieuw wetenschappelijk doel kunnen dienen (hergebruik)?
  • De historische waarde van een dataset.  Een dataset kan van historisch belang zijn/worden omdat het onderzoek bijvoorbeeld over een historisch moment ging of het was heel vernieuwend of de scope is van belang, etc. 
  • Datasets met een commerciële waarde dienen best bewaard te worden maar worden beter niet publiek beschikbaar gesteld.
  • Unieke of kwetsbare datasets hebben een hogere prioriteit voor bewaring.
  • De hoeveelheid en kwaliteit van de metadata die bij de dataset hoort is van belang en ook de mate waarin de geschikt zijn voor hergebruik.  Zijn de juiste formaten gebruikt? Is er voldoende metadata aanwezig om de dataset juist te kunnen interpreteren? Etc.
  • Maar ook de economische waarde moet bekeken worden.  Wegen de kosten van langdurige archivering op tegen de voordelen ervan?

 

Checklist

Dit klinkt echter allemaal erg vaag en daarom heeft het Britse Digital Curation Centre een handige checklist uitgewerkt:

De UK Data Service heeft dan weer een tool om de mogelijk kosten voor datamanagement mee te berekenen.

Data voorbereiden op archivering/deponeren

Je kan niet zomaar 'alle' data deponeren in het gekozen archief. Het is nodig om

Gerelateerde inhoud