Research Data Management als nieuwe vaardigheid binnen de opleiding Chemie

Vakgroep/dienst: Chemie (WE06)
Promotor:  Prof. Patrick Bultinck (patrick.bultinck@ugent.be)
Projectmedewerkers: N.N Deze persoon zal in een deeltijdse aanstelling als WP het project ontwerpen en implementeren binnen de opleiding. N.N. zal dit doen in nauw overleg met de projectverantwoordelijke en volgende personen die reeds aan de UGent werkzaam zijn:
  • dr. Myriam Mertens, zij is de Research data officer (DOZA) van de UGent en heeft een duidelijke kijk op de noodzaak van RDM aan de UGent en zal advies verlenen om het project te laten aansluiten bij de vereisten van de UGent en externe financiers (myriam.mertens@ugent.be)
  • Prof. Johan Winne is verantwoordelijk lesgever voor het opleidingsonderdeel “Experimenteren in de chemie” en heeft dus een excellente kijk op de data die typisch worden gegenereerd binnen dit vak waar we RDM als eerste zullen uitrollen. (johan.winne@UGent.be)
  • Dr. Philip Brondeel is de persoon die binnen de vakgroep Chemie reeds de hardwarematige aspecten van RDM verkent, i.e. de nodige contacten legt met DICT en nu reeds in testfase een setup ontwikkelt om data van masterscripties centraal te beheren en te archiveren. (philip.brondeel@ugent.be)


Korte beschrijving van het onderwijsinnovatieproject

Wetenschappers genereren steeds sneller en steeds meer wetenschappelijke gegevens (hierna data genoemd) terwijl er een duidelijke noodzaak is aan FAIR data. Dit acroniem drukt kernachtig uit dat onderzoeksdata Vindbaar (Findable), Toegankelijk (Accessible), Interoperabel (Interoperable) en Herbruikbaar (Reusable) zijn. Het doel is om data te kunnen verifiëren, hun betrouwbaarheid te testen en aan te wenden in nieuw en innovatief onderzoek.

Europa wil een leider zijn in het uitdragen van “open science” en de Europese commissie vereist dat vanaf 2017 alle onderzoeksprojecten een Data Management Plan (DMP) hebben dat voorziet in het openstellen van alle gegenereerde data voor zover er geen juridische of andere conflicten rijzen (zie onder meer de European Code of Conduct for Research Integrity). Ook Vlaamse financiers van wetenschappelijk onderzoek stellen deze eis, zoals onder meer blijkt uit Artikel 2 van het FWO reglement: ”In navolging van de Berlin Declaration van 2003 ter bevordering van de vrije toegang tot wetenschappelijke kennis en cultureel erfgoed, zijn beneficianten van mandaten, kredieten en projecten van het FWO verplicht hun publicaties, die voortvloeien uit de FWO-toelagen, te deponeren in een publieke “Open Access” databank, dit ten laatste één jaar na de publicatiedatum om een grotere impact en valorisatie van hun werk te bewerkstelligen. Wetenschappers worden aangeraden ook al hun andere publicaties in een dergelijke “Open Access” databank, zogenaamde “Open Archives”, te deponeren, samen met de onderzoeksgegevens die tot deze publicaties hebben geleid”.

Research Data Management is echter geen triviale materie. De hoeveelheid data vormt een uitdaging en er is een absolute mentaliteitsverandering nodig om alle wetenschappers er toe te brengen de actieve onderzoeksdata (de data op de werkvloer) voldoende secuur te beheren. Dit met het doel dat de actieve data duurzaam kunnen worden omgezet tot passieve data en bewaard met aandacht voor hun integriteit. Dit wordt enkel gegarandeerd als de passieve data kunnen worden teruggevonden op een toegankelijke infrastructuur en kunnen hergebruikt worden door een andere gebruiker op andere (computationele) infrastructuur zonder in te boeten op het vlak van hun begrijpbaarheid.

Gezien de vereiste van een DMP niet enkel beperkt blijft tot onderzoek binnen universiteiten maar ook een realiteit zal worden voor al onze toekomstige alumni, beoogt dit project om studenten van het prilste begin van hun studies inzicht te geven in hoe men dient om te gaan met RDM.
Concreet wensen wij vanaf de cursus “Experimenteren in de Chemie” in eerste bachelor de studenten in te leiden tot het kennen en toepassen van:

  • Het FAIR karakter van onderzoeksdata
  • Structuren van onderzoeksdata:  het verschil tussen actieve data en passieve data
  • Documenteren van passieve data : digitale sleutel (persistent identifier zoals een DOI) en metadata
  • Kennis te laten maken met het concept van de “research data lifecycle”, die de verschillende facetten van RDM omvat, zowel bij het plannen van onderzoek als tijdens het onderzoeksproces én na afloop van een project.

Hiertoe willen wij onze praktische oefeningen en zelfstandige werken aanpassen om studenten er toe op te leiden hun data op een bewuste manier te gebruiken en op te volgen van actieve “ruwe” data tot van metadata voorziene “passieve” data. De studenten zullen in daartoe reeds voorziene seminaries wegwijs worden gemaakt in RDM. De eindcompetentie zal getoetst worden door aan het einde van het opleidingsonderdeel studenten uit hun eigen passieve data (of van een medestudent) een verslag te laten reconstrueren van een eerder practicum. Op die manier zal de student de noodzaak ervaren om de alombekende “digitale prullenmanden” te vermijden.

Hiertoe zal door de projectmedewerkers (zie onder) een ICT infrastructuur worden opgesteld in samenspraak met de RDM commissie van de UGent, de RDM task force (waarvan de projectverantwoordelijke deel van uitmaakt) en DICT. Tevens zal een softwareomgeving worden opgebouwd waarbij de data verplicht van metadata worden voorzien en “publiek” binnen de opleiding beschikbaar worden gesteld via hardware conform de vereisten beschreven in het Research Infrastructure Self-Evaluation (RISE) document zoals ook gehanteerd aan de UGent voor het identificeren van de belangrijkste RDM noden. De projectmedewerkers zullen daarbij ook instaan voor de seminaries rond RDM, dit in samenwerking met de UGent RDM officer en het bekend maken van de studenten met het concept van een DMP en de herwerking van de practicumnota’s in overeenstemming met de vereisten van RDM.
Tegelijk met de eerste implementatie in eerste bachelor voorzien we een gelijkaardige traject in tweede master voor de nu nog lopende jaren waarin studenten deze vaardigheid niet hebben aangeleerd in eerste bachelor. Op deze wijze zullen op een zo kort mogelijke termijn alle scripties resulteren in een FAIR datamanagement.

Na de eerste implementatie van RDM in eerste bachelor door de aan te werven projectmedewerker, zal de geplande onderwijsbegeleider instaan voor het jaarlijks organiseren van de RDM vorming in eerste bachelor en het implementeren van RDM in de volgende studiejaren.

Op het vlak van doctoraatsstudenten die nog een ruimer aantal jaren niet van in het begin zullen getraind zijn in RDM en DMP of die niet uit de UGent masteropleiding komen, zal de doctoral schools worden verzocht een opleiding te organiseren.

Op deze wijze zal bovendien het ZAP worden geholpen te voldoen aan een DMP omdat de medewerkers deze vaardigheid als een tweede natuur hebben verworven.

Doelstellingen van het project + tijdsbesteding

De doelstelling van het project is om Research Data Management in een vroeg stadium als een nieuwe vaardigheid aan te brengen bij studenten vanaf het eerste jaar om hen zo:

  • Kennis te laten maken met de noodzaak wetenschappelijke data duurzaam te beheren
  • Het onderscheid te leren maken tussen actieve data(stromen) en passieve data en de noodzaak deze laatste “leesbaar” aan te bieden aan derden
  • Aan te leren hoe deze data te genereren, bewaren, van metadata te voorzien en duurzaam beschikbaar te stellen met aandacht voor basisvereisten van back-up, duplicatie, gestructureerd aanbieden van data, …

De finale doelstelling is Research Data Management als een opleidingsbrede eindcompetentie in de opleiding op te nemen. Bijgevolg zullen studenten bij afstuderen RDM als een automatisme zien zodat zij bij afstuderen dit kunnen inzetten in hun verdere carrière. Daarnaast beogen we op deze wijze voor alle masterscripties de passieve data te behouden en beheren op een zo geautomatiseerd mogelijke wijze. Niet in het minst willen we daarenboven een generatie onderzoekers opleiden die van nature zullen voldoen aan de vereisten die worden gesteld door wetenschapsfinanciers zoals het BOF, FWO, om onderzoeksresultaten zo open mogelijk beschikbaar te stellen voor derden met weliswaar aandacht voor privacy, belangen rond technologietransfer en valorisatie etc..

Er worden zes maanden voorzien om het systeem te implementeren. Het project wordt uitgewerkt in vier fases

  1. Mei 2018 : Analyse van de data die in het vak “Experimenteren in de chemie” (C003970) worden gegenereerd.
  2. Juni 2018 : In overleg met DICT het opzetten van een data repository op niveau van UGent account die tegelijk publiek toegankelijk is binnen de opleiding.
  3. Juli-Augustus 2018 : Ontwikkeling van een GUI
  4. September-Oktober 2018 : Communicatie naar de aan te werven onderwijsbegeleider en overige betrokken docenten die deze nieuwe technologie verder zullen ontwikkelen en inbouwen in de opleiding, inclusief de scripties.