Metadata voor economie en sociale wetenschappen

Het is zeer moeilijk om een dataset juist te begrijpen zonder de context te kennen waarin ze is gecreëerd.  Een beschrijving van de juiste context, onderzoeksmethoden en middelen, de zogenaamde metadata, zijn noodzakelijk om het onderzoek te kunnen reproduceren of naar waarde te schatten.

Metadata kan vóór het onderzoek (DMP), tijdens het onderzoek (readme.txt) of na afloop van het onderzoek (schemas, Data Storage Fact Sheet, publicatie) gegenereerd worden.

Datamanagementplan (DMP)

Een datamanagementplan is niet alleen een document dat men opmaakt voor het onderzoek maar is ook een 'levend document' dat men kan blijven bijwerken wanneer nodig.  Op deze manier vormt zich een overzicht van hoe het project verlopen is en wat er allemaal met de data is gebeurd.

Wanneer je een publicatie oplaadt in de academische bibliografie (biblio) kan je het DMP bijvoegen als bijkomend materiaal toevoegen.

README.txt

Een README.txt bestand is eenvoudige manier om metadata over zowel de data als over het project zelf bij te houden wanneer er geen gepaste standaard voor handen is. 

  • Algemeen template
  • Specifiek voor economie: het algemene template (appendice C) en het template specifiek voor economie (appendice E) uit de paper "Exploring disciplinary metadata and documentation practices to strengthen data archiving services" (E. Rolando, L. Li, A. Doshi, K. Young)
De README biedt antwoord op de vraag: "Welke informatie is er nodig om de data juist te interpreteren en/of het onderzoek te reproduceren?" Als onderzoeker kan je hier zo uitgebreid op antwoorden als nodig. 

Onderzoek van 4TU.ResearchData en TU Delft heeft uitgewezen dat men in de sociale wetenschappen bijna geen gestructureerde metadata aan de datasets toevoegt maar wel veel "vrije tekst" en dat dit systeem blijkt te werken.

Metadata-schema standaarden specifiek voor economie en sociale wetenschappen

Data Documentation Initiative (DDI)

De Data Documentation Initiative (DDI) is dé internationale standaard voor het beschrijven van data voor de sociale-, gedrags-, economische en gezondheidswetenschappen.

Deze uitgebreide standaard is ideaal voor codeboeken, vragenbanken, longitudinale datasets en geeft duidelijke informatie over de DDI-specificaties en DDI-tools.

SDMX - Statistical Data and Metadata Exchange

Statistical Data and Metadata Exchange (SDMX) is een internationale standaard om statistische data en metadata uit te wisselen tussen organisaties onderling.

Het SDMX-initiatief wordt gesponsord door de Bank of International Settlements (BIS), de Europese Centrale Bank (ECB), EUROSTAT (Statistical Office of the European Union), het International Monetary Fund (IMF), de Organisation for Economics Cooperation (OECD), de United Nations Statistical Division (UNSD) en de World Bank.

Dublin Core Metadata Initiative

De meest algemene en meest gekende metadata standaard is die van het Dublin Core Metadata Initiatve. Deze standaard laat niet toe om meer discipline-specifieke informatie mee te geven aan de dataset.

Andere standaarden en tools

Op de website van het Digital Curation Centre (UK) kan men nog andere metadatastandaarden en tools terugvinden.

Data Storage Fact Sheet (DSFS)

Een Data Storage Fact Sheet (DSFS) is een korte beschrijving van de data die werd verzameld tijdens een project, hoe en waar die data is opgeslagen en wie men kan contacteren met vragen over de data. Veelal word een DSFS na afloop van het project toegevoegd aan een publicatie en/of dataset. Het is mogelijk om een DSFS als bijkomend materiaal aan een publicatie te hangen in Biblio.

Publicatie/Paper

Wanneer de methodologie van een project goed beschreven staat, kan de paper zelf ook als metadata dienen.