Glossarium

Anonieme gegevens: zijn gegevens die niet in verband kunnen gebracht worden met een geïdentificeerde of identificeerbare persoon en zijn dus geen persoonsgegevens.

Anonimiseren: het irreversibel verwijderen van de mogelijkheid tot identificatie, door middel van bepaalde verwerkingstechnieken, met als doel enkel gegevens over te houden voor verdere verwerking of bewaring die niet meer in verband kunnen gebracht worden met een geïdentificeerde of identificeerbare persoon. In de praktijk blijkt sluitend anonimiseren niet altijd mogelijk; meestal blijft er een risico tot her-identificatie. Geanonimiseerde persoonsgegevens die met een redelijke inspanning terug te leiden zijn naar de oorspronkelijke individuen, blijven persoonsgegevens en zijn geen anonieme gegevens.

Checksum: Een unieke code van beperkte lengte die de authenticiteit van een bestand waarborgt. De code wordt berekend op de inhoud van een bestand. Als de inhoud van een bestand gewijzigd wordt, zal een andere code gegenereerd worden.

Codeboek is een document waarin de aard van de data gedocumenteerd is.

Data: Alle gegevens die gegenereerd worden uit of gebruikt worden in een bepaald onderzoek. Bij data gaat het steeds om een combinatie van zowel ruwe data als metadata.

Ruwe data (of primaire data) verwijst naar de onbewerkte brongegevens zoals door een onderzoeksinstrument worden op- of aangeleverd. Voorbeelden van ruwe data zijn een video-opname, MRI scan, de output van E-prime of een ingevulde vragenlijst. Het gaat dus niet om het object of subject dat door het onderzoeksinstrument geregistreerd of gemeten wordt (vb. bloedstalen, een interactie tussen personen) maar om de output gegenereerd door het onderzoeksinstrument. Soms kan ook de proefleider fungeren als meetinstrument (vb. bij observaties maken de originele observatienota’s deel uit van de ruwe data).

Metadata (of data over data) verwijst naar gestructureerde en gestandaardiseerde beschrijvingen die informatie weergeven over de aard en de soort data, alsook informatie omtrent verzameling, verwerking, bewaring en deponering van ruwe data. Dit omvat bijvoorbeeld een document (codeboek) waarin de aard van de data gedocumenteerd is, (indien mogelijk) het software programma waarmee de data verzameld zijn, uitleg over de manier waarop de ruwe data verwerkt zijn tot de data die geanalyseerd werden, een document met de data in de vorm waarin ze ingevoerd werden in een statistisch programma, een boomstructuur/codeboom waarmee interviews of focusgroepen geanalyseerd werden, een observatieformulier en een document met informatie over juridische (vb. wie is eigenaar van de data) en ethische (vb. informed consent) aspecten die van belang zijn voor het gebruik en hergebruik van de gegevens. Ook een beschrijving van de manier waarop de data geanonimiseerd en gecodeerd werden, alsook een beschrijving van beschikbare gegevens die niet extern gedeeld  worden, moet opgenomen worden in de metadata. > Metadata

Dataopslag: Het bewaren van data (centrale shares, kast, repository, etc.) zodat data niet verloren gaat. Dataopslag is een noodzakelijke voorwaarde voor datadeponering en datadeling, maar dient ook gerealiseerd te worden voor die data die moeilijk of niet in aanmerking komen voor datadeling.  Dataopslag voldoet aan drie basiscriteria:

  1. Vertrouwelijkheid (data is enkel toegankelijk voor diegenen die daartoe gemachtigd zijn)
  2. Integriteit (data kan niet opzettelijk of onopzettelijk verwijderd worden, data is actueel, correct en volledig)
  3. Beschikbaarheid (data is vlot toegankelijk en bruikbaar door gemachtigde personen in een stabiele omgeving)

> Dataopslag via centrale infrastructuur

> Dataopslag via academische bibliografie

Datadeponering: Het veilig en toekomstgericht (bij voorkeur elektronisch) opslaan van data in een archief.  Bij datadeponering wordt bijgehouden wanneer en door wie data in het archief werd gedeponeerd. Authenticiteit van data in het archief wordt geverifieerd door middel van bv. een checksum die op een andere plaats wordt bewaard.

Datamanagement: Alle handelingen die ertoe leiden dat onderzoeksdata veilig, vindbaar, toegankelijk en begrijpelijk zijn en blijven. Data management heeft betrekking op planning, verzameling, organisatie, opslag, verwerking, analyse, archivering, toegankelijk maken en hergebruik van onderzoeksgegevens. > Datamanagement

Datamanagementplan: Een gestructureerd document dat beschrijft hoe data zal verzameld worden, de omvang en het formaat van de data, de manier waarop de data zal opgeslagen worden en wie - zowel tijdens de uitvoering van het onderzoek als daarna - toegang zal hebben tot de data. Het document presenteert hoe onderzoekers voor, tijdens en na het onderzoek omgaan met de verzamelde data. Dergelijk plan bevat eveneens informatie over de juridische en ethische aspecten van data. > Datamanagementplan

Datadeling (data sharing): De praktijk om data beschikbaar te stellen voor de onderzoeksgemeenschap met als doel onderzoeksgegevens optimaal te (her)gebruiken voor wetenschap en maatschappij. > Datadeling

Encrypteren: het versleutelen van informatie door middel van een algoritme, zodat de informatie onleesbaar wordt voor wie de juiste sleutel niet heeft. Versleutelde gegevens kunnen enkel met de juiste sleutel weer gedecrypteerd (ontcijferd of gedecodeerd) worden om de originele informatie terug te krijgen.

End-user license agreement: Een gebruiksovereenkomst die rechten en plichten beschrijft van een gebruiker van data. Het betreft een licentie en geen overdracht van auteursrecht. De gebruiker van data heeft het recht - onder voorwaarden - data te gebruiken, maar wordt er geen eigenaar van. De gebruiksovereenkomst handelt ook over nieuwe resultaten die gegenereerd worden en afspraken over verwijzing naar bronmateriaal.

Gevoelige gegevens: bepaalde persoonsgegevens zijn gevoeliger van aard dan andere. Het gaat om gegevens over ras, politieke opvattingen, godsdienstige of levensbeschouwelijke overtuigingen, lidmaatschap van een vakvereniging, gezondheid, seksuele leven, verdenkingen, vervolgingen, strafrechtelijke of bestuurlijke veroordelingen. Het is enkel onder strikte voorwaarden toegelaten om dergelijke gegevens te verwerken.

Hergebruik: Het gebruik van data voor andere analyses dan deze die door de onderzoeker gerapporteerd werden in publicaties of verslagen.

Persoonsgegevens: Alle gegevens (bv. telefoonnummer, studentennummer, e-mailadres, vingerafdruk, etc.) waarmee een persoon rechtstreeks of onrechtstreeks wordt geïdentificeerd, of geïdentificeerd kan worden (zie Privacywetgeving).

Reproduceerbaarheid: De mogelijkheid om uitgaande van de ruwe data te komen tot de resultaten die door een onderzoeker gerapporteerd werden in publicaties of verslagen.