De volgende stap in de Open Access-revolutie: Open Data.
Het online, openbaar toegankelijk stellen van onderzoeksresultaten is inmiddels gemeengoed geworden en dit zogenoemdeOpen Accesspubliceren wint ongelooflijk aan vaart. Zo hebben afgelopen november 12 EU-lidstaten en hun nationale onderzoeksfinancieringsinstuten “Plan S” ondertekend waarin ze zich committeren aan het Open Access publiceren van alle met publieke middelen gefinancierde onderzoeken.[1]Nu de Open Accessgolf steeds krachtiger wordt, dient de volgende stap in deze Open Sciencerevolutie zich al aan: het online, openbaar en onbeperkt bruikbaar ter beschikking stellen van de aan de publicaties ten grondslag liggende onderzoeksdata. Oftewel: Open Data.
Maar zo ver gevorderd als de Open Accesspraktijk inmiddels is, zo in de kinderschoenen staat het openbaar maken van de onderzoeksdata en veel is nodig om ook op het gebied van Open Dataeen krachtige beweging te creeeren. Gezien de enorme potentie die het ter beschikking stellen van onderzoeksdata heeft loont het om een goed overzicht te krijgen van de huidige ontwikkelingen op dit gebied en de obstakels die de verdere ontwikkeling in de weg staan.
De ongekende potentie van Open Data
Voor wat exact verstaan moet worden onder onderzoeksdata en wat precies het Open Accesspubliceren van die data inhoudt, bestaat geen uniforme juridische definitie. In de literatuur is men het er over eens dat in ieder de data zo veel mogelijk ontdaan moet zijn van enige IE-rechtelijke contstricties. Hierdoor is de data te allen tijde inzichtelijk én herbruikbaar, en valt het grotendeels in het publieke domein.[2]Ten tweede zijn de FAIR-principlesvan belang. Deze principes stellen dat de data findable, accessible, interoperable enreusable moet zijn, en zien daarmee grotendeels op de technische maatregelen die de data niet slecht in naam, maar ook praktisch (her)bruikbaar maken.[3]Wat betreft de onderzoeksdata zelf wordt doorgaans gekozen voor een zeer brede definitie die alle data omvat die dient ter staving of verificatie van onderzoeksresultaten.[4]
Het bedenken van de mogelijke voordelen van een degelijk Open Databeleid vergt niet veel fantasie. Stel je voor dat alle onderzoeksdata die ten grondslag liggen aan de onderzoeken die gepubliceerd worden gemakkelijk online toegankelijk, compatibel, doorzoekbaar en onbeperkt herbruikbaar zijn. De mogelijkheden zijn bijna oneindig. Onderzoeken kunnen zo veel gemakkelijker geverifieerd of gefalsificeerd worden, wat leidt tot kwalitatief betere wetenschap. Daarnaast zijn de nieuwe onderzoeken die op basis van deze dataweelde gevoerd worden vrijwel onbeperkt. Ook buiten de wetenschap zal deze data een enorme invloed kunnen hebben in de vorm van private partijen die op basis van de data nieuwe, innovatieve producten op de markt kunnen brengen. Denk bijvoorbeeld aan een Buienradar die, op basis van openbare gegevens van het KNMI, mensen dagelijks het leven makkelijker maakt.[5]
Daarnaast brengt een volledig Open Databeleid ons als maatschappij een stap dichterbij de broodnodige democratisering van de wetenschap en het vervullen van het uiteindelijke doel van de universiteit: het duiden en waar mogelijk verbeteren van de wereld waar wij in leven. Dit geldt natuurlijk des te meer voor wetenschap die met publieke middelen gefinancierd wordt, de maatschappij heeft immers recht toegang tot de kennis die het zelf doet produceren.
De hobbelige weg in het verschiet
Hoewel de voordelen en zelfs de noodzaak tot een beweging in deze richting algemeen geaccepteerd worden, gaapt een reusachtig gat tussen idealistische toekomstperspectieven en de daadwerkelijke situatie. Zeer veel (juridische) obstakels staan in de weg van een Open Data-beleid, waarvan een aantal hier de revue zullen passeren.
Allereerst is in tegenstelling tot bij de wetenschappelijke publicaties zelf, bij de data de IE-rechtelijke status zeer onduidelijk. Op een publicatie rust altijd een auteursrecht wat met een simpele licentie Open Access openbaar gemaakt kan worden.[6]Ingeval van data en datasets is de juridische status echter lang niet altijd helder. Het is bijvoorbeeld mogelijk dat een auteursrecht rust op een dataset(/bank), dit komt echter niet vaak voor en daarnaast verschillen de omstandigheden waaronder een degelijke dataset onder het auteursrecht valt per jurisdictie. Ook de toepasselijkheid van het EU sui generisidatabankenrecht is niet altijd helder.[7]Deze onduidelijkheid over de juridische status leidt ook tot moeilijkheden met betrekking tot de licenties, zoals een grote verscheidenheid aan vaak incompatibele licenties en het gevaar tot een te zware licentie, waarbij aan rechtenvrije datasets toch per ongelijk IE-rechten wordt toegekend.[8]
Nauw verboden met deze problematiek is het gebrek aan externe motivatie voor de onderzoekers om zelf hun data openbaar te maken. Wanneer er geen rechten rusten op de data of wanneer er geen maatwerk mogelijk is in de licenties, raken onderzoekers alle controle kwijt over hun data op het moment van publicatie. Dit leidt enerzijds tot angst voor misbruik van de data en anderzijds tot een gebrek aan mogelijkheden om de data economisch te verzilveren. Dit is vervolgens ook problematisch bij publiek-private samenwerkingen in de wetenschap. Het is dus wenselijk dat wetenschappers enige controle houden over de wijze waarop de data openbaar gemaakt wordt en hoe (en of) verwezen wordt naar de maker.
Naast al deze meer principiële vraagstukken zijn er ook een grote hoeveelheid technische punten die gecoördineerd moeten worden om te verzekeren dat de data of de databanken compatibel en interoperbel zijn. Hierbij zijn de FAIR-principles natuurlijk leidend, maar die bieden vooralsnog onvoldoende houvast.
Huidige initiatieven
Bewust van deze problematiek en het belang van een goed Open Data-beleid werkt de EU vanuit een aantal verschillende invalshoeken om dit beleid werkelijkheid te maken. Ten eerste kan gewezen worden op de wijze waarop de EU Open Data stimuleert in de door haar gefinancierde onderzoeksprojecten. Bij alle onderzoeksfinanciering die de EU op basis van het Horizon2020 onderzoeksprogramma verstrekt is de standaard optie dat de data Open Access gepubliceerd wordt Dit is echter slechts een ‘default option’waar vrij gemakkelijk van afgeweken kan worden.[9]Daarnaast werkt de EU aan de ‘EU Science Cloud’ waar data opgeslagen en toegankelijk gemaakt kan worden.[10]
Momenteel in ontwikkeling zijn de Digital Single Market-richtlijn (“DSM”) en een herziening van de Public Sector Information-richtlijn (“PSI”).[11]De DSM-richtlijn introduceert een auteursrechtelijke exceptie voor onderzoeksinstituten waardoor deze onder enige IE-restricties aan tekst en datamining kunnen doen. In de herziening van de PSI-richtlijn wordt de verplichting voor lidstaten en de nationale onderzoeksfinancieringsinstituten gecreëerd om beleid op te stellen voor Open Data. Ook moeten alle reeds openbaar gemaakte onderzoeksdata aan de herbruikcriteria uit de PSI-richtlijn gaan voldoen.
Opvallend bij al deze initiatieven is dat de universiteiten en de onderzoekers zelf geen rol lijken te spelen bij het opstellen van de voorwaarden waaronder hun onderzoeksdata openbaar gemaakt wordt. Daarnaast blijkt ook duidelijk uit deze op sommige van huidige initiatieven dat lang niet alle problemen geadresseerd worden.
Bottom-up harmonisatie?
De enorme wetenschappelijke en maatschappelijke voordelen die het openbaar beschikbaarstellen van de onderzoeksdata kan bieden staan buiten kijf. Uit het bovenstaande blijkt echter duidelijk dat deze toekomstdroom nog niet zo simpel te realiseren is. Een grote hoeveelheid obstakels, juridisch en niet-juridisch, compliceren en vertragen de implementatie van dit potentieel revolutionaire beleid. Stappen worden gezet om deze één voor één te ruimen, maar de voortgang is langzaam, te weinig gecoördineerd de echte experts, de onderzoekers en universiteiten, worden onvoldoende betrokken in het vormgeven van dit beleid. Duidelijkheid moet verschaft worden over de IE-rechtelijke positie van de data, de licentie problematiek en de technische compatibiliteit moet aangepakt worden, en het moet aantrekkelijk zijn voor wetenschappers om hun data te publiceren.
Enerzijds schreeuwen deze problemen om harmonisatie en het opstellen van gemeenschappelijke spelregels, maar anderzijds is gedifferentieerd beleid toegespitst op wat de onderzoekers en universiteiten nodig hebben noodzakelijk. De EU zal op een zeer dunne lijn moet balancerenwaarbij tegelijkertijd het beleid op maat gemaakt wordt vóór en dóór de universiteiten terwijl het beleid niet dusdanig gedifferentieerd wordt dat van de broodnodige harmonisatie en standaardisatie geen sprake meer is. Echter, wanneer deze acrobatische act correct uitgevoerd wordt zal het de wijze waarop wetenschap bedreven wordt blijvend veranderen en zal de maatschappelijke impact ongekend zijn.
Naomi Appelman
[1] Zie https://www.coalition-s.org/voor meer informatie
[2] Gebaseerd op gezaghebbende definities uit: Suber, P., Open Access, Massachusetts Institute of Technology Press Essential Knowledge Series, Cambridge, MA, 2012, p. 4 en de Budapest Open Access Initiative, Februari 14, 2002, bron: http://www.soros.org/openaccess
[3] Wilkinson, M. D., e.a., “The FAIR Guiding Principles for scientific data management and stewardship”, Scientific Data, 15 March 2016, DOI: 0.1038/sdata.2016.18
[4] Zie bijvoorbeeld artikel 1, sub 7 van de voorgestelde herziening van de PSI-directive, COM/2018/234 final – 2018/0111 (COD)
[5] Voor uitwerkingen van de mogelijke voordelen van Open Databeleid zie onder andere: Dodirina, C., Eisenstadt, A.R., Onsrud, H. & Uhlir, P.F., Legal Approaches for Open Access to Research Data, CC BY 4.0, augustus 2016, p. 3-4; OECD Recommendation of the Council concerning access to research data from public funding 29 November 2009 C(2006)184
[6] Bijvoorbeeld de Creative Commons CC BY 4.0 licentie. Zie https://creativecommons.org/licenses/by/4.0/deed.en voor meer uitleg
[7] Voor meer uitleg over de complexe juridische status zie bijvoorbeeld : Dodirina, C., Eisenstadt, A.R., Onsrud, H. & Uhlir, P.F., Legal Approaches for Open Access to Research Data, CC BY 4.0, augustus 2016; Giannopoulou A., “Understanding open data regulation: An analysis of the licensing landscape” in van Loenen B. et. Al. (eds.), Open Data Exposed, Information Technology and Law Series 30, 2018 https://doi.org/10.1007/978-94-6265-261-3_6, pp. 101-125
[8] Voor een uitgebreide uiteenzetting van deze problematiek zie Giannopoulou A., “Understanding open data regulation: An analysis of the licensing landscape” IN van Loenen B. et. Al. (eds.), Open Data Exposed, Information Technology and Law Series 30, 2018 https://doi.org/10.1007/978-94-6265-261-3_6, pp. 101-125
[9] Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, 21 March 2017
Plaats een Reactie
Meepraten?Draag gerust bij!