Das erfahren Sie in diesem Artikel:

  1. Forschungsdaten und deren eigenständige Publikation werden zunehmend wichtiger.
  2. Die FAIR-Prinzipien sind ein Quasi-Standard für Forschungsdaten.
  3. Organisatorische, rechtliche und infrastrukturelle Hürden vor der Publikation sind überwindbar.

Open Access und Forschungsdaten

Wissenschaftliche Erkenntnisse in Textform basieren in der Regel auf Forschungsdaten. Diese können dabei die unterschiedlichsten Ausprägungen annehmen, sie umfassen sämtliche im wissenschaftlichen Prozess entstehenden (digitalen) Daten, z. B. durch Messungen, Simulationen, Befragungen oder Quellenarbeit. Das Management dieser Forschungsdaten ist in den letzten Jahren immer stärker in das Blickfeld der Wissenschaftler*innen und der Forschungs- und Infrastruktureinrichtungen geraten. Wurden in der Vergangenheit Forschungsdaten als Beiwerk zu Publikationen oft stiefmütterlich behandelt, der Form halber zur Verfügung gestellt oder nur auf Anfrage herausgegeben, ist ein starker Trend zur eigenständigen und prominenten Publikation von Forschungsdaten in offener Form zu erkennen.

Gründe für die Publikation von Forschungsdaten

Forschungsdaten ermöglichen die Replikation und die Nachvollziehbarkeit wissenschaftlicher Ergebnisse. Die Nachnutzbarkeit fördert die Re-Analyse von Daten, das Zusammenfügen von verschiedenen Datenquellen und damit die Chance, mit bestehenden Daten weitergehende Forschung zu betreiben und neue Erkenntnisse zu erzielen. Nachnutzbarkeit umfasst dabei im Idealfall das Recht, die Daten herunterzuladen, zu kopieren, zu verbreiten, maschinell zu verarbeiten und sie ohne finanzielle, technische oder rechtliche Einschränkungen nutzen zu können. Die Publikation von Forschungsdaten ermöglicht deren Zitierbarkeit und trägt damit zur wissenschaftlichen Reputation der Urheber*innen bei.

Positionen und Treiber

Auch bei Forschungsdaten ist ein Argument für den offenen Zugang, dass ihre Herstellung mit öffentlichen Mitteln gefördert wurde. Die Berliner Erklärung hat bereits früh Daten als Objekte genannt, deren offene Verfügbarkeit angestrebt wird.
Neben der intrinsischen Motivation, durch ein gutes Datenmanagement in zunehmend datengetriebener Forschung effizienter arbeiten zu können und selbst von offenen Daten zu profitieren, sind die Forschungsförderer der wichtigste Treiber für die Publikation von Daten.

Europäische Union

Die Europäische Union (EU) hat im Jahr 2016 im Förderprogramm Horizon 2020 den Open Research Data Pilot integriert. Dieser sieht die Veröffentlichung von Forschungsdaten unter der Prämisse „as open as possible, as closed as necessary“ vor. Eine Teilnahme ist freiwillig. Im Nachfolgeprogramm Horizon Europe wird Open Science zum „modus operandi“ ernannt und Open Access bei Text- und Datenpublikationen sowie eine Bereitstellung der Daten nach den FAIR-Prinzipien vorgeschrieben.
 

Deutschland

Die Deutsche Forschungsgemeinschaft (DFG) nennt dies sowohl in den Leitlinien zur Sicherung guter wissenschaftlicher Praxis wie auch in den separat herausgegebenen Leitlinien zum Umgang mit Forschungsdaten. Verpflichtende Angaben zur Weiterverwendung und Verwertung der Daten verlangen beispielsweise auch das Bundesministerium für Bildung und Forschung (BMBF) oder die Volkswagenstiftung. Als weiterer Treiber wird sich die Nationale Forschungsdateninfrastruktur (NFDI) erweisen, der vom Bund und den Ländern über 10 Jahre geförderte Aufbau von Konsortien zur „nachhaltigen, qualitativen und systematischen Sicherung, Erschließung und Nutzbarmachung von Forschungsdaten über regionale und vernetzte Wissensspeicher”.
 

Österreich

Der Österreichische Wissenschaftsfonds (FWF) erwartet seit 2019 bei Projekten, die durch ihn bewilligt werden, den offenen Zugang zu Forschungsdaten. „Für Forschungsdaten, die den wissenschaftlichen Publikationen des Projekts zugrunde liegen, ist der offene Zugang verpflichtend. […] Sollte […] ein offener Zugang zu diesen Daten nicht oder nur teilweise möglich sein, ist das im Datenmanagementplan (DMP) zu begründen“.
 

Schweiz

Der Schweizerische Nationalfonds (SNF) erachtet den offenen Zugriff auf Forschungsdaten ebenfalls als einen wesentlichen Beitrag und überschreibt die Grundsatzerklärung zu Open Research Data mit „Forschungsdaten sollen offen und für alle zugänglich sein – für die Wissenschaft wie für die Gesellschaft“.

FAIR-Prinzipien

Verschiedene nationale und internationale Forschungsförderer wie die EU und die DFG zielen in ihren Richtlinien auf die FAIR-Prinzipien ab, die NFDI hat sich zum Ziel gesetzt, Daten „FAIRfügbar“ zu machen. Das Akronym FAIR steht für Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel) und Reusable (Wiederverwendbar). Geprägt wurde der Begriff FAIR von der FORCE11-Community und am 15. März 2016 in Scientific Data publiziert (Wilkinson, Dumontier, Aalbersberg et al., 2016), eine Befürwortung findet sich unter anderem in der Abschlusserklärung vom G20-Gipfel in Hangzhou 2016. Die FAIR-Prinzipien sind auf bestem Wege ein international anerkannter Standard im Umgang mit Forschungsdaten zu werden. FAIRe Daten bedeuten dabei nicht zwangsläufig, dass alle Daten offen zur Verfügung stehen.

Die vier einzelnen Elemente von FAIR bedeuten:

  • Auffindbar: Damit Daten nachgenutzt werden können, müssen diese leicht auffindbar sein. Dazu sind Daten mit umfassenden menschen- und maschinenlesbaren Metadaten beschrieben.
  • Zugänglich: Der Zugriff auf die gefundenen Daten muss nach klaren Regeln möglich sein, Authentifizierung und Autorisierung müssen definiert sein.
  • Interoperabel: Zur Nutzung und zur Integration mit anderen Daten ist eine Verwendung einer zugänglichen und allgemein verwendbaren Sprache für die Wissensrepräsentation notwendig, Metadaten folgen standardisierten Vokabularien.
  • Wiederverwendbar: Die Beschreibung der Daten und der Metadaten ermöglicht die Nutzung in unterschiedlichen Kontexten, geeignete Datennutzungslizenzen werden verwendet und die Daten entsprechen domänenrelevanten Community-Standards.

Publikation

Bei der Publikation von Forschungsdaten ist ein geeignetes Repositorium auszuwählen, das möglichst einen Open-Access-Zugriff auf die Daten anbietet. Dabei ist die Wahl eines fachspezifischen und in der Community etablierten Repositoriums immer zu bevorzugen, da sich die eigenen Daten damit in einem guten fachlichen Kontext befinden und die Auffindbarkeit erleichtert wird. Zur Auswahl eines Datenrepositoriums kann der Verzeichnisdienst re3data genutzt werden. Falls kein passendes Repositorium gefunden werden kann, so ist ein Rückgriff auf allgemeine oder institutionelle Repositorien möglich.
Um die Bereitstellung und Auffindbarkeit langfristig zu garantieren, ist die Vergabe einer dauerhaften Adresse notwendig. Dieser persistente Identifikator sichert auch die Zitierbarkeit der Datensätze. Bevorzugte Identifikatoren sind die vom Verbund DataCite vergebenen DOIs.
Vor der Veröffentlichung von Daten ist eine Kuration der Daten nach den FAIR-Prinzipien dringend angeraten, denn die Nachnutzbarkeit von Daten wird stark eingeschränkt, wenn diese nicht über ausreichende Beschreibungen und Metadaten verfügen. Metadaten sollten dabei frühestmöglich im Forschungsprozess vergeben werden und umfassen sowohl technische (Beispiel: Wann und von wem wurde der Datensatz erhoben?) wie auch inhaltliche Metadaten (Beispiel: Was steht in den einzelnen Variablen?). Bei der Kuration werden die Daten vor allem technisch überprüft. Dies umfasst das Datenformat, den grundsätzlichen Zugriff und die formale Korrektheit. Beim Datenformat ist z. B. auf langfristig zugreifbare und offene Datenformate zu setzen. Die inhaltliche Überprüfung muss durch die Wissenschaftler*innen weitestgehend selbst geleistet werden. Am Ende der Kuration steht die Wahl einer geeigneten Lizenz. Hier haben sich die Creative-Commons-Lizenzen bewährt (nähere Informationen hierzu bietet das Portal forschungsdaten.info).

Herausforderungen

Drei wichtige Herausforderungen sollten im Forschungsdatenmanagement (FDM) und im Publikationsprozess als überwindbare Hürden genannt werden:

  • Organisatorisch: Das Management und die Kuration der Daten erfordert zusätzliche Kompetenzen. Neue Berufsbilder wie Data Curator, Data Steward oder Data Scientist entstehen und Forschungs- und Infrastruktureinrichtungen müssen entsprechende Ressourcen bereitstellen und Mitarbeiter*innen entsprechend weiter- und ausbilden.
  • Rechtlich: Forschungsdaten können personenbezogen und sehr sensitiv sein. Diese Daten müssen vor der Veröffentlichung anonymisiert oder im Zugriff so eingeschränkt werden, dass keine Datenschutzrechte verletzt werden. Auch die Berücksichtigung urheberrechtlicher Aspekte im Zusammenhang mit Forschungsdaten ist nicht zu vernachlässigen. Eine rechtliche Beratung zu einem frühen Zeitpunkt im Forschungsprozess ist dringend anzuraten.
  • Infrastruktur: Die entstehenden Datenmengen können – besonders in den Naturwissenschaften – sehr schnell sehr groß werden und aus den Erfahrungen der Vergangenheit wird die Datenmenge stetig wachsen. Der Umgang mit Daten im Petabyte-Bereich stellt Anforderungen an die Speicherung, Sicherung, Archivierung und die Übertragung dieser Daten.

Kritik

Eine oft geäußerte Kritik aus der Wissenschaft liegt in der Sorge begründet, dass andere zu stark vom eigenen Datenschatz profitieren und man selbst nicht die nötige Reputation für die wissenschaftliche Karriere erzielen kann. Dazu ist klarzustellen, dass eine Veröffentlichung so früh und so umfangreich wie möglich anzustreben ist. Dies lässt aber weiterhin zu, dass Daten erst zu seinem späteren Zeitpunkt, nach der Auswertung oder mit einem Embargo versehen, veröffentlicht werden. Die Hoheit über die Daten verbleibt beim Erzeugenden.
Ebenfalls oft genannt wird der zusätzliche Aufwand für den geforderten Umgang mit den Daten. Hierzu ist es bereits jetzt möglich, im Rahmen der Beantragung von Forschungsförderung auch Mittel für diesen Aufwand zu erhalten. Datenmanagement muss als zentraler Bestandteil von wissenschaftlicher Forschung angesehen und personell und finanziell ausreichend ausgestattet werden.

Ausblick

Der Prozess der letzten Jahre wird sich weiter verstärken. Die Veröffentlichung, Nachnutzung und Verknüpfung von Forschungsdaten werden sich zum wissenschaftlichen Standard entwickeln. Dabei ist zu erwarten, dass die Grenzen zwischen Open Access, Textpublikationen und Forschungsdaten zunehmend verschwimmen, sich die Themen und Aufgaben überlappen und unter dem Sammelbegriff Open Science ein Mentalitätswandel in der Wissenschaft herbeigeführt wird. Zur Akzeptanz in der Wissenschaft müssen Daten und der Umgang mit diesen als wissenschaftliche Leistung anerkannt werden.

Literatur

  • Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., Bonino da Silva Santos, L., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3. https://doi.org/10.1038/sdata.2016.18

Weiterführende Literatur

Weiterführende Links

Bearbeitung der Inhalte der Seite: Matthias Landwehr (Stand: März 2021)