Forschungsdaten

Im Laufe eines wissenschaftlichen Prozesses werden in der Regel Daten erzeugt, bearbeitet und/oder genutzt. Je nach Disziplin kann es sich dabei um sehr unterschiedliche Daten handeln, etwa Annotationen, topographische Daten, Messreihen, Fragebögen u.s.w.

Im Zuge steigender Datenmengen wird auch der bewusste und organisierte Umgang mit diesen Daten immer wichtiger. Nicht zuletzt Forschungsförderer, Politik und Verlage empfehlen oder fordern deshalb vermehrt sogenanntes „Forschungsdatenmanagement“.


Was ist Forschungsdatenmanagement?

Die ↗Forschungsdaten-Leitlinie der Universität Kassel versteht unter Forschungsdaten

alle Daten, die im Laufe eines wissenschaftlichen Prozesses erzeugt, bearbeitet und genutzt werden oder dessen Ergebnis sind.

Je nach Disziplin handelt es sich um unterschiedlichste Daten, die in verschiedenen Formen und Formaten vorliegen.

Abb. 1: Aufgaben im Lebenszyklus von Forschungsdaten

Forschungsdatenmanagement bezeichnet den verantwortungsvollen und organisierten Umgang mit diesen Daten von der Planung über die Erhebung und Auswahl bis hin zur Sicherung und Bereitstellung (im sog. „Lebenszyklus“ von Forschungsdaten, vgl. Abb. 1). Ziel ist dabei, die Daten langfristig und personenunabhängig zugänglich, nachprüfbar und potentiell nachnutzbar zu halten.

Abb. 2: Stufen des Forschungsdatenamangements

Forschungsdatenmanagement beschränkt sich nicht auf die technische Speicherung und Archivierung, sondern umfasst einen komplexen Gesamtprozess, der Daten zusätzlich auffindbar, zugreifbar, verstehbar und im besten Fall nutzbar macht (vgl. Abb. 2).


Warum Forschungsdatenmanagement?

Mit zunehmender Rechenleistung, günstigeren und nutzerfreundlicheren Speichermöglichkeiten sowie der disziplinübergreifenden Etablierung digitaler Forschungsmethoden nehmen Quantität und Komplexität von Forschungsdaten stetig zu. Diese wachsenden Datenmengen bedürfen einer geplanten und systematischen Verwaltung. Eine Reihe weiterer guter Gründe spricht für ein systematisches Management von Forschungsdaten: 

Überprüfbarkeit: Mit Blick auf den diskursiven Charakter von Wissenschaft, aber auch auf Fälle wissenschaftlichen Fehlverhaltens sollten Forschungsergebnisse grundsätzlich überprüfbar sein. Die DFG empfahl deshalb bereits 1998 in ihrer Denkschrift ‚Sicherung guter wissenschaftlicher Praxis‘ die Sicherung und Aufbewahrung von Primärdaten.

Zitierfähigkeit: Durch persistente Adressierbarkeit sind Ihre Daten für Sie selbst und andere dauerhaft referenzierbar und zitierfähig. Dies ist eine Voraussetzung dafür, dass Datenpublikationen als eigenständige Leistung gewürdigt werden und ins wissenschaftlichen Reputationssystem Eingang finden können. Eine aktuelle Studie von Piwowar und Vision (2013) zeigt außerdem die höhere Zitationsrate von Publikationen, bei denen die zugrundeliegenden Forschungsdaten veröffentlicht wurden.

Nachnutzbarkeit: Daten sind wertvoll. Nicht nur ist ihre Gewinnung meist kostenintensiv (Experimentaldaten, abgeleitete Daten) – auch sind sie oft nicht oder nur schwer reproduzierbar (Beobachtungsdaten). Selbstverständlich bedeutet Forschungsdatenmanagement nicht automatisch die Offenlegung Ihrer Daten (↗Bedeutet der Upload in ein Repositorium automatisch freien Zugriff für andere?). Vielmehr beginnt die potentielle Nachnutzung bereits innerhalb von Instituten, Forschergruppen oder Projekten, wo nach Abschluss von Projekten oder mit dem Ausscheiden von Mitarbeitenden Daten und/oder notwendige Informationen für deren Nutzung verloren gehen.

Vorgaben von Forschungsförderern: Zunehmend verlangen Forschungsförderer wie die DFG, BMBF (z.T.) sowie die EU in Projektanträgen Angaben zum Umgang mit Forschungsdaten (Welche Anforderungen stellen Förderer, Verlage und Universität?). Die EU geht im aktuellen Rahmenprogramm Horizon2020 noch darüber hinaus, indem sie ab 2017 den offenen Zugang zu publikationsrelevanten Daten vorschreibt. Darüber hinaus kann Forschungsdatenmanagement weitere Berichts- und Belegpflichten erleichtern.


Welche Anforderungen stellen Förderer, Verlage und Universität?

Forschungsdatenmanagement ist häufig auch eine Anforderung, die von außen an die Forschenden herangetragen wird. Viele Forschungsförderer, Verlage und nicht zuletzt die Universität Kassel selbst verlangen einen planvollen Umgang mit Forschungsdaten, teils auch deren Veröffentlichung.

Drittmittelgeber

Deutsche Forschungsgemeinschaft (DFG)

Die DFG verlangt in der Denkschrift zur Sicherung guter wissenschaftlicher Praxis, dass

„Primärdaten als Grundlagen für Veröffentlichungen (…) auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden."

Diesen Regeln sind alle Wissenschaftlerinnen und Wissenschaftler verpflichtet.

Hinsichtlich einer Veröffentlichung der Daten findet sich bereits für die Planungsphase der Hinweis:

„Werden in dem geplanten Projekt systematisch Forschungsdaten erhoben, die für eine Nachnutzung geeignet sind, sollte der Antrag ein entsprechendes Konzept für die Überführung der Forschungsdaten in vorhandene Datenbanken oder Repositorien enthalten."

Eine Publikation der Daten verlangt die DFG derzeit nicht, wünscht sie aber ausdrücklich:

„Soweit einer Veröffentlichung der Forschungsdaten aus einem DFG-geförderten Projekt Rechte Dritter (...) nicht entgegenstehen, sollten Forschungsdaten so zeitnah wie möglich verfügbar gemacht werden."

Ausführlichere Angaben finden Sie in den Leitlinien für den Umgang mit Forschungsdaten der DFG. Eine detaillierte Erläuterung der dort formulierten Forderungen sowie Hinweise für die eigene Antragstellung finden Sie in unserer Erläuterung zu den DFG-Leitlinien.

Europäische Kommission (EC)

Die EC hat für Projekte im laufenden Rahmenprogramm (Horizon 2020) bis Ende 2016 zunächst einen „Open Research Data Pilot“ durchgeführt, dessen Vorgaben mit 2017 für alle geförderten Projekte verpflichtend sind.

Die Verpflichtung umfasst folgende Punkte:

  • Erstellung eines Datenmanagementplans entsprechend der Vorlage. Einreichung innerhalb der ersten sechs Monate, Aktualisierung bei relevanten Änderungen bzw. mindestens zum Zeitpunkt der Zwischen- und Abschlussevaluation des Projekts.
  • Datenablage: Forschungsdaten müssen so bald wie möglich (‘underlying data‘) bzw. entsprechend dem Datenmanagementplan (‘other data’) in einem geeigneten, möglichst institutionellen, projekt- oder fachspezifischen Repositorium hinterlegt werden.
  • Veröffentlichung: Sofern möglich sollen die Daten ohne Nutzungsbeschränkung unter einer offenen Lizenz (bevorzugt CC-BY oder CC-0) inklusive der benötigten Kontextinformationen und –tools veröffentlicht werden.

Die EC formuliert ihre eigene Politik als as open as possible, as closed  as necessary." Eine, ggf. teilweise, Befreiung von den Auflagen aufgrund legitimer Gründe (vgl. ↗Spricht etwas gegen eine Veröffentlichung?) ist entsprechend möglich.

Verlage

Auch Publikationsdienstleister fordern vermehrt die Bereitstellung derjenigen Forschungsdaten, die einer Publikation zugrunde liegen. Prüfen Sie bitte die entsprechenden Policys vor einer Veröffentlichung. Einige Beispiele zu diesbezüglichen Vorgaben sind:

Universität Kassel

Schon über die ↗Grundsätze zur Sicherung guter wissenschaftlicher Praxis hat sich die Universität Kassel den DFG-Forderungen zur Aufbewahrung von Forschungsprimärdaten angeschlossen. Mit der neuen ↗Forschungsdaten-Leitlinie sind die Forderungen in einigen Punkten umfassender geworden: 

  • Das Management von Forschungsdaten jedes Forschungsvorhabens soll in einem Datenmanagementplan dokumentiert werden
  • Die Projektleiterinnen und Projektleiter sowie die eigenverantwortlich Forschenden zeichnen hierfür verantwortlich.
  • Den einzelnen Fachgebieten wird darüber hinaus empfohlen, Verfahrensweisen des Forschungs­datenmanagements in Forschung und Lehre zu verankern.