FAQ – häufig gestellt Fragen

Einführung und Hintergründe

Wie steht die Wissenschaftspolitik zu Forschungsdatenmanagement?

Auch auf Wissenschaftspolitischer Ebene findet das Thema Interesse und Zuspruch:

Die Hochschulrektorenkonferenz (HRK) hatte bereits im Mai 2014 das Management von Forschungsdaten als „eine zentrale strategische Herausforderung für  Hochschulleitungen“ bezeichnet. In der Empfehlung vom Nov 2015 stellt sie schließlich die vielschichtigen Entwicklungen und Herausforderungen aus der Organisationsperspektive in Form einer praktischen Handlungsanleitung dar. Dabei hebt sie den dringenden Bedarf an Koordination und Abstimmung zwischen den Hochschulen beim Aufbau eines länderübergreifenden und international kompatiblen Forschungsdatenmanagements hervor. Die Kommission Zukunft der Informationsinfrastruktur (KII) hat 2011 Empfehlungen zu einem „Gesamtkonzept für die Informationsinfrastruktur in Deutschland“ veröffentlicht. Forschungsdaten stellen hier eines von acht Handlungsfeldern dar. Der Kommission zufolge, sind sie

als nationales  Kulturgut  anzusehen  und  sollten  im  Sinne  einer öffentlichen Aufgabe  dauerhaft  gesichert  und  der  (Fach-)Öffentlichkeit sowie zukünftigen (Forscher-) Generationen  zur  Nachnutzung  zur Verfügung gestellt werden“. Hierfür sei „eine nationale Allianz zwischen allen Akteuren nötig."

Der Wissenschaftsrat betont in seinem Positionspapier Empfehlungen zu wissenschaftlicher Integrität

die Forderung, Forschungsdaten internationalen Standards entsprechend aufzubereiten, für einen ausreichend langen Zeitraum aufzubewahren und für Anschlussforschung zugänglich zu machen."

Der Rat für Informationsinfrastrukturen (RFII) empfiehlt 2016 (Leistung aus Vielfalt) die Etablierung eines bundesweiten, verteilten und arbeitsteilig angelegten Netzwerks als ‚Nationale Forschungsdateninfrastruktur‘ (NFDI).

Die AG Forschungsdaten der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen hat 2016 ihr Positionspapier „Research data at your fingertips“ veröffentlicht, in dem sie verschieden Empfehlungen zur Einrichtung einer nachhaltigen Forschungsdateninfrastruktur formuliert. Als „wesentliche Voraussetzung“ bezeichnet sie dabei die  

wissenschaftliche Anerkennung der Veröffentlichung von Forschungsdaten zur Nachnutzung (citable and accessible) und deren Berücksichtigung in Evaluierungsverfahren von Personen und Institutionen."

Was verlangen Forschungsförderer und Verlage?

Forschungsdatenmanagement, z.T. auch Data Sharing, wird vielfach von Forschungsförderern gefordert. Hintergrund sind v.a. die Validierbarkeit von Ergebnissen sowie die Vermeidung von Mehrfachförderung. Im Sinne Guter Wissenschaftlicher Praxis entwickeln auch Verlage vermehrt Daten-Policies, die eine Veröffentlichung zumindest derjenigen Daten, die der jeweiligen Publikation zugrundliegen, vorschreiben.

Eine detaillierte Beschreibung der Anforderungen einzelner Akteure finden Sie unter Forschungsdaten → Welche Anforderungen stellen Förderer, Verlage und Universität?

Beachten Sie auch unsere Erläuterung zu den DFG-Leitlinien.

Wann starte ich mein Forschungsdatenmanagement?

Abb 1: Aufgaben im Lebenszyklus von Forschungsdaten

Forschungsdatenmanagement  sollte nicht erst beginnen, wenn die erhobenen Daten vorliegen. Im besten Fall gehen der Erstellung von Daten konzeptionelle Überlegungen über den weiteren Umgang mit ihnen voraus. Hilfreich kann dabei die Orientierung an einem Data-Lifecycle sein (vgl. Abb. 1).

Dabei folgt Forschungsdatenmanagement disziplinübergreifend vergleichbaren Fragen, wenngleich die Antworten stark variieren können. Am Anfang sollten z.B. Fragen nach dem geeigneten Format /Standard stehen, nach finanziellen und personellen Ressourcen zur Datenpflege, nach der Verantwortung für und nach dem geistigen Eigentum an den zu erstellenden Daten. Entsprechende Fragen können über alle Phasen des Lebenszyklus‘ gestellt werden (siehe hierzu auch „Checkliste zum Forschungsdaten-Management“ von Wissgrid: knapp oder ausführlich).

Nützliche Hinweise für einen Start ins systematische Forschungsdatenmanagement finden Sie unter ↗Anleitung

Ein planvoller Umgang mit Daten ist auch Hintergrund der von vielen Förderern bereits geforderten Datenmanagementpläne, die helfen sollen, solche Fragen vorab systematisch zu klären (↗Wie erstelle ich einen Datenmanagementplan?).

Wie erstelle ich einen Datenmanagementplan?

Die Erstellung eines Datenmanagementplans erfordert eine detaillierte Reflexion über den geplanten Umgang mit den im jeweiligen Vorhaben anfallenden Daten. Er ist als „lebendiges Dokument“ zu verstehen, das den Umgang mit Forschungsdaten von der Planung bis zum Abschluss eines Forschungsvorhabens dokumentiert und ggf. an Änderungen, neue Erkenntnisse oder Probleme angepasst werden kann und muss.

Bei der Erstellung von Datenmanagementplänen helfen Ihnen folgende Werkzeuge und Informationen

Tools

  • DMPOnline wurde vom britischen Digital Curation Centre (DCC) entwickelt. Es enthält u.a. ein Template für H2020-Projekte und leitet Nutzerinnen und Nutzer anhand detaillierter Fragen und Anleitungen
  • DMPTool wird von der California Digital Library betrieben. Die Webseite bietet auch Beispiele für Datenmanagementpläne. Aufgrund der unterschiedlichen Förderlandschaft ist das Tool nur begrenzt für deutsche/europäische Projekte geeignet.
  • RDMO vom Leibniz Institut für Astrophysik Potsdam befindet sich aktuell in der Betaphase. Das Projekt verfolgt das Ziel, mit dem Tool nicht nur die Erstellung von Datenmanagementplänen, sondern auch die strukturierte Planung, Umsetzung und Verwaltung zu unterstützen. Die Uni Kassel ist plant, in Kürze eine eigene Instanz des Tools zur Verfügung zu stellen.

Checklisten, Templates, Wizards

Eine sehr überzeugende Vorlage für das Forschungsdatenmanagement ist zudem der Fragenkatalog des Oxforder Zoologen David Shotton ("Twenty Questions for Research Data Management")

Muster Datenmanagementpläne

  • Muster Datenmanagementpläne der HU Berlin für H2020, DFG und BMBF
  • Vorlage Datenmanagementplan für die RWTH Aachen
  • Beispiele für Datenmanagementpläne bei DMPTool
  • Beispiele für Datenmanagementpläne der dcc
  • Beispiele für Datenmanagementpläne der University of Leeds
  • Beispiele für Datenmanagementpläne der UC San Diego
  • Beispiele für Datenmanagementpläne der National Endowment for the Humanities

Einen Einstieg bietet auch das kurze Video-Tutorial der HU Berlin.


Datenspeicherung und -archivierung

Wo speichere ich meine Daten im Arbeitsprozess (Backup)?

Die regelmäßige Sicherung der Daten im Arbeitsprozess ist angesichts möglicher technischer und menschlicher Fehler sehr wichtig. Sie obliegt der Verantwortung der Forschenden, die darin von der Infrastruktur der Universität unterstützt werden. Das ITS bietet folgende Backup-Lösungen:

  • Home-Verzeichnis: Mit Ihrem Nutzerkonto (UniAccount) hat das ITS automatisch einen persönlichen Speicherbereich für Sie angelegt, Ihr Home-Verzeichnis. Der einfachste und komfortabelste Weg der Nutzung besteht in der direkten Einbindung Ihres Home-Verzeichnisses in die Dateiverwaltung Ihres Arbeitsplatzrechners. Dateien, die Sie hier speichern, werden täglich durch das ITS gesichert.
  • Dokumentenmanagement: Mit Alfresco bietet Ihnen das ITS ein System an, mit dem Sie Ihre Daten versionieren und mit Metadaten versehen können. Alfresco ermöglicht eine Zugriffsverwaltung, sodass verschiedene Nutzer mit verschiednenen Rechten auf Daten zugreifen können.
  • Gruppenressourcen: Identisch mit dem Home-Laufwerk, jedoch ist eine Nutzung durch mehrere Personen, z.B. Projektmitglieder möglich.
  • Backup-Dienst: Das ITS bietet außerdem die regelmäßige automatisierte Sicherung von Daten auf Arbeitsplatzrechnern und Servern über das Backup- und Archivsystem Tivoli Storage Manager. Dieser Service bedarf ebenfalls der Beantragung.

Im Falle größeren Speicherplatzbedarfs insbesondere im Rahmen umfangreicherer Forschungsprojekte kontaktieren Sie bitte rechtzeitig das ITS, damit ein passendes Angebit entwickelt werden kann.

Diese Lösungen beziehen sich lediglich auf die (temporäre) Sicherung ihrer Arbeitsdateien und sind in Umfang und Funktion beschränkt. Sie können mit weiteren Speicheroptionen (wie externe Speichermedien) kombiniert werden. Für die Aufbewahrung der Daten entsprechend guter wissenschaftlicher Praxis ist dies nicht ausreichend. Vgl. hierzu (↗Wo archiviere ich meine Daten langfristig?)

Wie strukturiere ich meine Daten sinnvoll?

Im Arbeitsprozess entstehen oft nicht nur eine Vielzahl von Datensätzen, sondern durch verschiedene Modifizierungsstufen auch jeweilige Versionen. Mit Blick auf ein effizientes Arbeiten, koordinierte kollaborative Arbeitsprozesse, die langfristige Nachvollziehbarkeit und ggf. interne oder externe Nachnutzbarkeit empfiehlt sich die Festlegung spezifischer Konventionen zur Benennung und Versionierung von Datensätzen. Gegebenenfalls kann es zusätzlich sinnvoll sein, zusätzlich Ordnerstrukturen nach Prozessierungsgrad zu definieren. Die Konventionen sollten wiederum dokumentiert werden.

Namenskonventionen können abhängig von den Spezifika der Forschungsbereiche und Daten sehr unterschiedlich aussehen. Sie sollten widerspiegeln, um welche Art der Datendateien (Originaldaten / Rohdaten, bereinigte Dateien, Analysedateien) bzw. welche Dateiform (Arbeitsdatei, Ergebnisdatei etc.) es sich handelt. Diese Differenzierung kann auch über Versionierungskonventionen geschehen. Wichtig sind Einheitlichkeit, Eindeutigkeit und Aussagekraft .

Beispiele für sprechende Dateibenennungen sind etwa:

  • [Sediment]_[Probe]_[Instrument]_[YYYYMMDD].dat
  • [Experiment]_[Reagens]_[Instrument]_[YYYYMMDD].csv
  • [Experiment]_[Versuchsaufbau]_[Versuchsperson]_[YYYYMMDD].sav
  • [Beobachtung]_[Ort]_[YYYYMMDD].mp4
  • [Interviewpartner]_[Interviewer] ]_[YYYYMMDD].mp3

Um die Kompatibilität zwischen verschiedenen Betriebssystemen zu gewährleisten, sollte auf Sonderzeichen (außer Unter- und Bindestriche) sowie auf Umlaute verzichtet werden. Dateinamen sollten 21 Zeichen nicht überschreiten.

In den verschiedenen Modifikationsstadien (z.B. Originaldaten, bereinigte Daten, analysefähige Daten) sollten schreibgeschütze Versionen erstellt werden. Weitere Bearbeitungen sollten nur in Kopien dieser Master-Dateien vorgenommen werden.

Ein bekanntes Konzept der Versionierung , das auf dem DDI-Standard (Data Documentation Initiative) basiert, lautet:

Ausgehend von der Version "v1-0-0" werden dabei geändert:

1. die erste Stelle, wenn mehrere Fälle, Variablen, Wellen oder Sample hinzugefügt oder gelöscht wurden

2. die zweite Stellen, wenn Daten korrigiert werden, so dass die Analyse beeinflusst wird

3. die dritte Stelle, wenn einfache Überarbeitungen ohne Bedeutungsrelevanz vorgenommen werden

Konventionen sollten immer den fach- bzw. projektspezifischen Bedürfnissen angepasst werden. Stehen Versionen z.B. nicht in linearer Beziehung zueinander, können über spezielle Metadatenschemata (etwa das DataCite Metadata Schema) Beziehungen definiert werden ("IsDerivedBy", "IsSourceOf")

Versionierung kann auch durch entsprechende Software (z.B. Git) unterstützt werden.

Wo archiviere ich meine Daten langfristig?

Die Gute wissenschaftliche Praxis der DFG wie auch der Universität Kassel verlangen die Aufbewahrung von Forschungsdaten über mindestens 10 Jahre.

Am besten wird dies durch die Ablage der Daten in einem disziplinspezifischen oder -übergreifenden Forschungsdatenrepositorium gewährleistet. Einen guten Überblick über Forschungsdatenrepositorien bietet die von DataCite angebotene Registry of Research Data Repository (re3data).

Die Ablage in einem Repositorium ist nicht gleichbedeutend mit einer Veröffentlichung der Daten selbst (siehe hierzu ↗Bedeutet der Upload in ein Repositorium automatisch freien Zugriff für andere?)

Bedeutet der Upload in ein Repositorium automatisch freien Zugriff für andere?

Das Hochladen Ihrer Daten ist nicht mit dem freien Zugriff gleichzusetzen. Grundsätzlich können Sie Forschungsdaten auch verzögert publizieren oder lediglich die Metadaten zugänglich machen. Im Falle einer tatsächlichen Veröffentlichung können Sie über die Lizenz oder Verträge die Rechte auf Zugriff und Bearbeitung detailliert regeln (↗Kann ich die Nutzung meiner Daten dann überhaupt kontrollieren?). Diese Möglichkeiten können im Wesentlichen beschränkt werden durch:

  • die spezifische Anforderungen und Policies Ihrer Forschungsförderer und/oder Verleger
  • fehlende/begrenzte Rechte an den Daten
  • Datenschutzrechtliche Einschränkungen
  • Einschränkungen auf Seiten des Repositoriums


Datenpublikation

Warum sollte ich meine Daten veröffentlichen?

Die Veröffentlichung Ihrer Daten bietet für das Wissenschaftssystem, aber auch für Sie persönlich Vorteile.

Veröffentlichte Daten stehen zur Nachnutzung in neuen Kontexten, z.B. auch für interdisziplinäre Fragestellungen oder Meta-Analysen zur Verfügung. Hierdurch können nicht nur wissenschaftliche Mehrwerte geschaffen, sondern auch Doppelarbeit vermieden und Kosten gespart werden.

Durch die Vergabe von dauerhaften Identifikatoren sind Ihre Daten für Sie selbst und andere dauerhaft referenzierbar und zitierfähig. Dies ist eine Voraussetzung dafür, dass Datenpublikationen als eigenständige Leistung gewürdigt werden und ins wissenschaftlichen Reputationssystem Eingang finden können. Eine aktuelle Studie von Piwowar und Vision (2013) zeigt außerdem die höhere Zitationsrate von Publikationen, bei denen die zugrundeliegenden Forschungsdaten veröffentlicht wurden.

Nicht zuletzt erfüllt die Veröffentlichung in einigen Fällen schlicht die Anforderungen von Forschungsförderern oder Verlagen (↗Anforderungen)

Beachten Sie, dass es durchaus legitime Gründe geben kann, auf eine Veröffentlichung der eigenen Daten zu verzichten (↗Spricht etwas gegen eine Veröffentlichung?)

Wie kann ich Daten veröffentlichen?

Die Veröffentlichung Ihrer Daten kann auf verschiedenen Wegen geschehen:

  • Disziplinspezifische Datenrepositorien und –zentren (Wie finde ich ein passendes Repositorium?). Dies stellt in der Regel die beste Lösung dar.
  • Disziplinübergreifende Repositorien wie Zenodo, Dryad oder figshare (einen Vergleich der drei Repositorien finden Sie hier). Hierbei handelt es sich eher um eine mittelfristige Lösung, da die Langzeitarchivierung nicht gewährleistet ist.
  • Datensupplemente von Fachzeitschriften, z.B. bei Nature. Dies wird zunehmend gefordert, sollte aber mit Blick auf die Langzeitverfügbarkeit durch andere  Archivierungsstrategien ergänzt werden.

Im Rahmen des Landesprojekts “Hessische Forschungsdateninfrastrukturen” wird ein gesamthessisches Forschungsdatenrepositorium aufgebaut werden, das den Forschenden aller hessischen Universitäten zur Verfügung steht.

In Datenzeitschriften wie z.B. GigaScience, Earth System Science Data oder Journal of Chemical and Engineering Data (Listen von Data Journals #1, #2) werden keine Daten selbst, sondern deren Beschreibung– keine Interpretation – veröffentlicht (Dokumentation oder Data-Curation-Profiles). Dies trägt nicht zuletzt der Tatsache Rechnung, dass traditionelle Artikel für die – wichtige und wertvolle – Datenbeschreibung kaum Raum bieten.

Wie finde ich ein passendes Repositorium?

Es gibt sowohl fachspezifische bzw. thematische wie auch generische Repositorien. Fachrepositorien und -datenzentren (wie etwa Pangaea für geowissenschaftliche Daten, GenBank, Protein Data Bank) stellen nicht zuletzt mit Blick auf die Sichtbarkeit in der Fachcommunity aber auch hinsichtlich der Konformität zu fachspezifischen Standards häufig die erste Wahl dar. Eine Übersicht über Fachrepositorien bietet die Registry of research data repositories (re3data.org) sowie das Open Access Directory zu Forschungsdaten.

Darüber hinaus stehen fachübergreifende Repositorien für Forschungsdaten wie das EU-geförderte ZENODO, Dryad oder figshare zur Verfügung.

Bei der Entscheidung für ein bestimmtes Repositorium können Ihnen folgende Punkte helfen:

  • Handelt es sich um ein fachlich passendes Repositorium? Ist es etabliert und an spezifische Suchportale angebunden?
  • Bietet das Repositorium die gewünschten Services (PIDs, Open Access, differenzierte Zugriffsrechte (z.B. Nutzungsverträge), Realisierung von Embargo-Fristen)
  • Ist die Nachhaltigkeit des Repositorium gewährleistet? Gibt es eine Exit-Strategie bzw. eine Übereinkunft zur Erhaltung der Daten bei z.B. Wegfall der Finanzierung?
  • Wie sind Datenüberlassung und Datennutzung inhaltlich und formal geregelt?

Was muss ich bei der Einspeisung in ein Repositorium beachten?

Zunächst ist es wichtig, dass die Daten in einem geeigneten Format vorliegen. Einige Repositorien machen hier strengere Vorgaben, andere sprechen lediglich Empfehlungen aus oder sind offen für alle Formate. Umso wichtiger ist es, diesbezügliche Überlegungen bereits im Vorfeld der Forschung anzustellen (↗Wie erstelle ich einen Datenmanagementplan?) Allgemeine Hinweise und spezifische Links zu Formaten finden Sie unter ↗Welche Dateiformate sind sinnvoll?

Damit Daten gefunden und sinnvoll genutzt werden können, müssen sie durch Metadaten genauer dokumentiert sein. Beachten Sie hierzu bitte die detaillierten Hinweise unter ↗Was sind Metadaten, Metadatenschemata und Dokumentationen?

Ein Upload in ein Repositorium bedeutet nicht automatisch eine sofortige Veröffentlichung. Unter Umständen können Gründe für eine Embargo-Frist oder eine Teilveröffentlichung sprechen. Gerade in wirtschaftsnahen Forschungsdisziplinen sind Embargos für Forschungsergebnisse üblich. Bedenken Sie deshalb, ob gewichtige Gründe gegen eine sofortige Veröffentlichung sprechen. Siehe hierzu ↗Spricht etwas gegen eine Veröffentlichung?

Überlegen Sie außerdem, unter welchen Bedingungen Sie Ihre Daten veröffentlichen wollen. Hierzu existieren verschiedene Lizenzmodelle (↗Welche Lizenz soll ich wählen?)


Dokumentation und Formate

Welche Dateiformate sind sinnvoll?

Die Wahl des geeigneten Dateiformats ist insbesondere mit Blick auf langfristige Speicherung und Nutzung der Daten bedeutsam. Einige Eigenschaften sind dabei in der Regel gewünscht: Dateien/Formate sollten nicht verschlüsselt, nicht komprimiert, nicht proprietär/patentiert sein. Entsprechend werden offene, dokumentierte Standards bevorzugt. Beispielsweise werden in der Regel folgende Formate bevorzugt:

 

Empfohlenes Format

Weniger geeignet / ungeeignet

.odf, .rtf, .txt

.doc/.docx

ASCII, .csv, .tsv, .tab

.xls/.xlsx, .mdb, .accdb

.por (SPSS portable)

.sav (SPSS)

.wav, .flac

.mp3

.mp4

.mov, .avi, .wmv

.tiff, .jp2/.j2k/.jpx

.gif oder .jpg

RDF, .xml

RDBMS

pdf/a

pdf

Beispiele für Empfehlungen finden Sie etwa beim UK data Service, bei RADAR oder der HU Berlin.

Was sind Metadaten, Metadatenschemata und Dokumentationen?

Anhand von Metadaten werden Ressourcen, in diesem Fall Forschungsdaten, beschrieben, um ihre Auffindbarkeit zu optimieren. Zu den basalen Informationen gehören beispielsweise Titel, Autor/Primärforscher, Institution, Identifier, Ort & Zeitraum, Thema, Rechte, Dateinamen, Formate etc. Da diese Informationen für das Auffinden, das Verständnis und die Nutzung von Daten essentiell sind, sollen standardisierte Metadatenschemata eine möglichst einheitliche und nachvollziehbare Beschreibung sicherstellen.

Metadatenschemata sind Zusammenstellungen von Elementen zur Beschreibung von Daten. Einige Disziplinen verfügen bereits über spezifische Metadatenschemata, wie etwa

Vor Beginn der Dokumentation Ihrer Daten, bestenfalls bereits im Rahmen eines Datenmanagementplans, sollten Sie daher prüfen, ob für Ihre Disziplin bereits ein passendes Metadatenschema existiert. Informationen hierzu bietet z.B. das Digital Curation Center (DDC). Sollte kein fachspezifisches Schema zur Verfügung stehen, kann auch ein disziplinunabhängiges, wie etwa Dublin Core, MARC21 oder RADAR. genutzt werden.

Metadatenschemata legen also fest, welche Informationen geliefert werden sollen. Für eine bestmögliche Suche und Nutzung der Daten ist es darüber hinaus wichtig, diese Informationen in einem möglichst einheitlichen Format zu geben. Hierfür stehen eine Reihe disziplinspezifischer und –übergreifender sog. ‚kontrollierter Vokabulare‘, Thesauri, Klassifikationen und Normdaten zur Verfügung, wie etwa:

Einen Überblick über verschiedene Systeme bieten z.B. das Basel Register of Thesauri, Ontologies & Classifications (BARTOC) und Taxonomy Warehouse.

Eine Dokumentation geht in der Regel über die Beschreibung der Daten via Metadaten hinaus. Sie stellt eine tiefere (fachwissenschaftliche) Erschließung dar, in deren Rahmen z.B. Entstehungskontext, Variablen, Instrumente, Methoden etc. ausführlich beschrieben werden. In vielen Fällen ist eine solche Beschreibung unerlässlich, um die Daten verstehen, nachprüfen und ggf. nutzen zu können.

Einführungen ins Thema Metadaten bieten z.B. der JISC Guide oder der interaktive Mantra-Kurs der Universität Edinburgh.


Rechtliche Aspekte

Spricht etwas gegen eine Veröffentlichung?

Es gibt Konstellationen, unter denen eine Veröffentlichung der Daten nicht oder nur unter bestimmten Bedingungen erfolgen sollte. Wichtigste Voraussetzung für eine Veröffentlichung ist, dass Sie über das Recht hierzu verfügen (Wer darf über die Weitergabe und Veröffentlichung von  Daten entscheiden? Besitze ich das Urheberrecht an meinen Daten?).

Zum anderen kann es sich um vertrauliche, personenbezogene Daten handeln, die nur nach Anonymisierung oder mit Einverständnis der Betroffenen veröffentlicht werden dürfen (Welche datenschutzrechtlichen Beschränkungen muss ich beachten?).

Welche datenschutzrechtlichen Beschränkungen muss ich beachten?

Unter personenbezogenen Daten versteht man "Einzelangaben über persönliche oder sachliche Verhältnisse einer bestimmten oder bestimmbaren natürlichen Person" (§ 3 Abs. 1 BDSG). Sie unterliegen in ihrer Erhebung, Nutzung und Weitergabe strengen Vorgaben. Für die Archivierung, Bereitstellung und Veröffentlichung sollten Informationen, die einer bestimmten oder bestimmbaren Person zugeordnet werden können, aus den Forschungsdaten entfernt werden. Abhängig von den Daten eignen sich hier verschiedene Wege der Anonymisierung.

Anleitungen finden Sie beim ForschungsdatenZentrum Bildung. Darüber hinaus existieren verschiedene Werkzeuge zur Anonymisierung von Daten wie ARX, μ-ARGUS, sdc-micro oder das Anonymisierungstool der TMF.

Sollen personenbezogene Daten verarbeitet werden, muss in dere Regel die Einwilligung der betroffenen Person eingeholt werden. Hierbei muss u.a. der Zweck klar definiert werden und die betroffene Person die Folgen abschätzen können

Darüber hinaus können Forschungsdaten wie etwa Unternehmensdaten vertrauliche Informationen enthalten (Know-How-Schutz) oder Vertraulichkeits- und Geheimhaltungsvereinbarungen getroffen worden sein, die eine Veröffentlichung ausschließen.

Wer darf über die Weitergabe und Veröffentlichung von Daten entscheiden?

 

Mögliche Besitzer oder Mitbesitzer der Rechte an den Daten sind die Forschenden, der Arbeitgeber, der Auftraggeber, Forschungsförderer und/oder (privatwirtschaftliche) Vertragspartner. Wer über die Weiterhabe oder Veröffentlichung von Forschungsdaten mitentscheiden darf oder gefragt werden muss, bestimmt sich über die Vertragsverhältnisse. Üblicherweise sind Ergebnisse weisungsgebundener Forschung Eigentum des Arbeit- bzw. Geldgebers. Anders verhält es sich bei eigener Forschung, über deren Daten Forschende selbst bestimmen dürfen.

Besitze ich das Urheberrecht an meinen Daten?

Forschungsobjekte und vereinzelt auch Forschungsdaten können als Werk im Sinne des Urhebergesetzes geschützt sein. Das können sein Sprachwerke, Computerprogramme, Musikwerke, Pantomimische Werke einschließlich Werke der Tanzkunst, Werke der bildenden Künste einschließlich der Werke der Baukunst und der angewandten Kunst, Lichtbildwerke, Filmwerke und Darstellungen wissenschaftlicher und technischer Art. 

In der Regel fehlt Forschungsdaten aber die notwendige Schöpfungshöhe und sie sind keine Werke. In Betracht kommt aber, dass bestimmte Arten von Forschungsdaten unter ein Leistungsschutzrecht fallen, zum Beispiel Lichtbilder, Laufbilder oder Tonträger.

Oft sind die Forschungsdaten eines Forschungsvorhabens aber als Teil eines Datenbankwerks urheberrechtlich geschützt oder fallen unter den leistungsrechtsschutz für Datenbanken.

Forschungsdaten, die nicht unter ein Schutzrecht fallen, können in der Regel von jedermann ohne eine Genehmigung oder Zahlungsverpflichtung zu jedem beliebigen Zweck verwendet werden.

Kann ich die Nutzung meiner Daten dann überhaupt kontrollieren?

 

Sofern Sie ein Urheberecht oder Leistungsschutzrecht über Forschungsdaten besitzen, können Sie verschiedene Aspekte der Nutzung über entsprechende Verträge regulieren, wie etwa Art und Weise der Nutzung, Nutzergruppen und –zeitraum, Zweck etc. Da vertragliche Einzelfallregelungen praktisch sehr aufwändig wären, existieren verschiedene Lösungen der standardisierten Regelungen von Nutzungsrechten. So bietet beispielsweise das Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID) Standardverträge für die Nutzung der psychologischen Daten und GESIS regelt über Nutzungsverträge die Zugangsbeschränkungen für besonders sensible sozialwissenschaftliche Daten. Wenn Ihre Daten keiner spezifischen Zugriffs- oder Nutzungsbeschränkung unterliegen sollen, bietet sich die Verwendung standardisierter Lizenzen wie Creative Commons oder Open Data Commons an (↗Welche Lizenz soll ich wählen?).

Welche Lizenz soll ich wählen?

Die Veröffentlichung von Daten unter einer bestimmten Lizenz erlaubt eine detaillierte Festlegung der zulässigen Form ihrer Nutzung. Sie schaffen Rechtssicherheit sowohl auf Seiten der bereitstellenden als auch der nutzenden Person. Auch bei dem Verzicht auf jegliche Beschränkungen ist es daher wichtig, diesen zu formulieren.

Wenngleich Daten selbst in der Regel nicht dem Urheberrecht unterliegen, spricht doch einiges dafür, sie als potentiell schützenswert zu behandeln, nicht zuletzt um den eigenen Vorstellungen der Weiternutzung Ausdruck zu verleihen. Hierfür bieten sich verschiedene Lizenzmodelle an. Das verbreitetste unter ihnen ist ‚Creative Commons‘ (CC). CC-Lizenzen sind unabhängig vom lizenzierten Inhalt und decken Urheberrechte, Leistungsschutzrechte und in der aktuellen Version – sofern existent – auch Datenbankherstellerrecht ab.

Speziell für die Veröffentlichung von Daten ist das Lizenz-Paket ‚Open Data Commons‘ der Open Knowledge International (ehemals Open Knowledge Foundation) konzipiert worden. Neben der bedingungslosen Lizenz (Open Data Commons Public Domain Dedication and License (PDDL)) bietet es drei weitere Modelle:

Unabhängig von Ihrer rechtlichen Verbindlichkeit erfüllt die Lizenz CC-BY die Idee von Open Access und Open Science sicherlich am ehesten, wogegen die ‚Weitergabe unter gleichen Bedingungen‘ zu Kompatibilitätsproblemen mit anderen Lizenzen, das Verbot von Bearbeitung zu Einschränkungen bei Nutzung durch z.B. Data-Mining oder auch zu Problemen bei der Langzeitarchivierung führen kann. Das Verbot kommerzieller Nutzung erschwert die Verwendung in kommerziellen Datenbanken und reduziert damit potentiell die Sichtbarkeit Ihrer Forschung (für Details vgl. Paul Klimpel, 2012).

Welche Lizenz Sie auch wählen – Sie sollten eine bewusste und informierte Entscheidung treffen.
Eine ausführlichere Auseinandersetzung mit der Thematik finden Sie bei Andreas Wiebe &  Lucie Guibault (2013).

Unabhängig von den Nutzungsbedingungen gelten selbstverständlich die Regeln guter Wissenschaftlicher Praxis, die eine Angabe der Quelle verwendeter Daten fordern.


Finden und Nutzen von Forschungsdaten

Wo finde ich Forschungsdaten?

Nicht zuletzt durch die Vorgaben und Empfehlungen von Förderern, Verlagen und Institutionen zur Zugänglichmachung von Daten stehen zunehmend Forschungsdaten für die Nachnutzung zur Verfügung. Um geeignete Forschungsdaten für den eigenen Forschungsbereich zu finden,  bieten oft einschlägige Angebote aus dem eigenen Fachgebiet die erste Anlaufstelle. Dies können institutionelle oder fachliche Repositorien oder auch Datenjournale sein. Repositorien finden Sie – nach Fachgebiet aufgeschlüsselt – unter re3data. Eine – längst nicht erschöpfende – Liste von Datenjournalen finden Sie hier.

Darüber hinaus besteht auch die Möglichkeit, Daten über generische Suchdienste zu recherchieren. Ein großer Nachteil dieser Suchdienste besteht darin, dass sie die detaillierten Metadatenschemata ihrer Quellen oft nicht adäquat abbilden können. Zudem unterscheiden sich die die jeweiligen Metadaten stark dahingehend, was sie indentifizieren, also einzelne Daten, Datensets oder –Sammlungen.

Drei bekannte Suchdienste sind

  • EUDAT B2 Find
    • Durchsucht Metadaten aus verschiedenen  Quellen wie CLARIN oder Global GBIF.

  • DataCite Metadata Search
    • Durchsucht Metadaten von Informationsobjekten, u.a. Forschungsdaten (Objekttyp ‚Dataset‘), die bei DataCite mit DOIs registriert sind. Die Metadaten werden z.T. auch von den anderen beiden Diensten abgefragt.

Für die Nachnutzung selbst sind die jeweiligen Rechte (Lizenzen, ggf. Nutzungsverträge) bindend. Sie können u.a. festlegen, wer die Daten zu welchem Zweck und für welche Zeit nutzen darf.

Wie zitiere ich Forschungsdaten?

Um die (Nach-)Nutzung von eigenen und fremden Forschungsdaten im Sinne der Guten Wissenschaftlichen Praxis adäquat zu dokumentieren, ist eine korrekte Datenzitation unerlässlich.

Im Falle von Fremddaten wird hierdurch außerdem die wissenschaftliche Leistung ihrer ‚Urheber‘ gewürdigt. Wie bei der Zitation von anderen Publikationen können die Konventionen zur Zitation von Daten formal abweichen. Inhaltlich verbindet sie jedoch der Anspruch einer eindeutigen Identifizierbarkeit der Datenquelle. Die FORCE11 Data Citation Synthesis Group hat Empfehlungen zur Datenzitation erarbeitet. Ihnen zufolge umfasst eine vollständige Datenzitation

Autor(en), Jahr, Titel der Forschungsdaten, Datenrepositorium oder Archiv, Version, weltweit Persistenter Identifikator

Weitere optionale Angaben, die im Rahmen einer Zitation sinnvoll sein können, sind Edition, Feature name and URI, Resource type, Publisher, Unique numeric fingerprint (UNF) und Location (vgl. Alex Ball & Monica Duke (2015). How to Cite Datasets and Link to Publications).


Support

Wo bekomme ich Unterstützung?

Die Universität Kassel arbeitet daran, ein Team aus Ansprechpartnern für die verschiedenen Herausforderungen des Forschungsdatenmanagements  zu stellen. In dieser Aufbauphase können wir den geplanten Support-Umfang noch nicht voll leisten, stehen aber bereits mit themenspezifischen Ansprechpersonen bereit.

 

 

 


Sofern nicht anderweitig gekennzeichnet sind alle Texte dieser Seite und ihrer Unterseiten lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.