FAQ – häufig gestellte Fragen
Inhalt
- Informationsquellen zum Forschungsdatenmanagement
- Einführung und Hintergründe
- Struktur, Formate und Dokumentation
- Datenpublikation
- Rechtliche Aspekte
- Warum sind rechtliche Fragen beim Forschungsdatenmanagement wichtig?
- Welche rechtlichen Grundlagen gelten für Forschungsdaten?
- Was sind personenbezogene Daten – und darf ich sie speichern oder weitergeben?
- Finden und Nutzen von Forschungsdaten
Einführung und Hintergründe
Forschungsdaten sind alle Daten, die im Laufe eines wissenschaftlichen Prozesses erzeugt, bearbeitet oder genutzt werden oder dessen Ergebnis sind. Forschungsdaten können je nach Wissenschaftsdisziplin in unterschiedlichen Formaten vorliegen.
Forschungsdatenmanagement ist der Prozess, in dem die Erzeugung, Verwaltung und Sicherung dieser Daten beschrieben bzw. geplant wird. Es umfasst alle Bereiche der Datenverwaltung, insbesondere die Planung der Datenerhebung, die Erzeugung und Aufbereitung der Daten, die Datenintegrität, ihre Dokumentation und nachhaltige Aufbewahrung sowie die Zugänglichmachung der Daten. Entwickelt und dokumentiert wird dieser Prozess mit Hilfe eines Datenmanagementplans, der Teil eines jeden Forschungsvorhabens ist bzw. sein sollte.
Der Datenmanagementplan ist ein „lebendes Dokument“, das zunächst das zentrale Planungswerkzeug für das Datenmanagement im Forschungsprojekt darstellt und sich im Projektverlauf zum Projektdokumentationswerkzeug entwickelt.
Ein gutes Forschungsdatenmanagement (FDM) ist die Grundlage für vertrauenswürdige, transparente und nachhaltige Forschung. Es unterstützt Forschende dabei, ihre Ergebnisse langfristig nachvollziehbar, sicher und nachnutzbar zu machen.
FDM hilft dabei, …
- Datenverlust zu vermeiden: Durch regelmäßige Backups, redundante Speicherorte und die Nutzung geeigneter Dateiformate bleibt Ihre Arbeit langfristig gesichert.
- Missbrauch und Fehlinterpretationen zu verhindern: Eine strukturierte Dokumentation und klare Zugriffsregeln gewährleisten Datenintegrität und Verantwortlichkeit.
- Nachvollziehbarkeit und Nachnutzung zu ermöglichen: Gute Dokumentation und aussagekräftige Metadaten stellen sicher, dass auch andere Forschende Ihre Daten korrekt verstehen und weiterverwenden können.
Ein systematisches FDM beginnt bereits in der Planungsphase eines Projekts. Wer frühzeitig festlegt, wie Daten erhoben, beschrieben, gespeichert und geteilt werden, profitiert von effizienteren Arbeitsprozessen, besserer Auffindbarkeit und höheren Chancen auf Anschlussforschung.
Darüber hinaus ist FDM heute oft verpflichtend: Forschungsförderer, Hochschulen und Fachzeitschriften verlangen zunehmend Datenmanagementpläne oder Nachweise zur Datenverfügbarkeit. Prüfen Sie daher die spezifischen Anforderungen Ihres Fachs, Ihrer Institution oder Ihres Drittmittelgeber, Informationen finden Sie u.a. hier:
Forschungsdaten-Leitlinie der Uni Kassel
DFG-Kodex: Leitlinien zur Sicherung guter wissenschaftlicher Praxis (Stand: September 2024 / korrigierte Version 1.2)
Struktur, Formate und Dokumentation
Im Arbeitsprozess entstehen oft nicht nur eine Vielzahl von Datensätzen, sondern durch verschiedene Modifizierungsstufen auch jeweilige Versionen. Mit Blick auf ein effizientes Arbeiten, koordinierte kollaborative Arbeitsprozesse, die langfristige Nachvollziehbarkeit und ggf. interne oder externe Nachnutzbarkeit empfiehlt sich die Festlegung spezifischer Konventionen zur Benennung und Versionierung von Datensätzen. Gegebenenfalls kann es sinnvoll sein, zusätzlich Ordnerstrukturen nach Prozessierungsgrad zu definieren. Die Konventionen sollten wiederum dokumentiert werden.
Namenskonventionen können abhängig von den Spezifika der Forschungsbereiche und Daten sehr unterschiedlich aussehen. Sie sollten widerspiegeln, um welche Art der Datendateien (Originaldaten / Rohdaten, bereinigte Dateien, Analysedateien) bzw. welche Dateiform (Arbeitsdatei, Ergebnisdatei etc.) es sich handelt. Diese Differenzierung kann auch über Versionierungskonventionen geschehen. Wichtig sind Einheitlichkeit, Eindeutigkeit und Aussagekraft .
Beispiele für sprechende Dateibenennungen sind etwa:
- [Sediment]_[Probe]_[Instrument]_[YYYYMMDD].dat
- [Experiment]_[Reagens]_[Instrument]_[YYYYMMDD].csv
- [Experiment]_[Versuchsaufbau]_[Versuchsperson]_[YYYYMMDD].sav
- [Beobachtung]_[Ort]_[YYYYMMDD].mp4
- [Interviewpartner]_[Interviewer] ]_[YYYYMMDD].mp3
Um die Kompatibilität zwischen verschiedenen Betriebssystemen zu gewährleisten, sollte auf Sonderzeichen (außer Unter- und Bindestriche) sowie auf Umlaute verzichtet werden.
In den verschiedenen Modifikationsstadien (z.B. Originaldaten, bereinigte Daten, analysefähige Daten) sollten schreibgeschützeVersionen erstellt werden. Weitere Bearbeitungen sollten nur in Kopien dieser Master-Dateien vorgenommen werden.
Ein bekanntes Konzept der Versionierung , das auf dem DDI-Standard (Data Documentation Initiative) basiert, lautet:
- Major.Minor.Revision (vgl. Gesis - Leitlinien)
Ausgehend von der Version "v1-0-0" werden dabei geändert:
1. die erste Stelle, wenn mehrere Fälle, Variablen, Wellen oder Sample hinzugefügt oder gelöscht wurden
2. die zweite Stellen, wenn Daten korrigiert werden, so dass die Analyse beeinflusst wird
3. die dritte Stelle, wenn einfache Überarbeitungen ohne Bedeutungsrelevanz vorgenommen werden
Konventionen sollten immer den fach- bzw. projektspezifischen Bedürfnissen angepasst werden. Stehen Versionen z.B. nicht in linearer Beziehung zueinander, können über spezielle Metadatenschemata (etwa das DataCite Metadata Schema) Beziehungen definiert werden ("IsDerivedBy", "IsSourceOf")
Versionierung kann auch durch entsprechende Software (z.B. Git) unterstützt werden.
Eine Datenpublikation entfaltet ihr volles Potential, wenn die Forschungsdaten in Dateiformaten veröffentlicht werden, die zum einen eine möglichst uneingeschränkte Nachnutzung erlauben und zum anderen möglichst langzeitstabil sind. Aus beiden Gesichtspunkten werden offene, nicht-proprietäre Dateiformate empfohlen: Offene Dateiformate können von verschiedenen Programmen gelesen werden und sind nicht von einer bestimmten Software abhängig, so dass eine Nachnutzung in unterschiedlichen IT-Umgebungen (etwa Betriebssysteme, Softwarelizenzen, gängige Programme) möglich ist.
Diese Übersicht über geeignete Dateiformate empfiehlt in diesem Sinne konkrete Dateiformate für die Datenpublikation.
Anhand von Metadaten werden Ressourcen, in diesem Fall Forschungsdaten, beschrieben, um ihre Auffindbarkeit zu optimieren. Zu den basalen Informationen gehören beispielsweise Titel, Autor/Primärforscher, Institution, Identifier, Ort & Zeitraum, Thema, Rechte, Dateinamen, Formate etc. Da diese Informationen für das Auffinden, das Verständnis und die Nutzung von Daten essentiell sind, sollen standardisierte Metadatenschemata eine möglichst einheitliche und nachvollziehbare Beschreibung sicherstellen.
Metadatenschemata sind Zusammenstellungen von Elementen zur Beschreibung von Daten. Einige Disziplinen verfügen bereits über spezifische Metadatenschemata, wie etwa
- Geisteswissenschaften: Text Encoding Intitiative (TEI)
- Geowissenschaften: ISO 19115, Darwin Core
- Naturwissenschaften: ICAT Schema, Cristallographic Information Framework, conventions for Climate and Forecast metadata
- Sozial- und Wirtschaftswissenschaften: Digital Documentation Initiative (DDI)
Vor Beginn der Dokumentation Ihrer Daten, bestenfalls bereits im Rahmen eines Datenmanagementplans, sollten Sie daher prüfen, ob für Ihre Disziplin bereits ein passendes Metadatenschema existiert. Informationen hierzu bietet z.B. das Digital Curation Center (DDC). Sollte kein fachspezifisches Schema zur Verfügung stehen, kann auch ein disziplinunabhängiges, wie etwa Dublin Core, MARC21 oder RADAR. genutzt werden.
Metadatenschemata legen also fest, welche Informationen geliefert werden sollen. Für eine bestmögliche Suche und Nutzung der Daten ist es darüber hinaus wichtig, diese Informationen in einem möglichst einheitlichen Format zu geben. Hierfür stehen eine Reihe disziplinspezifischer und –übergreifender sog. ‚kontrollierter Vokabulare‘, Thesauri, Klassifikationen und Normdaten zur Verfügung, wie etwa:
- Standards zur eindeutigen Identifikation von Personen wie Open Researcher and Contributor ID (ORCID) oder International Standard Name Identifier (ISNI, ISO 27729)
- Klassifikationssysteme für Fachgebieten (z.B. DDC oder LCC)
- Fachinterne Klassifikationen wie etwa die Mathematics Subject Classification (MSC) oder die Klassifikation Sozialwissenschaften.
- Fachspezifische Thesauri wie der Thesaurus Sozialwissenschaften (TheSoz), der Standard Thesaurus Wirtschaft (STW) oder die Getty Vocabularies (AAT, TGB, CONA, ULAN).
Einen Überblick über verschiedene Systeme bieten z.B. das Basel Register of Thesauri, Ontologies & Classifications (BARTOC) und Taxonomy Warehouse.
Eine Dokumentation geht in der Regel über die Beschreibung der Daten via Metadaten hinaus. Sie stellt eine tiefere (fachwissenschaftliche) Erschließung dar, in deren Rahmen z.B. Entstehungskontext, Variablen, Instrumente, Methoden etc. ausführlich beschrieben werden. In vielen Fällen ist eine solche Beschreibung unerlässlich, um die Daten verstehen, nachprüfen und ggf. nutzen zu können.
Einführungen ins Thema Metadaten bieten z.B. der JISC Guide oder der interaktive Mantra-Kurs der Universität Edinburgh.
Datenpublikation
Die Veröffentlichung Ihrer Daten bietet für das Wissenschaftssystem, aber auch für Sie persönlich Vorteile.
Veröffentlichte Daten stehen zur Nachnutzung in neuen Kontexten, z.B. auch für interdisziplinäre Fragestellungen oder Meta-Analysen zur Verfügung. Hierdurch können nicht nur wissenschaftliche Mehrwerte geschaffen, sondern auch Doppelarbeit vermieden und Kosten gespart werden.
Durch die Vergabe von dauerhaften Identifikatoren sind Ihre Daten für Sie selbst und andere dauerhaft referenzierbar und zitierfähig. Dies ist eine Voraussetzung dafür, dass Datenpublikationen als eigenständige Leistung gewürdigt werden und ins wissenschaftlichen Reputationssystem Eingang finden können. Eine Studie von Piwowar und Vision (2013) zeigt außerdem die höhere Zitationsrate von Publikationen, bei denen die zugrunde liegenden Forschungsdaten veröffentlicht wurden.
Nicht zuletzt erfüllt die Veröffentlichung in einigen Fällen schlicht Anforderungen Dritter. Neben den Anforderungen von Forschungsförderern fordern auch Publikationsdienstleister vermehrt die Bereitstellung derjenigen Forschungsdaten, die einer Publikation zugrunde liegen. Einige Beispiele für solche Vorgaben sind:
- Public Library of Science (PLOS): Data Availability Policy / Materials and Software Sharing Policy
- Nature Publishing Group: Availability of Data, Material and Methods Policy
- Science: Data and Code Deposition
- BioMed Central: Availability of supporting data
- Elsevier: Research data Policy und Text and Data Mining Policy
Die Veröffentlichung Ihrer Daten kann auf verschiedenen Wegen geschehen:
- Disziplinspezifische Datenrepositorien und –zentren (↗Wie finde ich ein passendes Repositorium?). Dies stellt in der Regel die beste Lösung dar.
- Disziplinübergreifende Repositorien wie Zenodo, Dryad oder figshare. Diese Repositorien bieten meistens eine sogenannte Bitstream-Preservation, d. h. die Dateien werden aufbewahrt, wie sie sind, aber nicht nach archivischen Standards gepflegt (z. B. auf neuere Dateiformate aktualisiert). Disziplinübergreifend steht auch das Repositorium der Universität Kassel zur Verfügung (siehe hierzu "Daten archivieren und publizieren").
- Datensupplemente von Fachzeitschriften, z. B. bei Nature. Teilweise werden bei einer Veröffentlichung als Supplement die Rechte an den Daten an die Verlage übertragen (je nach Veröffentlichungsvertrag).
In Datenzeitschriften wie z.B. GigaScience, Earth System Science Data oder Journal of Chemical and Engineering Data (Liste von Data Journals) werden keine Daten selbst, sondern deren Beschreibung– keine Interpretation – veröffentlicht (Dokumentation oder Data-Curation-Profiles). Dies trägt nicht zuletzt der Tatsache Rechnung, dass traditionelle Artikel für die – wichtige und wertvolle – Datenbeschreibung kaum Raum bieten.
Es gibt sowohl fachspezifische bzw. thematische wie auch generische Repositorien. Fachrepositorien und -datenzentren (wie etwa Pangaea für geowissenschaftliche Daten, GenBank, Protein Data Bank) stellen nicht zuletzt mit Blick auf die Sichtbarkeit in der Fachcommunity aber auch hinsichtlich der Konformität zu fachspezifischen Standards häufig die erste Wahl dar. Eine Übersicht über Fachrepositorien bietet die Registry of research data repositories (re3data.org) sowie das Open Access Directory zu Forschungsdaten. Eine gezielte Suche nach Fachrepositorien, die auch eine Datenablage erlauben, bietet der auf re3data basierende Repository Finder.
Bei der Entscheidung für ein bestimmtes Repositorium können Ihnen folgende Punkte helfen:
- Handelt es sich um ein fachlich passendes Repositorium? Ist es etabliert und an spezifische Suchportale angebunden?
- Bietet das Repositorium die gewünschten Services (PIDs, Open Access, differenzierte Zugriffsrechte (z. B. Nutzungsverträge), Realisierung von Embargo-Fristen)?
- Ist die Nachhaltigkeit des Repositoriums gewährleistet? Gibt es eine Exit-Strategie bzw. eine Übereinkunft zur Erhaltung der Daten bei z. B. Wegfall der Finanzierung?
- Wie sind Datenüberlassung und Datennutzung inhaltlich und formal geregelt?
Die Universität Kassel stellt außerdem allen Forschenden, die kein fachspezifisches Repositorium nutzen können oder möchten, ein institutionelles Repositorium (DaKS) zur Verfügung, das sowohl die Funktion der Archivierung als auch der Publikation erfüllt (siehe auch "Daten archivieren und publizieren"). Dieses kann auch für studentische Projekte und Abschlussarbeiten genutzt werden
Darüber hinaus stehen fachübergreifende Repositorien für Forschungsdaten wie das EU-geförderte ZENODO, Dryad oder figshare zur Verfügung.
Zunächst ist es wichtig, dass die Daten in einem geeigneten Format vorliegen. Einige Repositorien machen hier strengere Vorgaben, andere sprechen lediglich Empfehlungen aus oder sind offen für alle Formate. Umso wichtiger ist es, diesbezügliche Überlegungen bereits im Vorfeld der Forschung anzustellen. Allgemeine Hinweise und spezifische Links zu Formaten finden Sie unter ↗Welche Dateiformate sind sinnvoll?
Damit Daten gefunden und sinnvoll genutzt werden können, müssen sie durch Metadaten genauer dokumentiert sein. Beachten Sie hierzu bitte die detaillierten Hinweise unter ↗Was sind Metadaten, Metadatenschemata und Dokumentationen?
Ein Upload in ein Repositorium bedeutet nicht automatisch eine sofortige Veröffentlichung. Unter Umständen können Gründe für eine Embargo-Frist oder eine Teilveröffentlichung sprechen. Gerade in wirtschaftsnahen Forschungsdisziplinen sind Embargos für Forschungsergebnisse üblich. Bedenken Sie deshalb, ob gewichtige Gründe gegen eine sofortige Veröffentlichung sprechen. Siehe hierzu ↗Spricht etwas gegen eine Veröffentlichung?
Überlegen Sie außerdem, unter welchen Bedingungen Sie Ihre Daten veröffentlichen wollen. Hierzu existieren verschiedene Lizenzmodelle (↗Welche Lizenz soll ich wählen?).
In vielen Repositorien durchlaufen Ihre Datensätze eine Kuration, bevor sie veröffentlicht bzw. im Repositorium angenommen werden. Dabei werden u. a. die oben genannten Aspekte überprüft und Sie erhalten möglicherweise Verbesserungsvorschläge oder Vorgaben. Einen Überblick über die Kuration in DaKS bietet die Publikation "Kurationsempfehlungen für HeFDI-Repositorien".
Das Hochladen Ihrer Daten ist nicht mit dem freien Zugriff gleichzusetzen. Grundsätzlich können Sie Forschungsdaten auch verzögert publizieren oder lediglich die Metadaten zugänglich machen. Im Falle einer tatsächlichen Veröffentlichung können Sie über die Lizenz oder Verträge die Rechte auf Zugriff und Bearbeitung detailliert regeln (↗Kann ich die Nutzung meiner Daten dann überhaupt kontrollieren?). Diese Möglichkeiten können im Wesentlichen beschränkt werden durch:
- die spezifische Anforderungen und Policies Ihrer Forschungsförderer und/oder Verleger
- fehlende/begrenzte Rechte an den Daten
- Datenschutzrechtliche Einschränkungen
- Einschränkungen auf Seiten des Repositoriums
Es gibt Konstellationen, unter denen eine Veröffentlichung der Daten nicht oder nur unter bestimmten Bedingungen erfolgen sollte. Wichtigste Voraussetzung für eine Veröffentlichung ist, dass Sie über das Recht hierzu verfügen (↗Wer darf über die Weitergabe und Veröffentlichung von Daten entscheiden? ↗Besitze ich das Urheberrecht an meinen Daten?).
Zum anderen kann es sich um vertrauliche, personenbezogene Daten handeln, die nur nach Anonymisierung oder mit Einverständnis der Betroffenen veröffentlicht werden dürfen (↗Welche datenschutzrechtlichen Beschränkungen muss ich beachten?).
Rechtliche Aspekte
Rechtliche Fragen helfen, Missverständnisse und Konflikte zu vermeiden. Wer früh klärt, wie mit den Daten verfahren werden darf, beispielsweise was in welcher Form veröffentlicht werden darf, spart später viel Aufwand. Besondere Aufmerksamkeit kommt hierbei dem Datenschutz zu, die Einhaltung der DSGVO ist unumgänglich.
Es gelten vor allem das Urheberrecht und die Datenschutz-Grundverordnung (DSGVO), jedoch können im Einzelfall viele weitere Gebiete betroffen sein (Patentrecht, das sogenannte Nagoya-Protokoll, Lizenzrechte u.v.m.). Dazu kommen ggf. Regeln aus Hochschul- oder Förderverträgen, sowie Kooperationsverträge. Diese Gesetze und vertraglichen Bestimmungen bestimmen, wer welche Daten nutzen oder weitergeben darf. Bei Unsicherheiten helfen der Forschungsdaten-Service, die Datenschutzbeauftragten oder das juristische Fachpersonal der Universität.
Datenschutz-Grundverordnung (DSGVO)
Juristisches Fachpersonal der Universität Kassel
Personenbezogene Daten sind Informationen, die sich auf eine Person beziehen, z. B. Name, Stimme, Adresse sowie ganze Interviews oder Gruppenbeobachtungen. Solche Daten dürfen nur unter Auflagen verarbeitet werden. Es muss eine rechtliche Grundlage bestehen, meist durch eine informierte Einwilligung. Vor der Weitergabe müssen sie in der Regel anonymisiert oder pseudonymisiert werden. Bei sogenannten besonderen kategorien personenbezogener Daten (u.A. ethnische Herkunft, politische Überzegungen, biologische Proben) oder falls vulnerable Gruppen wie Schulkinder betroffen sind, muss auch die Ethikkommission einbezogen werden. Außerdem muss immer ein sogenanntes Verzeichnis der Verarbeitungstätigkeiten erstellt werden, bei dem auch die technische Sicherheit der Daten in den Blick genommen wird. Hierbei unterstützen die Datenschutzbeauftragten der Universität.
Datenschutzbauftragte der Universität Kassel
Ethikkommissionen der Universität Kassel
Mögliche Besitzer oder Mitbesitzer der Rechte an den Daten sind die Forschenden, der Arbeitgeber, der Auftraggeber, Forschungsförderer und/oder (privatwirtschaftliche) Vertragspartner. Wer über die Weitergabe oder Veröffentlichung von Forschungsdaten mitentscheiden darf oder gefragt werden muss, bestimmt sich über die Vertragsverhältnisse. Üblicherweise sind Ergebnisse weisungsgebundener Forschung Eigentum des Arbeit- bzw. Geldgebers. Anders verhält es sich bei eigener Forschung, über deren Daten Forschende selbst bestimmen dürfen. Zudem gibt es Ausnahmen, bei denen nicht frei entschieden werden darf, z.B.: personenbezogene Daten, Daten die der Exportkontrolle unterliegen, Geschäftsgeheimnisse oder Standorte von gefährdeten Arten.
Forschungsobjekte und vereinzelt auch Forschungsdaten können als Werk im Sinne des Urhebergesetzes geschützt sein. Das können sein Sprachwerke, Computerprogramme, Musikwerke, Pantomimische Werke einschließlich Werke der Tanzkunst, Werke der bildenden Künste einschließlich der Werke der Baukunst und der angewandten Kunst, Lichtbildwerke, Filmwerke und Darstellungen wissenschaftlicher und technischer Art.
In der Regel fehlt Forschungsdaten aber die notwendige Schöpfungshöhe und sie sind keine Werke. In Betracht kommt aber, dass bestimmte Arten von Forschungsdaten unter ein Leistungsschutzrecht fallen, zum Beispiel Lichtbilder, Laufbilder oder Tonträger.
Oft sind die Forschungsdaten eines Forschungsvorhabens aber als Teil eines Datenbankwerks urheberrechtlich geschützt oder fallen unter das Leistungsschutzrecht für Datenbanken.
Forschungsdaten, die nicht unter ein Schutzrecht fallen, können in der Regel von jedermann ohne eine Genehmigung oder Zahlungsverpflichtung zu jedem beliebigen Zweck verwendet werden.
Wichtig ist, dass dabei trotzdem die Verpflichtung zur Offenlegung der Herkunft und zur korrekten Zitation besteht.
Zuerst sei gesagt, dass unabhängig davon, ob Urheber- oder andere Rechte an den Daten überhaupt bestehen, es nach der guten wissenschaftlichen Praxis die Pflicht jeder Person, die Daten anderer nachnutzt ist, die Herkunft der Daten transparent darzulegen und Sie entsprechend zu zitieren.
Darüber hinaus gilt: Sofern Sie ein Urheberecht oder Leistungsschutzrecht über Forschungsdaten besitzen, können Sie verschiedene Aspekte der Nutzung über entsprechende Verträge regulieren, wie etwa Art und Weise der Nutzung, Nutzergruppen und –zeitraum, Zweck etc. Da vertragliche Einzelfallregelungen praktisch sehr aufwendig wären, existieren verschiedene Lösungen der standardisierten Regelungen von Nutzungsrechten. So bietet beispielsweise das Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID) Standardverträge für die Nutzung der psychologischen Daten und GESIS regelt über Nutzungsverträge die Zugangsbeschränkungen für besonders sensible sozialwissenschaftliche Daten. Wenn Ihre Daten keiner spezifischen Zugriffs- oder Nutzungsbeschränkung unterliegen sollen, bietet sich die Verwendung standardisierter Lizenzen wie Creative Commons oder Open Data Commons an.
Die Veröffentlichung von Daten unter einer bestimmten Lizenz erlaubt eine detaillierte Festlegung der zulässigen Form ihrer Nutzung. Sie schaffen Rechtssicherheit sowohl auf Seiten der bereitstellenden als auch der nutzenden Person. Auch bei dem Verzicht auf jegliche Beschränkungen ist es daher wichtig, diesen zu formulieren.
Wenngleich Daten selbst in der Regel nicht dem Urheberrecht unterliegen, spricht doch einiges dafür, sie als potentiell schützenswert zu behandeln, nicht zuletzt um den eigenen Vorstellungen der Weiternutzung Ausdruck zu verleihen. Hierfür bieten sich verschiedene Lizenzmodelle an. Das verbreitetste unter ihnen ist ‚Creative Commons‘ (CC). CC-Lizenzen sind unabhängig vom lizenzierten Inhalt und decken Urheberrechte, Leistungsschutzrechte und in der aktuellen Version – sofern existent – auch Datenbankherstellerrecht ab.
Unabhängig von Ihrer rechtlichen Verbindlichkeit erfüllt die Lizenz CC-BY die Idee von Open Access und Open Science sicherlich am ehesten, wogegen die ‚Weitergabe unter gleichen Bedingungen‘ zu Kompatibilitätsproblemen mit anderen Lizenzen, das Verbot von Bearbeitung zu Einschränkungen bei Nutzung durch z.B. Data-Mining oder auch zu Problemen bei der Langzeitarchivierung führen kann. Das Verbot kommerzieller Nutzung erschwert die Verwendung in kommerziellen Datenbanken und reduziert damit potentiell die Sichtbarkeit Ihrer Forschung (für Details vgl. Paul Klimpel, 2012).
Welche Lizenz Sie auch wählen – Sie sollten eine bewusste und informierte Entscheidung treffen. Hilfreich sind dabei Tools wie der englischsprachige Licensechooser für CC Lizenzen oder der für Software.
Unabhängig von den Nutzungsbedingungen gelten selbstverständlich die Regeln guter Wissenschaftlicher Praxis, die eine Angabe der Quelle verwendeter Daten fordern.
Finden und Nutzen von Forschungsdaten
Nicht zuletzt durch die Vorgaben und Empfehlungen von Förderern, Verlagen und Institutionen zur Zugänglichmachung von Daten stehen zunehmend Forschungsdaten für die Nachnutzung zur Verfügung. Um geeignete Forschungsdaten für den eigenen Forschungsbereich zu finden, bieten oft einschlägige Angebote aus dem eigenen Fachgebiet die erste Anlaufstelle. Dies können institutionelle oder fachliche Repositorien oder auch Datenjournale sein (↗ Wie kann ich Daten veröffentlichen?). Repositorien können Sie – nach Fachgebiet aufgeschlüsselt – über den Repository Finder recherchieren. Eine – längst nicht erschöpfende – Liste von Datenjournalen finden Sie in dem Wiki forschungsdaten.org (↗ Data Journals).
Darüber hinaus besteht auch die Möglichkeit, Daten mit Hilfe generischer Suchdienste über mehrere Repositorien hinweg zu recherchieren. Ein großer Nachteil dieser Suchdienste besteht darin, dass sie die detaillierten Metadatenschemata ihrer Quellen oft nicht adäquat abbilden können. Zudem unterscheiden sich die jeweiligen Metadaten stark dahingehend, was sie identifizieren, also einzelne Daten, Datensets oder –Sammlungen.
Zu den bekanntesten Portalen gehören:
- BASE - Bielefeld Academic Search Engine - Ruft Metadaten von Repositorien und Datenbanken über OAI-PMH ab. Forschungsdaten sind über die Dokumentart „Primärdaten“ zu finden.
- B2FIND - Durchsucht Metadaten aus verschiedenen Quellen wie CLARIN oder Global GBIF.
- DataCite Metadata Search - Durchsucht Metadaten von Informationsobjekten, u.a. Forschungsdaten (Objekttyp ‚Dataset‘), die bei DataCite mit DOIs registriert sind. Die Metadaten werden z.T. auch von den anderen beiden Diensten (BASE, B2FIND) abgefragt.
- OpenAIRE - Enthält frei zugängliche Forschungsergebnisse aus EU-geförderten Projekten.
- Google Dataset Search (proprietär!)
- gesisDataSearch - Suche von Daten zur Sozial- und Wirtschaftsforschung in Datenrepositorien und Metadatendiensten.
- VerbundFDB - Forschungsdaten Bildung - Suche von Studien, Forschungsdaten und Instrumenten der empirischen Bildungsforschung.
Für die Nachnutzung selbst sind die jeweiligen Rechte (Lizenzen, ggf. Nutzungsverträge) bindend. Sie können u.a. festlegen, wer die Daten zu welchem Zweck und für welche Zeit nutzen darf (↗ Rechtliche Aspekte).
Um Forschungsdaten nachnutzen zu können, ist vor allem die Qualität der Daten entscheidend. Datenqualität im Forschungsdatenmanagement umfasst insbesondere folgende Bereiche:
- Datenformat (spezielle Speicherformate wissenschaftlicher Daten, wie z.B. Vektorformat, Rasterformat und Eigenschaftsformat, etc.)
- Datenvollständigkeit und Datenrichtigkeit
Derzeit ist ein kostenfreier Prototyp des Leibniz Data Managers verfügbar, der hier exemplarisch für ähnliche Tools steht:
Leibniz Data Manager ermöglicht die Visualisierung verschiedener Forschungsdatenformate, wodurch das 'Screening' von Datensätzen auf ihren potentiellen Nutzen möglich wird. Als Visualisierungs- und Management-Tool unterstützt es die Verwaltung und den Zugriff auf heterogene Forschungsdatenpublikationen, und somit die Forscherinnen und Forscher bei der Auswahl relevanter Datensätze für ihre jeweiligen Disziplinen.
Um die (Nach-)Nutzung von eigenen und fremden Forschungsdaten im Sinne der Guten Wissenschaftlichen Praxis adäquat zu dokumentieren, ist eine korrekte Datenzitation unerlässlich.
Im Falle von Fremddaten wird hierdurch außerdem die wissenschaftliche Leistung ihrer ‚Urheber‘ gewürdigt. Wie bei der Zitation von anderen Publikationen können die Konventionen zur Zitation von Daten formal abweichen. Inhaltlich verbindet sie jedoch der Anspruch einer eindeutigen Identifizierbarkeit der Datenquelle. Die FORCE11 Data Citation Synthesis Group hat Empfehlungen zur Datenzitation erarbeitet. Ihnen zufolge umfasst eine vollständige Datenzitation
Autor(en), Jahr, Titel der Forschungsdaten, Datenrepositorium oder Archiv, Version, weltweit Persistenter Identifikator
Weitere optionale Angaben, die im Rahmen einer Zitation sinnvoll sein können, sind Edition, Feature name and Uniform Resource Identifier (URI), Resource type, Publisher, Unique Numeric Fingerprint (UNF) und Location (vgl. Alex Ball & Monica Duke (2015). How to Cite Datasets and Link to Publications).
Sofern nicht anderweitig gekennzeichnet sind alle Texte dieser Seite und Ihrer Unterseiten lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
