Erläuterung zu den DFG Leitlinien

Die DFG hat Leitlinien zum Umgang mit Forschungsdaten entwickelt. Sie beschreiben die Anforderungen an Förderanträge, die Position zur Bereitsstellung der Daten sowie die Verpflichtung zur langfristigen Sicherung.
Darüber hinaus informieren sie über Unterstüzungsmöglichkeiten durch die DFG und appellieren an wissenschaftlichen Fachgemeinschaften bzgl. der Entwicklung von Standards und der Würdigung der Bemühung um Verfügbamachung von Daten.

Für die Beantragung von Fördergeldern ist der erste Teil (1. Projektplanung und Antragstellung) ausschlaggebend.

Sie können auf die einzelnen Passagen klicken, um weitere Hinweise zu erhalten!

1. Projektplanung und Antragstellung

Bereits in die Planung eines Projekts sollten Überlegungen einfließen, ↗ob und welche der aus einem Vorhaben resultierenden Forschungsdaten für andere Forschungskontexte relevant sein können und in welcher Weise diese Forschungsdaten anderen Wissenschaftlerinnen und Wissenschaftlern zur Nachnutzung zur Verfügung gestellt werden können. In einem Antrag sollten die Antragstellenden daher ausführen, ↗welche Forschungsdaten im Verlauf eines wissenschaftlichen Forschungsvorhabens entstehen, erzeugt oder ausgewertet werden. Dabei sollten ↗fachspezifisch angemessene Konzepte und Überlegungen für die Qualitätssicherung, für den Umgang mit und die langfristige Sicherung der Forschungsdaten zugrunde gelegt werden. Die einschlägigen Erläuterungen müssen ↗Informationen zu Datentypen, falls vorhanden zu ↗disziplinspezifischen Standards und zur ↗Wahl geeigneter Repositorien enthalten, sofern diese für ein bestimmtes Fachgebiet oder bestimmte Datentypen vorhanden sind. Zusätzlich werden Angaben zu ggf. ↗betroffenen Rechten Dritter sowie erste ↗Planungen zum zeitlichen Rahmen der Datenveröffentlichung erbeten.

(Quelle: DFG: Leitlinien zum Umgang mit Forschungsdaten)

 

 



Erläuterungen und Hinweise




Ob und welche der aus einem Vorhaben resultierenden Forschungsdaten für andere Forschungskontexte relevant sein können und in welcher Weise diese Forschungsdaten anderen Wissenschaftlerinnen und Wissenschaftlern zur Nachnutzung zur Verfügung gestellt werden können. [Pflichtangabe]

Der Aspekt der potentiellen Nachnutzung ist zentral für die Darlegung des eigenen Forschungsdatenmanagements. Dabei geht es explizit NICHT darum, dass alle Daten uneingeschränkt veröffentlicht werden sollen. Vielmehr zielen diese Überlegungen zunächst darauf ab, einen Umgang mit Forschungsdaten zu etablieren, der eine Nachnutzung potentiell erlauben würde.
Hierzu zählen die weiter unten ausgeführten Punkte wie Benennung, Dokumentation, Eigentum, Rechtssicherheit, Format usw.

Eine tatsächliche freie Verfügbarmachung der Daten ist von der DFG nicht verpflichtend vorgeschrieben, jedoch – sofern möglich - gewünscht.

Schätzen Sie die (fachspezifische und-übergreifende) Relevanz Ihrer Daten für andere Forschende ab. Berücksichtigen Sie dabei auch ihren "Wert" im Sinne ihrer Einmaligkeit, kostenintensiven Erhebung etc.

Falls Daten unterschiedlich eingeschätzt werden und/oder behandelt werden sollen, machen Sie Ihre Auswahlkriterien transparent.

Gehen Sie hier auch darauf ein, ob und ggf. welche Bedingungen für eine Nachnutzung gelten sollen, etwa Embargo-Fristen, Anonymisierung, Zweckbindung, etc.

Im Punkt der Nachnutzbar-Machung empfiehlt es sich, ‚rückwärts‘ zu denken, sich also zu fragen, „welche Informationen, Tools etc. würden andere Forschende benötigen, um mit den Daten zu arbeiten?“




Welche Forschungsdaten im Verlauf eines wissenschaftlichen Forschungsvorhabens entstehen, erzeugt oder ausgewertet werden. [Pflichtangabe]

Stellen Sie zunächst die Frage: müssen die benötigten Daten selbst generiert werden oder können zur Beantwortung der Forschungsfrage vorhandene Daten nachgenutzt werden?

Falls eigene Daten benötigt werden:Welche Art von Daten werden erzeugt? Auf welche Weise und mit welchen Methoden werden sie gewonnen und bearbeitet? In welchem Bearbeitungsstatus werden sie vorgehalten?

Unterscheiden Sie nicht nur nach der grundlegenden Beschaffenheit (qualitative / quantitaive Daten), sondern auch nach ihrer Entstehung:

  • Beobachtungsdaten
  • Experimentaldaten
  • Simulationsdaten
  • Abgeleitete Daten
  • Referenzdaten

und machen Sie ggf. Angaben zur Erhebungsmethode.

Gehen Sie ggf. auf die verschiedenen Bearbeitungsstufen ein, etwa:

  • Roh-, Primär-, Sekundärdaten
  • aggregierte, bereinigte, anonymisierte Daten

Auch die Beschreibung von Typ und Format kann bereits hier ihren Platz finden (vgl. ↗Informationen zu Datentypen)




Fachspezifisch angemessene Konzepte und Überlegungen für die Qualitätssicherung, für den Umgang mit und die langfristige Sicherung der Forschungsdaten [Pflichtangabe]

Der Fokus liegt hier auf der Auseinandersetzung mit Standards, die sich Fach-Communities hinsichtlich Qualität, Umgang und Sicherung von Forschungsdaten selbst gegeben haben. Mehr hierzu finden Sie auf der Seite der DFG (unter 'Fachspezifische Empfehlungen zum Umgang mit Forschungsdaten').
Existieren solche Standards nicht, sollten hier Ausführungen zu den entsprechenden Punkten vor dem Hintergrund der allgemeinen Leitlinien unter Berücksichtigung möglicher Besonderheiten des konkreten Falls gemacht werden.

Entsprechende Überlegungen sollten grundsätzlich vor dem Hintergrund möglicher Nachnutzung geschehen.

Qualitätssicherung:

Qualitätssicherung im Bereich Forschungsdaten können verschiedene Aspekte umfassen, etwa

  • Inhaltliches Review, technische (Format, Integrität) und/oder formale Prüfung (Metadaten)
  • (fachspezifische) Dokumentation
  • Praxis der Versionierung, Benennung etc.
  • Inhaltl. Qualitätssicherung in Erhebung und Auswertung // Gütekriterien

Umgang:

Klärung Sie unbedingt die Verantwortlichkeiten für das Forschungsdatenmanagement. Berücksichtigen Sie dabei sowohl die Pflicht der Aufbewahrung über das Projektende hinaus als auch die Möglichkeiten personeller Änderungen in der Projektlaufphase.

Wie sieht der Umgang mit Daten darüber hinaus aus? Wer hat welchen Zugang und welche Rechte? Welche Tools und/oder Konventionen finden im "aktiven Datenmenagement" Anwendung (Tools, Versionierung, Labeling etc.)

Langfristige Sicherung:

Langfristige Sicherung betrifft zum einen den Zugriffschutz (Verschlüsselung, Mandantentrennung etc.), zum anderen die technische Sicherung (Speicher- und Backup-Routine).
Unterscheiden Sie wenn möglich zwischen Speicherung in der aktiven Nutzung, 10 jähriger Pflicht-Aufbewahrung, Veröffentlichung und Langzeitarchivierung. Legen Sie ggf. die Kriterien bei verschiedenen Strategien dar.

Darüber hinaus kann hier auch die Sicherung inhaltlicher Nachnutzung (im Sinne fachspezifischer Dokumentation) zur Sprache kommen.




Informationen zu Datentypen [Pflichtangabe]

Um welche Datentypen handelt es sich und in welchem Format werden sie vorliegen? Wichtig ist hier die Orientierung an (internationalen) disziplinären Standards. Darüber hinaus gilt grundsätzlich, dass offene, dokumentierte Standards gegenüber proprietären Formaten vorzuziehen sind.

⇒Prüfen Sie ggf. auch die Möglichkeit, die benötigte Software zu veröffentlichen!

Unterscheiden Sie Daten beispielsweise nach Typ

  • Numerisch (Statist. Daten, Laborwerte)
  • Textuell (Transkripte, Annotationen,  Laborbücher, Feldtagebücher)
  • Multimedial (Digit. Karten, Audio/Video)
  • Modelle (Algorithmen, Netzwerkanalysen, Skripte, Code)
  • Proben, geräteabhängige Messwert
  • ...

und/oder nach Format wie etwa

  • Texte (TXT, Docx, PDF, …)
  • Bilder (TIFF, JPEG, …)
  • Multimedia (MP4, Dicom, …)
  • Messdaten (TXT, XLSX, …)
  • Born-digitals (netCDF, grib, …)
  • ...




[Informationen zu] disziplinspezifischen Standards [Pflichtangabe; falls vorhanden]

Der Fokus liegt auch hier auf der Auseinandersetzung mit Standards, die sich Fach-Communities selbst gegeben haben.  

Dies meint neben Gutekriterien v.a. Standards der Datenbeschreibung, etwa

  • Metadatenschemata
  • Kontrollierte Vokabulare
  • Klassifikationen
  • Normdaten

Beispiel hierfür finden Sie unter ↗Was sind Metadaten, Metadatenschemata und Dokumentationen?




[Informationen zur] Wahl geeigneter Repositorien [Pflichtangabe; falls vorhanden]

Mit Blick auf die Sichtbarkeit in der Fachcommunity aber auch hinsichtlich der fachspezifischen Anforderungen ist ein disziplinäres Repositorium in der Regel die erste Wahl. Eventuell finden Sie bereits über unsere ↗Fachspezifika ansonsten ggf. über die Suche von re3data ein passendes Repositorium.

Fachspezifische Repositorien sind etwa

  • Sozial-/Wirtschaftswissenschaften.: datorium
  • Erdsystemforschung und Umweltwissenschaften: Pangaea
  • Lebenswissenschaften: Dryad

Fachübergreifende Repositorien wie Zenodo oder figshare stehen allen Disziplinen zur Verfügung, sind aber hinsichtlich Publikum und Funktionsumfang entsprechend generisch.

siehe hierzu auch ↗Wie finde ich ein passendes Repositorium?

Mit Blick auf eine frühzeitige Planung des Datenmanagements können zusätzlich folgnde Fragen helfen

  • Welche formalen und inhaltlichen Anforderungen stellt das Repositorium (und kann/will ich diese erfüllen)?
  • Entstehen einmalig oder langfristig Kosten für die Nutzung (und kann ich diese ggf. beantragen)?

Ist Ihnen kein geeignetes Repositorium bekannt, formulieren Sie ggf. Ihre spezifischen Anforderungen, etwa persistente Identifikatoren, Archivierungsdauer, Embargo, Zugriffsschutz, Nutzungsregulierung etc.




Betroffenen Rechten Dritter [Empfohlene Angabe]

Forschungsdatenmanagement, insbesondere die Veröffentlichung von Daten kann eine Reihe von Rechten betreffen, u.a.

  • Urheberrecht
  • Persönlichkeitsrechte
  • Eigentumsrecht
  • Know-How-Schutz

Um böse Überraschungen zu vermeiden, klären Sie vor Beginn des Projekts unbedingt:

  • Wer besitzt welche Rechte an den Daten? Bin ich selbst in der Nutzung oder Weitergabe eingeschränkt?
  • Welche personenbezogenen Daten werden erhoben und welche Maßnahmen zum Schutz von Persönlichkeitsrechten müssen getroffen werden?

Beispiele

  • „Es werden folgende personenbezogene Daten erhoben: Alter, Religion, Bildungsgrad, ..“
  • „Personenbezogene Daten werden vor dem Zugriff durch Unbefugte geschützt.“ Detail können umfassen:
    • Verschlüsselung der Daten
    • Passwortschutz
    • Zugangsbeschränkung o.ä.
  • Weiterverarbeitung und ggf. Veröffentlichung auf Basis von z.B.
    • Anonymisierung
    • Einverständniserklärung
    • Zugriffskontrolle




Planungen zum zeitlichen Rahmen der Datenveröffentlichung [Empfohlene Angabe]

Für wann ist die Datenveröffentlichung geplant?
Möglicherweise benötigen Sie Zeit für die Erstauswertung der Daten oder eine Patentanmeldung. In solchen Fällen kann bei den meisten Repositorien eine Sperr-/Embargofrist festgelegt werden, während welcher lediglich die Metadaten einsehbar sind. Hierdurch kann die Befolgung von Archivierungspflichten nachgewiesen werden, ohne dass legitime Interessen der Datenerstellenden verletzt werden.

Nicht gefordert aber sinnvoll sind zudem weitere Überlegungen im Kontext einer möglichen Veröffentlichung, etwa

  • zur Aufbereitung der Daten
    • Dokumentation, Format, etc.
    • Auswahlkriterien (Relevanz/Wert, Grundlage einer Textpublikation, etc. )

  • zum Umfang der Veröffentlichung
    • Daten und/oder Metadaten
    • Zugehörige Dokumentation, ggf. Datenpaper
    • Roh-, Primär-, Sekundärdaten

  • zum Ort der Veröffentlichung (s.o.)

  • zu den Bedingungen der Veröffentlichung (s.o.)

Legen Sie an dieser Stelle auch dar, falls eine Veröffentlichung aus bestimmten Gründen nicht möglich ist (siehe auch ↗Spricht etwas gegen eine Veröffentlichung?).