Öffnet eine externe Seite Link zur Startseite

Bundesamt für Naturschutz

Datenmanagement

Für eine effektive Nachnutzung von Daten und Informationen zur Biodiversität und die sie beeinflussenden Umweltfaktoren ist es notwendig, dass diese in guter Qualität erhoben, gut dokumentiert, dauerhaft gesichert, auffindbar und zugänglich sind. Ein guter Umgang mit Daten bezieht sich somit auf deren gesamten Lebenszyklus.

Die im Biodiversitätsmonitoring und in der Biodiversitätsforschung gewonnenen Daten sind die wissenschaftliche Grundlage für belastbare Aussagen bezüglich des Zustandes und der Veränderung der Biodiversität. Aus ihnen können statistisch belastbare Trends abgeleitet und geeignete Maßnahmen zum Biodiversitätsschutz erarbeitet werden. Damit die langfristige Nachnutzbarkeit solcher Daten gewährleistet ist, spielt die sorgfältige Dokumentation sämtlicher Schritte des Datenmanagements (zum Beispiel Erhebungsmethodik, Variablen- und Probenbeschreibung, Metadatenerfassung) eine entscheidende Rolle. Ein gutes Datenmanagement erleichtert auch die Nutzung regional beziehungsweise national erhobener Daten im nationalen und internationalen Kontext. Darüber hinaus lassen sich durch die Verschneidung von Daten über verschiedene Datenquellen hinweg gegebenenfalls Aussagen für große Bezugsräume und über lange Zeiträume treffen. Eine ausreichend detaillierte Dokumentation der Daten und der Methodik der Erhebung ist hierfür jedoch eine zentrale Voraussetzung.

Was ist Forschungsdatenmanagement?

Forschungsdatenmanagement umfasst den standardisierten Umgang mit erhobenen Datensätzen entlang des gesamten sogenannten Datenlebenszyklus - begonnen mit der Planung der Datenerhebung, über die Entstehung, Beschreibung, Transformation und Speicherung der Daten, bis hin zu deren Langzeitarchivierung und gegebenenfalls Veröffentlichung. Ziel des Forschungsdatenmanagements ist es, wertvolle Forschungsdaten in einer Form zu bewahren, die eine dauerhafte, personenunabhängige Nachnutzbarkeit und Überprüfbarkeit gewährleistet. Obwohl es auf den ersten Blick so scheint, als könne ein stringentes Datenmanagement an jedem Punkt des Datenlebenszyklus starten, hat sich gezeigt, dass die Erstellung eines Datenmanagement-Plans (DMP) bereits bei der Planung eines Monitoring- oder Forschungsprojektes extrem wichtig ist.

Datenlebenszyklus: Konzipieren, Daten erheben, Qualität prüfen, Daten beschreiben, Daten teilen, Daten archivieren, Daten finden, Daten verknüpfen, Analysieren/prozessieren, Ergebnisse veröffentlichen
Datenlebenszyklus: Konzipieren, Daten erheben, Qualität prüfen, Daten beschreiben, Daten teilen, Daten archivieren, Daten finden, Daten verknüpfen, Analysieren/prozessieren, Ergebnisse veröffentlichen

Datenmanagement-Planung und Datendokumentation

Eine frühzeitige Planung und Dokumentation des Umgangs mit Daten trägt maßgeblich zu einer nachhaltigen und transparenten Datenhaltung bei. Die Bandbreite an Dokumentationsarten ist vielfältig. Hier einige zentrale Beispiele:

  • sogenannte Data-Curation-Profiles: dokumentieren die „Geschichte“ eines einzelnen Datensatzes
  • Datenmanagementpläne: werden meist für ein gesamtes Vorhaben erstellt und enthalten alle Informationen, die im Verlauf des Vorhabens für das Verständnis und den Umgang mit den Daten relevant sind; werden im Forschungskontext zunehmend von Geldgebern eingefordert
  • Data Policy: regeln den Umgang mit allen Aspekten des Datenmanagements für eine gesamte Institution oder ein großes Verbundvorhaben mit vielen unterschiedlichen Partnern
  • Im behördlichen Kontext werden einzelne Aspekte des Umgangs mit Daten eher über Verfahrensanweisungen geregelt oder ergeben sich implizit durch den gesetzlichen Auftrag
  • Welche Art von Dokumentation für ein bestimmtes Vorhaben sinnvoll ist, oder ob gar eine Kombination der genannten Ansätze notwendig ist, hängt immer von der Frage- bzw. Zielstellung ab. Deshalb ist es ratsam, sich bereits in einem frühen Stadium der Planung auch über solche Aspekte Gedanken zu machen und ein geeignetes Vorgehen festzulegen.

Die FAIR-Data-Prinzipien

Wichtige Aspekte, die beim Datenmanagement zu beachten sind, werden in den FAIR-Data-Prinzipien abgebildet. Diese Prinzipien bieten einen übergeordneten Rahmen und eine Orientierungshilfe zu den Kriterien, die gut gehaltene Daten erfüllen sollten. Sie besagen, dass Daten jeder Zeit auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable, das heißt von verschiedensten Softwareprogrammen lesbar) und wiederverwendbar (Reusable) sein sollten. Diese Prinzipien sind in der Fachwelt allgemein anerkannt, haben inzwischen Einzug in diverse Richtlinien von Förderorganisationen (zum Beispiel EU Horizon 2020, Deutsche Forschungsgemeinschaft) sowie in die Datenrichtlinien vieler Wissenschaftsinstitutionen gefunden.

Leitlinien zur Sicherung guter wissenschaftlicher Praxis

Den Umgang mit Forschungsdaten hat die Deutsche Forschungsgemeinschaft (DFG) inzwischen als wichtigen Aspekt in ihre allgemein anerkannten Leitlinien zur Sicherung guter wissenschaftlicher Praxis aufgenommen. Für die Förderung von Forschungsprojekten durch die DFG spielen diese Leitlinien eine maßgebliche Rolle.

Zurück nach oben