Website
Forschung

Forschungsdatenmanagement

Die Bereitstellung von Daten ist im Interesse der Forschung eine wichtige Aktivität. Die DFG gibt für Forschungsanträge auch Leitlinien für den Umgang mit Forschungsdaten heraus. Die hierin behandelten Themen reichen von der Antragstellung für ein Projekt, über die Bereitstellung von Daten nach dem Projekt bis hin zur langfristigen Speicherung von Daten in geeigneten Verzeichnissen. Vergleichbares gilt für die Datenhaltung in EU-Projekten. In den Anträgen hierzu muss ein Plan zur Datenverwaltung für die Zeit während des Projekts und auch nach dem Projekt nach bestimmten Richtlinien eingebracht werden.

Auf diesen Webseiten fassen wir die Strategie der Universität zu Lübeck für das Forschungsdatenmanagement zusammen.

Begrifflichkeiten

Forschungsdaten sind Daten, die für den wissenschaftlichen Erkenntnisgewinn in einem Forschungsprojekt systematisch ausgewertet werden oder wurden. Mit der Bereitstellung der für eine veröffentlichte wissenschaftliche Arbeit relevanten Daten können wissenschaftliche Aussagen für andere Forschende überprüfbar gemacht werden, und es können Methoden zur Lösung von in der Forschung behandelten wissenschaftlichen Problemen verbessert werden oder auch weiterführende Fragen beantwortet werden.

Nach forschungsdaten.org bezeichnen Forschungsdaten "(digitale) Daten, die je nach Fachkontext Gegenstand eines Forschungsprozesses sind, während eines Forschungsprozesses entstehen oder sein Ergebnis sind. Forschungsdaten werden unter Anwendung verschiedener Methoden – abhängig von der Forschungsfrage – erzeugt, z. B. durch Quellenforschungen, Experimente, Messungen, Beschreibungen, Erhebungen oder Befragungen. Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten mit divergierenden Anforderungen für die Aufbereitung und Verwaltung" [Kindling, M.; Schirmbacher, P. (2013): „Die digitale Forschungswelt“ als Gegenstand der Forschung. In: Information : Wissenschaft und Praxis 64 (2/3), S. 127–136].

Wir möchten hinzufügen, dass Forschungsdaten auch ganz abstrakter Natur sein können und dazu noch automatisch generiert werden können, z.B. um die Skalierbarkeit von Algorithmen (und ihrer Implementierung in Programmen) zu testen. In den Informatikwissenschaften kann neben den für eine Veröffentlichung verwendeten Daten also auch ein Generator für neue Daten ein bedeutender wissenschaftlicher Beitrag zu Forschungsdaten sein (vgl. z.B. Physionet.org).

Bereitstellung von Forschungsdaten der Universität zu Lübeck

Forschungsdaten sollten auffindbar, zugreifbar, interoperabel und wiederverwendbar sein (siehe hierzu die Diskussion von sog. FAIR-Prinzipien). Der Zugriff auf Daten erfolgt meist aufgrund der Verschiedenartigkeit der verwendeten Datenformate nicht über die Daten selbst, sondern über Beschreibungen der Daten (Metadaten genannt). Für Datenbeschreibungen dieser Art gibt es verschiedene Beschreibungsformen und Standards.

Wir haben uns dazu entschieden, für die Bereitstellung von Daten zur Forschung den Beschreibungsstandard von DataCite.org und deren Infrastruktur zur Verwaltung von Datenbeschreibungen zu empfehlen. DataCite.org bietet die Möglichkeit, Beschreibungen von Forschungsdaten in einem zentralen, webbasierten System einzutragen, und stellt Dienste bereit, um Forschungsdaten nach den FAIR-Prinzipien in verschiedenen Verzeichnissen zu finden. Als Ergebnis einer Suchanfrage bei DataCite.org erhalten Forschende eine Übersicht über passende eingetragene Datenbeschreibungen. Interessierte Nutzer:innen können nach Sichtung der Datenbeschreibungen entscheiden, ob sie die beschriebenen Daten genauer betrachten möchten oder sogar aus dem in der angezeigten Datenbeschreibung erwähnten Verzeichnis kopieren wollen.

Um Forschungsdaten selbst bereitzustellen, gibt es verschiedene Möglichkeiten. Eine in der Vergangenheit häufig verwendete Möglichkeit besteht darin, Forschungsdaten auf dem eigenen Webserver mit einer speziellen Seite bereitzustellen. Der/Die lokal Verantwortliche trägt dann dafür Sorge, dass die Daten verfügbar sind. Nicht immer kann das allerdings über viele Jahre garantiert werden, so dass eine solche Strategie in Gutachten für Förderanträge zunehmend kritisiert wird. Eine weitere von vielen Forscher genutzte Möglichkeit ist daher die Eintragung in bekannte existierende Verzeichnisse. Verschiedene Forschungsgebiete verwenden jeweils fachspezifische Verzeichnisse. DataCite.org verwaltet ca. 2000 dieser Verzeichnisse, die auch auf der DataCite.org Webseite über Suchanfragen auf Verwendbarkeit geprüft werden können, so dass geeignete externe Verzeichnisse gefunden werden können. Je nach Verzeichnis gibt es unterschiedliche Wege, Daten in das Verzeichnis zu überführen. Die Verwendung eines in der fachspezifischen Wissenschaftsgemeinde anerkannten Verzeichnisses kann zu Synergie-Effekten führen, und das Vorgehen wird von Gutachtern für Forschungsanträge anerkannt.

Eintragung einer Datenbeschreibung bei DataCite.org

Bei der Registrierung von Datenbeschreibungen aus einem Projekt bei DataCite.org muss dann angegeben werden, wo die konkreten Daten zu finden sind. Datenbeschreibungsformate sind standardisiert, und konrekte Beschreibungen können mit interaktiven Werkzeugen erstellt werden. Obwohl es viele Vorschläge für die Beschreibung von Daten gibt, empfehlen wir, ein Werkzeug zu verwenden, dass Beschreibungen erzeugt, die kompatibel zu DataCite.org sind. Ein geeignetes Werkzeug wird z.B. unter dhvlab.gwi.uni-muenchen.de/datacite-generator/ bereitgestellt. Der Nutzer kann über eine interaktive Oberfläche in einem Web-Browser eine korrekte Beschreibungsdatei (im XML-Format) erstellen, die dann von DataCite.org verarbeitet werden kann.

Wahl eines Verzeichnisses und des Formats für die bereitgestellten Daten

Zur Beschreibung des Verzeichnisses für Daten (oder einer konkreten Position in einem Verzeichnis) sollte ein eindeutiger Identifikator verwendet werden (Digital Object Identifier, DOI). Sie können eine DOI über die Zentrale Hochschulbibliothek beantragen.

In vielen Fällen werden Forschungsdaten als Dateien bereitgestellt (etwa in Form von Excel-Tabellen oder  auch als Text-Dateien z.B. im CSV-Format). Bevor eine Beschreibung eigener Forschungsdaten nun bei DataCite.org registriert wird (siehe oben, die Zentrale Hochschulbibliothek ist Ihnen dabei behilflich), sollten die Daten in einem allgemein zugängigen Verzeichnis bereitgestellt werden, das z.B. auch über DataCite.org bzw., genauer gesagt, über re3data.org gefunden werden kann (siehe die Webseite von DataCite.org).

Ein Verzeichnis an der Universität zu Lübeck für frei und ohne Einschränkungen zugängige Forschungsdaten befindet sich im Aufbau.

An der Universität zu Lübeck werden auch beschränkt zugängige medizinische Forschungsdaten von mehreren Abteilungen angeboten. Der Zugriff auf die jeweiligen Verzeichnisse ist unter jeweils festgelegten Bedingungen möglich (z.B. Ethikvotum). Bitte wenden Sie sich direkt an die Betreiber:

Rolle der Zentralen Hochschulbibliothek

Der Zentralen Hochschulbibliothek kommt in Bezug auf das Forschungsdatenmanagement eine zentrale Bedeutung zu. Folgende Dienste werden angeboten:

  • Unterstützung bei der DOI-Beantragung
  • Unterstützung bei der Erstellung von Datenbeschreibungen (siehe die obige Abbildung)
  • Unterstützung beim Finden eines geeigneten Verzeichnisses für die konkreten Daten eines Projektes (über DataCite.org bzw. re3data.org)
  • Unterstützung beim Erstellen von entsprechenden Eintragungen auf der DataCite.org Webseite

Ansprechpartnerinnen: Inga Larres

Rolle der Stabsstelle Forschung

Die Stabsstelle Forschung stellt folgende Dienste bereit:

  • Bereitstellung von Mustern für das Konzept zum Forschungsdatenmanagement in DFG-Anträgen
  • Empfehlungen für Datenverzeichnisse zur Speicherung von frei zugängigen Forschungsdaten aus der Medizin und den Gesundheitswissenschaften

Ansprechpartnerin: Dr. Nina Perwitz

Rolle der EU-Drittmittelkoordination

  • Unterstützung bei der Gestaltung von EU-Anträgen in Bezug auf Forschungsdatenmanagement während des Projektes
  • Unterstützung bei der Gestaltung von EU-Anträgen in Bezug auf Forschungsdatenbereitstellung nach Ende des Projektes

Ansprechpartnerin: Annette Bender-Schiffer

Rolle der/des Verantwortlichen für Datensicherheit (Data Protection Officer)

Die/Der Verantwortliche für die Datensicherheit an der UzL (Data Protection Officer, DPO) organisiert die Prozesse zur Datensicherung in Forschungsprojekten auf abstrakter Ebene in enger Absprache mit dem ITSC und, sofern es konkrete Projekte betrifft, auch mit den für die Datenverarbeitung verantwortlichen Direktoren der Institute und Kliniken. Die Direktoren der jeweiligen Einheiten sind für die jeweilige detaillierte Umsetzung der in Anträgen eingebrachten Datenmanagement-Pläne verantwortlich, wobei eine explizite Delegierung auf entsprechende Projektleiter:innen oder Mitarbeiter:innen möglich ist.

  • In Abstimmung mit dem DPO der UzL erfolgt eine Begleitung bei der projektspezifischen Ausarbeitung des Datenmanagement-Plans, der im Antrag beschrieben werden soll.

Rolle des Präsidiumsbeauftragten für Forschungsdatenmanagement

  • Beantwortung allgemeiner Fragen
  • Entgegennahme von Anregungen und Wünschen

Ansprechpartner: Prof. Dr. Ralf Möller