Home » Publizieren » Forschungsdaten » Daten publizieren

Forschungsdaten publizieren

Forschungsdaten sollten, soweit sinnvoll und möglich, zusammen mit den Forschungsergebnissen veröffentlicht werden. Ziel ist, dass andere Personen wissenschaftliche Erkenntnisse nutzen, überprüfen und weiterverwenden können.

Verknüpfte Strukturen im Gehirn mit Knotenpunkten (Künstliche Intelligenz)
Quelle: pixabay.com. Free for use under the Pixabay Content License

Auf dieser Seite erfahren Sie:

Warum sollen Forschungsdaten veröffentlicht werden?

Die angemessene Veröffentlichung von Forschungsdaten bietet Forschenden der TUHH viele Vorteile:

  • Forschungsergebnisse aus Publikationen werden in Verbindung mit den verwendeten Daten transparenter und verifizierbar.
  • Daten können nachgenutzt werden. Dadurch kann doppelte Arbeit vermieden werden und stattdessen können neue Impulse für Forschungsideen entstehen.
  • Forschungsdaten können zitiert werden. Datenarbeitende Wissenschaftler*innen erhalten dadurch größeren akademischen Credit.
  • Der öffentliche Zugang zu Forschungsergebnissen entspricht der guten wissenschaftlichen Praxis (siehe Leitlinie 13 des DFG-Kodex).
  • Bei Projektförderungen wird immer häufiger die Veröffentlichung von Daten erwünscht (siehe TUB-Website Leitlinien und Grundlagen).

Was bedeuten die FAIR-Prinzipien?

Laut den FAIR-Data-Prinzipien sollen Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederauffindbar (reusable) sein1. Damit erfüllen sie gewisse Qualitätsansprüche für die einfache Nachnutzung.

Illustration der FAIR Data Principles
Quelle: fosteropenscience.eu

Im Kern sollen Forschungsdaten:

  • mit einem global eindeutigen persistenten Identifikator (PID) versehen,
  • hinreichend mit standardkonformen Metadaten beschrieben,
  • in einem anerkannten Repositorium in geeigneten Formaten archiviert und
  • möglichst offen unter einer freien Lizenz zugänglich gemacht werden.

Ein Hinweis dazu: FAIR bedeutet nicht, dass alle Daten öffentlich zur Verfügung stehen müssen! Vielmehr zielen die FAIR-Prinzipien darauf, im Rahmen des rechtlich und technisch Möglichen, Datenbestände für neue Nutzungsszenarien zu öffnen.

Grundsätzlich gelten die FAIR-Prinzipien auch für Forschungssoftware. Um die gemeinsame Nutzung und Weiterverwendung von Software zu fördern, wurden spezifisch die FAIR Principles for Research Software (FAIR4S) entwickelt2.

Wie FAIR sind meine Daten? Die EUDAT-Checkliste How FAIR are your data? gibt Antworten3.

Wo kann ich Forschungsdaten veröffentlichen?

Forschungsdaten sollen nach Möglichkeit in einem vertrauenswürdigen Repositorium veröffentlicht und archiviert werden, um diese damit für Interessierte zugänglich zu machen. Repositorien dienen auch als gute Stütze, um die Leitlinien der FAIR-Prinzipien zu erfüllen.

Wenn vorhanden, sollten fachspezifische Repositorien bevorzugt genutzt werden. Ist kein geeignetes Fach-Repositorium verfügbar, dann können Sie die Daten in der Forschungsdatensammlung von TUHH Open Research (TORE) veröffentlichen. Für (zitierfähige) Software empfehlen wir GitHub kombiniert mit Zenodo. Bei der Auswahl eines passenden Repositoriums unterstützen wir Sie gern.

1. Fachrepositorien

Forschungsdaten sollten am besten in einem fachspezfischen Forschungsdaten-Repositorium dauerhaft publiziert werden. Je nach Fach und Community können sich die Anforderungen an Auffindbarkeit und Zugänglichkeit stark unterscheiden.

Unterstützung bei der Auswahl eines geeigneten Repositories bietet re3data.org, das Registry of Research Data.

re3data.org Regsitry of Research Data Repositories

Vertrauenswürdige Repositorien sollten Antworten auf die folgenden Mindestkriterien geben können:

Vergabe von dauerhaften und eindeutigen Identifikatoren (PIDs)
  • Ermöglicht das Auffinden und Identifizieren von Daten
  • Ermöglicht das Suchen, Zitieren und Abrufen von Daten
  • Unterstützung für die Versionierung von Daten
Metadaten

  • Finden von Daten wird ermöglicht
  • Verweise auf verwandte relevante Informationen, wie andere Daten und Veröffentlichungen
  • Öffentlich zugängliche Informationen auch für nicht veröffentlichte, geschützte, zurückgezogene oder gelöschte Daten
  • Verwendung von Metadatenstandards, die (von der wissenschaftlichen Gemeinschaft) allgemein anerkannt sind
  • Metadaten müssen maschinell auffindbar sein

Datenzugang und Nutzungslizenzen
  • Zugriff auf Daten unter festgelegten Bedingungen ermöglichen
  • Gewährleistung der Authentizität und Integrität der Daten
  • Ermöglicht den Abruf von Daten
  • Bereitstellung von Informationen über Lizenzen und Berechtigungen (idealerweise in maschinenlesbarer Form)
  • Gewährleistung der Vertraulichkeit und Achtung der Rechte der betroffenen Personen und der Urheber von Daten

Datenerhaltung
  • Sicherstellung der Persistenz von Metadaten und Daten
  • Transparenz in Bezug auf Auftrag, Umfang, Bewahrungsrichtlinien und -pläne (einschließlich Governance, finanzielle Nachhaltigkeit, Aufbewahrungszeitraum und Kontinuitätsplan)

Eine Orientierungshilfe zur Auswahl eines geeigneten Repositoriums bietet auch der Practical Guide to the International Alignment of Research Data Management von Science Europe (S. 26 ff)4.

2. Technische Universität Hamburg: TORE

An der TUHH steht die Sammlung Forschungsdaten in TUHH Open Research für die Publikation von Forschungsdaten der TUHH zur Verfügung.

Logo TUHH Open Research

TUHH Open Research (TORE) wird als institutionelles Repositorium für Forschungsdaten an der TU Hamburg standardkonform nach den FAIR-Data-Prinzipien betrieben. Die Langzeitarchivierung erfolgt auf einem S3-Speicher des regionalen Rechenzentrums der Universität Hamburg. TORE unterstützt DataCite als Metadatenschema. Als persistente Identifier werden DOIs (Digital Object Identifiers) für einen Datensatz, ORCID iDs für Personen und ROR IDs für Einrichtungen genutzt.

TORE ist im Registry of Research Data Repositories verzeichnet:

re3data.org: TUHH Open Research – Research Data TUHH; editing status 2022-06-09; re3data.org – Registry of Research Data Repositories. https://doi.org/10.17616/R31NJML0 last accessed: 2024-03-05.

3. Software über Zenodo auf Github

Softwareentwicklung ist häufig ein wichtiger Bestandteil der wissenschaftlichen Arbeit an der TUHH. Viele von Ihnen nutzen GitLab oder GitHub, um gemeinsam wissenschaftliche Software zu erstellen und zu teilen. Aber wie kann man die Software dann am besten zitieren?

Digital Object Identifiers (DOI) sind zum Quasi-Standard für die Referenzierung digitaler Publikationen geworden. Was liegt also näher, als DOIs auch für Software zu verwenden? Dies ist dank der Zusammenarbeit zwischen GitHub und Zenodo von CERN möglich.

Ein Beispiel aus dem Institute für Kommunikationsnetze der TUHH:

Sebastian Lindner, Konrad Fuger, Musab Ahmed Eltayeb Ahmed, & Andreas Timm-Giel. (2023). ComNetsHH/ldacs_simulator: LDACS MCSOTDMA Simulator (v1.0). Zenodo. https://doi.org/10.5281/zenodo.8085497

So verbinden Sie GitHub mit Zenodo:

Logos GitHub und Zenodo
  1. Navigieren Sie zur Anmeldeseite für Zenodo.
  2. Klicken Sie auf Mit GitHub anmelden.
  3. Überprüfen Sie die Informationen zu den Zugriffsberechtigungen und klicken Sie dann auf Zenodo autorisieren.
  4. Navigieren Sie zur Zenodo-GitHub-Seite.
  5. Schalten Sie rechts neben dem Namen des Repositorys, das Sie archivieren möchten, die Schaltfläche auf Ein um.

Zenodo archiviert Ihr Repository und stellt jedes Mal eine neue DOI aus, wenn Sie eine neue GitHub-Version erstellen. Folgen Sie den Schritten unter “Verwalten von Veröffentlichungen in einem Repository“, um eine neue Veröffentlichung zu erstellen.

Und noch zwei Tipps dazu:

  1. Nutzen Sie die TUHH-Community auf Zenodo: https://zenodo.org/communities/tuhh/
    Eine Zuordnung ist auch nachträglich möglich.
  2. Legen Sie eine CITATION.cff in ihr Repository.
    CITATION.cff-Dateien sind einfache Textdateien mit menschen- und maschinenlesbaren Zitierinformationen für Software (und Datensätze). Code-Entwickler können sie in ihre Repositories aufnehmen, um anderen mitzuteilen, wie sie ihre Software korrekt zitieren können.

Hier finden Sie einen ausführlichen Blogbeitrag zur Publikation auf über Github auf Zenodo: Machen Sie Ihre Software zitierfähig. Lesenswert ist auch der Praxisbericht aus dem Institut für Regelungstechnik: Open Access Publishing an der TUHH: Exemplarische Schritt-für-Schritt-Anleitung für eine Toolchain mit TORE, GitLab, Sherpa Romeo und Zenodo5.

Wie mache ich Forschungsdaten zitierfähig?

Wenn Forschungsdaten Forschungsergebnisse ergänzen sollen, dann müssen sie auch verläßlich zitierbar sein. TUHH Open Research und viele andere Repositorien verzeichnen ihre Inhalte deswegen über eine Registrierungsagentur bei DataCite. Dabei wird für jedes Datenset ein eindeutiger DOI vergeben, über den das Datenset dauerhaft zitiert und aufgerufen werden kann.

Ein Beispiel aus dem Institut Verkehrsplanung und Logistik W-8:

Aberle, Christoph (2019). Mobility as a Service: ein Angebot auch für Einkommensarme? (Geo-Datensatz). TUHH Universitätsbibliothek. https://doi.org/10.15480/336.2396.2

Datensätze aus TUHH Open Research oder DataCite können Sie außerdem in Ihr ORCID-Profil übernehmen und damit Ihnen als Person eindeutig zuordnen.


Zitationen

  1. Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). https://doi.org/10.1038/sdata.2016.18 ↩︎
  2. Chue Hong, N. P., Katz, D. S., Barker, M., Lamprecht, A.-L., Martinez, C., Psomopoulos, F. E., Harrow, J., Castro, L. J., Gruenpeter, M., Martinez, P. A., Honeyman, T., Struck, A., Lee, A., Loewe, A., van Werkhoven, B., Jones, C., Garijo, D., Plomp, E., Genova, F., … RDA FAIR4RS WG. (2022). FAIR Principles for Research Software (FAIR4RS Principles) (1.0). Zenodo. https://doi.org/10.15497/RDA00068 ↩︎
  3. Jones, S., & Grootveld, M. (2017). How FAIR are your data?. https://doi.org/10.5281/zenodo.5111307 ↩︎
  4. Science Europe (January 2021). Practical Alignment of Research Data Management (Extended Edition). https://www.scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_final.pdf ↩︎
  5. Patrick Göttsch, Christian Hespe, Adwait Datar, Simon Heinke und Lennart Heeren (20. Mai 2022). Open Access Publishing at TUHH: Exemplary Step-by-step guide for a toolchain with TORE, GitLab, Sherpa Romeo and Zenodo. https://www.tub.tuhh.de/tubtorials/2022/05/30/open-access-publishing-at-tuhh-exemplary-step-by-step-guide-for-a-toolchain-with-tore-gitlab-sherpa-romeo-and-zenodo/ ↩︎

Benötigen Sie Unterstützung? Ich berate Sie gerne


Ausführliche Informationen zu Forschungsdaten finden Sie auf der Informations­plattform forschungsdaten.info.

Logo forschungsdaten.info
Nach oben scrollen