Das Bild zeigt die Wörter *FAIR Principles* über einem schwarzen Kreis, in dem vier weiße, ineinandergreifende Puzzleteile zu sehen sind. in jedem Puzzleteil befindet sich jeweils ein Buchtabe von FAIR. Links vom Kreis führt eine graue Linie, rechts eine blaue Linie. Der Hintergrund ist hellblau.

Wissenschaftliche Integrität bildet die Basis einer vertrauenswürdigen Wissenschaft. Forschende tragen große Verantwortung diesen Maßgaben im Sinne der guten wissenschaftlichen Praxis 1 und den FAIR-Prinzipien 2 gerecht zu werden, welche auch im Hochschulgesetz von NRW 3 verankert sind. Die FAIR-Prinzipien stellen Anforderungen auf einem hohen Abstraktionsniveau, sowohl an die eigentlichen Forschungsdaten als auch an die beschreibenden Metadaten, um Forschenden das Auffinden und die sinnvolle Interpretation der wiederverwendeten Daten zu ermöglichen.

Im folgenden Text wird der Ansatz von Coscine zur Anwendung der FAIR-Prinzipien auf die in Coscine verwalteten Forschungsdaten beschrieben.

Auffindbarkeit (Findability)

F1. (Meta-)Daten erhalten eine global eindeutige und dauerhafte Kennung. Dieses Prinzip wird durch die Verwendung von Coscine umgesetzt. Coscine implementiert das FAIR Digital Object Concept, um gespeicherte Daten in prägnanten digitalen Einheiten darzustellen. Coscine vergibt für jedes Projekt und jede Ressource (einschließlich Daten und Metadaten) eine handle-basierte ePIC-PID . Einzelne Dateien werden mit Metadatenprofilen beschrieben, von denen jedes RDF-Triple PIDs enthält, die durch Erweiterung der Handle-URL zu den beschriebenen Daten führen.

F2. Daten werden mit umfangreichen Metadaten beschrieben (siehe auch R1 unten).
Dieses Prinzip muss in erster Linie von den Nutzern angewendet werden. Coscine unterstützt Forschende durch die Bereitstellung einer umfangreichen Metadatenverwaltungsumgebung, die Zugang zu disziplinspezifischen Metadatenprofilen bietet. Die Metadaten werden auf der Grundlage der Verfeinerungen der einzelnen Metadatenprofile automatisch auf Vollständigkeit geprüft. Der Umfang der Metadaten(z. B. die Wahl des Metadatenprofils) liegt in der Hand der Forschenden - sie müssen geeignete bereichsspezifische Metadatenprofile auswählen und die Felder mit umfangreichen Metadaten füllen. Bei der Beantragung von Speicherplatz prüfen die Reviewer jedoch, ob das gewählte Metadatenprofil (hinsichtlich der Menge) für die hinzugefügte Datenmenge ausreicht. Wenn Forschende den S3-Zugang zu einer Speicherressource nutzen und keine Metadatenprofile in Coscine ausfüllen, müssen alle Daten zumindest mit einer README-Datei versehen werden, damit potenzielle Nachnutzende feststellen können, ob diese nützlich sind.

F3. Metadaten erhalten eindeutig und explizit die Kennung der von Ihnen beschriebenen Daten.
Dieses Prinzip wird durch die Verwendung von Coscine umgesetzt. In Coscine werden einzelne Dateien mit Metadatenprofilen beschrieben, von denen jedes RDF-Triple PIDs enthält, die zu den beschriebenen Daten führen.

F4. (Meta)Daten werden in einer durchsuchbaren Ressource registriert oder indiziert.
Dieses Prinzip wird teilweise durch die Verwendung von Coscine umgesetzt. Die (Meta-)Daten werden in einem internen Suchindex indiziert. Durch die Umsetzung von FAIR Digital Objects in Coscine werden die Metadaten im PID-Datensatz verlinkt und können von außen aufgelöst werden. Eine feingranulare Indizierung und Auffindbarkeit z.B. über die Google-Datensatzsuche wird jedoch noch nicht unterstützt.

Zugänglichkeit (Accessibility)

Alle Prinzipien der Zugänglichkeit werden über unsere Standard-Webschnittstelle und die Coscine-API umgesetzt.

A1. (Meta-)Daten können anhand ihrer Kennung unter Verwendung eines standardisierten Kommunikationsprotokolls abgerufen werden.
Durch die Auflösung der PID eines Projekts oder einer Ressource landen die Nutzenden auf einer PID-Kontaktseite und können eine Einladung zu dem zugehörigen Projekt anfordern. Nachdem sie über einen Projektbesitzenden Zugang zum Projekt erhalten haben, können die Nutzenden verschiedene Kommunikationsprotokolle verwenden, um die (Meta-)Daten abzurufen: entweder über den Browser oder über unsere REST-API mit offener API-Spezifikation. Je nach Ressourcentyp können die Daten auch direkt über eine S3-Schnittstelle abgerufen werden.

A1.1. Das Protokoll ist offen, kostenlos und universell implementierbar.
Dieses Prinzip wird durch die Verwendung von Coscine umgesetzt. Coscine bietet offene, freie und universell implementierbare Protokolle für den Zugriff auf Projekte, Ressourcen und (Meta-)Daten entweder über einen Browser oder unsere REST-API mit offener API-Spezifikation. Je nach Ressourcentyp kann auf die Daten auch direkt über eine S3-Schnittstelle zugegriffen werden. Auf unserer Entwicklungs-Roadmap steht auch die Implementierung einer Linked-Data-Plattform-konformen API und die Ermöglichung von SPARQL-Abfragen für Coscine-Nutzende auf ihre projektbezogenen Ressourcen.

A1.2. Das Protokoll ermöglicht bei Bedarf ein Authentifizierungs- und Autorisierungsverfahren.
Dieses Prinzip wird durch die Verwendung von Coscine umgesetzt. Alle Coscine-REST-Endpunkte unterstützen Authentifizierung und Autorisierung. Coscine ermöglicht projektspezifische Zugriffsrechte (Lesen, Schreiben). Anwendungen können über ein Bearer-Token im Namen von Nutzenden agieren. Die obligatorische Registrierung von Projektteilnehmenden stellt die Authentifizierung aller Dateneigentümer und Mitwirkenden für jeden Datensatz sicher, während das Rollenmanagement die Definition von nutzendenspezifischen Rechten ermöglicht.

A2. Auf Metadaten kann zugegriffen werden, auch wenn die Daten nicht mehr verfügbar sind.
Dieses Prinzip wurde durch die Verwendung von Coscine bereits teilweise umgesetzt. Einzelne Metadaten für Dateien werden versioniert und sind unabhängig von der Datei zugänglich. Die PID Kernel Record Information für jedes Projekt und jede Ressource bleibt auch nach dem Löschen der Dateien zugänglich. Diese Datensatzinformationen enthalten die folgenden Metadaten: Für private Projekte: digitaler Objektstandort (Coscine-API-Adresse) und digitaler Objekttyp (Ressource oder Projekt); für öffentliche Projekte: Erstellungsdatum, digitaler Objektstandort (Coscine-API-Adresse) und digitaler Objekttyp (Ressource oder Projekt), Lizenz, Kontaktorganisation (ROR-ID), Thema (DFG Fachkollegium). Diese Datensatzinformationen können über handle.net oder das FAIR-DOScope aufgelöst werden. Einzelne Metadaten sind nicht mehr zugänglich, wenn die zugehörige Ressource gelöscht wurde. Die Entwicklung eines Grabsteins für die Coscine PID-Landing Page, der mehr Metadaten zu gelöschten öffentlichen Projekten und Ressourcen enthält, steht auf unserer Entwicklungs-Roadmap.

Interoperabilität (Interoperability)

I1. (Meta-)Daten verwenden eine formale, zugängliche, gemeinsame und allgemein anwendbare Sprache zur Wissenspräsentation.
Dieses Prinzip muss in erster Linie von den Nutzenden angewendet werden. Coscine unterstützt Forschende durch die Bereitstellung von Metadatenprofilen, die aufgrund ihrer technischen Darstellung und Validierung über die W3C-Standards RDF und SHACL maschinenlesbar sind. Entscheiden sich Forschende jedoch für die Verwendung ihrer eigenen Metadaten-Einreichungsformate, sind sie für die Wahl formaler, zugänglicher, gemeinsamer und allgemein anwendbarer Sprachen verantwortlich. Bei der Beantragung von Speicherplatz werden die technischen Reviewer die gewählten Sprachen für die Metadaten prüfen und gegebenenfalls bessere Sprachen verlangen. Für die hochgeladenen Daten werden keine Kontrollen durchgeführt.

I2. (Meta)daten verwenden Vokabulare, die den FAIR-Prinzipien folgen.
Dieses Prinzip wird teilweise von Coscine angewandt, muss aber auch von den Nutzenden angewendet werden. Auf der Projekt- und Ressourcenebene verwendet Coscine ROR-IDs zur Identifizierung der teilnehmenden Organisationen. Coscine integriert die AIMS-Plattform für die Erstellung von Metadatenprofilen, die mit Terminologiediensten verknüpft sind, welche die Verwendung von fachspezifischer Terminologie fördern. AIMS wird von der DFG gefördert mit dem Ziel, Metadatenprofile zu harmonisieren und austauschbar zu machen. Coscine bietet Metadatenprofile mit Vokabularen, die den FAIR-Prinzipien folgen, z. B. das EngMeta-Profil. Wenn Nutzende jedoch eigene Metadatenprofile mit individuellen Feldern erstellen, liegt die Verwendung von FAIR-Vokabularen in ihrer Hand. Bei der Beantragung von Speicherplatz prüfen die technischen Reviewer, ob das gewählte Metadatenprofil hinsichtlich der Vokabulare angemessen gestaltet ist. Für die hochgeladenen Daten werden keine Kontrollen durchgeführt.

I3. (Meta-)Daten enthalten qualifizierte Verweise auf andere (Meta-)Daten.
Dieses Prinzip muss in erster Linie von den Nutzenden angewendet werden. Die Nutzenden können den Metadatenprofilen entsprechende Felder hinzufügen, um auf andere (Meta-)Daten zu verweisen. Das in Coscine verwendete RDF-Metadatenmodell verknüpft die verwendeten Terminologien direkt und ermöglicht die Traversierung nach W3C-Linked-Data-Standards. Die Erweiterung der Metadatenprofile, um feste Verweise auf andere (Meta-)Daten zu ermöglichen, steht auf unserer Coscine-Entwicklungs-Roadmap.

Wiederverwendbarkeit (Reuse)

R1. Meta(daten) werden mit einer Vielzahl genauer und relevanter Attribute ausführlich beschrieben.
Dieses Prinzip muss in erster Linie von den Nutzenden angewandt werden. Die Wiederverwendbarkeit von Forschungsmetadaten (z.B. die Wahl des Metadatenprofils) liegt in der Hand der Forschenden. Mit Hilfe aller Elemente, Typen und Attribute des gewählten Metadatenprofils kann eine umfassende Beschreibung der Eigenschaften und Herkunft der Forschungsdaten erreicht werden. Coscine bietet solche Profile an, aber die Wahl des Metadatenprofils liegt in der Hand des Forschenden.

Bei der Beantragung von Speicherplatz prüfen die Reviewer jedoch, ob das gewählte Metadatenprofil (hinsichtlich der Menge) für die hinzugefügten Daten ausreichend ist. Wenn Forschende den S3-Zugang zu ihrer Speicherressource nutzen und keine Metadatenprofile in Coscine ausfüllen, müssen alle Daten zumindest mit einer README-Datei versehen werden, damit potenzielle Nachnutzende feststellen können, ob diese nützlich sind.

R1.1. (Meta-)Daten werden mit einer eindeutigen und zugänglichen Datennutzungslizenz veröffentlicht.
Dieses Prinzip muss in erster Linie von den Nutzenden angewendet werden. Coscine bietet die Möglichkeit, jeder Ressource eine Lizenz hinzuzufügen. Die Lizenzen müssen jedoch von den Nutzenden ausgewählt werden und sind nicht obligatorisch. Wenn eine Lizenz gewählt wird - und das Projekt und die Ressource öffentlich sind - wird sie auch zu den PID-Datensatzinformationen hinzugefügt.

R1.2. (Meta-)Daten sind mit detaillierten Informationen über die Entstehung versehen.
Dieses Prinzip wird von Coscine teilweise erfüllt und muss teilweise von den Nutzenden angewendet werden. Die technische Versionierung von Metadaten wird über die API implementiert. Die technische Versionierung von Daten wird für die Ressourcentypen DataStorage.nrw implementiert. Die Beschreibung des Arbeitsablaufs, der zur Sammlung und Verarbeitung der Daten geführt hat, wird von Coscine nicht erzwungen und liegt in den Händen der Forschenden, wenn sie das Projekt, die Ressource und die Metadaten beschreiben.

R1.3. (Meta-)Daten entsprechen domänenrelevanten Community-Standards.
Dieses Prinzip muss in erster Linie von den Nutzenden angewendet werden. Coscine bietet eine breite Palette von Metadatenprofilen aus verschiedenen Domänen, mit einer technischen Darstellung und Validierung über die W3C-Standards RDF und SHACL. Coscine integriert die AIMS-Plattform für die Erstellung solcher Metadatenprofile, die mit Terminologiediensten verknüpft sind, welche die Verwendung von fachspezifischer Terminologie fördern. Die erstellten Metadatenprofile können von anderen Forschenden wiederverwendet werden und sind unter einer offenen Lizenz öffentlich zugänglich. Die projekt- und ressourcenbasierten Metadaten sowie das am häufigsten verwendete Metadatenprofil „Base“ basieren auf dem disziplinunabhängigen Standard DublinCore. Für die PID-Datensätze wurde ein disziplinunabhängiger Metadatensatz vereinbart, um die Wiederverwendbarkeit für jede Domäne zu verbessern (siehe A2). Da es sich bei Coscine jedoch um eine generische Plattform handelt, müssen die Forschenden bei der Erstellung individueller Metadatenprofile sicherstellen, dass sie geeignete Metadatenprofile für ihre Domäne auswählen oder auf geeignete kontrollierte Vokabulare zurückgreifen.


  1. Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. Deutsche Forschungsgemeinschaft. (2019) ↩︎

  2. Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). ↩︎

  3. NRW HG § 3 Abs. 1 ↩︎