Kriterien für die Bewilligung von DataStorage.nrw Speicherplatzanträgen über Coscine
Dieses Dokument, welches sie auch auf Zenodo lesen können, richtet sich an Forschende von teilnehmenden Hochschulen der Digitalen Hochschule NRW (DH.NRW) und durch die NFDI unterstütze Forschende, die einen Antrag für Speicherplatz auf dem DataStorage.nrw für ihr Coscine-Projekt stellen möchten. Es enthält die Kriterien für die Bewilligung von DataStorage.nrw-Ressourcen in Coscine, die das Coscine Service Management basierend auf dem Bewirtschaftungskonzept der FDSI.nrw umgesetzt hat. DataStorage.nrw-Ressourcen in Coscine stehen Forschenden von DH.NRW-Hochschulen zur Verfügung, die die dafür nötigen Verträge unterschrieben haben. Ebenfalls können Forschende mit einer eindeutigen Zugehörigkeit zu einem NFDI-Konsortium Speicherplatz beantragen, wenn eine aktive Betreuung und Begutachtung durch die NFDI beziehungsweise das entsprechende Konsortium gewährleistet ist (beispielsweise durch einen NFDI Data Steward).
Coscine ist eine Plattform für Forschungsdatenmanagement (FDM), die eine strukturierte Ablage, kollaborative Zusammenarbeit sowie eine langfristige Speicherung von Forschungsdaten innerhalb von Forschungsprojekten ermöglicht. Dabei werden die FAIR-Prinzipien implizit durch Coscine unterstützt . Die Speicherplatzbeantragung erfolgt über ein elektronisches Projektantragsverfahren, welches über die Plattform Coscine-JARDS durchgeführt wird . Beim Ausfüllen eines Speicherplatzantrags müssen die im Folgenden beschriebenen Kriterien beachtet werden. Eine Berücksichtigung der aufgelisteten Kriterien ist notwendig für eine positive Begutachtung. Zusätzlich wird dadurch sichergestellt, dass Ihr Antrag möglichst schnell bearbeitet werden kann, da keine oder wenige Rückfragen durch das FDM-Personal nötig sind, um fehlende Informationen bei Ihnen einzuholen.
Im Speicherplatzantrag ist eine Angabe der URL(s) des Coscine-Projekts, welches Speicherplatz erhalten soll, erforderlich. Daher müssen das Projekt sowie mögliche Unterprojekte bereits vor Erstellung des Antrags in Coscine angelegt werden.
Bei Unsicherheiten bezüglich der Speicherung personenbezogener Daten wenden Sie sich bitte vor Antragstellung an einen Datenschutzbeauftragten, um mögliche Anforderungen abklären zu lassen (weitere Details zur Speicherung personenbezogener Daten finden Sie unter Personenbezogene Daten).
Falls Sie Ihren Workflow für die Speicherung von Forschungsdaten und Metadaten in Coscine testen möchten, können Sie ein Testprojekt beim FDM-Personal Ihrer Heimateinrichtung beantragen. Dieses steht Ihnen nach Absprache mit dem jeweiligen FDM-Personal für zwei Monate zur Verfügung. Folgende Informationen benötigt Ihr FDM-Personal dafür:
E-Mail-Adressen aller Testnutzenden
Wie viele Ressourcen von welchem Ressourcentypen werden benötigt?
Welches Metadatenprofil soll für welche Ressource verwendet werden?
Wie viel Speicherplatz soll den einzelnen Ressourcen zugeteilt werden? (Maximum 100 GB Web und 100 GB S3 pro Testprojekt für alle Ressourcen zusammen)
Speicherplatzanträge beginnen mit der verpflichtenden Eintragung von Kontaktinformationen von Principal Investigator (PI) und Person of Contact (PC). Es ist möglich, dieselbe Person als PI und PC einzutragen. Die Person mit dem Status PI muss die Projektverantwortung innehaben (= Owner des beantragten Projektes). Dies obliegt üblicherweise Post-Docs oder Professorinnen und Professoren. Bestmöglich sind PI und/oder PC langfristig verfügbar, um im Rahmen der aktiven Projektlaufzeit und der anschließenden zehnjährigen Archivierung als Ansprechperson erreichbar zu sein.
Die Angabe der Coscine-Projekt URL ist verpflichtend, da sie für die Zuweisung des Speicherplatzes benötigt wird. Orientieren Sie sich bei der Auflistung der Projekte und URLs bitte an diesem Beispiel: https://coscine.rwth-aachen.de/p/testprojekt
Ein Vergabekriterium für DataStorage.nrw-Ressourcen ist die projektbasierte Nutzung. Sie müssen im Abstract deutlich darlegen, dass es sich um ein in sich geschlossenes Forschungsprojekt handelt. Das Forschungsprojekt kann sowohl kurz vor Beginn stehen (maximal drei Monate vorher beantragbar), aktuell laufen oder bereits abgeschlossen sein (Archivierung). Forschungsprojekte müssen zwingend folgende Merkmale aufweisen:
Zeitrahmen:
Ein Forschungsprojekt ist zeitlich begrenzt. Der Beginn und das Ende werden in den zugehörigen Metadaten festgelegt. Nachträgliche Änderungen der Projektlaufzeit werden durch Coscine registriert und geprüft.
Forschungsdaten:
Die gesammelten Daten haben einen klaren inhaltlichen Zusammenhang. Dies muss sich in einheitlichen Metadaten für Forschungsprojekte widerspiegeln. Die Bedingungen und Voraussetzungen für das Beitragen von Daten sind definiert. Qualitätssichernde Prozesse sind definiert und werden umgesetzt.
Akteure:
Projekte werden von einer definierten Gruppe von Personen durchgeführt, deren Zusammensetzung sich im Verlauf ändern kann. Es gibt eine oder mehrere leitende Personen (Principle Investigator = PI), die üblicherweise über die Laufzeit konstant ist / sind. Personen, die Speicherplatz auf dem DataStorage.nrw hauptverantwortlich beantragen und nutzen, haben eine Anstellung an einer Hochschule in der DH.NRW oder einen direkten Bezug zu einem NFDI-Konsortium.
Organisatorische Verortung:
Ein Forschungsprojekt ist an einer oder mehreren Forschungseinrichtungen verortet. Im Falle von mehreren beteiligten Einrichtungen ist eine von Ihnen konsortialführend und muss primär dem Projekt zugeordnet sein.
Diese Merkmale ermöglichen die Behandlung der Forschungsdaten gemäß dem Datenlebenszyklus. Forschungsdaten von Projekten, die bereits an anderer Stelle durch eine anerkannte Organisation langfristig verfügbar gehalten werden, dürfen nicht doppelt gespeichert werden.
Ressourcentypen: Alle
Die Angabe des benötigten Speicherplatzes erfolgt in Gigabyte (GB). Für eine Bewilligung muss die Speicherplatzmenge in einem sinnvollen Verhältnis zu der Projektbeschreibung sowie den Dateiformaten und Dateimengen stehen. Geben Sie daher bitte so detailliert wie möglich an, ob bereits Daten im Rahmen des Forschungsprojektes erhoben wurden und wenn ja, nennen Sie die grobe Anzahl der Dateien sowie die bereits aufgewendete Speicherplatzmenge. Schätzen Sie bitte bestmöglich ab, wie viele Dateien in welcher Größenordnung für das Forschungsprojekt generiert wurden und / oder noch generiert werden. Beispiel:
| Speicherumfang | Projektlaufzeit | Archivierungszeit | Kosten |
|---|---|---|---|
| 0,5 TB | 3 Jahre | 10 Jahre | Ca.257 € |
| 1 TB | 3 Jahre | 10 Jahre | Ca. 515 € |
| 10 TB | 3 Jahre | 10 Jahre | Ca. 5148€ |
| 125 TB | 3 Jahre | 10 Jahre | Ca. 64350€ |
Ressourcentypen: Alle
Eine Vererbung von Speicherplatz von Hauptprojekt zu Unterprojekt ist in Coscine zurzeit nicht möglich. Demnach müssen im Speicherplatzantrag auch alle Unterprojekte aufgelistet werden, die Speicherplatz benötigen. Hierbei ist wichtig, dass
Ressourcentypen: Alle
Auf dem DataStorage.nrw können alle derzeit bekannten Dateitypen gespeichert werden und es gibt diesbezüglich keine Einschränkungen.
Ressourcentypen: Alle
Die Speicherung personenbezogener Daten auf dem DataStorage.nrw ist grundsätzlich nicht ausgeschlossen. Es liegt jedoch in der Verantwortung der Forschenden, für ihre konkreten Forschungsdaten zu prüfen, ob diese hier abgelegt werden dürfen und welche zusätzlichen Sicherheitsmaßnahmen erforderlich sind (siehe auch Sicherheitsmaßnahmen für personenbezogene Daten).
Ressourcentypen: Alle
Basierend auf den Förderrichtlinien des DataStorage.nrw müssen alle dort gespeicherten Daten mit Metadaten beschrieben werden. Für die Eintragung von Metadaten werden in Coscine Metadatenprofile verwendet. Sie können bereits verfügbare Metadatenprofile bei der Erstellung von Ressourcen auswählen oder individuelle Metadatenprofile erstellen.
Bei der Nutzung von S3-Ressourcen können neben Metadatenprofilen auch andere Annotationen von Daten mit Metadaten gewählt werden, diese müssen im Antrag (siehe Ort der Metadatenablage und Metadaten-Annotation) jedoch detaill
Basierend auf den Förderrichtlinien des DataStorage.nrw müssen alle dort gespeicherten Daten mit Metadaten beschrieben werden. Für die Eintragung von Metadaten werden in Coscine Metadatenprofile verwendet. Sie können bereits verfügbare Metadatenprofile bei der Erstellung von Ressourcen auswählen oder individuelle Metadatenprofile erstellen.
Bei der Nutzung von S3-Ressourcen können neben Metadatenprofilen auch andere Annotationen von Daten mit Metadaten gewählt werden, diese müssen im Antrag (siehe Ort der Metadatenablage und Metadaten-Annotation) jedoch detailliert beschrieben werden.
Ressourcentypen: Alle
Im Speicherplatzantrag muss der Hauptgrund der Nutzung von Coscine angegeben werden. Dies erleichtert begutachtenden Personen den Stand des jeweiligen Forschungsprojekts besser einschätzen zu können.
Ressourcentypen: S3 & WORM
Hierbei geht es um die Beschreibung der geplanten Dateneinlieferung, zum Beispiel über die Weboberfläche, die REST-API oder S3-Clients. Falls automatisierte Prozesse für die Einlieferung der Daten geplant sind, müssen diese hier beschrieben werden. Insbesondere bei bereits abgeschlossenen Projekten, die Coscine für die Archivierung nutzen wollen, kann ein bereits erstellter Datenmanagementplan (DMP) als PDF angehängt werden. Dies erspart Ihnen Zeit bei der Beschreibung und beschleunigt den Begutachtungsprozess.
Ressourcentypen: S3 & WORM
Hier beschreiben Sie, woher Ihre Daten stammen, beispielsweise aus einem Mikroskop, einer Literaturrecherche, etc. und wie diese von Coscine (bzw. dem DataStorage.nrw) aus für Ihr Projekt weitergenutzt werden. Falls der Workflow sehr komplex ist, kann zusätzlich ein PDF mit einer Grafik des Workflows im Antrag hochgeladen werden.
Ressourcentypen: S3 & WORM
Legen Sie in diesem Abschnitt des Fragenkatalogs dar, wie die Dateneinlieferung erfolgt: z. B. über die Weboberfläche, die REST-API oder S3-Clients. Falls Sie eine Dateneinlieferung über die Weboberfläche planen und einen Antrag für S3-Ressourcen stellen, legen Sie bitte ausführlich dar, wieso in diesem Fall eine Web-Ressource Ihren Bedarf nicht erfüllen kann. Sollten Sie einen S3-Client für das Hochladen von Dateien nutzen wollen, nennen Sie welchen (z.B. Cyberduck). Falls für Ihr Forschungsprojekt bereits ein anderer Workflow existiert, beschreiben Sie diesen bitte so ausführlich wie möglich.
Ressourcentypen: S3 & WORM
Basierend auf den Förderrichtlinien, müssen Daten auf dem DataStorage.nrw geordnet und nach einer abgestimmten Struktur abgelegt werden. Bitte beschreiben Sie Ihre Datenstruktur, also unter anderem wie Dateien abgelegt und gespeichert werden oder wie ihre Auffindbarkeit gewährleistet ist. Hierbei ist es wichtig, dass aus der Beschreibung hervorgeht, wie die Daten auch in kommenden Jahren noch auffindbar sein werden.
Ressourcentypen: Alle
Basierend auf den Förderrichtlinien des DataStorage.nrw müssen alle dort gespeicherten Daten mit Metadaten beschrieben werden. Die begutachtenden Personen benötigen eine klare Beschreibung des bereits etablierten oder in Zukunft geplanten Workflows zur Einlieferung von Metadaten. Bei der Nutzung von Web-Ressourcen wird die Eintragung der Metadaten in einem Metadatenprofil über die Weboberfläche oder die REST-API erzwungen. Bei der Nutzung von S3-Ressourcen können neben Metadatenprofilen auch andere Annotationen von Daten mit Metadaten gewählt werden, diese müssen im Antrag jedoch detailliert beschrieben werden.
Die Darstellung der gewählten Beschreibung von Daten mit Metadaten stellt ein Hauptkriterium für die Zustimmung oder Ablehnung des Antrags dar!
Die folgenden Orientierungsfragen können Ihnen dabei helfen die Fragen im Speicherplatzantrag zur Metadatenablage und -annotation so detailliert und zielführend wie möglich zu beschreiben. Sollten Sie eine Abbildung zu dem (geplanten) Workflow der Speicherung von Metadaten in Ihrem Forschungsprojekt vorliegen haben, fügen Sie diese gerne im Antrag ein.
Orientierungsfragen:
An welchen Stellen im Projektablauf werden Metadaten gesammelt und gespeichert?
Wird ein bereits existierendes Metadatenprofil aus Coscine verwendet?
Wurde ein eigenes Metadatenprofil erstellt? Falls ja, bitten wir hier um Angabe des Merge Requests im Git-Respositorium sowie des exakten Profilnamens. Geben Sie bitte außerdem eine kurze Begründung, warum Sie sich für das neue Metadatenprofil entschieden haben.
Falls der Antrag für S3 gestellt wurde: Bitte beschreiben Sie detailliert den Workflow, wie Metadaten gespeichert werden. Haben Sie (Teil-)Schritte dafür automatisiert, z. B. über ein Skript?
Wie werden die Forschungsdaten mit den Metadaten verknüpft?
WORM (Write Once, Read Many) -Ressourcentypen stehen für die Speicherung von Forschungsdaten zur Verfügung, die einen zwingend hohen Schutzbedarf in Bezug auf Unveränderbarkeit erfordern. Abgelegte Dateien in diesem Ressourcentyp können nach dem Upload weder verändert noch gelöscht werden. Der Zugriff auf die Daten erfolgt äquivalent zum S3-Ressourcentyp (siehe 3.2.2 S3). Neben der dadurch nicht erzwungenen Metadaten-Verwaltung kommt beim WORM-Ressourcentyp die hohe Verantwortung gegenüber hochgeladenen Dateien hinzu, da keine Löschung möglich ist (beispielsweise bezüglich personenbezogener Daten). Daher ist hierbei der Speicherplatzantrag über Coscine-JARDS immer erforderlich und am umfangreichsten. Bei WORM-Ressourcen ist eine Löschung der Daten für mindestens fünf Jahre nicht möglich. Dies hängt mit dem Wechselzyklus der dahinterliegenden Hardware zusammen. Daher müssen Sie darlegen, dass Sie alle Rechte an den Daten besitzen und bei personenbezogenen Daten das Recht auf Löschung gemäß Art. 17 DSGVO nicht gilt. Bei der Nutzung von WORM-Ressourcen muss Ihnen bewusst sein, dass alle Projekt-Owner und -Member in Coscine die Möglichkeit haben werden, Dateien in dieser Ressource hochzuladen und somit Speicherplatz zu belegen. Dadurch müssen Sie sicherstellen, dass sowohl Ihnen als auch allen Projektmitgliedern die Tragweite der fehlenden Löschmöglichkeit für fünf Jahre bewusst ist.