GHGA Metadaten-Modell Version 0.7.0 veröffentlicht

Im April 2022 haben wir Version 0.7.0 des GHGA-Metadatenmodells veröffentlicht, das eine verfeinerte Metadatenstruktur des GHGA-Metadatenschemas enthält. Zusätzlich haben wir das GHGA Submission Spreadsheet Version 0.7.0 veröffentlicht, das eine strukturierte Möglichkeit bietet, nicht-personenbezogene Metadaten im GHGA Metadatenkatalog zu hinterlegen.

Der Metadaten-Workstream entwickelt das Modell für die in GHGA zu speichernden (Meta)Daten. Es handelt sich um eine gemeinsame Anstrengung der konzeptionellen und technischen Arbeitsgruppen von GHGA. Das Team besteht aus Fachleuten aus verschiedenen Bereichen wie Datenbanktechnologien, rechtlichen Aspekten, Community-Standards und FAIR-Datenprinzipien, die gemeinsam das Konzept der GHGA-Metadaten definieren. 

Das GHGA-Metadatenmodell wurde in GHGAs GitHub-Repository veröffentlicht. Die aktuelle Version des Modells ist eine Weiterentwicklung des bereits im Dezember 2021 veröffentlichten Metadatenmodells. 

Die weitere Auswertung wesentlicher Informationen, wie Spender von Proben, Experimenten und der Analyse von Daten, wird die Wiederverwendbarkeit der bei GHGA hinterlegten Daten weiter erhöhen. Die aktuelle Version konzentriert sich auf die strukturelle Integrität, um spezifische Anwendungsfälle wie z.B. Einzelzellsequenzierungsdaten zu berücksichtigen. Darüber hinaus haben wir mit dem ELSI-Workstream bei GHGA zusammengearbeitet, um sicherzustellen, dass die im GHGA-Metadatenkatalog präsentierten Daten öffentlich zugänglich und anzeigbar sind. Dies ermöglicht es auch dem UI/UX-Workstream, die Präsentation der bei GHGA hinterlegten Datensätze im Datenportal zu entwickeln. Eine enge Zusammenarbeit zwischen beiden Arbeitsgruppen stellt sicher, dass relevante Informationen angezeigt werden, um Datenanforderer bei der Identifizierung von Datensätzen für ihren Forschungsbedarf zu unterstützen.

Gleichzeitig mit der Umsetzung haben wir auch erstmals das Submission Spreadsheet veröffentlicht. Dieses Tabellenblatt umfasst alle Metadaten, die bei GHGA deponiert werden müssen. Verschiedene Kategorien wie "Core", "Sample", "Experiment", "Analysis" und "Files" helfen den data submittern, ihre Daten strukturiert zu übermitteln, damit die GHGA-Dateninfrastruktur die übermittelten Metadaten verarbeiten kann. In einer weiteren Iteration des Arbeitsblatts werden wir den data submittern dabei helfen, indem wir "How To"-Leitlinien bereitstellen.

Dieses Kernmodell wird sich in naher Zukunft weiterentwickeln. Darüber hinaus beginnt der Metadaten-Workstream mit der Planung für die Atlas- und Cloud-Phase von GHGA, um den Bedürfnissen verschiedener Gemeinschaften und Anwendungsfälle gerecht zu werden.