Das GHGA Metadatenmodell

Mit diesem Modell soll die Community dabei unterstützt werden, die von ihr eingereichten genomischen Daten umfassend zu beschreiben. Gleichzeitig soll es Forschenden helfen, für sie interessante Daten abzurufen. Um dies zu erreichen, konzentrieren wir uns darauf, die Metadatenl auffindbar, zugänglich, interoperabel und wiederverwendbar (FAIR) zu machen, indem wir etablierte und weit verbreitete ontologische Konzepte und Terminologien verwenden. Alle Ontologien und Terminologien werden auf der Grundlage ihrer Instandhaltung  und ihres Inhalts mit maximaler Auflösung mit Hilfe von https://fairsharing.org bewertet. 

Die Implementierung unseres Metadatenmodells erfolgt mit der Linked Data Modelling Language (LinkML) und ist auf dem GHGA GitHub Repository für jeden offen zugänglich. Hier können Sie jede neue Version des Modells verfolgen und auf das yaml-Schema und die automatisch generierten Excel-Vorlagen zugreifen. en. Eine ausführliche Dokumentation des GHGA-Metadatenmodells und der dazugehörigen Hilfsmittel finden Sie in der GHGA-Benutzerdokumentation. Dort haben wir Informationen zusammengestellt, die zum Verständnis des GHGA-Metadatenmodells beitragen sollen. Sie enthält neben der Beschreibung des Modells auch Erklärungen der zugrunde liegenden Konzepte und Standards.

Die Modellklassen stellen die Interoperabilität sicher und bieten Flexibilität, um verschiedene Arten von Experimenten und Analysen abzudecken. Die Klassen sind nach Funktionalität gruppiert: 

Die Forschungsmetadaten (Research Metadata) konzentrieren sich auf die Wiederverwendbarkeit und FAIRness der Daten, während die administrativen Metadaten die Bedingungen und das Komitee für den Datenzugriff beinhalten.

Forschungs-Metadaten (Research Metadata)

  • Individual, Biospecimen und Sample sammeln Metadaten über die im Experiment verwendeten Proben und deren Herkunft. Dies umfasst nicht-personenbezogene Daten über die Person, von der die Proben entnommen wurden, und Details über das Biomaterial, aus dem die Proben gewonnen wurden.
  • Experiment und Experiment Method beschreiben den experimentellen Aufbau oder das Protokoll, das zur Durchführung des Omics-Experiments verwendet wurde. Die Durchführung des Experiments generiert Forschungsdatensätze.
  • Analysis und Analysis Method erfassen Einzelheiten über den Analyseprozess oder Arbeitsablauf, der zur Erzeugung von Ausgabedateien (verarbeitete Dateien) aus Forschungsdatensätzen verwendet wurde.

Administrative Metadaten

  • Dataset ist ein Container für Dateien. Dateien in einem Datensatz sind eine teilbare Einheit, die durch eine Datenzugangsrichtlinie kontrolliert wird.
  • Data Access Policy und Data Access Committee erfassen Informationen über die Richtlinie, unter der Datenzugang und -wiederverwendung gewährt werden, sowie darüber, wer die Richtlinie verwaltet und Anfragen zum Datenzugang beantwortet.
  • Study und Publication beschreiben, warum die Daten gesammelt wurden und wo zugehörige Artikel veröffentlicht sind.

 

Die Daten können unter Verwendung des GHGA Submission Spreadsheet eingereicht werden. Dieses spiegelt den Metadatenkatalog wider und ermöglicht es dem GHGA-Datenportal, wertvolle Informationen über einen eingereichten Datensatz durch die Verknüpfung aller Kategorien anzuzeigen. Reichhaltig beschriebene Metadaten werden dazu beitragen, die Datensätze der Einreicher zu verbreiten und die Gemeinschaft zur Wiederverwendung der Daten zu ermutigen.