Das GHGA Metadatenmodell

Das GHGA-Metadatenmodell unterstützt die wissenschaftliche Gemeinschaft dabei, die von ihr eingereichten Genomdaten umfassend zu beschreiben. Gleichzeitig hilft es Forschenden, relevante Daten zu finden und abzurufen. Um dies zu ermöglichen, konzentrieren wir uns darauf, die Metadaten auffindbar, zugänglich, interoperabel und wiederverwendbar (FAIR) zu machen. Dabei nutzen wir etablierte und weit verbreitete ontologische Konzepte und Terminologien, die wir in enger Zusammenarbeit mit unseren Partnern definiert haben.

Technische Umsetzung und Dokumentation

Das GHGA-Metadatenmodell wird mit der Linked Data Modelling Language (LinkML) implementiert und ist im GHGA GitHub Repository frei zugänglich. Hier können Sie jede neue Version des Modells verfolgen sowie auf das Schema und automatisch generierte Excel-Vorlagen zugreifen.

Eine ausführliche Dokumentation des GHGA-Metadatenmodells und der dazugehörigen Hilfsmittel, einschließlich Beschreibungen des Modells selbst und der  zugrunde liegenden Konzepte und Standards, finden Sie in der GHGA-Nutzer*innendokumentation.

 
Struktur des Metadatenmodells

Die Modellklassen gewährleisten Interoperabilität und bieten gleichzeitig genügend Flexibilität, um verschiedene experimentelle Ansätze und Analysen abzudecken. Die Klassen sind nach Funktionalität gruppiert: 

Die Forschungsmetadaten (Research Metadata) konzentrieren sich auf die Wiederverwendbarkeit und FAIRness der Daten, während die administrativen Metadaten die Bedingungen und das Komitee für den Datenzugriff beinhalten.

Forschungs-Metadaten (Research Metadata)

  • Individual, Biospecimen und Sample sammeln Metadaten über die im Experiment verwendeten Proben und deren Herkunft. Dies umfasst nicht-personenbezogene Daten über die Person, von der die Proben entnommen wurden, und Details über das Biomaterial, aus dem die Proben gewonnen wurden.
  • Experiment und Experiment Method beschreiben den experimentellen Aufbau oder das Protokoll, das zur Durchführung des Omics-Experiments verwendet wurde. Die Durchführung des Experiments generiert Forschungsdatensätze.
  • Analysis und Analysis Method erfassen Einzelheiten über den Analyseprozess oder Workflow, der zur Erzeugung von Ausgabedateien (verarbeitete Dateien) aus Forschungsdatensätzen verwendet wurde.

Administrative Metadaten

  • Dataset ist eine Sammlung von Dateien, deren Zugriff durch eine spezifische Datenzugriffssrichtlinie geregelt wird.
  • Data Access Policy und Data Access Committee erfassen Informationen zu den Richtlinien für den Datenzugriff sowie zur verantwortlichen Person oder Institution, die Anfragen zum Datenzugriff prüft und beantwortet.
  • Study und Publication beschreiben, warum die Daten gesammelt wurden und wo zugehörige Artikel veröffentlicht sind.

 

Die Metadaten können mithilfe des GHGA Submission Spreadsheet eingereicht werden. Dieses spiegelt das GHGA-Metadatenmodell wider und ermöglicht es dem GHGA-Datenportal, wertvolle Informationen über einen eingereichten Datensatz durch die Verknüpfung aller Kategorien anzuzeigen. Reichhaltig beschriebene Metadaten verbessern die Auffindbarkeit und erleichtern die Wiederverwendung der Daten innerhalb der Forschungsgemeinschaft.