Die GHGA Dateninfrastruktur ist als föderiertes Netzwerk aufgebaut: es besteht aus einem zentralen Koordinationsstelle (GHGA Central) sowie mehreren GHGA-Datenknoten (GHGA Data Hubs). Diese befinden sich an sieben Standorten in ganz Deutschland.
Das GHGA-Datenportal dient als zentrale Anlaufstelle für den Up- und Download und die Analyse von Genomdaten. Hinter den Kulissen wird die Datenverarbeitung durch GHGA Central sowie die GHGA Datenknoten koordiniert.
Die GHGA Datenknoten werden von Universitäten und Forschungseinrichtungen betrieben. Sie sind mit lokalen Genomforschungszentren verbunden, die Genomdaten über GHGA verfügbar machen. Diese Knoten agieren als Auftragsverarbeiter und stellen die für den Betrieb der Forschungsplattform notwendigen IT-Ressourcen zur Verfügung. Dazu gehören Speicher- und Computing-Systeme, sowie das Personal für den Betrieb und die Wartung dieser Ressourcen.
Aktuell befinden sich GHGA Datenknoten an sieben Standorten:
Aufgrund der sensiblen Natur der archivierten Genomdaten sind alle GHGA Datenknoten verpflichtet, ein Höchstmaß an Datensicherheit zu gewährleisten. Zu diesem Zweck werden die Daten während der Übertragung und Speicherung verschlüsselt. Die eingesetzte Software basiert auf neuesten Sicherheitskonzepten wie dem Zero Trust Security-Prinzip. Darüber hinaus führen die Standorte regelmäßige Sicherheitsaudits sowie Penetrationstests durch und setzen die erarbeiteten Sicherheitsstandards in einem Managementsystem für Informationssicherheit (ISMS) um. Als Konsortialführer des GHGA genehmigt und prüft das DKFZ die GHGA Datenknoten hinsichtlich der Einhaltung der festgelegten Sicherheitsstandards.
Eine weitere zentrale Rolle spielen die GHGA Datenknoten als Teil der föderierten Datenplattform im Modellvorhaben Genomsequenzierung, die vom Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM) getragen wird. Einige der Knoten betreiben in diesem Rahmen sog. Genomrechenzentren (GRZ).