Lediglich 0,1 % der genetischen Informationen unterscheiden sich von Mensch zu Mensch. Diese 0,1% machen uns zu dem, was wir sind. DNA enthält Informationen über Krankheitsrisiken, Geschlecht, ethnische Zugehörigkeit und andere sensible Merkmale. Beim Umgang mit  Omics-Daten ist daher besondere Vorsicht geboten. Zu Forschungszwecken erhobene Daten werden in der Regel pseudonymisiert, einzelne Sequenzen könnten aber zu einer Re-Identifizierung führen. Omics-Daten werden daher in sicheren Archiven aufbewahrt.

Bei Datensicherheit setzt GHGA auf ein mehrschichtiges Konzept. Wir entwickeln eine fortschrittliche Infrastruktur, damit Daten sicher archiviert und weitergegeben werden können. Darüber hinaus erarbeiten wir einen Rahmen für GDPR-konforme Datenverarbeitung und helfen den Datenproduzent:innen die Patient:innen zu informieren und ihre Einwilligung einzuholen. Der kontrollierte, aber FAIRe Datenzugriff ist eine weitere Ebene, mit der wir sicherzustellen, dass die Daten zuverlässig geschützt sind und zugleich ihr Potenzial für die Forschung entfalten können.

IT und Cybersicherheit durch innovative Infrastruktur

Datenmissbrauch zu verhindern ist eine Priorität beim Aufbau unserer Dateninfrastruktur.

Schloss und Wassergraben

Um GHGAs Ansatz beim Thema Datensicherheit zu erläutern, ist es hilfreich, zunächst über traditionelle Sicherheitsmodelle, ihre Annahmen und Auswirkungen nachzudenken.

Üblicherweise sehen wir als Sicherheitsmodell, bildlich gesprochen, vier Mauern um ein Rechenzentrum. Der Datenverkehr läuft durch die Eingangstür, und Firewalls und Anwendungsfilter schützen das Netzwerk. Alles außerhalb dieses "Schlosses" ist potenziell schädlich und nicht vertrauenswürdig. Alles innerhalb ist gut und genießt ein hohes Maß an Vertrauen. Aber es gibt gute Gründe, von diesem Modell abzuweichen.

Zum einen geht das Modell von Schloss und Wassergraben von einem unrealistischen Grad an Perfektion aus: Es setzt voraus, dass nie Fehler passieren. Keine fehlerhafte Konfiguration in Firewalls oder Anwendungsfiltern, keine Lücken wegen veralteter Software, usw. Zum Anderen berücksichtigt das traditionelle Modell keine Gefahren von innen. Es spielt keine Rolle, wie hoch die Mauern sind, wenn sich der Angreifer bereits dahinter befindet. 

Zero-Trust-Netzwerke

Die meisten Datenschutzverletzungen sind auf gestohlene Zugangsdaten, Anwendungsschwachstellen, Schadsoftware, Insider-Bedrohungen, physischen Diebstahl oder menschliche Fehler zurückzuführen. Natürlich ist es nach wie vor sehr wichtig, die Wahrscheinlichkeit all dieser Angriffe zu verringern. Wir können jedoch nicht davon ausgehen, dass das zuvor erläuterte Sicherheitsmodell allumfassend ist. Unser Perimeter mag 95 %, vielleicht 99,9 % abdecken, aber wir können niemals 100 % versprechen. Wir müssen daher davon ausgehen, dass sich unser Gegner bereits im Netzwerk befindet. Standardmäßig können wir niemandem trauen - weder internen noch externen Parteien. Dies führt uns zum Zero-Trust-Networking.

Bei GHGA bauen wir auf einer privaten Cloud-Infrastruktur auf. Alle unsere Anwendungen, Datenverarbeitungsschritte, Datenbanken und Datenspeicher befinden sich physisch an unseren lokalen Datenknoten; werden dort kontrolliert und betrieben. Aber die Tatsache, dass diese Umgebungen privat sind, macht sie nicht automatisch vertrauenswürdig. Wir konzipieren die GHGA-Anwendungen, -Dienste, -Datenspeicher und -Netzwerkkomponenten daher nach dem Zero-Trust-Networking-Modell. Niemandem wird standardmäßig vertraut. Sowohl Menschen als auch Maschinen benötigen eine strenge Überprüfung ihrer Identität, bevor der Zugang gewährt wird.

Dezentralisierte Sichtweise

Da das Deutsche Humangenom-Phänomarchiv ein Gemeinschaftsprojekt mehrerer Omics-Datenverarbeiter ist, birgt das Systemdesign einige Herausforderungen. Als bundesweite Initiative wollen wir ein offenes System schaffen, das es Universitäten, Forschungseinrichtungen und anderen interessierten Parteien ermöglicht, sich anzuschließen und Daten einzureichen oder ein Datenknoten zu werden.  

Dieser Bedarf an Flexibilität bestärkt uns darin, auf offene Standards für Datenverschlüsselung, Authentifizierung und Autorisierung und nicht zuletzt auf Datenschutzbestimmungen zu setzen. Durch die Einführung offener Standards und transparenter Systeme wenden wir uns auch von überholten Paradigmen wie "Sicherheit durch Geheimhaltung" ab. Gute Systemsicherheit sollte nicht von der Geheimhaltung der Umsetzung oder ihrer Komponenten abhängen.

Informationssicherheit gewährleisten

Die sichere Speicherung sensibler Omics-Daten ist mehr als eine Frage der technischen Maßnahmen. Sie umfasst auch organisatorische, personelle und physische Kontrollen. Deshalb führt GHGA ein Informationssicherheitsmanagementsystem (ISMS) ein, das sich an Industriestandards wie ISO27001 orientiert. Dieses ISMS unterstützt GHGA bei der Einhaltung von Hochsicherheitsstandards für die gesamte Organisation und bildet die Grundlage für regelmäßige Sicherheitsinspektionen. Darüber hinaus legt das ISMS Richtlinien und Kontrollen fest, nach denen die föderierten Datenknoten arbeiten.

Der ethisch-rechtliche Rahmen für die Datenverarbeitung

GDPR-konformer Datentransfer

Sensible personenbezogene Daten, wie z. B. humane Omics-Daten, sind durch die europäische Datenschutzgrundverordnung (GDPR) geschützt. Die Auslegung der GDPR richtet sich nach dem Land, in dem die Daten verarbeitet werden. Als deutsche Initiative befasst sich GHGA mit der Rechtsgrundlage für die Datenverarbeitung im nationalen Kontext. 

Die gemeinsame Nutzung von Daten über nationale Grenzen hinweg ermöglicht internationale Zusammenarbeit, die die deutsche Forschung sichtbarer macht und gleichzeitig die Qualität der Wissenschaft verbessert. So wird ein höherer Nutzen für die Bevölkerung erzielt. GHGA engagiert sich daher für die rechtliche Vereinbarkeit der Datenverarbeitung innerhalb der EU und in internationalen Datenräumen. GHGA ist Teil von EU-Initiativen wie FAIR DataSpaces, GDI und der globalen Initiative GA4GH. 

Einverständniserklärung - ein Leitfaden 

In der Regel ist die Einwilligung von Patient:innen und Forschungsteilnehmenden erforderlich, um Omics- und damit verbundene Gesundheitsdaten zu Forschungszwecken weiterzugeben. Wir haben Module entwickelt, die in Einwilligungsformulare integriert werden können. Diese können von Kliniker:innen, Forschenden und Institutionen, die Daten über GHGA austauschen wollen, genutzt werden. Die Module informieren Patient:innen und Forschungsteilnehmenden über die Möglichkeit, ihre Omics-Daten mit Genomarchiven wie GHGA zu teilen. 

In der Vergangenheit eingeholte Einwilligungen - sogenannte Legacy-Einwilligungen - müssen individuell bewertet werden, um die rechtliche Zulässigkeit der gemeinsamen Datennutzung auf ihrer Basis zu bewerten. Um Forschende und Kliniker:innen bei dieser Bewertung zu unterstützen, hat GHGA eine App entwickelt. Darüber hinaus arbeiten die GHGA-Experten an Risikobewertungen, De-Identifizierungs- und Anonymisierungsmethoden, sowie an einem Verhaltenskodex für gemeinsame Datennutzung. 

Gemeinsame Datennutzung aus Sicht der Patient:innen

Zusätzlich zur Einhaltung der Datenschutzgesetze befasst sich GHGA mit den ethischen und sozialen Auswirkungen der gemeinsamen Nutzung von humanen Omics-Daten. Dabei stehen die Patient:innen und andere Datenspendenden im Mittelpunkt der Bemühungen. GHGA prüft aktiv Strategien zur Einbeziehung von Patient:innen in die Konzeption und Verwaltung von GHGA, um eine breite und dauerhafte gesellschaftliche Unterstützung für das Projekt zu erreichen. 

Der offene Dialog und die Zusammenarbeit wurden durch Diskussionsforen angestoßen, in denen die Gründung eines Patient:innenbeirates und eine enge Mitwirkung an Aufklärungsmaßnahmen vereinbart wurden.

Patient:innen möchten die Forschung mit ihren klinischen Daten unterstützen

Omics-Daten sind sensibel, und Patient:innen wissen das. Dennoch sind sie bereit, ihre Daten der Wissenschaft zur Verfügung zu stellen - in der Hoffnung, künftigen Betroffenen mit neuen Entwicklungen und Behandlungsmöglichkeiten zu helfen. Eine Studie mit Krebspatient:innen ergab, dass 97 Prozent grundsätzlich bereit sind, klinische Daten für biomedizinische Forschungszwecke zur Verfügung zu stellen. Die wichtigste Bedingung für ihre Zustimmung? Hohe Datensicherheit. Ein Ziel, das GHGA anstrebt.

Kontrollierter Datenzugriff

Nicht jeder kann auf die bei GHGA gespeicherten Daten zugreifen. Nur nicht-personenbezogene Metadaten sind innerhalb des GHGA-Datenportals öffentlich zugänglich. Forschende, die archivierte Daten nutzen oder personenbezogene Metadaten einsehen möchten, müssen den Zugang bei der zuständigen juristischen Person beantragen - in der Regel bei der Person oder Institution, die die Daten einreicht. Häufig wird ein Datenzugangskomitee (Data Access Committee, DAC) eingesetzt. Dieses Gremium prüft die Rechtmäßigkeit des Antrags bevor der Zugang gewährt wird, und stellt sicher, dass er mit der ursprünglichen Einwilligung der Patient:innen, von denen die Daten stammen, übereinstimmt. Dieser Schritt stellt sicher, dass nur Forschende mit einem legitimen Forschungsvorhaben Zugang zu sensiblen Daten erhalten - eine weitere Schutzebene. 

Forschende oder Institutionen, die Daten an GHGA übermitteln, sind nach wie vor für die Daten selbst verantwortlich. Es ist ihre Entscheidung, wer Zugang zu den Daten erhält. GHGA dient in diesem Prozess als Vermittler. Spezielle Datenverwalter:innen (Data Stewards) an den GHGA-Datenknoten, geschult in den technischen und ethisch-rechtlichen Aspekten im Umgang mit Omics-Daten, werden den Nutzer:innen bei der Einreichung von Daten helfen, sie bei der Bearbeitung von Datenzugangsanfragen beraten und einen sicheren Zugang über verschlüsselte Downloads ermöglichen (siehe Cybersicherheit oben).