Das GHGA-Bioinformatik-Team arbeitet kontinuierlich daran, standardisierte, vergleichbare und reproduzierbare Omics-Workflows (standardisierte Abläufe für die Datenanalyse) für die Forschungsgemeinschaft bereitzustellen. In enger Zusammenarbeit mit der nf-core-Gemeinschaft verbessern wir bestehende Workflows und entwickeln Best-Practices für Reproduzierbarkeit und Zuverlässigkeit. Dies ermöglicht Forschenden und Kliniker*innen, komplexe Omics-Daten effizient und präzise zu analysieren. Im Folgenden stellen wir die bereits publizierten Workflows vor, an denen GHGA beteiligt war.
Für Einsteiger empfehlen wir Bytesize - eine von nf-core veröffentlichte Video-Tutorial-Serie, die eine leicht verständliche Einführung in die Anwendung von nf-core Workflows bietet
Ein kontinuierliches Benchmarking, also der Vergleich von Arbeitsabläufen anhand bekannter Standards, ist entscheidend für die Präzision und Zuverlässigkeit von Workflows und ein zentraler Bestandteil der Qualitätssicherung in der Bioinformatik. GHGA trägt zu verschiedenen Benchmarking-Bemühungen bei, die darauf abzielen, die Leistung und Genauigkeit bioinformatischer Workflows zu bewerten..
Ein Beispiel ist NCBench, eine gemeinsam mit dem Next Generation Sequencing Competence Network (NGS-CN) entwickelte Plattform für das kontinuierliche Benchmarking von Workflows zur Bestimmung genomischer Varianten. NCBench bietet einen umfassenden und reproduzierbaren Benchmarking-Workflow zur Bewertung kleiner genomischer Variantenbestimmungen in Bezug auf Präzision und falsch positiver/negativer Fehlermuster. Der kontinuierliche Open-Source-Ansatz macht eine spezielle Infrastruktur überflüssig und Benchmarking damit für die Forschungs- und Diagnostikgemeinschaft, aber auch für Patient:innen, zugänglich und transparent.
Pipeline zur Bestimmung von somatischen und Keimbahn-Varianten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Bestimmung von Varianten mit öffentlichen Ressourcen und Analyseparameter-Einstellungen.
Mehr erfahrenMethode zur Analyse von Long-Read-Sequenzierung von nf-core mit Schwerpunkt auf der Oxford Nanopore-Technologie - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisiertes Long-Read-Alignment und QC.
Mehr erfahrenSnakemake Pipeline zur Erkennung von abweichenden RNA-Ereignissen - Eine Methode zur Verarbeitung und Interpretation von RNA-Seq-Daten sowie zur Erkennung von Abweichungen bei Seltenen Erkrankungen, z.B. Änderungen in Spleißen und Expressionsleveln.
Mehr erfahrenEine Nextflow-basierte Pipeline zum Erkennen und Priorisieren von somatischen Indels mit umfangreichen Qualitätskontroll- und Filterungsschritten. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.
Mehr erfahrenNextflow-Pipeline zum Erkennen und Priorisieren von somatischen Einzelnukleotid-Variationen mit Filtermöglichkeiten, Annotationen und Diagrammen. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.
Mehr erfahrenNextflow-Pipeline zur Schätzung allelspezifischer Kopienzahlen anhand humaner Ganzgenomsequenzierungsdaten (>30X). Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.
Mehr erfahrenPipeline zur Analyse von RNA-Sequenzierungsdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisierte RNA-seq-Analysen und Genexpressionsschätzungen mit öffentlichen Ressourcen und Einstellungen.
Mehr erfahren10XGenomics Pipeline für Einzelzell-RNA-Sequenzdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Analyse und Genexpressionsabschätzung mit öffentlichen Ressourcen und Einstellungen.
Mehr erfahrenBenchmarking-Pipeline zur Bestimmung von für Keimbahn- und somatische Varianten - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.
Mehr erfahrenBest-Practice-Pipeline für die Vorverarbeitung und Qualitätskontrolle von Xenium-Daten für die räumliche Profilierung in situ - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.
Mehr erfahrenBest-Practice-Pipeline zur Qualitätskontrolle von Short- und Long-Read-Sequenzierungsdaten. Diese Pipeline wird im Modellvorhaben GenomSeq verwendet.
Mehr erfahren