Datenanalyse

Datenanalyse-Hilfsmittel

Omics-Workflows

Das GHGA-Bioinformatik-Team arbeitet kontinuierlich daran, standardisierte, vergleichbare und reproduzierbare Omics-Workflows (standardisierte Abläufe für die Datenanalyse) für die Forschungsgemeinschaft bereitzustellen. In enger Zusammenarbeit mit der nf-core-Gemeinschaft verbessern wir bestehende Workflows und entwickeln Best-Practices für Reproduzierbarkeit und Zuverlässigkeit. Dies ermöglicht Forschenden und Kliniker*innen, komplexe Omics-Daten effizient und präzise zu analysieren. Im Folgenden stellen wir die bereits publizierten Workflows vor, an denen GHGA beteiligt war.

Für Einsteiger empfehlen wir Bytesize - eine von nf-core veröffentlichte Video-Tutorial-Serie, die eine leicht verständliche Einführung in die Anwendung von nf-core Workflows bietet

Benchmarking

Ein kontinuierliches Benchmarking, also der Vergleich von Arbeitsabläufen anhand bekannter Standards, ist entscheidend für die Präzision und Zuverlässigkeit von Workflows und ein zentraler Bestandteil der Qualitätssicherung in der Bioinformatik. GHGA trägt zu verschiedenen Benchmarking-Bemühungen bei, die darauf abzielen, die Leistung und Genauigkeit bioinformatischer Workflows zu bewerten..

Ein Beispiel ist NCBench, eine gemeinsam mit dem Next Generation Sequencing Competence Network (NGS-CN) entwickelte Plattform für das kontinuierliche Benchmarking von Workflows zur Bestimmung genomischer Varianten. NCBench bietet einen umfassenden und reproduzierbaren Benchmarking-Workflow zur Bewertung kleiner genomischer Variantenbestimmungen in Bezug auf Präzision und falsch positiver/negativer Fehlermuster. Der kontinuierliche Open-Source-Ansatz macht eine spezielle Infrastruktur überflüssig und Benchmarking damit für die Forschungs- und Diagnostikgemeinschaft, aber auch für Patient:innen, zugänglich und transparent.

sarek 3.0

Pipeline zur Bestimmung von somatischen und Keimbahn-Varianten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Bestimmung von Varianten mit öffentlichen Ressourcen und Analyseparameter-Einstellungen.

Mehr erfahren

nanoseq 3.0

Methode zur Analyse von Long-Read-Sequenzierung von nf-core mit Schwerpunkt auf der Oxford Nanopore-Technologie - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisiertes Long-Read-Alignment und QC.

Mehr erfahren

DROP

Snakemake Pipeline zur Erkennung von abweichenden RNA-Ereignissen - Eine Methode zur Verarbeitung und Interpretation von RNA-Seq-Daten sowie zur Erkennung von Abweichungen bei Seltenen Erkrankungen, z.B. Änderungen in Spleißen und Expressionsleveln.

Mehr erfahren

nf-platypusindelcalling

Eine Nextflow-basierte Pipeline zum Erkennen und Priorisieren von somatischen Indels mit umfangreichen Qualitätskontroll- und Filterungsschritten. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren

nf-snvcalling v2.0

Nextflow-Pipeline zum Erkennen und Priorisieren von somatischen Einzelnukleotid-Variationen mit Filtermöglichkeiten, Annotationen und Diagrammen. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren

nf-aceseq vdev

Nextflow-Pipeline zur Schätzung allelspezifischer Kopienzahlen anhand humaner Ganzgenomsequenzierungsdaten (>30X). Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren

rnaseq 3.0

Pipeline zur Analyse von RNA-Sequenzierungsdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisierte RNA-seq-Analysen und Genexpressionsschätzungen mit öffentlichen Ressourcen und Einstellungen.

Mehr erfahren

scrnaseq 2.0

10XGenomics Pipeline für Einzelzell-RNA-Sequenzdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Analyse und Genexpressionsabschätzung mit öffentlichen Ressourcen und Einstellungen.

Mehr erfahren

nf-core/variantbenchmarking v1.0

Benchmarking-Pipeline zur Bestimmung von für Keimbahn- und somatische Varianten - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.

Mehr erfahren

nf-core/spatialxe vdev

Best-Practice-Pipeline für die Vorverarbeitung und Qualitätskontrolle von Xenium-Daten für die räumliche Profilierung in situ - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.

Mehr erfahren

Genomrechenzentrum (GRZ) QC Workflow vdev

Best-Practice-Pipeline zur Qualitätskontrolle von Short- und Long-Read-Sequenzierungsdaten. Diese Pipeline wird im Modellvorhaben GenomSeq verwendet.

Mehr erfahren