Z4 - Datenanalyse-Plattform und integrative Analyse von non-coding RNAs bei Adipositas

Das Subprojekt Z4 wird innerhalb des SFB die bioinformatische Datenauswertung unterstützen. Außerdem werden wir die Rolle von nicht-kodierenden RNAs und Isoform Variationen-in Fettleibigkeit untersuchen.

Für die innerhalb des SFB erzeugten Hochdurchsatz-Daten bietet Z4 umfassende Unterstützung für die maschinelle Auswertung und Integration dieser Daten. Für die Auswertungen der während der 1. Förderperiode von den verschiedenen Subprojekten gewonnenen -omics-Daten wird eine geeignete Auswertungs-Infrastruktur sowie eine umfassende Unterstützung bei der bioinformatischen Analyse geliefert. Während der 2. Förderperiode wird dieser Bedarf noch weiter ansteigen, da zusätzlich große Datenmengen aus Hochdurchsatz Experimenten gewonnen werden. Hierzu werden wir eine zentrale und flexible Datenanalyseplattform etablieren, und so die synergetischen Effekte innerhalb des gesamten SFB maximieren. Oft sind die Datenanalyse-Workflows der einzelnen Subprojekten sehr ähnlich, so dass die Arbeitsabläufe standardisiert und folglich wiederverwendbar implementiert werden können. Hierzu werden wir das Workflow-Management-System Galaxy verwenden, welches maximale Wiederverwendbarkeit, Anpassungsfähigkeit und Reproduzierbarkeit gewährleistet. Gleichzeitig wird dadurch die Integration der SFB-Daten untereinander, sowie mit der Fülle an extern vorhandenen Datensätzen ermöglicht. Im Besonderen wird auch die Zusammenarbeit mit dem de.NBI (Deutsches Netzwerk für Bioinformatik-Infrastruktur) gewährleistet.

Eine wichtige Komponente des Projekts Z4 wird die Schulung der SFB-MitarbeiterInnen sein. Alle sollen in die Lage versetzt werden, Galaxy so zu benutzen, dass sie ihre Daten autonom analysieren können und mit Unterstützung von Z4 sogar Workflows verbessern und (weiter)entwickeln können.

In der Forschungskomponente werden wir eine großs angelegte integrative Analyse der durch die verschiedenen Gruppen innerhalb des SFB gewonnenen, sowie der von außerhalb eingebundenen Transkriptom-Daten durchführen. Dabei wird uns die enge Zusammenarbeit mit den einzelnen Subprojekten und die daraus resultierende Fülle an integrierten Daten in die Lage versetzen, auch Fragen, welche über die individuellen Forschungsziele der Subprojekte hinausgehen, zu beantworten. Wir werden insbesondere den Einfluss von Isoformvarianten, sowohl in kodierenden als auch in nicht-kodierenden Transkripten, und deren Einfluss auf die verschiedensten Aspekte von Adipositas beleuchten.

Abbildung 1: Beispiel eines kürzlich erfolgreichen Projektes mit medizinischer Relevanz. Es wurde eine individuelle Strategie zur Auswertung von dual-RNA-seq-Daten entwickelt. Dieses spezielle Sequenzierprotokoll ermöglicht die Auswertung von Interaktionen ohne das Erfordernis der physikalischen Deparation, z. B. ein interzellulärer Parasit (hier Salmonella) in der Wirtszelle (hier Mensch) . Abbgebildet sind die Auswirkungen von Deletionsvarianten einer kleinen RNA (pinT) in Salmonella auf das menschliche Transkriptom. (a,b) zeigen die zentralen, veränderten Signalwege und ihre Validierungen (c,d), den Effekt auf die Mitrochondrien der Wirtszellen (e) und ein Gesamtmodell der Interaktionen zwischen pinT und dem Wirt (f). Knockout von verschiedenen bakteriellen sRNAs in unterschiedlichen Kombinationen beeinflussen unterschiedliche Signalwege des Wirts (g).

Westermann AJ, Förstner KU, Amman F, Barquist L, Chao Y, Schulte LN, Müller L, Reinhardt R, Stadler PF, Vogel J. Dual RNA-seq unveils noncoding RNA functions in host-pathogen interactions. Nature. 2016;529:496-501.


Jühling F, Kretzmer H, Bernhart SH, Otto C, Stadler PF, Hoffmann S. metilene: fast and sensitive calling of differentially methylated regions from bisulfite sequencing data. Genome Res. 2016;6:256-62.


Liu X, Hinney A, Scholz M, Scherag A, Tönjes A, Stumvoll M, Stadler PF, Hebebrand J, Böttcher Y. Indications for potential parent-of-origin effects within the FTO gene. PLoS One. 2015;10:e0119206.


Hoffmann S, Stadler PF, Strimmer K. A simple data-adaptive probabilistic variant calling model. Algorithms Mol Biol. 2015;10:10.


Hoffmann S, Otto C, Doose G, Tanzer A, Langenberger D, Christ S, Kunz M, Holdt LM, Teupser D, Hackermüller J, Stadler PF. A multi-split mapping algorithm for circular RNA, splicing, trans-splicing and fusion detection. Genome Biol. 2014;15:R34.


Otto C, Stadler PF, Hoffmann S. Lacking alignments? The next-generation sequencing mapper segemehl revisited. Bioinformatics. 2014;30:1837-43.


Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014;5:R48.


Nitsche A, Doose G, Tafer H, Robinson M, Saha NR, Gerdol M, Canapa A, Hoffmann S, Amemiya CT, Stadler PF. Atypical RNAs in the coelacanth transcriptome. J Exp Zool B Mol Dev Evol. 2014;322:342-51.


Holdt LM, Hoffmann S, Sass K, Langenberger D, Scholz M, Krohn K, Finstermeier K, Stahringer A, Wilfert W, Beutner F, Gielen S, Schuler G, Gäbel G, Bergert H, Bechmann I, Stadler PF, Thiery J, Teupser D. Alu elements in ANRIL non-coding RNA at chromosome 9p21 modulate atherogenic cell functions through trans-regulation of gene networks. PLoS Genet. 2013;9:e1003588.


Otto C, Stadler PF, Hoffmann S. Fast and sensitive mapping of bisulfite-treated sequencing data. Bioinformatics. 2012;28:1698-704.

PROJEKT TEAM

Stephanie Kehr, Postdoc