License: Creative Commons Attribution 4.0 ZIP Archive - Data MST measurements and TSE-seq data (1GB) | |
License: Creative Commons Attribution 4.0 Thesis (10MB) |
- URN to cite this document:
- urn:nbn:de:bvb:355-epub-523529
- DOI to cite this document:
- 10.5283/epub.52352
Item type: | Thesis of the University of Regensburg (PhD) |
---|---|
Open Access Type: | Primary Publication |
Date: | 17 July 2023 |
Referee: | Prof. Dr. Gernot Längst |
Date of exam: | 13 July 2022 |
Institutions: | Biology, Preclinical Medicine > Institut für Biochemie, Genetik und Mikrobiologie > Lehrstuhl für Biochemie III > House of the Ribosome Biology, Preclinical Medicine > Institut für Biochemie, Genetik und Mikrobiologie > Lehrstuhl für Biochemie III > Prof. Dr. Gernot Längst |
Keywords: | Gene regulation, Nucleosomes, MNase-seq, RNA:DNA triplex |
Dewey Decimal Classification: | 500 Science > 570 Life sciences |
Status: | Published |
Refereed: | Yes, this version has been refereed |
Created at the University of Regensburg: | Yes |
Item ID: | 52352 |
Abstract (English)
Gene regulation is a tightly controlled process in Eukaryotes. Coding and non-coding regions work together to ensure proper spatiotemporal gene expression through 3D chromatin organization, nucleosome positioning, histone tail post-translational modifications, epigenetic DNA modifications, and non-canonical nucleic acid structures such as RNA:DNA triplexes. In this thesis, I investigate two of ...
Abstract (English)
Gene regulation is a tightly controlled process in Eukaryotes. Coding and non-coding regions work together to ensure proper spatiotemporal gene expression through 3D chromatin organization, nucleosome positioning, histone tail post-translational modifications, epigenetic DNA modifications, and non-canonical nucleic acid structures such as RNA:DNA triplexes. In this thesis, I investigate two of these mechanisms, nucleosomes and RNA:DNA triplexes.
In the first chapter, I focus on characterizing nucleosomal properties, such as stability and accessibility, and explore how these properties change to regulate gene expression. I show that Eukaryotic organisms can modulate nucleosome stability and change the RNA polymerase pausing rate, which in turn regulates gene expression. Intriguingly, I find a distinct group of un-stable nucleosomes enriched at the TSS of promoters marked with motif one, an M1BP TF-specific motif, in D. melanogaster. Modulation of stability may ensure a fast response to environmental cues and proper spatiotemporal expression of developmental genes. Furthermore, I developed a bioinformatic pipeline called nucMACC, with which scientists can study nucleosomal properties and positioning in their projects. I show the nucMACC pipeline is consistent and robust and provide recommendations for minimum sequencing depth, MNase titrations, and spike-in use. In summary, the nucMACC pipeline provides high-resolution nucleosome positions and an automated way of calling non-canonical nucleosomes, un-stable nucleosomes, hyper-accessible nucleosomes, hypo-accessible nucleosomes, and stable canonical nucleosomes.
In the second chapter, I study the triplex binding code and explore how the code changes based on the triplex motif (Purine, pyrimidine, and mixed), sequence Guanine content, length, and the nucleic acid (RNA or DNA). Triplexes are non-canonical DNA/RNA structures consisting of three nucleotide strands, most commonly a double-stranded DNA molecule and a single-stranded RNA molecule in its major groove. I show that major differences exist between the triplex motifs and between RNA:DNA and DNA:DNA triplexes. Interestingly, I discovered that the mixed RNA:DNA triplex motif permits triplex formation only at very narrow Guanine contents, while DNA:DNA mixed motif triplexes are able to form at almost any Guanine content. Moreover, I confirm the newly defined triplex code by testing published triplex pairs, of which half are unable to form a triplex under physiological conditions. Furthermore, I developed a high throughput method to investigate the triplex binding code in the context of molecular crowding and competition. I find that certain mismatches in the motif stabilize triplex formation and are preferentially selected for triplex formation over the complementary Hoogsten base-pairing motif. Moreover, I investigate how the location of a mismatch modifies triplex stability and show that the middle section of the triplex is more sensitive to mismatches than flanking regions. In summary, I add to the existing triplex code by delineating the differences in the binding code between triplex motifs and RNA:DNA and DNA:DNA triplexes. I show how the binding code changes in the context of molecular crowding and competition and moreover, show the differential effect of different mismatch locations.
Translation of the abstract (German)
Die Genregulation ist ein genau kontrollierter Prozess in Eukaryonten. Kodierende und nicht-kodierende Regionen arbeiten zusammen, um eine korrekte räumlich-zeitliche Genexpression durch 3D-Chromatinorganisation, Nukleosomenpositionierung, posttranslationale Histonschwanzmodifikationen, epigenetische DNA-Modifikationen und nicht-kanonische Nukleinsäurestrukturen wie RNA:DNA-Triplexe ...
Translation of the abstract (German)
Die Genregulation ist ein genau kontrollierter Prozess in Eukaryonten. Kodierende und nicht-kodierende Regionen arbeiten zusammen, um eine korrekte räumlich-zeitliche Genexpression durch 3D-Chromatinorganisation, Nukleosomenpositionierung, posttranslationale Histonschwanzmodifikationen, epigenetische DNA-Modifikationen und nicht-kanonische Nukleinsäurestrukturen wie RNA:DNA-Triplexe sicherzustellen. In dieser Arbeit untersuche ich zwei dieser Mechanismen, Nukleosomen und RNA:DNA-Triplexe.
Im ersten Kapitel konzentriere ich mich auf die Charakterisierung der Eigenschaften von Nukleosomen, wie Stabilität und Zugänglichkeit, und untersuche, wie sich diese Eigenschaften ändern, um die Genexpression zu regulieren. Ich zeige, dass eukaryotische Organismen die Nukleosomenstabilität modulieren und die Pausenrate der RNA-Polymerase verändern können, was wiederum die Genexpression reguliert. Interessanterweise finde ich in D. melanogaster eine bestimmte Gruppe instabiler Nukleosomen, die an der TSS von Promotoren mit dem „Motif one“ , einem M1BP TF-spezifischen Motiv, angereichert sind. Eine Modulation der Stabilität könnte eine schnelle Reaktion auf Umweltreize und eine angemessene räumlich-zeitliche Expression von Entwicklungsgenen gewährleisten. Darüber hinaus habe ich eine bioinformatische Pipeline namens nucMACC entwickelt, mit der Wissenschaftler die Eigenschaften und Positionierung von Nukleosomen in ihren Projekten untersuchen können. Ich zeige, dass die nucMACC-Pipeline konsistent und robust ist, und gebe Empfehlungen für die Mindestsequenzierungstiefe, MNase-Titrationen und die Verwendung von Spike-in DNA. Zusammenfassend erlaubt die nucMACC-Pipeline sowohl die Bestimmung von hochauflösenden Nukleosomenpositionen als auch eine automatische Kategorisierung von nicht-kanonischen, instabilen, hyper- und hypo-zugänglichen und stabilen kanonischen Nukleosomen.
Im zweiten Kapitel erforsche ich den Triplex-Bindungscode und untersuche, wie sich der Code je nach Triplex-Motiv (Purin, Pyrimidin und gemischt), Sequenz, Guanin-Gehalt, Länge und Nukleinsäure (RNA oder DNA) verhält. Triplexe sind nicht-kanonische DNA/RNA-Strukturen, die aus drei Nukleotidsträngen bestehen, meist einem doppelsträngigen DNA-Molekül und einem einzelsträngigen RNA-Molekül in seiner großen Furche . Ich zeige, dass es große Unterschiede zwischen den Triplex-Motiven und zwischen RNA:DNA- und DNA:DNA-Triplexen gibt. Interessanterweise entdeckte ich, dass das gemischte RNA:DNA-Triplex-Motiv die Triplex-Bildung nur bei einem sehr geringen Guanin-Gehalt ermöglicht, während Triplexe mit gemischtem DNA:DNA-Motiv bei fast jedem Guanin-Gehalt gebildet werden können. Darüber hinaus bestätige ich den neu definierten Triplex-Code, indem ich schon veröffentlichte Triplex-Paare teste und zeige außerdem, dass von diesen Paaren die Hälfte unter physiologischen Bedingungen keine Triplex bildet. Zusätzlich habe ich eine Hochdurchsatzmethode entwickelt, um den Triplex-Bindungscode im Kontext von molekularem Gedränge und Kompetetion zu untersuchen. Ich stelle fest, dass bestimmte Fehlpaarungen im Motiv die Triplexbildung stabilisieren und gegenüber dem komplementären Hoogsten-Basenpaarungsmotiv bevorzugt für die Triplexbildung ausgewählt werden. Außerdem untersuche ich, wie die Lage einer Fehlpaarung die Triplex-Stabilität verändert, und zeige, dass der mittlere Abschnitt des Triplex empfindlicher auf Fehlpaarungen reagiert als flankierende Regionen. Zusammenfassend lässt sich sagen, dass ich den bestehenden Triplex-Code ergänze, indem ich die Unterschiede im Bindungscode zwischen Triplex-Motiven und RNA:DNA- und DNA:DNA-Triplexen beschreibe. Ich zeige, wie sich der Bindungscode im Kontext von molekularem Gedränge und Kompetetion verändert, und zeige darüber hinaus die unterschiedliche Wirkung verschiedener Mismatch-Positionen.
Metadata last modified: 17 Jul 2023 07:06