| Lizenz: Creative Commons Namensnennung 4.0 International (13MB) |
- URN zum Zitieren dieses Dokuments:
- urn:nbn:de:bvb:355-epub-770430
- DOI zum Zitieren dieses Dokuments:
- 10.5283/epub.77043
| Dokumentenart: | Hochschulschrift der Universität Regensburg (Dissertation) |
|---|---|
| Open Access Art: | Primärpublikation |
| Datum: | 10 Juli 2025 |
| Begutachter (Erstgutachter): | Prof. Dr. Tilo Wettig und Pro. Dr. Rainer Spang |
| Tag der Prüfung: | 5 Juni 2025 |
| Institutionen: | Physik > Institut für Theoretische Physik > Lehrstuhl Professor Braun > Arbeitsgruppe Tilo Wettig |
| Stichwörter / Keywords: | deconvolution, gene expression, cellular compositions, bulkRNA-seq, scRNA-seq |
| Dewey-Dezimal-Klassifikation: | 000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik 500 Naturwissenschaften und Mathematik > 530 Physik |
| Status: | Veröffentlicht |
| Begutachtet: | Ja, diese Version wurde begutachtet |
| An der Universität Regensburg entstanden: | Ja |
| Dokumenten-ID: | 77043 |
Zusammenfassung (Englisch)
Knowledge of tissue composition is fundamental to biological and medical research: the cellular makeup of a tissue reflects its function, possible disease progression, and therapeutic responses. Thus, quantifying cell types within samples is an integral task when researching phenomena such as disease resistance via immune response and transplantation response. Quantification of cellular ...

Zusammenfassung (Englisch)
Knowledge of tissue composition is fundamental to biological and medical research: the cellular makeup of a tissue reflects its function, possible disease progression, and therapeutic responses. Thus, quantifying cell types within samples is an integral task when researching phenomena such as disease resistance via immune response and transplantation response.
Quantification of cellular composition of a solid tissue can be achieved through the physical dissociation of the tissue followed by single-cell analysis techniques. However, due to technical challenges, tissue dissociation often results in disproportionate cell loss, and single-cell methods are often labor intensive and expensive.
The efficiency and low cost of computational deconvolution methods—combined with bulk gene expression data—have made them a common alternative to single-cell technologies. However, despite the advantages of these methods, they are prone to significant biases. Computational deconvolution tools normally need a reference profile, which contains profiles of different cell types. Typically, these reference profiles are created by averaging the gene expression of single-cell data within each specific cell type. Using these references, deconvolution is hindered by biological and technological inconsistencies; as there are systematic differences between bulk and single-cell expression data, which originate from their different experimental workflows. The biological variability of tissue samples further amplifies this issue, especially since the samples used for bulk expression data often are different from those used for single-cell experiments, rather than from the exact same tissue.
Although solutions have been proposed to address these inconsistencies, no comprehensive reconciliation of measured cellular composition and gene expression data has been attempted yet.
I developed Harp, a new method, which reconciles these approaches to produce more reliable deconvolution results in applications where only gene expression data is available.
In this thesis, I introduce Harp using calibration datasets that include both
experimentally measured and deconvolution-based cell compositions. I demonstrate that Harp enhances the accuracy of tissue deconvolution by improving the consistencies between experimentally determined tissue compositions, single-cell and bulk expression profiles. The main purpose of Harp is to determine the cellular abundances of a tissue with precision, making data harmonization a crucial component of the process. During the training, Harp takes bulk gene expression data with their paired cellular compositions—derived from experimental methods—together with a reference profile, in order to learn a harmonized reference profile. This reference can then be used either by Harp itself or another deconvolution tool of choice to deconvolve new bulk expression data, where their cellular compositions are not available. I evaluated Harp using simulated and real data, showing that this approach outperforms competing state-of-the-art deconvolution tools, overcoming technological and biological batch effects. Moreover, by providing the harmonized reference from Harp to other deconvolution tools, I found out this reference generally improved
their performance compared to their own respective references.
Übersetzung der Zusammenfassung (Deutsch)
Wissen um die zelluläre Zusammensetzung von Geweben ist für biologische und medizinische Forschung fundamental: der zelluläre Aufbau eines Gewebes spiegelt seine Funktion, potentielle Krankheitsprogression und das Ansprechen auf Therapie wider. Deshalb ist das Quantifizieren von Zelltypen in Proben eine integrale Aufgabe in der Erforschung von Phänomenen wie etwa Krankheitsresistenz durch ...

Übersetzung der Zusammenfassung (Deutsch)
Wissen um die zelluläre Zusammensetzung von Geweben ist für biologische und medizinische Forschung fundamental: der zelluläre Aufbau eines Gewebes spiegelt seine Funktion, potentielle Krankheitsprogression und das Ansprechen auf Therapie wider. Deshalb ist das Quantifizieren von Zelltypen in Proben eine integrale Aufgabe in der Erforschung von Phänomenen wie etwa Krankheitsresistenz durch Immunreaktion oder das Ansprechen auf Gewebstransplantation.
Quantifizierung der Zellzusammensetzung eines festen Gewebes kann erreicht werden durch physische Auflösung des Gewebes und anschließender Analyse durch Einzelzell-Techniken. Allerdings kann die Auflösung von Geweben aufgrund technischer Herausforderungen oft zu ungleichmäßigem Zellverlust führen, und Einzelzell-Techniken sind oft arbeitsintensiv sowie teuer.
Methoden der computerbasierten Dekonvolution von BulkGenexpressionsdaten (gemessen an vollständigen Geweben) bieten hingegen eine effiziente, kostengünstige und mittlerweile weit verbreitete Alternative zu Einzelzell-Techniken. Allerdings sind solche Methoden, trotz ihrer Vorteile, anfällig für beträchtliche Verzerrungen. Computerbasierte Dekonvolution benötigt für gewöhnlich ein Referenzprofil, welches die Einzelprofile verschiedener Zelltypen enthält. Diese Referenzprofile werden gemeinhin erstellt durch das Mitteln von Einzelzell-Genexpressionsdaten innerhalb eines bestimmten Zelltyps. Allerdings
behindern systematische Unterschiede zwischen Bulk- und Einzelzellexpressionsdaten welchen unterschiedliche experimentelle Protokolle zugrundeliegende Dekonvolution mithilfe solcher Referenzprofile. Die biologische Variabilität von Gewebsproben verstärkt dieses Problem, besonders da die Proben für Bulk-Genexpressionsmessungen oft nicht vom gleichen Gewebe kommen wie die Proben für Einzelzell-Experimente.
Einige Dekonvolutions-Werkzeuge wurden als Antwort auf diese Probleme
entwickelt, allerdings fehlt bisher der Versuch eines umfassenden Abgleichs
zwischen gemessenen Zellzusammensetzungen und Genexpressionsdaten.
Ich entwickelte Harp, eine neue Methode die diese Herangehensweisen abgleicht um in Anwendungen, in denen lediglich Genexpressiondaten vorliegen, verlässlichere Dekonvolutionsresultate zu liefern. In dieser Arbeit stelle ich Harp vor, anhand von Kalibrierungs-Daten die aus experimentell gemessenen sowie dekonvolutionsbasierten Zellzusammensetzungen bestehen. Ich demonstriere dass Harp die Genauigkeit der Gewebsdekonvolution erhöht indem es die Kohärenz zwischen experimentell bestimmten Zellzusammensetzungen und Bulk- sowie Einzelzell-Expressionsprofilen verbessert. So ist der zentrale Zweck von Harp die Bestimmung von zellulären Häufigkeiten eines Gewebes mit Präzision, wobei die Datenharmonisierung ein Hauptbestandteil dieses Prozesses ist.Während des Trainings kombiniert Harp Bulk Genexpressionsmessungen mit gepaarten, experimentell bestimmten Zellzusammensetzungen um ein harmonisiertes Referenzprofil zu erlernen. Dieses Referenzprofil kann dann entweder direkt von Harp oder von einer anderen Dekonvolutions-Methode genutzt werden um neue Bulk-Expressionsdaten zu dekonvolvieren, wenn deren Zellzusammensetzungen unbekannt sind. Ich evaluierte Harp auf simulierten sowie realen Daten und zeigte dadurch dass die Ansatz sich bei der Bewältigung von technischen und biologischen Batch-Effekten als vorteilshaft gegenber anderen modernsten Dekonvolutions-Methoden erweist. Außerdem führte die Verwendung der harmonisierten Harp-Referenz auch bei den anderen Dekonvolutions Methoden zu generell erhöhter Leistung im Vergleich zu deren ursprünglichen Referenzen.
Metadaten zuletzt geändert: 10 Jul 2025 09:10

Downloadstatistik