Direkt zum Inhalt

Sadeh, Mohammad Javad

Considering unknown unknown: reconstruction of non-confoundable causal relations in biological networks

Sadeh, Mohammad Javad (2013) Considering unknown unknown: reconstruction of non-confoundable causal relations in biological networks. Dissertation, Universität Regensburg.

Veröffentlichungsdatum dieses Volltextes: 12 Jun 2013 09:56
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.28301


Zusammenfassung (Englisch)

Our current understanding of cellular networks is rather incomplete. We miss important but so far unknown genes and mechanisms in the pathways. Moreover, we often only have a partial account of the molecular interactions and modifications of the known players. When analyzing the cell, we look through narrow windows leaving potentially important events in blind spots. This might severely bias both ...

Our current understanding of cellular networks is rather incomplete. We miss important but so far unknown genes and mechanisms in the pathways. Moreover, we often only have a partial account of the molecular interactions and modifications of the known players. When analyzing the cell, we look through narrow windows leaving potentially important events in blind spots. This might severely bias both the computational and manual reconstruction of underlying biological networks. Network reconstruction is naturally confined to what we have observed. Little is known about how the incompleteness of our observations confounds our interpretation of the available data. In this dissertation I ask the question: Which features of a network can be confounded by incomplete observations and which cannot? In order to answer this question, I first summarize the methodology of Nested Effects Models (NEMs) proposed by Markowetz et al. to reconstruct non-transcriptional networks using subset relationships from perturbation data and bring out its limitation to model biological processes in the presence of hidden mechanisms. In the context of Nested Effects Models, I show that in the presence of missing observations or hidden factors a reliable reconstruction of the full network is not feasible. Nevertheless, I show that certain characteristics of signaling networks like the existence of cross talk between certain branches of the network can be inferred in a non-confoundable way. I introduce and describe new statistical methodologies called Non-confoundable Networks Analysis (No-CONAN) and Partial Nested Effects Models (pNEM) for analyzing cell signaling pathways and gene expression. No-CONAN is based on a simple polynomial test for inferring non-confoundable characteristics of signaling networks. I then introduce a new data structure to represent partially reconstructed signaling networks. Finally, I evaluate the methods presented in this dissertation on simulated data and two biological studies, a first application to embryonic stem cell differentiation in mice and a recent study on the Wnt signaling pathway in colorectal cancer cells. I demonstrate that taking unknown hidden mechanisms into account changes our account of real biological networks.

Übersetzung der Zusammenfassung (Deutsch)

Unser derzeitiges Verständnis zellulärer Netzwerke ist unvollständig. Wir übersehen derzeit wichtige aber bisher unbekannte Gene und Mechanismen der Signalwege. Darüber hinaus ist uns oft nur ein Ausschnitt der molekularen Interaktionen und Modifikationen bekannt. Bildlich betrachten wir Zellen nur durch ein kleines Fenster und übersehen dadurch wichtige Vorgänge. Sowohl die Computer gestützte ...

Unser derzeitiges Verständnis zellulärer Netzwerke ist unvollständig. Wir übersehen derzeit wichtige aber bisher unbekannte Gene und Mechanismen der Signalwege. Darüber hinaus ist uns oft nur ein Ausschnitt der molekularen Interaktionen und Modifikationen bekannt. Bildlich betrachten wir Zellen nur durch ein kleines Fenster und übersehen dadurch wichtige Vorgänge. Sowohl die Computer gestützte also auch die manuelle Rekonstruktion des zugrunde liegende biologischen Netzwerks wir dadurch möglicherweise stark verfälscht. Die Rekonstruktion von Netzwerken ist naturgemäß auf unsere Beobachtungen limitiert. Inwieweit die Unvollständigkeit unserer Beobachtungen die mögliche Interpretation der vorhandenen Daten beeinflusst ist weitestgehend unbekannt.
In dieser Arbeit möchte ich die Frage beantworten, welche Merkmale eines Netzwerks durch unvollständige Daten beeinflusst werden können und welche nicht. Dazu fasse ich zunächst Nested Effects Models (NEMs) von Markowetz et al. zur Rekonstruktion nicht transkriptionaler Netzwerke zusammen, die auf Teilmengen Beziehungen in Daten aus Perturbatiosexperimenten basiert. Dabei arbeite ich die Grenzen von NEMs im Bezug auf unbeobachtete Mechanismen heraus. In diesem Kontext zeige ich, dass in Gegenwart von fehlenden Beobachtungen oder Faktoren die zuverlässige Rekonstruktion des vollständigen Netzwerks nicht möglich ist. Nichts desto trotz zeige ich, dass bestimmte Charakteristika von Signal-Netzwerken wie z.B. die Wechselwirkungen bestimmter Zweige des Netzwerks auch unter Berücksichtigung von confounders eindeutig abgeleitet werden können. Ich führe 'Non-confoundable Network Analysis (No-CONAN)‘ und 'Partial Nested Effects Models (pNEM)‘ zur Analyse von Zell Signalwegen und beschreibe diese. No-CONAN und pNEM basieren auf einem einfachen polynomial Test zur Störfaktors unabhängigen Ableitung der Charateristik von Signal-Netzwerken. Anschließ end führe ich eine neue Datenstruktur zur Darstellung partiell rekonstruierter Signal-Netzwerke ein. Schlussendlich evaluiere ich die in dieser Arbeit eingeführten Methodologien auf simulierten Daten und wende sie auf Daten zweier biologischer Studien an: einer Analyse der Differenzierung embryonischer Stammzellen in Mäusen, sowie eine kürzlich erfolgten Arbeit zur Analyse des Wnt Signalweges in Zellen des Kolorektalen Karzinoms. Dabei zeige ich, wie das Einbeziehen unbekannter Mechanismen unsere Sichteweise auf echte biologische Netzwerke verändert.


Beteiligte Einrichtungen


Details

DokumentenartHochschulschrift der Universität Regensburg (Dissertation)
Datum12 Juni 2013
Begutachter (Erstgutachter)Prof. Dr. Rainer Spang
Tag der Prüfung22 April 2013
InstitutionenMedizin > Institut für Funktionelle Genomik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
Informatik und Data Science > Fachbereich Bioinformatik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
Stichwörter / KeywordsNetwork reconstruction, hidden variables
Dewey-Dezimal-Klassifikation500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie
600 Technik, Medizin, angewandte Wissenschaften > 610 Medizin
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenJa
URN der UB Regensburgurn:nbn:de:bvb:355-epub-283013
Dokumenten-ID28301

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben