| Published Version Download ( PDF | 6MB) | License: Publishing license for publications including print on demand |
Considering unknown unknown: reconstruction of non-confoundable causal relations in biological networks
Sadeh, Mohammad Javad (2013) Considering unknown unknown: reconstruction of non-confoundable causal relations in biological networks. PhD, Universität Regensburg.Date of publication of this fulltext: 12 Jun 2013 09:56
Thesis of the University of Regensburg
DOI to cite this document: 10.5283/epub.28301
Abstract (English)
Our current understanding of cellular networks is rather incomplete. We miss important but so far unknown genes and mechanisms in the pathways. Moreover, we often only have a partial account of the molecular interactions and modifications of the known players. When analyzing the cell, we look through narrow windows leaving potentially important events in blind spots. This might severely bias both ...
Our current understanding of cellular networks is rather incomplete. We miss important but so far unknown genes and mechanisms in the pathways. Moreover, we often only have a partial account of the molecular interactions and modifications of the known players. When analyzing the cell, we look through narrow windows leaving potentially important events in blind spots. This might severely bias both the computational and manual reconstruction of underlying biological networks. Network reconstruction is naturally confined to what we have observed. Little is known about how the incompleteness of our observations confounds our interpretation of the available data. In this dissertation I ask the question: Which features of a network can be confounded by incomplete observations and which cannot? In order to answer this question, I first summarize the methodology of Nested Effects Models (NEMs) proposed by Markowetz et al. to reconstruct non-transcriptional networks using subset relationships from perturbation data and bring out its limitation to model biological processes in the presence of hidden mechanisms. In the context of Nested Effects Models, I show that in the presence of missing observations or hidden factors a reliable reconstruction of the full network is not feasible. Nevertheless, I show that certain characteristics of signaling networks like the existence of cross talk between certain branches of the network can be inferred in a non-confoundable way. I introduce and describe new statistical methodologies called Non-confoundable Networks Analysis (No-CONAN) and Partial Nested Effects Models (pNEM) for analyzing cell signaling pathways and gene expression. No-CONAN is based on a simple polynomial test for inferring non-confoundable characteristics of signaling networks. I then introduce a new data structure to represent partially reconstructed signaling networks. Finally, I evaluate the methods presented in this dissertation on simulated data and two biological studies, a first application to embryonic stem cell differentiation in mice and a recent study on the Wnt signaling pathway in colorectal cancer cells. I demonstrate that taking unknown hidden mechanisms into account changes our account of real biological networks.
Translation of the abstract (German)
Unser derzeitiges Verständnis zellulärer Netzwerke ist unvollständig. Wir übersehen derzeit wichtige aber bisher unbekannte Gene und Mechanismen der Signalwege. Darüber hinaus ist uns oft nur ein Ausschnitt der molekularen Interaktionen und Modifikationen bekannt. Bildlich betrachten wir Zellen nur durch ein kleines Fenster und übersehen dadurch wichtige Vorgänge. Sowohl die Computer gestützte ...
Unser derzeitiges Verständnis zellulärer Netzwerke ist unvollständig. Wir übersehen derzeit wichtige aber bisher unbekannte Gene und Mechanismen der Signalwege. Darüber hinaus ist uns oft nur ein Ausschnitt der molekularen Interaktionen und Modifikationen bekannt. Bildlich betrachten wir Zellen nur durch ein kleines Fenster und übersehen dadurch wichtige Vorgänge. Sowohl die Computer gestützte also auch die manuelle Rekonstruktion des zugrunde liegende biologischen Netzwerks wir dadurch möglicherweise stark verfälscht. Die Rekonstruktion von Netzwerken ist naturgemäß auf unsere Beobachtungen limitiert. Inwieweit die Unvollständigkeit unserer Beobachtungen die mögliche Interpretation der vorhandenen Daten beeinflusst ist weitestgehend unbekannt.
In dieser Arbeit möchte ich die Frage beantworten, welche Merkmale eines Netzwerks durch unvollständige Daten beeinflusst werden können und welche nicht. Dazu fasse ich zunächst Nested Effects Models (NEMs) von Markowetz et al. zur Rekonstruktion nicht transkriptionaler Netzwerke zusammen, die auf Teilmengen Beziehungen in Daten aus Perturbatiosexperimenten basiert. Dabei arbeite ich die Grenzen von NEMs im Bezug auf unbeobachtete Mechanismen heraus. In diesem Kontext zeige ich, dass in Gegenwart von fehlenden Beobachtungen oder Faktoren die zuverlässige Rekonstruktion des vollständigen Netzwerks nicht möglich ist. Nichts desto trotz zeige ich, dass bestimmte Charakteristika von Signal-Netzwerken wie z.B. die Wechselwirkungen bestimmter Zweige des Netzwerks auch unter Berücksichtigung von confounders eindeutig abgeleitet werden können. Ich führe 'Non-confoundable Network Analysis (No-CONAN)‘ und 'Partial Nested Effects Models (pNEM)‘ zur Analyse von Zell Signalwegen und beschreibe diese. No-CONAN und pNEM basieren auf einem einfachen polynomial Test zur Störfaktors unabhängigen Ableitung der Charateristik von Signal-Netzwerken. Anschließ end führe ich eine neue Datenstruktur zur Darstellung partiell rekonstruierter Signal-Netzwerke ein. Schlussendlich evaluiere ich die in dieser Arbeit eingeführten Methodologien auf simulierten Daten und wende sie auf Daten zweier biologischer Studien an: einer Analyse der Differenzierung embryonischer Stammzellen in Mäusen, sowie eine kürzlich erfolgten Arbeit zur Analyse des Wnt Signalweges in Zellen des Kolorektalen Karzinoms. Dabei zeige ich, wie das Einbeziehen unbekannter Mechanismen unsere Sichteweise auf echte biologische Netzwerke verändert.
Involved Institutions
Details
| Item type | Thesis of the University of Regensburg (PhD) |
| Date | 12 June 2013 |
| Referee | Prof. Dr. Rainer Spang |
| Date of exam | 22 April 2013 |
| Institutions | Medicine > Institut für Funktionelle Genomik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang) Informatics and Data Science > Department Computational Life Science > Lehrstuhl für Statistische Bioinformatik (Prof. Spang) |
| Keywords | Network reconstruction, hidden variables |
| Dewey Decimal Classification | 500 Science > 570 Life sciences 600 Technology > 610 Medical sciences Medicine |
| Status | Published |
| Refereed | Yes, this version has been refereed |
| Created at the University of Regensburg | Yes |
| URN of the UB Regensburg | urn:nbn:de:bvb:355-epub-283013 |
| Item ID | 28301 |
Download Statistics
Download Statistics