| Lizenz: Veröffentlichungsvertrag für Publikationen mit Print on Demand (5MB) |
- URN zum Zitieren dieses Dokuments:
- urn:nbn:de:bvb:355-epub-308530
- DOI zum Zitieren dieses Dokuments:
- 10.5283/epub.30853
Dokumentenart: | Hochschulschrift der Universität Regensburg (Dissertation) |
---|---|
Open Access Art: | Primärpublikation |
Datum: | 16 Oktober 2014 |
Begutachter (Erstgutachter): | Prof. Dr. Elmar Lang |
Tag der Prüfung: | 25 September 2014 |
Institutionen: | Biologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Elmar Lang |
Stichwörter / Keywords: | tumor development, tumor progression modeling, cancer research, likelihood-free methods |
Dewey-Dezimal-Klassifikation: | 500 Naturwissenschaften und Mathematik > 530 Physik 500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie 600 Technik, Medizin, angewandte Wissenschaften > 610 Medizin |
Status: | Veröffentlicht |
Begutachtet: | Ja, diese Version wurde begutachtet |
An der Universität Regensburg entstanden: | Ja |
Dokumenten-ID: | 30853 |
Zusammenfassung (Englisch)
Since it became clear that the number of newly diagnosed cancer cases and the number of deaths from cancer worldwide increases from year to year, a great effort has been put into the field of cancer research. One major point of interest is how and by means of which intermediate steps the development of cancer from an initially benign mass of cells into a large malignant and deadly tumor takes ...

Zusammenfassung (Englisch)
Since it became clear that the number of newly diagnosed cancer cases and the number of deaths from cancer worldwide increases from year to year, a great effort has been put into the field of cancer research. One major point of interest is how and by means of which intermediate steps the development of cancer from an initially benign mass of cells into a large malignant and deadly tumor takes place. In order to shed light onto the details of this process, many models have been developed in the recent decades. With increasing complexity of the model, however, the computational time also increases. This is especially the case for models where network inference is based on the analysis of the likelihood function when the maximization of the likelihood can not be done in closed form.
In this thesis two alternative methods for the inference of tumor progression models were proposed which do not use a likelihood function but instead rely on simulated data. The two methods are based on Support Vector Machines (SVMs) and approximate Bayesian computation (ABC), respectively, to decide between competing networks. For global model inference a simulated annealing and/or hill climbing approach was used.
The performance and runtime of the two methods were compared to an existing method called the conjunctive Bayesian networks (CBN) in a simulation study. In this study, a graph and corresponding simulated data were generated and on the basis of the data each of the methods was used in turn to reconstruct the underlying graph.
The performance of the methods was compared via the calculation of likelihood and distance values. It was found that the likelihood values for the observed data are higher when using the maximum likelihood estimation (MLE) of the CBN model for network reconstruction compared to those obtained when using the likelihood-free methods. When looking at the distance values the performance of the methods depended on the noise level used in the simulated data. Best results were obtained with the SVM based method using hill climbing with 10% noise in the simulated data. Then the distances between the observed data and data simulated from the networks reconstructed with the SVM based method using hill climbing and the MLE of the CBN model were very similar and were also very close to the results obtained for the true graph.
The average calculation time for the MLE of the CBN model was found to be close to 50 hours when using networks with a size of 12 nodes, while both the SVM based and the ABC based method need only about 30 minutes for the same network size. It could further be shown in this thesis that in the case of the SVM based method an average calculation time of about 50 hours is reached only starting from a network size of 30 nodes, while for the ABC based method the average calculation time is only about 15 hours for networks with 30 nodes.
In addition to the simulations, both the SVM based and the ABC based method were applied to three real tumor datasets for network inference. It could be shown that all networks have one or several relations in common with the CBN results.
Übersetzung der Zusammenfassung (Deutsch)
Seitdem man weiß dass die Zahl der neu diagnostizierten Krebsfälle und die Zahl der Krebstode weltweit von Jahr zu Jahr steigt, wurde ein enormer Aufwand in den Bereich der Krebsforschung gesteckt. Ein Hauptinteressenspunkt ist wie und durch welche Zwischenschritte die Entwicklung von Krebs aus einer anfangs gutartigen Zellmasse in einen großen bösartigen und tödlichen Tumor abläuft. Um die ...

Übersetzung der Zusammenfassung (Deutsch)
Seitdem man weiß dass die Zahl der neu diagnostizierten Krebsfälle und die Zahl der Krebstode weltweit von Jahr zu Jahr steigt, wurde ein enormer Aufwand in den Bereich der Krebsforschung gesteckt. Ein Hauptinteressenspunkt ist wie und durch welche Zwischenschritte die Entwicklung von Krebs aus einer anfangs gutartigen Zellmasse in einen großen bösartigen und tödlichen Tumor abläuft. Um die Details dieses Prozesses zu beleuchten wurden in den letzten Jahrzehnten viele Modelle entwickelt. Mit steigender Komplexität des Modells steigt jedoch auch die Rechenzeit. Die ist besonders der Fall bei Modellen wo die Netzwerksuche auf der Analyse der Likelihood-Funktion basiert wenn die Maximierung der Likelihood in geschlossener Form nicht möglich ist.
In dieser Arbeit werden zwei alternative Methoden für die Suche nach Tumorprogressionsmodellen vorgeschlagen, die keine Likelihood-Funktion verwenden und stattdessen auf der Simulation von Daten basieren. Die beiden Methoden verwenden Supportvektormaschinen (SVMs) bzw. approximate Bayesian computation (ABC) um zwischen konkurrierenden Netzwerken zu entscheiden. Zur globalen Netzwerksuche werden simulated annealing und/oder hill climbing verwendet.
Die Ergebnisse und die Rechenzeit der beiden Methoden wurden in einer Simulationsstudie mit einer existierenden Methode namens conjunctive Bayesian networks (CBN) verglichen. In dieser Studie wurden ein Graph und zugehörige simulierte Daten generiert. Im Anschluss wurde jede der Methoden verwendet um auf Basis der Daten den zugrunde liegenden Graphen zu rekonstruieren.
Die Ergebnisse der Methoden wurden mittels Likelihood- und Distanzwerten verglichen. Die Likelihoodwerte für die beobachteten Daten waren höher wenn die Maximum-Likelihood-Schätzung des CBN Modells zur Rekonstruktion der Graphen verwendet wurde als im Vergleich zu den Ergebnissen der Likelihood-freien Methoden. Was die Distanzwerte betrifft, hing die Qualität der Ergebnisse von der Höhe des verwendeten Fehlers in den simulierten Daten ab. Die besten Ergebnisse wurden mit der SVM-basierten Methode mit hill climbing erzielt wenn man einen Fehler von 10% in den simulierten Daten verwendet. Dann waren die Distanzen zwischen den beobachteten Daten und den Daten die auf Basis der rekonstruierten Graphen der SVM-basierten Methode mit hill climbing und der Maximum-Likelihood-Schätzung des CBN Modells simuliert wurden sehr ähnlich und auch sehr nah an den Ergebnissen für den zugrunde liegenden Graphen.
Die durchschnittliche Rechenzeit für die Maximum-Likelihood-Schätzung des CBN Modells betrug fast 50 Stunden bei einer Netzwerkgröße von 12 Knoten, während sowohl die SVM-basierte als auch die ABC-basierte Methode für die selbe Netzwerkgröße nur ungefähr 30 Minuten brauchen. Darüber hinaus konnte in dieser Arbeit gezeigt werden, dass im Falle der SVM-basierten Methode eine durchschnittliche Rechenzeit von 50 Stunden erst ab einer Netzwerkgröße von 30 Knoten erreicht wird, während im Falle der ABC-basierten Methode die durchschnittliche Rechenzeit bei der gleichen Netzwerkgröße sogar nur 15 Stunden beträgt.
Zusätzlich zu den Simulationen wurden sowohl die SVM-basierte als auch die ABC-basierte Methode auf drei echte Tumordatensätze zur Netzwerkrekonstruktion angewandt. Es konnte gezeigt werden, dass in allen gefundenen Netzwerken eine oder mehrere Relationen mit denen in den CBN Ergebnissen übereinstimmen.
Metadaten zuletzt geändert: 26 Nov 2020 00:42