Cancer progresses by accumulating genomic events, such as mutations and copy number alterations, whose chronological order is key to understanding the disease but difficult to observe. Instead, cancer progression models use co-occurrence patterns in cross-sectional data to infer dependencies between events and thereby uncover their most likely order of occurrence.
Here we introduce Mutual ...
Zusammenfassung (Englisch)
Cancer progresses by accumulating genomic events, such as mutations and copy number alterations, whose chronological order is key to understanding the disease but difficult to observe. Instead, cancer progression models use co-occurrence patterns in cross-sectional data to infer dependencies between events and thereby uncover their most likely order of occurrence.
Here we introduce Mutual Hazard Networks, a new class of models that improve upon the state of the art by allowing stochastic dependencies between events, inhibiting dependencies and dependencies that form cycles. MHNs model events by their spontaneous rate of occurrence and by multiplicative effects they exert on the rates of successive events.
We further propose an approach for modeling and predicting pivotal events such as the diagnosis of the tumor, temporary inflammation of the tumor, seeding of a metastasis or death of the patient.
To this end we formulate an MHN as a large, continuous-time Markov chain whose transition rate matrix is given as a sum of tensor products. We develop efficient algorithms for computing its transient, stationary and time-marginal probability distributions as well as their derivatives with respect to model parameters in order to perform inference.
First results indicate that MHNs consistently outperform state-of-the-art models on publicly available data in terms of cross-validated model fit. In particular, MHN inferred from a glioblastoma dataset from The Cancer Genome Atlas that IDH1 mutations are early events that promote subsequent mutations in TP53, a finding that is independently supported by consecutive biopsies.
Moreover, we demonstrate the general usefulness of our method beyond oncology by applying it to a stochastic SIR model of epidemic spread. We use our algorithm for computing the derivative of a transient distribution to estimate the monthly infection and recovery rates during the first COVID-19 wave in Austria in a full Bayesian analysis.
Übersetzung der Zusammenfassung (Deutsch)
Krebs schreitet fort, indem er genomische Ereignisse wie Mutationen und Kopienzahländerungen anhäuft. Ihre chronologische Reihenfolge ist der Schlüssel zum Verständnis der Krankheit, aber schwer zu beobachten. Stattdessen verwenden Krebsprogressionsmodelle Muster von gemeinsam aufgetretenen Ereignissen in Querschnittsdaten, um auf Abhängigkeiten zwischen Ereignissen zu schließen und dadurch ihre ...
Übersetzung der Zusammenfassung (Deutsch)
Krebs schreitet fort, indem er genomische Ereignisse wie Mutationen und Kopienzahländerungen anhäuft. Ihre chronologische Reihenfolge ist der Schlüssel zum Verständnis der Krankheit, aber schwer zu beobachten. Stattdessen verwenden Krebsprogressionsmodelle Muster von gemeinsam aufgetretenen Ereignissen in Querschnittsdaten, um auf Abhängigkeiten zwischen Ereignissen zu schließen und dadurch ihre wahrscheinlichste Reihenfolge aufzudecken.
In dieser Arbeit führen wir Mutual Hazard Networks ein, eine neue Klasse von Modellen, die den Stand der Technik verbessern, indem sie stochastische Abhängigkeiten zwischen Ereignissen zulassen, als auch inhibierende und zyklische Abhängigkeiten. MHNs modellieren Ereignisse durch ihre spontane Auftrittsrate und durch multiplikative Effekte, die sie auf die Raten nachfolgender Ereignisse ausüben.
Wir schlagen ferner einen Ansatz zur Modellierung und Vorhersage von entscheidenden Ereignissen vor, wie der Diagnose des Tumors, der vorübergehenden Entzündung des Tumors, der Disseminierung einer Metastase oder dem Tod des Patienten.
Dazu formulieren wir ein MHN als große, zeitkontinuierliche Markov-Kette, deren Übergangsratenmatrix als Summe von Tensorprodukten gegeben ist. Wir entwickeln effiziente Algorithmen zur Berechnung ihrer transienten, stationären und zeitmarginalen Wahrscheinlichkeitsverteilungen sowie ihrer Ableitungen nach Modellparametern, um Inferenz durchzuführen.
Erste Ergebnisse deuten darauf hin, dass MHNs durchgängig State-of-the-Art-Modelle auf öffentlich zugänglichen Daten in Bezug auf die kreuzvalidierte Modellanpassung übertreffen. Insbesondere leitete MHN aus einem Glioblastom-Datensatz von The Cancer Genome Atlas ab, dass IDH1-Mutationen frühe Ereignisse sind, die nachfolgende Mutationen in TP53 fördern, ein Befund, der unabhängig durch konsekutive Biopsien gestützt wird.
Darüber hinaus demonstrieren wir die allgemeine Nützlichkeit unserer Methode über die Onkologie hinaus, indem wir sie auf ein stochastisches SIR-Modell der Ausbreitung von Epidemien anwenden. Wir verwenden unseren Algorithmus zur Berechnung der Ableitung einer transienten Verteilung, um die monatlichen Infektions- und Genesungsraten während der ersten COVID-19-Welle in Österreich in einer vollständigen Bayes'schen Analyse zu schätzen.