| Angenommene Version Download ( PDF | 5MB) | Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand |
Neural networks to predict clinical events from cytometry data
Glehr, Gunther
(2026)
Neural networks to predict clinical events from cytometry data.
Dissertation, Universität Regensburg.
Veröffentlichungsdatum dieses Volltextes: 08 Apr 2026 07:45
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.52191
Zusammenfassung (Englisch)
From a computational perspective, clinical decision making requires classifying a patient into classes that respond similarly to treatment. Cytometry characterises individual cells in patient specimens by size, complexity or surface markers. The result is a matrix per specimen with an unordered number of rows refecting the cells and a defined number of cell-parameters as columns. These data can ...
From a computational perspective, clinical decision making requires classifying a patient into classes that respond similarly to treatment.
Cytometry characterises individual cells in patient specimens by size, complexity or surface markers. The result is a matrix per specimen with an unordered number of rows refecting the cells and a defined number of cell-parameters as columns. These data can be used for classification, hence also for clinical decision making.
Classically, predictive modelling uses cell subpopulation quantities as a predictor to classify each sample. The cell subpopulations are defined by binning cells with similar characteristics. Sequential gating, manually defining cuts in the parameters, or automated clustering are possibilities for binning.
In contrast to this two-step procedure, this thesis investigates the application of neural networks to classify cytometry samples without prior cell subpopulation identification.
I provide a Cell Cloud Classification python package (CCC): A modular framework for neural networks to classify and investigate cytometry samples. The
investigation includes a novel, decision-tree based concept to explain the predictions.
I study the impact of hyperparameters by classifying public cytomegalovirus
samples. The impact was measured using the classification AUC. Here, using the mean proved superior to maximum pooling. There were an optimum number of layers, but the number of nodes was irrelevant. The number of drawn cells, but neither replacement nor focus on rare cells were relevant. Surprisingly, network initialisation affected performance, but validation and test performance correlated.
I study CCC in binary and multiclass simulations. Additionally, classifying T-cell based flow cytometry samples of (non-) starved human blood resulted in reliable but non-classical discriminative cell subpopulations.
In summary, I present a python package to classify cytometry samples using
neural networks and show its application to real and simulated datasets.
Übersetzung der Zusammenfassung (Deutsch)
Aus der Sicht von computerunterstützter Analyse erfordert die klinische Entscheidungsfindung die Einteilung von Patienten in Klassen welche ähnlich auf Behandlungen ansprechen. Zytometrie charakterisiert einzelne Zellen von Patientenproben nach Größe, Komplexität oder Oberfächenmarkern. Daraus ergibt sich eine Matrix pro biologischer Probe mit einer ungeordneten Anzahl von Zeilen. Die Zeilen ...
Aus der Sicht von computerunterstützter Analyse erfordert die klinische Entscheidungsfindung die Einteilung von Patienten in Klassen welche ähnlich auf Behandlungen ansprechen.
Zytometrie charakterisiert einzelne Zellen von Patientenproben nach Größe,
Komplexität oder Oberfächenmarkern. Daraus ergibt sich eine Matrix pro biologischer Probe mit einer ungeordneten Anzahl von Zeilen. Die Zeilen dieser Matrix spiegeln die gemessenen Zellen der Probe wieder und die Spalten eine definierte Anzahl von Zellparametern. Diese Daten können zur Klassifikation und damit auch zur klinischen Entscheidungsfindung verwendet werden.
Klassischerweise verwendet prädiktive Modellierung Zellsubpopulationshäufigkeiten als Prädiktoren, um jede biologische Probe zu klassifizieren. Die Zellsubpopulationen werden durch das Eingruppieren von Zellen mit ähnlichen Eigenschaften definiert. Sequentielles gating, das manuelle definieren von Grenzwerten der Zellparametern, oder automatisiertes Clustering sind Gruppierungsmöglichkeiten.
Im Gegensatz zu diesem zweistufigen Verfahren untersucht diese Arbeit die
Verwendung neuronaler Netze zur Klassifizierung von Zytometrieproben ohne
vorherige Identifizierung der Zellsubpopulationen.
Ich präsentiere das Python Paket CCC Cell Cloud Classification (Zell-Wolken-
Klassifkation): Ein modulares Framework für neuronale Netze zur Klassifizierung und Untersuchung von Zytometrieproben. Die Untersuchung beinhaltet ein neuartiges, entscheidungsbaumbasiertes Konzept zur Erklärung der Vorhersagen des neuronalen Netzes.
Ich untersuche den Einfluss von Hyperparametern, indem ich öffentlich verfügbare biologische Proben mit oder ohne CMV klassifiziere. Anhand der Klassifizierungs-AUC wurde die Performance beurteilt. Zusammenfassen der Zellen mithilfe des Mittelwerts war der Nutzung des Maximums überlegen. Für das neuronale Netz gab es eine optimale Anzahl von Schichten, aber die Anzahl der Knoten spielte keine Rolle. Die Anzahl der gezogenen Zellen, aber weder (nicht) wiederholtes ziehen noch der Fokus auf seltene Zellen waren relevant. Überraschenderweise beeinflusst die Netzwerkinitialisierung die Performance, aber Validierung und Testperformance korrelierten.
Ich untersuche CCC in Binär- und Mehrklassensimulationen. Darüber hinaus
führte die Klassifizierung von T-Zell-basierten Durchflusszytometrieproben von (nicht) gefasteten Blutproben zu zuverlässigen, aber nicht klassisch diskriminierenden Zellpopulationen.
Zusammenfassend stelle ich ein Python-Paket vor, um Zytometrieproben mit
neuronalen Netzen zu klassifizieren und ich zeige die Anwendung auf reale und simulierte Datensätze.
Downloadstatistik
Downloadstatistik