Neural networks to predict clinical events from cytometry data

Glehr, Gunther

(2026) Neural networks to predict clinical events from cytometry data. Dissertation, Universität Regensburg.

Veröffentlichungsdatum dieses Volltextes: 08 Apr 2026 07:45
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.52191

Vorschau

Angenommene Version
Download ( PDF | 5MB)

Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand

Zusammenfassung (Englisch)

From a computational perspective, clinical decision making requires classifying a patient into classes that respond similarly to treatment.
Cytometry characterises individual cells in patient specimens by size, complexity or surface markers. The result is a matrix per specimen with an unordered number of rows refecting the cells and a defined number of cell-parameters as columns. These data can be used for classification, hence also for clinical decision making.
Classically, predictive modelling uses cell subpopulation quantities as a predictor to classify each sample. The cell subpopulations are defined by binning cells with similar characteristics. Sequential gating, manually defining cuts in the parameters, or automated clustering are possibilities for binning.

In contrast to this two-step procedure, this thesis investigates the application of neural networks to classify cytometry samples without prior cell subpopulation identification.

I provide a Cell Cloud Classification python package (CCC): A modular framework for neural networks to classify and investigate cytometry samples. The
investigation includes a novel, decision-tree based concept to explain the predictions.

I study the impact of hyperparameters by classifying public cytomegalovirus
samples. The impact was measured using the classification AUC. Here, using the mean proved superior to maximum pooling. There were an optimum number of layers, but the number of nodes was irrelevant. The number of drawn cells, but neither replacement nor focus on rare cells were relevant. Surprisingly, network initialisation affected performance, but validation and test performance correlated.
I study CCC in binary and multiclass simulations. Additionally, classifying T-cell based flow cytometry samples of (non-) starved human blood resulted in reliable but non-classical discriminative cell subpopulations.

In summary, I present a python package to classify cytometry samples using
neural networks and show its application to real and simulated datasets.

Übersetzung der Zusammenfassung (Deutsch)

Aus der Sicht von computerunterstützter Analyse erfordert die klinische Entscheidungsfindung die Einteilung von Patienten in Klassen welche ähnlich auf Behandlungen ansprechen.
Zytometrie charakterisiert einzelne Zellen von Patientenproben nach Größe,
Komplexität oder Oberfächenmarkern. Daraus ergibt sich eine Matrix pro biologischer Probe mit einer ungeordneten Anzahl von Zeilen. Die Zeilen dieser Matrix spiegeln die gemessenen Zellen der Probe wieder und die Spalten eine definierte Anzahl von Zellparametern. Diese Daten können zur Klassifikation und damit auch zur klinischen Entscheidungsfindung verwendet werden.

Klassischerweise verwendet prädiktive Modellierung Zellsubpopulationshäufigkeiten als Prädiktoren, um jede biologische Probe zu klassifizieren. Die Zellsubpopulationen werden durch das Eingruppieren von Zellen mit ähnlichen Eigenschaften definiert. Sequentielles gating, das manuelle definieren von Grenzwerten der Zellparametern, oder automatisiertes Clustering sind Gruppierungsmöglichkeiten.

Im Gegensatz zu diesem zweistufigen Verfahren untersucht diese Arbeit die
Verwendung neuronaler Netze zur Klassifizierung von Zytometrieproben ohne
vorherige Identifizierung der Zellsubpopulationen.

Ich präsentiere das Python Paket CCC Cell Cloud Classification (Zell-Wolken-
Klassifkation): Ein modulares Framework für neuronale Netze zur Klassifizierung und Untersuchung von Zytometrieproben. Die Untersuchung beinhaltet ein neuartiges, entscheidungsbaumbasiertes Konzept zur Erklärung der Vorhersagen des neuronalen Netzes.
Ich untersuche den Einfluss von Hyperparametern, indem ich öffentlich verfügbare biologische Proben mit oder ohne CMV klassifiziere. Anhand der Klassifizierungs-AUC wurde die Performance beurteilt. Zusammenfassen der Zellen mithilfe des Mittelwerts war der Nutzung des Maximums überlegen. Für das neuronale Netz gab es eine optimale Anzahl von Schichten, aber die Anzahl der Knoten spielte keine Rolle. Die Anzahl der gezogenen Zellen, aber weder (nicht) wiederholtes ziehen noch der Fokus auf seltene Zellen waren relevant. Überraschenderweise beeinflusst die Netzwerkinitialisierung die Performance, aber Validierung und Testperformance korrelierten.
Ich untersuche CCC in Binär- und Mehrklassensimulationen. Darüber hinaus
führte die Klassifizierung von T-Zell-basierten Durchflusszytometrieproben von (nicht) gefasteten Blutproben zu zuverlässigen, aber nicht klassisch diskriminierenden Zellpopulationen.

Zusammenfassend stelle ich ein Python-Paket vor, um Zytometrieproben mit
neuronalen Netzen zu klassifizieren und ich zeige die Anwendung auf reale und simulierte Datensätze.

Beteiligte Einrichtungen

Medizin > Institut für Funktionelle Genomik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang) Informatik und Data Science > Fachbereich Bioinformatik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
Browse Publikationen

Details

Dokumentenart	Hochschulschrift der Universität Regensburg (Dissertation)
Open Access Art:	Primärpublikation
Datum	8 April 2026
Begutachter (Erstgutachter)	Prof. Dr. Rainer Spang und Prof. Dr. Edward K. Geissler und Prof. Dr. Wolfram Gronwald
Tag der Prüfung	7 April 2022
Institutionen	Medizin > Institut für Funktionelle Genomik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang) Informatik und Data Science > Fachbereich Bioinformatik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
Stichwörter / Keywords	Neuronale Netze, Zytometrie, Python
Dewey-Dezimal-Klassifikation	000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik 500 Naturwissenschaften und Mathematik > 510 Mathematik 500 Naturwissenschaften und Mathematik > 530 Physik 500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie 600 Technik, Medizin, angewandte Wissenschaften > 610 Medizin
Status	Veröffentlicht
Begutachtet	Ja, diese Version wurde begutachtet
An der Universität Regensburg entstanden	Ja
URN der UB Regensburg	urn:nbn:de:bvb:355-epub-521913
Dokumenten-ID	52191

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

Downloadstatistik

Weitere Literatur (mittels CORE)

nach oben