Direkt zum Inhalt

Glehr, Gunther

Neural networks to predict clinical events from cytometry data

Glehr, Gunther (2026) Neural networks to predict clinical events from cytometry data. PhD, Universität Regensburg.

Date of publication of this fulltext: 08 Apr 2026 07:45
Thesis of the University of Regensburg
DOI to cite this document: 10.5283/epub.52191


Abstract (English)

From a computational perspective, clinical decision making requires classifying a patient into classes that respond similarly to treatment. Cytometry characterises individual cells in patient specimens by size, complexity or surface markers. The result is a matrix per specimen with an unordered number of rows refecting the cells and a defined number of cell-parameters as columns. These data can ...

From a computational perspective, clinical decision making requires classifying a patient into classes that respond similarly to treatment.
Cytometry characterises individual cells in patient specimens by size, complexity or surface markers. The result is a matrix per specimen with an unordered number of rows refecting the cells and a defined number of cell-parameters as columns. These data can be used for classification, hence also for clinical decision making.
Classically, predictive modelling uses cell subpopulation quantities as a predictor to classify each sample. The cell subpopulations are defined by binning cells with similar characteristics. Sequential gating, manually defining cuts in the parameters, or automated clustering are possibilities for binning.

In contrast to this two-step procedure, this thesis investigates the application of neural networks to classify cytometry samples without prior cell subpopulation identification.

I provide a Cell Cloud Classification python package (CCC): A modular framework for neural networks to classify and investigate cytometry samples. The
investigation includes a novel, decision-tree based concept to explain the predictions.

I study the impact of hyperparameters by classifying public cytomegalovirus
samples. The impact was measured using the classification AUC. Here, using the mean proved superior to maximum pooling. There were an optimum number of layers, but the number of nodes was irrelevant. The number of drawn cells, but neither replacement nor focus on rare cells were relevant. Surprisingly, network initialisation affected performance, but validation and test performance correlated.
I study CCC in binary and multiclass simulations. Additionally, classifying T-cell based flow cytometry samples of (non-) starved human blood resulted in reliable but non-classical discriminative cell subpopulations.

In summary, I present a python package to classify cytometry samples using
neural networks and show its application to real and simulated datasets.

Translation of the abstract (German)

Aus der Sicht von computerunterstützter Analyse erfordert die klinische Entscheidungsfindung die Einteilung von Patienten in Klassen welche ähnlich auf Behandlungen ansprechen. Zytometrie charakterisiert einzelne Zellen von Patientenproben nach Größe, Komplexität oder Oberfächenmarkern. Daraus ergibt sich eine Matrix pro biologischer Probe mit einer ungeordneten Anzahl von Zeilen. Die Zeilen ...

Aus der Sicht von computerunterstützter Analyse erfordert die klinische Entscheidungsfindung die Einteilung von Patienten in Klassen welche ähnlich auf Behandlungen ansprechen.
Zytometrie charakterisiert einzelne Zellen von Patientenproben nach Größe,
Komplexität oder Oberfächenmarkern. Daraus ergibt sich eine Matrix pro biologischer Probe mit einer ungeordneten Anzahl von Zeilen. Die Zeilen dieser Matrix spiegeln die gemessenen Zellen der Probe wieder und die Spalten eine definierte Anzahl von Zellparametern. Diese Daten können zur Klassifikation und damit auch zur klinischen Entscheidungsfindung verwendet werden.

Klassischerweise verwendet prädiktive Modellierung Zellsubpopulationshäufigkeiten als Prädiktoren, um jede biologische Probe zu klassifizieren. Die Zellsubpopulationen werden durch das Eingruppieren von Zellen mit ähnlichen Eigenschaften definiert. Sequentielles gating, das manuelle definieren von Grenzwerten der Zellparametern, oder automatisiertes Clustering sind Gruppierungsmöglichkeiten.

Im Gegensatz zu diesem zweistufigen Verfahren untersucht diese Arbeit die
Verwendung neuronaler Netze zur Klassifizierung von Zytometrieproben ohne
vorherige Identifizierung der Zellsubpopulationen.

Ich präsentiere das Python Paket CCC Cell Cloud Classification (Zell-Wolken-
Klassifkation): Ein modulares Framework für neuronale Netze zur Klassifizierung und Untersuchung von Zytometrieproben. Die Untersuchung beinhaltet ein neuartiges, entscheidungsbaumbasiertes Konzept zur Erklärung der Vorhersagen des neuronalen Netzes.
Ich untersuche den Einfluss von Hyperparametern, indem ich öffentlich verfügbare biologische Proben mit oder ohne CMV klassifiziere. Anhand der Klassifizierungs-AUC wurde die Performance beurteilt. Zusammenfassen der Zellen mithilfe des Mittelwerts war der Nutzung des Maximums überlegen. Für das neuronale Netz gab es eine optimale Anzahl von Schichten, aber die Anzahl der Knoten spielte keine Rolle. Die Anzahl der gezogenen Zellen, aber weder (nicht) wiederholtes ziehen noch der Fokus auf seltene Zellen waren relevant. Überraschenderweise beeinflusst die Netzwerkinitialisierung die Performance, aber Validierung und Testperformance korrelierten.
Ich untersuche CCC in Binär- und Mehrklassensimulationen. Darüber hinaus
führte die Klassifizierung von T-Zell-basierten Durchflusszytometrieproben von (nicht) gefasteten Blutproben zu zuverlässigen, aber nicht klassisch diskriminierenden Zellpopulationen.

Zusammenfassend stelle ich ein Python-Paket vor, um Zytometrieproben mit
neuronalen Netzen zu klassifizieren und ich zeige die Anwendung auf reale und simulierte Datensätze.


Involved Institutions


Details

Item typeThesis of the University of Regensburg (PhD)
Date8 April 2026
RefereeProf. Dr. Rainer Spang and Prof. Dr. Edward K. Geissler and Prof. Dr. Wolfram Gronwald
Date of exam7 April 2022
InstitutionsMedicine > Institut für Funktionelle Genomik > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
Informatics and Data Science > Department Computational Life Science > Lehrstuhl für Statistische Bioinformatik (Prof. Spang)
KeywordsNeuronale Netze, Zytometrie, Python
Dewey Decimal Classification000 Computer science, information & general works > 004 Computer science
500 Science > 510 Mathematics
500 Science > 530 Physics
500 Science > 570 Life sciences
600 Technology > 610 Medical sciences Medicine
StatusPublished
RefereedYes, this version has been refereed
Created at the University of RegensburgYes
URN of the UB Regensburgurn:nbn:de:bvb:355-epub-521913
Item ID52191

Export bibliographical data

Owner only: item control page

nach oben