Direkt zum Inhalt

Rehberg, Thorsten

Zero-Sum Regression Scale Invariant Molecular Data Analysis

Rehberg, Thorsten (2018) Zero-Sum Regression Scale Invariant Molecular Data Analysis. Dissertation, Universität Regensburg.

Veröffentlichungsdatum dieses Volltextes: 17 Okt 2018 08:48
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.37841


Zusammenfassung (Englisch)

In biomedicine, it is still an outstanding issue that the absolute scale of omics data gets lost due to technical limitations. This causes that the original scale first has to be approximated by normalization techniques before analysis methods can be applied. However, there are competing normalization strategies based on different assumptions about the structure of the underlying data. Due to ...

In biomedicine, it is still an outstanding issue that the absolute scale of omics data gets lost due to
technical limitations. This causes that the original scale first has to be approximated by normalization techniques before analysis methods can be applied. However, there are competing normalization strategies based on different assumptions about the structure of the underlying data. Due to these different assumptions, normalization methods can yield different results, which can also affect the outcome of concluding analysis methods. Thus, another concept is to resolve this issue by using scale invariant data analysis methods.
This thesis shows how generalized linear regression methods can be extended with a scale invariance for log-transformed omics data by enforcing an additional constraint called zero-sum. Therefore, an efficient coordinate descent algorithm is developed and the advantages of this approach shown in simulations and on omics data. The corresponding open source software zeroSum is available at https://github.com/rehbergT/zeroSum.

Übersetzung der Zusammenfassung (Deutsch)

In der Biomedizin besteht noch immer ein Problem darin, dass die absolute Größe von Omics-Daten aufgrund technischer Einschränkungen verloren geht. Daher muss diese zuerst durch Normalisierungsverfahren approximiert werden, bevor Analyseverfahren auf die Daten angewendet werden können. Es existieren jedoch verschiedene Normalisierungsverfahren, welche auf unterschiedlichen Annahmen über die ...

In der Biomedizin besteht noch immer ein Problem darin, dass die absolute Größe von Omics-Daten aufgrund technischer Einschränkungen verloren geht. Daher muss diese zuerst durch Normalisierungsverfahren approximiert werden, bevor Analyseverfahren auf die Daten angewendet werden können. Es existieren jedoch verschiedene Normalisierungsverfahren, welche auf unterschiedlichen Annahmen über die Struktur der zugrunde liegenden Daten basieren. Deshalb können unterschiedliche Normalisierungsmethoden zu unterschiedlichen Ergebnissen führen, welche sich auch auf die Resultate von sich anschließenden Datenanalysen auswirken können. Ein anderes Konzept dieses Problem zu lösen ist daher skaleninvariante Datenanalyseverfahren zu verwenden.
Diese Arbeit zeigt, wie verallgemeinerte lineare Regressionsmethoden mit einer Skaleninvarianz für logarithmisch transformierte Omics-Daten erweitert werden können, indem eine zusätzliche Nebenbedingung namens zero-sum erzwungen wird. Hierfür wird ein effizienter Koordinatenabstiegsalgorithmus entwickelt und die Vorteile dieses Ansatzes in Simulationen und auf Omics-Daten gezeigt. Die zugehörige open source Software zeroSum ist unter https://github.com/rehbergT/zeroSum verfügbar.


Beteiligte Einrichtungen


    Details

    DokumentenartHochschulschrift der Universität Regensburg (Dissertation)
    Datum17 Oktober 2018
    Begutachter (Erstgutachter)Prof. Dr. Elmar Lang
    Tag der Prüfung8 Oktober 2018
    InstitutionenNicht ausgewählt
    Verwandte URLs
    URLURL Typ
    https://github.com/rehbergT/zeroSumSoftware
    Stichwörter / Keywordsgeneralized linear regression, omics, machine learning
    Dewey-Dezimal-Klassifikation500 Naturwissenschaften und Mathematik > 500 Naturwissenschaften
    500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie
    StatusVeröffentlicht
    BegutachtetJa, diese Version wurde begutachtet
    An der Universität Regensburg entstandenJa
    URN der UB Regensburgurn:nbn:de:bvb:355-epub-378411
    Dokumenten-ID37841

    Bibliographische Daten exportieren

    Nur für Besitzer und Autoren: Kontrollseite des Eintrags

    nach oben