| Download ( PDF | 2MB) | Lizenz: Creative Commons Namensnennung 4.0 International |
Zero-Sum Regression Scale Invariant Molecular Data Analysis
Rehberg, Thorsten (2018) Zero-Sum Regression Scale Invariant Molecular Data Analysis. Dissertation, Universität Regensburg.Veröffentlichungsdatum dieses Volltextes: 17 Okt 2018 08:48
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.37841
Zusammenfassung (Englisch)
In biomedicine, it is still an outstanding issue that the absolute scale of omics data gets lost due to technical limitations. This causes that the original scale first has to be approximated by normalization techniques before analysis methods can be applied. However, there are competing normalization strategies based on different assumptions about the structure of the underlying data. Due to ...
In biomedicine, it is still an outstanding issue that the absolute scale of omics data gets lost due to
technical limitations. This causes that the original scale first has to be approximated by normalization techniques before analysis methods can be applied. However, there are competing normalization strategies based on different assumptions about the structure of the underlying data. Due to these different assumptions, normalization methods can yield different results, which can also affect the outcome of concluding analysis methods. Thus, another concept is to resolve this issue by using scale invariant data analysis methods.
This thesis shows how generalized linear regression methods can be extended with a scale invariance for log-transformed omics data by enforcing an additional constraint called zero-sum. Therefore, an efficient coordinate descent algorithm is developed and the advantages of this approach shown in simulations and on omics data. The corresponding open source software zeroSum is available at https://github.com/rehbergT/zeroSum.
Übersetzung der Zusammenfassung (Deutsch)
In der Biomedizin besteht noch immer ein Problem darin, dass die absolute Größe von Omics-Daten aufgrund technischer Einschränkungen verloren geht. Daher muss diese zuerst durch Normalisierungsverfahren approximiert werden, bevor Analyseverfahren auf die Daten angewendet werden können. Es existieren jedoch verschiedene Normalisierungsverfahren, welche auf unterschiedlichen Annahmen über die ...
In der Biomedizin besteht noch immer ein Problem darin, dass die absolute Größe von Omics-Daten aufgrund technischer Einschränkungen verloren geht. Daher muss diese zuerst durch Normalisierungsverfahren approximiert werden, bevor Analyseverfahren auf die Daten angewendet werden können. Es existieren jedoch verschiedene Normalisierungsverfahren, welche auf unterschiedlichen Annahmen über die Struktur der zugrunde liegenden Daten basieren. Deshalb können unterschiedliche Normalisierungsmethoden zu unterschiedlichen Ergebnissen führen, welche sich auch auf die Resultate von sich anschließenden Datenanalysen auswirken können. Ein anderes Konzept dieses Problem zu lösen ist daher skaleninvariante Datenanalyseverfahren zu verwenden.
Diese Arbeit zeigt, wie verallgemeinerte lineare Regressionsmethoden mit einer Skaleninvarianz für logarithmisch transformierte Omics-Daten erweitert werden können, indem eine zusätzliche Nebenbedingung namens zero-sum erzwungen wird. Hierfür wird ein effizienter Koordinatenabstiegsalgorithmus entwickelt und die Vorteile dieses Ansatzes in Simulationen und auf Omics-Daten gezeigt. Die zugehörige open source Software zeroSum ist unter https://github.com/rehbergT/zeroSum verfügbar.
Beteiligte Einrichtungen
Details
| Dokumentenart | Hochschulschrift der Universität Regensburg (Dissertation) | ||||
| Datum | 17 Oktober 2018 | ||||
| Begutachter (Erstgutachter) | Prof. Dr. Elmar Lang | ||||
| Tag der Prüfung | 8 Oktober 2018 | ||||
| Institutionen | Nicht ausgewählt | ||||
| Verwandte URLs |
| ||||
| Stichwörter / Keywords | generalized linear regression, omics, machine learning | ||||
| Dewey-Dezimal-Klassifikation | 500 Naturwissenschaften und Mathematik > 500 Naturwissenschaften 500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie | ||||
| Status | Veröffentlicht | ||||
| Begutachtet | Ja, diese Version wurde begutachtet | ||||
| An der Universität Regensburg entstanden | Ja | ||||
| URN der UB Regensburg | urn:nbn:de:bvb:355-epub-378411 | ||||
| Dokumenten-ID | 37841 |
Downloadstatistik
Downloadstatistik