Direkt zum Inhalt

Heizinger, Leonhard Josef

Exploring Early Stages of Protein Evolution

Heizinger, Leonhard Josef (2021) Exploring Early Stages of Protein Evolution. Dissertation, Universität Regensburg.

Veröffentlichungsdatum dieses Volltextes: 02 Aug 2021 06:23
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.43604


Zusammenfassung (Englisch)

A comparison of protein backbones makes clear that the number of contemporary protein ar- chitectures is limited: Not more than approximately 1400 different folds exist, each specifying the architecture of a protein domain. In agreement with the frequent reuse observed in nature, many folds can accommodate different functions and large proteins are composed of specific do- main combinations. ...

A comparison of protein backbones makes clear that the number of contemporary protein ar-
chitectures is limited: Not more than approximately 1400 different folds exist, each specifying
the architecture of a protein domain. In agreement with the frequent reuse observed in nature,
many folds can accommodate different functions and large proteins are composed of specific do-
main combinations. These findings make clear that gene duplication and fusion are fundamental
forces in evolution. In contrast to the evolution of homologs that share the same fold but possess
substantially different functions, the origin of the architecture of individual domains is unclear.
If reuse was also the driving force of domain evolution, it should be possible to identify a set
of ancestral fragments of sub-domain size that are shared between domains having significantly
different architectures. For a fully automated detection of putative ancestral fragments, the
algorithm FragStatt was developed. It assesses proteins pairwise in order to find shared frag-
ments. To identify fragments that are homologous, FragStatt compares sequences and to reach
maximum sensitivity, HMM searches are cascaded. Subsequently, the program determines and
scores the similarity of the fragments’ 3D structures. A comprehensive large-scale comparison of
proteins from the CATH database yielded 12,533 partially overlapping and structurally similar
motifs that clustered to 134 unique motifs. These motifs are concentrated on not more than
18 % of the CATH topologies and at most one topology exists that contains more than one motif.
These findings suggest that the reuse of sub-domain sized fragments was not the dominating
force of protein evolution.

Übersetzung der Zusammenfassung (Deutsch)

Der Vergleich von Protein-Backbones macht deutlich, dass dieAnzahl der heutigen Protein-Architekturen begrenzt ist: Es gibtnicht mehr als ungefähr 1400 verschiedene Folds. Viele Foldskönnen unterschiedlichste Funktionen erfüllen und größere Proteinewiederum sind aufgebaut aus der Kombination von mehreren Domänen,die jeweils einen bestimmten Fold aufweisen. Diese Ergebnissemachen deutlich, dass ...

Der Vergleich von Protein-Backbones macht deutlich, dass dieAnzahl der heutigen Protein-Architekturen begrenzt ist: Es gibtnicht mehr als ungefähr 1400 verschiedene Folds. Viele Foldskönnen unterschiedlichste Funktionen erfüllen und größere Proteinewiederum sind aufgebaut aus der Kombination von mehreren Domänen,die jeweils einen bestimmten Fold aufweisen. Diese Ergebnissemachen deutlich, dass Genduplikation und -fusion von grundlegenderBedeutung sind in der Evolution. Im Gegensatz zur Entwicklung vonhomologen Domänen, die den gleiche Fold teilen, ist der Ursprungder Architektur einzelner Domänen jedoch unklar. Wenn dieWiederverwendung auch der treibende Mechanismus hinter derEvolution von Domänen war, sollte es möglich sein, universelleMotive in Subdomänengröße zu identifizieren, die in verschiedenenProtein-Architekturen auftreten. Für die vollautomatischeDetektion solcher Motive wurde der Algorithmus FragStattentwickelt. FragStatt untersucht Proteine paarweise und detektiertsomit gemeinsame Motive. Um homologe Fragmente zu identifizieren,vergleicht FragStatt Sequenzen durch das Kaskadieren vonHMM-Suchen und erreicht dadurch eine hohe Sensitivität.Anschließend ermittelt die Software die strukturelle Ähnlichkeitder Fragmente. Ein umfassender großangelegter Vergleich vonProteinen aus der CATH-Datenbank ergab 12.533 teilweiseüberlappende und strukturell ähnliche Motive, die auf 134einzigartige Motive zurückzuführen sind. Diese Motive erstreckensich auf lediglich 18% der CATH-Topologien. Es existiert nur eineTopologie, die mehr als eines dieser Motive enthält. DieseErgebnisse legen nahe, dass die Wiederverwendung von Fragmenten inSubdomänengröße nicht der dominierende Mechanismus in derProteinentwicklung war.


Beteiligte Einrichtungen


Details

DokumentenartHochschulschrift der Universität Regensburg (Dissertation)
Datum1 August 2021
Begutachter (Erstgutachter)Prof. Dr. Rainer Merkl
Tag der Prüfung23 Juli 2020
InstitutionenBiologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Rainer Merkl
Stichwörter / Keywordsprotein, evolution, ancestral
Dewey-Dezimal-Klassifikation000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenJa
URN der UB Regensburgurn:nbn:de:bvb:355-epub-436045
Dokumenten-ID43604

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben