Modellierung, Strukturverbesserung und sequentielle Zuordnung als vollautomatische Module für die automatisierte Proteinstrukturbestimmung im Softwareprojekt AUREMOL

Brunner, Konrad (2007) Modellierung, Strukturverbesserung und sequentielle Zuordnung als vollautomatische Module für die automatisierte Proteinstrukturbestimmung im Softwareprojekt AUREMOL. Dissertation, Universität Regensburg.

Veröffentlichungsdatum dieses Volltextes: 04 Okt 2007 08:12
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.10518

Vorschau

Download ( PDF | 4MB)

Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand

Zusammenfassung (Deutsch)

In der vorliegenden Arbeit wurde die Entwicklung des Softwareprojekts AUREMOL fortgesetzt. Das Ziel von AUREMOL ist die Bereitstellung von Modulen, die eine automatische Strukturbestimmung von Proteinen in Lösung mit möglichst wenigen experimentellen Daten ermöglichen. Grundsätzliche Neuerungen sind die Einführung einer einheitlichen IUPAC-konformen Nomenklatur der Atomnamen der einzelnen Aminosäuren in den verschiedenen Modulen von AUREMOL und die Bereitstellung entsprechender Konverter, um Fremddaten leicht und schnell nutzen zu können.
Es wurden drei spezielle Module entwickelt, mit deren Hilfe die Proteinbestimmung mittels AUREMOL weiter automatisiert wurde. Der Top-Down-Ansatz von AUREMOL verlangt u. a. eine Startstruktur. Im Extremfall kann hier ein ausgestreckter Strang eingesetzt werden. Um jedoch mehr Strukturinformationen gleich von Anfang an nutzbar zu machen und so die Strukturbestimmung zu beschleunigen, wurde als erstes Modul eine Homologie-Modellierung (PERMOL) in AUREMOL implementiert und weiterentwickelt. Da bereits ab einer Sequenzidentität von mehr als 20 % eine Homologie bzgl. Funktion und somit Struktur vorliegen kann, wird die Strukturinformation derartiger, bereits gelöster, Proteine dazu genutzt, Atomabstände, Diederwinkel und Wasserstoffbrücken aus den PDB-Dateien zu berechnen. Diese Daten werden dann als Beschränkungen (Restraints) in Moleküldynamik-Programmen verwendet. Die Berechnung von Fehlergrenzen folgt unmittelbar aus den mit Hilfe der jeweiligen Standardabweichung berechneten Konfidenzintervallen. Ebenso können auf diese Weise aus einzelnen Röntgenstrukturen mit Hilfe der für jedes Atom gegebenen
B-Faktoren und der Auflösung Strukturbündel gewonnen werden. Die so gewonnenen homologen Strukturen können sehr vielfältig in den verschiedenen Modulen von AUREMOL als Startstruktur eingesetzt werden.
Das zweite Modul ISIC dient zur Strukturverbesserung von Proteinen unter Verwendung von Informationen aus anderen Datenquellen. Während der letzten Jahre ist die in der Proteindatenbank hinterlegte Datenmenge enorm angewachsen. Durch die richtige Nutzung können diese Daten eine wichtige Rolle bei künftigen Strukturbestimmungen einnehmen. Mit ISIC wird ein neuer, allgemeiner und vollautomatischer Ansatz für die Kombination von Strukturinformationen vorgestellt. Besonders wichtig hierbei ist, dass die Daten nicht auf einfache Weise gemittelt werden, sondern dass nur relevante Daten zur Strukturverbesserung beitragen. Auf diese Weise ist es möglich, hoch aufgelöste Strukturen zu berechnen.
Mit ASSIGN wurde in der vorliegenden Arbeit ein drittes Modul entwickelt, mit dessen Hilfe die sequentielle Zuordnung erstellt wird. Der Vergleich eines simulierten und experimentellen 2D-NOESY-Spektrums in definierten Bereichen ermöglicht es ASSIGN, fehlende chemische Verschiebungen zu finden. Dazu werden die fehlenden chemischen Verschiebungen iterativ variiert und jedes Mal das simulierte Spektrum neu aufgebaut. Ein Vergleich von Linienform und Volumina sowie die Nutzung einer statistischen Vorhersage für chemische Verschiebungen liefern eine Bewertung des Vergleichs. Durch Optimierung wird die wahrscheinlichste Lösung als sequentielle Zuordnung festgehalten.

Übersetzung der Zusammenfassung (Englisch)

In this dissertation the development of the software package AUREMOL is continued. The goal of AUREMOL is to provide routines for an automatic protein structure determination from a minimum of experimental data with a minimum of user intervention. General improvements are the establishment of an IUPAC compliant nomenclature of the atoms in the amino acids in the different modules of AUREMOL and the introduction of adequate converters in order to use extrinsic data in an easy and fast way.
Three special modules for a further automatisation of protein structure determination via AUREMOL were developed. The top down approach in AUREMOL demands among other things a starting structure. In extreme case an extended strand can be employed. But to use more structure information from the very beginning and to speed up structure determination that way, a homology modeling module was implemented and enhanced in AUREMOL. As a homology regarding function and thus structure can be expected at a sequence identity above 20 %, structure information from those already solved proteins is used to calculate atom distances, dihedral angles and H-bonds from the PDB files. This data is used as restraints in molecular dynamic programs. The calculation of error bonds as confidence intervals follows directly from the standard deviations. Similarly in this way structure bundles can be obtained from a single X-ray structure with the use of the B-factor given for each atom and the resolution. The obtained homologous structures can be used in the different modules of AUREMOL.
The second module ISIC is developed for structure improvement of proteins using information from other data sources. During the last years the amount of data deposited in the protein database was significantly increased. Accurate use of this data can play an important role in future structure determination. With ISIC a new, general and fully automatic approach is introduced in order to combine structure information. Of particular importance is, that the data is not combined by simply averaging, but only relevant data contribute to structure improvement. In that way it is possible to calculate high resolution structures.
The third module ASSIGN allows to determine the sequential assignment automatically. The comparison of a simulated and an experimental 2D-NOESY spectrum in defined regions is used in ASSIGN to find missing chemical shifts. To this end the missing chemical shifts are varied iteratively and the simulated spectrum is rebuilt for each step. The comparison of line shapes and volumes as well as the use of statistical prediction of chemical shifts supply a rating for the comparison. In an optimization process the most likely solution is determined on as sequential assignment.

Beteiligte Einrichtungen

Biologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Dr. Hans Robert Kalbitzer
Browse Publikationen

Details

Dokumentenart	Hochschulschrift der Universität Regensburg (Dissertation)
Open Access Art:	Primärpublikation
Datum	3 Oktober 2007
Begutachter (Erstgutachter)	Hans Robert (Prof. Dr. Dr.) Kalbitzer
Tag der Prüfung	16 August 2006
Institutionen	Biologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Dr. Hans Robert Kalbitzer
Stichwörter / Keywords	Mehrdimensionale NMR-Spektroskopie , Molekulare Bioinformatik , Proteine , Top-Down-Verfahren , Computerunterstütztes Verfahren , Proteinstruktur , AUREMOL , ISIC , ASSIGN , PERMOL , protein structure , AUREMOL , ISIC , ASSIGN , PERMOL
Dewey-Dezimal-Klassifikation	500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie
Status	Veröffentlicht
Begutachtet	Ja, diese Version wurde begutachtet
An der Universität Regensburg entstanden	Ja
URN der UB Regensburg	urn:nbn:de:bvb:355-opus-7030
Dokumenten-ID	10518

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

Downloadstatistik

Weitere Literatur (mittels CORE)

nach oben