Modellierung, Strukturverbesserung und sequentielle Zuordnung als vollautomatische Module für die automatisierte Proteinstrukturbestimmung im Softwareprojekt AUREMOL

URN to cite this document: urn:nbn:de:bvb:355-opus-7030

Brunner, Konrad (2007) Modellierung, Strukturverbesserung und sequentielle Zuordnung als vollautomatische Module für die automatisierte Proteinstrukturbestimmung im Softwareprojekt AUREMOL. PhD, Universität Regensburg

[img]
Preview

Publishing license for publications excluding print on demand
PDF - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
4073Kb

Abstract (German)

In der vorliegenden Arbeit wurde die Entwicklung des Softwareprojekts AUREMOL fortgesetzt. Das Ziel von AUREMOL ist die Bereitstellung von Modulen, die eine automatische Strukturbestimmung von Proteinen in Lösung mit möglichst wenigen experimentellen Daten ermöglichen. Grundsätzliche Neuerungen sind die Einführung einer einheitlichen IUPAC-konformen Nomenklatur der Atomnamen der einzelnen Aminosäuren in den verschiedenen Modulen von AUREMOL und die Bereitstellung entsprechender Konverter, um Fremddaten leicht und schnell nutzen zu können.
Es wurden drei spezielle Module entwickelt, mit deren Hilfe die Proteinbestimmung mittels AUREMOL weiter automatisiert wurde. Der Top-Down-Ansatz von AUREMOL verlangt u. a. eine Startstruktur. Im Extremfall kann hier ein ausgestreckter Strang eingesetzt werden. Um jedoch mehr Strukturinformationen gleich von Anfang an nutzbar zu machen und so die Strukturbestimmung zu beschleunigen, wurde als erstes Modul eine Homologie-Modellierung (PERMOL) in AUREMOL implementiert und weiterentwickelt. Da bereits ab einer Sequenzidentität von mehr als 20 % eine Homologie bzgl. Funktion und somit Struktur vorliegen kann, wird die Strukturinformation derartiger, bereits gelöster, Proteine dazu genutzt, Atomabstände, Diederwinkel und Wasserstoffbrücken aus den PDB-Dateien zu berechnen. Diese Daten werden dann als Beschränkungen (Restraints) in Moleküldynamik-Programmen verwendet. Die Berechnung von Fehlergrenzen folgt unmittelbar aus den mit Hilfe der jeweiligen Standardabweichung berechneten Konfidenzintervallen. Ebenso können auf diese Weise aus einzelnen Röntgenstrukturen mit Hilfe der für jedes Atom gegebenen
B-Faktoren und der Auflösung Strukturbündel gewonnen werden. Die so gewonnenen homologen Strukturen können sehr vielfältig in den verschiedenen Modulen von AUREMOL als Startstruktur eingesetzt werden.
Das zweite Modul ISIC dient zur Strukturverbesserung von Proteinen unter Verwendung von Informationen aus anderen Datenquellen. Während der letzten Jahre ist die in der Proteindatenbank hinterlegte Datenmenge enorm angewachsen. Durch die richtige Nutzung können diese Daten eine wichtige Rolle bei künftigen Strukturbestimmungen einnehmen. Mit ISIC wird ein neuer, allgemeiner und vollautomatischer Ansatz für die Kombination von Strukturinformationen vorgestellt. Besonders wichtig hierbei ist, dass die Daten nicht auf einfache Weise gemittelt werden, sondern dass nur relevante Daten zur Strukturverbesserung beitragen. Auf diese Weise ist es möglich, hoch aufgelöste Strukturen zu berechnen.
Mit ASSIGN wurde in der vorliegenden Arbeit ein drittes Modul entwickelt, mit dessen Hilfe die sequentielle Zuordnung erstellt wird. Der Vergleich eines simulierten und experimentellen 2D-NOESY-Spektrums in definierten Bereichen ermöglicht es ASSIGN, fehlende chemische Verschiebungen zu finden. Dazu werden die fehlenden chemischen Verschiebungen iterativ variiert und jedes Mal das simulierte Spektrum neu aufgebaut. Ein Vergleich von Linienform und Volumina sowie die Nutzung einer statistischen Vorhersage für chemische Verschiebungen liefern eine Bewertung des Vergleichs. Durch Optimierung wird die wahrscheinlichste Lösung als sequentielle Zuordnung festgehalten.

Translation of the abstract (English)

In this dissertation the development of the software package AUREMOL is continued. The goal of AUREMOL is to provide routines for an automatic protein structure determination from a minimum of experimental data with a minimum of user intervention. General improvements are the establishment of an IUPAC compliant nomenclature of the atoms in the amino acids in the different modules of AUREMOL and the introduction of adequate converters in order to use extrinsic data in an easy and fast way.
Three special modules for a further automatisation of protein structure determination via AUREMOL were developed. The top down approach in AUREMOL demands among other things a starting structure. In extreme case an extended strand can be employed. But to use more structure information from the very beginning and to speed up structure determination that way, a homology modeling module was implemented and enhanced in AUREMOL. As a homology regarding function and thus structure can be expected at a sequence identity above 20 %, structure information from those already solved proteins is used to calculate atom distances, dihedral angles and H-bonds from the PDB files. This data is used as restraints in molecular dynamic programs. The calculation of error bonds as confidence intervals follows directly from the standard deviations. Similarly in this way structure bundles can be obtained from a single X-ray structure with the use of the B-factor given for each atom and the resolution. The obtained homologous structures can be used in the different modules of AUREMOL.
The second module ISIC is developed for structure improvement of proteins using information from other data sources. During the last years the amount of data deposited in the protein database was significantly increased. Accurate use of this data can play an important role in future structure determination. With ISIC a new, general and fully automatic approach is introduced in order to combine structure information. Of particular importance is, that the data is not combined by simply averaging, but only relevant data contribute to structure improvement. In that way it is possible to calculate high resolution structures.
The third module ASSIGN allows to determine the sequential assignment automatically. The comparison of a simulated and an experimental 2D-NOESY spectrum in defined regions is used in ASSIGN to find missing chemical shifts. To this end the missing chemical shifts are varied iteratively and the simulated spectrum is rebuilt for each step. The comparison of line shapes and volumes as well as the use of statistical prediction of chemical shifts supply a rating for the comparison. In an optimization process the most likely solution is determined on as sequential assignment.

Item Type:Thesis of the University of Regensburg (PhD)
Referee:Hans Robert (Prof. Dr. Dr.) Kalbitzer
Date of exam:16 August 2006
Institutions: Biology, Preclinical Medicine > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Dr. Hans Robert Kalbitzer
Keywords:Mehrdimensionale NMR-Spektroskopie , Molekulare Bioinformatik , Proteine , Top-Down-Verfahren , Computerunterstütztes Verfahren , Proteinstruktur , AUREMOL , ISIC , ASSIGN , PERMOL , protein structure , AUREMOL , ISIC , ASSIGN , PERMOL
Subjects:500 Science > 570 Life sciences
Status:Published
Refereed:Yes, this version has been refereed
Created at the University of Regensburg:Yes
Owner:Universitätsbibliothek Regensburg
Deposited On:27 Oct 2009 09:12
Last Modified:16 Oct 2012 11:14
Item ID:10518
Owner Only: item control page