Design of Protein Interfaces Using Computer-Based Methods
Nazet, Julian Simon (2022) Design of Protein Interfaces Using Computer-Based Methods. Dissertation, Universität Regensburg.Veröffentlichungsdatum dieses Volltextes: 01 Mrz 2022 07:27
Hochschulschrift der Universität Regensburg
DOI zum Zitieren dieses Dokuments: 10.5283/epub.44884
Zusammenfassung (Englisch)
Computer-based methods are excellent tools to modify existing proteins. The software suite Rosetta offers a large variety of options to solve many problems of protein design. During the last decades a steadily increasing number of protocols became available and more complex concepts for the modelling of proteins and their function arouse. Among them is multi-state protein design (MSD) that ...
Computer-based methods are excellent tools to modify existing proteins. The software suite Rosetta offers a large variety of options to solve many problems of protein design. During the last decades a steadily increasing number of protocols became available and more complex concepts for the modelling of proteins and their function arouse. Among them is multi-state protein design (MSD) that utilizes in parallel several three-dimensional conformations of a protein to increase the chances of a successful design.
In the first part of this work I used MSD to reprogram a protein interface by means of an anchored design approach. The starting point was a pair of glutamine amidotransferase complexes consisting both of homologous pairs of synthase and glutaminase subunits. The goal was to alter the interface of the synthase subunit PabA such that it is no longer able to bind the native glutaminase subunit PabB, but the homolog TrpEx which forms a native complex with the synthase TrpG. The experimental characterization confirmed that a grafting of TrpG-specific interface residues into the PabA interface and a subsequential design by means of Rosetta gave rise to a PabA variant that exclusively bound to TrpEx. In the second part of this work I present a novel combination of a Rosetta protocol and a neural network (NN) which is used to rapidly score candidate sequences. Generally, protein design protocols require a high computational effort and therefore it is worth to develop timesaving extensions that do not degrade the design performance. My aim was to implement a hybrid combination of an NN and the classical Rosetta approach, with the NN deducing the energy landscape from the Rosetta scores of relatively few candidates. Thereby I employed a hybrid approach of a neural network and Rosetta, whereby the neural network learns the energy landscape from Rosetta and vice versa Rosetta evaluates the predictions of the neural network. Due to its speed, the trained NN allows then the sampling of a much larger region of the vast and design-specific energy landscape spanned by alternative sequences and residue orientations.
This approach also facilitates a new way to design MSD protocols, since the outcome of NNs each trained on a different state can be subsequently recombined. A protein benchmark dataset was utilized to test the performance of the new approach named Rosetta:MSF:NN. In comparison to a previously described protocol, the new one led to a threefold increase in speed.
Übersetzung der Zusammenfassung (Deutsch)
Computergestützte Methoden sind hervorragende Werkzeuge, um vorhandene Proteine zu modifizieren. Die Software-Suite Rosetta bietet eine Vielzahl von Optionen, um viele Probleme des Proteindesigns zu lösen. Während der letzten Jahrzehnte lang wurde eine stetig wachsende Anzahl von Protokollen und komplexeren Konzepten zur Modellierung von Proteinen und deren Funktion verfügbar. Unter ihnen ist ...
Computergestützte Methoden sind hervorragende Werkzeuge, um vorhandene Proteine zu modifizieren. Die Software-Suite Rosetta bietet eine Vielzahl von Optionen, um viele Probleme des Proteindesigns zu lösen. Während der letzten Jahrzehnte lang wurde eine stetig wachsende Anzahl von Protokollen und komplexeren Konzepten zur Modellierung von Proteinen und deren Funktion verfügbar. Unter ihnen ist Multi-State-Protein Design (MSD), dass parallel mehrere dreidimensionale Konformationen eines Proteins bearbeitet, um so die Chancen auf ein erfolgreiches Design zu erhöhen. Im ersten Teil dieser Arbeit habe ich mittels MSD, eine Proteinschnittstelle neu gestaltet mit Hilfe eines anchored Designansatzes. Der Ausgangspunkt war ein Paar von Glutaminamidotransferase Komplexen, die sowohl aus homologen Paaren von Synthase- als auch Glutaminase-Untereinheiten bestehen. Das Ziel war es, die Schnittstelle der Synthase-Untereinheit PabA so zu verändern, dass sie die native Glutaminase-Untereinheit PabB nicht mehr binden kann, aber das Homologe TrpEx Protein, welches einen nativen Komplex bildet mit der Synthase TrpG. Die experimentelle Charakterisierung bestätigte, dass ein Einbau von TrpG-spezifisch Reste in das PabA-Interface und ein nachfolgendes Design mittels Rosetta, eine PabA-Variante erzeugt haben, die ausschließlich TrpEx bindet. Im zweiten Teil dieser Arbeit stelle ich eine neuartige Kombination aus einem Rosetta-Protokoll und einem Neuronales Netzwerk (NN), mit dem Kandidatensequenzen schnell bewertet werden können. Im Allgemeinen erfordern Protein-Design Protokolle einen hohen Rechenaufwand. Daher lohnt es sich, zeitsparende Erweiterungen zu entwickeln, die die Designleistung nicht beeinträchtigen. Mein Ziel war es, eine Hybridkombination aus einem NN und dem klassischen Rosetta-Ansatz zu kombinieren, wobei das NN die Energielandschaft aus Rosetta mit relativ wenigen Kandidaten lernt. Das NN lernt die Energielandschaft von Rosetta und umgekehrt bewertet Rosetta die Vorhersagen des Neuronalen Netzes. Aufgrund seiner Geschwindigkeit ermöglicht das trainierte NN dann die Abtastung eines viel größeren Bereichs der designspezifischen Energielandschaft, die von alternativen Sequenzen und Rotameren gebildet wird. Dieser Ansatz ermöglicht auch ein neues Verfahren für MSD-Protokolle, da jeweils ein NN für jeden Zustand trainiert wird. Die trainierten Neuronalen Netze können danach frei kombiniert werden. Die Leistung des neuen Ansatzes mit dem Namen Rosetta:MSF:NN wurde mithilfe eines Protein-Benchmark-Datensatz bewertet. Dabei zeigte sich, dass der neue Ansatz zu einer Verdreifachung der Geschwindigkeit führte.
Beteiligte Einrichtungen
Details
| Dokumentenart | Hochschulschrift der Universität Regensburg (Dissertation) |
| Datum | 1 März 2022 |
| Begutachter (Erstgutachter) | Prof. Dr. Rainer Merkl |
| Tag der Prüfung | 15 Dezember 2020 |
| Institutionen | Biologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Rainer Merkl |
| Stichwörter / Keywords | Protein-Design, Neural-Network, Rosetta |
| Dewey-Dezimal-Klassifikation | 500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie |
| Status | Veröffentlicht |
| Begutachtet | Ja, diese Version wurde begutachtet |
| An der Universität Regensburg entstanden | Ja |
| URN der UB Regensburg | urn:nbn:de:bvb:355-epub-448842 |
| Dokumenten-ID | 44884 |
Downloadstatistik
Downloadstatistik