Sequence based methods for the prediction and analysis of the structural topology of transmembrane beta barrel proteins [Elektronische Ressource] / von Sikander Hayat
121 Pages
English

Sequence based methods for the prediction and analysis of the structural topology of transmembrane beta barrel proteins [Elektronische Ressource] / von Sikander Hayat

Downloading requires you to have access to the YouScribe library
Learn all about the services we offer

Description

Sequence based methods for the prediction andanalysis of the structural topology oftransmembrane beta barrel proteinsDissertationzur Erlangung des Gradesdes Doktors der Naturwissenschaftender Naturwissenschaftlich-Technischen Fakult¨at IIIChemie, Pharmazie, Bio- und Werkstoffwissenschaftender Universit¨at des SaarlandesvonSikander HayatSaarbru¨cken31. M¨arz 2010Tag des Kolloquiums: .................................Dekan: .................................Berichterstatter: ...................................................................................................Vorsitz: .................................Akad. Mitarbeiter: .................................2AcknowledgementsFirst and foremost, I am grateful to my supervisor Prof. Dr. Volkhard Helmsfor providing me with the opportunity to work in his research group. My workwould not have been possible without his constant guidance, suggestions andsupport. I am also thankful to the Graduiertenkolleg 1276/1 of the DFG forprovidingmewithanactivescientificenvironmentandsustainingmyworkwitha generous fellowship. I would also like to thank the center for bioinformaticsat the Saarland University.I want to thank the ”Coffee-club” for fun times in the afternoon breaks andmy colleagues at the research group for a pleasant working atmosphere. I amespeciallythankfultoMazenAhmadforlivelyandfruitfuldiscussions. Iamalsograteful to Tiham´er Geyer for his invaluable technical help with the computersystems.

Subjects

Informations

Published by
Published 01 January 2010
Reads 80
Language English
Document size 3 MB

Sequence based methods for the prediction and
analysis of the structural topology of
transmembrane beta barrel proteins
Dissertation
zur Erlangung des Grades
des Doktors der Naturwissenschaften
der Naturwissenschaftlich-Technischen Fakult¨at III
Chemie, Pharmazie, Bio- und Werkstoffwissenschaften
der Universit¨at des Saarlandes
von
Sikander Hayat
Saarbru¨cken
31. M¨arz 2010Tag des Kolloquiums: .................................
Dekan: .................................
Berichterstatter: .................................
.................................
.................................
Vorsitz: .................................
Akad. Mitarbeiter: .................................
2Acknowledgements
First and foremost, I am grateful to my supervisor Prof. Dr. Volkhard Helms
for providing me with the opportunity to work in his research group. My work
would not have been possible without his constant guidance, suggestions and
support. I am also thankful to the Graduiertenkolleg 1276/1 of the DFG for
providingmewithanactivescientificenvironmentandsustainingmyworkwith
a generous fellowship. I would also like to thank the center for bioinformatics
at the Saarland University.
I want to thank the ”Coffee-club” for fun times in the afternoon breaks and
my colleagues at the research group for a pleasant working atmosphere. I am
especiallythankfultoMazenAhmadforlivelyandfruitfuldiscussions. Iamalso
grateful to Tiham´er Geyer for his invaluable technical help with the computer
systems. Furthermore, I am thankful to Dr. Yungki Park for helping me with
starting my research work. I am also thankful to Nitesh Kumar Singh, and
Aaron Goodman for their contributions to the HMM project.
IamespeciallythankfultoKatharinaRudeltforherunderstanding,patience
and support, and to Imran Rauf and Muhammad Zeshan Afzal for their help.
Lastbutnotleast, IamgratefultomyparentsHayatMohammadKhanand
Badar Hayat and my sisters Salma and Amber Hayat, who always believed in
me and provided me with endless moral support and encouragement.
3Abstract
Transmembrane proteins play a major role in the normal functioning of the
cell. Many transmembrane proteins act as a drug target and hence are of ut-
most importance to the pharmaceutical industry. In spite of the significance of
transmembrane proteins, relatively few transmembrane 3D structures are avail-
able due to experimental bottlenecks. Due to this, it is imperative to develop
novel computational methods to elucidate the structure and function of these
proteins. The two major classes of transmembrane proteins are helical mem-
brane proteins and transmembrane beta barrel proteins. Relatively more 3D
structures of helical membrane proteins have been experimentally determined
and in general, the majority of computational methods in the realm of trans-
membraneproteinsdealwithhelicalmembraneproteins. However, intherecent
years there has been an increased interest in the development of computational
methods for the transmembrane beta barrel proteins. In this study, I focus
on the transmembrane beta barrel proteins. More specifically, I present here
computational methods for the prediction of the exposure status of the residues
in the membrane spanning region of the transmembrane beta barrel proteins.
To the best of our knowledge, the exposure status prediction is a novel prob-
lem in the realm of transmembrane beta barrel proteins. The knowledge about
the exposure status of the membrane spanning residues is then used to analyse
the structural properties of transmembrane beta strands. The exposure status
information is also employed to identify relevant physico-chemical properties
that are statistically significantly different in the transmembrane beta strands
at the oligomeric interfaces and the rest of the protein surface. A method for
thepredictionofthebetastrandsinthemembranespanningregionsofputative
transmembrane beta barrel proteins from protein sequence has also been devel-
oped. The computational method for strand prediction is novel in the respect
that it also gives the exposure status information of the residues predicted to be
in the predicted transmembrane beta strands. The two computational methods
developed in this study have been made available as web services. In the future,
theinformationabouttheexposurestatusoftheresiduesinthetransmembrane
beta strands can be used to identify putative transmembrane beta barrels from
proteomic data. The exposure status prediction can also be extended to predict
the pore region of transmembrane beta barrel proteins from sequence, which
could in turn be used in the function prediction of putative transmembrane
beta barrels.
5Kurzfassung
DieKlassederTransmembranproteineub¨ ernimmteineReihewesentlicherFunk-
tionen innerhalb der Zelle. Daher eignen sich viele dieser Proteine als Ziele
fur¨ medizinische Wirkstoffe und sind daher von außerordentlichem Interesse
fur¨ die Pharmaindustrie. Trotz ihrer Wichtigkeit wurden bislang nur wenige
drei-dimensionale Strukturen von Membranproteinen erfasst, denn deren ex-
perimentelle Bestimmung hat sich als ausgesprochen schwierig herausgestellt.
Aus diesem Grund erweist sich die Entwicklung von in silico Methoden zur de
novo Vorhersage von Struktur und Funktion dieser Proteine von als notwendige
Strategie.
DiebeidenwesentlichenKlassenvonTransmembranproteinenunterteiltman,
basierend auf ihren charakteristischen Sekund¨arstrukturen, in α-helikale Pro-
teine undβ-Barrels. Erstere machen den gro¨ßeren Anteil an experimentell bes-
timmten Strukturen aus, und auch die meisten bislang vorgestellten in silico
Methoden konzentrieren sich auf die Modellierung solchα-helikaler Strukturen.
In den vergangenen Jahren stieg daher das Interesse an Methoden zur Model-
lierung von transmembranen β-Barrels.
Die vorliegende Disseration besch¨aftigt sich vorrangig mit dieser Klasse von
Transmembranproteinen,insbesonderepr¨asentierenwireinVerfahrenzurVorher-
sage der Exposition (“Exposure”) zur Lipidschicht einzelner Residuen inner-
halb der Transmembranregion von β-Barrels. Diese Vorhersage der Exposition
stellt bislang ein neuartiges Problem im Feld der β-Barrels dar. Die daraus
gewonnenen Informationen wurden zur Analyse der strukturellen Eigenschaften
von Transmembranketten verwendet. Darub¨ er hinaus ko¨nnen die Exposure-
Daten zur Identifikation bedeutender physikochemischer Eigenschaften verwen-
det werden. Unsere Untersuchungen ergaben, dass zwischen transmembranen
β-strandsanOligomer-InterfacesunddemRestderProteinoberfl¨achestatistisch
signifikanteUnterschiedebezug¨ lichdieserEigenschaftenauftreten. Darub¨ erhin-
ausstellenwireinVerfahrenzursequenzbasiertenVorhersagevonTransmembran-
Residuen mutmaßlicher β-Barrels vor, welches in Kombination mit der Vorher-
sagedesExposure-StatusindieserFormneuartigist. DiebeidenindieserStudie
vorgestellten Methoden sind online als Webdienste verfug¨ bar.
Basierend auf den Exposure-Vorhersagen von β-Faltbla¨ttern ist es m¨oglich,
in kunf¨ tigen Studien mutmaßliche transmembraneβ-Barrels aus Proteomdaten
zu identifizieren.
7Zusammenfassung
Die Vorhersage von strukturellen Eigenschaften und der Topologie von Trans-
membranproteinen sowie deren Identifikation aus Proteomdaten ist bereits seit
Jahrzehnten ein st¨andig behandeltes Forschungsgebiet.
Transmembranproteine unterteilt man im wesentlichen nach ihrer charak-
teristischen Sekund¨arstruktur in α-helikale Proteine und β-Barrels. Obwohl
jung¨ st dank wesentlicher Verbesserungen im Bereich experimenteller Methoden
zurStrukturbestimmungeineVielzahlneuerdrei-dimensionalerStrukturenbes-
timmt werden konnte, steht deren Anzahl in einem sehr niedrigen Verh¨altnis zu
den bekannten lo¨slichen Proteinen. Da Transmembranproteine bekanntlich eine
Vielzahl wesentlicher Funktionen innerhalb einer Zelle ub¨ ernehmen, eignen sich
viele dieser Proteine als Ziele fur¨ medizinische Wirkstoffe und sind daher von
¨außerster Wichtigkeit fur¨ die Pharmaindustrie. Aus diesem Grund erweist sich
die Entwicklung von in silico Methoden zur de novo Vorhersage von Struktur
und Funktion dieser Proteine als notwendige Strategie.
Die meisten bislang vorgestellten in silico Methoden konzentrieren sich auf
die Analyse von Proteinen mit α-helikalen Strukturen. Basierend auf struk-
turellenundphysikochemischenGesetzma¨ßigkeitenko¨nnendieTopologiendieser
Proteine heutzutage mit hoher Genauigkeit vorhergesagt werden. Andererseits
existieren zu diesem Zeitpunkt nur wenige Methoden zur Identifikation und
VorhersagevonStruktursowieTopologietransmembranerβ-Barrels. Prinzipiell
kann deren Struktur innerhalb einer einfachen Grammatik gefasst werden: sie
bestehen aus anti-parallelen β-Faltbla¨ttern, langen extrazellul¨aren Loops, und
kurzen periplasmischen Loops. Trotz der im Vergleich zuα-helikalen Proteinen
simplen Struktur hat sich herausgestellt, dass die Identifikation von transmem-
branen β-Barrels schwieriger ist. Man fuhr¨ t dies auf das Fehlen von charak-
eristischen langen hydrophoben Aminos¨aurenketten innerhalb der Membranre-
gion zuruc¨ k. Die geringere Hydrophobizit¨at, zusammen mit der strukturellen
¨Ahnlichkeit zu den lo¨slichenβ-Barrels, macht die Identifikation von transmem-
branen β-Barrels zur Herausforderung. In den letzten Jahren wurden einige
wenigeVerfahrenmitannehmbarerGenauigkeitpubliziert,jedochfehlenbislang
Methoden zur umfassenden Charakterisierung der strukturellen Eigenschaften,
so wie sie bereits fur¨ α-helikale Proteine entwickelt wurden.
Es existieren verschiedene Regeln, die zur Definition von Transmembranre-
gionen herangezogen werden ko¨nnen und auf topologischen und geometrischen
Gesetzma¨ssigkeiten beruhen. Ein Beispiel fur¨ eine solche Regel ist das “Doppel-
Repeat-Pattern”. Fur¨ Ketten mit zwei alternierenden Residuen hat man dem-
nach festgestellt, dass diese entweder zur Lipiddoppelschicht oder aber zum
Proteinkernhinzeigen. DasZieldervorliegendenStudiebestehtinderEntwick-
lung neuartiger Verfahren zur Vorhersage der strukturellen Eigenschaften der
Residuen innerhalb von Transmembran-β-Barrels mithilfe ebensolcher Regeln.
Eine dieser Eigenschaften ist der “Exposure”-Status einzelner Aminos¨auren.
Dieser gibt Aufschluss darub¨ er, ob eine bestimmte Residue zur Membran hin
(“exposed”) zeigt oder eher im Proteininneren verborgen ist (“buried”). Wir
zeigen,dassResiduenzwarnachaußengerichtetseinko¨nnen,aberdurchweitere
Aminos¨aurenzurMembranrichtunghinabgeschirmtwerdenunddemnachnicht
9direkt mit der Membran interagieren ko¨nnen. Umkehrt haben wir festgestellt,
dassinnenliegendeResiduenteilweisezurLipiddoppelschichthinexponiertsind.
Zun¨achst bestimmen wir fur¨ alle Residuen innerhalb eines Proteins, ob sie
tendenziell eher exponiert oder vergraben sind. Diese Tendenzen leiten wir
korrelierend zu den Frequenzprofilen der jeweiligen Aminos¨auren ab, was un-
seres Wissens neuartig ist und daher bislang noch nicht vorgenommen wurde.
Darub¨ erhinausunterscheidenwirzwischenResidueninnerhalbdesProteinkerns
und den Residuen an der Lipid-Wasser Grenzschicht, indem wir separate Ten-
denzwerte fur¨ diese berechnen. Anschließend betrachten wir die fur¨ β-Barrels
neuhergeleitetenWertezusammenmitdenvergleichbarenMaßst¨aben, diebere-
its fur¨ α-helikale Membranproteine bestimmt wurden, und stellen Unterschiede
und Gemeinsamkeiten zwischen den Tendenzen der Residuen beider Protein-
klassenheraus. WirvergleichendiehergeleitetenPra¨ferenzenmitbereitsbekan-
nten physikochemischen Werten aus der Literatur. Darub¨ er hinaus vergle-
ichen wir die “Exposure”-Tendenz von Residuen innerhalb des Proteinkerns fur¨
einen nicht-redundanten Datensatz von oligomeren β-Barrels. Um die Praxis-
tauglichkeitunsererSkalanachzuweisen,entwickeltenwireineeinfacheMethode
zurExposure-Vorhersagetransmembranerβ-BarrelsbasierendaufderTichonow-
Regularisierung und unserer hergeleiteten Tendenzen.
Im Anschluss haben wir ein ausgereifteres Verfahren namens BTMX en-
twickelt, das ein zwei-stufiges “sliding window”-Konzept verfolgt. Diese Meth-
ode verwendet Positional Specific Scoring Matrices (PSSM) aus multiplen Se-
quenzalignments und berechnet daraus den Exposure-Status fur¨ die jeweiligen
Eingabesequenzen. Die BTMX-Software ist online als Webservice zuga¨nglich.
Das Programm generiert farbig markierte Snakeplots, die mit dem jeweiligen
Exposure-Status der einzelnen Residuen annotiert sind. Vergleiche unserer
BTMX-Methode mit einer weiteren Methode aus der Literatur zeigen, dass
BTMXhinsichtlichderVorhersagegenauigkeitdeutlichbessereErgebnisseerzielt.
Zusa¨tzlich dazu ist BTMX in der Lage, seine Berechnungen mit einer Konfiden-
zscore zu bewerten, was in der Praxis Aufschluß ub¨ er die Gut¨ e der Vorhersagen
gibt.
Darub¨ erhinaus sind Vorhersagen zu oligomeren Interfaces bei transmembra-
nen β-Barrels ein weiteres ausstehendes Problem. Ebensowenig hat man bis-
lang physikochemische Eigenschaften nachweisen ko¨nnen, die zur Unterschei-
dung solcher oligomeren Interfaces von den anderen β-Faltbla¨ttern signifikante
Hinweise liefern. Wir haben in dieser Studie relevante physikochemische Eigen-
schaften fur¨ exponierte Residuen analysiert und konnten einige weitere Eigen-
schaften herausarbeiten, die kunf¨ tig zur Entwicklung von Methoden zur Identi-
fikation von oligomeren Interfaces nut¨ zlich sein ko¨nnen.
Diese Arbeit behandelt weiterhin Methoden zur Vorhersage von transmem-
bransta¨ndigen β-Faltbla¨ttern basierend auf einer bekannten Proteinsequenz.
Wir haben eine Hidden Markov-Modell (HMM)-basierte Methode zur Vorher-
sage der strukturellen Topologie mutmaßlicher β-Barrels entwickelt. Das Ver-
fahren, das wir TMBHMM nennen, liefert bislang die umfassendsten in silico
Vorhersagen zur Struktur von β-Barrel-Sequenzen. Wie auch BTMX berech-
net TMBHMM auch den vermutlichen Exposure-Status der membransta¨ndigen
Residuen. Die Methode ist ebenfalls als Webserver frei zuga¨nglich.
In kunf¨ tigen Studien kann das Wissen ub¨ er den Exposure-Status einzelner
Residuen verwendet werden, um mutmaßliche transmembrane β-Barrels aus
Proteomdaten zu identifizieren. Zu diesem Zweck lassen sich beispielsweise
10