MAGYAR TUDOMNYOS AKADMIA TERMSZETTUDOMNYI KUTATKZPONT ENZIMOLGIAI INTZET Rendezetlen

  • Slides: 48
Download presentation
MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ENZIMOLÓGIAI INTÉZET Rendezetlen fehérjék bioinformatikája II. A rendezetlenség predikciója

MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ENZIMOLÓGIAI INTÉZET Rendezetlen fehérjék bioinformatikája II. A rendezetlenség predikciója TANTOS ÁGNES

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A rendezetlen fehérjék specifikus tulajdonságai 1. Sajátos aminosav összetétel 2.

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A rendezetlen fehérjék specifikus tulajdonságai 1. Sajátos aminosav összetétel 2. Nyílt és oldószernek kitett peptidlánc 3. Flexibilitás, mobilitás 4. Szerkezeti heterogenitás (sokaság) 5. Nagy hidrodinamikai térfogat MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 2

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Miért akarjuk megjósolni a rendezetlenséget? 1. Az ismereteink hiányossága miatt

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Miért akarjuk megjósolni a rendezetlenséget? 1. Az ismereteink hiányossága miatt 2. Szerkezeti genomikai kutatások miatt 3. Bioinformatikai kutatásokhoz 4. Egyes fehérjék tanulmányozásához MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 3

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 4 Predikció: egy klasszifikációs probléma: Input 1. 2. 3. 4.

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 4 Predikció: egy klasszifikációs probléma: Input 1. 2. 3. 4. Aminosav szekvencia Tulajdonság vektor Szekvencia illesztés (profil) Interakciós energiák Módszer 1. Statisztikai módszerek 2. Machine learning 3. Szerkezeti megközelítés Output (tulajdonság) Ellenőrzés 1. Bináris 2. Pontszám 1. Dis. Prot 2. PDB MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Három alapvető megközelítés Statisztikai módszerek Gépi tanulás Szerkezeti megközelítés MAGYAR

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Három alapvető megközelítés Statisztikai módszerek Gépi tanulás Szerkezeti megközelítés MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 5

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 6 A rendezetlen fehérjék specifikus aminosav összetétele order-promoting disorder-promoting Dunker

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 6 A rendezetlen fehérjék specifikus aminosav összetétele order-promoting disorder-promoting Dunker et al. (2001) J. Mol. Graph. Model. 19, 26 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 7 AA tuladonságok mezője: AAindex adatbázis: https: //www. genome. jp/aaindex/

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 7 AA tuladonságok mezője: AAindex adatbázis: https: //www. genome. jp/aaindex/ Minden aminosavhoz rendelnek egy számot, amely kvantitatív módon leírja, hogy az adott tulajdonság mennyire jellemző rá (jelenleg 517 különböző skála van) MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Két dolog, amit inkább ne tegyünk: 1. SEG: alacsony komplexitású

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Két dolog, amit inkább ne tegyünk: 1. SEG: alacsony komplexitású régiók MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 8

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Drosophila mastermind >sp|P 21519|MAM_DROME Neurogenic protein mastermind OS=Drosophila melanogaster GN=mam

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Drosophila mastermind >sp|P 21519|MAM_DROME Neurogenic protein mastermind OS=Drosophila melanogaster GN=mam PE=2 SV=2 MDAGGLPVFQSASQAAAVAQQQQQQHLNLQLHQQHLGLHLQQQQQLQLQQQQHN AQAQQQQIQVQQQQQQQHSPYNANLGATGGIAGITGGNGAGGPTNPGAVPTAP GDTMPTKRMPVVDRLRRRMENYRRRQTDCVPRYEQAFNTVCEQQNQETTVLQKRFLESKN KRAAKKTDKKLPDPSQQHQQQQQHQQHQQHQQAQTMLAGQLQSSVHVQQKFLKRP AEDVDNGPDSFEPPHKLPNNNNNSNSNNNNGNANANNGGNGSNTGNNTNNNGNSTNNNGG SNNNGSENLTKFSVEIVQQLEFTTSAANSQPQQISTNVTVKALTNTSVKSEPGVGGGGGGSGNNNNNGGGGGGGNGNNNNNGGDHHQQQQQQQGGGLGGLGNNGRGGGPGG MATGPGGVAGGLGGMGMPPNMMSAQQKSALGNLANLVECKREPDHDFPDLGSLDKDGGGG QFPGFPDLLGDDNSENNDTFKDLINNLQDFNPSFLDGFDEKPLLDIKTEDGIKVEPPNAQ DLINSLNVKSEGGLGHGFGGFGLGLDNPGMKMRGGNPGNQGGFPNGPNGGTGGAPNAGGN GGNSGNLMSEHPLAAQTLKQMAEQHQHKNAMGGMGGFPRPPHGMNPQQQQQQQ AQQQHGQMMGQGQPGRYNDYGGGFPNDFGLGPNGPQQQQQAQQQQPQQQHLPPQFHQQKG PGPGAGMNVQQNFLDIKQELFYSSQNDFDLKRLQQQQAMQQQQQQQHHQQQQPKMG GVPNFNKQQQQQQVPQQQLQQQQQQQQQYSPFSNQNPNAAANFLNCPPRGGP NGNQQPGNLAQQQQQPGAGPQQQQQRGNAANGQQNNPNAGPGGNTPNAPQQQQQQSTTTT LQMKQTQQLHISQQGGGAHGIQVSAGQHLHLSGDMKSNVSVAAQQGVFFSQQQAQQQQQQ QQPGGTNGPNPQQQQQQPHGGNAGGGVGVGVGNGGPNPGQQQQQPNQNMSNANVPS DGFSLSQSQSMNFNQQQQQQAAAQQQQVQPNMRQRQTQAQAAAAAQAQAAANASG PNVPLMQQPQVGVGVGVGNGGVVGGPGSGGPNNGAMNQMGGPMGGMPGMQMG GPMNPMQMNPNAAGPTAQQMMMGSGAGGPGQVPGPGQGPNPNQAKFLQQQQMMRAQAMQQ QQQHMSGARPPPPEYNATKAQLMQAQMMQQTVGGGGVGVGVGVGGVGGANGGRFP NSAAQAAAMRRMTQQPIPPSGPMMRPQHAMYMQQHGGAGGGPRTGMGVPYGGGAGGPMGG PQQQQRPPNVQVTPDGMPMGSQQEWRHMMMTQQQTQMGFGGPGPGGPMRQGPGGFNGGNF MPNGAAGSGPNAGGMMSGPNVPQMQLTPAQMQQQLMRQQQQQQHMGPGAAN NMQMQQLLQQQQSGGGGNMMASQMQMTSMHMTQTQQQITMQQQQQFVQSTTTTTHQQQQM MQMGPGGGGPGSANNNNGGGGGGAAGGGNSASTIASASSISQTINSVVANSNDFGL EFLDNLPVDSNFSTQDLINSLDNDNFNLQDFNMP MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT 9 Dentin sialophosphoprotein >sp|Q 9 NZW 4|DSPP_HUMAN Dentin sialophosphoprotein OS=Homo sapiens GN=DSPP PE=1 SV=2 MKIITYFCIWAVAWAIPVPQSKPLERHVEKSMNLHLLARSNVSVQDELNASGTIKESGVL VHEGDRGRQENTQDGHKGEGNGSKWAEVGGKSFSTYSTLANEEGNIEGWNGDTGKAETYG HDGIHGKEENITANGIQGQVSIIDNAGATNRSNTNGNTDKNTQNGDVGDAGHNEDVAVVQ EDGPQVAGSNNSTDNEDEIIENSCRNEGNTSEITPQINSKRNGTKEAEVTPGTGEDAGLD NSDGSPSGNGADEDEDEGSGDDEDEEAGNGKDSSNNSKGQEGQDHGKEDDHDSSIGQNSD SKEYYDPEGKEDPHNEVDGDKTSKSEENSAGIPEDNGSQRIEDTQKLNHRESKRVENRIT KESETHAVGKSQDKGIEIKGPSSGNRNITKEVGKGNEGKEDKGQHGMILGKGNVKTQGEV VNIEGPGQKSEPGNKVGHSNTGSDSNSDGYDSYDFDDKSMQGDDPNSSDESNGNDDANSE SDNNSSSRGDASYNSDESKDNGNGSDSKGAEDDDSDSTSDTNNSDSNGNGNNGNDDNDKS DSGKGKSDSSDSSNSSDSSDSSDSNSSSDSDSSDSSDSSN SSDSSDSSDSSDSKSDSSKSESDSSDSDSKSDSSDSNSSDSSDNSDSSDSS NSSNSSDSSDSSSSSDSSNSSDSSDSSDSSNSSESSDSSDSSDSSN SNSSDSDSSNSSDSSDSSDSSNSSDSSDSSDSS NSSDSNDSSNSSDSSNSSDSSDSDSSNSSDSSDSSNSSD SSDSSDSSDGSDSDSSNRSDSSNSSDSSDSSDSNESSNSSDSSDSSNS SDSDSSDSSNSSDSSESSNSSDNSNSSDSSDSSDSSNSSDSSDSSNSSDSSDSSDSSNSSDSSDSSNSSDSSDSSDSSDSSDSSNSSDSSDSSDSSD SSESSDSSDSSNSSDSSDSSDSSDSSDSSNSSDSSDSSDSSN SSDSSDSSESSDSSDSSDSSDSSDSSNSSDSSDSSDSSDSSDSNESSDSSDSSNSSDSSD STSDSNDESDSQSKSGNGNNNGSDSDSDSEGSDSNHSTSDD ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 10 Az alacsony komplexitás és a rendezetlenség kapcsolata MAGYAR TUDOMÁNYOS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 10 Az alacsony komplexitás és a rendezetlenség kapcsolata MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 11 Két dolog, amit inkább ne tegyünk: 2. NORSp: másodlagos

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 11 Két dolog, amit inkább ne tegyünk: 2. NORSp: másodlagos szerkezettel nem rendelkező régiók MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 12 Olyan, mintha működne… A NORSp: LDR (40<) protein, %

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 12 Olyan, mintha működne… A NORSp: LDR (40<) protein, % 1. PSI-BLAST segítségével szekvencia-profilt generál 2. PROFphd segítségével másodlagos szerkezetet és oldószer hozzáférhetőséget predikál 3. PHThtm segítségével transzmembrán hélixeket predikál 4. COILS predikciót készít a coiled-coil szakaszok kiszűrésére 5. A kapott információkat kombinálja és egyesíti az átfedő régiókat 60 E 40 20 0 B A Domain of life MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 13 …de vannak másodlagos szerkezettel nem rendelkező globuláris fehérjék, és

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 13 …de vannak másodlagos szerkezettel nem rendelkező globuláris fehérjék, és IDPk, amiknek van másodlagos szerkezeti elem tartalma CREB KID 1 tbi Radhakrishnan (1997) Cell 91, 741 Radhakrishnan (1998) FEBS Lett. 430, 317 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Egyszerű statisztikai módszerek MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Egyszerű statisztikai módszerek MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 14

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 15 Dis. EMBL http: //dis. embl. de p 53 •

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 15 Dis. EMBL http: //dis. embl. de p 53 • Egy paraméter • Kristályszerkezeteken alapul • Kristályosítási problémák elkerülésére készült • 3 féle rendezetlenséget különböztet meg MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A rendezetlenség definíciói a Dis. EMBL-ben p 53 • Loops/coils:

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A rendezetlenség definíciói a Dis. EMBL-ben p 53 • Loops/coils: a DSSP kategóriák szerint minden, ami nem hélix vagy béta szerkezet. Nem feltétlenül jelent rendezetlenséget, de rendezetlenség nem lehet helikális vagy béta szerkezeten belül. Szükséges, de nem elégséges feltétel • Hot loops: az előző kategória egy részhalmaza, olyan hurok régiók, amelyek nagy mobilitással rendelkeznek (magas a Bfaktoruk). Ezt az értéket sok paraméter befolyásolja, önmagában nem elég megbízható • Remark 465: hiányzó koordináták a PBD szerkezetekben. Itt nagyon fontos tényező a kísérleti adatok megbízhatósága (lehet, hogy a kristályosodó konstrukció nem is tartalmazta az adott szakaszt) MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 16

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 17 Dis. EMBL (egy paraméter) p 53 • A három

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 17 Dis. EMBL (egy paraméter) p 53 • A három predikció között nincs (és nem is szükséges) konszenzus • Kontextus-függő rendezetlenség nem feltétlenül jelenik meg MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 18 Dis. EMBL p 53 Véletlenszerű várható érték MAGYAR TUDOMÁNYOS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 18 Dis. EMBL p 53 Véletlenszerű várható érték MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 19 Mean net charge Uversky plot: töltés-hidrofobicitás (két paraméter) Mean

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 19 Mean net charge Uversky plot: töltés-hidrofobicitás (két paraméter) Mean hydrophobicity Uversky (2002) Eur. J. Biochem. 269, 2 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 20 Uversky plot továbbfejlesztve Oldfield (2005) Biochemistry 44, 1989 MAGYAR

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 20 Uversky plot továbbfejlesztve Oldfield (2005) Biochemistry 44, 1989 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 21 Pozíció specifikus változat: Fold. Index https: //fold. weizmann. ac.

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 21 Pozíció specifikus változat: Fold. Index https: //fold. weizmann. ac. il/fldbin/findex • Fő kérdés: feltekeredik-e a fehérje? • Alapja az Uversky-plot • Pozíció specifikus értékeket számol • Pozitív-negatív skála MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Suz 12 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Suz 12 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 22

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 23 Gépi tanulás MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 23 Gépi tanulás MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 24 Mesterséges neurális hálózat (NN) input MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 24 Mesterséges neurális hálózat (NN) input MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT pontszám ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 25 Mesterséges neurális hálózat (NN) Alapegység: egy neuron tanítás Hidden

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 25 Mesterséges neurális hálózat (NN) Alapegység: egy neuron tanítás Hidden layer globuláris rendezetlen MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A PONDR prediktorok működése és jellemzői • Neurális háló •

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A PONDR prediktorok működése és jellemzői • Neurális háló • Paraméterek: aminosav kompozíció, hidrofobicitás, szekvencia komplexitás • 9 -21 aminosavas ablakban számol • Globuláris és rendezetlen tanító adathalmazok • Eredmény: 0 -1 közötti skála 9 aminosavanként átlagolva • Határérték: 0, 5 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 26

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 27 A PONDR prediktorok elnevezése • Első betű: a prediktorhoz

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 27 A PONDR prediktorok elnevezése • Első betű: a prediktorhoz használt tanító adathalmaz X – X-ray N – NMR C – CD V - Various • Második betű: a jósolt rendezetlenség hossza és elhelyezkedése szerint S – Short (8 -9 aminosav) M – Medium (20 -39 aminosav) L – Long (40 vagy több aminosav) N – N-terminális C – C-terminális T - bármelyik Peng (2006) BMC Bioinfo. 7, 208 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 28 Predictor of naturally disordered regions (PONDR) http: //www. pondr.

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 28 Predictor of naturally disordered regions (PONDR) http: //www. pondr. com • CDF (Cumulative Distribution Factor): a teljes molekula rendezetlenségét vizsgálja • Charge-Hydropathy: Uversky plot alapján MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 29

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 30

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 31 ESpritz • Bidirectional Recurrent Neural Network (BRNN): három neurális

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 31 ESpritz • Bidirectional Recurrent Neural Network (BRNN): három neurális hálóból áll (C-terminális, teljes és N-terminális szekvencia) • Nincs csúszó ablak • Kétféle predikció: szekvencia alapú (aaindexek szerinti csoportosítás) és szekvencia-illesztés alapú • Tanító adathalmazok: PDB – rendezetlenség definíciója: hiányzó atomi koordináták Disprot – legalább egyszer rendezetlenként van definiálva egy aminosav NMR – egy algoritmussal megkeresik az NMR sokaságokban a több konformációval rendelkező szakaszokat MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ ESpritz http: //protein. bio. unipd. it/espritz/ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ ESpritz http: //protein. bio. unipd. it/espritz/ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 32

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ X-ray MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT Dis. Prot ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ X-ray MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT Dis. Prot ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 33 NMR

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 34 Support vector machine (SVM) Support vektor: ami mentén legjobban

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 34 Support vector machine (SVM) Support vektor: ami mentén legjobban szétválnak az adatok MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET Ez a legegyszerűbb, a lineáris SVM (LSVM)

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 35 DISOPRED 3 • Lineáris SVM • 15 aminosavas csúszó

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 35 DISOPRED 3 • Lineáris SVM • 15 aminosavas csúszó ablak • Tanító adathalmaz: PDB – rendezetlenség definíciója: hiányzó atomi koordináták Dis. Prot MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 36 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 36 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 37 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 37 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 38 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 38 DISOPRED 3 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 39 DISOPRED MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 39 DISOPRED MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Szerkezeti megközelítés (interakciós potenciál) MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG-

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Szerkezeti megközelítés (interakciós potenciál) MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 40

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A fehérje fel-nem-tekeredés problémája 1. A fehérje feltekeredés problémája: Hogyan

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A fehérje fel-nem-tekeredés problémája 1. A fehérje feltekeredés problémája: Hogyan határozza meg az aminosav szekvencia a fehérje feltekeredését 2. A fehérje fel-nem-tekeredés problémája: Hogyan határozza meg az aminosav szekvencia a fehérje rendezetlenségét? MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 41

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A fehérje fel-nem-tekeredés problémája • A globuláris fehérjék speciális aminosav

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ A fehérje fel-nem-tekeredés problémája • A globuláris fehérjék speciális aminosav sorrendje lehetővé teszi a sok energetikailag kedvező kölcsönhatás kialakítását • A rendezetlen fehérjék olyan (rendezetlenséget elősegítő) aminosavakat tartalmaznak, amik igyekeznek elkerülni a kölcsönhatásokat • Ez utóbbi vezet ahhoz, hogy a rendezetlen fehérjék nem képesek egy alacsony energiájú konformációba feltekeredni MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 42

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Egy szekvenciában található összes aminosav közötti páros kölcsönhatási energia becslése:

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ Egy szekvenciában található összes aminosav közötti páros kölcsönhatási energia becslése: IUPred • Az aminosavak közötti interakciók kiszámolása szerkezetek alapján • Az energiák megbecslése a szerkezet ismerete nélkül • A becslés alkalmazása olyan szekvenciákra, melyek nem rendelkeznek szerkezettel (IDPk) • Aminosavak közötti kölcsönhatási energiák származtatása globuláris fehérjékből Az algoritmus csak globuláris fehérjéket “ismer” MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 43

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 44 A globuláris és a rendezetlen fehérjék becsült energia értékei

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 44 A globuláris és a rendezetlen fehérjék becsült energia értékei IDP GLOB Dosztanyi et al. (2005) J. Mol. Biol. 347, 827 MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 45 IUPred 2 A MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG-

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 45 IUPred 2 A MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET 46

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 47 Prediktorok összehasonlítása Dis. EMBL Fold. Index PONDR ESpritz DISOPRED

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 47 Prediktorok összehasonlítása Dis. EMBL Fold. Index PONDR ESpritz DISOPRED 3 IUPred 2 A Módszer Statisztika Neurális háló SVM Szerkezeti Output Grafikus Szöveges/ grafikus Grafikus Rövid/hosszú rendezetlenség Nincs Van Interakciós szakaszok Nem (intuitív módon) Nem Nem Igen (opcionális) Másodlagos szerkezet Nem Nem Igen Nem Globuláris domének Nem Nem Nem Igen Predikció ideje <5 s 1 -2 s kb. 10 s 30 perc – 2 óra <1 s Letölthető Igen Nem Igen Feltölthető szekvenciák Egy Nincs limit Max. 1 MB MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 48 ROC görbék a CASP 6 -ban PONDR DISOPRED IUPred

RENDEZETLEN FEHÉRJÉK - PREDIKCIÓ 48 ROC görbék a CASP 6 -ban PONDR DISOPRED IUPred MAGYAR TUDOMÁNYOS AKADÉMIA TERMÉSZETTUDOMÁNYI KUTATÓKÖZPONT ANYAG- ÉS KÖRNYEZETKÉMIAI INTÉZET ENZIMOLÓGIAI INTÉZET