2012年4月7日 星期六

DSSP

DSSP - 簡介

DSSP是用於對蛋白質結構中的氨基酸殘基進行二級結構構像分類的標準化算法,由Wolfgang Kabsch和Chris Sander設計。 DSSP數據庫是由此算法生成的一個存放蛋白質二級結構分類數據的數據庫,其中包括了PDB數據庫(Protein Data Bank)中的所有條目。  

算法名稱Define Secondary Structure of Proteins 由作者在其原始論文中,作為實現該算法的Pascal語言程序名稱所提及。 DSSP數據庫英文全稱為 Definition of Secondary Structure of Proteins。

DSSP - 算法原理

DSSP算法使用PDB格式的原子級分辨率的蛋白質三維結構坐標集數據,依靠以靜電學定義進行的氫鍵識別,以及對主鍊和側鏈二面角的計算,從而得到每個氨基酸殘基的二級結構構象參數。 算法使用的鍵能公式為:

E=q1q2{1/rON+1/rCH-1/rOH-1/rCN}·332 kcal/mol
 
其中q1=0.42,q2=0.20。
 
以上參數來自分別為-0.42e和+0.20e的羰基氧原子和氨基氫原子間的局部電荷、以及羰基碳原子和氨基氮原子間的互斥電荷。 當鍵能小於-0.5 kcal/mol時,DSSP算法將其定義為一個氫鍵。

DSSP根據氫鍵模式,可以識別八種類型的二階結構構像,各構像擁有各自的標識符。  

這八種構像為:310螺旋, α-螺旋 ,π螺旋三種螺旋,分別以G、H和I標識,它們的識別特徵是殘基與主鏈中分別3、4、5個後續殘基間形成氫鍵並產生重複序列;兩種β-折疊片 中的氫鍵對類型,平行與反向平行橋中,單獨的橋結構標識為B,即β橋,含有β凸起的折疊片標識為E;在其餘構像種,包含即具有螺旋典型特徵,連接螺旋與折 疊結構的轉角區域表示為T,具有高曲率,即從第i個主鏈α碳原子指向第i+2個的向量與從第i-1個α碳原子指向第i個的向量間夾角小於70°的區域標識 為S,這也是程序中唯一不依靠氫鍵分類的構像,剩餘的環狀區域標識為L。

這八種構像在實用中又常被歸為三個大類:螺旋(G、H和I)、折疊(E和B)以及環狀結構(其餘所有標識符)

沒有留言: