2010年10月12日 星期二

筆記 My Note about - Pfam Dataset

Protein Families Database
屬性;Protein Classifications and Motifs Database 蛋白質分類與模組資料庫

是由 Sanger 所維護,一個搜集了的大量多序列比對及常見蛋白質domain 和 family 的資料庫。
在應用上我們常常使用這個資料庫來比對一個蛋白質相關的功能,並可使用Pfam 來找尋相似功能的區域,此外此資料庫也會展示蛋白質結構的視覺化圖形給使用者。


其原理是藉由 HMM Profile (Hidden Markov Models)處理蛋白質多序列比對,
以做為蛋白質家族分類之標準。Pfam 最主要的功能分別為二級結構預測、折疊區域
辨識、演化分析及突變設計等,其比對存在兩種方式,分別為
1. Seed Alignment:針對蛋白質家族特定區域進行比對;
2. Full Alignment:使用HMM Profile 進行廣泛性全序列比對。

進入 ftp

註: HMM 為一廣泛使用之序列相似型比對與衡量模型,其做法是先經由多序列比對方式進行,
先將多序列分成 Main State 及 Insert State 兩種,再將比對結果轉換為機率示意圖,
最後再分別計算各種胺基酸序列出現的機率。

註: 陽明一份講義不錯 去下載

同類型: BLOCK, Smart, Procite, interpro等模組分析資料庫與GO蛋白質分類資料庫


沒有留言: