Shadow Wolf: 筆記 My Note about

2010年10月12日星期二

筆記 My Note about - Pfam Dataset

Protein Families Database
屬性；Protein Classifications and Motifs Database 蛋白質分類與模組資料庫

是由 Sanger 所維護，一個搜集了的大量多序列比對及常見蛋白質domain 和 family 的資料庫。
在應用上我們常常使用這個資料庫來比對一個蛋白質相關的功能，並可使用Pfam 來找尋相似功能的區域，此外此資料庫也會展示蛋白質結構的視覺化圖形給使用者。

其原理是藉由 HMM Profile （Hidden Markov Models）處理蛋白質多序列比對，
以做為蛋白質家族分類之標準。Pfam 最主要的功能分別為二級結構預測、折疊區域
辨識、演化分析及突變設計等，其比對存在兩種方式，分別為
1. Seed Alignment：針對蛋白質家族特定區域進行比對;
2. Full Alignment：使用HMM Profile 進行廣泛性全序列比對。

進入 ftp

註: HMM 為一廣泛使用之序列相似型比對與衡量模型，其做法是先經由多序列比對方式進行，
先將多序列分成 Main State 及 Insert State 兩種，再將比對結果轉換為機率示意圖，
最後再分別計算各種胺基酸序列出現的機率。

註: 陽明一份講義不錯去下載

同類型: BLOCK, Smart, Procite, interpro等模組分析資料庫與GO蛋白質分類資料庫

沒有留言:

張貼留言

2010年10月12日 星期二

筆記 My Note about - Pfam Dataset

沒有留言:

2010年10月12日星期二