Bartels於1990年提出使用圖論方法來解決從頭測序的問題。許多研究學者提出的算法都可以歸納到此類型中,其中包括Lutefisk、PepNovo、MSNovo、pNovo等。
基於圖論的從頭測序基本流程圖(來源:百泰派克)
Lutefisk
Lutefisk方法可以利用CID質譜處理從頭測序。該法中,首先找到圖譜中的顯著離子,然後確定N端和C端離子位置,並構建一個序列譜。根據序列譜,在圖譜上生成完整的序列,並用實驗圖譜對其進行評分。因為結果可能包含幾個僅有很小差異的候選序列,因此比較難確定完全正確的肽序列。Alex Taylor根據Bill Pearson的FASTA算法修改後的得到的版本CIDentify,可以用來區分這些不確定的相似的候選序列。
PepNovo
2005年,Frank等提出了PepNovo算法。該算法是一種高通量肽從頭測序法,它引入了機率網絡模型作為評分機制。使用該法解析一個圖譜通常僅需不到0.2秒的時間。根據Frank等人的描述,PepNovo比Sherenga,PEAKS和Lutefisk等幾種流行算法好。現在PepNovo已經更新到了新版的PepNovo+。同年,Grossmann等提出了AuDeNS。它是一種自動化的肽從頭測序工具,該工具中包含了一種可以識別信號峰和噪聲峰的預處理模塊。
MSNovo
2007年,Mo等人提出了MSNovo法。根據Mo的介紹,MSNovo方法在多個數據集上的表現比以前的從頭測序方法表現得更好。該方法可以支持LCQ,LTQ等多種質譜產出的數據,並能支持+1、+2、+3價的母離子。與其他算法不同的是,它還引入了一個新的評分機制,同時結合質譜矩陣,使用動態規劃方法解決從頭測序問題。
pNovo
2013年,Chi等人推出了一種新的肽從頭測序算法,pNovo。該算法可用於高能碰撞解離(HCD)類型數據的從頭測序。根據Chi等人描述,使用資料庫搜索方法鑑定出的HCD圖譜中,80%以上序列都能被pNovo正確測定。
本文由百泰派克生物整理編輯,參考文獻:
孫漢昌等,2010,串聯質譜圖譜從頭測序算法研究進展。
De novo peptide sequencing,en.wikipedia.org/wiki/De_novo_peptide_sequencing#cite_note-14
百泰派克是一家質譜技術服務公司,主要提供蛋白質理化性質分析及結構解析、以質譜技術為基礎的蛋白質組學代謝組學技術服務。公司致力於建立國際領先的蛋白質研究分析技術平台,為各科研院所和大學提供高效、準確、性價比高的蛋白質(組)研究技術包裹,協助客戶在基礎研究、分子診斷及其他生命科學研究領域取得突破,為生命科學的發展做出貢獻。