蛋白質質譜測序中的挑戰和應對方案

2020-09-17   百泰派克生物

原標題:蛋白質質譜測序中的挑戰和應對方案

蛋白質測序的一般流程

蛋白質測序通常包括三個步驟:

1.用酶將蛋白質酶切成長度較短的多肽;

2. 對產出的每段多肽進行測序;

3. 將測出的肽序列組裝形成一條完整的蛋白序列。

下圖闡述了用質譜法進行蛋白質測序的整個過程:

LC-MS / MS蛋白質測序步驟圖(來源:百泰派克)

蛋白質質譜測序中的的挑戰和應對方案

蛋白質質譜測序(即利用質譜法進行蛋白質測序)並不是什麼新的概念,然而,這個概念里看似簡單的步驟在實踐操作過程中卻有很多挑戰,尤其是想要通過這些步驟對蛋白質的所有胺基酸進行高通量測序時。

來自同一蛋白質或其他污染物的不同部分的兩種肽可能偶然存在小段重疊。因此,為了促使步驟三(肽序列組裝)順利進行,步驟一中產生的肽應具有更長段的重疊區域以排除隨機匹配。這可以通過在蛋白質不同的位點選擇不同的酶進行酶切以及創造故意錯過酶切位點的酶切條件來實現。但是,非標準酶產生的圖譜不適用於蛋白質組學中使用的標準分析軟體進行分析。百泰派克生物通過使用專門針對每種酶和酶切條件的算法參數定製的軟體可解決此問題。

每個圖譜的從頭序列都有可能包含測序錯誤,這也是基於MS / MS技術的蛋白質從頭測序法的基本局限性。如果處理不當,肽段上的錯誤會延伸到最終的蛋白質測序結果中。百泰派克採用的「胺基酸可信度評分」機制可很好地解決此問題,該評分機制可測量肽測序結果中每個殘基的質量。根據評分結果,選擇高可信度的殘基來完成最終的蛋白質測序結果。百泰派克通過反覆的真實數據演練,不斷完善了其「胺基酸可信度評分」機制的使用。

蛋白質從頭測序中肽序列組裝過程在算法上比較困難,因此大多數蛋白分析軟體/工具都選擇只用資料庫搜索或同源性搜索方法,以此避免組裝這一步驟。這種搜索類型的方法會不斷修飾參照抗體序列,直到得到最終答案為止。當參照蛋白質序列和目標蛋白質序列之間的差異較小時,資料庫搜索或同源性搜索方法還是很有效的,但是,該法在實踐過程中常常會遇到困難或給高變區產出錯誤的序列。此外,對參考序列過度依賴還會對該序列的判斷產生偏差。百泰派克公司基於高解析度質譜儀Obitrap Fusion Lumos,結合豐富的生物信息學分析經驗,採用全新一代蛋白質從頭測序和突變分析(De Novo Sequencing)平台,可對蛋白一級結構進行快速準確的分析。