參考消息網10月30日報道 據英國《自然》周刊網站10月15日報道,八月中旬的一個周六早晨,亞歷克斯·納卡在他女朋友的廚房裡踏上了一場「小型黑客馬拉松」。藉助一台筆記本電腦、一杯咖啡以及大約80個雲端人工智慧(AI)處理器,他生成了大量計算機設計的蛋白質,這些蛋白質旨在阻斷在一些腫瘤中發生突變的細胞受體。
掀起熱潮
納卡是美國加利福尼亞州阿拉梅達一家醫療技術公司的蛋白質工程師。他將最有希望獲獎的十個結果提交到了一場剛剛啟動的蛋白質設計競賽中,並看著它們攀升至排行榜前列。
這場競賽的主辦方是瑞士洛桑的生物技術初創企業適應性生物公司。過去一年左右,世界各地出現了至少五種此類競賽。大多數參賽者都會使用「阿爾法摺疊」程序(AlphaFold)和受到聊天機器人啟發的「蛋白質語言模型」等AI工具,這些工具在適用範圍和能力上都出現了爆炸式增長。其中一些工具背後的研究人員被授予今年的諾貝爾化學獎。他們獲得這一榮譽的部分原因在於,新創造的蛋白質有望成為更有效的藥物、工業酶或實驗室試劑。
但科學家們表示,人工設計蛋白質的熱潮製造了很多混亂。人們設計蛋白質的速度快於這些蛋白質在實驗室中製造和測試的速度,因此很難判斷哪些方法是真正有效的。
引發混亂
過去,競賽推動了重要的科學進步,特別是在蛋白質結構預測領域。當前一系列最新的競賽通過降低門檻,吸引了世界各地的人士進入蛋白質設計相關領域。它們還可能加快驗證和制定標準的步伐,有助於培育相關社群。位於西班牙巴塞隆納的基因調控中心的計算生物學家諾埃利婭·費魯斯·卡帕佩說:「競賽將推動該領域向前發展,並更快地測試方法。」
但科學家們表示,這些競賽必須克服一些困難,例如確定解決哪些問題,以及如何客觀地決定獲勝者。找到正確的方法很重要。德國慕尼黑理工大學的計算生物學家布克哈德·羅斯特說,如果執行不當,「這些競賽可能會對該領域造成損害」。
這些蛋白質設計競賽在一定程度上受到了一個已有30年歷史的競賽的啟發,後者幫助推動了生物AI革命。自1994年以來,這場名為「蛋白質結構預測關鍵評估」(CASP)的競賽一直鼓勵科學家們通過蛋白質的胺基酸序列預測其3D形狀。該競賽由美國馬里蘭大學的計算生物學家約翰·莫爾特和美國加州大學戴維斯分校的計算生物學家克日什托夫·菲德利斯發起,通過將計算預測結果與未發表的結構模型進行比較來確定獲勝者。
2018年,總部位於倫敦的「深層思維」公司(現為谷歌旗下公司)憑藉其蛋白質結構預測工具、第一代AlphaFold在CASP獲勝。第二代工具AlphaFold 2在2020年表現優異,莫爾特甚至宣布預測簡單蛋白質結構的問題基本上已經解決。自那以後,該競賽已將重點轉移到其他新興挑戰上,例如預測復合體中多個相互作用蛋白質的結構。
推動發展
現在,許多人希望這些競賽能夠推動蛋白質設計領域向前發展,就像CASP幫助推動蛋白質結構預測領域的革命一樣。羅斯特說:「如果沒有CASP,就不會有AlphaFold。我們需要這些競賽發揮正確作用,為人們提供激勵。」
今年6月,羅斯特及其同事贏得了由開放科學非營利組織協同創新組織主辦的「蛋白質工程大賽」。該活動包括兩部分。首先,參與者嘗試預測不同酶變體的性質。在這一輪中表現最好的團隊隨後重新設計一種分解澱粉的酶,根據實驗室結果確定最佳設計。2025年的競賽正在籌備中。
「冬季蛋白質設計賽」由加拿大生物技術公司自由生物公司和維護蛋白質建模工具的學術組織羅塞塔共享聯盟共同主辦。該競賽在今年4月宣布了獲勝者。參賽者需重新設計一種現有蛋白質——一種在蛋白質純化中廣泛使用的植物病毒酶,使其分子更有效。
另有兩場競賽要求參賽者設計出全新的蛋白質。適應性生物公司主辦的競賽正在尋找能夠附著在表皮生長因子受體(EGFR)上的蛋白質。EGFR是一種在許多癌症中過度活躍的生長激素受體。90名參賽者提交了700多個設計。
而在「AI設計蛋白質結合劑」大賽中,研究人員正努力創造可用於T細胞癌症治療的小蛋白。該競賽由美國德克薩斯大學奧斯汀校區研究生領導的組織「生物學與機器學習學會」主辦,吸引了來自42個國家——包括奈及利亞、哥倫比亞、伊朗和印度——的64個團隊參賽。目前約有1.8萬個設計結果正在接受測試,結果將於2025年初公布。該大學生物化學博士生、競賽聯合組織者克萊頓·科索諾基說:「居然有這麼多人參賽,我們感到很驚訝。」(編譯/熊文苑)