攻克癌症,百億億次超級計算機來幫忙 | 賽先生

2019-05-20     知識分子

單個腫瘤的活體組織檢查就超過八百萬次,數據量是如此龐大,普通電腦難以應付。百億億級(每秒進行10的18次方,也就是1後面18個零,浮點運算)的超級計算機的建成,有望藉助AI的力量對抗癌症。


Rick Stevens,CANDLE計劃的首席調查員(圖源:阿貢國家實驗室)

撰文 | 李薇達

編輯 | 邸利會

根據世界衛生組織發布的報告,癌症是繼心臟病之後的全球第二大死因。但到本世紀末,癌症預計將成為全球的頭號「殺手」,也是阻礙人類預期壽命延長的最大「攔路虎」。

可癌症又是極其複雜的疾病,迄今為止,醫生們還沒弄清楚為什麼一種特定的癌症會影響某一個人而不會影響另外一個人;為什麼一種藥對某患者有效卻對另一個患者無效。

另外,在一個典型的癌症研究中,對單個腫瘤的活體組織檢查就超過八百萬次——醫生們分析癌症的表征、對藥物治療的反應以及患者身體受到的影響。這些數據量是如此巨大,以至於普通電腦都難以應付。

深度學習與癌症治療

為了解決這些問題,醫生們向超級計算機求助。

2016年,美國國家癌症研究所、美國能源部和其他多個國家級實驗室聯手啟動了一項名為「癌症探月」(Cancer Moonshot)的計劃,而研究工作的重點之一是構建一個名為CANDLE(CANcer Distributed Learning Environment, 癌症分布式學習環境)的人工智慧(AI)框架,它將提供一個公共發現平台,以藉助AI的力量對抗癌症。

為更好地了解癌症的本質,並找出對抗多種形式癌症的最佳藥物,CANDLE將著重解決三個關鍵挑戰,以加速在分子,細胞和群體水平的研究。

首先,研究團隊需要對各種癌症的核心生物學和分子相互作用有一個詳細的了解。其次,研究小組必須開發計算模型來預測癌細胞對藥物的反應。該模型可用於優化臨床前藥物篩選,並為癌症患者提供精確的藥物治療。第三,團隊還得從所謂的「患者軌跡」中收集信息。也就是說,他們必須評估全美數百萬癌症患者的數據,包括腫瘤學家手寫的患者報告,以期發現一些模式或樣板,然後基於此構建大規模的計算模型。


CANDLE計劃的三大挑戰(圖源:candle.cels.anl.gov)

註:RAS信號途徑是一種常見細胞分子信號傳導途徑。

這個過程從收集所有已知的關於癌症如何運作、對藥物的反應和個人行為的數據開始,然後創建一個虛擬的近似值。因此,這些挑戰同時也將考驗這一項目的機器學習方式——深度學習。通過將創新的數據採集和分析技術、模型組成與模擬結合,深度學習將幫助得出為單個患者設計的專門性的預後和治療計劃。

美國阿貢國家實驗室計算、環境與生命科學實驗室副主任,同時也是CANDLE的首席調查員Rick Stevens表示——

「深度學習是利用多層神經網絡來進行機器學習,當這個程序獲得更多的數據進行預測時,它會變得更智能或更準確。如果把這個系統比作火箭飛船,那麼學習模型就類似於火箭發動機,而數據代表燃料。不管發動機有多好,它都需要很好的燃油來起飛。所以,我們的持續挑戰是獲得大量的高質量數據,然後對他們進行清理、整合,再將她們規範,然後設計出最新的深層學習架構,以最大限度地利用它。」

雖然分子結構、藥物組合和患者數據集的數量驚人,但百億億級計算機將逐步 「學習」並管理它們。


Aurora exascale超級計算機(圖源:英特爾)

美國第一台百億億級的超級計算機

英特爾和美國能源部正在建造Aurora,它被譽為美國第一台百億億級的超級計算機。Aurora的性能如何強大呢?打個比方如果地球上的每個人每秒都進行一次計算(例如涉及代數的數學問題),那麼每個人都需要四年多才能完成Aurora在一秒內完成的所有計算。

這台百億億級的計算機將在阿拉貢國家實驗室進行開發,並且計劃在2021年底全面投入運行。

同時作為Aurora背後的核心人物,Stevens對於這台超級計算機的前景十分樂觀: 「我們把這系統取名『Aurora』(極光)便是因為那包含了我們的理想目標——創造一個在某種意義上可以照亮世界的系統。第一次,我們將擁有驚人的強大的計算能力,它可以提供每秒10到18次冪運算。我們將不再受計算機遺留能力瓶頸的阻礙而可以自由地實驗和嘗試新的方法。CANDLE團隊很興奮超級計算機將用它前所未有的能力和之前不可能的方式來幫助人類。」

超級計算機競賽

不過,雖然前景很光明,但百億億級計算機的廣泛應用仍需數年的時間。目前,各國在超級計算機領域展開了激烈的競賽。

2018年,中國超算天津中心對外展示了我國新一代百億億次超級計算機「天河三號」原型機,並且預計在2020年研製成功。而日本計算機巨頭富士通和日本最大的研究機構——日本理化研究所(RIKEN)也已開始對下一代超級計算機Post-K進行現場測試,並預計於2021年投入使用。他們認為這將使日本重新回到全球超級計算機排名的領先位置。

正如Aurora所展示的,攻克癌症,百億億次超級計算機的到來將是一件利器,同時在應對氣候變化、助力智能製造、新材料的發明和應用、物聯網等方面也將繼續發揮巨大作用。伴隨著大量數據時代的到來,人類對強大計算力的需求是無限的。


文章來源: https://twgreatdaily.com/zh-cn/o-tBRWwB8g2yegNDX04n.html