作者 | 程唯珈 卜葉
人類史上最大天文裝置——平方公里陣列(SKA)射電望遠鏡預計2020年啟動建設。
作為創始成員國之一,中國除了參與研發這個超級望遠鏡的反射面天線,也在為建設區域中心積極進行準備工作。
近日,我國科學家成功研製出世界首台SKA區域中心原型機。
中國SKA區域中心原型機 圖片來源:《自然—天文》
「沒有SKA區域中心,就無法開展真正意義上的SKA科學研究。」中科院上海天文台研究員安濤告訴《中國科學報》,此項研究不僅有助於我國科學家在關鍵科學項目中優先獲得數據從而把握創新突破的先機,而且能極大促進國內超算和大數據相關領域自主創新能力。
相關成果日前發表於《自然—天文》。
分擔總台數據處理壓力
宇宙從何而來,將向何處去?SKA的建設和運行將為這些問題的解答打開一個窗口。
不同於「中國天眼」FAST,SKA是由一系列小單元天線編織成的巨大網絡,也稱綜合孔徑射電望遠鏡。它不僅能直接成像,還能得到海量的數據,這些數據需要射電天文學家運用專門的軟體處理,將數據轉化為科學成果,從數據中「看見」宇宙。
然而,SKA產生的數據量極其龐大,台址國數據處理中心的承受能力無法滿足SKA完整的數據處理和存儲需求,建設多個區域性科學與數據中心成為了必然選擇。
「SKA的兩組望遠鏡陣列分別位於南非和澳大利亞,而另外的大多數成員國也希望有些數據能儲存在北半球,方便用戶使用。」安濤補充道。
不過,區域中心不僅需要分擔SKA天文台的數據處理總體壓力,更重要的是,它們要承擔本地區的用戶支持,使得SKA科學成果最大化。
事實上,各個國家和地區的科研水平和關注的學術領域不盡相同,不同科學任務要求的計算架構和軟體環境也都不同。台址國超算設備的設計一旦固化,就缺乏靈活性,只有區域中心才有能力充分考慮用戶的差異化需求。
建造區域中心原型機
這樣的區域中心的技術要求和建設成本相當高,因此需要關鍵設備等的預研。原型機的建造就是重要的預研內容之一。
目前,中國雖然有「天河二號」「神威·太湖之光」等超算設備,但計算能力難以滿足SKA龐大而複雜的數據處理要求。
為了方便數據的國際共享,區域中心必須方便國際同行訪問提取,實現寬頻低延遲國際互聯。這些無疑都增加了原型機的研製難度。
安濤介紹,成功研製的中國SKA區域中心原型機,整體設計充分考慮了各方面需求,整個系統採用「軟硬體協同設計」的思想,即根據應用程式的特徵,選擇合適的硬體和軟體組件,以實現在有限功耗下的最佳性能。
此次研製的原型機在計算、存儲、網絡三大模塊中均有創新突破。
計算模塊採用新型數據島架構,由執行框架將整個數據中心按照任務需求分成若干個小區域或多個子數據中心,既可以獨立執行數據處理任務,也可以根據需求靈活重組資源,滿足SKA多任務並行處理的要求。
此外,中國SKA區域中心原型機還首次採用了華為鯤鵬處理器,基準測試表明該伺服器整體性能優良。
不過,在處理SKA先導望遠鏡的實測數據中,原型機會遇到實際的問題,有些可能是事先無法預測的,這為未來建設完整意義的中國SKA區域中心提供了寶貴經驗。
安濤介紹,原型機還有一個任務是測試軟體和算法,研究這些軟體在大型集群上的擴展性。「比如我們和國際合作團隊在美國SUMMIT(世界上最快的超算)上開展大規模實驗之前,就在原型機上做了大量測試。」
他指出,要想針對不同科學用戶和科學需求,定製不同的計算和存儲設備組合,使得區域中心能夠發揮最大效率,經濟運行成本也需考慮在內。
區域中心並非單純超算
事實上,中國並非一早就參與了SKA區域中心原型機的研究,世界上有很多國家很早就開始了SKA科學數據處理器的研究工作。受各國現實條件等的影響,最終中科院上海天文台成功研製了中國SKA區域中心原型機,成為世界上首台SKA區域中心原型機。
在中科院上海天文台研究員洪曉瑜看來,我國領先的超算能力和日益增長的綜合科技實力,為建設中國SKA區域中心的數據處理平台奠定了重要基礎。
區域中心就是簡單意義上的超算嗎?答案是否定的。
相比於傳統的服務於通用型需求的國家超算,中國SKA區域中心對系統架構、業務目標、技術都提出了更高的挑戰。
首先,SKA區域中心是以數據處理為中心而非以計算為中心,SKA數據的運算和管理主要是以數據驅動的工作流模式,巨大的數據流對輸入輸出(I/O)帶寬、單伺服器存儲容量與存儲介質的性能均提出了極致需求,而這些都不是國家超算的主流業務類型。
其次,計算平台是專門設計的異構系統。與國家超算強調節點同構以支持大規模作業運行或提供通用計算服務不同,SKA區域中心需要支持眾多不同科學目標的科學工作組,其軟體特徵差異巨大,不適宜用同構的、通用服務型超算中心進行承載。
洪曉瑜告訴《中國科學報》,中國SKA區域中心是國際SKA區域中心體系的一個關鍵節點,不僅承擔第一層級數據(每年百PB量級)的接收、運算、管理和存檔,而且需要與其他區域中心進行數據交換和協同工作,它還依賴於科學軟體的研發和科學用戶的長期服務支撐,這些都不是通用型國家超算可以比擬的。
總體而言,區域中心除了承擔計算和存儲的國際義務,更重要的是承擔研發SKA數據處理軟體、培養中國SKA第一梯隊科研人才的重任。
「中國SKA區域中心一旦建成,意味著中國科學家不出國門,就能便捷使用數據產出科學成果,並吸引國際夥伴來中國進行科學研究和交流。」安濤表示,下一步團隊將逐步向國內外用戶開放,支持天文學家使用原型機分析處理SKA先導望遠鏡數據。
相關論文信息:
https://doi.org/10.1038/s41550-019-0943-4
《中國科學報》 (2019-11-21 第3版 國際)