中新網杭州10月31日電(鮑夢妮)據之江實驗室10月31日消息,之江實驗室聯合中國科學院國家天文台共同打造的天文大語言模型AstroOne於近日發布。該模型擁有700億參數、320億tokens文本語料,歷經1萬道天文學評測數據集的測評。
「傳統天文研究亟需人工智慧技術賦能,以突破天文數據處理困境。」中國科學院國家天文台台長、黨委副書記劉繼峰表示,「天文學界常說『以天之語,解物之道』,但『天籟之聲』非常嘈雜,信息量巨大,處理每年產生的百PB量級天文數據是一個難題。」
發布現場。 之江實驗室供圖
據了解,AstroOne能夠為天文研究提供強有力的輔助,可快速檢測研究中的潛在錯誤、數據異常或邏輯矛盾,減少人為疏漏;能從海量文獻中提取和核對信息,輔助驗證假設和結果的可靠性;實現跨學科知識推理與整合,幫助天文科學家突破知識邊界、啟發創新靈感,生成富有想像力的研究假設。
智能時代,計算從輔助性的工具變成了重要的創新引擎,正在全面變革科技創新的模式。此背景下,今年5月起,之江實驗室和中國科學院國家天文台共同舉辦「天文大模型培訓班」(以下簡稱「天文班」),通過封閉式科研攻關實訓,培養「AI+天文」復合型人才。在天文班,計算背景和天文背景的學員相互協作,成功開發出天文大語言模型AstroOne。
「我們的優勢在於理論和觀測,有很多天文數據,同時能夠為計算提供天文的想法和知識,但缺乏大模型方面的經驗。雙方合作能夠取長補短,效率更高。」天文班學員、中國科學院國家天文台博士陳孝鈿說。
此外,雙方還合作打造了一個天文圖文模型和四個天文學專業領域模型——用於快速捕捉極端瞬變源的Falco、進行恆星普查的SpecClip、精確預測太陽活動的SolarGPT以及實時識別GRBs等高能瞬變源的GRBs X射線探測模型。
「這只是一個起步,AI+天文還有很多事情要做。我們將持續深化合作,加強資源共享,推進學科交叉融合和科學數據開放共享,推動科研範式變革。」之江實驗室黨委副書記趙新龍表示。(完)
文章來源: https://twgreatdaily.com/zh-mo/9235de50b5eb96fdce474e0934e0a7ae.html