AstroOne亮相,最「懂」天文的大語言模型來了!

2024-10-31     文匯報

AstroOne在中國天文學會2024年學術年會上亮相

10月30日,天文大語言模型AstroOne在中國天文學會2024年學術年會上首次亮相,引發天文學界廣泛關注。

AstroOne由之江實驗室聯合中國科學院國家天文台共同打造,擁有700億參數、320億tokens文本語料,經過了1萬道天文學評測數據集的測評,是當前天文知識能力最強的大語言模型。

作為天文學的「新質生產力」,AstroOne有望促進學科交叉、突破領域邊界,探索未知領域中的未知問題,加速天文發現。

AI賦能解碼「天之語」

天文學界常說「以天之語,解物之道」,是要運用天文觀測所得來揭示宇宙運行規律。但「天之語」異常嘈雜,且信息量巨大,處理每年產生的百PB量級天文數據是一個難題。

「傳統天文研究亟需人工智慧技術賦能,以突破天文數據處理困境。」國家天文台台長、黨委副書記劉繼峰表示。

據介紹,AstroOne能夠為天文研究提供強有力的輔助。除了快速閱讀和學習專業文獻外,它可以快速檢測研究中的潛在錯誤、數據異常或邏輯矛盾,減少人為疏漏。

它還能從海量文獻中提取和核對信息,輔助驗證假設和結果的可靠性。與此同時,AstroOne能實現跨學科知識推理與整合,幫助天文科學家突破知識邊界、啟發創新靈感,生成富有想像力的研究假設。

「今天,計算、數據和模型三者規模的快速增長正在推動科學研究範式的變革。我們希望藉助天文大模型AstroOne,幫助天文科學家和天文愛好者更好地解讀天文觀測數據、更高效地進行科學探索,做出有影響力的研究工作。」之江實驗室「科學基座模型」科研任務總體部技術總師薛貴榮介紹。

跨學科協作攻關科研難題

今年5月起,之江實驗室和國家天文台共同舉辦「天文大模型培訓班」,培養「AI+天文」復合型人才,用人工智慧賦能天文研究。天文大語言模型AstroOne,正是在天文班學員的相互協作下誕生的。

天文大模型培訓班開班儀式

「未來,我們將以人工智慧的天文應用為目標,助力我國在國際天文研究領域走在發展前沿。」國家天文台羅阿理教授說。

天文班的攻關成果不止AstroOne,雙方還合作打造了一個天文圖文模型和四個天文學專業領域模型——用於快速捕捉極端瞬變源的Falco、進行恆星普查的SpecClip、精確預測太陽活動的SolarGPT以及實時識別GRBs等高能瞬變源的GRBs X射線探測模型。

「我們收集了900萬組天文圖文對,並通過大模型技術生成了20萬組圖像問答對,構建了目前規模最大的天文圖文數據集。」天文班學員、之江實驗室天文計算研究中心高級研究專員唐曉瑜透露,接下來,這些模型將陸續發布。

「這只是一個起步,AI+天文還有很多事情要做。」之江實驗室黨委副書記趙新龍表示。除了天文領域,實驗室正在打造一個為AI for Science提供算力、數據、模型、工具等資源和服務的公共平台,未來可以為各個科學領域研究效率提升和成果產出提供有力支撐。

作者:劉琦

文:劉琦 圖:受訪者提供 編輯:劉琦 責任編輯:任荃

轉載此文請註明出處。

文章來源: https://twgreatdaily.com/5efeac9d5c79a42eef5bbd3193754a5e.html