AI賦能可持續,大模型創造「無法計算的價值」

2024-09-24     經濟觀察報

2024雲棲大會如期結束,AI大模型仍是今年大會的主角。

此次大會上,阿里雲通義旗艦模型Qwen-Max再次升級,性能已接近GPT-4o。阿里雲同時宣布,正以AI為中心,全面重構底層硬體、計算、存儲、網絡、資料庫、大數據,打造一個AI時代的最強AI基建。

全面投入AI的背後,是阿里雲深信生成式AI具有「逐漸滲透數字世界,接管數字世界,改變物理世界」的龐大想像空間。

當前,大模型在物理、化學和生物等多個學科的能力已接近博士水平。另一方面,大模型不僅具備持續可用性,還擁有在記憶、泛化上的舉一反三能力,對複雜知識、數據的總結能力,以及在音視頻等方面的多模態能力。

這使得大模型已經能在一定程度上幫助人類解決各種問題。目前,阿里雲正與各方開展合作,讓AI在各個行業場景中落地,其中不可或缺的一部分是,讓大模型智能向善,賦能可持續發展、教育和科學研究,為國計民生謀求更多福祉。

在經濟社會領域,由自然資源部信息中心與阿里雲聯合研發的后土大模型,正在賦能自然資源的數字化治理;在天文研究領域,基於通義打造的星語3.0天文大模型已接入望遠鏡集群,助力天文發現;在教育領域,高教社正在利用AI技術加速教育變革、推進教育公平......

加速向社會各行各業滲透的AI,於許多人「看不見」的地方,正在產生深遠的影響和無法計算的價值。

「后土」量地

據了解,在自然資源部信息中心(下稱「信息中心」)與阿里雲的密切合作下,自然資源行業大模型后土已取得的初步進展包括:

構建自然資源行業大模型總體技術路線;開展自然資源行業知識收集和加工處理,採集自然資源基礎知識、政策法規、標準規範等7大類、70多萬份文檔語料;組織自然資源行業大模型關鍵技術研發。

在研發富模態知識文檔解析加工技術上,文字OCR(光學字符識別)、段落、表格、圖片、公式等識別準確率超過90%。

基於Qwen系列通用大模型+RAG(檢索增強生成)及微調,為大模型注入自然資源領域專業知識,共同打造自然資源行業大模型智能體。

信息中心副主任兼工程師吳洪濤在雲棲大會上介紹,后土大模型的命名源於中國古神話中的神明「后土」,其職責就是自然資源管理和國土空間治理。

目前,后土大模型已初步落地在國土變更調查工作中。一直以來,這項工作對於全面及時準確掌握我國國土利用狀況,保護耕地、節約集約用地,保護生態環境和國家糧食安全等都具有重要意義。

國土變更調查主要分為調查取證和核查兩個階段。在調查階段,調研人員需親自前往調查地點進行走訪、測繪;在核查階段,工作人員需對海量衛星影像、測繪數據,以及實地拍攝圖片、視頻進行識別,核對土地用地類別。

問題在於,我國每天都會新增大量的國土資源調查圖片和視頻,難以全部完成人工核查。為了減輕調查人員的工作量,提高調查、核查的準確率,去年,自然資源部信息中心與阿里雲展開合作,基於通義基模共同打造了后土自然資源行業大模型。

以農用地變更調查場景為例,在外調查時,調研人員可使用基於后土大模型開發的AI工具對目標地塊進行拍攝,大模型能精準識別農用地占地面積、用地類型等信息,輔助工作人員作業,避免多拍、錯拍和漏拍。

在核查階段,大模型會根據已有實地拍攝圖片識別地類和屬性,自動輸出核查結論,輔助工作人員提升核查準確度和效率。

以人為本的大模型,正在將人從繁瑣、重複的工作中解脫出來。據悉,未來后土大模型也將在耕地、園地、林地、草地、商服用地等其他地類調查工作中應用,助力自然資源可持續發展。

吳洪濤還提到,過去一年以來,信息中心也在探索后土大模型在空間規劃和用途管制、資源保護、地質災害防治等場景的應用,「大模型基礎底座和應用場景的雙向奔赴」,將「全面支撐自然資源數字化治理能力的提升,來回答自然資源數字化治理過程中的必答題」。

望向天空的大模型

測量大地的同時,AI大模型也在望向天空。

今年4月,中國科學院國家天文台人工智慧工作組發布了新一代天文大模型星語3.0,這是大模型在天文觀測領域的首次應用。

星語3.0基於阿里雲通義千問開源模型打造,當前已成功接入國家天文台興隆觀測站望遠鏡陣列Mini司天,可實現自主控制望遠鏡進行觀測、分析觀測結果,智能地給出下一步觀測建議。

天文望遠鏡是人類探索宇宙的「照相機」。相比單體望遠鏡,大型望遠鏡陣列能更有效地整合高性能望遠鏡資源,成本更低,觀測效率更高。但隨著望遠鏡數量的不斷增加,如何控制大型望遠鏡陣列已成為當今天文界共同面臨的挑戰。

過去,天文觀測主要依賴觀測助手和科研人員的配合,科研人員常常需要根據觀測所在地氣象情況修改觀測計劃,在觀測室等待數據返回並實時分析數據,再根據結果修改觀測計劃。重要觀測目標的每個環節都需要人工參與,效率低且難以同時控制多個望遠鏡。

星語3.0嘗試解決這一難題。依託阿里雲通義千問底模和百鍊平台,星語3.0基於超30萬專家訂正數據完成訓練,在天文物理等專業能力上表現突出。

在觀測星體時,星語3.0首先會查詢某星體的坐標信息,反饋給觀測人員;當得到確認後,星語3.0將按照觀測人員輸入的計劃進行自動觀測;單次曝光完成後,大模型將回收並處理數據,根據結果判斷目標源的觀測價值,推薦接下來的觀測計劃。

相比以往,星語3.0自主完成了天文觀測中一些原本需要人力完成的任務,提高了天文觀測的效率,讓研究者能夠回歸到天文研究上。

除了輔助天文觀測,國家天文台還與阿里雲合作開發了國際首個太陽垂直Sora模型,可用來探測耀斑,以及用於磁場、演化實時分割等相關研究

另一方面,大模型在海量數據處理方面的能力也被天文領域所需要。據中國科學院國家天文台研究員羅阿理表示,天文觀測的數據量增加非常快,現在每天會產生幾十TB數據,未來10年,天文領域的數據總量會從PB走向EB的量級。為了更好地挖掘這些天文數據,國家天文台在2016年就和阿里雲簽署了戰略合作協議。

羅阿理透露,在沒有大數據和機器學習等方法之前,天文領域每年新增的全球成果大概是1000多個,有了這些新的工具、數據和方法後,每年新增成果已經翻倍。

未來,星語大模型將接入國家天文台大型望遠鏡陣列司天(Mini司天即為司天的一部分),這是我國天文學家面向時域天文學提出的國家級重大天文基礎設施項目,項目預期至2030年米級望遠鏡數量達到72架,每晚產生約140TB處理後數據,成為全球巡天效率最高的項目。

AI的「有教無類

2500年前,思想家、教育家孔子提出了他理想的教育——「有教無類」「因材施教」,前者講的是教育普惠,後者則希望進一步實現個性化教育。而大模型的出現,正逐漸推動著這種理想教育成為現實。

當前,我國城鄉和地區之間的教育資源分布不平衡,教育質量存在很大差異。如何應用先進技術,推動優質教育資源的共建共享是推進教育公平的重要任務。

高等教育出版社(下稱「高教社」)社長劉超在雲棲大會上提到,過去高教社在教育公平1.0的實踐是,通過信息技術賦能教育資源的普及,實現優質教育資源的共享。

據了解,高教社已建成了全世界最大的在線開放課程平台愛課程、最大的職業教育數字教學資源共享平台和在線教學服務平台智慧職教等教育資源平台。高教社各教學平台的一億多用戶,可以通過一根網線直接連通名校名師的課堂,共享優質資源。

進入到新的時代,劉超認為,人才培養正以知識為重轉向以能力培養為重,人們對於自主性學習、個性化學習和終身學習的現實需求日漸強烈。自然語言模型能實現對話式學習,在教育領域具有無限的潛力和廣泛的前景。他深信,教育公平的2.0一定是有人工智慧賦能的教育的公平。

基於這一思想,高教社正基於阿里雲通義千問等大模型打造AI底座。其中高教社擁有70年來積累的4500TB的高質量教育語料,包括優質的教材文本、豐富的多模態資源、習題題庫等,阿里雲的通義大模型性能則位於國產大模型前列。

此前,高教社與阿里雲、浙江大學等已聯合發布了基於通義千問7B(70億參數)模型訓練的「智海-三樂」教育垂直大模型,並應用於14所高校的101計劃核心課程《人工智慧引論》教學課堂。據悉,該模型可為相關課程提供智能化、個性化學習,服務人才培養。

在劉超看來,理想的教育大模型需要集成四個特點:更正確的答案,分布式的輸出,情緒的提供和資源的推薦。

其中,分布式的輸出被稱為是蘇格拉底式的啟發式教學,劉超說,浙江大學吳飛教授的團隊今年特意在蘇格拉底式的教學智能體的研發下做了大量的工作,讓AI能把一個複雜的問題拆解成若干相關簡單的問題,分布式地問給學生,這樣才能夠啟發學生真正掌握學習的邏輯和推理過程。

不同的學生往往即使上同一年級,在學習的進展上也不一樣,對知識點的掌握程度也不一致,而具有記憶、泛化能力的大模型,能夠做到「千人千面」,推動個性化學習的實現,讓教育真正走向「有教無類」。

無法計算的價值

不只是上述領域,一直以來,阿里雲堅持開源大模型,作為千行百業應用開發的基礎,通義之上已長出AI應用的「熱帶雨林」。

截至2024年9月中旬,通義千問開源模型下載量突破4000萬,Qwen系列衍生模型總數超過5萬個,成為僅次於Llama的世界級模型群。

2024雲棲大會上,阿里雲CTO周靖人最新發布了通義千問新一代開源模型Qwen2.5,旗艦模型Qwen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。

基於成為「AI時代最開放的雲」的願景,阿里雲希望用AI技術賦能社會可持續發展,正如阿里雲副總裁、中國可持續發展研究會理事劉湘雯所言,人工智慧和雲計算相結合,從數字世界進入到物理世界,將為整個社會帶來無法計算的價值。

中國可持續發展研究會理事長李萌認為,人工智慧賦能可持續發展,將成為推進經濟社會綠色轉型的關鍵支撐。作為新興技術力量,人工智慧在中國助力資源優化、提升效率,推動產業轉型、環境保護、消除貧困、教育公平,以及加速實現可持續發展的目標中將發揮不可替代的作用。

文章來源: https://twgreatdaily.com/4e7a0152552fb62b149cbe8f715623d0.html