從技術創新到場景落地,百度文心大模型開啟價值階段

2022-06-16     懂懂筆記

原標題:從技術創新到場景落地,百度文心大模型開啟價值階段

從元宵節AI做畫,到高考季度曉曉的高分作文;從百度APP對話式搜索,到龔俊數字虛擬人的聊天……今年以來,百度文心大模型頻頻創造社會熱點,AI已經離我們越來越近了。

這不是錯覺,AI正在我們每個人的工作、生活中潛移默化、潤物無聲地滲透。這背後,是大模型加速落地、開啟價值階段的轉折點。

01

場景「大爆炸」 度曉曉「出圈」

今年的高考季,數字人度曉曉「出圈」了。

每年的高考作文都會成為公眾的一大關注點。今年語文考試結束後,百度數字人度曉曉化身為「數字人考生」,挑戰高考作文寫作——《本手、妙手、俗手》這篇議論文,在40秒內就創作了40多篇文章,平均1秒生成1篇。

不僅速度快,文章結構還非常完整,論述邏輯清晰、文字語言流暢,文中還大量引用了名人名言,並使用了排比、比喻等修辭手法。面對高考作文寫作「審題」、「邏輯」和「創意」等挑戰,度曉曉在文心大模型的幫助指導下,又快又好地完成了寫作。

曾擔任北京高考語文閱卷組組長的申怡,為度曉曉的作文打出了48分的成績(滿分60分),這一分數已經超過75%的高考考生。

作為一個數字人,度曉曉不僅能答題,還能變身學習助理,為考生提供虛擬服務,包括整合多模態交互技術、3D數字人建模、機器翻譯、語音識別、自然語言理解等多項技術能力,可以在查分、報志願、查錄取等重要高考節點推送提醒,確保考生和家長不會錯過任何重要信息,還能根據考生的不同特點,智能推送個性化的報考推薦和優質內容。

另外,「度曉曉」還能與考生進行智能聊天對話,通過情感陪伴的方式幫助用戶緩解壓力與情緒波動,全程陪伴考生及家長。

在百度文心大模型的加持下,度曉曉的角色還可以從高三考生秒變AI藝術生,帶著她的畫作「現身」西安美術學院的2022年「時空留痕·無界西美」本科畢業展。在其展出的用AI創作的六幅繪畫作品中,除了四幅與「無界」主題強相關的作品(《自然與虛擬》、《火星上的月亮》、《沙漠中的孤島》、《顏色與星空》)外,還有兩幅有關西安大雁塔的特別作品。度曉曉僅用數十秒就完成了作品,而且「已經達到了本科美術畢業生的基本要求」。

擁有一個智慧的靈魂——文心大模型,度曉曉可以分飾多個角色,可以跟據場景換不同的造型,也可以換個合適的名字。

在百度自己的智能化產品中,語音搜索、信息推薦、對話系統、智能音箱、自動駕駛等方面都得到了實踐。比如在百度App端內的AI數字人,目前主要可以實現四大功能:即個性化聊天陪伴、輔助搜索、服務分發和互動玩法。

在外部,文心大模型已落地工業、能源、金融、通信、媒體等領域,通過飛槳開源開放平台、百度智能雲等賦能到各行各業,個人、企業開發者數量超6萬。

隨著「度曉曉」一次次出圈,你才突然發現AI已經遍地開花。

在AI遍地開花的同時,其價值也在不斷被驗證:在媒體行業,可以激發創新,提升內容多樣性,降低製作成本;在保險領域,能夠讓文本處理效率提升30倍;在人力資源應用中,候選人信息智能分類識別準確率可高達99%;在醫療領域應用中,病歷檢查時間從30分鐘縮短到了秒級……

一項技術的快速普及,其要素之一就是廣泛的應用場景,並且能在場景中產生價值。從過去這兩年文心大模型落地的應用來看,場景正在不斷豐富,尤其是今年呈現出「大爆炸」之勢,與此同時應用價值也逐漸被用戶認可。此次度曉曉出圈,也讓更多人看到了AI的價值,無疑將對AI的普及起到進一步催化作用。

02

技術成熟,文心大模型已是「優秀生」

預訓練大模型在AI進程中為什麼重要?它如同AI「輪子」,解決場景碎片化的難題,是AI從作坊式變成工廠式生產的通用工具。所以,大模型在一定程度上也決定著AI落地的速度。

所謂預訓練大模型,是通過自監督學習的方法,讓模型對海量無標註數據中的規律和知識進行提煉、學習,當面向實際任務和場景應用時,只需要少量的任務標註數據,就能通過持續微調得到在應用場景中非常好用的模型。從這一點可以看到,其特點就是通用性強、泛化性強,易用且好用。也正是因此,全球科技巨頭都在預訓練大模型領域投入研發力量,展開「軍備競賽」。

百度是中國企業中走得早、走得快的科技企業之一。2019年3月,百度率先發布國內首個正式開放的預訓練模型ERNIE 1.0,那個時候這項技術還相對稚嫩。此後兩年兩次升級,到2021年7月,百度百億參數規模的知識增強型預訓練模型ERNIE 3.0 問世,這是當時業界首次在百億級預訓練模型中引入大規模知識圖譜。

ERNIE 3.0 一舉刷新了54個中文NLP任務基準,其英文模型在國際權威的複雜語言理解任務評測SuperGLUE上,以超越人類水平0.8個百分點的成績登頂全球榜首,處於全球領先地位。當年12月,百度聯合鵬城實驗室打造了「鵬城-百度·文心」(代號ERNIE 3.0 Titan),這是全球首個知識增強千億大模型,參數規模達到了2600億,是當時全球最大中文的單體模型。就在剛剛結束的WAVE SUMMIT 2022深度學習開發者峰會上,文心大模型又迎來一系列重大升級——ERNIE 3.0 Zeus成為融合了任務相關知識的千億大模型,也是國內首個開放API調用的千億大模型。

文心大模型的一大特色是「知識增強」,即引入知識圖譜,將數據與知識融合,使得學習效率更高、可解釋性更好。今天,用AI進行創作已經很成熟,從財經、體育類新聞快訊,再到詩歌、小說等文學創作,AI寫作覆蓋的領域越來越廣,創作形式和內容也變得更加豐富多彩。

這次支持度曉曉完成高考作文的,就是文心大模型最新發布的融合任務相關知識的千億大模型ERNIE 3.0 Zeus。這一模型在學習海量數據和知識的基礎上,進一步學習了百餘種不同形式的任務知識,增強了模型的效果,在各類NLP任務上都表現出更強大的零樣本和小樣本學習能力。

技術的成熟度,是市場普及的另一個關鍵因素。短短几年時間,百度文心大模型已經成為業界的優秀生。隨著技術的成熟,只需要少量的任務標註數據,就能通過持續微調得到在應用場景中非常好用的模型,進一步加速在各類場景中的應用落地。

以AI創作的一些例子來分析,在文心大模型的支持下,利用AI自動生成內容的新型生產方式——AIGC已經滲透到諸多場景中,並且愈發成熟:AI作畫、AI寫歌、AI剪輯、虛擬主持、智能客服……根據百度研究院預測,2022年AIGC技術將藉助大模型的跨模態綜合技術能力,實現更為規模化的應用。

對此《經濟學人》最近發表的一篇關於大模型的文章也指出,文心ERNIE大模型是中國最好的預訓練大模型,「AIGC的普及,能夠給人類的創作帶來更多靈感。」

03

搭橋鋪路,由點到面加速普及

基於技術成熟、場景價值的基礎,AI普及的第三個要素就是實現路徑。

在今年WAVE SUMMIT 2022深度學習開發者峰會上,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜認為,今年是大模型的落地關鍵年,她對此強調:「要做好落地,需要解決的關鍵問題,是前沿的大模型技術如何與真實場景的方方面面要求相匹配。」實際上,就是要在技術與場景之間搭橋鋪路,讓技術快速在場景中落地。

首先是模型體系。不同場景對模型的需求會有一定的差異化,所以在通用模型的基礎上要增加不同特質,對此百度增加了兩類模型:一是任務大模型,主要面向特定任務,比如語音搜索、圖文搜索、圖象理解等等;二是行業大模型,針對特定行業進行知識增強後的大模型,百度當前的模型體系中已經發布能源和金融兩個行業大模型,未來還將不斷更新更多行業。

將大模型體系化,按技能、行業細化,拓寬了人工智慧技術落地場景的覆蓋廣度。如果用蓋房子來比喻,大模型就是基礎設施,有人建公寓,有人建別墅,有人建寫字樓,有人建廠房,有人建商場。不同的建築,選擇不同的基礎設施。

其次是全流程支持。百度今年WAVE SUMMIT 2022發布了大模型開發套件、API和內置了文心大模型能力的EasyDL及BML開發平台。

所謂全流程支持,本質上是降低了技術滲透到產業應用的難度,提升了落地速度。如果用蓋房子來比喻,這就相當於提供各種工具、圖紙以及施工指導,幫助你快速完成工程。

比如,高性能部署方案涵蓋了通用蒸餾、任務蒸餾、模型裁剪等大規模輕量化落地方案,以及飛槳運算元融合、模型量化等加速方案。再比如,預設多領域的豐富任務,包括40多種NLP任務,涵蓋了分類、抽取、檢索、生成等;20多種計算機視覺任務,涵蓋了人臉、人體、車輛、商品、食物等細粒度分類識別。在這些預製任務下,方案提供配置文件、命令行等多種啟動方式、實現一鍵組網訓練。

最後是生態、社區。任何一項技術的普及,都與生態的繁榮度密切相關。大模型的技術成熟了,未來如何創新地應用於場景中,需要更多的開發者共同探索與創造。百度開放的大模型創意和探索社區——暘谷,是文心大模型支持下的一個創意應用空間,也是開發者盡情展現自己「腦洞」的地方。百花齊放、百家爭鳴,將會加速世界向AI遷移的進程。

我們都知道,生態能促進場景應用的豐富度。如果類比於蓋房子,生態就是各種設計師、建築師在這裡發揮創意,出設計圖、建樣板間,他們在實現自我價值的同時也可以供別人參考、複製。

可以說,今年度曉曉的「出圈」,讓更多人深刻感受到了AI的發展已經到達一個臨界點:這將是由點到面快速普及的一年。廣度、速度、豐富度,百度有意識地在多個維度加速AI的落地,今年我們將在更多的場景中看到AI帶來的創新價值。

【結束語】

正是因為大模型的重要性,過去幾年間,業界展開了大模型的技術軍備競賽,大家不停刷榜。事實上,無論大模型的性能有多強、參數量有多麼龐大,最終的價值體現是要落地,好用、易用的同時,還要在應用場景中產生價值,帶動產業發展和升級。文心大模型完成了初期的技術積累,率先開啟了大模型的價值階段。

文章來源: https://twgreatdaily.com/zh-my/c733f96d43d7beaa4407c2cd98eb38b5.html