百度不是口嗨,文心一言為定

2023-03-17     鋅刻度

原標題:百度不是口嗨,文心一言為定

撰文/ 陳鄧新

編輯/ 高 智

文心一言,終於揭開了神秘面紗。

2022年3月16日14時,百度在北京總部召開新聞發布會,宣布正式邀請測試基於百度新一代大語言模型的生成式AI 產品文心一言。

百度創始人、董事長兼執行長李彥宏表示:「百度希望和大家一起,推動人工智慧技術進步,讓所有人都能使用最先進的生產力工具,讓所有人都能從中受益。」

反應到資本市場,當天百度美國股價收盤上漲3.8%,次日百度香港股價早間高開高走,大幅拉升,盤中漲幅最高近15%,資本認可的態度可見一斑。

憑藉在AI領域的長期投入,百度站在歷史的拐點。

對標GPT-4,文心一言底氣十足

時代,變了。

2022年3月15日凌晨,OpenAI正式發布了升級後的GPT-4,具備了圖像處理,儘管如此仍有不足之處:在新版本中,AI依舊存在社會偏見、捏造事實、對抗生成等問題。

對此,「虎嗅科技組」進行了「胡編亂造」測試,發現GPT-4與GPT-3.5一樣,從容地編造了「林黛玉倒拔垂楊垂楊柳」「魯智深敗走麥城」等故事,並沒有改進。

而一天之隔,百度的「文心一言」也橫空出世。

巧合的背後,則是棋逢對手,標誌著AI正式邁入「iPhone時刻」,拉開新時代的序幕。

事實上,文心一言雖然對標GPT-4,卻大有不同:走了一條「人有我有,人有我優」之路,尋求差異化競爭力,與GPT-4形成錯位競爭。

具體來看,文心一言對人類意圖的理解頗深,在現場展示的互動中,準確性、邏輯性與流暢性已逐漸接近人類的水平。

譬如,文心一言不但可以正確解釋「洛陽紙貴」的成語含義,還可以闡述「洛陽紙貴」背後的經濟學理論,更可以藉此創作一首藏頭詩。

再譬如,雞兔同籠是著名的數學趣題,文心一言不但可以解題、一步步算出正確答案,更可以判斷題目是否正確,邏輯思維與常人無異。

以上可見,文心一言的文學創作、商業文案寫作、數理邏輯推算等能力,可與GPT-4正面叫板。

此外,文心一言也有獨到之處。

一方面,大模型更懂中文。

中文博大精深,哪怕同一個詞彙,在不同語境或有不同的意義,對AI是一個巨大的挑戰,這難不倒文心一言。

畢竟,作為一家中國公司,百度天然占據中文語境的優勢,再疊加持之以恆地深耕,從而對中國文化的理解更深:文心一言大模型的訓練數據包括萬億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,及5500億事實的知識圖譜。

一言以蔽之,百度的文心大模型紮根於中國本土,比國外開發的大語言模型更適合中文語境和中國市場。

另外一方面,多模態更豐富。

相比GPT-4,文心一言可以生成視頻與方言語音,前者降低了視頻製作的門檻,一次創作,觸及文本、圖片、視頻等全域內容生態;後者覆蓋不同地區的群體,方便用戶流暢地進行智能互動。

百度多模態的實力,可見一斑。

未來,百度多模態統一大模型的能力增強,文心一言的多模態生成能力也會不斷提升。

厚積薄發,才能水到渠成

需要注意的是,Open Al為美國創業公司,而正式發布對標GPT產品的,百度是全球大廠的第一個,值得高看一眼。

這並非突擊數月就辦得到的,而是厚積薄發的結果。

首先,十年投入超千億元。

2013年起,百度陸續成立了百度美國研究院、百度深度學習研究院、大數據實驗室、矽穀人工智慧實驗室,從此不斷加碼勇攀AI技術的高峰。

這十年來,百度在AI累計投入了超1000億元,其中核心研發投入占核心收入比例連續多個季度超過了20%。

以2022年為例,百度的研發費用為233億元,占核心收入的比例高達24.42%,而全年的凈利潤也不過206.8億元。

專注之下,回報也肉眼可見。

據《中國人工智慧專利技術分析報告(2022)》報告顯示,百度AI專利申請量為16754件,AI專利授權量為5705件, AI專利申請量與授予量連續五年全國第一。

實際上,從全球AI專利數量排名來看,百度已穩壓微軟、谷歌一頭,這意味著百度AI在中國乃至全球範圍均具有綜合優勢。

其次,持續夯實算力底座。

技術占優之外,百度也有承接AI算力的底氣。

多年以來,百度一直是「新基建」的主力之一,在算力基礎設施上一向未雨綢繆,並規劃2030年百度智能雲伺服器數量超500萬台。

如此一來,百度自然沒有算力瓶頸的困擾。

更為重要的是,百度在山西陽泉、江蘇鹽城等地建設智算中心;其中,百度陽泉智算中心是亞洲最大單體智算中心,建設規模為4 EFLOPS(每秒400億億次浮點運算)AI算力,可滿足各行業超大規模AI計算需求。

再次,打造AI閉環。

百度是中國唯一一家擁有全棧AI技術架構的公司:從高端晶片崑崙芯,到飛槳深度學習框架,到文心預訓練大模型,再到行業AI落地,在晶片層、框架層、模型層與應用層都有關鍵自研技術。

早在2019年3月,百度提出知識增強的語義理解框架ERNIE,曾一舉登頂全球權威數據集GLUE榜單,首次突破90分大關,刷新榜單歷史。
同年9月,百度發布全球首個百億參數的對話大模型PLATO-XL,一舉超過Facebook Blender、谷歌Meena和微軟DialoGPT,成為全球首個百億參數中英文對話預訓練生成模型。
截至2022年11月,文心已累計發布11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、製造、社科等領域。

換而言之,由於掌握了關鍵自研技術,百度在模型、框架、晶片、應用這四層架構之間的協同勢必更為通暢,這是其他玩家不可比擬的優勢。

百度首席技術官王海峰表示:「文心一言是百度多年技術積累和產業實踐的水到渠成,尤其是飛槳深度學習平台和文心大模型的聯合優化,為文心一言提供了堅實的技術支撐。」

賦能千行百業,百度智能雲提速

文心一言落地,百度智能雲一馬當先。

過去多年間,價格戰成為全球雲計算行業的關鍵詞,「帶頭大哥」亞馬遜AWS降價近百次,而國內更是殺紅了眼。

一度,出現「一元中標」「一分錢中標」的怪事,令人唏噓不已。

舊時代一味追求低價,新時代從拼價格走向拼AI。

這意味著,用戶今後選雲更為聚焦智能服務,AI能力成為首要指標,那麼誰掌握了AI的戰略高點,誰將成為下半場的最大贏家。

隨著雲市場遊戲規則的根本改變,百度智能雲有了後來居上的資本,路將越走越寬、越走越順、越走越遠。

更為關鍵的是,百度智能雲可以為產業帶來AI普惠。

百度智能雲的打法為雲智一體,以雲計算為基礎,以AI為抓手,聚焦重要賽道,藉助百度大腦、飛槳平台等對產業輸出百度強悍的AI能力,推動產業走向智能化轉型,從而不斷革新生產力,以到達降本增效的目的。

眼下,百度智能雲已與汽車、電子、能源電力、裝備製造、鋼鐵、化工、水務等超過22個行業的300多家標杆企業建立合作,為超過18萬家工業企業提供服務,讓行業認識到智能化的實際價值。

有了文心一言加持,百度智能雲賦能千行百業勢必更為得心應手。

譬如,百度智能云為國能綏中打造了「設備故障知識庫」,實現運維數據快速查詢、運維需求即問即答,信息查找速度較之前提升90%;同時,對歷史設備故障經驗和運規數據進行智能分析,為維修人員提供輔助決策,設備故障檢修周期縮短50%以上。

截至2023年3月17日10點,申請文心一言AIP調用服務測試的企業已達7.6萬家,涉及網際網路、媒體、金融、汽車、軟體等行業,而百度智能雲已與5家企業完成首批簽約合作,並與650家企業啟動簽約。

讓每一家公司離客戶更近,成為百度智能雲最大的訴求。

中信證券認為:「百度具備『模型、框架、晶片、應用』的全棧布局,上述領域的產業落地有望帶動百度雲計算業務在AI領域的持續拓展,持續強化公司智能雲業務的競爭力與遠期市場空間。」

總而言之,文心一言承載了百度科技改變世界的夢想,是賦能千行百業的新平台,勢必成為產業的智能牽引,驅動產業不斷降本增效。

畢竟,文心一言的一小步,百度的一大步。

文章來源: https://twgreatdaily.com/zh-hk/e4227153c394a33f919ae1f359fe511a.html