百度版「Sora」,不發模型,直接落地|最前線

2024-09-25     36氪

文|周鑫雨

編輯|蘇建勛

2024年9月,大廠發布會扎堆的一個月。而廠商發布的主要內容,都指向了多模態,和對標OpenAI Sora的視頻生成模型:

9月19日開幕的雲棲大會,阿里雲發布了通義萬相AI視頻生成模型;緊接著,9月24日,位元組跳動的首個視頻生成模型「豆包·視頻生成模型」,空降在火山引擎AI創新巡展。

在快手、阿里、位元組等一眾網際網路大廠中,百度布局通用大模型的時間最早,但對類Sora的視頻生成模型的響應,卻保守的多。迄今為止,百度尚未發布獨立的視頻生成模型,2024年1月發布的視頻生成方法UniVG,仍然留在一紙論文中。

在2024年9月25日舉辦的百度雲智大會上,百度突然發布了一項文生視頻功能——沒有獨立模型,而是直接在疊代到4.0版本的曦靈數字人平台上,上線了文生3D數字人、文生3D視頻內容的功能。

根據用戶的文字指令,生成的數字人還能改變妝容、根據落地場景調整形象風格。AI生成功能的嵌入和疊代,讓幾小時的3D數字人生成時間,被壓縮到了5分鐘。

同樣壓縮的還有3D數字人的成本:3D超現實數字人的單價,直接從萬元降到了199元

以「落地」為導向的發布,貫穿了整場百度雲智大會。可見的是,相較於一股腦發布11款AI應用的2023年雲智大會,百度雲2024年的命題,已經轉變成了向下游「賣水」。

Scaling Law的探索仍在進行,支撐千億、萬億參數大模型的基礎設施,已經從CPU變成了以GPU為主,集群的規模也從千卡擴大到了萬卡級別。

百度集團執行副總裁、百度智能雲事業群總裁沈抖認為,大模型的Scaling Law將在一段時間內持續有效,很快就會有更多的十萬卡集群出現。

最新的百度百舸AI異構計算平台4.0,就是針對十萬卡集群的算力管理平台。一方面,百舸4.0能夠將萬卡任務的有效訓練時長穩定在99.5%以上,另一方面,百舸4.0將萬卡集群下的萬億參數MoE(混合專家架構)模型的模型算力利用率,提升了30%。

而在模型層,持續的降低價格和使用門檻,依然是百度千帆大模型3.0疊代的重點。迄今為止,文心旗艦模型的降價幅度已經到了90%,ERNIE Speed、ERNIE Lite兩款主力模型則直接免費開放。

據沈抖介紹,目前文心大模型的日均調用量已經超過了7億次,千帆平台已經開發了超過70多萬個企業級應用。

在應用層,成為B端企業用戶的「賣水人」,是百度雲AI應用的定位。會上,除了數字人生成,針對智能客服和代碼編程場景,百度雲分別疊代了智能客服平台「客悅」和代碼助手「文心快碼」。

更新版的「客悅」已經支持語音、視頻等多模態交互,將智能客服處理複雜任務的能力提升至92%,超過了行業的平均水平(80%)。

目前,代碼處理是AI模型最成熟的應用場景之一,多名從業者對36氪判斷,AI對代碼的理解和處理能力,比長文本更優。

「企業級代碼架構解釋」和「企業級代碼審查」能力,是「文心快碼」上新的兩個功能。前者可幫助用戶理解原有代碼,快速上手開發,而後者則可基於對項目的理解,對代碼進行勘誤。

百度雲在明確提供基礎設施的角色,而對於下游應用層而言,百度CEO李彥宏在會上再次強調,智能體是他最看好的方向:「就像網際網路時代的帳號,智能體門檻很低,但上限卻很高。」

歡迎交流!

文章來源: https://twgreatdaily.com/47f3ceabf95ea7bbb23afa4014cdc791.html