百度版「Sora」，不發模型，直接落地

文｜周鑫雨

編輯｜蘇建勛

2024年9月，大廠發布會扎堆的一個月。而廠商發布的主要內容，都指向了多模態，和對標OpenAI Sora的視頻生成模型：

9月19日開幕的雲棲大會，阿里雲發布了通義萬相AI視頻生成模型；緊接著，9月24日，位元組跳動的首個視頻生成模型「豆包·視頻生成模型」，空降在火山引擎AI創新巡展。

在快手、阿里、位元組等一眾網際網路大廠中，百度布局通用大模型的時間最早，但對類Sora的視頻生成模型的響應，卻保守的多。迄今為止，百度尚未發布獨立的視頻生成模型，2024年1月發布的視頻生成方法UniVG，仍然留在一紙論文中。

在2024年9月25日舉辦的百度雲智大會上，百度突然發布了一項文生視頻功能——沒有獨立模型，而是直接在疊代到4.0版本的曦靈數字人平台上，上線了文生3D數字人、文生3D視頻內容的功能。

根據用戶的文字指令，生成的數字人還能改變妝容、根據落地場景調整形象風格。AI生成功能的嵌入和疊代，讓幾小時的3D數字人生成時間，被壓縮到了5分鐘。

同樣壓縮的還有3D數字人的成本：3D超現實數字人的單價，直接從萬元降到了199元。

以「落地」為導向的發布，貫穿了整場百度雲智大會。可見的是，相較於一股腦發布11款AI應用的2023年雲智大會，百度雲2024年的命題，已經轉變成了向下游「賣水」。

Scaling Law的探索仍在進行，支撐千億、萬億參數大模型的基礎設施，已經從CPU變成了以GPU為主，集群的規模也從千卡擴大到了萬卡級別。

百度集團執行副總裁、百度智能雲事業群總裁沈抖認為，大模型的Scaling Law將在一段時間內持續有效，很快就會有更多的十萬卡集群出現。

最新的百度百舸AI異構計算平台4.0，就是針對十萬卡集群的算力管理平台。一方面，百舸4.0能夠將萬卡任務的有效訓練時長穩定在99.5%以上，另一方面，百舸4.0將萬卡集群下的萬億參數MoE（混合專家架構）模型的模型算力利用率，提升了30%。

而在模型層，持續的降低價格和使用門檻，依然是百度千帆大模型3.0疊代的重點。迄今為止，文心旗艦模型的降價幅度已經到了90%，ERNIE Speed、ERNIE Lite兩款主力模型則直接免費開放。

據沈抖介紹，目前文心大模型的日均調用量已經超過了7億次，千帆平台已經開發了超過70多萬個企業級應用。

在應用層，成為B端企業用戶的「賣水人」，是百度雲AI應用的定位。會上，除了數字人生成，針對智能客服和代碼編程場景，百度雲分別疊代了智能客服平台「客悅」和代碼助手「文心快碼」。

更新版的「客悅」已經支持語音、視頻等多模態交互，將智能客服處理複雜任務的能力提升至92%，超過了行業的平均水平（80%）。

目前，代碼處理是AI模型最成熟的應用場景之一，多名從業者對36氪判斷，AI對代碼的理解和處理能力，比長文本更優。

「企業級代碼架構解釋」和「企業級代碼審查」能力，是「文心快碼」上新的兩個功能。前者可幫助用戶理解原有代碼，快速上手開發，而後者則可基於對項目的理解，對代碼進行勘誤。

百度雲在明確提供基礎設施的角色，而對於下游應用層而言，百度CEO李彥宏在會上再次強調，智能體是他最看好的方向：「就像網際網路時代的帳號，智能體門檻很低，但上限卻很高。」

歡迎交流！

百度版「Sora」，不發模型，直接落地｜最前線