李彥宏說透了國產大模型的現在與未來

2023-11-16     財經無忌

原標題:李彥宏說透了國產大模型的現在與未來

文 | 無銹缽 山核桃

「中國的大模型很多,但是基於大模型所開發出的AI原生應用卻非常少。」

11月15日,深圳2023西麗湖論壇上,百度創始人、董事長兼執行長李彥宏對國內AI市場給出的研判。

作為《時代》周刊所評選的全球AI領袖企業創始人,李彥宏留給人們的印象,一直是人工智慧行業最堅定的支持者。

過往幾個月里,身處AI賽道廣闊前景之中「振奮感」,幾乎貫穿了他的每一場公開演講。即便是私下裡為《智能革命》一書作序,他也毫不掩飾對於行業的期待:

「全世界都在為即將到來的人工智慧革命感到興奮。」

而在剛剛結束的西麗湖論壇上,面對國內大模型領域的「過熱」現象,這個小小的傳統被打破了,取而代之的則是一盆迎面的「冷水」。

正如他在演講開頭,拋出的那句直切主題的開場白一樣:

「人工智慧很熱,但我想首先談幾個『冷』思考。」

1、熱過的大模型,何時「退燒」?

大模型賽道很火爆,這是過去的大半年裡,各界人士都能直觀感受到的現象。

然而,只有行業中感知最敏銳的那批人才能意識到,當下的大模型賽道,不僅廣受關注,而且已經有了明顯的「過熱」跡象。

當下,人工智慧行業「模型層—中間層—應用層」的宏觀架構之中,大模型已經躍馬當先,成為了占據絕對資源優勢的主角。

「人工智慧每收穫1塊錢投資,就有6毛錢流向了大模型。」

這個類比並不誇張,數據統計現實,2023上半年,國內人工智慧領域共發生161起投融資事件,其中超過半數投融資直指算力設施和大模型業務,而涉及具體應用側面的,不足四分之一。

從發布大模型的時間節點來看,國內的大模型訓練起步,平均要晚於美國3年左右,然而據鈦媒體《2023AI大模型應用中美比較研究》報告顯示,單從數量來看,截至2023年7月底,國內市場已經累計問世了超過130個大模型,甚至超越了同期的美國市場。

大模型超量湧現的另一邊,正如李彥宏所提到的那樣:

「很多行業、企業,甚至很多城市還在買卡、囤晶片,建立智算中心,想要從頭訓練自己的專用大模型。」

這種反常的「過熱」背後,是越來越多從業公司、投資者和企業品牌的集體「迷失」。

對於從業公司來說,大模型之於AI行業,猶如作業系統之於網際網路產業,是不折不扣的「基礎設施」,無論是短期紅利還是長期前景,都非常可觀。

而對於投資人來說,入股算力中心、開發大模型也是「更保險」的商業行為,一方面,AI的中間層和應用層還沒有跑出類似ChatGPT、文心一言這樣的頭部企業,缺乏現有案例參考,另一方面,相較於看不見的原生應用,買實體晶片、建算力中心更能直觀的看見資金流向,從而幫助平衡投資風險。

最後,很多企業對此更是理解不深,順著媒體和輿論的炒作,以為擁抱人工智慧就是引入大模型,最終誤入歧途,造成了對公司資源和社會資源的巨大浪費。

回望過去,各方複雜的博弈與思考,鑄就了如今大模型的「過熱」現象。

長期來看,這一現象所帶來的危害已經逐步顯露:

人工智慧產業架構中,相較於模型層的落後,應用層本來可以成為國內市場彎道超車美國的機遇,然而當前過熱的大模型賽道,虹吸了過多本該投放於應用層的資源,來「重複造輪子」,拖累了應用層的木桶板。

對此,李彥宏同樣深有感觸:

「人類進入AI時代的標誌,是出現大量的AI原生應用,而不是出現大量的大模型。」

從這個角度來說,國產大模型,或許是時候該吃上一劑「退燒藥」了。

2、AI原生帶來的改變,才剛剛開始

類比網際網路產業,作業系統所衍生的紅利,固然成就了微軟這一矽谷巨擘,但硬體層的英特爾、英偉達,軟體層的亞馬遜、谷歌、Meta、Netflix,以及產品終端的蘋果、三星、華為等企業,同樣向世界詮釋著其他產業層級所蘊含的豐厚機遇。

同樣的,人工智慧產業要想收穫長足發展,也必須要實現各個層級的均衡發展,多點開花。

當前階段,意識到這一點的矽谷,已經開始了「各就各位」的新發展階段,圍繞相對成熟的大模型工具,開始朝細分方向衍化新應用。

參考美國的人工智慧市場發展階段,「AI原生應用」的崛起,需要兩個前置條件:

·底層的基礎設施——大模型已經具備了較為成熟的能力

·頭部大模型已經實現了市占率領先,圍繞大模型的內卷告一段落

對應OpenAI的高市占率,在國內大模型市場,以文心一言為代表的頭部大模型,已經成為了開啟「AI原生時代」的關鍵鑰匙。

從技術水平來看, 新發布的文心4.0在理解、生成、邏輯和記憶四大能力上,已經迎來顯著提升;正如李彥宏所提到的那樣,「4.0是迄今為止最強大的文心大模型」。

具體而言,在生成能力上,文心一言除了生成文字內容,還包括了圖片、視頻、數字人等多模態內容,可實現的創作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。

另一側的市場占有率上, 文心大模型更是「遙遙領先」。

截至10月中旬公布的數據,文心一言面向全社會開放以來,用戶規模已經達到7000萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。具體到調用量數據,也如李彥宏所說「可能比國內200多家加起來的調用量還大」,並且還在不斷呈現指數級的增長趨勢。

從這個角度來說,伴隨著文心一言等頭部大模型的逐步成熟化,國內大模型市場千帆競逐、野蠻生長的初級階段,已經從事實上宣告結束。

基於這一背景條件,對於國內當前的人工智慧市場來說,圍繞文心一言等頭部大模型,開啟應用層的「AI原生時代」,已經是「正當其時」。

這也是為什麼,李彥宏在演講的開頭重點呼籲:

「如果我們能夠更加鼓勵基於大模型的AI原生應用,就一定能夠構建起一個繁榮的AI生態,推動新一輪的經濟增長。」

3、繁榮AI應用生態下的「百度解法」

在中國的科技大廠中,百度是最早一批確立AI為核心戰略的企業,在過去諸多公開場合中,李彥宏對AI的熱情貫穿始終,百度也在「一號位」的帶領下,率先自上而下完成AI重構。

但正如李彥宏在演講中所說的:「我認為直到今天,中國也好,美國也好,最好的AI原生應用還沒出現。」

這句研判並非沒有根據。紅杉資本在其刷屏報告《生成式AI進入第二階段 》中提到,當前市場正在進入「第二幕」,一切的炒作最終會被真正的價值和完整的產品體驗所取代。

從全球範圍來看,無論如微軟、谷歌這樣的科技巨頭,還是OpenAI這樣的獨角獸,都在利用AI原生應用夯實自身的護城河,這已是確定性的趨勢。微軟雖然自己不下場最大模型,但藉助和OpenAI的聯盟,已完成Office全家桶的AI化,另一邊的OpenAI則在最近的開發者大會上,直接推出了GPT Store,呼籲個人與開發者打造自己的專屬GPTs。

也正是這種對技術價值的長期研判,催生出李彥宏的呼籲:「我們需要的是100萬量級的AI原生應用,而不是100個所謂的大模型」。

當價值錨定,剩下就是如何去做,如何真正開啟一個健康、繁榮的「AI原生時代」?

事實上,李彥宏與百度想的也非常清楚:這不是一道靠一家或兩家企業完成的選擇題,而是一道需要多方合力共同參與的開放題。

首先,擁抱AI時代,必須是一項「一把手、一號位」工程。 在李彥宏看來:「大企業天然保守,對新生事物不敏感,不願意冒險」。他提到一些行業亂象,比如,很多企業只認為擁抱AI是IT部門的事,要麼天馬行空地想要從0到1自己去大煉基礎模型,要麼就只看評測榜單選一個模型,最終的結果只會造成資源浪費。

如何避免內耗,發揮AI真正的價值,李彥宏給出的解法是企業的「一號位」。這一點也並不難理解。一方面,沒有人比一號位更關注新技術對業務關鍵指標所起的作用,另一方面,只有自上而下的意志傳達,形成統一共識,才能實現合力。

李彥宏是這麼說的,百度也是這樣做的。 正如上文所提到的,百度率先自上而下完成AI重構的中國企業,不僅是各產品線的AI原生化重構,更是上下意志的統一。

其次,技術必須服務需求,從具體的行業場景與業務場景找痛點,與技術做結合。 現在很多企業都在陷入一種算力恐慌,但正如李彥宏所說的「無論是晶片也好、框架也好、模型也好,都需要AI應用來驅動。」

換言之,只有通過更多的場景應用,才能驅動算力和數據步入正循環軌道。

最後,更好的生態才能催生更多的創新。 中國的大模型廠商不能閉門造車,讓AI真正實現普惠必須降低門檻,為更多企業、開發者與個人提供更便捷的工具鏈與解決方案。

「百度從做AI的第一天,就非常重視生態的建設」。李彥宏這樣說。目前,百度飛槳已擁有800萬AI開發者,不久前,百度發布的文心一言插件生態平台「靈境矩陣」,相當於為大模型提供了「手和腳」,插件以一種以輕量化的形式,降低了使用門檻,讓用戶科技結合自身的業務場景與需求,快速創新,進而真正發揮讓大模型的通用能力真正落地於場景。

插件生態之外,對於一些企業級與行業客戶而言,如何讓大模型更好地落地產業,關鍵要讓大模型用的順手、用的長久,百度智能雲千帆大模型平台就通過更完善的大模型產品、工具和服務,目前已有超17000家企業在這裡開發產業模型和解決方案。

對李彥宏與百度來說,他們足夠熟悉AI,也靠著多年的AI蓄力等來了如今的蛻變重生,在西麗湖上的這份冷思考與熱驅動,某種程度上,是李彥宏的真心話,也是百度經歷過AI時代完整周期的經驗總結與價值理解。

正如Robin在演講最後所提到的那樣:

「希望每個人都行動起來,去使用它、體驗它、投入到AI原生應用的創新中,共同創造一個百花齊放、無限可能的AI原生時代。

附:李彥宏《AI原生時代:「冷」思考和「熱」驅動》演講實錄

尊敬的各位領導、各位嘉賓,大家好!很高興來深圳參加西麗湖論壇。我想藉此機會,跟大家分享我對大模型和AI原生應用的一些思考。我演講的主題是《AI原生時代:「冷」思考和「熱」驅動》。現在人工智慧很熱,但我想首先分享兩個「冷」思考。

第一個,中國的大模型很多,但是基於大模型開發出來的AI原生應用卻非常少。有報道說,截止10月份國內已經發布了238個大模型,而6月份的時候這個數字是79個,相當於4個月就翻了3倍。但中國有多少AI原生應用呢?我想在座的各位,很少有人能說出一二個來。如果我們看國外,除了有幾十個基礎大模型之外,實際上,已經有了上千個AI原生應用,這是在中國市場上沒有的。而我認為,人類進入AI時代的標誌,不是產生很多的大模型,而是產生很多的AI原生應用。為什麼這麼說?我們看PC時代,基本上只有Windows一個作業系統,但是基於Windows系統開發的軟體有很多;移動網際網路時代,主流作業系統也只有安卓和iOS兩家,而移動應用有800萬之多。大模型時代其實也是類似,大模型本身是一個基礎底座,類似作業系統,那麼最終開發者要依賴為數不多的大模型來開發出各種各樣的原生應用。所以,不斷地重複開發基礎大模型是對社會資源的極大浪費。

AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。如果我們的產業政策能夠更加鼓勵基於大模型的AI原生應用,我們一定能夠構建起一個繁榮的AI生態,推動新一輪的經濟增長。

第二個冷思考,由於沒有智能湧現能力,專用大模型的價值其實非常有限。我看到一個現象,很多行業、企業,甚至很多城市都在買卡、囤晶片,建立智算中心,想要從頭訓練自己的專用大模型。殊不知這樣煉出來的大模型是沒有智能湧現能力的。因為,只有當你的模型的參數規模足夠大,訓練數據量足夠多並且能夠不斷投入,進行疊代,才能夠產生智能湧現,大模型才能具有觸類旁通的能力。也就是說,你沒教過的東西,它也會了。所以,大模型的產業化模式,應該是把基礎模型的通用能力和行業領域的專業知識相結合。也就是大模型套小模型,專用的小模型反應快,成本低,大模型更智能,可以用來兜底。

自從8月31號開放以來,文心大模型的API調用量,呈現了指數級的增長。國內有200多個大模型,上了這個榜單、進了那個排名,但其實調用量是很小的。文心大模型一家的調用量比這200多家大模型的調用量加起來還要多。

剛才說了兩個「冷」思考。作為一個在AI領域工作超過十年的從業者,我對大模型和AI原生應用的巨大價值和影響力,都深信不疑。所以我想說一說,AI原生時代的三個「熱」驅動。

第一,強大的基礎模型,會驅動AI原生應用爆發。中國有領先的基礎大模型,這是AI原生應用發展的堅實基礎,是底層的能力。3 月16日,百度率先發布了基於文心大模型3.0的文心一言產品,之後快速疊代。

上個月,我們又發布了文心4.0版本,在網站和APP上叫做文心一言專業版。4.0是迄今為止最強大的文心大模型,在理解、生成、邏輯和記憶各方面能力,都有了明顯提升。比如,在生成能力上,文心一言除了生成文字內容,還包括圖片、視頻、數字人等等多模態內容,可實現的創作體裁超過200種,你讓他寫一首李白風格的詩,寫出來就像李白,你讓他寫一首杜甫風格的詩,寫出來就像杜甫,涵蓋了幾乎所有的寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍的提升。而AI原生應用,就是基於大模型智能湧現後產生的理解、生成、邏輯和記憶能力而開發出來的應用。這些能力是過去的時代所不具備的,因而才能打開無限的創新空間。作為基礎底座,大模型可以支撐無數AI原生應用的開發。但是,直到今天,無論是中國也好,美國也好,我認為最好的AI原生應用還有沒出現。就像移動時代誕生了像微信、抖音、Uber這樣的「mobile-native」的應用一樣,AI原生時代一定會有優秀的AI原生應用是基於這些大模型開發出來的。而深圳有著豐富的場景和深厚的產業基礎,在AI原生時代深圳一定會再次成為創新創業的沃土。

第二,擁抱AI時代,需要由CEO、一把手來驅動。今天,大模型和生成式人工智慧所帶來的機遇是堪比工業革命的大機遇,這一點已經成為行業的共識,每一家企業、每一個組織,都在思考如何擁抱這個新時代,如何利用這一新技術來提升自己的競爭力。如同任何新鮮事物都有一個接受過程一樣,最早接受的是C端用戶和創業企業,之後是中小企業,最後接受的才是大企業,因為大企業天然保守,對新生事物不敏感,不願意冒風險。我見到很多企業,上上下下都非常重視這次機會,但是對問題的本質理解不深,CEO把這個任務交給IT負責人,IT負責人和工程師天天被那些所謂的「震撼發布」、「史詩級的更新」、「iPhone時刻」、「炸裂」這些說法所忽悠,都想去自己搞個基礎模型,或者按照網上傳播的評測方法來挑選一款評分高的大模型,大家就以為這就是擁抱AI時代了,殊不知大模型本身不僅不產生任何價值,還造成了對公司資源和社會資源的巨大浪費。

擁抱AI時代,為什麼需要一把手來驅動?因為只有CEO才會關心新技術對自己業務的關鍵指標是不是產生了正面作用。比如對於網際網路企業來說,大模型有沒有對你的DAU、時長、用戶留存這些指標產生正面的影響。其實對於所有企業來說,更簡單、更直接的是對你的收入和利潤增長有沒有產生影響,對你成本的降低有沒有產生影響。這才是問題的本質。小公司一把手什麼都管,就更容易開發出適合自己的原生應用,大公司分工明確,CEO如果不主動引領這個變革,就很容易被帶偏。

在百度我們堅決地對旗下各個產品線進行了AI原生的重構,給大家帶來了前所未有的智能體驗。比如,新搜索具有極致滿足、推薦激發和多輪交互的特點,當用戶提出一個問題時,新搜索不再是提供一堆連結,而是通過對內容的理解,生成文字、圖片、動態圖表等多模態的答案,讓用戶一步獲得滿足。再比如,以前準備一場演講,要耗費好幾天時間製作講稿和PPT,剛剛也講了,寫文章3000字可能一分鐘就完成了。現在,百度文庫可以在1分鐘內生成一個20幾頁的PPT,包括圖表生成,格式美化等,成本幾乎是零。新文庫也實現了從內容工具到生產力工具的轉變。因為有了這樣的原生化改造,文庫的付費率有了明顯的提升,這就是我說的AI對業務關鍵指標的促進作用。更大想像空間在於,大模型催生出過去從來沒有過的AI原生應用。百度也在孵化全新的AI原生應用。比如智能代碼助手Comate。今天百度有上萬個工程師,百度現在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協同,幫助我們大幅度提升研發效率。而AI原生應用帶來的改變,我認為,才剛剛開始。

第三,繁榮的AI原生應用生態,會驅動經濟增長。好的應用會帶動市場,倒逼市場變化。類比來看,中國新能源車在全球的市場份額達到65%。這主要是因為國家政策的扶持拉動了應用端,拉動了市場的需求,比如對於新能源車的車輛購置稅減免,不限號不限行等等這些手段,都有效拉動了新能源汽車產業的快速增長。AI產業也是需求驅動,所以應該是在需求側、應用層發力,就像補貼新能源汽車用戶一樣,鼓勵企業調用大模型來開發人工智慧原生應用,用市場手段推動產業發展。

我之前說,AI時代的技術棧分為四層,也就是晶片層、框架層、模型層和應用層。無論是晶片也好、框架也好、模型也好,都是需要AI應用來驅動的。只有通過更多的場景落地應用,才可以形成更大的數據飛輪,才能夠讓晶片做到夠用、好用。全球來看,AI原生應用正在成為主要的趨勢。微軟其實並沒有自己的基礎大模型,它是跟OpenAI合作的,但是它有最成功的AI原生應用,大家知道就是Office365的Copilot,30美金一個月。百度從做AI的第一天起,就非常重視生態的建設,目前已經擁有了超過800萬AI開發者。

不久前,百度上線了大模型插件平台,無論是個人還是企業,都可以通過這個平台,把自己的數據和能力,快速地變成插件。比如法律助手、簡歷助手、裝修助手、旅遊、辦公等等助手類插件。插件是一類特殊的AI原生應用,不僅容易上手,還能讓企業在私有數據沒有泄露風險的情況下,更便捷地用到大模型的能力,大大降低了開發者門檻,有利於構建繁榮的AI原生應用生態。
API是AI原生應用調用大模型的主要方式。在製造、能源、電力、化工、交通等實體產業,都將成為大模型和AI原生應用極為重要的落腳點,也將成為推動數實融合的主陣地。今天,在百度智能雲千帆大模型平台上,已經有超過17000家企業在這裡開發產業模型和解決方案,除了剛才提到的行業,也包括教育、電商、短視頻、遊戲等多個行業。未來,每一家企業跟自己客戶打交道的方式,都會轉變為AI原生應用,這將大幅度提升企業的競爭力。無論是企業競爭力的提升,還是個人工作效率的提升,都是經濟增長的驅動力。AI應用生態的繁榮就會成就經濟繁榮。

「紙上得來終覺淺,絕知此事要躬行」。我講了這麼多大模型和AI原生應用,就是希望每個人都行動起來,去使用它、了解它、體驗它、投入到AI原生應用的創新中,共同創造一個百花齊放、無限可能的AI原生時代。
謝謝大家!
文章來源: https://twgreatdaily.com/zh-my/d037147f0c41de7ce2b9d2c98ff3132f.html