大模型的故事已經不好講了

2023-09-19     AI狐頭條

原標題:大模型的故事已經不好講了

原創 | 首席創鑒局
FBIBIJI

大模型的「神話之戰」

增長推力漸弱的當下,大模型是為數不多的亮點,過去半年的狂熱炒作後,一些人擔心被 AI 替代、顛覆,另一些人決心在被替代前跳入潮流,還有一些人認為沒什麼用。這種時候往往也是資本願意投資的階段,分歧才能產生更大的收益。

在增長越來越稀缺、確定性越來越難得的此刻,AI 大模型許諾了一個少有的新可能。根據賽迪顧問的統計,僅今年1~7月,中國就有64個大模型問世,而截至7月末,國產大模型累計發布數量達到了130個。

今年以來,百度、阿里、華為相繼發布了自己的大模型產品。人們無比相信那個比「移動網際網路大10倍」的平台級大機會,在GPT-4推出不過20餘天時,已有超10餘家創業公司坐上大模型牌桌,總融資額數十億美金。此後包括大廠在內的20多家公司公布了自研AI大模型,「就連上古神仙的名字都不夠用了,諸如盤古、崑崙、混元、太初等等」。

為了開發頂尖的大模型,需要高度專業化的人才團隊來進行開發、調試和維護。這些團隊需要具備深厚的技術背景和領域知識,以確保模型能夠在特定領域內取得良好的效果。

企業不得不吸納大量的人工智慧領域人才,從而掀起了一場激烈的「搶人大戰」。如今,大模型的相關崗位,如機器學習工程師、數據科學家、領域專家等,其薪酬水平也急轉直上百萬年薪只是起步。本來國內大模型相關人才就頗為稀缺,在風口之上翻倍只是小意思,網傳張一鳴為了挖OpenAI的大牛開出一億美元的薪酬,急用人的時候甚至有一些產品崗也轉發做大模型。

看上去轟轟烈烈機會就在眼前,但這個機會能夠有資格抓住的確不多。

前不久,在Waves大會的一場圓桌論壇上,中國人民大學高瓴人工智慧學院盧志武教授,就質疑了所謂「國產大模型的春天」。在他看來,這不過是很多公司在「微調國外底座模型」的假象。

這波大模型浪潮里,玩家很多,但很多並不具備從底層開始搭建大模型的能力。因為它們面臨著缺少算法積累、計算資源,訓練數據差,配置成本高以及缺乏對產業的理解和智能化經驗等各個問題。這些需要深厚的積累,很難一蹴而就。

玩家很多這不假但同質化嚴重,不光沒啥價值還會造成社會資源的浪費。於是李彥宏表示,模型本身是不直接產生價值的,基於基礎大模型開發出來的應用才是模型存在的意義,對於創業者來說,「卷大模型沒有意義,卷應用機會更大」。他分析說,移動網際網路時代作業系統只有安卓和iOS,但特別成功的應用卻很多,只有在大模型基礎上產生足夠多的AI原生應用,才是一個健康的生態環境。

李老闆說的也是大實話,但是一個充分競爭的市場誰會自願退出呢?做應用層始終還是要受制於平台的,更何況應用層目前並沒有什麼亮眼的應用。眼下勸大家進軍應用層缺少商業動力,又面臨大公司幾乎全覆蓋的應用降維打擊,大部分人還是看得明白的。

沒人能「阻止」英偉達

制約 AI 人工智慧發展最大的桎梏是什麼?如果在幾年前,這個答案可能五花八門。但在大模型盛行的當下,這個問題只有一個答案——算力不夠!

如果說數據是大模型世界的生產原料,那麼算力則是大模型的生產力。OpenAI此前公布過一組數據,目前大模型訓練所需算力的增速保持在3-4個月/倍速度增長,遠超摩爾定律18-24個月/倍。

算力是支撐大模型運轉起來的原動力。強大的算力,意味著更快的數據處理速度、更強的大模型服務能力。

越來越多的人工智慧初創公司和服務導致對 A100 和 H100 等高端 GPU的高需求,從而壓垮了 Nvidia 及其製造合作夥伴台積電,兩者都在努力滿足供應。Reddit 等在線論壇上充斥著對 GPU 可用性的不滿,這呼應了整個技術社區的情緒。情況變得如此可怕,AWS 和 Azure 都別無選擇,只能實施配額系統。

這個瓶頸不僅提高了初創企業的成本,也擠壓了初創企業的發展空間。對於 OpenAI 這樣的科技巨頭來說,這是一個絆腳石。最近在倫敦舉行的一次非正式會議上,OpenAI執行長 Sam Altman坦誠承認,計算機晶片短缺正在阻礙 ChatGPT 的進步。據報道,Altman 感嘆計算能力的缺乏導致 API 可用性低於標準,並阻礙 OpenAI 為 ChatGPT 推出更大的「上下文窗口」。

所以才會有國內大廠集中採購50億美元的A100晶片,沒有算力維持,大模型都無從談起更別說產品疊代了。但這50億訂單交付也不是今年就能給,其中,只有10億美元的貨能趕在年內交付,另外八成訂單也要等到2024年才能陸續交付。

早在第一財季電話會上,黃仁勛就感嘆,數據中心業務的「訂單多到不可思議」,英偉達的核心要務是開發並保證生產儘可能多的符合市場需求的先進晶片。

但真的來到第二財季,外部需求的爆發仍然超出了黃仁勛的預期。據CoreWeave聯合創始人兼CTOBrian Venturo表示,今年一季度,獲取英偉達GPU還很容易,但從4月份開始,市場忽然變得異常緊張,即使現在立即訂購,交貨時間也要等到2024年Q1甚至Q2。

一般來講生意好做的時候就是企業大幅擴張的時候,這個時期不太會對費用比控制太嚴格,但英偉達偏偏在「降本增效」上做到了極致,震驚了華爾街。在營收大幅增長的同時,英偉達對於成本費用的控制卻異常的嚴苛,該季度研發費用為20.4億美元,同比增長11.8%,銷售和其他費用6.22億美元,同比增長5.1%,相比營收超過100%的增長,成本的控制可謂做到了極致。

在發布財報的同時,英偉達同時宣布了在兩天前的董事會上,公司剛剛表決通過了額外250億美元的股票回購計劃,在第二季度中,英偉達動用了32.8億美元回購了750萬股。「課代表」般的公司如今可不多了。

今年以來,隨著AI熱潮的推動,英偉達的市值已經成功站上1萬億美元,從各種估值方式來看,英偉達的估值無論和自身歷史縱向比較,還是與行業整體橫向比較,都出於較高的估值區間。但英偉達的管理層對估值還是有所不滿,認為英偉達仍然被華爾街低估。

這麼想也不是不行,AI最終市場會有多大沒有人能給出準確答案,英偉達仍然在研發更先進的產品,還將帶給市場怎麼樣的震驚還未可知。AI景氣度還在,英偉達就不會到頂。

「商業化難題」澆滅資本熱情

就算是算力無限制供應,十倍網際網路規模的市場就真的會到來嗎?答案是不一定,至少目前很困難。

華為輪值董事長鬍厚崑在 WAIC 開幕式上說,「大模型的目標是應該服務於不同行業的不同應用……才能發揮更大價值。」 騰訊集團高級執行副總裁湯道生在後續發言中也表達了類似觀點:「行業大模型是企業擁抱大模型的更優選項。」

一位 AI 獨角獸公司首席科學家說,他們從 2018 年就開始研究大語言模型,前兩年也做出來了寫文章的應用,因為沒客戶買單,公司就一直沒有加大投入。ChatGPT 火了後,他們也發布了自研大模型,但暫時不打算訓練規模更大的模型,因為客戶覺得性價比有限,畢竟訓練一個參數千億的模型要花千萬元人民幣。

據IT桔子等數據顯示,2014年至2018年,中國人工智慧領域的IPO退出平均回報僅為1.83倍,2018年全年有將近90%的人工智慧公司處於虧損狀態。2019年,「投資人逃離人工智慧」刷屏,經過幾年凋敝,除聯想之星、創新工場等機構外,國內真正在持續關注AI的投資人寥寥,大基金也幾乎沒有專人在長期覆蓋。

所以新的故事是「大模型如何賦能千行百業」。

一位投資人曾在社交媒體上表示,旨在滿足數據採集、標註、模型調度等MLOps需求的公司,會面臨「中間商難賺差價」的夾心尷尬——前有免費開源工具,後有雲廠商打包工具和服務。同時,「國內客戶付費習慣仍然沒有很好地養成,尤其在企業開支緊縮的經濟恢復期」。

就算是老老實實很早切入應用層的明星公司,如今也迅速衰落。這在海外市場已有表征。例如去年尚風頭無兩的美國獨角獸Grammarly和Jasper,在GPT4發布後,現有功能即被代替,價值迅速被攤薄,朱嘯虎公開稱「這兩家公司或將很快歸零,根本守不住」。

那麼大廠自己做的應用產品怎麼樣呢?那就不得不提到妙鴨相機這一款迅速躥紅的AI應用,七麥數據顯示,於IOS端,妙鴨相機APP在7月28日上線以來,短時間內下載排名急速爬升。8月8日妙鴨相機APP開始霸榜「社交」,12日拿下總榜第一。

不過這波高峰,也只維持了一周時間。8月16日之後,妙鴨相機後勁乏力,排名一路下滑。截止目前,「社交」榜單排名15名左右,「應用」榜單則在200名開外。妙鴨相機的問題不只在於熱度下滑,在付費內容和差異化上並不出眾才是最大的問題。

事實上,曇花一現的AI生成圖像現象級產品也並不罕見,如Sensor Tower《2023年AI應用市場洞察》數據顯示,隨著DALL-E和Stable Diffusion模型的疊代與成熟,Al+圖像應用市場繁榮發展,2023年上半年相關應用超過150餘款,下載量突破1億次。

其中,「Lensa AI」自2022年11月下旬一經推出,應用下載量隨即迅速攀升,12月下載量突破1700萬次。僅過了一個多月,「Lensa AI」的下載量就直線下滑,下載量跌破了200萬。

手握國內首個基礎大模型的百度,也深知這一點。其資深副總裁、移動生態事業群組總經理何俊傑近日也也認為,「燒錢做大模型」這事該往前一步了,下一程是應用層之戰。「應該燒腦去做AI應用」,在接受第一財經《總編時刻》訪談時,何俊傑透露百度內部正在充分「賽馬」,各個業務線都有階段性的「軍令狀」,看哪條線能率先跑出黑馬。

寫在最後

2017年,扎克伯格回到哈佛,進行畢業典禮演講。他說:「讓我告訴你們一個秘密,『沒有人一開始就知道(Facebook)該怎麼做,想法不會在最初就完全成型。只有當你開始行動時,事情的脈絡才會逐漸清晰,你只需要開始行動。如果從一開始我就要完全弄明白『如何連接人』,我永遠做不出Facebook。」

當然有勇氣投身大模型還遠遠不夠,需要產學研的積累打磨,深度學習從學術走向產業,在視覺、語音等方面大放異彩用了十幾年,在這個過程中有無數的公司倒下,行業經歷著外人難以想像的內卷和疊代。大模型的情況更為複雜,但只要路徑正確剩下的無非是試錯疊代,儘量不要倒在黎明前。

不要責怪投資人說投100家AIGC公司,不如直接投英偉達和微軟來得實在,怪他們淺薄勢利眼。正如李彥宏所說AI原生應用要能解決過去解決不了、解決不好的問題,應用才是大模型存在的意義。還沒發揮價值就上來談錢景恐怕也不合適。

參考資料:

妙鴨相機涼了?來源:AI藍媒匯

我們需要什麼樣的大模型 來源:最話FunTalk

如果大模型是答案能解決什麼問題 來源:晚點LatePost

進退兩難的中國大模型 來源:暗涌Waves

文章來源: https://twgreatdaily.com/zh-sg/4454cb531a57fa0e1db302c4cc9e3daf.html