來源 | 劉志剛專欄
文:網際網路江湖
大模型似乎沒能帶來更多的估值上的想像力。
今年3月14日,OpenAI發布GPT-4,大模型理解能力、可靠性有了進一步提升。兩天後,百度聞心一言正式發布,直到8月底,文一言才正式向大眾開放服務。
百度之外,科大訊飛5月6日發布星火大模型,9月5日,面向全民開放。商湯方面。4月份,發布日日新大模型體系,8月底,日日新大模型獲批。騰訊渾元、阿里通以千問,也紛紛跑步入場。
如今,首個國產大模型亮相半年過去了,各家資本市場表現如何?
百度3月14日港收盤股價129港元,9月18日收盤132.2港元。
商湯4月11日收盤3.33港元,9月18日收盤股價1.46港元。
科大訊飛5月8日收盤63.76元,9月18日收盤48.38元。
……
對於大模型概念,確實喧囂過,但是目前來看,繁華褪盡,市場似乎並不買帳。
8月15日,《生成式人工智慧服務管理辦法(徵求意見稿)》開始施行,AIGC產品合規之路明朗,於是,國產大模型密集發布,百度、訊飛、商湯等一眾大模型玩家開始搶奪ToC市場。
那麼人們手機中的「第一個大模型應用」能不能成為AI生成的「第一入口」?值得深究。
大模型「內卷」到前台,AI落地半場開香檳?
可以確定的一點是,走到前台,市場期待的是應用意義上的「產品化」。大模型能夠解決什麼樣的客觀問題,能解決問題的應用,才是有商業價值的應用。
大模型最直接的應用,是語音助手。
大模型強化一波語音交互應用,可能會給某些硬體行業帶來「第二春」,比如智能音箱有了新賣點,小度智能音箱可能會找到新的增長點。
語音助手領域的應用,最順利的可能還是汽車。
文心一言收穫了吉利、長城、紅旗、東風日產、嵐圖,ChatGPT接入奔馳,星火大模型接入廣汽,華為盤古接入賽力斯……這也是大模型最容易商業化的場景之一。畢竟,對於車載場景來說,語音助手應用是剛需,也是比較成熟的B端落地領域。
大模型向C端滲透過程中,雖然已經邁出重要的一步,但距離真正的大規模應用,恐怕還有距離。
如今的歡呼,倒像是半場開香檳,現實是大模型還遠未到成熟的階段。
人們需要接受的是,大模型看起來很強,但你真正用它去解決問題的時候,會發現真正沒有那麼的強。
對於一些最實際的,哪怕是簡單的需求,大模型都還沒有辦法滿足,背後有數據的問題,生態的問題,但歸根到底,還是只能有限地解決實際需求。
首先是數據新鮮度的問題。在實際的使用過程中,我們發現,同樣的問題,大模型給出的答案甚至不如搜索。
這是百度搜索給出的答案:
這是文心一言給出的答案:
從時效性以及準確度來說,反而是搜索更符合常理,也更符合人們對於真實場景的認知。
「凡是要跟語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。」王海峰曾對外界表示。
的確,大模型的應用場景很大,但現實是,真實的需求場景中,當下的大模型產品似乎還有不少能夠提升的空間。
相比文心一言,訊飛星火大模型給出了答案,但時間是2022年度上市公司排名,並不是當下最新的數據,也同樣是數據新鮮度的問題。
數據新鮮度的問題,本質上是數據生態的孤島問題。
對於某些垂直領域的提問,大模型給出的答案無論是從專業度上還是從時效性上都似乎不能滿足人們的需要。這可能是因為,無論是文一言,或是星火大模型,大家對垂直領域的數據訓練其實還不夠。
比如,對於財經信息方面,大模型給出結果可能還不如財經信息網站上搜到的結果準確,可用,當然這裡面可能會涉及版權的問題,但本質上其實就是數據生態的孤島的問題。
拿ChatGPT來說, OpenAI、Google 及其支持的 Anthropic 多年來一直在使用其他網站或公司的在線內容來訓練他們的生成式 AI 模型,雖然數據的量有保證了,但也有潛在的法律問題。
當大模型走向前台,這種數據孤島問題會更加突出。因為用戶不在乎你怎麼獲取數據,用戶只在乎,你的工具好不好用。
天眼查APP搜索大模型,相關結果有100多家,雖然其中也有不少大模型都發布了各自的APP,但目前來看真正好用的其實不多,大量用戶湧入還是因為有新鮮感,大模型在C端應用方面做的工作其實也還很有限。
比如,用戶想把一張2K解析度的圖片清晰度生成為4K,其實技術上並不複雜,但大模型卻給不出結果,對於普通用戶來說。用過一次不好用,恐怕就很難再堅持用下去了。
就像曾經的智能音箱、語音助手, 其實大家手機里都有AI語音助手,為什麼使用的頻率並不高?其實還是因為不好用。所以,對於百度、訊飛甚至商湯來說,挑戰不在於能不能把C端的應用做出來,而在於做的夠不夠好。
百度產品上比較成功的就是百度搜索,智能搜索的確很強大,但大模型產品能不能做到像搜索一樣的水平,需要打一個問號。
對訊飛而言,一些硬體產品做得不錯,但考驗在於軟體產品的定義能力;對於商湯來說,ToB的應用做了不少,但ToC顯然還是需要更多的經驗。
目前來看,國產ToC的大模型差異化並不大,大多是內容創作、AI繪畫、翻譯、AI辦公等場景應用,也能幫助人解決一些實際的問題,比如生成會議大綱,給PPT寫提綱、寫研報、寫工作日報。
但接下來,能不能ToC的大模型真正做成「爆款」,做出差異化,恐怕考驗的就不僅是AI技術了。
大模型產品化的窗口期不多了
大模型落地B端的一個最大阻礙是不能理解業務。
舉個例子,金融領域是強數據導向的領域,人們需要在數據的基礎上去做決策,如果把大量的數據以及金融理論用來訓練AI,那麼面對瞬息萬變的市場,大模型的決策有多少的準確度?用戶敢不敢用?
之前馬斯克曾表示,FSD V12幾乎完全是神經網絡,構築了一套端到端自動駕駛技術。也就是說,端到端的信息輸入輸出過程是一個「黑箱」。
你不知道AI是怎麼具體做決策的,但是你最終會得到一個可用的結果。
大多數時候,這樣的應用是沒有問題的,比如出行領域,人們需要的是安全到達目的地,即便是決策黑箱的問題存在,但並不影響實際應用。
決策黑箱最大的問題是決策信任的問題,雲到端的大模型也有類似的問題。
比如,你問大模型一個問題,AI問題給出的答案夠不夠真實可信?這個問題還需要花大力氣解決。簡單點說,要去教大模型什麼樣的結果是正確的,是易用的,這就需要不斷把模型的輸出結果跟現實去「對齊」。
這也是大模型落地C端的一個重要挑戰。
輸出結果的真實性,有效性能不能得到最基本的保證?這是大模型應用能否真正迎來大爆發需要解決的前置問題。
過去ChatGPT花了大量的成本去做這個件事,文心一言,星火大模以及商湯的日日新大模型顯然也需要經歷這個過程。
目前階段,通用大模型的應用熱更像是人們的一場自嗨,公司發布大模型往往會伴隨著一系列的公關活動,但除此之外,能給B端公司帶來怎樣的效益增量,仍然沒有一個較為清晰的方案,只是空有一句「AI智能化大模型降本提效」的公關話術。
這種品宣做「巨人」業務上做「矮子」的現狀,無非是想打上大模型的標籤,好讓二級市場高看自己一眼。不過,市場已經在用腳投票,最終還是會看實際的商業化表現。
網際網路江湖認為,如果說過去大模型的價值,在於對科技企業的「標籤化」想要在二級市場謀個好價格,那麼接下來能不能活下去,就在於能否完成「產品化」,真正靠應用能力「打天下」。
矽谷教父彼得·蒂爾曾說,喜歡給自己貼標籤賽道標籤的公司幾乎都是不可投資的那一檔,他曾經這樣表達這個觀點:「我對一切主題熱點投資都抱有懷疑態度,一般來說這樣的投資毫無區分度。大家很喜歡把一大堆完全不同的東西放進一個熱點中,標籤是,雲計算,大數據,人工智慧,醫療SaaS等等,但是實際上是底層卻完全沒有區分度的公司。」
大模型也是如此。
事實上,AI賽道的泡沫被擠出之後,市場清楚地知道,大模型真正的價值還是在於產品化。而產品化的關鍵,不僅是技術的比拼,也是產品經理能力的比拼。
在這一點上,上個時代的「王者」們(比如阿里、騰訊)可能比百度們更有經驗和話語權。
一方面,產品化的關鍵在於能夠精準定義用戶需求。
比如,大家目前都比較青睞於去做AI原生應用,但AI原生應用如何能夠更好地去滿足用戶的實際需求,靠的還是產品定義。
另一方面,產品化之後,大模型才有差異化,而商業化其實是產品化自然而然的結果。
在體驗過各家發布的大模型產品後,有這麼一種強烈的感覺,雖然叫不同的名字,但大家的產品並沒有太多差異,能夠完成的任務類型都差不多。
比如,剛開始用文心一言,你會覺得確實很厲害,什麼問題都能給出答案,一旦涉及稍微深度點的內容,就會發現他給出的答案太公式化,而且大多數時候像是空話、套話。
不只是文心一言、訊飛的星火大模型、商湯的商量SenseChat,大家表現其實都差不太多。
本質上,這是因為大模型本質上不是強人工智慧,還是需要靠數據去不斷訓練,並不是真正意義上根據信息去做判斷。所以差異化的關鍵,還是在於最終的應用產品。
網際網路江湖認為,大模型產品不僅需要靠場景「吸引住」用戶,更需要用體驗來留住用戶,甚至激發用戶的付費意願。
目前來看,通過審批的這些大模型應用產品集中了覆蓋用戶日常大部分場景的工具,從工作到文娛各個方向的應用都已經開始出現,想要成為新的入口。
問題在於,大多數用戶還是處於嘗鮮的狀態,用來解決實際問題的用戶可能並不多。原因可能還是在產品應用上。
就拿檢查錯別字這個簡單的需求來說,從親身的使用體驗來講,目前市面上的主流的大模型應用做得都不怎麼好,反倒是一些專門做文章校對的垂直平台,用戶體驗要好得多。作為一個文字工作者來說,對於這樣的產品其實有很強的付費意願。
不僅是文字工作,代碼生成、圖片生成也是如此,目前的大模型初步解決了「能不能用」的問題,但真正的關鍵是要解決「好不好用」的問題。
所以,這些細分應用上的產品能力,可能會是用戶能不能真正把大模型用起來的關鍵。
用戶大量用起來之後,用來訓練AI的數據足夠多,AI大模型的能力便能夠突飛猛進。ChatGPT真正的起飛,也是在大量用戶湧入之後。
可以預見的是,大模型開放之後,AI原生應用會出現一波爆發,而在應用爆發之後,能夠有多少用戶留下來,可能是「文心一言」們需要深入思考的問題。
「想在『百模大戰』之中笑到最後,還是得看究竟會有多少用戶願意花真金白銀買單。」行業觀察人士劉宇表示。
ChatGPT用戶過億後,開始對C端收取訂閱費用,每月20美元,而且針對B端專門推出了企業版。這說明OpenAI的思路在轉變,從做技術轉變為做產品。當然,前提是ChatGPT已經證明了能夠去解決更多的實際問題。
國產大模型,達到GPT4的水平還需要一年,也就是說,真正留給大模型玩家去定義、完善大模型AI原生應用的窗口期還有一年。接下來,如何去做好這方面的工作,進一步提升大模型的數據時效問題,可能才是關鍵。
寫在最後:
喬布斯和iPhone的成功證明,真正出彩的不是永遠都不是技術,而是產品。
如何做好應用產品,可能是大模型玩家們需要更明確的目標。可以預見的是,接下來C端應用的確都需要用大模型重做一遍,這對百度、訊飛、商湯來說,無疑是一次機遇。
AI行業從來不缺等風者,但真正缺的是造風者,接下來到了真刀真槍的戰場,誰能一呼百應打開大模型應用的金礦,我們且行且看。