「如果大模型是答案,能解決的問題是什麼?」

2023-07-11     AI狐頭條

原標題:「如果大模型是答案,能解決的問題是什麼?」

原創 | 晚點LatePost
postlate

世界人工智慧大會上,熱鬧的、尋覓的、困惑的。

文丨賀乾明 邱豪

編輯丨程曼祺

華為、騰訊和阿里來了,英特爾、高通也來了;特斯拉來了,帶著它的 1:1 人形機器人模型;英偉達沒亮相,但它也出現在各個地方,在中國競爭者的演講里,在潛在客戶的詢問里。

這算一個 AI 大會的常規配置,但 7 月 6 日到 7 月 8 日來上海參加第六屆世界人工智慧大會(WAIC)的近 18 萬人里,有珠寶檢測機構、公安局的團隊,還有核電公司和醫院的員工來找機會,甚至有人組織了一些小學生來參觀,不止一個團。

在增長越來越稀缺、確定性越來越難得的此刻,AI 大模型許諾了一個少有的新可能。各行各業的人士都帶著他們的問題和迷惑,聚集到上海浦東,當他們離去時,一些問題並未得到解答。

「如果大模型是答案,那問題是什麼?」 這是一位尋找創業機會的參展者來了之後的疑問。他之前在位元組跳動工作,現在籌備大模型創業,希望能在這場大會展出的 30 多個大模型上找一些靈感。

逛了一上午後之後,他想到了自己經歷的上一輪人工智慧熱。AlphaGo 在 2017 年擊敗柯潔,第二年,WAIC 第一次在上海舉辦。當時會場裡展示最多的各種巨型螢幕,呈現攝像頭監控下的車流或街區。AI 公司給這類系統取名 「智慧城市」。

自那時起,人工智慧的發展就不完全由市場驅動,而是混合著政府的引導與期待。這次的大模型熱潮也不例外,開幕式和一些規模較大的論壇都有官員身影,表態要為推動人工智慧產業發展提供政策助力。

對比兩次浪潮,這位創業者有了更多疑問:「CV(計算機視覺)有安防,大模型會有什麼呢?」 他不認為會有多少公司願意每年花上百萬、千萬元買一個並不完美的聊天機器人幫自己回答客服問題或做文檔提煉和摘要。

他的疑問展現了大模型熱潮的另一面:大模型像是雷神之錘,但如果沒有適合它的釘子,就難以發揮被期許的巨大商業價值。

各行各業的人都來了,看大模型能怎麼幫自己

7 月 6 日上午 9 點後,還沒有等到 WAIC 開放展館,人潮就已占領了上海世博中心和世博展覽館附近的大小咖啡館,晚到的人只能擠在附近的麵館里討論 AI 和大模型,以往只有到中午,這裡生意才會好起來。

「黃牛」 也在入口附近就位,低聲詢問來往的人 「預約了沒」。按官方要求,不提前預約就無法入場。黃牛們說自己能搞定入場問題,「得花 400 元」。

看展的不只 AI 從業者,展覽館中隨處可見工作人員舉著牌子帶隊參觀,牌子上寫著 「珠寶國檢採購團」「上海市公安局虹口分局」「長城汽車採購團」 等。

在華為辦的大模型論壇中,晚到的媒體記者發現預留的媒體座位已被搶占,並不是媒體同行太熱情,而是到場的人實在太多了。兩位中國核電集團的員工也坐在這裡,過去幾年他們把人工智慧技術用到了維護、檢修設備的環節中,現在他們關心大模型:「看能不能找到一些結合點」。

增長推力漸弱的當下,大模型是為數不多的亮點,過去半年的狂熱炒作後,一些人擔心被 AI 替代、顛覆,另一些人決心在被替代前跳入潮流。不過這種全行業的熱情暫時缺乏認知基礎,多數人還不理解大模型到底是什麼、能做什麼。

「大模型就是大算力、占用更大的存儲空間嗎?」 一位在醫院工作的人士逛了一圈騰訊展區後問附近的工作人員。她知道人工智慧的視覺能力,已經能幫醫生看 CT 圖像了,但不太了解大模型能幫助醫院做什麼,渴望知道更多。

太快形成的太大期待,往往帶來了等量的失望。展會現場,很多圍在各家展台電腦前體驗大模型:「寫一個創意咖啡的品牌故事」「寫一個小學生的出遊計劃」。一位參展者瞥見了阿里通義千問展示的 「寫情書」 功能,立即吐槽說:「這什麼玩意?能幫我干點實際的事嗎?」

參觀者圍在 WPS 展台上體驗大模型應用,圖片來自 WPS。

沒幾家公司談論再造一個 OpenAI 了

送走幾位測試大模型失敗的人後,一位網際網路公司的參展人員嘆了口氣:「沒辦法,技術現在還是不太行。」

剛走的那位拿著一道數學題測試大模型,讓它算出 「每個數字都不相同的五位數有多少個」。看到結果後,對方揚了揚手機說,「還是 ChatGPT 靠譜些」。

參會前,展台的這位工作人員看到同行們在幾個月里做出了幾十個大模型,就已經有了感覺:做出一個大模型似乎沒那麼有技術壁壘,但要做好很難。WAIC 期間,他抽空體驗了同行的大模型後,這一感覺更強烈了:「效果相差不大,都離 ChatGPT 有差距。」

就在半年前,還有不少公司稱要做中國的 OpenAI。但這次大會的展台和論壇發言中,已經沒多少人提這個目標了。

新的敘事是:行業大模型與 「大模型賦能千行百業」。

華為展出礦山大模型。

華為輪值董事長鬍厚崑在 WAIC 開幕式上說,「大模型的目標是應該服務於不同行業的不同應用……才能發揮更大價值。」 騰訊集團高級執行副總裁湯道生在後續發言中也表達了類似觀點:「行業大模型是企業擁抱大模型的更優選項。」

騰訊和華為都沒有在展台上擺電腦讓人體驗大模型。緊挨著騰訊展台的阿里巴巴雖然放了十多台電腦在展區中心供人體驗,但阿里雲的 CTO 周靖人也開始強調做生態,而不是自研的大模型。他在 WAIC 論壇中說:「阿里雲將把促進中國大模型生態繁榮作為首要目標……讓各行各業享受大模型技術紅利。」

風向轉變並不是大公司放棄研發更大的模型,而是它們希望先找到一個可行的方式,讓這個不算成熟的新技術先發揮價值,創造收入。他們的邏輯是:

  • 通用大模型(類似 ChatGPT 背後的大模型)用起來貴,模型參數普遍千億起,實際運作起來要花費大量資源,ChatGPT 和 New Bing 一度抽乾了微軟積累的數十萬張 GPU 算力,一般公司根本難以承受。
  • 通用大模型在特定場景效果不好。通用大模型一般基於公開文獻與網絡信息訓練,專業知識與行業數據積累不足,導致回答的精準度不夠,「企業一旦向公眾提供了錯誤信息,可能引起嚴重後果。」 湯道生說。
  • 行業大模型參數更小、部署成本更低,針對性訓練後,回答特定問題時效果更好。而且大公司為各行業公司提供訓練或部署大模型服務的雲端 MaaS(模型即服務),也能幫助它們先賣一些雲服務。

體量小些的公司更現實。一位 AI 獨角獸公司首席科學家說,他們從 2018 年就開始研究大語言模型,前兩年也做出來了寫文章的應用,因為沒客戶買單,公司就一直沒有加大投入。ChatGPT 火了後,他們也發布了自研大模型,但暫時不打算訓練規模更大的模型,因為客戶覺得性價比有限,畢竟訓練一個參數千億的模型要花千萬元人民幣。

不過即使是理論上更便宜,離落地更近的行業大模型,真要用起來價格依然不菲。《晚點 LatePost》了解到,中國一家備受關注的大模型創業公司的參數 60 億的大模型,售價為百萬元,千億參數的售價每年上千萬元——大多數成本都是晶片算力。

大模型能做什麼還不確定,賣裝備的很活躍

大模型具體能做什麼,能做到什麼程度還在探索中,但大部分人的共識是,淘金前先得準備好裝備。

今年 WAIC 會場的一個明顯變化是國內 AI 晶片公司的展台更大、更接近 C 位,也吸引了更多人關註:燧原科技、天數智芯、瀚博半導體、沐曦集成電路、登臨科技等晶片公司的展位貼近騰訊、百度,展台面積也和這些大公司相近。占據全場最大展台的華為,單獨拆出了一個昇騰生態展台,昇騰是包含 AI 晶片、MindSpore AI 訓練框架和軟體服務的華為 AI 計算全套產品。

每家晶片公司的展台都人頭攢動,前來諮詢的客戶想知道這些晶片的性能怎樣、具體可以做什麼。最常見的一個問題是:可以替代 A100 嗎?

中國 AI 晶片公司展台比往年更大。

兩年多前由英偉達推出的 A100 GPU,現在幾乎是訓練大模型的標配。當 ChatGPT 橫空出世,四處湧現的 AI 初創公司和科技巨頭們爭相購買 A100。美國政府針對 A100 等 AI 晶片的出口管制更加劇了其在中國的緊缺程度,但同時也讓國產晶片公司們看到了替代機會。華為昇騰計算業務總裁張迪煊接受採訪時說,「過去是我們找企業,現在是許多企業找過來。」

不同於開發大模型的公司還在嘗試各種最終應用場景,晶片公司們展示的東西明確、直觀得多:在各晶片展台的顯眼位置,往往擺放著各型號晶片,和搭載了其 AI 晶片的伺服器,它們看起來是一個個大機箱,其中插著數排 AI 加速卡。各家公司也會用現場計算機展示在自己的晶片支持下, AI 大模型或 AIGC 的應用效果:包括對話機器人、AI 繪畫等。

英偉達沒在 WAIC 上設展台、沒有一場冠名論壇,也沒拿任何獎項,在晶片專場論壇中,英偉達只派來一位技術總監,他最後一個上台,排在高通、AMD 和英特爾之後。但幾乎每家晶片公司宣傳產品時都會對比英偉達 A100 的指標;燧原科技 CEO 趙立冬在同場論壇里演講時,就以英偉達市值已突破萬億美元開場,以此說明華爾街正在用真金白銀押注 AI 計算大機會。

中國政府對扶持 AI 算力的重視也更甚以往:去年大會的晶片專場論壇的領導致辭環節,有一位上海市副市長出席,今年則來了上海市市委常委、浦東新區區委書記,上海市經信委主任,以及工信部科技司的一位副司長。

奮力賣 「裝備」 的人除了晶片公司,還有雲計算廠商和數據服務公司,以及獵頭公司和地方園區。

大多數公司很難買到 GPU 晶片訓練大模型,更好的方式是直接租用雲廠商供應的算力。微軟 Azure、亞馬遜 AWS 今年都上了 WAIC 的主論壇。

《晚點 LatePost》了解到,數據採集和標註平台澳鵬今年下了重注,把全年大多數展出預算都放在了 WAIC 上;它的中國同行——股價曾在短短一個月之內上漲超 2 倍的海天瑞聲,則是第一次參會,現場的工作人員說,除了接待接連不斷的潛在客戶,還有 「許多股民來感謝我們」。

創業生態里的各種服務方也在尋找客戶。一位參展企業人士說,他一個上午遇到了好幾波獵頭和地方園區招商人員,接了一沓名片。不管想嘗試什麼新機會,人才和經營場地,都是一批公司要付出的成本,是另一批公司和地方的新發展機會。

大模型帶動通用機器人成熱點,無人車、元宇宙退潮

在各種相對抽象的應用和系統解決方案中,機器人是少有的能 「看得見、摸得著」 的應用方向。

大模型熱起來的這半年,一個名叫 「具身智能」(Embodied AI)的概念也獲得關注。簡單來說,具身智能是指人工智慧軟體與硬體結合起來,去解決現實世界的問題。今年 5 月,英偉達 CEO 黃仁勛說,具身智能會是下一個 AI 浪潮,具身智能的典型代表就是機器人,尤其是能以同一形態產品,完成多種複雜任務的通用機器人。

WAIC 現場,機器狗和人形機器人肉眼可見地多了起來,主辦方稱有 20 多個,往年則是個位數。

會場中的熱鬧場景,是一群人圍著機器狗 「逗狗」,嘗試推倒它、騎它。雲深處的機器狗在一次表演爬台階時踏空摔了下來,馬上在圍觀的人群中激起一陣密集的嘆息:「完了、完了……完了」。

人們圍觀機器狗。來源:視覺中國。

關於大模型和機器人具體怎麼結合,從業者現在莫衷一是。有觀眾問機器狗公司宇樹科技的工作人員:「你們會把大模型用到機器狗上嗎?」 工作人員愣了一會兒,說:「還沒有發現什麼可以做的」。

一家機器人公司創始人告訴《晚點 LatePost》,大模型現階段在機器人上的明顯應用方向,是用自然語言替代代碼,直接向機器人輸入指令,讓機器人有部分 「常識」,能把人想傳達的任務分拆成各種機器人子任務;但子任務的執行需要依賴機器人基礎能力,如導航、規劃、控制等,大模型可能有幫助,但不是替代和顛覆。

相比機器狗公司面對大模型的猶豫,開發人形機器人的公司樂觀多了。達闥科技發布了 「RobotGPT 行業大模型」,宣稱要 「引領具身智能新時代」。他們運了十幾個機器人到現場,讓它們擺成一列跳 「千手觀音」。

達闥科技的機器人表演 「千手觀音」。

它在這場 AI 大會上遇到了新對手。展台就在達闥對面的傅利葉智能。這家公司之前做智能復健設備,現在發布了人形機器人,同樣宣布要 「引領 AI 進入具身智能時代」。

最抓人眼球的人形機器人是特斯拉的 Optimus。在保護機器人的紅線之外,聚集的人群爭著鑽得近一點再近一點,好拍照記錄,仿佛在膜拜一尊神像,儘管這只是一個 1:1 的模型。

參觀者擠到特斯拉人形機器人 Optimus 前拍照。

路過的人常常問工作人員 「它能動嗎?」 甚至有人靠上下前後搖動手機,硬是拍出了動感效果。「雖然是模型,但很震撼」,一位現場的年輕人說,他目測這個機器人有 1.9 米高,這也許是黑科技帶來的光環,Optimus 的官方身高是 1.72 米。

往年,這樣的盛況屬於無人車和元宇宙。

2021 年的人工智慧大會儼然像是另一場上海車展。自動駕駛公司嬴徹科技、小馬智行和圖森未來不惜重金將高 4 米、近 10 噸重的卡車實物運到展台。AutoX、上汽、華為車 BU、百度 Apollo、商湯科技,乃至做汽車晶片的芯馳科技,都直接展示了搭載自家技術或產品的汽車。WAIC 還專門設立了一個無人車體驗區,會場接駁都用了無人小巴。

到了今年,體驗區和無人小巴都不見了。只有上汽智己、集度、特斯拉等少數車企的展位上還有車,兩年前的 「卡車三雄」,今年只剩圖森未來展示了一個用塑料盒包裹起來的感知套件,其他無人車公司幾乎都沒來。

圖森未來 2021 年展台(上)和 2023 年展台(下)的對比。

大會的智能駕駛論壇被安排到 WAIC 最後一天,雲驥智行聯合創始人曹光植在參與圓桌討論時一邊鼓勵同行共渡難關,一邊自嘲:「自動駕駛這麼一個陽春白雪的事情,怎麼被我們捲成了這樣?」

元宇宙也有類似冷遇。去年 WAIC 大會把元宇宙概念嵌進了主題名,「智聯萬物、元生無界」,Meta 大中華區總裁梁幼莓受邀在開幕式上演講,主辦方還在世博中心、徐匯西岸、張江分會場、東方明珠和武康大樓等地設置了元宇宙打卡點。

一年過去,只剩下為數不多的 XR (擴展現實)企業將元宇宙作為宣傳點。在官方設置的 10 個前沿技術中,今年元宇宙相關論壇只有 3 個,是去年的五分之一。從主會場的入口一直走到盡頭,才能看到一些元宇宙相關公司的小展位。無論是自動駕駛還是元宇宙,在當下風口過去、融資困難的背景下,企業們大多將有限的預算留給了維持公司經營。

當一種新技術熱潮顯現,往往有兩種演進路徑:一是新技術兌現了價值,成為基礎設施的一部分,不再被關注,比如網際網路、推薦算法。另一個是新技術短期內無法兌現價值,然後被新的熱潮搶走資源與風頭。現在大模型成為新熱點,但過去的一輪輪技術炒作後,局內和局外人都已冷靜很多。那些真正想在這個新機會裡做些事情的從業者,其實希望大眾的熱情和期待都更務實一些。

騰訊雲副總裁吳運聲說,騰訊已經聯合金融、文旅、政務、傳媒、教育等十多個行業客戶,打造超過 50 個行業大模型解決方案。據我們了解,這些方案暫時都沒有上線。他說,現在是大模型發展的初級階段。

朱麗琨對此文亦有貢獻。

文章來源: https://twgreatdaily.com/zh-my/e096b4e84fb6291ff8bae6661d28566f.html