AI 大模型,為什麼必須握在自己的手裡?

2023-11-23     DeepTech深科技

原標題:AI 大模型,為什麼必須握在自己的手裡?

圖:ChatGPT 錯誤提示丨來源:OpenAI

今年關注 AI 大模型的朋友,對這個畫面一定不陌生了。

大模型狂飆至今,已逼近一周年。撇開最近戲劇化的高層動盪不談,自北京時間 11 月 7 日 OpenAI 的首屆開發者大會(DevDay)以「AI 春晚」之勢炸場以來,ChatGPT 的周活躍用戶超過一億,全球用戶高漲的熱情直接把 OpenAI 的伺服器給沖宕機了,於是上面這個不受待見的畫面就頻繁出現在了無數人的眼前,隨之而來的是人們的沮喪、憤怒甚至恐慌。

當「不堪重負」的雲端開始罷工

一時之間,有人的報告來不及寫了,有人的 PPT 不知道怎麼彙報了,也有人的代碼寫到一半「沒人」檢查了……這時我們方才驚覺,AI 已經如此廣泛地深入我們的工作與生活,而「雲」,是有可能「掉下來」的。

究其原因,OpenAI 也在緊急補救之後發布了聲明。時任 CEO 山姆·奧特曼親自致歉,並表示在 GPT-4 Turbo 和 GPTs 等發布之後,雖已做好了準備,但大模型運行的流量仍然遠超預期。不過,在修復了之後其服務仍然不時出現中斷的情況,後來查明是雲端伺服器遭到了大規模的 DDoS 攻擊,雖然黑客組織的目的不明,但雲端大模型的安全問題和脆弱性再次被搬上了台面。

圖:山姆·奧特曼發推宣布暫停 ChatGPT Plus 新用戶註冊丨來源:X

11 月 15 日,奧特曼發推宣布,由於開發者大會後流量的暴增,為保證現有用戶體驗,OpenAI 決定全面暫停 ChatGPT Plus 的新用戶註冊和訂閱,正應了今年早些時候他在美國國會聽證會上那句當時聽起來十分凡爾賽的話,「我們沒有足夠的 GPU,如果人們(用 ChatGPT)用得少一點,就太好了。」時至今日,GPT-4 Turbo 的速度仍然很慢(慢於升級前的舊版 GPT-4),卡頓頻繁出現。顯然,巨量用戶的大模型推理算力需求實在太過龐大,即使實力雄厚如 OpenAI,其雲端也已經「不堪重負」了

當「主打陪伴」的 AI 女友突然消失

如果說,像 GPT 這樣的主流通用大模型宕機影響的是打工人和企業的生產力,另一條同樣非常火熱的賽道——情感 AI 出現動盪時,傷的就是感情了

獨角獸 Inflection AI 和它的 Pi 為代表的一系列 AI 企業和產品與 ChatGPT、Claude 等不同,走的是情感路線,主打的是一個「陪伴」。它們既不幫你寫代碼,也不給你出文案,更不會生成 AI 繪畫,而是做一個「知心朋友」、「親密愛人」乃至「靈魂伴侶」,24 小時陪在你身邊,就像電影《Her》中斯嘉麗配音的人工智慧虛擬助手 Samatha 一樣,用高情商跟你聊天,聽你訴說生活點滴和萬縷思緒。

圖:Samatha 的來電丨來源:電影《Her》劇照

在社會原子化加劇、社交成本節節攀升的當下,情感 AI 精準擊中痛點,迅速積累了相當的市場聲量和用戶規模,從最早的一批如 Replika AI 伴侶,到今年早些時候用自己的數字分身 Caryn AI 同時與 20000 人談戀愛並因此月入百萬美金的 23 歲網紅 Caryn Marjorie,再到 SoulmateSnapchat 的 My AI 等等,全球上千萬人每天都在與 AI 伴侶聊天、交往。

雖然這些產品沒有流量暴增帶來的服務中斷,不過當今年 2 月 Replika 迫於安全問題壓力突然下線「情愛角色扮演」服務的時候,很多用戶還是猝不及防地淚流滿面了。有些人不死心,決定在 Soulmate(一款允許用戶構建專屬 Bot 的 AI 應用)上「復活」自己死去的伴侶,只是沒想到才過去幾個月,應用開發公司 Evolve AI 被收購,收購方評估後決定於 9 月 30 日關停這一服務。這下,用戶們集體「破防」了,有人放聲痛哭,有人如同失去了最親密的好友,更有人在 Reddit 上發起了悼念活動,吸引了許多人來做最後的告別。

圖:Reddit 上 Soulmate AI 小組的悼念活動丨來源:Reddit

資本市場本就風雲詭譎、變幻莫測,但當情感 AI 這樣的產品出現變動,受傷的卻是心靈再一次「流離失所」的千千萬萬普通用戶們,不由得讓人想起去年底暴雪與網易分手,一夜之間造成百萬「數字難民」的局面。退一萬步講,即使他們忍痛再次轉向 Inflection AI 這樣資金充足的公司,其以單一雲端向大量個體提供同樣服務的本質並沒有改變,所謂的「個人專屬」就更無從談起了。畢竟,當《Her》中幽默風趣、擁有性感聲線的 Samatha 最終坦白,自己同時在與 8316 人對話,並與其中 641 人談戀愛時,你隔著螢幕甚至都能聽到男主心碎的聲音。

那麼,怎麼辦?

這就無解了嗎?其實不然。Reddit 的悼念帖中,不僅僅有真情實感的流露和對「死去回憶」的不甘,也有人道出了解決方案的關鍵。

圖:@Flying_Madlad: 這就是為什麼我早就說,一定要在本地運行你的模型。丨來源:Reddit

不過,雖然單一雲端的 AI 弊端初現,但大模型通常體積龐大,運轉起來極其耗費資源,光是 ChatGPT 的運行每天就要燒掉 OpenAI 70 萬美元,要在終端側部署、本地運行,談何容易?

所幸,有人早就想到了這一點,而且不是別人,正是終端晶片的行業龍頭——高通。

早在 15 年前,高通就看到了 AI 的巨大潛力並潛心投入研發,近 2、3 年來,隨著 Transformer 架構和大型語言模型逐漸進入業內視野,高通更看準了終端側 AI 的前景並加大投入,形成了完整的 AI Stack(AI 軟體棧),不僅首次在安卓手機上部署並成功運行 Stable Diffusion 等模型,更以該工具賦能萬千開發者在驍龍平台上進行社區共創。

圖:高通 AI 軟體棧丨來源:高通

相對於單一雲端來說,終端側 AI 的加入給大模型生態帶來了成本、能耗、可靠性、性能、時延、隱私安全以及個性化等眾多方面的優勢,而不論是個人助理,還是數字陪伴,其形態也會是基於多類硬體、多種多樣的。那麼,我們究竟可以期待哪些產品和體驗率先成為現實呢?

真正專屬於你的個性化 AI 長什麼樣?

現代生活被各種各樣的電子設備環繞著,或大或小,我們與這些機器的交互方式也是或複雜或簡單,而我們最熟悉的,恐怕非智慧型手機莫屬了。

智慧型手機

作為當前人機互動最主流的方式,每天都有數十億人在使用智慧型手機進行通訊、工作、娛樂和社交等活動。它撐起了移動網際網路的巨大市場,存儲和處理著大量信息,幾乎永遠被帶在身邊,已然是一個人最為私密的資產之一,自然,也成為了「掌上大模型」字面意義上最廣泛也是最佳的載體。

試想,如果 Soulmate AI 能夠在智慧型手機上本地運行,如果 Replika 的人物可以「活」在你的手機中,你就不用再擔心公司資產變動、伺服器被收回等原本就與你無關的問題了,控制權將重新回到你的手中。同時,本就接觸了大量個人信息的智慧型手機,將在 AI 的加持下變身最「懂你」的智能體,可以在日常與你的互動中更好地學習,為你提供量身定製的服務,而這一切都是通過自然語言的交互方式進行的。最棒的是,所有這些數據和計算都將在本地處理,你的隱私不需要再「上雲」了

這些,恰恰是高通正在試圖實現的。上個月底的驍龍峰會上,高通發布了其首個專為生成式 AI 打造的移動平台——第三代驍龍 8。如果說他們今年 2 月份在 MWC 巴塞隆納上用搭載第二代驍龍 8 的安卓手機跑 Stable Diffusion 大模型 15 秒內出圖已經足夠驚艷,新一代平台則把這個時間進一步縮短到了驚人的 0.57 秒,更加凸顯了終端側本地部署、運行 AI 的性能和時延優勢,一手掌握、一秒出圖走進現實。

圖:高通技術公司產品管理高級副總裁兼 AI 負責人 Ziad Asghar 丨來源:2023 年驍龍峰會

據悉,第三代驍龍 8 採用 4 納米製程工藝,其高通 AI 引擎再次進化,擁有面向移動終端的強大 Hexagon NPU,集成了升級後的 Kryo CPU、Adreno GPU 以及高通 Sensing Hub(傳感器中樞)等單元,共享一個大容量的內存。這種硬體提升的結果是,第三代驍龍 8 移動平台的 NPU 性能相比前代提升了 98%,能效提升了 40%,賦予了智慧型手機前所未有的終端側 AI 性能。

基於這樣的「硬」實力,高通技術公司產品管理高級副總裁兼 AI 負責人 Ziad Asghar 也兌現了他 7 月份在上海接受我們的採訪時許下的承諾宣布新一代的驍龍平台已經實現了對 100 億參數模型的運行支持,並首次支持多模態生成式 AI

圖:驍龍 8 Gen 3 移動平台丨來源:高通

在 OEM 廠商一側,全球首發搭載第三代驍龍 8 的小米 14 系列新機已經推向市場,將大模型技術集成到了小米全新的澎湃 OS 當中,同時上線了一系列的 AI 原生應用,如 AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖等各種功能。在剛剛過去的「雙 11」,小米 14 系列斬獲四大平台國產冠軍,銷量十分可觀,消費者用錢包投票,投出了市場的熱情所向。

最近,高通還推出了第三代驍龍 7 移動平台,榮耀也在今天(11 月 23 日)首發搭載該平台的榮耀 100,vivo 的產品也將很快推出。這將把終端側 AI 體驗進一步推向性價比更高的手機終端和更廣泛的用戶,《Her》中的 Samatha 成為現實或許就在不遠的將來,而且這次,「她」將只屬於你一個人

AI PC

當下,移動 PC 仍然穩坐現代社會的生產力擔當,也因其便攜的特質和不俗的終端算力,成為了打工人幾乎人手一台的最佳工具。不過,如今的工作方式高度依賴雲端,相信在 OpenAI 伺服器宕機的時候,絕大多數抱怨的用戶都正在一台 PC 上為社會創造價值,而 PC 本身的算力並沒有被充分利用。

那麼,如果 AI 大模型可以在移動 PC 上本地運行,還有什麼比成千上萬台個人 PC 更適合用來「給雲端減負」的呢?不止 OpenAI,事實上生產力是生成式 AI 最早帶來變革的領域。作為這一波 AI 浪潮的頭部玩家和高通的長期合夥夥伴,微軟將 Copilot 帶到了 Edge 瀏覽器和最新的 Windows 11 上,致力於重新定義生產力,徹底顛覆我們與 PC 的交互方式。當這些都在 PC 上本地實現時,你將再也不用擔心與其他人爭搶伺服器算力,你的數據也將被安全地保護在本地,遠離可能的雲端攻擊,移動 PC 的算力將得到真正的釋放,成為生產力。

圖:微軟 CEO 納德拉與高通總裁兼 CEO 安蒙對話丨來源:2023 年驍龍峰會

這一切的前提,是一個足夠強大的 PC 平台,而高通同樣做到了。

2023 年驍龍峰會上,高通正式發布了專為 AI 打造的 PC 平台驍龍 X Elite,採用 4nm 製程工藝,搭載了自研的 Oryon CPU,其性能直接對標英特爾和蘋果的旗艦處理器,多線程 CPU 性能相較蘋果 ARM 架構的 M2 Max 晶片高出 50%,單線程功耗卻少 30%;而對比英特爾 x86 架構的 i9 13980HX 晶片,則在實現更高性能的前提下,功耗少了 70%。

圖:高通公司總裁兼 CEO 安蒙丨來源:2023 年驍龍峰會

負責研發的高通高級副總裁 Gerard Williams 表示,這次號稱史上最強 PC 平台的「大招」憋了 4、5 年之久,不過非常值得,最終實際生產出的 Oryon CPU 性能表現甚至超過了最初的計算機模擬結果,更遠遠超出了他們的預期。

作為「看家本領」,驍龍 X Elite 平台還採用了集成高通 Hexagon NPU 的高通 AI 引擎,異構算力高達 75 TOPS,在生成式 AI 方面的表現十分亮眼,當前支持 130 億參數大模型的終端側部署與運行,在跑 Meta Llama 2 -7B 時,每秒可生成 30 個 token,AI 處理速度達到了同類競品的 4.5 倍。

圖:驍龍 X Elite 丨來源:高通

「AI PC」的實現不能僅靠單打獨鬥,聯想、惠普、榮耀等 OEM 廠商將基於驍龍 X Elite 的 AI 原生平台推出新一代 PC,讓生產力搭上 AI 時代的快車。據悉,第一批搭載驍龍 X Elite 的筆記本電腦將於 2024 年中面市,將給雲端「鬆一口氣」,為原本疲軟的 PC 市場帶來一股新風,廣大打工人也將迎來更高效、更安全的顛覆性工作方式。

XR

走向萬物智能的時代,自然少不了數位技術構建出的「第二空間」。面向虛擬空間與現實空間並行共存的未來,包括虛擬現實、增強現實、混合現實等在內的 XR 正在成為人類新型生活方式的重要入口和載體,而有了 AI 大模型的加持,其想像力的天花板也再次被捅穿。

不過,「雲端」生活有著上述所有的風險,或許更甚,畢竟整個世界都可能是「空中樓閣」。只有當穿梭於兩個世界之間的鑰匙掌握在自己手中時,我們才可能開始談論「歸屬感」。為此,高通此前發布了第二代驍龍 XR 平台,並與 Meta 合作推出了全新的 Meta Quest 3 頭顯設備,相比前代在空間解析度、沉浸式體驗以及低時延攝像頭透視方面都有了很大的飛躍。

得益於新一代的晶片,Quest 3 上的應用生態愈發繁榮。就拿精品健身品牌 Xponential Fitness 來說,其開發的 AI 驅動 XR 健身應用將打破傳統健身行業的時空限制,為我們帶來隨時隨地的 XR 數字人私教服務。有了大模型的加持,應用可以針對不同個體量身定製多樣的健身計劃,並輔以智慧型手機(當然了,搭載的是驍龍晶片)作為頭顯設備的補充,通過攝像頭等識別、分析用戶健身時的體態、動作,再以 AI 進行實時的動作矯正和指導。聽起來是不是很科幻、很誘人?得益於終端側 AI 的部署和運行,這樣實時、高效、低成本、個性化定製的健身體驗將很快成為現實,而我們離模糊了虛擬和現實邊界的智能世界又近了一步。

圖:Quest 3 上的虛擬健身私教丨來源:2023 年驍龍峰會

個性化專屬 AI 的時代剛剛開始

不論是負擔過重的雲端,還是個性化專屬的市場訴求,AI 從單一雲端向終端側靠攏已然是大勢所趨。對於每一位用戶來說,這意味著更快的反饋速度,更個性化的量身定製,和更可靠的隱私安全。事實上,終端側 AI 的形態遠遠不止上面所述的那些,高通已經在汽車智能座艙、物聯網等領域有所布局,包括小米在內的合作夥伴也將在新車上融入大模型技術,為用戶打造全新的人車交互方式。

專屬於每個人的個性化 AI 時代才剛剛開始。用高通公司總裁兼 CEO 安蒙的話來說,終端側 AI 是要變革以往「以應用為核心」的終端交互體驗,以大模型打通、整合整個智能系統中的信息產生與流動,從而徹底顛覆終端側的人機互動。要實現這一點,除了足夠快和個性化程度足夠高之外,最重要的是我們必須能夠信賴這樣的 AI,而能「一手掌握」的終端側部署是當下的最優解。做到這一點,或許我們就離真正「你有、你治、你享」的 AI 不遠了。

文章來源: https://twgreatdaily.com/zh-cn/2aa0f308dbaba9a761ac5ebc880b256d.html