人人都要上雲的時代,AI部署為何要往本地走?

2024-01-12     DeepTech深科技

原標題:人人都要上雲的時代,AI部署為何要往本地走?

根據不完全統計,現在全球每周上線的基於 AI 的手機應用高達上千款。在 2022 年 11 月 ChatGPT 發布後,AI 的發展迎來了新紀元:生成式 AI 從幕後走到台前,通過用戶友好型介面和大眾產生直接聯繫。

現如今,如果手機上不安裝幾款 AI 應用,似乎都不好意思說自己用的是「智能」手機。這些應用可以是基於生成式 AI 的 ChatBox(聊天機器人),或者是 AI 加持下的語言學習軟體、圖片生成類應用等等。

如果你以為生成式 AI 只能嵌入進手機,那真的小看了科技公司的想像力。2024 年 1 月 9 日,CES 2024 在美國拉斯維加斯盛大開幕,高通展示了其先進的 AI 實力。利用業界領先的 AI 硬體和軟體解決方案,驍龍數字底盤平台推動汽車領域人工智慧向前發展。現在,驍龍座艙平台已經具備支持生成式 AI 的能力。

彷佛一晃之間,AI 已經走入普通消費者這個「尋常百姓家」。

然而,這種變化不是一蹴而就的。

終端側部署的 AI 更了解用戶需求

2023 年 2 月 23 日,也就是 ChatGPT 發布後的 3 個月,高通成功在搭載了驍龍晶片的安卓手機上運行了 Stable Diffusion,這是一款風靡全球的從文本生成圖片的應用。對於手機用戶而言,安裝一款應用僅僅是點擊幾下螢幕,但這背後是相當複雜的配置。Stable Diffusion 模型參數超過 10 億個,此前只能在雲端運行。

還有 ChatGPT,登錄網頁依然是主流的使用方式。由此我們不禁要問,為何一定要在移動端部署 AI?用更專業的說法,為何要在終端側部署 AI?這裡的終端側可以指手機、平板電腦、可穿戴設備、智能汽車等等。

首先,把 AI 部署在本地可以更好的獲知用戶需求。本地 AI 通過捕獲用戶的行為數據和位置信息,提供更加個性化的服務。與此同時,終端側設備的使用方式也經歷了轉變,不再局限於單一應用的簡單操作。以發送簡訊為例,當我提到參與某個活動並遇到另一個人時,如果之前與這個人拍了照片,AI 將立即給予提示,導航至相冊並識別出相關照片,使用戶體驗更為無縫。這種智慧型手機與 AI 的協同工作,不僅提升了用戶體驗,也為移動設備帶來了更廣泛的功能。生成式 AI 在此背景下發揮作用,協同工作於所有應用之間。

高通現任 CEO 安蒙(Cristiano Amon)曾在一次公開演講中說,「真正有趣的地方在於讓生成式 AI 在智慧型手機本地運行,而不是雲端」。在 CES2024 上,安蒙再次強調,「生成式 AI 的變革意義在於終端上的信息能夠幫助 AI 成為無處不在的個人助手……」

圖:高通公司總裁兼 CEO 安蒙 | 來源:高通公司

其次,這關係到用戶隱私、安全性和網絡通暢性。請讀者來設想一種情景,當你在和一款 AI 機器人溝通一些關於自己的私密問題,聊天記錄是備份在本地更安全,還是雲端更安全?如果用戶是一家企業,這其中涉及到的諸多商業機密,想必不會上傳雲端。這就是終端側部署 AI 的好處之一。

另一方面則是網絡通暢性,雖然目前 5G 已經快速部署,但相比於 AI 產生的海量數據,網絡傳輸速度似乎並不能滿足需求。一架波音 787 每秒鐘產生 5GB 數據,全球每時每刻正在飛行民航飛機何止幾千架。高通發布的白皮書《混合 AI 是 AI 的未來》指出,相較於傳統方式,生成式 AI 的搜索成本增加了 10 倍,全球每天產生超過 100 億次的搜索查詢量。

所以,最優的解決方案是混合式 AI:即在終端側部署 AI,一部分 AI 計算在終端運行,一部分在雲端運行,混合搭配,這會極大的減輕運營壓力,降低算力成本和能耗,同時提升了安全性與用戶體驗。

終端側 AI 的願景:萬物互聯、分布式計算

在媒體一輪又一輪的普及和展望之下,大眾對「萬物互聯」的概念不陌生。然而,由於現實體驗和「未來展望」的差距,相當多的用戶以為萬物互聯就是「藍牙連接」,更先進一些的,是智能家居之間通過同一個 Wi-Fi 網絡的數據交互。

然後真正的萬物互聯並非如此。筆者認為,萬物互聯的基礎首先是萬物智能化,智能化之後的互聯才更有意義。而「萬物智能化」需要在終端設備上部署 AI,這便是終端側 AI 的願景。當你手中的每一款終端都具備了 AI 能力、強大的算力,會產生一些神奇的應用場景。

比如推動科學進步,乃至造福社會和人類。

我們以 Folding@home 項目(也稱 FAH)為例做一下展望。這是一個分布式計算項目,科學家通過模式計算的方式研究蛋白質動力學,包括蛋白質摺疊的過程和蛋白質運動。這個項目的意義在於,其研究成果可以用在一系列難以攻克的疾病上,比如老年痴呆、癌症、亨廷頓病等等。這個處在科學前沿的研究項目需要極大的計算量,或者說,計算速度越快,這項研究就能更早突破。

於是,研究人員想到了一個使用大眾「富餘算力」的辦法,志願者可以讓自己的設備,如電腦參與到科學計算當中。比如,當用戶處於夜間睡眠狀態時,手機可能正在充電並置於 Wi-Fi 網絡下,此時它便可以承擔一些科學計算任務,最終這些結果匯總到一起,從而大大加速整個科研進程。目前 FAH 已經是全球最快的計算系統之一,它是全球第一個「億億次計算系統」。據稱,該項目的模擬結果也與實驗非常吻合。

這與十多年前網際網路田園時代的 BT(Bit Torrent)下載十分相似,越多人參與,下載(計算)速度越快。

這或許是未來終端側 AI 的一個重要應用:貢獻 AI 能力和算力。在某種程度上,部署了 AI 的終端就是一台微型分布式計算終端。這或許能給用戶帶來經濟上的收益。

這樣「出售算力」的平台在全球範圍內已經出現。比如 LoadTeam,這是一個利用用戶閒置算力和內存「挖礦」的平台,根據用戶終端的運行速度和貢獻值分成。另一個海外平台叫 Golem,其願景描述就是「出租您的數字資源,包括閒置計算能力」,「您可以成為去中心化網絡生態中的一部分」。

雖然一些應用的細節還在展望,並沒有實際走進我們日常生活。但這些變化是可預見的。對於終端用戶來說,部署 AI 成為了一種賦能,而這種賦能不論是轉化為用戶體驗,或者是保障安全性,還是用這種能力換取金錢,用戶都將受益。

首個專為生成式 AI 打造的平台,如何賦能 AI 體驗?

生成式 AI 浪潮到來之後,高通加速了其產品對 AI 的支持力度。2023 年 10 月 24 日,第三代驍龍 8 移動平台發布。作為高通技術公司首個專為生成式 AI 打造的平台,第三代驍龍 8 帶來了影像、遊戲體驗和專業品質的全面提升。

圖:第三代驍龍 8 移動平台 | 來源:高通公司

ChatGPT 之後,各個手機廠商推出了各自的生成式 AI 應用,這些基於 AI 能力開發的產品,需要一款更先進,更具備 AI 基因的移動平台搭載。第三代驍龍 8 發布後,已經在全球 OEM 廠商和智慧型手機品牌的終端得到廣泛採用,這其中包括大家耳熟能詳的小米、榮耀、甚至以往的汽車廠商蔚來等品牌。

比如在近期推出的小米 14 系列手機中,通過引入本地 AI 大模型,讓手機具備了一系列強大功能——AI 擴圖、AI 寫真等。AI 擴圖可以對構圖比較拘謹的照片進行新增畫面生成擴充,而 AI 寫真可以讓用戶和指定的背景合影,即便沒有去過。這些都僅僅通過端側 AI 計算便可實現,無需雲端的參與。最新發布的榮耀 Magic6 系列帶來的基於魔法大模型的「任意門」功能同樣是終端側 AI 應用的一個典型代表。

我們在上文提到,在年初的 MWC2023 上,高通展示了在第二代驍龍 8 智慧型手機上運行 Stable Diffusion,10 億參數模型,能夠在僅 15 秒內完成 20 步推理,將文字提示轉化為圖像。這樣的表現已經十分驚人,而現在,在第三代驍龍 8 上,高通 AI 引擎的核心 Hexagon NPU 進一步升級了全新的微架構,性能再度提升了 98%,能效提升了 40%。

依靠強大的 Hexagon NPU,微切片推理單元,性能有加強的張量/標量/矢量單元,同時所有單元共享 2 倍帶寬的大容量共享內存,此前第二代驍龍 8 運行的是 10 億參數模型,第三代驍龍 8 發布時已經能夠運行高達 100 億參數的生成式 AI 模型,並且以 20 tokens/s 的速度運行大語言模型。

這樣的性能提升速度,意味著手機(也包括其它終端)用戶很快就能流暢的在手機上體驗各項 AI 應用。

高通一直以來給公眾的印象就是「手機晶片」,一定程度上已經成為了手機晶片的代名詞。除了晶片,高通實際上是 AI 的「原生玩家」。2009 年,谷歌剛開始秘密研發無人駕駛汽車,2010 年,「數據科學家」還是一個新興職業,而高通在 2007 年就已經投入研發 AI 了。

圖:高通的 AI 研發之路丨來源:《混合 AI 是 AI 的未來》白皮書

從 2007 年至今,高通在 AI 領域的一些突破推動了整個行業的進步。2016 年,一款重磅產品橫空出世,高通驍龍神經處理引擎工具包(Snapdragon Neural Processing Engine SDK)正式發布。這一軟體開發工具包(SDK)使得原始設備製造商(OEM)能夠在驍龍 820 設備上,包括智慧型手機、安全攝像頭、汽車和無人機等各種設備上,運行他們自己的神經網絡模型,而無需連接到雲端。這意味著下游廠商能夠個性化地開發場景檢測、文本識別、對象跟蹤與規避、手勢識別、人臉識別以及自然語言處理等功能。

2022 年 6 月 AI Stack(高通 AI 軟體棧)發布,解決了困擾行業多年的重複開發問題。此前,AI 開發人員需要針對同一個功能,不同終端做重複開發,而 AI Stack 的出現真正實現了「一次開發,全平台通用」,把開發人員從重複性勞動中解放了出來,讓他們把更多精力投入到創新性活動中。

回看高通在推動 AI 行業發展中取得的成績,與其說賦能終端側 AI 是戰略,不如說是一種必然,它是目前各個子領域發展至今的最優解。

AI 時代的到來勢不可擋,這是人類社會的發展趨勢,我們只能擁抱它,而不能逃避 AI。旗艦移動平台第三代驍龍 8 發布後,高通又在 2023 年 11 月推出了第三代驍龍 7,將非旗艦移動平台上的卓越使用體驗和 AI 支持帶給更廣泛的用戶群體。由此覆蓋了中、高端用戶和普惠用戶。

科技的發展,應當塑造一個良善的 AI 行業,每個人都應該被賦能,不能讓一人掉隊。AI 時代需要被每一個人共享。

文章來源: https://twgreatdaily.com/zh-cn/c1a8fcd82690ed2398df536bfcbebb46.html