智能體捲起來了 但爆款還沒出現

2024-06-19   第一財經

[ 商業場景中的智能體需要具備專業準確、高質量的交互能力,這背後,專業技能與高昂的研發投入仍必不可少。智能體的有效運作還需要豐富、精準的知識庫的無縫對接,保證輸出內容的權威性與實用性,進而滿足多元化、高要求的業務場景需求。 ]

「生成式人工智慧,我更看好的方向是什麼呢?是智能體(Agent)。」6月18日,百度方面披露了百度創始人、董事長兼執行長李彥宏近日在一次活動上的講話,他預計,智能體是AI時代的網站,將會有幾百萬、甚至更大量的智能體出現,形成龐大生態。

就在幾天前,百度前首席科學家、現Landing AI創始人兼CEO吳恩達也在一次公開場合展示了在視覺智能體方面的最新進展,他認為AI Agent正驅動下一個創新浪潮,並呼籲開發者們關注和參與AI智能體技術的發展。

而在上周末的智源大會上,智源研究院院長王仲遠在接受採訪時預計,智能體很有可能會成為爆款應用的一個方向,大模型可以讓它成為真正意義上的智能助理。「如果每個人都能擁有一個足夠智能和好用的助理,這種科技帶來的平權將催生重大的產業變革。這可能是C端應用的一個重要方向,也是令人興奮的前景。」

幾乎所有的大模型廠商都在布局智能體應用或平台,不過,在大廠紛紛開「卷」智能體的背景下,智能體何時出現爆款應用?商業化如何落地?這些問題尚未有明確答案。

業界普遍看好

簡單來說,智能體就是一個能夠感知環境、理解情境,並基於這些信息進行決策、採取行動的計算機系統。它就像是虛擬的機器人,能夠學習、適應並完成複雜的任務。

比如,在自動駕駛汽車中,智能體通過分析道路狀況、識別交通標誌和預測其他車輛的行為,從而引導人類安全地駕駛汽車;在遊戲領域,智能體可以作為對手或隊友,提供更具挑戰性和真實感的遊戲體驗。再如,近期正值高考季,有平台瞄準應屆學子群體上線類似AI志願助手的智能體,用戶提出問題如「600 分能上什麼大學」,會得到相應大學的推薦列表,也能回答學校往年分數線、專業情況、招生計劃、建議填報專業等等問題,作為考生志願參考。

去年以來,國內外科技大廠陸續布局智能體開發平台。例如OpenAI的GPT Store、谷歌DeepMind的SIMA、位元組跳動的Coze扣子、騰訊雲的騰訊元器、百度智能雲千帆AgentBuilder、阿里雲的AgentScope多智能體開發平台、科大訊飛星火智能體平台等。

在生成式人工智慧領域中,為什麼智能體成為被業界普遍看好的一個方向?

智能體的特性與生成式AI的需求非常契合。通常,智能體能夠處理和生成多種類型的數據,包括文本、圖像、聲音等,這使得智能體在多模態交互場景中表現出色。

智能體還有很強的適應性,更擅長「交流」。它們可以根據環境的變化或是用戶偏好、反饋來快速調整其策略和行為,從而生成更加準確和相關的內容。這意味著,當用戶和智能體交流時,從體驗上它更像一個真正的夥伴一樣回應你,而不是一個冷冰冰的機器,這種交互性讓智能體更加貼近用戶。

在現實世界中,情況總是不斷變化的,這就要求智能體能夠快速調整策略,應對新情況。例如,一個管理能源分配的智能體,需要實時監測電力需求,預測未來負荷,並據此優化資源分配,確保電網穩定運行。這種動態適應的能力,也正是生成式AI所追求的——在不斷變化的環境中,智能體能夠生成最適合當前情境的解決方案。

還有一個重要原因是,創建一個智能體的門檻足夠低。一些平台提供了用自然語言零代碼和低代碼方式創建智能體的選項。這意味著用戶不需要掌握程式語言,通過自然語言文字描述,就能夠完成創建一些簡單的智能體。

一些平台可以零代碼製作智能體,李彥宏分析,智能體就像網際網路時代的網站,門檻足夠低,「當時看網站是怎麼做出來的?通過瀏覽器一看原始碼,非常簡單,稍微改一點,我也可以做出來,今天做智能體跟這個很類似……起個名字,告訴它回答什麼、不回答什麼,就做成了。」他指出,智能體將會大量出現、形成生態。

業界對智能體充滿期待。中信證券近日研報指出, AI Agent作為當前語言模型應用落地的最佳形式,預計將迎來技術轉折,距離AI Agents應用落地或需6~12個月時間。

李彥宏則預計,「未來,在各行各業、各個領域都會依據自己具體的場景,根據自己特有的經驗、規則、數據,做出來這些智能體。」

智能體不僅能對話,還具備反思和規劃能力,「如果說得不對,它能自己想想哪兒錯了;它還有規劃能力,為了實現目的,能規劃要調用什麼工具。」李彥宏表示,智能體的這些能力正在逐步完善、門檻也足夠低,隨著基礎大模型能力增強,將誕生更多有價值的應用。

爆款應用還沒出現

儘管大廠們都在積極布局智能體開發,已經在搜索服務、內容生成、工業製造、遊戲開發、物聯網決策,以及智能終端融合等多個領域展現出應用價值。但到目前為止,智能體領域還沒有出現一款真正的爆款應用。

背後的原因,在於智能體要想從概念驗證走向大眾市場,還需要在提升用戶體驗、深化內容價值及優化交互模式等方面做出實質性的突破。

從第一財經記者的體驗來看,儘管部分智能體在特定場景下展現了一定實用性,但不少智能體的應用場景僅停留在新穎性層面,與傳統的App應用或者小程序對比來看,並未展現出壓倒性的優勢,更無法形成持久的用戶黏性。還有一些面向垂直領域的智能體,其內容深度和互動質量仍有待提高。

一位AI從業人士對第一財經記者表示,雖然智能體的基礎技術如機器學習、深度學習和自然語言處理等取得了顯著進展,但實現高度複雜和個性化交互方面仍有限制。而且,儘管一些平台提供了低代碼或無代碼的智能體開發工具,但對企業開發者而言,「一鍵式生成」遠遠不能滿足需求。

商業場景中的智能體需要具備專業準確、高質量的交互能力,這背後,專業技能與高昂的研發投入仍必不可少。智能體的有效運作還需要豐富、精準的知識庫的無縫對接,保證輸出內容的權威性與實用性,進而滿足多元化、高要求的業務場景需求。

此外,智能體更是一項系統工程,需要深諳市場需求與用戶心理,目前在精準匹配開發者需求、提供自然流暢的交互體驗以及創造獨特價值方面還存在挑戰。也因此,智能體市場競爭激烈,許多公司都在探索智能體的應用,但大多數應用尚未形成明顯的競爭優勢。

在商業化落地上,大模型廠商在構建智能體的生態系統和商業閉環方面仍在探索中。當前業界的主要精力放在技術研發和生態培育、拓展應用場景等方面,產業價值的釋放還需時間。一位從業者表示,未來如能通過百度、騰訊等官方插件和知識庫,並能將這些智能體一鍵分發到比如搜索、微信公眾號等渠道,或將找到商業化的機會。

不過,智能體的智能化程度與其學習能力、數據積累、技術疊代和用戶參與度緊密相關,隨著這些方面的不斷積累與進步,智能體也將變得越來越聰明。吳恩達也在演講中表示,雖然目前技術依舊有缺陷,但AI智能體工作流已經開始從一種新奇的「玩具」過渡到真正的實用階段,未來必將為開發者帶來前所未有的高效創新體驗。他相信,通過開源和社區合作,這些技術將不斷進步,顯著提升開發者的能力。

如何讓智能體真正用起來?

李彥宏預計,未來智能體或許將具備協作能力。「有些複雜的任務,可以通過多個智能體來完成,就像公司里有CEO,還有財務、技術、銷售主管,他們協作起來,就能完成一個非常複雜的任務。」

除了虛擬的智能體外,另一個方向是數字智能體與智能硬體結合。英偉達今年宣布成立GEAR實驗室,主要用於研究和布局具身智能、AI智能體等下一代AI與機器人結合的創新技術。

王仲遠也預計,大模型將以數字智能體的形態與智能硬體融合,以具身智能的形態從數字世界進入物理世界,同時,大模型這一技術手段可為科學研究提供新的知識表達範式,加速人類對微觀物理世界規律的探索與研究突破,不斷趨近通用人工智慧的終極目標。

不過他也提醒,硬體的發展速度比不上大模型的疊代速度,業界要保持客觀理性來看待具身智能大模型,包括人形機器人的技術發展周期,要能夠接受它在未來幾年內可能進入低谷,直到它跨越周期迎來真正的爆發。