誰能最早看見AIGC的未來?專訪崑崙萬維董事長兼CEO方漢丨文娛行業AI巡禮

2023-10-12     娛樂資本論

原標題:誰能最早看見AIGC的未來?專訪崑崙萬維董事長兼CEO方漢丨文娛行業AI巡禮

文/James

手機讓相機被顛覆、移動支付讓錢包被取代……很多時候,給一個現有行業帶來衝擊,乃至將其連根拔起的,並不是來自這個行業本身的競爭者,而是跨行業帶來的「降維打擊」。

搜尋引擎或許就是如此。

今年初,微軟的必應搜索最早結合了大語言模型,提供了基於GPT-4的聊天介面,份額占比和影響力從「其它」裡面一躍而出,成為谷歌不可忽視的競爭者。儘管谷歌在AI研發方面其實也走在行業前列,但它本身的搜索業務是谷歌的「搖錢樹」,對於其自我革命的態度相對保守。

在國內,以遊戲開發和運營為大眾熟知的崑崙萬維,在行業內率先推出了AI搜尋引擎,其完成度還相當高,足以讓國內現有的搜索產品感受到一種「跨界」的壓力。

基於自研的天工大模型,崑崙萬維已經推出了3款主要的C端產品,即AI對話、AI搜索和AI創作。這家公司還因對全球化和內容創作的前瞻性思考而引人關注。9月初,計算機視覺和機器學習領域的國際頂級專家顏水成教授加盟,而公司自主研發的一款AI UGC遊戲平台Club Koala 也即將上市。

近日,娛樂資本論·視智未來專訪崑崙萬維董事長兼CEO方漢,深入探討了公司在AI方面的最新動向及未來願景。

天工AI工具:AIGC不是都要做成聊天

短時間試用天工AI搜索,就可以給人留下深刻的印象。

在首批8款國產大模型通過備案之際,娛樂資本論·視智未來剛剛進行了第二次國產大模型橫向評測,在其中可以看到天工AI搜索在特定內容生成任務方面有出色的表現。

方漢解釋說,崑崙萬維的團隊在搜索領域的經驗積累比表面上看起來要長。團隊花了六年的時間在搜索領域積累,然後逐漸將其整合成一個產品。

6年前,崑崙萬維旗下一款名為"Opera News"的新聞推薦產品上線運營。這是一款主要面向海外市場的信息流產品,它彙集了幾十個國家的幾十萬個網站上的信息處理與推送。這個過程實質上就是一個小型的搜尋引擎。目前對重點網站的抓取頻率已經提升到每分鐘一次。

6年的時間裡,崑崙萬維的技術團隊積累了豐富的預訓練數據收集、清洗、深度加工等能力。他們也在研究如何確保信息的真實性,比如對各種信息源網站進行打分。對於如何進行信息推送、如何調整內容以適應國內用戶、如何避免信息繭房等問題,團隊也已經有了經驗和對策。

再加上兩個千億模型—— 千億預訓練基座模型和千億 RLHF(Reinforcement Learning from Human Feedback)模型底座,崑崙天工AI搜索應運而生。

方漢提到一些有趣的用戶案例,包括一個公務員寫工作總結,以及使用AI搜索來學習怎麼給老師寫檢討。這些案例讓他意外地發現產品的使用場景更寬廣了。

天工AI搜索後續也將提供圖片搜索、圖片理解等功能。這些AI工具不排除用廣告創收,但方漢認為,廣告並不是最大的盈利模式。

除了AI搜索,天工還包括AI對話、AI創作產品。娛樂資本論·視智未來測試了同一個寫作任務「西湖有哪些美食」,在天工三款不同產品中提問後各自的表現。

天工AI對話的結果相對簡明,而天工AI創作的內容會更豐富,天工AI搜索則可能會加入一些其他平台如知乎專欄的內容,引用的內容均有明確來源。

(天工AI對話)

(天工AI創作)

(天工AI搜索)

天工AI搜索、天工AI對話、天工AI創作分屬於三個獨立的介面,而不是像其它同類產品集成一個統一的聊天窗口。這是因為方漢觀察到,大多數用戶並不會編寫prompt,需要適當引導。很多用戶容易在對話介面中沉迷於「調戲AI」。換成搜索框以後,用戶輸入的指令實用了很多。

方漢得出的一個結論是,普通用戶更需要的是「生成端到端的內容」,直接得到的就是成品,而不是提供給他們一個工具,先做出半成品再調整。這中間的轉化過程,需要「包裝起來」。

因此,天工團隊準備的「下一個大招」是研發出一鍵生成漫畫、動畫或短視頻的工具。他們投入了大量的精力,研究如何將劇本轉化為分鏡,然後再轉化為漫畫。這樣一來,再轉換為AI動畫就會自然得多。

這類產品將首先在海外市場推出。方漢認為,海外的遊戲玩家對內容不夠準確問題的包容度較高,也比較期待具有創意和驚喜的輸出結果。它們一開始就支持英、日、韓文,計劃未來支持泰語、印地語等。

AI遊戲:自由世界和數字陪伴

不過,接下來要說的AI應用,會比上面幾種更突破人們對AIGC的常規印象。

8月25日,崑崙萬維旗下遊戲工作室Play for Fun 自研的AI UGC遊戲平台Club Koala在德國科隆展亮相,這是國內首款出海AI遊戲。

崑崙萬維在海外市場運營近20年,因此對於國內遊戲出海是相當有發言權的。方漢認為,其中一個經驗是做「平台」優於做「劇情」。中國公司在工具和平台的開發上比較擅長,也可以規避第一方內容開發帶來的潛在的文化衝突。

Club Koala是一個輕劇情的,自由世界方向的遊戲,這實質上是一個UGC平台,提供工具,讓用戶自由創作,也符合他們對海外市場一貫的主要策略。

這款遊戲從NPC對話,到衣服、家具、小遊戲以及劇本等,幾乎都可以用AI驅動來隨機生成,或是由玩家自行創作。在捏道具的過程中,玩家甚至「動動嘴」就能創作內容,而不是像以往那樣要手動調節乃至編寫代碼。

Club Koala的目標是把AI滲透到內容創作的全流程中,讓用戶更容易地創作內容,形成社區文化。方漢認為,雖然大部分用戶創作的內容可能質量不高,但如果有一定比例的內容具備販售價值,那就能形成市場。

AI NPC角色是Club Koala的另一個大膽創新。每個玩家都可以創建一個專屬的陪伴角色,這個角色有自己的記憶、生涯,並且擁有海量的問題庫,可以解答玩家的開放性問題。

在多輪對話方面,目前在部分測試中的效果已經接近Character.ai和Replika。實現多輪對話記憶依靠大模型能力和工程能力,創造了一個類似於人類長時記憶和短時記憶的資料庫。

這個資料庫通過大量的標籤來組織向量數據。在對話中,會先定位標籤,再細緻分析解答,以提升響應速度。他們還會根據角色的性格等因素,對重要或不重要的記憶打權重和排序。最後,針對閒聊等場合還有一些專用的小模型。綜合運用這些方法,它們規避了多次使用大模型的算力消耗。

花這麼大力氣設計一個遊戲內的NPC,絕不是為了炫技這麼簡單。在方漢的規劃中,這個AI驅動的數字陪伴項目,具有遊戲之外的社會價值。

在Club Koala上市之初,首要任務是讓用戶願意與NPC聊天;在測試順利後,同一個角色將有希望登陸崑崙萬維的其他遊戲,甚至在其它非遊戲產品和介面上也可以繼續存在,成為一個全時陪伴的角色。從這個角度上講,AI NPC是一個可以在所有遊戲中使用的底座,而他們正在這個底座上進行實驗。

方漢提到,AI遊戲是一個全新的項目,對原有組織結構產生了影響。他們將整個工作室全面轉向平台和產品,這個轉型過程相對比較順利,而員工們也對做AI遊戲萬分期待。

大模型B端應用與晶片版圖相結合

崑崙萬維早前官宣與蜜萊塢科技(映客的母公司)達成千萬以上級別的合作。他們的AI技術可以幫助主播們對其「前幾萬個用戶」提供更有針對性的聊天服務。方漢表示,映客選擇使用崑崙天工,是因為在多輪對話、情感對話方面效果更好。

在這個項目中,天工會篩選優質主播的語料,幫助客戶訓練有代表性的主播角色,再結合主播形象、口頭禪等信息加入提示詞,讓模型進行「角色扮演」。其中的挑戰在於語料清洗和小樣本學習。產品的最終形態則留待客戶自己開發。

那麼,天工在其它領域是否也找到了大客戶?方漢表示,天工B端主要聚焦人力資源、金融和醫藥領域等。海外移動支付項目OPay、科亞醫療等崑崙萬維的關聯企業都有植入AI的潛力。目前,天工已經和一些人力資源公司談成合作,待後續公布詳情。

他認為天工相對其它模型開發商,在大模型訓練和微調方面有3年的經驗,每2周疊代一次,使其具有獨特性,底層也更可控。產品能力和長線思維有助於做成可復用的SaaS產品,而不是來一單做一單的「施工隊」。

崑崙萬維擁有跨國遊戲、應用開發商的C端基因,使得它們更熟悉C端的發展路徑,同時也會通過投資布局一些C端公司。此外,投資的領域還包括新材料、晶片等。

9月20日,崑崙萬維官宣投資並控股AI算力晶片企業艾捷科芯,完成AGI與AIGC全產業鏈布局。艾捷科芯主要從事AI大算力及配套晶片的研發生產,特別聚焦於生成式AI的智能計算。核心團隊由晶片研發、集成電路、人工智慧、大語言模型等領域的知名專家學者組成。

全球化策略是崑崙萬維的醒目標籤。公司的海外收入長久以來穩定占比50%以上,最新財報數據顯示占比更是高達83%。除了遊戲,Opera瀏覽器是公司全球化的另一個經典案例,它的總部在挪威,但大部分研發在波蘭進行。在Opera News等成熟業務基礎上,適配AI的全新瀏覽器Opera One,人工智慧服務Aria等創新不斷湧現,目前Opera的全球平均月活用戶近4億。

近期,計算機視覺和機器學習領域的國際頂級專家顏水成教授加入崑崙萬維,引發廣泛關注。他曾提到,崑崙萬維的務實態度、長期主義視角,以及建立國際化大模型團隊的願景,都對他產生了吸引力。

隨著顏教授的加入,崑崙萬維「2050全球研究院」投入運作,將在新加坡、倫敦、矽谷三地建立研究中心,以吸引更多的海外人才。這意味著公司在基礎大模型領域將投入更多精力,也會積極貢獻開源社區。

這些前瞻性的思考和布局,會使得崑崙萬維比大多數人更早地看見未來嗎?

方漢從多年前開始就一直關注AI技術進展,最近一年多以來,他幾乎每天都在閱讀AI方向的論文。他認為,當前的AI趨勢是由技術驅動,甚至是由論文驅動,而非產品驅動,這是因為技術還在劇烈變化。

提及大模型後下一個「大事件」,方漢把票投給了多模態,尤其是視頻生成,「這是內容工業皇冠上的明珠」。一旦視頻生成的一致性、畫風等問題得到解決,整個影視行業將會被徹底重塑,「甚至懷疑未來是否還有攝像機存在的必要」。

文章來源: https://twgreatdaily.com/zh-my/11bdaadef17fea12fb6e40557ce08de0.html