「對於AI,大家的想像力還是太匱乏了」

2023-04-28   毒眸

原標題:「對於AI,大家的想像力還是太匱乏了」

北京的咖啡廳是最能獲知當下國內風口的地方,坐在咖啡廳里的人,從區塊鏈聊到元宇宙,再聊到如今的AIGC。現在,幾乎五環內的每一家咖啡廳,都有圍在一起討論AI的客人。

這波技術浪潮來得迅猛,而AIGC(即生成式AI,AI Generated Content)和元宇宙相比,顯得更現實、更有落地空間。其中,ChatGPT的出現很重要,讓每個人都可知可感可操作的應用,是AIGC能迅速席捲國內外各行各業的重要助推力。

另一個同樣流行的概念是「大模型」。前百度總裁、奇績創壇創始人兼CEO陸奇在前幾天的一場演講中提到,是OpenAI帶來了大模型時代,而未來將會是「模型無處不在」的時代。

根據民生證券的統計,4月剛過半,已經有將近30個大模型發布,成為了新的創業風口。阿里巴巴集團董事會主席兼CEO張勇表示:「面對AI時代,所有產品都值得用大模型重做一次。」

讓我們將目光轉回到影視行業。在3月底結束的網絡視聽大會上,幾乎所有人都在談AIGC。——和兩年前的長短視頻之爭相比,今年的平台故事顯然都要圍繞AI來做文章。

不過,究竟應當如何結合?似乎尚沒有明確的答案。騰訊公司副總裁孫忠懷曾提到,「目前看來,ChatGPT應該可以應用於電視劇劇本的基礎編輯,從而節省人力成本,但此外還有哪些可能性?」

這也是為什麼,比起部分崗位已經被AI替代的遊戲、廣告、IT等行業,影視行業受到的影響並不大,雖然有很多人在保持關注、討論與研究,但真正落地、投入應用的並不多。

毒眸諮詢了一些影視行業的從業者,得到的回答也差不多——他們並不認為AIGC在未來會全面取代創作者,因為「靈感和創造力是無法被機器取代的」,真正在使用的一線從業者也不算多。而顯然,身處這波AI浪潮里的創業者們並不這麼覺得,在他們描繪的故事裡,新的技術將是一切問題的最終答案。

因此,我們將在未來持續與入局這一賽道的創業者進行對話,試圖尋找除了「寫劇本、畫分鏡」之外,AI與影視行業真正的連接點,以及遊戲、音樂、短視頻等我們關注的行業,正在或將會被AI改變到什麼地步。

本期我們對談的嘉賓是猴子無限的創始人尹伯昊。猴子無限是一家去年8月成立的AI公司,專注於模型調優。他們在初創時的第一筆投資,來自被稱為「中國AI布道人」的陸奇。據他回憶,這筆投資的達成時間只用了十分鐘。

尹伯昊2015年開始從事相關工作,一直在關注AI領域的發展,並從中尋找可能的創業機會,真正促使他投身這波創業浪潮的,是他判斷到的技術拐點的到來,也就是經過多次疊代後成熟的ChatGPT4。

目前,猴子無限只有五名正式員工,全部線上辦公,他戲稱他們是下一代的「數字辦公模式」。

以下是對談實錄:

AIGC,只是開始?

毒眸:在你的判斷里,大模型所帶來的最大變化是什麼?

尹伯昊:很多人以為AI就到頭了,但其實AI是一個前菜,因為它帶來的變革是人類世界所有的信息都能用新的方式來處理。

最核心的變化是,AI利用數據的方式相比過去發生了很大的變化,比如說過去的1.0時代,像是騰訊會議,微信,本身不產生信息,只搬運信息,也沒有信息處理能力;到了2.0時代,可能是人工建模,或者說是弱AI輔助的模型,比如Excel,CRMERT、HR人力管理軟體等,很多的規則和流程是人類驅動的,這個過程中人類利用數據還是很困難的,需要大量的成本,要麼是人類標註,要麼人類設計流程。

而ChatGPT3做的事情幾乎是無間段的學習,把大量的數據塞到這個模型里,它會自動學習。疊代到3.5和4其實是強化學習的過程,比起上兩代,要麼是完全沒有信息處理能力,要麼是有一些信息處理能力但是人為參與很多,現在是幾乎全自動的過程。

毒眸:所以它改變的是人類世界處理信息的方式?

尹伯昊:過去我們想寫一個劇本,需要讀很多劇本,再總結出規律,比如「英雄之旅」的模式,其實就是人工建模的過程,那麼如果文本足夠多,拿到世界上所有的劇本,那我就能寫出一個這樣的劇本。

同樣地,如果我想要一個姜文風格的劇本,姜文到底是什麼風格?過去我們需要看完他所有的片子,去理解和總結,如果有一個姜文的專屬大模型,就可以讓AI寫一個「姜文風格」的故事。

毒眸:相當於AI代替了人類總結規律的過程,還能復用這個規律。

尹伯昊:對,這是非常重要的特性。圖像也是一樣的,如果把姜文所有的電影里的每一幀切下來構建一個模型,它就能習得姜文的影像風格。這就是大模型時代,很多人沒有看到這些機會,覺得它只是幫我們寫點東西。

毒眸:我們目前已經投入使用的案例有哪些?

尹伯昊:我們在服務一個一次性電子煙的品牌,他們有八萬封歷史郵件,是一些客戶的意見,比如煙彈上飛機會漏油等等,人工總結需要花很長時間,但是生成專屬大模型之後,它會自動學習和拆解這些郵件內容,並且完成郵件回復的工作。

毒眸:聽起來還是TO B的商業邏輯。

尹伯昊:我們解決的核心問題是數據到智能,目前還是TO大B(服務大型企業)的,本質是你給我數據,我給你模型,並且讓這個模型在企業內部成功運作。目前我們已經跟海爾達成合作,給他們製作了創新設計中台。

當然,如果討論個人數據到個人智能的話,就是數字生命了。用你跟所有人的歷史聊天記錄,就可以訓練出你的對話模型,你歷史上寫過的文章也可訓練成自己的寫作模型,我們最終是一個大模型驅動數字生命的公司。接下來我們會也做每個人的數字生命,但還需要一點時間。

毒眸:前段時間比較火的應用Glow,也是定製模型的思路。

尹伯昊:對,我們還跟Glow競爭過客戶,我們贏單了。我們在技術邏輯上是一模一樣的,就是通用模型+私有數據=私有模型,只是商業邏輯不太一樣。

毒眸:現在服務的或者說接觸的企業裡面,哪一類公司會比較多呢?我們比較好奇什麼行業的人會在這個事情上面格外敏銳一點。

尹伯昊:都有,在現在這個階段大街上拉一個人,沒有人不聊。感覺反應時間的長短不分領域,網際網路公司也有不著急的。決策快的人永遠決策快,決策慢的人永遠決策慢。

不過影視行業的客戶目前確實還沒有,可能他們還不認識我們。

毒眸:在你看來,AI和影視的結合點會在哪?

尹伯昊:大家的想像力還是太匱乏了,只是把AI當作一個輔助工具,「過去我拍一個東西要一天,現在只需要10分鐘。」——想像力到此為止了。

但真正應該關注的是,新的媒介能夠產生藝術形式。媒介是人的延伸,AI2.0本身就是一個新媒介。如果訓練一個數字生命,這是不是一種藝術?訓練一個每天能跟我聊天的機器人,是不是藝術?我覺得算,藝術的邊界應該被媒介來擴展。

毒眸:所以真正能帶來變革的是數字生命?

尹伯昊:核心就是數字生命。一個聊天機器人是一種藝術,如果我創造一個已經有基礎設定的新世界,當中有一堆智能體,那麼它本身又是新的藝術形式。

毒眸:聽起來更像是遊戲的延伸形態。

尹伯昊:對,所以遊戲是比影視更大的市場,而且影視和遊戲的邊界也在慢慢模糊,這可能會是下一代的藝術。也許未來電影會變成遊戲的先導片,先設計一個新世界,這個世界裡每個人會產生不同的劇情。

毒眸:傳統的影視形態會被完全顛覆嗎?

尹伯昊:也不會,就像現在還有人看話劇一樣。

AI無法替代的是……

毒眸:像你剛剛提到的,如果導入某個人的所有信息和資料,生成專屬的模型,當中必然會產生版權、法律甚至倫理方面的問題,國家網際網路信息辦公室也在4月11日就《生成式人工智慧服務管理辦法(徵求意見稿)》公開徵求了意見,你如何看待這些問題的產生?

尹伯昊:這不是現階段我們要考慮的問題,技術進步到一定程度,自然會有人來總結這些問題。之前在參加AI閉門會的時候,認識了一個拿過兩次艾美獎的紀錄片導演,他也來找我們聊合作。如果你不去主動拿自己的數據訓練這個AI,就會有別人盜用你的數據訓練AI。

毒眸:前幾天跟一個電影導演聊天,他說如果有個很成熟的可以為他所用的AI,他就可以跟AI一起完成自己的電影,這樣效率會提高很多。

尹伯昊:AI幫人類做輔助已經是非常確定性的事情,以至於我現在覺得這還用聊嗎?難道不是已經發生了嗎?

毒眸:生成一個專屬大模型的時間大概需要多久呢?

尹伯昊:非常快,大家對AI有一個誤解,覺得訓練時間特別久。當然,因為AI學的是全世界所有的知識,又要學生物,又要學物理,還要學歷史,又要學魯迅講話,又要學馬爾克斯講話,當然要很久。如果只學一個人,一天就足夠了。

毒眸:現在我們還是聊文生文、文生圖和圖生圖比較多,進入到三維模態會對影視行業產生更大的影響嗎?

尹伯昊:對,因為3D內容很稀缺,建一個3D內容的模態要幾萬塊錢。像是NeRF在做的事情是,我掃一圈大概需要50張圖,能夠生成一個3D模型,但如果結合AI,可能拍一張圖就夠了。我判斷這個事情會在半年到一年的時間內發生。

毒眸:那文字生成視頻呢?

尹伯昊:也是半年到一年。還是剛剛說的,動作快的人已經在技術非常不成熟的時候就開始了,慢的人可能永遠都不會開始。

毒眸:現在很多影視和動畫公司在管理數字資產、接入相關插件的時候,會遇到每個部門不統一的情況,大模型能夠解決這個問題,幫助這些公司實現「資產統一化」嗎?

尹伯昊:大模型本身是一種壓縮方式,過去幾萬張圖是幾萬個文件,但是大模型能夠能把幾萬個文件壓縮成一個文件,同時無損地解壓出來,大模型就是壓縮和解壓的過程。

毒眸:同時還能夠進行自主分類。

尹伯昊:對,可能10個角色的各1萬張圖全部壓縮到一個模型裡面,它可以靈活地解壓出10個角色。你可以把大模型理解成一個可執行的壓縮包,我覺得大模型有三個核心的特性,自訓練、壓縮和泛化,你剛剛提到的是壓縮。

毒眸:現在很多人在面對新的技術浪潮來臨時,普遍會產生焦慮情緒,如果大模型真的能替代掉很多工作崗位,未來會發生什麼?

尹伯昊:首先,每個人都有base income(基本工資),這是一定會發生的,因為很多人就是會被替代掉。

另外一個維度關係到每個個體,比如說過去我是開馬車的,現在我開汽車,所以新的技術也會帶來新的崗位。過去寫代碼要很多人一行行地寫,所以寫代碼是很貴的事情,現在寫代碼非常容易,人人都能寫代碼,造自己的東西,這個世界代碼總量就會更多,工作機會也更多。

第三種就是會有全新的崗位誕生,包括現在我們公司有的新崗位,數據清洗、模型訓練等等,這些都是新的工作崗位。

毒眸:最後一個問題,我們作為內容創作者,會認為AI永遠無法替代的部分是人的靈感、情感和創新的想法,你同意這個觀點嗎?

尹伯昊:他們只能自己洗腦說「我是姜文」了。我是覺得AI現在可能只能達到寫3年劇本的人的水平,但未來會一直突破,可能除了姜文的寫不了其他都能寫,而且它還能模仿姜文。

毒眸:那如果我們拋開內容創作者的角度不談,你有沒有考慮過AI永遠無法替代的部分是什麼?

尹伯昊:挺難的。

毒眸:比如說我們訓練一個能夠訓練大模型的大模型,未來是不是你也可以被替代?

尹伯昊:那也有可能,我們所有人要做好拿base income的準備,這是早晚的事情。