數字栩生:喚活數字人

2024-09-20   商學院雜誌

數字人產業真正的門檻是閉環能力,數字人持續的生命力靠什麼來營造?商業模式是什麼?

文| 錢麗娜

ID | BMR2004

「無論你成為什麼樣的人,無論你未來將去往何方,我都會愛你,做你永遠的朋友……你是我的靈魂伴侶。」

2013年上映的電影《HER》提出了一個在當時令人難解的問題:人會與AI虛擬人產生感情嗎?哪怕是一個簡單的問題:你是誰?你能成為什麼人?在碳基人與矽基人共生的時代,都變得不再簡單。

01

數字人「活了」

知名藝術家梅蘭芳是如何復現的?

梅蘭芳再一次「復活」了。

數字人技術早先由電影行業而來。傳統的數字人構建過程是通過藝術家進行數字雕刻,把人物的臉型進行數字化建模,通過骨骼綁定,生成可控制的數據角色,但這一技術的局限在於前期需要高水平的藝術家。

而此次復現梅蘭芳時,數字栩生(北京)科技有限公司(以下簡稱「數字栩生」)收集了梅蘭芳的大量照片,邀請中央美術學院教授,以歷史照片為依據,製成梅蘭芳「實體」肖像。之後,技術團隊與雕塑團隊完成了以三維數字化為目標的雕像工藝流程,使用高精度雷射掃描儀對雕像進行掃描,獲取基礎靜態表情,在動作採集部分,團隊邀請梅派弟子演繹,數據錄入後,使用角色生成管線,結合梅蘭芳的表演材料進行精雕細琢。

人臉有40多塊肌肉,能組合成2000多種不同的表情。數字栩生採集人的近60組表情後,將其拆成近500個表情,這些表情運動起來,又能組合出幾千種表情,真實地再現了人臉微妙的信息效果。

在攻克3D數字人技術之後,數字栩生新近還開發出了面部4D動態表情光場採集系統。「3D數字人臉採集就是在臉部打點,拍靜態照片,用算法去還原運動軌跡,而4D數字人臉採集,相當於坐在設備前做動作,獲取的數據是帶時間軸的序列幀。」數字栩生首席市場官郭學贇說。3D人臉採集數據可能需要3—4個小時,現在的4D設備只需要40分鐘到1個小時。「數字栩生不斷推進數字人的研究,從長遠看,一是為了創建數字人製作的平台,二是創建數字人功能性的平台。因為未來的元宇宙里一定會有數字分身。」

近來,外網爆火的TEDx演講者照片超越「恐怖谷效應」,引起了熱烈的討論。在郭學贇看來,這是一個簡化版的小模型lora,技術並不新鮮,數字栩生也能夠達成相似的效果。數字人的真實度還體現在數字人個性化的語言表達、情感和動作上。

為了讓人物動作體現其個性,郭學贇說,數字栩生會在大模型中進行調優,比如加上「怕黑」「愛貓」「神經質」等人物細節,讓數字人變得更加真實。

02

為數字人注入靈魂

在ChatGPT出現之前,1.0階段的虛擬人製作,各家在外形設計上做足了文章。但無論多逼真,都沒有靈魂、沒有思想。

時間回到2019年,北京齊樂無窮文化科技有限公司(以下稱「齊樂無窮」)CEO周道回憶道:「儘管當時市場對虛擬人有需求,但是受技術限制,開發虛擬人的成本非常高,產出極低。定製一個虛擬人至少需要兩三個月的時間。」

齊樂無窮團隊決定開發一個靠「捏臉」就能生成虛擬人的平台,對標的是美國metahuman平台。當時國內遊戲中的虛擬人物都是統一格式,輸出52種基礎面部表情,但metahuman可以做出幾百個骨骼點和表情數。

為此,齊樂無窮推出「虛擬咔咔」,這是全球首款免費創建超寫實AI數字人的UGC平台,用戶可以在「虛擬咔咔」平台快速生成超寫實3D虛擬人,「1500+」調節參數和「40000+」頭部面數,保證了虛擬人形象的千人千面。

周道說:「原先的虛擬人無論多逼真,都是沒有靈魂、沒有思想的。」事實是,在ChatGPT出現之前,1.0階段的虛擬人製作,各家公司在外形設計上做足了文章。而人工智慧出現之後,齊樂無窮將發展方向定為「AI+」虛擬人。「我們看到的趨勢是,人與電腦的交互將從文字轉向數字智能體,這裡將誕生全新的商業機會。」

2000年,一個「網際網路+」時代宣布開啟。2024年,「AI+」也將重塑各行各業的機會。周道說:「在『AI+』的趨勢之下,『數字人』將成為連結用戶的介質。」

03

數字人的商業機會

人與電腦的交互將從文字轉向數字智能體,這裡將誕生全新的商業機會。

當一家律所找到齊樂無窮,提出定製一款「法律數字人」時,齊樂無窮對此進行了深入的市場分析。

齊樂無窮提供的是虛擬人開發平台,並不具備法律專長。從當前市場來看,而「網際網路+法律」領域沒有誕生有市場影響力的商業公司。

齊樂無窮決定另闢蹊徑,以「AI+」的方式,選擇「直播間的法律諮詢」,並以此創建一個「虛擬律師」。

早先,齊樂無窮為數字人取名「包青天」,選擇在快手開設直播。按照平台規定,數字人不能獨立直播,背後必須有真人律師驅動。在挑選直播律師時,一位年輕的女律師成功入選。「包公」變成了女性?團隊靈機一動,索性把「包青天」更名為「包晴天」,外形採用3D卡通形象,這是根據快手平台的人群畫像而定製生成的。

在是否由數字人做法律直播這件事上,齊樂無窮團隊內部也有分歧。一方認為,法律是專業而嚴肅的事,人們只會諮詢真人律師;另一方認為,人們在做法律諮詢時,相對隱私,虛擬人反而讓人更有安全感,更願意交流。

2023年10月,「包晴天」直播間開播,在線普法。在沒有投流的情況下,直播間當天迎來了200多位觀眾。到2024年8月,「包晴天」僅在快手上的粉絲就逼近250萬。周道說:「事實證明,選擇數字人直播是對的,年輕人更喜歡跟虛擬人聊天,遇到校園霸凌、早戀等問題時,他們不敢與家長或老師說,就會來直播間尋求幫助,人們更願意向數字人敞開心扉。」

「包晴天」的專業性其實是來自與齊樂無窮達成戰略合作的一家全球著名律所。合作方積累了30年的法律數據,經過專業人員的數據調優和『清洗』,從而形成了強大的法律語料庫。「包晴天」所提供的內容和意見由專業法律團隊審核和把關,除了直播連線,「包晴天」在短視頻方面也會結合時事熱點為大家帶來解讀。

「中國只有70多萬名律師,要服務14億人,每個人遇到的法律問題不同。數字人直播降低了普法的門檻。」周道說。

周道認為,數字人產業真正的門檻是閉環能力,數字人的持續生命力靠什麼來營造?商業模式是什麼?最終比拼的還是商業模式。要沒有回血能力,虛擬人開發是很難持續下去的。

對比中美兩國數字人在技術賽道和應用領域上的特點,郭學贇認為,美國方面可能更強調底層算法,強調藝術性的表達,注重電影特效,它們在這方面的探索更多一些。相對來說,中國的數字人,且大多是2D數字人在電商平台做直播賺錢。郭學贇說,「中國的特點是找到一個商業化的角度,先把技術用起來。」

04

數字人的法律問題

如果將人數字化,就應該獲得人身權對應的全部授權。

在奇幻動作影片《傳說》中,博納影業推出了成龍年輕時的形象。未來,預計還會有越來越多的數字明星進入市場,而這其中涉及到的版權保護也是全新的課題。

上海大邦律師事務所高級合伙人、智慧財產權律師游雲庭認為,數字人的數字資產包含智慧財產權和數據兩部分。智慧財產權是數字人自身構成的相關智慧財產權,比如美術形象、人物設定。數據則是指用戶和數字人交互所產生的相關數據,這些都有一定的商業價值。

虛擬數字人形象屬於美術作品,但它和用戶互動背後所依賴的資料庫屬於數據集,美術作品則歸設計者所有。如果數字人是由人工智慧創作的,根據目前的著作權法,該作品不受保護。

博納影業在《傳說》中復刻的是成龍27歲時的形象,游雲庭認為,經過授權的形象訓練出的成年或老年時成龍的數字形象,如果沒有協議特別約束,應該不需要另外的授權。授權之後的相應形象是不是可以使用在其他的電影或媒體創作中,也要看雙方原始合同的授權範圍。

版權方獲得了成龍年輕時的數字形象,若新形象與最早的數字形象有極大程度上的相似,是否涉及版權侵權,要看其他使用方獲取原始形象後的訓練是否經過授權,同時訓練輸出的內容也獲得過成龍的授權,那就不涉及版權侵權。

數字人的著作權應該由合同來進行界定,如果合同沒有約定,原始數字人特徵文件還是受保護的,加工使用這些特徵文件,仍然需要原始的技術公司授權,否則新的創作如果發表,就侵犯了原始數字人的版權。

實際上,個人除了版權之外,他還會有肖像權、聲音權、姓名權等權利。如果將人數字化,就應該獲得人身權對應的全部授權。

游雲庭說,在「包晴天」的案例中,如果數字人作為法律普及者,在知識傳播中出現失誤時,首先看它的用戶協議以及用戶的使用提示中有沒有對用戶進行過提示。如果進行過提示,那用戶就有義務去覆核相應的結果,此時出現失誤,數字人的所有方,也就是運營者應該不承擔責任。如果沒有進行過提示,運營方可能還是會有一定的過錯責任。

來源 | 《商學院》雜誌9月刊