一分鐘視頻就能訓練出一位AI虛擬主播,最多能講129種語言

2023-10-19     DeepTech深科技

原標題:一分鐘視頻就能訓練出一位AI虛擬主播,最多能講129種語言

在撰寫有關中國的文章時,我經常遇到的一個問題是:有哪些技術在中國無處不在,但在西方國家卻沒有流行起來?我的首選答案之一是直播電商(帶貨)。

如果你不住在中國,很難理解直播電商有多麼流行。超過 5 億中國人經常觀看。2022 年,這些直播帶來了數萬億的銷售額,這意味著中國超過四分之一的網上購物銷售額來自直播。

(來源:STEPHANIE ARNETT/MITTR | MIDJOURNEY (WOMAN))

科技公司一直試圖將這一利潤豐厚的業務帶到中國之外的地方,背後的原因顯而易見。早在 2020 年,我就報道了這一舉措,當時阿里巴巴的海外子公司速賣通(AliExpress)正在聘請外國人才,用英語、俄語和其他語言創建類似的直播帶貨。儘管中國公司不斷努力,但這個想法從未被海外的主流觀眾接受。

最近,TikTok 已經在美國正式上線直播購物功能。不過,這給我一種似曾相識的感覺,因為這是該公司自 2021 年以來一直表示將要做的事情。

但是可以肯定地說,美國目前仍不存在廣泛的直播購物需求。Marketplace Pulse 公司創始人、電子商務分析師尤薩斯·卡齊烏肯納斯(Juozas Kaziukėnas)在 X(原推特)上表示,即使是 TikTok 的狂熱粉絲也不一定對這個新功能感到興奮,並引用了上周的另一條推文:「TikTok 商店毀掉了整個應用,廣告和測評充斥其中,而不是愚蠢的小視頻。」

相比之下,在人工智慧的幫助下,中國的帶貨主播卻迎來了擁有前所未有的突破機會。

在中國的電商平台上,廉價便捷的人工智慧工具正在使用「深度偽造」技術,幫助品牌商創建無數個虛擬(化身)主播。開發人員只需要一分鐘的視頻來訓練「虛擬主播」,並為人工智慧生成的虛擬化身收取約 8000 元的費用。他們幾乎跟真人一樣,可以在鏡頭前說話和行動。這樣的虛擬主播超過 40 萬個,早已被部署在成千上萬場購物直播中。

這或許有助於消除將中國式直播購帶貨拓展到海外的最大障礙之一:缺乏了解直播電商如何運作、在鏡頭前表現自然、願意每天花上十個小時跟大家聊天的外國帶貨主播。因為這項工作很大程度上是重複的。在中國,有一些學校專門培訓對這個行業感興趣的主播,但海外尚不存在同樣的生態系統。

有時,電子商務品牌會採用創新措施來解決人才缺口。中國人工智慧主播營銷公司 Quantum Planet 的執行長 Chen Dan 表示,他看到一家中國藍牙耳機品牌聘請泰語配音演員錄製音頻,然後播放一隻手展示和測試產品的視頻,看起來就像展示產品的人也在說泰語一樣。

但憑藉大型語言模型和文本轉語音技術,只要你想,這些人工智慧主播可以講任何語言。

最近,一款新的人工智慧翻譯產品在社交媒體上火了。總部位於美國洛杉磯的 HeyGen 推出了一款工具,可以將視頻翻譯成七種不同的語言,同時克隆說話者的聲音,並同步說話者的嘴唇動作,讓一切看起來都很自然。成品視頻效果出奇地好。

有了這些工具,或許就不再需要尋找當地的直播人才了。「語言實際上是虛擬主播的優勢(與人類相比)。我們的許多客戶有興趣在東南亞開展跨境電子商務,需求非常高,」中國人工智慧企業小冰公司的虛擬網紅直播業務總監 Huang Wei 表示。

小冰和 Quantum Planet 現在合作向中國客戶推銷這些人工智慧主播。他們的虛擬主播可以講 129 種語言,包括英語、越南語、泰語和印度尼西亞語等語言。

2023 年 3 月,他們首次使用泰語人工智慧主播為一家中國公司銷售家具,一小時內售出了價值 2000 美元的產品。我請一位以泰語為母語的人觀看了一段剪輯並評估人工智慧的質量。他告訴我,虛擬主播的語調非常自然,他幾乎認為這就是配音。

顯然,人工智慧無法完成人類主播能做的所有事情,尤其是實時測試產品以回答觀眾的問題,但它適合那些只是想打入新市場但不想花太多錢的公司。據報道,印度尼西亞當地主播的月薪幾乎與定製人工智慧主播的成本相當,而且從長遠來看,重複使用人工智慧的成本比留住真人的成本要低得多。另外,使用人工智慧的結果比大多數人預期的要好。

這是否意味著直播電商終於要在海外流行起來了?我對此仍持保留態度,我們可能不會很快看到直播電商席捲西方市場。但我確實認為,人工智慧可以幫助中國企業克服語言和文化障礙,實現全球擴張。無論哪種方式,很明顯,合成媒體技術正在以令人難以置信的速度向前發展,因此中國電子商務公司最終能夠利用它賺錢可能只是時間問題。

支持:Ren

文章來源: https://twgreatdaily.com/zh-mo/39d66b11bfa47b1542b17b354859aaa1.html