2024中國生成式AI大會於4月18-19日在北京舉行,在大會第二天的主會場AIGC應用專場上,極睿科技創始人兼CEO武彬以《AIGC全鏈路電商內容生成的前景與挑戰》為題發表演講。
成立於2017年的極睿科技是一家「清華系」創企,算法團隊源自清華大學計算機系NLP實驗室,基於AIGC打造電商內容生成引擎。武彬分享說,極睿科技打造了業界唯一的一站式全角色x全鏈路x全類型電商內容生成方案,把電商內容全部通過AI的方式來做。
在武彬看來,當下電商行業圖文和短視頻的內容數量與需求都在大幅上升,內容關聯著平台、賣家與買家的核心交易訴求,但內容製作效率嚴重不足。而極睿科技的AIGC工具和方法論在電商場景已經得到很好的驗證,幫助商家將成本縮減為原來的1/5。該公司曾用1條視頻幫助一家杭州女裝品牌一個月多賣出兩三千萬元。
極睿科技已推出ECGPT+FashionCLIP基座模型及多種電商垂直大模型,可支持商品AI拍攝、AI排版上新、AI直播切片、AI生成商品短視頻、AI帶貨、一站式AI技術與數據服務平台、智能商品作業系統等多種功能,目前已合作超4萬電商客戶。
以下為武彬的演講實錄:
我們是一家基於AIGC能力做電商內容的公司。為什麼選擇這個賽道?電商內容滿足兩個條件:
第一,需求量非常大,大家可能日常都會在淘寶、京東、抖音、快手購物,每天都會產生大量的內容。
第二,電商內容的價值可量化,會極大影響GMV(商品交易總額),電商內容做得好或者不好,對GMV有很大的影響,我們希望能夠通過AI的方式在這個領域降本增效,開源節流。
我們團隊主要是清華背景的算法團隊,我是清華本碩,出身於自然語言處理(NLP)實驗室,是一個專門做大模型和自然語言的實驗室。畢業後,我創業成立了這家公司,到目前為止拿了四輪融資,包括金沙江、紅杉、魔量、順為等。
我們現在在專注做「AI+電商」行業里算是比較頭部的公司,目前服務全網大概兩千家品牌和四萬多家店鋪,大家打開淘寶、抖音,上面很多耳熟能詳的品牌,像安踏、伊芙麗、馬克華菲,也包括電器、食品品類,圖片視頻基本是我們幫他們做的。
這樣既省掉了原來的電商內容製作成本,也可以幫他們多賣錢。有的品牌通過我們製作的圖片、視頻,可能一個月多賣兩三千萬。AI既是一個省錢利器,也是一個掙錢工具。
我們也對接了國內非常多的電商平台,核心做了3個事情:電商內容的製作、管理、分發。我們可以自動化把電商內容做好、管好,分發到電商平台上,通過這些內容做進一步的成交。
這是我們整體產品的矩陣和鏈路,當商家把內容上傳上來之後,通過多個自動化工具,包括PhotoMagic自動做圖片,EC Pro自動做排版布局和加工,自動化做成主圖、詳情頁海報,以及iCLIP視頻工具,可以自動化做好視頻。
我們把文本、圖像、視頻從拍攝、排版到短視頻一站式做好。基本上商家所需要的電商內容,都可以通過AI的方式來做。
一、電商對內容的訴求攀升,內容決定商品賣得好不好
我們發現的行業趨勢是整個電商對內容的訴求一直在上升。
一方面,電商變得越來越碎片化。之前淘寶一家獨大,大家只要把淘寶圖片做好就行,隨著抖音、快手、微盟、拼多多、得物、小紅書誕生,商家需要做各種平台適合的內容。
另一方面,之前大家只需要做圖,現在也需要做視頻、直播,做更多的內容,商家的人力成本上升了,同時平台數量也上升了。而每個平台對於內容的喜好不一樣,比如這個平台主打降價促銷,這個平台主打新品,這個平台主打次日達,要做出適合各個平台不同的內容。
我們能幫助商家用AI來自動做多個版本的內容,覆蓋這些平台和消費者。
對於平台、商家和消費者來說,內容是非常重要的樞紐。平台希望通過內容把消費者留下,拉更多停留的時長,促更多的GMV;商家希望通過內容把自己的商品賣出去;消費者希望通過內容了解商品。很多消費者在線下購物,對於商品的感知可能是觸摸一下、試穿一下,但在線上所有的理解都基於內容。
我們有一個觀點,就是商品賣得好不好,極大程度上取決於內容,只有退不退取決於商品。因為商品到消費者手裡之前,所有的理解都是基於內容,包括主播的講解、圖片和視頻,內容會極大程度上影響成交。
目前我們通過一系列SaaS工具幫助商家做好內容,在上層通過工具來引導和實現更多的成交。
二、電商要求百分之百的可控性,AI工具能帶來上萬倍ROI投入產出比
我們定義一個產品誕生之後,基本會經歷這些流程:
第一,拍攝。幫商家合成圖片,包括模特圖、場景圖、外拍圖。
第二,排版布局。把商品圖變成精美的頁面,大家日常去看主圖詳情頁,可能看到這些海報的複雜程度非常高。
第三,短視頻。短視頻的製作方式前面有人提到Sora、Pika、Runway,但在電商裡面這些工具很難直接來使用,因為電商要求百分之百的可控性。
如果通過Prompt指令做了這個衣服,有任何細節變化跟商品不一致,在電商裡面都叫貨不對版、虛假宣傳,電商要求百分之百可控以及可控基礎上的多樣。目前來說不管圖生視頻還是文生視頻,都很難解決這個問題。我們做的方式更多是基於圖片或基於視頻,做自動化剪輯、混剪或美化包裝,跟Sora、Pika和Runway有些區別。
再到後面的運營、種草,我們也會通過AI做更多的內容。
我們的工具和方法論在電商裡面得到很好的驗證,比如成本能達到商家原來成本的1/4到1/5。之前商家需要雇很多人,像編輯、美工、運營、文案、剪輯師,一年的成本大概要二三十萬,但我們基本上能做到原來成本的20%左右,可能只要三四萬,比雇一個人的成本要低很多就能解決這個問題。
其次,因為我們積累了大量的數據,我們知道這個平台或者這個時代用什麼樣的背景音樂、特效字幕、水印、LOGO做視頻更好,也知道不同的商品如何做包裝更好,我們做出來的圖片、視頻點擊率可能比單人做得更好。
通過之前的驗證,我們做的單條視頻幫助杭州一個女裝品牌,用1條視頻1個月賣了100多萬,整體1個月多賣了兩三千萬。它只要付給我們一年幾萬的費用,對於它們來說一年有幾個億的產出,這個ROI投入產出比可能達到上萬倍。
三、打造首個電商垂直大模型,提供圖文、排版、直播多個工具
這是我們的底層模型,一部分是我們自研的基座模型,一部分是通用模型改的垂直電商大模型。
前面講過由於電商的百分之百可控性要求,以及在可控基礎上的多樣性要求。在基座模型層面,我們通過NLP或者計算機視覺識別的能力,理解識別這是一個什麼樣的圖片,以及圖片當中是什麼樣的商品,或者這是一個什麼樣的視頻,視頻中是模特走秀、穿搭還是街拍,這個模特在閒聊還是講什麼樣的賣點。在基座模型的基礎之上,我們通過大模型做可控的生成,比如識別到是碎花V領連衣裙,應該通過什麼方式來展現。
這是我們的幾個產品基座。
圖文板塊PhotoMagic,可以通過假模特自動生成模特圖,把衣服穿到一個真人身上。商家不需要請一個模特,不需要場景街拍,就可以實現一個模特在巴黎香榭麗舍大街或者塞納河畔的樣子,極大地降低了拍攝成本。
這是我們的排版布局產品ECPro,大家打開日常淘寶的主圖詳情頁海報圖,它可以通過識別圖片生成相應的標題、文案,生成排版、作出裁剪,做出精美的頁面。
這是直播切片工具iCut,我們會通過識別能力,識別到在一個七到八小時的直播當中,這個主播在哪一段核心賣點講得比較高,比如講了商品細節,講了面料,講了垂感、親膚的材質,在這個地方講了食品的安全性等。
識別到這個賣點更精準或者賣點密度更高的片段之後,我們把賣點摘取出來,放在混剪里,帶貨效果更好。如果這個商家不做直播的話,我們也會通過圖片的方式幫它合成視頻。
四、立項AI MCN機構,拓展海外業務和更多品類
我們看到做出來的視頻或者圖片帶貨效果更好,因此在去年開始立項自己做了AI的MCN機構,它其實更像是一個Agent服務。
我們之前的所有工具服務更像Copilot,商家使用我們的工具,一起來創作內容,我們通過內容的方式跟商家收SaaS訂閱服務。MCN業務更像Agent服務,商家直接用我們的MCN,通過我們做出來的內容直接做帶貨成交,我們從額外的成交當中賺CPS(按銷售成功訂單付費)。
比如我們幫助商家一個月多賣了一千萬,我們拿10%,100萬左右的佣金。通過這樣的方式也能證明我們的內容有價值,收集更多的數據,讓我們知道什麼樣的內容有更好的變現方式,有更好的商品展示能力。
最後總結一下我們的優勢。我們相當於有自己的行業Know-how,知道電商品類需要什麼內容,我們非常專注在電商內容,但是有幾個拓展方向。
第一是拓展海外。之前我們主要做國內商家,今年做了跨境服務,把國內的視頻自動化翻譯到海外。比如人臉翻譯,將中國模特翻譯到海外變成歐美、日韓或者其他模特;字幕、音頻翻譯,字幕變成英文,音頻變成英文。
其次,拓更多的品類、區域和更多的變現方式,比如從傳統的工具再到MCN業務,提供全鏈路、全流程、全類型的服務。
我們還有一個優勢是能幫商家算清楚帳。所有客戶的價值排序都是開源節流、管理髮展,首先是你能不能幫我多賺錢、省錢,再下面才是管理和發展的需求。我們可以算出來商家一個月通過我們的服務能多賺多少錢,視頻幫他們多賣多少錢,以及省掉多少人工成本。這也是我們選擇電商的理由,需求很大,並且內容的價值可量化。
我們在全國各地都有分布,尤其在電商聚集帶,像杭州、上海、廣州、深圳、廈門,今年可能會擴展一些海外業務。我也從去年開始做創始人IP,定期分享一些AI和電商的乾貨,大家如果對我們的業務感興趣,或者對電商和AI感興趣,都可以來關注我們。
以上是武彬演講內容的完整整理。