文/陳妍
編輯/大風
這年頭,是個企業都要搭上AIGC的順風車。
自從ChatGPT問世,各種AI視覺大模型公司也像雨後春筍般湧現。數據顯示,國內目前已發布的AI視覺大模型超過30個,還有100支以上的創業團隊在路上。但仔細觀察會發現,大部分大模型只是描述了一個「完美」的概念。
它們的產品沒怎麼打磨過就匆忙上市,用戶真實的使用體感很差。尤其是在企業生產環節,許多大模型與工作流的結合仍在初步探索階段。
很長一段時間裡,AI視覺大模型的都是空有其名,從企業到用戶,都在等待一場真正攪動風雨的暴雨洗禮。
最近,鋅財經發現美圖公司舉辦了15周年生日會。生日會上,創始人兼CEO吳欣鴻官宣了一件大事,美圖自研AI 視覺大模型MiracleVision發布3.0版本,最新的大模型將運用到美圖旗下所有影像與設計產品,助力電商、廣告、遊戲、動漫、影視五大行業。
MiracleVision 3.0版本的核心能力可以拆分為「奇思妙想」和「智能創作」兩部分,除了輸入文字生成相應圖像、輸入塗鴉秒變大作這些基本操作外,大模型的「智能腦補」和精準控制能力都進一步加強,降低繪圖、修圖的門檻,實現創作平權。
美圖15周年生日會直播
對於美圖的種種新動作,二級資本市場也已經做出來自己的回答。近幾個月來,美圖公司的股價持續呈現出上升趨勢,截至目前總市值突破172億港元。
不難發現,在這場對AIGC探索的長跑中,美圖拉著用戶跑到了最前面。
美圖上一次有更新動作,還在100天前。
今年6月,美圖首次發布的視覺大模型MiracleVision,已經給整個行業帶來驚喜,它能從繪畫、設計、攝影等視覺創作場景反推技術演化,尤其擅長亞洲人像攝影、國風國潮等生成方向。但當時,吳欣鴻直言:「AI帶來很多機會和挑戰,但這個機會不一定是我們的機會,而挑戰是實實在在存在的。我還是一個如履薄冰的狀態。」
這種對技術的重視度和危機感,讓美圖大模型在很短的時間裡再次做到疊代升級。吳欣鴻介紹說,三個月前,MiracleVision繪畫水平還停留在初級階段,如今3.0版本已經能描繪出真實細膩的畫面細節。
鋅財經親身體驗了以MiracleVision3.0為內核的AI視覺創作工具WHEE。在對話框中輸入「一個小女孩」後,平台會提供智能聯想,把關鍵詞補全為「兒童畫,小女孩,純真的笑容,綠色草地,高解析度,卡通風格,可愛,陽光明媚,水彩效果」,設定完基本參數,再等待數秒後,生成了4張畫面內容各異的小女孩圖像。文生圖截圖
文生圖截圖
具體來看,這些畫像注重細節勾勒,畫面精緻符合美學結構,人物效果栩栩如生,甚至有合理多變的光影效果,氛圍感拉滿。
一般用戶可能不太懂有關繪畫、照片的專業名詞,比如光影效果、質感、風格、圖片質量等,美圖的「奇思妙想」能輔助沒有美術功底的用戶,提供創意靈感。如果有更專業的需求,MiracleVision的「提示詞精準控制」功能,還可以輕鬆實現近景、遠景、順光、逆光等生成效果。
「智能創作」是美圖辦成的又一件大事。MiracleVision的「深化創作」功能,能進一步豐富作品細節和提升表現力;「AI畫面擴展」功能讓作品尺寸更大、細節更豐富;「局部修改」功能,可以指哪改哪,對部分畫面進行精準修改與調整;「解析度提升」功能可以生成高清大圖,讓細節表現、色彩展示、物體辨識更加精準和生動。
可以看到,這次美圖大模型的更新,試圖從根源上解決圖像的精確性和可控性問題,讓AI視覺生成上了一個台階。
一定程度上,把AI視覺大模型用到工作流程中,是比單純做好視覺呈現更困難的事。雖然生活場景和生產力場景技術底層是共通的,但實際應用場景很不一樣,需要做很多精細化的適配工作。
這次美圖MiracleVision3.0版本的推出,更大的意義就在於,它能落地電商、廣告、遊戲、動漫、影視五大行業,來幫助工作流提效。
就拿電商行業來說,做物料一直是頭大的事情。很多鞋服企業每年光是找攝影團隊、模特拍攝上能花掉幾十萬甚至上百萬,而且真人模特拍攝是一錘子買賣,後期想要再調整修改,也會很麻煩。
如今在美圖設計室里,商家可以實現從塗鴉生成線稿、線稿上色、商品圖、模特試穿圖,再到電商物料輸出的全過程,極大提高生產效率、降低成本。
用「AI鞋服」工具可以完成初步的商品圖,選擇線稿參考圖、材質、文字描述後,一次性能生成8張圖片,生成結果也能二次微調。
美圖設計室「AI鞋服」截圖
·美圖設計室「AI鞋服」截圖
然後在「AI商品圖」上,能把剛做好的商品圖自動摳圖,選擇合適的場景,進行細節優化。最後再在「AI海報」看到海報效果。
美圖設計室「AI商品圖」截圖
美圖還研發了「AI模特試衣」工具,上傳人台圖或真人模特圖後,能定向選擇保留或去除哪部分商品內容,然後在模特庫里挑選所需的AI模特,性別、人種、膚色都可以自定義。稍等片刻,就會生成AI模特試衣圖,如果對效果不滿意,還能換模特,重新編輯。
美圖設計室「AI模特試衣」截圖
不難發現,美圖視覺大模型的出現,形成了AI原生工作流。在創意腦暴後,AI能快速生成各種創意視覺方案,確定最終創意後,AI又能快速把創意細化,完成最終作品。因此,原本會延續一周以上的工作時間,被壓縮到三天,甚至更短。
在吳欣鴻看來,AI視覺大模型的本質,是無窮無盡的視覺創意庫,應用層則是內容提取器,「根據用戶的需求,從這個巨大的創意庫中提取所需要的內容,讓用戶在特定場景中使用。」
將視覺大模型3.0版本做到的精確性和可控性賦能垂類工作場景,為行業降本增效,這是美圖的目標。
時至今日,美圖與AIGC已經深度綁定了。
早兩個月,美圖公布2023中期業績,上半年實現總收入12.61億元,同比增長29.8%;歸母凈利潤1.51億元,同比增長320.4%。美圖公司月活躍用戶數達2.47億,同比增長2.5%。具體分業務來看,影像與設計產品收入高達6.02億元,同比增長62.2%;美業解決方案的收入2.86億元,同比增長31.1%。
美圖2023中期業績
不難發現,在AIGC技術的驅動下,美圖在AI圖片、AI視頻、AI設計等領域持續創新,推動影像與設計產品(主要是通過VIP訂閱收費)收入大幅增長,從而幫助美圖實現了營收增長和全面盈利。
事實上,AIGC在影像領域的應用場景,還有更廣闊的市場空間。生日會上,吳欣鴻分享了自己的看法,視覺大模型應用普及將經歷三個階段:2024年之前為探索期,2024-2025年為高速發展期,2026-2030年為成熟期。
視覺大模型在生產端的應用逐漸走向成熟,到時候會助力千萬設計場景,引領美學的升級與社會經濟增長。
那麼對於美圖公司來說,這也是更大的發展機遇。根據財報數據,截至2023年6月,美圖的VIP用戶數量達到720萬,但付費滲透率只有2.9%,還有很大的上升空間。
一個趨勢是,未來美圖的收入將主要由影像與設計產品業務驅動,預計到2025年影像與設計產品收入將超26億元,是2022年的三倍有餘,美圖也很有可能成為最具影響的影像訂閱企業之一。
如今的成就,是美圖過往努力取得成功的里程碑。在AIGC的浪潮中,美圖還在向行業釋放更多想像力。