誰說大模型都是冰冷的代碼?其實,它也可以塑造「血肉之軀」。在8月15日訊飛星火認知大模型V2.0升級發布會上,我們見識了虛擬主播介紹世外桃源「桃花潭」的美景,也親眼目睹了虛擬外教與劉聰院長「狂飆」口語的炫酷。而這些應用場景,都源於星火V2.0在多模態能力上的提升,讓視頻內容生產與英語學習效率大幅提升。
中金研報曾指出,如果虛擬角色在大模型等技術助力下,能夠實現與用戶實時智能互動,用戶將獲得更具真實感的體驗,繼而激活一個巨大體量的市場。何況,科大訊飛依託星火多模態技術,率先將其用於視頻內容生產。根據中國電子信息產業發展研究院發布的數據,預計2023年中國超高清視頻產業規模將達到4萬億。同時視頻產業是一條涵蓋生產、分發、消費等上下游的長鏈條產業,僅生產環節的市場規模就從2016年的19億飆升至2022年的3860.7億元,年均復合增長率達到222.34%。
基於視頻生產環節巨大的商業機會,訊飛星火認知大模型以多模態技術實現「虛擬主播」出鏡,不但極大提升了視頻內容質感和新穎度,還能化身「景點導遊」、」室內導覽」以及「銀行客服」等身份,在旅遊、展覽、金融等各行各業發揮巨大價值。據悉,科大訊飛虛擬人服務已在各行各業遍地開花,並與新華社、央視動畫、中信銀行、中國平安等公司建立了合作,在北京冬奧會、成都大學生運動會等世界性體育賽事,訊飛虛擬人技術都進行了精彩呈現。
為了極致簡化使用難度,科大訊飛在星火V2.0發布會上,重磅升級了訊飛智作2.0一站式AIGC內容創作平台。用戶只要錄製一段真人出鏡的3-10分鐘視頻,再將視頻放到訊飛智作2.0平台進行訓練,即可生成1:1還原的真人虛擬數字分身。同時也可以選擇不同風格的配音,讓虛擬人具有多情感演繹能力,結合內容本身的喜怒哀樂來控制語氣、語調和停頓,讓用戶看到「有血有肉」的溫情演繹。
2023年下半年,當同類大模型還停留在文本「二維」階段時,訊飛星火認知大模型已進入音畫「三維」階段,實現了AIGC技術在內容生產與各行各業的「智慧湧現」。同時訊飛星火助手中心上線的一千多個智能助手,全方位滿足了職場、營銷、創作等各類場景需求,助力全方位提升工作效率,降低時間成本。而時間,就是這個時代最寶貴的東西!
如今,大模型正在悄無聲息、卻又影響深遠地改變著人類世界。面向未來,正如訊飛董事長劉慶峰所期盼的那樣:「今天訊飛星火2.0發布後,我們還會迎來3.0、4.0,希望到那時你已經成為了我們的夥伴,無論是API的開發夥伴、共建行業生態的夥伴、還是做最終應用的夥伴,相信都將成為在星火賦能之下工作和生活更幸福的夥伴。」