華為雲媒體創新技術,重塑音視頻產業生產力

2023-08-02     華為雲

原標題:華為雲媒體創新技術,重塑音視頻產業生產力

近日,LiveVideoStackCon2023上海站圓滿舉辦,近百位行業大咖齊聚大會,從AICG、元宇宙、多媒體、傳輸網絡等不同視角切入,覆蓋娛樂、醫療、安防、旅遊、電商、社交、遊戲、智能設備等行業領域,分享音視頻領域的當前技術發展,探討未來趨勢和前景。華為雲媒體服務產品部多位專家受邀進行主題演講,帶來行業最新技術成果分享。

直播+X,突破時空限制,超越真實的內容體驗

華為雲媒體服務產品部副總裁陸振宇在《直播+X,直播行業新趨勢》主題演講中,分享了直播行業對新技術的需求和應用;在現階段電商直播蓬勃發展、時空範圍不斷擴大、數字人直播盛行的大背景下,就華為雲如何高質量地幫助客戶在全球化語境下開展業務,為全球客戶的業務提供服務展開了分享。

消費者在國內看視頻、直播的時候,本質上是用的一個國家的一張網,在此情況下,都能達到不錯的體驗調優效果;但放眼全球,多個國家地區千差萬別的網絡質量、條件和業務場景,要實現良好的交流體驗,構建一個分國家、分協議、自動化的數據驅動的調用系統很有必要。

華為在很多年前,就已經在為華為全球170多個國家的分支機構、消費者用戶提供會議、暢聯等實時音視頻服務。華為雲通過全球一張網的規劃和落地,解決了本地覆蓋問題;通過多拓撲網絡平面選路算法,保障了跨區傳輸體驗;基於WebRTC的低時延分發算法,將E2E時延<500ms,保障跨大區互聯最優時延,確保用戶最佳體驗感;最後,通過流量級和應用級可視化、質量可視化、帶寬可視化,解決全球運維效率問題,助力夥伴全球業務開展。

隨著AIGC的發展,數字人直播盛行,如何在這個行業里服務好做業務創新的夥伴,降低算力成本和傳輸成本,以及如何降低技術使用門檻的問題。華為雲的解決方案是MetaStudio數字內容生產線,通過模型製作、直播話術及一卡十路的能力,降低數字人直播入門門檻,解決有效運營及快速降本問題。

  • 夥伴通過API方式接入使用,可以高性價比、高質量的製作數字人;
  • 除了形象,還提供數字人預置音色、音色克隆、高保真音色克隆等音色服務;
  • 除此之外,華為雲通過昇騰的算力、算力之上的模型層、數字人算法、渲染、推流到直播平台全套的解決方案,幫助用戶快速實現生成式直播。

華為雲MetaStudio,人人皆可擁有自己的個性化數字人

華為雲虛擬數字人技術負責人李明磊分享《華為雲MetaStudio多模態數字人進展及挑戰介紹》,對數字人建模、編輯、驅動進行技術解讀,深度闡述了數字人視頻製作、直播、交互的流程,以及介紹了華為雲數字內容生產線MetaStudio提供的一系列基礎服務。提供數字人三種生成方式:

  • 文字生成數字人:輸入對形象的描述,10s左右即可生成數字人,可以被後續驅動;
  • 照片生成數字人:一張照片,一分鐘生成數字人;
  • 視頻生成數字人:更多用於數字人直播場景,需要五分鐘語料,訓練3-6h,生成數字人形象。

華為雲MetaStudio,大大提升了數字人的生產製作效率,在傳統動捕方案之外,數字人單目驅動、數字人語音驅動表情和肢體、數字人情感風格肢體驅動讓數字人的使用更加簡單。

華為雲渲染,助力渲染全場景業務遷移上雲

華為雲渲染服務技術專家陳普帶來《華為雲渲染實踐》的演講分享。據分享,渲染場景分為離線渲染與實時渲染兩類場景。其中離線渲染場景主要用於影視、高清設計圖等渲染場景。

華為雲離線渲染AI加速,幫助客戶在華為雲的離線渲染業務提升渲染效率,顯著降低渲染資源消耗。華為云云原生光追渲染服務,提供豐富的材質兼容,幫助家裝設計類場景可以離線分鐘級出高清渲染圖,大幅度提升渲染效率。

實時渲染在數字人、數字人、虛擬展廳、工業等場景被廣泛使用。華為雲3D應用實時雲渲染結合華為實時音視頻服務,幫助企業將現有3D應用直接上雲,客戶端無需高級硬體即可以獲得高質量流暢體驗。

  • 華為雲MetaEngine的實時渲染技術,支持物理真實的渲染、仿真、動畫能力;
  • 實時光追渲染管線支持數字人、地形、水體、天氣、植被等豐富的場景渲染,滿足多場景製作的效果與性能,融合華為雲多用戶復用技術,還能夠提升單機並發能力;
  • 華為雲工業圖形渲染引擎,可幫助CAD、CAE實現高性能工業可視化圖形渲染與光追真實感渲染。

華為雲媒體基礎設施通過一系列創新技術,解鎖更多新場景和新玩法,不斷拓寬視頻直播業務邊界,實現更實時、更沉浸式的互動體驗,重塑音視頻產業生產力,賦能音視頻產業新發展。

文章來源: https://twgreatdaily.com/zh-tw/3de9507501f1c1d6947a5ea8a83a3210.html