騰訊雲ASR全新升級,多模態融合算法大幅提升準確率

2024-01-09     電腦報

原標題:騰訊雲ASR全新升級,多模態融合算法大幅提升準確率

騰訊雲ASR全新升級,多模態融合算法大幅提升準確率

近日,騰訊雲宣布全面升級其語音識別(ASR)方案,基於大模型能力,複雜場景下的識別率提升了20%。騰訊雲ASR現已支持23種方言,採用業界首創的高性能引擎,並突破了現有ASR引擎的場景局限,可靈活應用於線下銷售、下沉市場等場景。

通過自研多模態融合算法、蒸餾和半監督算法,騰訊雲ASR強化了上下文理解能力,減少了語音數據的標記工作,提升了複雜識別環境的準確率。採用無監督學習,該方案加入大量未經標註的低資源數據,在垂類行業音頻和方言音頻上取得了重大突破。

如今,智能汽車普及、短視頻配音、企業出海等趨勢興起,多語種、多方言的語音識別需求逐漸加大。騰訊雲ASR採用了自研的高新技術,打造多項業界首創的高性能引擎,增強了ASR混合和識別能力。此外,還支持熱詞增強版、ASR情緒識別等多項業界首創功能,進一步改善了複雜音頻和低信噪比識別效果。

升級後的騰訊雲ASR不僅解決了現有ASR引擎在高並發和高可用性方面的局限,還在智能客服、語音輸入法等應用場景展現出強大的靈活性和廣泛性。各行業的音頻都能獲得相對高性能和準確地轉寫服務,助力企業提高效率、降低成本。在百應科技和KK鍵盤等場景中,騰訊雲ASR的應用已取得了顯著的成果。

展望未來,騰訊雲將繼續推動語音識別能力創新升級,助力更多應用場景將技術力價值轉化為生產力價值,推動產業發展。

文章來源: https://twgreatdaily.com/zh-sg/7523d6b6f97db034fe6d92c498cdcb6c.html