騰訊雲ASR全新升級，多模態融合算法大幅提升準確率

近日，騰訊雲宣布全面升級其語音識別(ASR)方案，基於大模型能力，複雜場景下的識別率提升了20%。騰訊雲ASR現已支持23種方言，採用業界首創的高性能引擎，並突破了現有ASR引擎的場景局限，可靈活應用於線下銷售、下沉市場等場景。

通過自研多模態融合算法、蒸餾和半監督算法，騰訊雲ASR強化了上下文理解能力，減少了語音數據的標記工作，提升了複雜識別環境的準確率。採用無監督學習，該方案加入大量未經標註的低資源數據，在垂類行業音頻和方言音頻上取得了重大突破。

如今，智能汽車普及、短視頻配音、企業出海等趨勢興起，多語種、多方言的語音識別需求逐漸加大。騰訊雲ASR採用了自研的高新技術，打造多項業界首創的高性能引擎，增強了ASR混合和識別能力。此外，還支持熱詞增強版、ASR情緒識別等多項業界首創功能，進一步改善了複雜音頻和低信噪比識別效果。

升級後的騰訊雲ASR不僅解決了現有ASR引擎在高並發和高可用性方面的局限，還在智能客服、語音輸入法等應用場景展現出強大的靈活性和廣泛性。各行業的音頻都能獲得相對高性能和準確地轉寫服務，助力企業提高效率、降低成本。在百應科技和KK鍵盤等場景中，騰訊雲ASR的應用已取得了顯著的成果。

展望未來，騰訊雲將繼續推動語音識別能力創新升級，助力更多應用場景將技術力價值轉化為生產力價值，推動產業發展。