訊飛星火大模型升級:74個語種方言「自由對話」,破解強幹擾場景語音識別難題

2024-06-28     北青網

6月27日,科大訊飛在北京發布訊飛星火大模型V4.0及相關落地應用。

自去年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達1.31億次。此次升級後的訊飛星火V4.0 七大核心能力全面升級,全面對標GPT-4 Turbo,並實現在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面的整體超越。

現場,科大訊飛董事長劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果,星火「智商」再度進化。以空間推理為例,「Bob在客廳里。他拿著一個杯子走到廚房。他把球放進杯子裡,然後拿著杯子走到臥室。他把杯子倒過來,然後走到花園。他把杯子放在花園裡,然後走到車庫。問題:球在什麼地方?」訊飛星火可以基於空間和常識推斷出球在臥室的地面上,這些能力的進步對於以後的具身智能、家庭機器人都具有意義。

近期科大訊飛作為第一完成單位的《多語種智能語音關鍵技術及產業化》項目,獲得國家科學技術進步獎一等獎。此次星火語音大模型迎來新突破。星火語音大模型發布國際領先的多語種多方言免切換語音識別能力,可支持37個語種、37種方言「自由對話」。其中,37個語種識別效果領先OpenAI whisper-V3,37個方言識別效果平均提升30%。現場,科大訊飛演示了訊飛輸入法混合方言和外語的語音輸入效果,能讓輸入效率大大提高。

科大訊飛還發布了軟硬體一體化訊飛同傳系統,可支持大會同傳、會議同傳、展廳同傳、旅遊同傳等多場景使用。本次參會的嘉賓座位上同樣配備訊飛同傳的收聽設備,佩戴後即可實時收聽多語種AI同聲傳譯。

針對強幹擾場景下的語音識別難題,科大訊飛突破了多人混疊場景下的極複雜場景語音轉寫,即使在三人混疊說話場景也能實現86%的語音識別準確率。三位訊飛研究院的研究員現場實測了在噪音場景下,同時混疊著說話,正常人耳已難以聽清,只見訊飛星火的多模態能力不但實現了三人重疊語音的角色分離,還能實時轉寫出每個人說的話。未來基於多模態的聲音識別技術,將應用在訊飛聽見智慧辦公、智慧屏等會議辦公產品中。

自去年5月6日發布以來,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大眾汽車、江汽集團、海爾集團、美的集團等多領域頭部企業的首選。

訊飛星火已經在代碼、合規審查、客服、評標、智能交互等多個典型場景產生應用成效,以交通銀行為例,基於星火大模型能力的產品iFlyCode覆蓋6000+研發人員,代碼採納率達38%,工作效率顯著提升。

此次星火企業智能體平台正式發布。在代碼智能體iFlyCode中,它集成了代碼生成助手、架構設計助手、代碼問答助手、測試助手、資料庫優化助手、代碼審核助手等六大場景智能體,將採納率由30%提升至52%。

星火商機助手可以實現商機線索應知盡知、客戶拜訪提質增效、銷售管理智能研判,助力一線銷售和商機管理效能提升。星火評標助手通過標前尋源、智能評標、定標審核等功能,智能評標結果人機一致率達98%,投標異常檢出率超過80%,在大幅提升企業評標效率同時降低採購成本。

文/北京青年報記者 溫婧

編輯/田野

文章來源: https://twgreatdaily.com/zh-cn/0aa4b327782de32adac6049834540201.html