訊飛會議耳機,升級了AI大腦

2024-05-17     36氪

比AI更有價值的,是幕後的大腦

未來智能於5月15日舉辦2024訊飛耳機新品發布會,推出了iFLYBUDS Pro2、iFLYBUDS 2以及viaim Kit 2三款新品。這一系列新品將為用戶帶來更優質的會議體驗和便捷的溝通解決方案,引領著AIGC行業發展的新趨勢。作為搭載viaim AI的先驅AIGC耳機,未來智能為用戶開啟了智能硬體時代的嶄新篇章。

發布會現場,科大訊飛聯合創始人及未來智能董事長鬍郁和資深媒體人楊瀾一起見證了新品的發布,暢聊中國人工智慧發展趨勢。早在2016年,楊瀾就製作過一系列人工智慧紀錄片,胡郁作為人工智慧專家,是其欄目中的重要嘉賓。8年之後,未來智能的訊飛會議耳機,已經成為中國AIGC智能硬體的標誌性產品。

相較於一年前發布的訊飛會議耳機Nano系列,訊飛會議耳機Pro 2升級了工藝,實現了閃錄升級和語種擴充。更重要的是,如今訊飛會議耳機的「大腦」,會議助理viaim AI,從單向響應需求,成長為了能接受用戶詢問的聰慧個人助理。

和楊瀾的對話中,胡郁如此形容訊飛會議耳機的蛻變:「你有了『耳替』、部分的『腦替』,在未來甚至是『人替』。」

AIGC,走出網際網路,進入物聯網

時間已經來到AIGC勁風狂襲的第二年。「場景」,這個2023年下半年被AI應用廠商持續強調的詞,找了更為合適的抓手:消費硬體。

「計算機的發展史,就是從算力從超算等大型設備一步步轉移至個人電腦和手機等終端設備上的過程。」高通CEO克里斯蒂亞諾·阿蒙曾在採訪中總結。

這一趨勢在AIGC發展的歷程再次上演——以軟體為載體的AI應用所能觸達場景有限,AIGC技術想要在用戶的活動空間釋放能力,依託於實體硬體,是必然的選擇。

2023年,熱錢和資源已經集中流向了AI大模型和軟體應用。據不完全統計,「AI大模型五小虎」以不到1%的交易數,吞下了中國AI領域近40%的投資金額。

不少玩家已經試圖在硬體中找到AIGC的新藍海。在素有「消費電子春晚」之稱的CES(國際消費電子展會)上,一名前大廠高管的新AI硬體項目在首發當天,就賣出一萬台。另一家明星人型機器人企業帶了7條機器狗去了展會現場,三天後,4條已經收到了來自馬來西亞、美國等科技發燒友的訂單。

數據也側面印證了AIGC的新窗口,將在硬體賽道再次打開。IDC預測,2024年中國市場上搭載AI功能的終端設備將超70%,AI終端占比將達55%。

而此時,TWS耳機賽道,已經渴望一個新故事太久。

TWS,即真正無線(True Wireless Stereo),曾是耳機賽道最大的技術創新。自2016年蘋果推出首代AirPods以來,TWS行業經歷了四年的快速發展期。

但隨之而來的,是在三年新冠大流行中不斷收縮的市場需求,TWS耳機也迎來了行業的第一個瓶頸期。Canalys數據顯示,2023年第三季度全球個人智能音頻設備出貨量同比下跌3%至1.1億部。

市場環境是催化劑,TWS耳機行業發展阻滯的根本原因在於,L2HC、LDAC、aptX Lossless等新一代音頻編解碼技術,已經解決了從「能聽」到「好聽」的問題。但音頻的技術已經觸到了極致的天花板,TWS耳機已經很難從設計、外觀和功能上,釋放用戶的新需求。

而AIGC技術的發展,讓TWS耳機的應用價值從「聽個響」,延伸到了「可攜式的AI助理」。

未來智能CEO馬嘯曾告訴36氪,進入紅海市場後,TWS耳機市場將由兩類玩家主導:一種是手機廠商持續推出自有品牌的TWS耳機,主打通用場景;另外一種則為專攻垂直市場的TWS耳機廠商,以差異化的產品填補市場空缺。

未來智能瞄準的,則是辦公這一垂直場景。在傳統TWS賽道,未來智能已經靠訊飛會議耳機Pro、Air系列,做到了辦公場景的「天花板」。未來智能董事長鬍郁曾對36Kr自信地表示:「蘋果的AirPods開創智能耳機品類,未來智能在耳機形態上實現了辦公會議助理的創新,在這個細分領域裡做到更佳。」

站在如今的AIGC風口中,未來智能定義的「AI會議助理」,自然地演進為辦公場景中的個人的生產力標配。

2023年5月,未來智能發布的訊飛會議耳機 Nano系列,從擁有降噪、「Easy wearing」等單點疊代的記錄機器,進化為了擁有強大腦力的生成式AI會議助理viaim AI。

將一顆「大腦」,植入耳機

辦公,這是一個用戶敏感度苛刻到以「毫秒」、「個字」為單位來描述傳譯時延和翻譯準確率的場景。

轉寫準確率,是辦公耳機的基本功。一旦「聽寫」的基本功不牢,翻譯、摘要、總結等功能再好用,最終也難為無米之炊。

但90%的轉寫準確率,已經是市面上大多辦公耳機所能做到的天花板。這意味著10個字中,就有1個錯字。在完美主義至上的工作場景下,用戶們並不敢希冀一副並不「耳聰」的耳機,就能解放雙手。

而未來智能在2023年5月發布的Nano系列耳機,將聽寫準確率抬高到了98%。紮實的基本功,由錄音實時轉文字、外語實時轉譯、語氣詞過濾、智能分段與排版、說話人識別等多個功能組成。

十多年來對語料和場景的積累,是未來智能立足的巨人肩膀。支持10種語言、12種方言、10個行業術語詞彙——Nano系列耳機在語言和行業上的優勢得以凸顯。

「聽寫」的基本功已經夯實,未來智能要做的,則是讓耳機更加「耳聰目明」,讓用戶在工作中真正解放雙手。

內置在Nano系列耳機中的viaim AI,則是一顆靈活、有效的大腦。比如,viaim AI可以成為「會議助理」,智能分析轉錄的會議內容,一鍵生成總結摘要,也能成為「任務管家」,根據會議生成待辦事項。

更重要的是,相較於傳統辦公耳機,viaim AI的進化並不依賴於廠商的調試,而是隨著用戶數據和場景的積累,不斷自主疊代。這意味著,viaim AI的能力是沒有天花板的,馬嘯形容:「未來它將是化繁為簡的整理大師,事無巨細的AI私人助理,甚至還將是一個整合信息的專家智庫。」

但在馬嘯看來,初代的viaim AI,還沒有完全釋放智能TWS耳機的產品力。

初代的viaim AI,會摘要總結,會安排事項,但似乎還不夠聰明,因為它缺了點「交互」

如今,升級版的viaim AI學會了跟「主人」聊天了。通過新增的「有問必答」功能,用戶只需要用語音或文字輸入問題或需求,viaim AI在根據轉寫記錄回答當前問題的同時,還能主動提供和補充擴展信息,再一次提升辦公效率和質量。

開箱即用,則是讓技術通過產品普惠的核心要素。訊飛會議耳機Pro 2新增了全球首創的「紅點錄」這一閃錄功能,用戶只需要推開耳機殼蓋,按一下電池盒中的紅色按鈕,就能直接錄音。傳統的轉錄功能,最怕的就是突發來電的打斷。而訊飛會議耳機Pro 2耳機的「安心錄」模式,則為錄音阻隔了電話的干擾。

當然,翻譯基本功的升級也必不可少。隨著全球旅遊和跨國差旅數量的回升,實時傳譯的市場需求也愈發龐大。訊飛會議耳機Pro 2則將支持的語種從原有的11種,擴充到了32種,並且在12種方言的基礎上,擴充了2種民族語言。

「大腦」的進化外,訊飛會議耳機Pro 2並沒有忘記體驗的提升。作為職場人,我們往往需要克服嘈雜的環境,快速響應突發會議或者緊急電話。訊飛會議耳機Pro 2看到了這一需求——在三麥克風通話降噪算法上,訊飛會議耳機Pro 2耳機新增了骨聲紋拾音麥克風,利用頭骨震動的方式精準採集用戶聲音,大幅提升通話質量。即便用戶身處嘈雜環境,也能清晰如同面對面交流。

比AI更有價值的,是幕後的大腦

未來智能CEO馬嘯,在一次採訪中談到了自己對語音助手的願景:

「我們的判斷就一句話:每個人都有一個能理解他的隨身智能助手,不是人,是個機器人,或者別的形態,無所謂。」

在他看來,在語音交互並未全面爆發的背景下,他們不會追求大而全,而是向垂直場景滲透。2018年,他選擇走在時代前面,試水全球最早的翻譯錄音耳機雛形Mobius。四年後,他驗證了自己「深入垂類場景」的戰略判斷。

但產品戰略怎麼做、市場運營怎麼跑、公司該怎麼經營,作為一家獨立的年輕公司,未來智能還得自己打仗。

好在,這是一個六邊形的團隊。董事長兼創始人胡郁,也是科大訊飛的聯合創始人,是腦科學和人工智慧領域的專家;CEO馬嘯,有超過10年的AI智能交互產品研發和孵化經驗,是全球首個中文智能語音助理「靈犀」的締造者;CTO王松,則有百人研發團隊管理經驗和15年的軟體研發經歷,長期從事智能助理產品開發;CPO柳達,是有三次創業經歷的行業老將。

事實證明,不少成功的產品,往往是貼著用戶的剛需,做「反常識」的生意。

當Scaling Law已經成為大煉模型的共識,狂堆參數的「大」成了眾多廠商競速的方向。但馬嘯不以為然:「經過我們的測算,不需要大模型那麼大的參數量 也能夠滿足絕大多數會議紀要生成、日程提取的需要,同時由於訓練數據更加適合專業場景,有限規模的『垂直模型』反而效率更高。」

生硬地將通用大模型塞進耳機中,不僅功能空泛雞肋,在能耗和成本上也並不合適。未來智能的思路是將垂直模型做小、做精。

瞄準辦公垂直場景,未來智能將RAG(檢索增強生成)技術與自研的垂直模型結合。RAG,好比大腦的自我學習能力,隨著用戶操作形成的自訓練數據的積累,訊飛會議耳機中的viaim AI會愈發聰明和懂你。

未來智能的另一個「反常識」,則是在創業初期,就布局了硬體供應鏈。

對於不少創業公司而言,在資源有限的情況下,往往要有的放矢,把住單點的核心競爭力。更何況,供應鏈是需要長期積累的硬本事。因此,不少AI硬體公司會選擇先在軟體上下功夫,在功能上創造一個「長版」吸引客戶,等營收提升後再疊代非核心賣點。

馬嘯則認為,不能用軟體思維進行硬體創業,硬體創業的用戶偏好更能體現短板效應。以耳機為例,只要音質、外觀、續航、降噪等性能中有一個短板,即便AI大腦再強大,也難以提升用戶使用時長和留存。

未來智能對供應鏈的打磨,使得如今的訊飛會議耳機,擁有了天花板級的硬體組件。

訊飛會議耳機Pro 2系列耳機細膩音質的背後,是11mm鍍鈦原生剛性振膜單元、具有高彈性和剛性的TPU鍍鈦材質,以及訊飛AI音頻實驗室的專業調音;深度可達48dB的降噪深度游,領先行業。為了讓用戶徹底告別續航焦慮,訊飛會議耳機Pro 2系列做到了單次9小時、搭配充電倉36小時的續航時長。

再比如,設計和體驗也是產品的「門面」。在辦公耳機品類中,訊飛會議耳機Air系列開創性地使用了「頸掛+耳掛」的可切換佩戴設計,頸掛佩戴可以減輕入耳式對耳部產生的負擔,耳掛模式則更方便收納盒攜帶,讓用戶可以靈活利用通勤、運動時間,不耽誤通話和聽音樂。與訊飛會議耳機Pro2同期發布的iFLYBUDS 2,採用的則是半入耳設計,更適合耳道敏感的人群。

軟硬一體的打磨,未來智能實現的是AI風口中,產品和用戶的雙贏。

當眾多AI應用仍苦於難以變現的「概念」,或仍停留在漫長的投入期,未來智能的PMF,已經被市場驗證。2023年「雙十一」期間,未來智能會議耳機全網GMV同比22年實現了564%增長,躋身人工智慧會議耳機品類銷冠,實現多個電商平台霸榜。

「在AIGC領域,垂直場景的服務性工具比泛智能工具實用性更強,未來智能在垂直的辦公會議領域,已經形成了數據的馬太效應,打造出了非常實用的AI會議助理。」發布會上,馬嘯如此表示。從「智能工具」到「智能助理」,如今的未來智能,已經離馬嘯「隨身智能助手」的願景更近了一步。

文章來源: https://twgreatdaily.com/188335fac984e9ef89da1efdb21ebfd2.html