在創造1億矽基勞動力的道路上,矽基智能按下了加速鍵。成立於 2017 年 8 月的矽基智能在成立伊始就把為人類創造一億矽基勞動力作為自己的組織目標。矽基智能認為地球的生命進化不會至於人類,矽基生命作為文字誕生後就存在的生命體,它的發展在AI 時代將被加速,最終將引領我們的文明走向矽基文明時代。
作為全球最早提出矽基生命的矽基文明倡導者,矽基智能創始人司馬華鵬曾將矽基生命的進化分為三個階段,第一個階段就是通過圖靈測試階段,讓人分不清楚是 AI 還是人,第二階段是人和 AI 之間產生雙向情感連接。第三階段是人和 AI成為死生相契的靈魂伴侶。就像鋼鐵俠和賈維斯之間的關係。
今年年中,OpenAI 在線上發布會演示了旗艦模型GPT-4o,它同時具備的聽、看、說的能力,和它溝通就像和AI在打一個視頻電話。幾個月後的11月1日,矽基智能作為中國大模型代表企業,發布了新一代多模態大模型DUIX ONE,它在GPT-4o 基礎上進一步進化,增加了外在的數字人形象,這將有助於加強人和AI 之間的情感交流,標誌著矽基生命的進化突破圖靈測試,即將走入第二和第三階段。
作為 AIGC數字人的發明者,矽基智能在 2017 年就提出了 DUIX 作業系統,DUI 是 Dialog user interface 的縮寫,X 代表了這將是一個比肩 UNIX 和Linux 的作業系統。DUIX ONE是 DUIX 作業系統的重要升級,它結合視覺、聽覺與情緒感知,提供了一種全面的多模態交互體驗,使其具備聽、看和感知情緒的能力,真正實現了沉浸式的人機互動。通過 IP 賦能,矽基生命將真正以可視化的形式出現在我們的工作和生活中。
這一技術的實現,仿佛讓我們回到了電影《Her》的情境中。電影中的西奧多與AI助手薩曼莎之間,通過富有情感的語音互動,建立起了一種溫暖而貼近的情感連接。如今,矽基智能DUIX ONE 似乎正把《Her》中的場景帶入現實,矽基生命不再只是冷冰的工具,而兼具「全感知能力」與「真人級表達力」的「Her」。
兼具軀體和靈魂:成為你身邊的任何「人」
儘管這一年人工智慧領域進展迅猛,無論是頭部玩家如GPT-4o,還是細分賽道的Character.AI,大多數AI聊天機器人和虛擬人仍停留在單一交互層面,未能突破形象與感知的界限。
而DUIX ONE 則以其獨特的融合形象與感知能力,成功打破虛擬與現實的壁壘。它不僅「能聽」,還「會看」「會感知」,具備深度交流的能力,將會成為人類工作和生活中的陪伴者。DUIX ONE 通過多模態技術與AI智能體結合,為用戶帶來了真實且沉浸的互動體驗,讓人機互動超越了傳統的文字與語音限制。
憑藉智能感知能力,DUIX ONE 能在多個場景中提供高質量的陪伴和服務,從情感支持到專業知識分享,真正實現了「全感知」的AI交互體驗,成為更具溫度的大模型智能體。
AI 對練。據官方演示,DUIX ONE 可作為用戶的個性化口語外教,幫助用戶提升語言技能。它通過演示標準發音口型,並實時觀察和糾正用戶的發音,提供更精確的指導。
AI 伴侶。同時,DUIX ONE 還可以充當 24 小時在線的情感伴侶,敏銳捕捉用戶情緒波動,提供及時的反饋,作為用戶的傾聽者,為用戶提供高品質的情緒引導,成為用戶情感的避風港。
AI 教育。在家教角色上,DUIX ONE 可以幫助孩子完成作業,提供英語輔導,還能通過智能批改和解題指導減輕家長的教育壓力。大模型將助力教育領域的顛覆,每個孩子都將擁有一個隨時隨地提供高品質的服務的家庭教師。
AI養老。除此之外,在養老和數字永生領域,DUIX ONE 通過克隆家人AI分身,能夠為獨居老人提供情感慰藉。尤其在老齡化加速的社會背景下,數億老人面臨著情感孤獨的困境,DUIX ONE可以 7X24 小時陪伴老人,給老人提供醫療、健康、情感等領域的智能服務。
AI 面試。此外,在企業招聘中,DUIX ONE 作為智能HR助手,能夠實時分析候選人的面部表情和肢體語言,結合多維數據進行綜合評估,幫助企業高效篩選人才,提升招聘效率。
毫秒級響應,視覺識別率98%
據官方公開數據,DUIX ONE 是70B參數的多模態大模型,模型具備端到端的處理能力,能夠在文本、音頻和視頻處理時無需模態轉換。DUIX ONE 支持多模態能力,包括文本、圖像、視頻、聲音和形象處理,能夠識別超過10,000種不同類別的物體,識別準確率達98%。在實時交互方面,DUIX ONE 的音頻和視頻推理能力表現出色,單次推理時間低於300毫秒。同時,模型具備先進的情緒感知功能,能夠精確檢測並分析面部表情,情緒識別準確率超過95%,並能夠生成相應的情感回應,使得人機互動更加自然、生動。
在語音交互方面,DUIX ONE 具備豐富的互動能力,能夠識別背景音、用戶的呼吸聲等細微聲音。在安靜環境下,語音識別準確率高達98%。
DUIX ONE模型參數
DUIX ONE :全球首個具備形象的多模態大模型
矽基智能創始人司馬華鵬在接受採訪時表示:「DUIX ONE 的發布不僅是一次技術突破,更是『生命 3.0』進化的象徵。」
他進一步解釋了 DUIX ONE 名稱的由來,「ONE」包含三重含義:首先,它代表 DUIX 的第一代,類似於鋼鐵俠的第一代戰甲Mark ONE;其次,DUIX 大多數算法已經跑到了端側,從而使得DUIX ONE的調用成本低至每月幾百元;最後,DUIX ONE 是全球首個具備形象的多模態大模型,130 項授權發明專利見證著矽基智能的創新,這讓其在人機互動方面具備了突破性優勢。
找到PMF場景,是模型廠商的當務之急,DUIX ONE的推出,將助力大模型走向萬億級別的AI情感交互相關的市場。司馬華鵬表示,目前已經國內多個大廠完成接口對接,同時和歐洲,港澳、日本、北美及國內眾多生態合作夥伴完成布局,將共同推動DUIX ONE 成為一個更加開放互聯的 AI 生態系統,推動矽基勞動力的普及與產業升級。預計 2025 年將實現為世界創造一億矽基勞動力的目標。
矽基智能已經開放DUIX ONE 的 SDK 和 API 合作,邀請各界夥伴共同探索更多場景下的超級應用可能性。通過與教育、心理健康、企業管理、婚戀等行業的合作,DUIX ONE 致力於成為未來勞動力市場的重要組成部分,推動社會的智能化進程。