真香了!通義千問2.0升級語音對話功能,實測通義大模型系列新品 | 新榜出品

2023-11-02     新榜

原標題:真香了!通義千問2.0升級語音對話功能,實測通義大模型系列新品 | 新榜出品

國產大模型持續升級,阿里這回又放大招了!

近日,阿里雲在雲棲大會上正式發布千億級參數大模型通義千問2.0

在10個主流Benchmark測評集中,通義千問2.0的得分整體超越Meta的Llama-2-70B,相比OpenAI的GPT-3.5是九勝一負,相比GPT-4則是四勝六負,與GPT-4的差距進一步縮小。

通義千問2.0綜合性能超過GPT-3.5,正在加速追趕GPT-4

目前通義千問官網已更新2.0版本,新增圖片理解、文檔解析功能,同時通義千問APP也在各大手機應用市場正式上線,免費開放,APP還支持語音聊天功能。

通義千問官網:https://tongyi.aliyun.com/qianwen

除了基礎模型升級,本屆大會的重頭戲莫過於通義「全家桶」正式上線,阿里雲公布了基於通義千問開發的8個垂直領域模型

通義星塵:個性化角色創作平台
通義聽悟:工作學習AI助手
通義靈碼:智能編碼助手
通義點金:智能投研助手
通義智文:AI閱讀助手
通義法睿:AI法律顧問
通義仁心:個人專屬健康助手
通義曉蜜:智能客服

通義大模型家族全面升級,體驗地址:https://tongyi.aliyun.com/

其中通義星塵、通義智文等產品模型是首次亮相,而此前6月已發布的通義聽悟目前累計用戶數超100萬,每天處理5萬餘個音視頻;通義靈碼則率先在阿里雲內部大規模採用,廣受好評。

阿里雲首席技術官周靖人強調,阿里雲做大模型不是為了做端到端的超級應用,這次發布的行業模型大部分不是完整產品,目的是給大家展示和開放能力。「我們的所有模型都歡迎 『被集成』」,開發者可以通過網頁嵌入、API/SDK調用等方式,將上述的模型能力集成到自己的大模型應用和服務中。

那麼升級後的通義大模型到底效果如何?來看看「頭號AI玩家」新鮮出爐的一手實測。

通義千問:語音聊天更像人了

相比4月發布的1.0版本,通義千問2.0參數量全面提升至千億級別,據介紹,其在複雜指令理解、文學創作、通用數學、知識記憶、幻覺抵禦等能力上均有顯著提升。

我們先問幾個經典測試問題看看實力。

「昨天的當天是明天的什麼?」這個問題GPT-3.5無法理解,而通義千問2.0訓練有素,果斷給出了正確答案。

「樹上9隻鳥,打掉1隻,還剩幾隻?」通義千問分情況給出了完整的回答,看來還是有點東西。

「魯迅為什麼暴打周樹人?」通義千問給了一段魯迅的簡介,並沒有直接回答魯迅和周樹人是同一個人,可能是觸發了審核機制,它提示我開啟新對話,不能繼續追問了。

在文學創作方面,我們要求通義千問描寫瀑布,但不能出現「瀑布」二字,它巧妙地選擇用擬人的手法回答,起的標題也符合文意。

對於複雜指令的理解,比如根據諸多要求寫一個科幻小說的開頭,它的回答速度很快,行文也符合邏輯。

通義千問這次還上線了圖片輸入功能。比如上傳一張便當照片,它能精準識別有哪些食物,但無法提供更多熱量信息。

我們也可以讓它給圖片配文案,變身甲方指揮它修改。

不過通義千問目前不支持生成圖片,想體驗文生圖功能可使用通義萬相,具體參考下文。

接下來讓我們試試新推出的通義千問APP,整體介面比較簡潔,會話頁支持語音輸入,沉浸式聊天則要切換到「語音對話」頁。

通義千問提供了四種AI音色,分別是溫柔的女聲、嚴謹的男聲、親切的女聲、幽默的男聲。其中幽默的男聲聽起來和ChatGPT的男聲相似,不過帶點地方口音,有時不分平翹舌。

我們跟通義千問聊了會兒,一開始想讓他扮演渣男,結果他拒絕了,表示不鼓勵「性別歧視」。換成約會中的男女,他倒是情話信手拈來。

除了角色扮演對話,遇到專業問題,例如「直播帶貨的風口什麼時候會過去」,他也能講得頭頭是道。

我們發現通義千問的語音功能的確比機器音更自然,能模仿人說話時的停頓、語氣詞。在跨語言方面,它可以說中文、英文,能聽懂一點方言,但只會用普通話說出來。它的回答有時會太冗長,不過我們可以隨時中斷再提問。

以上是我們對通義千問2.0的初步評測。據官方介紹,阿里雲計劃在11月開源通義千問720億參數模型,周靖人稱這將成為參數規模最大的中國開源大模型。

通義萬相:一鍵生成虛擬模特

通義萬相是阿里雲在7月推出的AI繪畫模型,目前累計用戶數超50萬,累計生成圖片數超1000萬張。

除了文生圖、圖生圖、風格遷移等基礎功能,通義萬相這次上線了一系列場景化新功能。

「虛擬模特」功能支持對真人展示的商品圖更換模特和場景,比如保留圖中模特的穿搭,外國模特可一鍵替換成虛擬中國模特形象,背景從室外換到了室內,整體效果比較自然。

「寫真館」功能則類似於妙鴨相機,不過上傳2~4張個人照片就能快速生成自己的虛擬形象。

塗鴉作畫功能支持圖文組合生圖,隨手畫一個草圖加上幾句文字描述,沒有繪畫基礎的玩家也能快速將創意落地。

目前通義萬相可免費體驗,一個帳號每天能生成50次。未來還將增加3D頭像、海報生成、商品展示圖等新功能,看來在AI繪畫領域阿里雲還是會兼顧實用性和趣味性。

通義星塵:更個性化的AI角色對話

繼百度文心一言、訊飛星火之後,阿里雲也推出了個性化角色對話平台「通義星塵」,提供不同設定的AI角色如二次元人物、歷史名人、萌寵、超級英雄,用戶也可以自由定製角色。據介紹,通義星塵的上下文窗口支持最高16K,也支持長短期記憶。

比如這隻性格傲嬌的白貓露娜,一上來就要我給它罐頭吃,還配有動作和神情描述,非常擬人化。如果你不知道怎麼回答,還可以點擊「給我聊天靈感」,AI會根據上下文自動生成回復。

不過也會有回答混亂的情況出現,露娜前一秒叫我鏟屎官,後一秒就說自己是鏟屎官了。

目前通義星塵提供了偵探推理、情感樹洞、睡前故事、職場陪練、戀愛陪伴等多種應用場景,整體來說可玩性比較強。

通義智文:網頁、論文、書籍都能讀懂

最近大模型的長文本能力越來越強,處理上下文token不斷刷新紀錄。

通義智文作為一款基於通義大模型的AI閱讀助手,同樣面向多格式、多模態和長文本場景,支持文檔對話、摘要、解析等功能。

比如一篇發布在公眾號上關於AI agent的萬字長文,左邊顯示原文,右邊顯示AI的總結摘要,這樣方便我們快速抓住重點來高效閱讀,遇到不明白的也可以向AI提問,順便做好筆記。

長達361頁的《三國演義》也不在話下,通義智文按章節列出了概要,點擊概要還能定位到原文位置。

通義聽悟:個人音視頻知識庫

作為內容編輯,我們經常會用到通義聽悟這類音視頻工具來轉寫錄音、總結視頻內容,可以縮短繁瑣的整理資料的流程,提升創作效率。

通義聽悟支持分別總結多位發言人的內容,問答詳情也能清晰羅列。這次通義聽悟即將上線對話功能「小悟助手」,能對轉錄內容進一步提問,更加智能化。

值得注意的是,最近通義聽悟上線了「發現」板塊,用戶可以訂閱播客頻道,邊聽邊看文字筆記。這表明產品正從工具向社區轉變,提供更多內容,吸引用戶停留。

通義靈碼:解放程式設計師的智能編碼助手

對於程式設計師來說,可能最關注的就是AI編程助手「通義靈碼」,它專注於代碼的理解和生成,支持代碼補全、UT生成、代碼解釋等核心場景,目前面向所有開發者開放公測。

通義靈碼可以協助專業人士完成各種編程相關的工作,並實時給出相應的建議,快速幫助提升代碼編寫的效率。根據HumanEval測試結果,通義靈碼的問題解決率高達66.4%,超過行業平均水平的50%左右。

不懂編程的玩家也能用自然語言生成代碼,比如輸入「幫我用Python寫一個飛機遊戲」,短短數秒之間,通義靈碼就能自動生成100多行代碼,並且能夠跑起來。

大模型的下一步,是生態競爭

除了以上我們實測的幾款模型,通義還發布了針對金融、醫療、法律等行業場景的垂直模型,幫助從業者利用AI技術結合自己的業務場景來解決實際的問題。

通義點金:智能投研助手,支持解讀財報研報,分析金融事件,自動繪製圖表表格,實時市場數據分析

通義法睿:AI法律顧問,能正確引用法規和案例回答法律諮詢,一鍵生成專屬法律文書等

通義仁心:個人專屬健康助手,支持解讀體檢報告、用藥諮詢等,目前處於邀測階段

通義曉蜜:智能企業客服,可以根據企業需求定製化對話機器人,支持解析通話內容、分析客戶情緒等,提升服務效率和客戶滿意度

截至10月,阿里雲已與60多個行業頭部夥伴進行深度合作,推動通義千問在辦公、文旅、電力、政務、醫保、交通、製造、金融、軟體開發等領域的落地。

此外,阿里雲還在大會上發布了一站式大模型應用開發平台「阿里雲百鍊」,開發者可在5分鐘內開發一款大模型應用,幾小時即可「煉」出一個企業專屬模型,然後將更多精力專注於應用創新。

「促進中國AI生態繁榮,是阿里雲的首要目標。阿里雲將堅定打造AI時代最開放的大模型平台,我們歡迎所有大模型接入阿里雲百鍊,共同向開發者提供AI服務。」周靖人表示。

正如阿里雲所要構建的AI生態,目前大模型行業的下一步便是發展生態,國外的ChatGPT最近將各類插件融合,用戶可以在一個對話中無縫處理PDF、數據、DALL·E繪圖等多項任務。

國內AI玩家也開始打造大模型生態土壤,不僅要有強大的基礎大模型,更重要的是有豐富的行業模型、新生應用,有更多的開發者加入,生態的競爭會加速通用人工智慧的到來,讓AI真正融入每個人的生活中。

文章來源: https://twgreatdaily.com/zh-cn/bcf739c9c610569ff069d889a4dbcf70.html