國產大模型持續升級，阿里這回又放大招了！

近日，阿里雲在雲棲大會上正式發布千億級參數大模型通義千問2.0。

在10個主流Benchmark測評集中，通義千問2.0的得分整體超越Meta的Llama-2-70B，相比OpenAI的GPT-3.5是九勝一負，相比GPT-4則是四勝六負，與GPT-4的差距進一步縮小。

通義千問2.0綜合性能超過GPT-3.5，正在加速追趕GPT-4

目前通義千問官網已更新2.0版本，新增圖片理解、文檔解析功能，同時通義千問APP也在各大手機應用市場正式上線，免費開放，APP還支持語音聊天功能。

通義千問官網：https://tongyi.aliyun.com/qianwen

除了基礎模型升級，本屆大會的重頭戲莫過於通義「全家桶」正式上線，阿里雲公布了基於通義千問開發的8個垂直領域模型：

通義星塵：個性化角色創作平台

通義聽悟：工作學習AI助手

通義靈碼：智能編碼助手

通義點金：智能投研助手

通義智文：AI閱讀助手

通義法睿：AI法律顧問

通義仁心：個人專屬健康助手

通義曉蜜：智能客服

通義大模型家族全面升級，體驗地址：https://tongyi.aliyun.com/

其中通義星塵、通義智文等產品模型是首次亮相，而此前6月已發布的通義聽悟目前累計用戶數超100萬，每天處理5萬餘個音視頻；通義靈碼則率先在阿里雲內部大規模採用，廣受好評。

阿里雲首席技術官周靖人強調，阿里雲做大模型不是為了做端到端的超級應用，這次發布的行業模型大部分不是完整產品，目的是給大家展示和開放能力。「我們的所有模型都歡迎『被集成』」，開發者可以通過網頁嵌入、API/SDK調用等方式，將上述的模型能力集成到自己的大模型應用和服務中。

那麼升級後的通義大模型到底效果如何？來看看「頭號AI玩家」新鮮出爐的一手實測。

通義千問：語音聊天更像人了

相比4月發布的1.0版本，通義千問2.0參數量全面提升至千億級別，據介紹，其在複雜指令理解、文學創作、通用數學、知識記憶、幻覺抵禦等能力上均有顯著提升。

我們先問幾個經典測試問題看看實力。

「昨天的當天是明天的什麼？」這個問題GPT-3.5無法理解，而通義千問2.0訓練有素，果斷給出了正確答案。

「樹上9隻鳥，打掉1隻，還剩幾隻？」通義千問分情況給出了完整的回答，看來還是有點東西。

「魯迅為什麼暴打周樹人？」通義千問給了一段魯迅的簡介，並沒有直接回答魯迅和周樹人是同一個人，可能是觸發了審核機制，它提示我開啟新對話，不能繼續追問了。

在文學創作方面，我們要求通義千問描寫瀑布，但不能出現「瀑布」二字，它巧妙地選擇用擬人的手法回答，起的標題也符合文意。

對於複雜指令的理解，比如根據諸多要求寫一個科幻小說的開頭，它的回答速度很快，行文也符合邏輯。

通義千問這次還上線了圖片輸入功能。比如上傳一張便當照片，它能精準識別有哪些食物，但無法提供更多熱量信息。

我們也可以讓它給圖片配文案，變身甲方指揮它修改。

不過通義千問目前不支持生成圖片，想體驗文生圖功能可使用通義萬相，具體參考下文。

接下來讓我們試試新推出的通義千問APP，整體介面比較簡潔，會話頁支持語音輸入，沉浸式聊天則要切換到「語音對話」頁。

通義千問提供了四種AI音色，分別是溫柔的女聲、嚴謹的男聲、親切的女聲、幽默的男聲。其中幽默的男聲聽起來和ChatGPT的男聲相似，不過帶點地方口音，有時不分平翹舌。

我們跟通義千問聊了會兒，一開始想讓他扮演渣男，結果他拒絕了，表示不鼓勵「性別歧視」。換成約會中的男女，他倒是情話信手拈來。

除了角色扮演對話，遇到專業問題，例如「直播帶貨的風口什麼時候會過去」，他也能講得頭頭是道。

我們發現通義千問的語音功能的確比機器音更自然，能模仿人說話時的停頓、語氣詞。在跨語言方面，它可以說中文、英文，能聽懂一點方言，但只會用普通話說出來。它的回答有時會太冗長，不過我們可以隨時中斷再提問。

以上是我們對通義千問2.0的初步評測。據官方介紹，阿里雲計劃在11月開源通義千問720億參數模型，周靖人稱這將成為參數規模最大的中國開源大模型。

通義萬相：一鍵生成虛擬模特

通義萬相是阿里雲在7月推出的AI繪畫模型，目前累計用戶數超50萬，累計生成圖片數超1000萬張。

除了文生圖、圖生圖、風格遷移等基礎功能，通義萬相這次上線了一系列場景化新功能。

「虛擬模特」功能支持對真人展示的商品圖更換模特和場景，比如保留圖中模特的穿搭，外國模特可一鍵替換成虛擬中國模特形象，背景從室外換到了室內，整體效果比較自然。

「寫真館」功能則類似於妙鴨相機，不過上傳2~4張個人照片就能快速生成自己的虛擬形象。

塗鴉作畫功能支持圖文組合生圖，隨手畫一個草圖加上幾句文字描述，沒有繪畫基礎的玩家也能快速將創意落地。

目前通義萬相可免費體驗，一個帳號每天能生成50次。未來還將增加3D頭像、海報生成、商品展示圖等新功能，看來在AI繪畫領域阿里雲還是會兼顧實用性和趣味性。

通義星塵：更個性化的AI角色對話

繼百度文心一言、訊飛星火之後，阿里雲也推出了個性化角色對話平台「通義星塵」，提供不同設定的AI角色如二次元人物、歷史名人、萌寵、超級英雄，用戶也可以自由定製角色。據介紹，通義星塵的上下文窗口支持最高16K，也支持長短期記憶。

比如這隻性格傲嬌的白貓露娜，一上來就要我給它罐頭吃，還配有動作和神情描述，非常擬人化。如果你不知道怎麼回答，還可以點擊「給我聊天靈感」，AI會根據上下文自動生成回復。

不過也會有回答混亂的情況出現，露娜前一秒叫我鏟屎官，後一秒就說自己是鏟屎官了。

目前通義星塵提供了偵探推理、情感樹洞、睡前故事、職場陪練、戀愛陪伴等多種應用場景，整體來說可玩性比較強。

通義智文：網頁、論文、書籍都能讀懂

最近大模型的長文本能力越來越強，處理上下文token不斷刷新紀錄。

通義智文作為一款基於通義大模型的AI閱讀助手，同樣面向多格式、多模態和長文本場景，支持文檔對話、摘要、解析等功能。

比如一篇發布在公眾號上關於AI agent的萬字長文，左邊顯示原文，右邊顯示AI的總結摘要，這樣方便我們快速抓住重點來高效閱讀，遇到不明白的也可以向AI提問，順便做好筆記。

長達361頁的《三國演義》也不在話下，通義智文按章節列出了概要，點擊概要還能定位到原文位置。

通義聽悟：個人音視頻知識庫

作為內容編輯，我們經常會用到通義聽悟這類音視頻工具來轉寫錄音、總結視頻內容，可以縮短繁瑣的整理資料的流程，提升創作效率。

通義聽悟支持分別總結多位發言人的內容，問答詳情也能清晰羅列。這次通義聽悟即將上線對話功能「小悟助手」，能對轉錄內容進一步提問，更加智能化。

值得注意的是，最近通義聽悟上線了「發現」板塊，用戶可以訂閱播客頻道，邊聽邊看文字筆記。這表明產品正從工具向社區轉變，提供更多內容，吸引用戶停留。

通義靈碼：解放程式設計師的智能編碼助手

對於程式設計師來說，可能最關注的就是AI編程助手「通義靈碼」，它專注於代碼的理解和生成，支持代碼補全、UT生成、代碼解釋等核心場景，目前面向所有開發者開放公測。

通義靈碼可以協助專業人士完成各種編程相關的工作，並實時給出相應的建議，快速幫助提升代碼編寫的效率。根據HumanEval測試結果，通義靈碼的問題解決率高達66.4%，超過行業平均水平的50%左右。

不懂編程的玩家也能用自然語言生成代碼，比如輸入「幫我用Python寫一個飛機遊戲」，短短數秒之間，通義靈碼就能自動生成100多行代碼，並且能夠跑起來。

大模型的下一步，是生態競爭

除了以上我們實測的幾款模型，通義還發布了針對金融、醫療、法律等行業場景的垂直模型，幫助從業者利用AI技術結合自己的業務場景來解決實際的問題。

通義點金：智能投研助手，支持解讀財報研報，分析金融事件，自動繪製圖表表格，實時市場數據分析

通義法睿：AI法律顧問，能正確引用法規和案例回答法律諮詢，一鍵生成專屬法律文書等

通義仁心：個人專屬健康助手，支持解讀體檢報告、用藥諮詢等，目前處於邀測階段

通義曉蜜：智能企業客服，可以根據企業需求定製化對話機器人，支持解析通話內容、分析客戶情緒等，提升服務效率和客戶滿意度

截至10月，阿里雲已與60多個行業頭部夥伴進行深度合作，推動通義千問在辦公、文旅、電力、政務、醫保、交通、製造、金融、軟體開發等領域的落地。

此外，阿里雲還在大會上發布了一站式大模型應用開發平台「阿里雲百鍊」，開發者可在5分鐘內開發一款大模型應用，幾小時即可「煉」出一個企業專屬模型，然後將更多精力專注於應用創新。

「促進中國AI生態繁榮，是阿里雲的首要目標。阿里雲將堅定打造AI時代最開放的大模型平台，我們歡迎所有大模型接入阿里雲百鍊，共同向開發者提供AI服務。」周靖人表示。

正如阿里雲所要構建的AI生態，目前大模型行業的下一步便是發展生態，國外的ChatGPT最近將各類插件融合，用戶可以在一個對話中無縫處理PDF、數據、DALL·E繪圖等多項任務。

國內AI玩家也開始打造大模型生態土壤，不僅要有強大的基礎大模型，更重要的是有豐富的行業模型、新生應用，有更多的開發者加入，生態的競爭會加速通用人工智慧的到來，讓AI真正融入每個人的生活中。

真香了！通義千問2.0升級語音對話功能，實測通義大模型系列新品 | 新榜出品

通義千問：語音聊天更像人了

通義萬相：一鍵生成虛擬模特

通義星塵：更個性化的AI角色對話

通義智文：網頁、論文、書籍都能讀懂

通義聽悟：個人音視頻知識庫

通義靈碼：解放程式設計師的智能編碼助手

大模型的下一步，是生態競爭

對話微博AI幕後團隊：靠「已讀亂回」爆火後，「評論羅伯特」為什麼變聰明|新榜洞察

9.11和9.9哪個大？OpenAI剛官宣的GPT-4o mini竟然也翻車了|新榜

谷歌深夜放送：比肩GPT-4o的多模態助手、AI概述搜索結果、新視頻生成模型Veo

辛巴師徒蟬聯帶貨Top3，22位主播躋身10億GMV俱樂部|新榜出品

董宇輝新號首播，「丈母娘」們爆買1個億，4小時漲粉275萬 | 新榜出品

300位主播齊聚，快手搞了場老鐵味十足的跨年狂歡 | 新榜出品

百萬粉絲圍觀的視頻筆記，扛起小紅書流量紅利新風口？| 新榜出品

從章小蕙到小楊哥、董宇輝，我們到底需要什麼樣的主播？| 2023年終復盤

刷爆朋友圈的「聞神」1天漲粉360萬，抖音再「造神」普通人？| 新榜出品

「董宇輝小作文事件」大結局：392萬人在線、單場直播GMV破億元 | 新榜出品

從專業種草到效果轉化，知乎內容營銷新範式 | 新榜出品

好人董宇輝救了東方甄選 | 新榜出品

新媒體榜單發布：搜狐視頻11月視頻號影響力排行榜

對話中國AI繪畫著作權第一案當事人：AI生成內容如何維權？| 新榜出品

月銷破億，被嘲「美麗刑具」，光腿神器是怎樣煉成的？| 新榜出品

不拼才藝靠撒錢，這個網紅30天漲粉571萬 | 新榜出品

OpenAI COO：明年ChatGPT的推理能力會更強，目標惠及所有人 | 新榜出品

1秒1張圖實時成畫，2023文生圖領域進化有多快？| 新榜出品

一天超7場AI面試，這屆畢業生想進名企得跟AI談 | 新榜出品

用AI搞副業日賺近3萬，零工陷阱還是掘金秘訣？| 新榜出品

上線24小時吸金2000萬後被下架，狂飆中的短劇被按暫停鍵？| 新榜出品

重磅！Sam Altman攜核心團隊投奔微軟，OpenAI持續失控 | 新榜出品

AI圈大地震！Sam Altman被OpenAI開除，安全問題是核心分歧? | 新榜出品

完蛋！被GPTs包圍後，百萬年薪的提示詞工程師要下崗？| 新榜出品