阿里雲發布通義千問2.5,趕超GPT-4,千問110B成為全球最強開源大模型

2024-05-09     36氪

原標題:阿里雲發布通義千問2.5,趕超GPT-4,千問110B成為全球最強開源大模型

5月9日,通義大模型發布一周年之際,阿里雲正式發布通義千問2.5,模型性能全面趕超GPT-4 Turbo,成為地表最強中文大模型。同時,通義千問1100億參數開源模型在多個基準測評收穫最佳成績,超越Llama-3-70B,成為全球開源領域最強大模型。

Open LLM LeaderBoard截圖

技術依然是阿里雲在AI時代保持領先的最強武器

大模型技術爆發一年多,行業競爭態勢激烈而又多變。通義千問走了一條最「卷」的路,2023年4月問世以來,始終專注於基礎模型的技術研發,從初代模型升級至2.5版本。相比此前的通義千問2.1版,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,中文能力更是持續領先業界。

官方提供

同時,通義還發布了1100億參數開源模型Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準測評中超越Meta的Llama-3-70B,在HuggingFace開源大模型排行榜Open LLM Leaderboard上進入榜首,再度證明通義開源系列業界最強的競爭力。

通義多模態模型和專有能力模型也具備業界頂尖影響力。在多個多模態標準測試中,通義千問視覺理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,這款模型已在多家企業落地;代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的榜首模型,也是國內用戶規模第一的智能編碼助手通義靈碼的底座。

Big Code截圖

一年間,通義還發展出了業界領先的文生圖、智能編碼、文檔解析、音視頻理解等能力,企業客戶和開發者可以通過API調用、模型下載等方式接入通義,個人用戶可從APP、官網和小程序免費使用通義。大會當日,原通義千問APP宣布更名為「通義APP」,將通義大模型全套能力集於一身,致力於成為「通情達義」的全能AI助手。

堅定開源路線,成為全球最強開源大模型

去年8月,通義宣布加入開源行列,隨之啟動馬不停蹄的開源狂飆,沿著「全模態、全尺寸」開源路線陸續推出十多款模型。目前,通義開源模型下載量已經超過700萬。

大模型的訓練和疊代成本極高,絕大部分的AI開發者和中小企業都無法負擔。Meta、阿里雲等推動的大模型開源風潮,讓開發者不必從頭訓練模型,還把模型選型的主動權交給了開發者,大大加速了大模型的應用落地進程。

為順應不同場景用戶需求,通義推出參數規模橫跨5億到1100億的八款大語言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手機、PC等端側設備部署;大尺寸模型如72B、110B能支持企業級和科研級的應用;中等尺寸如32B試圖在性能、效率和內存占用之間找到最具性價比的平衡點。此外,通義還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。

通義72B、110B開源模型都曾登頂Open LLM Leaderboard榜首。在開放研究機構LMSYS Org推出的基準測試平台Chatbot Arena上,通義72B模型多次進入「盲測」結果全球Top 10,創造了國產大模型的先例。

Hugging Face截圖

長期沉澱的良好口碑為通義開源模型贏得一眾鐵粉,每有開源動作都會早早被開發者「蹲守」,也總能獲得生態夥伴第一時間支持。「開發者的反饋和開源社區的生態支持,是通義大模型技術進步的重要助力。」阿里雲CTO周靖人透露,未來通義大模型還會持續開源。

百鍊平台2.0全面升級,提供大模型最強外掛

百鍊平台從模型開發、應用開發到算力底座全面升級,更加易用、更加開放,引入更多模型,還率先兼容LlamaIndex等開源框架,企業可自由替換能力組件來適配自身系統。針對當下企業最關注的RAG鏈路,百鍊提供靈活開放的企業級檢索增強服務,5到10行代碼即可搭建RAG應用,讓大模型擁有「最強外掛」。

2023年10月,阿里雲發布了百鍊大模型平台,開發者可通過「拖拉拽」5分鐘開發一款大模型應用,幾小時「煉」出一個專屬模型,把精力專注於應用創新。本次大會上,百鍊升級成為阿里雲承載雲+AI能力的重要平台,提供一站式、全託管的大模型定製與應用服務。升級後,百鍊可以更好地支持大型企業和成熟開發者的需求。

官方提供

「當下企業應用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發應用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百鍊打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。」周靖人介紹。

對希望直接調用模型進行推理的企業,百鍊集成了上百款大模型api,除了通義、Llama、ChatGLM等系列,還首家託管百川等系列三方模型,覆蓋國內外主流廠商,聯動魔搭開源社區,同時支持企業上架通用或行業模型,給開發者提供足夠多的模型選擇。同時,百鍊依託阿里雲AI基礎設施,支持千億級模型的萬級並發推理,充分滿足企業需求。

針對需要進一步訓練模型的用戶,百鍊提供了從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可按需彈性調用算力,無需擔心底層架構。訓練過程可視化,還可自動評測模型質量,並與其他模型進行對比。

對希望打造RAG應用的企業,百鍊支持Assistant API開發模式,可在百鍊上輕鬆創建知識庫,並一鍵開啟知識檢索增強(RAG),通過Assistant API聯合輸出。同時,百鍊支持agent智能體開發,並能實現多智能體協作、對話記憶等高級功能。

據介紹,阿里雲百鍊的一大重要優勢,在於最大程度的開放性和自由度。當下一些大模型應用平台採用封閉鏈路,不支持替換原子能力,導致企業開發應用時無法引入自研插件,和業務場景充分融合。

官方提供

百鍊率先兼容並優化了LlamaIndex等開源架構,擁抱社區生態,支持從本地或不同雲端導入SQL、pdf、excel、ppt等各種類型數據源,還支持根據需求自由替換精細的能力組件,讓AI應用絲滑嵌入企業原有業務系統。

周靖人表示,接下來,百鍊將繼續做對開發者最友好、最開放的大模型平台。阿里雲歡迎更多大模型上架,百鍊將進一步支持三方模型的微調訓練和雲上專屬部署,幫助大模型生態中的企業提供商業化服務。

開源開放,打造最受中國企業歡迎的大模型

通義正在成為最受中國企業歡迎的大模型。根據最新數據,通義通過阿里雲服務企業超過9萬、通過釘釘服務企業超過220萬,現已落地PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

5月9日,小米旗下的人工智慧助手「小愛同學」與阿里雲通義大模型達成合作,強化其在圖片生成、圖片理解等方面的多模態 AI 生成能力,並在小米汽車、手機等多類設備落地;微博、眾安保險、完美世界遊戲等企業也宣布接入通義大模型,將大模型應用於社交媒體、保險、遊戲等領域。

官方提供

此前,通義大模型還曾「上天入地」服務客戶,中國科學院國家天文台人工智慧組基於通義千問開發了新一代天文大模型「星語3.0」,這是大模型首次應用於天文觀測領域;陝煤建新煤礦等十餘座礦山推出由通義支持的新型礦山重大風險識別處置系統,成為大模型在礦山場景的首次規模化落地。

一直以來,阿里雲都強調要成為「AI時代最開放的雲」,通過開放的算力平台、開源的自研模型、優質的模型服務,幫助客戶抓住大模型時代的機遇。如今,開源開放戰略正為阿里雲帶來新的商業增長。

文章來源: https://twgreatdaily.com/8d66466146a46c9e1aaf242883182e22.html