@360智腦,為啥沒考滿分,你自己反省一下!

2023-09-22   360安全衛士

原標題:@360智腦,為啥沒考滿分,你自己反省一下!

信通院近日發布可信 AI 評估結果,360集團的自研認知型通用大模型360智腦以4+級別通過驗證,其中絕大部分送驗項目均達到5分的滿分成績,達到目前國產大模型最高能力級別。

近日,2023南京人工智慧產業發展大會正式開幕。會上,信通院發布可信 AI 評估結果,360集團的自研認知型通用大模型360智腦以4+級別通過模型開發、模型能力兩個模塊驗證,成為業界為數不多通過4+級別驗證的大模型之一,這也是目前國產大模型達到的最高能力級別。

此前,信通院聯合大模型工作組百餘家單位,共同研製了《大規模預訓練模型技術和應用驗證方法》系列標準,包含模型開發、模型能力、模型運營、模型應用和可信要求五個部分。目前模型開發、模型能力兩部分標準已發布,包括數據構建、模型訓練、模型部署、功能豐富度、性能優越度、服務成熟度等幾大維度70餘個能力項,可全面驗證大模型各項技術能力。

本次360智腦大模型參與了「模型開發」、「模型能力」兩項標準符合性驗證,均以4+級別通過驗證,其中絕大部分送驗項目均達到5分的滿分成績。

360智腦是360集團的自研認知型通用大模型,依託360多年積累的大算力、大數據、工程化等關鍵優勢,集成360GPT大模型、360CV大模型、360多模態大模型技術能力,具備生成創作、多輪對話、邏輯推理等十大核心能力、數百項細分功能。目前,360智腦已疊代至4.0版本,並接入360全端產品,重塑人機協作新範式。今年7月至8月期間,360智腦在整體性能提升14.55%,COT能力提升69%,進一步實現可支持50000+字的更長文本輸入,並將多輪對話長度提升了18%。

目前,基於360集團在大模型技術和實踐上的積累,在由上海交通大學、清華大學及愛丁堡大學聯合發布的大模型排行中,360智腦能力跑贏GPT-4,並在中文通用大模型基準評測等多個第三方評測中位列國產大模型能力領先位置。