九章雲極宣布自主研發的大模型矩陣開源

2023-11-22     數據雜誌

原標題:九章雲極宣布自主研發的大模型矩陣開源

九章雲極宣布自主研發的大模型矩陣開源

11月21日,九章雲極DataCanvas舉行大模型系列成果發布會,宣布九章雲極DataCanvas公司自主研發的DataCanvas Alaya 九章元識大模型矩陣正式開源一系列新成果。其中包括「Alaya-7B大模型系列」中的Alaya-7B Foundation Model通識大模型和Alaya-7B Chat Model對話大模型兩大模型,以及「LLMOps大模型工具鏈」中的LMS模型運行工具和LMPM 提示詞管理器兩大工具。

九章雲極DataCanvas 公司副總裁於建崗介紹,Alaya-7B大模型系列是DataCanvas Alaya九章元識大模型矩陣的成員之一,基於Alaya通識大模型,由自我採集、精心篩選處理的萬億token數據集(包含網絡上的中英文文章、新聞、百科等數據源)上從0開始預訓練而成。在此前參與的C-Eval、CMMLU、AGIEval、 MMLU、BBH等權威大模型評測榜單中,Alaya-7B均表現出業內領先水準。

Alaya-7B Chat Model 是Alaya-7B Foundation Model的對話版本,通過在精心選擇的微調數據集上進行微調,並對基於涉毒、涉黃以及不良偏見數據進行去毒,從而生成和人類價值觀對齊的對話式大模型。Alaya-7B Chat Model具備多輪對話、自我認知和偏見拒答的能力,能夠完成知識問答、代碼編寫、信息提取、閱讀理解、創意寫作等多項語言任務。

於建崗稱,Alaya-7B大模型系列在保證模型表現的同時,對使用者的安裝使用硬體要求更低、應用技術難度更低、訓練所需的算力資源消耗更小,有助於加速大模型在各類行業場景的實際應用。

LLMOps大模型工具鏈則覆蓋了大模型從訓練、精調、壓縮、部署、推理到監控的全生命周期過程。

·LMS模型運行工具,能夠提高大模型的交付速度和質量,降低大模型的運維和運營成本,以及完成大模型生產化及服務運營等方面的需求。

·LMPM提示詞管理器,通過幫助用戶設計更好的提示詞,引導大模型生成更加準確、可靠、符合預期的輸出內容。該工具既可面向技術人員提供development toolkit的開發模式,也可以面向非技術人員提供人機互動的操作模式,滿足更多人群使用大模型的需求。

此次發布會上,以DataCanvas Alaya九章元識大模型和LLMOps大模型工具鏈為基礎實現的智能體創新產品——TableAgent數據分析智能體同時宣布公測。

九章雲極DataCanvas公司主任架構師楊健介紹稱,TableAgent在Alaya元識基礎上進化而來,是能夠實現私有化部署的企業級數據分析智能體。在充分的理解用戶意圖後,TableAgent能夠自主地利用統計科學、機器學習、因果推斷等高級建模技術從數據中挖掘價值,進而提供分析觀點和指導行動的深刻見解。這種啟發式和引導式分析能力,能夠從深度和廣度上不斷挖掘數據中的信息和價值,幫助用戶完成高質量的分析工作。

楊健指出,當前市場呈現出豐富多樣的生成式AI形態,「數據分析」是大模型和具體業務融合的更深一步,是最能為用戶產生直接商業價值的核心領域,也將是企業真正需要沉澱的、最有業務價值的領域。TableAgent聚焦數據分析,作為Data+AI的產物,將在未來大模型主導的AI時代為企業轉換巨大的業務價值,迎來難以估量的藍海機遇。

文章來源: https://twgreatdaily.com/zh-tw/666550c0f54e707a2f291e17b1a87096.html