九章云极宣布自主研发的大模型矩阵开源

2023-11-22 数据杂志

九章云极宣布自主研发的大模型矩阵开源

11月21日，九章云极DataCanvas举行大模型系列成果发布会，宣布九章云极DataCanvas公司自主研发的DataCanvas Alaya 九章元识大模型矩阵正式开源一系列新成果。其中包括“Alaya-7B大模型系列”中的Alaya-7B Foundation Model通识大模型和Alaya-7B Chat Model对话大模型两大模型，以及“LLMOps大模型工具链”中的LMS模型运行工具和LMPM 提示词管理器两大工具。

九章云极DataCanvas 公司副总裁于建岗介绍，Alaya-7B大模型系列是DataCanvas Alaya九章元识大模型矩阵的成员之一，基于Alaya通识大模型，由自我采集、精心筛选处理的万亿token数据集（包含网络上的中英文文章、新闻、百科等数据源）上从0开始预训练而成。在此前参与的C-Eval、CMMLU、AGIEval、 MMLU、BBH等权威大模型评测榜单中，Alaya-7B均表现出业内领先水准。

Alaya-7B Chat Model 是Alaya-7B Foundation Model的对话版本，通过在精心选择的微调数据集上进行微调，并对基于涉毒、涉黄以及不良偏见数据进行去毒，从而生成和人类价值观对齐的对话式大模型。Alaya-7B Chat Model具备多轮对话、自我认知和偏见拒答的能力，能够完成知识问答、代码编写、信息提取、阅读理解、创意写作等多项语言任务。

于建岗称，Alaya-7B大模型系列在保证模型表现的同时，对使用者的安装使用硬件要求更低、应用技术难度更低、训练所需的算力资源消耗更小，有助于加速大模型在各类行业场景的实际应用。

LLMOps大模型工具链则覆盖了大模型从训练、精调、压缩、部署、推理到监控的全生命周期过程。

·LMS模型运行工具，能够提高大模型的交付速度和质量，降低大模型的运维和运营成本，以及完成大模型生产化及服务运营等方面的需求。

·LMPM提示词管理器，通过帮助用户设计更好的提示词，引导大模型生成更加准确、可靠、符合预期的输出内容。该工具既可面向技术人员提供development toolkit的开发模式，也可以面向非技术人员提供人机交互的操作模式，满足更多人群使用大模型的需求。

此次发布会上，以DataCanvas Alaya九章元识大模型和LLMOps大模型工具链为基础实现的智能体创新产品——TableAgent数据分析智能体同时宣布公测。

九章云极DataCanvas公司主任架构师杨健介绍称，TableAgent在Alaya元识基础上进化而来，是能够实现私有化部署的企业级数据分析智能体。在充分的理解用户意图后，TableAgent能够自主地利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值，进而提供分析观点和指导行动的深刻见解。这种启发式和引导式分析能力，能够从深度和广度上不断挖掘数据中的信息和价值，帮助用户完成高质量的分析工作。

杨健指出，当前市场呈现出丰富多样的生成式AI形态，“数据分析”是大模型和具体业务融合的更深一步，是最能为用户产生直接商业价值的核心领域，也将是企业真正需要沉淀的、最有业务价值的领域。TableAgent聚焦数据分析，作为Data+AI的产物，将在未来大模型主导的AI时代为企业转换巨大的业务价值，迎来难以估量的蓝海机遇。

九章云极宣布自主研发的大模型矩阵开源

金融市场在震荡中等待美大选结果

苹果AI还在等待惊喜

金价猛涨10个月，最先扛不住的是金店

2024诺贝尔经济学奖：制度与繁荣

全球资本重返新兴市场

暑期档票房有多惨，突破了90亿，但退回到了10年前

给股份、送公司，“分手费”高达2亿，董宇辉为什么还是非走不可？

拜登退选 “特朗普交易”也熄火

议会洗牌欧洲“右转”

经历十几道“工序”后，1342份高考试卷已出发

英国为自动驾驶汽车正式立法

10万亿韩元韩国力撑芯片产业

日经ETF大火！华夏、工银瑞信等多家公募提示风险

天风证券：董事长、副董事长及部分董事、独立董事因工作原因辞职

泰禾集团事件追责！国泰君安等3家券商同日收警示函

智谱AI CEO张鹏：GLM-4中文能力比肩GPT-4，2024将是AGI元年

11只ETF入列互联互通名单！北向ETF成交额已超1300亿元

拖拉机开进柏林德国爆发农民抗议

北交所：2023年全年证券公司新增开通权限账户156.69万户

接近历史高点日本股市梦回“繁花”时代

兴业证券拟向兴证（香港）增资10亿元

因保荐项目上市当年营业利润同比下滑超50% 万和证券遭监管出具警示函

“押注”私企，美国登月计划一推再推

“老将”上任！超800亿元规模资管“换帅”