九章云极宣布自主研发的大模型矩阵开源

2023-11-22   数据杂志

原标题:九章云极宣布自主研发的大模型矩阵开源

九章云极宣布自主研发的大模型矩阵开源

11月21日,九章云极DataCanvas举行大模型系列成果发布会,宣布九章云极DataCanvas公司自主研发的DataCanvas Alaya 九章元识大模型矩阵正式开源一系列新成果。其中包括“Alaya-7B大模型系列”中的Alaya-7B Foundation Model通识大模型和Alaya-7B Chat Model对话大模型两大模型,以及“LLMOps大模型工具链”中的LMS模型运行工具和LMPM 提示词管理器两大工具。

九章云极DataCanvas 公司副总裁于建岗介绍,Alaya-7B大模型系列是DataCanvas Alaya九章元识大模型矩阵的成员之一,基于Alaya通识大模型,由自我采集、精心筛选处理的万亿token数据集(包含网络上的中英文文章、新闻、百科等数据源)上从0开始预训练而成。在此前参与的C-Eval、CMMLU、AGIEval、 MMLU、BBH等权威大模型评测榜单中,Alaya-7B均表现出业内领先水准。

Alaya-7B Chat Model 是Alaya-7B Foundation Model的对话版本,通过在精心选择的微调数据集上进行微调,并对基于涉毒、涉黄以及不良偏见数据进行去毒,从而生成和人类价值观对齐的对话式大模型。Alaya-7B Chat Model具备多轮对话、自我认知和偏见拒答的能力,能够完成知识问答、代码编写、信息提取、阅读理解、创意写作等多项语言任务。

于建岗称,Alaya-7B大模型系列在保证模型表现的同时,对使用者的安装使用硬件要求更低、应用技术难度更低、训练所需的算力资源消耗更小,有助于加速大模型在各类行业场景的实际应用。

LLMOps大模型工具链则覆盖了大模型从训练、精调、压缩、部署、推理到监控的全生命周期过程。

·LMS模型运行工具,能够提高大模型的交付速度和质量,降低大模型的运维和运营成本,以及完成大模型生产化及服务运营等方面的需求。

·LMPM提示词管理器,通过帮助用户设计更好的提示词,引导大模型生成更加准确、可靠、符合预期的输出内容。该工具既可面向技术人员提供development toolkit的开发模式,也可以面向非技术人员提供人机交互的操作模式,满足更多人群使用大模型的需求。

此次发布会上,以DataCanvas Alaya九章元识大模型和LLMOps大模型工具链为基础实现的智能体创新产品——TableAgent数据分析智能体同时宣布公测。

九章云极DataCanvas公司主任架构师杨健介绍称,TableAgent在Alaya元识基础上进化而来,是能够实现私有化部署的企业级数据分析智能体。在充分的理解用户意图后,TableAgent能够自主地利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。这种启发式和引导式分析能力,能够从深度和广度上不断挖掘数据中的信息和价值,帮助用户完成高质量的分析工作。

杨健指出,当前市场呈现出丰富多样的生成式AI形态,“数据分析”是大模型和具体业务融合的更深一步,是最能为用户产生直接商业价值的核心领域,也将是企业真正需要沉淀的、最有业务价值的领域。TableAgent聚焦数据分析,作为Data+AI的产物,将在未来大模型主导的AI时代为企业转换巨大的业务价值,迎来难以估量的蓝海机遇。