騰訊混元宣布大語言模型和3D模型正式開源

2024-11-05     中國證券報

中證網訊(記者 楊梓岩)11月5日,騰訊混元宣布最新的MoE大語言模型「混元Large」以及混元3D生成大模型「Hunyuan3D-1.0」正式開源,支持企業及開發者精調、部署等不同場景的使用需求,可在HuggingFace、Github等技術社區直接下載,免費並可商用。當天,騰訊雲TI平台和高性能應用服務HAI也開放接入這兩個模型,為模型的精調、API調用及私有化部署提供一站式服務。

本次開源是騰訊混元繼文生圖模型後持續開放的新舉措。其中,騰訊混元Large是目前開源領域參數規模最大、效果最好的MoE模型,而騰訊混元3D生成大模型則是業界首個同時支持文字、圖像生成3D的開源大模型。目前,兩個模型均已經在騰訊業務場景中落地應用,是面向實用場景的應用級大模型。

據了解,騰訊混元Large模型總參數量389B,激活參數量52B,上下文長度達256K,公開測評結果顯示,騰訊混元Large在CMMLU、MMLU、CEval、MATH等多學科綜合評測集以及中英文NLP任務、代碼和數學等9維度處於領先位置。

MoE(Mixture of Experts),即混合專家模型,是目前國內外主流的大模型結構。2024年年初,騰訊混元宣布在國內率先採用MoE架構模型,總體性能比上一代Dense模型提升50%。此後,騰訊混元推出基於MoE架構的多模態理解大模型以及基礎模型「混元turbo」,在性能、效果、速度等多個領域表現優越。

此次騰訊混元開源的3D生成大模型Hunyuan3D-1.0,解決了現有的3D生成模型在生成速度和泛化能力上存在不足的問題,可以幫助3D創作者和藝術家自動化生產3D資產。該模型具有強大的泛化能力和可控性,可重建各類尺度物體,大到建築,小到工具花草。經過定性、定量多個維度的評估,騰訊混元3D生成大模型的生成質量已達到開源模型的先進水平。應用上,3D生成相關技術已經開始應用於UGC 3D創作、商品素材合成、遊戲3D資產生成等騰訊業務中。

文章來源: https://twgreatdaily.com/4b8d07f0d7bc0ebba17ed57edb7be9b1.html