作者|知行
龙源是中国数字出版的代表性企业,核心资产经过了20年的发展和积累,聚集了全国人文大众类90%的期刊杂志的数字内容。这些内容从一开始就注重文本格式的数字化制作和标引,使得这些内容成为今天AI时代语言大模型最有价值的支撑素材。开创了将AIGC工具与区块链版权内容互为支撑的知识服务模式。
娱乐资本论·视智未来专访了龙源传媒的执行总裁汤杨,探讨了龙源传媒如何结合AI技术为知识创造更大的价值,以及面对未来,龙源有何计划和展望。
---以下为采访实录---
文可知识库是AI大语言模型与区块链内容库结合的赋能平台
视智未来:可以介绍龙源和文可知识库吗?
(龙源传媒执行总裁汤杨,下同)
龙源创新数字传媒(北京)股份有限公司是中国数字出版和数字传媒领域的代表性企业之一,被业界和大众广泛认知的特色是人文大类期刊杂志。此外,公司还有大量的其他数字化版权,包括图书、图片、音视频IP以及签约的作者,包括专业作者和草根作者。我们为公司定位的商务模式是“数字版权中台”。2022年正式命名为“知识树”平台。我们的使命是“为知识创造价值,为知识的创造者创造财富”。
视智未来:请介绍一下文可知识库?
文可知识库是龙源将版权知识库同LLM大语言模型,结合在一起的创新产品。核心功能是将版权文章参与到AI语言大模型的生成过程,辅助用户通过归纳文章概要,加入个人观点,以提升文章的质量和原创性。
现在AI写作更多是帮助用户整理思路,准确性不足。很多时候是一本正经的“胡说八道”。“文可”可以让用户更容易搜索到自己想要的、靠谱的知识,写出正确的内容,把以往沉淀的知识内容从书库束之高阁的书架上激活,变为大众创新的鲜活题材。
所有的创新都是“推陈”:让AI辅助创作内容更容易、更普及
视智未来:版权人会不会觉得,AI在剽窃我的知识产权?
ChatGPT所代表的AI语言大模型开启了革命性的新时代。其不断演进和发展的速度将超过我们的想象。版权问题是ChatGPT背后隐藏的巨大问题。这些语言大模型号称是机器自动生成,但实际上我们知道生成的基础一定是现有知识内容的基础,只是利用的内容颗粒度很小,来源众多,“无中生有”是不可能的。所有的创新都是基于以往的积累和融合。
比如我们以前写一篇论文,可能主要受5篇文章影响,所以我在论文后面会对这些引用进行标注。但ChatGPT可能引用了成千上万个来源,也仍然需要认可,对这些知识产权的认可和尊重是需要从法律、职业伦理、技术方面解决,“文可”是向这方面努力的重要一步。
视智未来:“文可”的壁垒是什么?
所有产品最高级别的壁垒可能是价值观,其次海量的专业版权内容库,然后是让使用更便利的技术性的壁垒。文可的核心壁垒就是龙源一贯坚持的“知识主体论”价值观。我们认为知识产业的价值链由知识的创造者、知识的使用者和知识的经验者构成。其中知识的创造者是根本,其次是知识的使用者,也就是用户,最后才是知识的经营者。比如龙源、百度、谷歌、OpenAI都属于知识的经营者。当然还有龙源获得的海量知识IP版权内容,能够作为用户创作的灵感、基础和依据。
视智未来:你们也在做区块链吗?
对。区块链技术平台一直在做。国内的区块链平台大部分只是一个技术链,而区块链的确权和溯源价值必须和司法体系打通,获得官方和法律的认可。2019年我们和北京市版权局主导的“首都链”达成战略合作。版权的确权结果可以获得官方认可。此外,我们创立了“知识区块链”的新理念,2017年在北师大设立了“知识区块链研究基金”,和北师大金融学院和技术学院共同成立了“北师大知识区块链研究中心”,不但从技术角度研究知识内容的确权和溯源方面的难题,而且从“证券化”的角度研究区块链“激励”机制。
视智未来:未来“文可”和AI产品的发展方向是?
“文可”的使命是将已经正式发表的版权内容库同ChatGPT结合起来,弥补现阶段的短板和漏洞。包括潜在的版权问题和“政治正确”问题。
目前几乎所有的大学、机关、媒体都明文禁止使用纯粹用ChatGPT生成的文章。主要担心文章内容的原创性和正确性无法判断。
此外,对普通使用者来说,最基本的问题是无法给机器提出基本的指令和大纲,也就是PROMPT。我们升级版的功能将协助用户通过PGC的内容和用户的观点和判断的参与,生成具有原创性的基本观点和大纲。而不是像现在的AI完全基于机器生成。
视智未来:还有商业模式的问题,“文可”如何实现盈利和价值?
严格意义上来说,“文可”以及龙源版权中台采用的是web3.0的模式。其核心特征是“共享”而不是追求利润最大化。
我们的大部分收入都会通过确权和溯源机制分配给版权利益的各方,此外也为平台的升级和运营服务形成良性的造血功能,主要是通过会员制的方式实现的。
我们第一阶段把用户定位于需要大量生产知识内容的领域,包括上千万的公众号等新媒体的运营者。他们需要每天更新公众号内容,但纯粹的GTP内容平台不会接受的。原创的内容成本太高。我们目前分为基本会员和高级会员两种会员类型。主要区别是版权授权内容的数量和其他增值服务。
对于需要大量生产文章或视频内容的用户来说,完成一篇有高质量公众号或媒体文章只有不到10元的成本,这是极为划算的。
我们本身并不提供基于算力的大模型,而是通过合作接口API整合各类算法和模型,加上其他辅助工具的增值服务,为用户提供会员制的综合服务。会员除了可以方便地免费使用“文心一言”“OpenAI”“讯飞星火”等大模型外,还可以引用龙源知识库的文章内容。下一步文可还将为用户提供“知识微视频的创作”,让视频内容更加便宜优质。
视智未来:据我所知很多大厂都在寻找优质内容来训练的大模型,你们会把龙源知识库卖给他们吗?
许多大企业也在构建自己的私域大模型为自己的产业和行业服务。已经有不少大企业找到我们,希望将我们的版权内容数据能卖给他们,提升内部大模型的质量,但我们提供的主要是数据内容,并不是版权的授权。
龙源知识库的版权内容数据是已经经过专家系统参与整理的知识体系内容,是可以称之为高结构化内容。这个价值是各语言大模型平台很看重的。我们希望他们可以按年使用付费,并和整体收益挂钩,给龙源适当的分成。或者,我们成为大模型的一个插件,用户使用我们的产品时单独付费。
视智未来:类似Scholarly吗?
对,这是最接近我们的产品。用户写学术论文的时候需要引用文献,这个插件会显示出来。
视智未来:你们为会员提供的增值服务还有查重服务和AI检测工具吗?
对。AI检测工具可以推断内容生成方面的AI比例。检测报告的准确率很高,底层数据和知网的查重检测是一家技术公司,实际上付费的还是学生。比如清华大学用多种检测工具检查学术不端的问题。但这种查重服务的模式主要是为了“除恶”,但AI检测工具是引导行业“向善”。
视智未来:目前文可知识库有多少会员?
目前还在试运营阶段,有十几万注册用户,其中有30%的重度用户,每天生成100多篇文章。最近三个月我们正在免费送出试用会员。现阶段还不追求盈利。
“我们一直在为基于AI的知识区块链社会做准备”
视智未来:“文可”做了多久?
“文可”的研发时间并不长。但可以说龙源20年来都在为基于AI和知识区块链的社会做准备。
龙源创立之初就确立了“为知识创造价值,为知识的创造者创造财富”的宗旨和使命。“为知识创造价值”是对知识服务端来讲的。知识的传播越广,使用越充分,知识的价值才能最大限度地体现出来。把知识锁进抽屉里是无法体现价值的;“为知识的创造者创造财富”是对版权方来讲的。必须充分保护知识创造者的利益,知识生产才能源源不断,生生不息。而建设以知识为主体的社会才是比权力主体社会、资本主义社会更理想的未来社会。而实现这个理想的技术支撑就是区块链和AI技术。从这个意义上说,我们的追求一以贯之,一开始就在为基于AI的知识区块链社会做准备。
视智未来:“知识树”平台的功能和目标是什么?
“知识树平台”是一个整合性的生态系统,包括区块链确权平台、AI编创平台、内容分发平台以及相关的辅助工具,形成了未来知识服务完整的价值链。
龙源20年前就开始对所有的内容进行文本格式处理,并进行了全面的关键词标引。这也使我们的内容不但可以方便地转换为语音版、繁体字版甚至视频化处理,而且借用AI的工具将内容按照最基础的逻辑单位进行重组。而这正是语言大模型需要的储备建设。
(本文呈现的谈话内容仅反映受访者的个人意见)