原创 | 算法一只狗
虽然说之前已经有很多公司发布了大模型,但是腾讯在大模型上还是令人期待的。
随着ChatGPT带来的AI大模型潮流的发展,国内各家大公司都是卯足力气发布自家的大模型。自今年3月份以来,百度发布了文心一言,并在近期发布了文心一言APP。4月份则是阿里发布的通义千问,同时近期也发布了多模态通义千问Qwen-Chat。而此后国内大模型就一直百花齐放,因此又被网友称为“百模大战”。
虽然“百模大战”已经然很多网友感觉到了疲劳。主要原因在于:
利用现有的榜单进行刷榜,其实人们已经很少去关注了,刷榜只会给人们带来麻木在开源模型中,目前只有LLAMA2真正使用了RLHF,其他模型还是欠缺了许多
大模型目前的发力点还在于实用性
从9月7日腾讯全球数字生态大会上,腾讯发布了自家大模型“混元助手”来看,其实腾讯更倾向于把大模型真正变成生产力,来提高工作效率。这就需要不断依赖于混元大模型与腾讯业务的紧密结合,从而找到更好的发力点。
大模型不仅仅要“参数量大”,更需要在多领域上进行充分应用,把用户的痛点进行充分解决,让更多开发者参与进来进行开发,从而更好的促进自身大模型的生态打造。
从官网介绍,混元大模型在复杂语境下,能够完成很好的“多轮对话”、“内容创作”、“逻辑推理”等大模型的基础能力
从生态大会上得知,腾讯混元大模型更加聚焦于其应用方面,其目前已经在腾讯文档、广告、会议等多个业务上取得明显效果。比如在腾讯文档中,可以有效的做到多种文案的生成,并且已经支持excel公式的生成。
在腾讯文档中,新建智能文档,按下"/"键,就可以快速调出混元助手进行文本生成:
而在腾讯会议中,混元助手则可以帮助你快速记录会议内容并生成摘要文档。同时能够根据一定的上下文进行问题回答:
当然,也可以通过混元助手生成对应的图片,并进行AI广告创作。让你几分钟内制作出好看的图片出来。
混元助手初体验
申请通过,我们可以通过网页和微信小程序体验混元助手,这里面提出几个问题对混元助手进行相应的测试。
1
数学计算
Q:个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?(答案为正整数)
本身推理过程算是比较正确,但是最后得到了错误的答案。因此这里进一步提示模型,这样才能够算出正确答案:
说明模型本身是有一定的推理能力的,而且也接受一定的多轮对话理解。
2
逻辑推理
全国防灾减灾日
Q:赵三的父母结婚的时候,为什么没有邀请自己参加
好像没有回答,只是把输入的话重复了一遍而已。
Q:我妈妈的弟弟的儿子的老婆我叫他
这次的推理还是比较准确,能够准确推理出亲戚之间的关系。
3
代码能力
本身在混元助手中,已经集成了多种不同的能力,这里面就包括生成代码。我们也可以生成自己的指令,进行快速的编写。
Q:利用huggingface调用LLAMA大模型代码。
从上面代码上看,基本没有什么问题。还会贴心的给出代码的每个步骤在干什么,应该是初步具备一定的代码水平。
4
额外的能力
除了上面几个能力之外,它还包括了绘画、营销、角色扮演等等。
在生成的图片上,没有太多的理解我的意思,同时生成的风格偏向于动画化:
总结
从“百模大战”的内卷,也最终让很多大公司意思到只有在具体行业中落地,才能够充分发挥大模型带来的价值。
而混元大模型虽然目前表现还不是太出色,但是如果能够与更多的场景进行融合,相信能够变得越来越好,真正的提升人们的工作效率。