混元大模型初体验:目前不太出色

2023-09-14     AI狐头条

原标题:混元大模型初体验:目前不太出色

原创 | 算法一只狗

虽然说之前已经有很多公司发布了大模型,但是腾讯在大模型上还是令人期待的。

随着ChatGPT带来的AI大模型潮流的发展,国内各家大公司都是卯足力气发布自家的大模型。自今年3月份以来,百度发布了文心一言,并在近期发布了文心一言APP。4月份则是阿里发布的通义千问,同时近期也发布了多模态通义千问Qwen-Chat。而此后国内大模型就一直百花齐放,因此又被网友称为“百模大战”。

虽然“百模大战”已经然很多网友感觉到了疲劳。主要原因在于:

利用现有的榜单进行刷榜,其实人们已经很少去关注了,刷榜只会给人们带来麻木在开源模型中,目前只有LLAMA2真正使用了RLHF,其他模型还是欠缺了许多

大模型目前的发力点还在于实用性

从9月7日腾讯全球数字生态大会上,腾讯发布了自家大模型“混元助手”来看,其实腾讯更倾向于把大模型真正变成生产力,来提高工作效率。这就需要不断依赖于混元大模型与腾讯业务的紧密结合,从而找到更好的发力点。

大模型不仅仅要“参数量大”,更需要在多领域上进行充分应用,把用户的痛点进行充分解决,让更多开发者参与进来进行开发,从而更好的促进自身大模型的生态打造。

从官网介绍,混元大模型在复杂语境下,能够完成很好的“多轮对话”、“内容创作”、“逻辑推理”等大模型的基础能力

从生态大会上得知,腾讯混元大模型更加聚焦于其应用方面,其目前已经在腾讯文档、广告、会议等多个业务上取得明显效果。比如在腾讯文档中,可以有效的做到多种文案的生成,并且已经支持excel公式的生成。

在腾讯文档中,新建智能文档,按下"/"键,就可以快速调出混元助手进行文本生成:

而在腾讯会议中,混元助手则可以帮助你快速记录会议内容并生成摘要文档。同时能够根据一定的上下文进行问题回答:

当然,也可以通过混元助手生成对应的图片,并进行AI广告创作。让你几分钟内制作出好看的图片出来。

混元助手初体验

申请通过,我们可以通过网页和微信小程序体验混元助手,这里面提出几个问题对混元助手进行相应的测试。

1

数学计算

Q:个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?(答案为正整数)

本身推理过程算是比较正确,但是最后得到了错误的答案。因此这里进一步提示模型,这样才能够算出正确答案:

说明模型本身是有一定的推理能力的,而且也接受一定的多轮对话理解。

2

逻辑推理

全国防灾减灾日

Q:赵三的父母结婚的时候,为什么没有邀请自己参加

好像没有回答,只是把输入的话重复了一遍而已。

Q:我妈妈的弟弟的儿子的老婆我叫他

这次的推理还是比较准确,能够准确推理出亲戚之间的关系。

3

代码能力

本身在混元助手中,已经集成了多种不同的能力,这里面就包括生成代码。我们也可以生成自己的指令,进行快速的编写。

Q:利用huggingface调用LLAMA大模型代码。

从上面代码上看,基本没有什么问题。还会贴心的给出代码的每个步骤在干什么,应该是初步具备一定的代码水平。

4

额外的能力

除了上面几个能力之外,它还包括了绘画、营销、角色扮演等等。

在生成的图片上,没有太多的理解我的意思,同时生成的风格偏向于动画化:

总结

从“百模大战”的内卷,也最终让很多大公司意思到只有在具体行业中落地,才能够充分发挥大模型带来的价值。

而混元大模型虽然目前表现还不是太出色,但是如果能够与更多的场景进行融合,相信能够变得越来越好,真正的提升人们的工作效率。

文章来源: https://twgreatdaily.com/zh-hans/bb6c05965bc639db43709591fe5efba4.html