混元大模型初体验：目前不太出色

2023-09-14 AI狐头条

原创 | 算法一只狗

虽然说之前已经有很多公司发布了大模型，但是腾讯在大模型上还是令人期待的。

随着ChatGPT带来的AI大模型潮流的发展，国内各家大公司都是卯足力气发布自家的大模型。自今年3月份以来，百度发布了文心一言，并在近期发布了文心一言APP。4月份则是阿里发布的通义千问，同时近期也发布了多模态通义千问Qwen-Chat。而此后国内大模型就一直百花齐放，因此又被网友称为“百模大战”。

虽然“百模大战”已经然很多网友感觉到了疲劳。主要原因在于：

利用现有的榜单进行刷榜，其实人们已经很少去关注了，刷榜只会给人们带来麻木在开源模型中，目前只有LLAMA2真正使用了RLHF，其他模型还是欠缺了许多

大模型目前的发力点还在于实用性

从9月7日腾讯全球数字生态大会上，腾讯发布了自家大模型“混元助手”来看，其实腾讯更倾向于把大模型真正变成生产力，来提高工作效率。这就需要不断依赖于混元大模型与腾讯业务的紧密结合，从而找到更好的发力点。

大模型不仅仅要“参数量大”，更需要在多领域上进行充分应用，把用户的痛点进行充分解决，让更多开发者参与进来进行开发，从而更好的促进自身大模型的生态打造。

从官网介绍，混元大模型在复杂语境下，能够完成很好的“多轮对话”、“内容创作”、“逻辑推理”等大模型的基础能力

从生态大会上得知，腾讯混元大模型更加聚焦于其应用方面，其目前已经在腾讯文档、广告、会议等多个业务上取得明显效果。比如在腾讯文档中，可以有效的做到多种文案的生成，并且已经支持excel公式的生成。

在腾讯文档中，新建智能文档，按下"/"键，就可以快速调出混元助手进行文本生成：

而在腾讯会议中，混元助手则可以帮助你快速记录会议内容并生成摘要文档。同时能够根据一定的上下文进行问题回答：

当然，也可以通过混元助手生成对应的图片，并进行AI广告创作。让你几分钟内制作出好看的图片出来。

混元助手初体验

申请通过，我们可以通过网页和微信小程序体验混元助手，这里面提出几个问题对混元助手进行相应的测试。

数学计算

Q:个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?（答案为正整数）

本身推理过程算是比较正确，但是最后得到了错误的答案。因此这里进一步提示模型，这样才能够算出正确答案：

说明模型本身是有一定的推理能力的，而且也接受一定的多轮对话理解。

逻辑推理

全国防灾减灾日

Q：赵三的父母结婚的时候，为什么没有邀请自己参加

好像没有回答，只是把输入的话重复了一遍而已。

Q：我妈妈的弟弟的儿子的老婆我叫他

这次的推理还是比较准确，能够准确推理出亲戚之间的关系。

代码能力

本身在混元助手中，已经集成了多种不同的能力，这里面就包括生成代码。我们也可以生成自己的指令，进行快速的编写。

Q：利用huggingface调用LLAMA大模型代码。

从上面代码上看，基本没有什么问题。还会贴心的给出代码的每个步骤在干什么，应该是初步具备一定的代码水平。

额外的能力

除了上面几个能力之外，它还包括了绘画、营销、角色扮演等等。

在生成的图片上，没有太多的理解我的意思，同时生成的风格偏向于动画化：

总结

从“百模大战”的内卷，也最终让很多大公司意思到只有在具体行业中落地，才能够充分发挥大模型带来的价值。

而混元大模型虽然目前表现还不是太出色，但是如果能够与更多的场景进行融合，相信能够变得越来越好，真正的提升人们的工作效率。

混元大模型初体验：目前不太出色

14岁男孩杀死了自己，在此之前，他迷上了他的AI伴侣

暴跌125亿！AI“巨头”万兴科技，泡沫有多大？

AI重构下的百度网盘：限速顽疾久治不愈、屡曝安全漏洞，用户信息如何守护？

深圳地下交通“最强大脑”背后：商汤科技五年半亏了近五百亿

第一批抢跑的人，用AI搞了上千万？

AI 幽灵，“刺杀”小说家

我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了！

苹果的大模型冲刺：没有 AI 新产品，只有新功能

大模型军备竞赛远未结束，但已注定成为少数人的游戏

为了0.0003元，阿里和字节杠上了

Kimi挣钱的样子好抽象！

降价会是字节AI的出路吗？

别再狂吹GPT-4o了！不要只顾着涨他人威风、灭自己志气

月之暗面撞上算力墙？

小红书的大模型有点怂

三天暴涨一倍，商汤翻身还是泡沫？

巴菲特：我对AI一无所知

阿里想借助AI电商反杀拼多多？

苦苦挣扎的周鸿祎，摇摆不定的360

汤晓鸥，倒在了商汤最难的时候

AI 制作的成人电影，为什么这么多人在看？

被冤枉的李开复，被“错付”的中国开源

营收下降，利润下滑！联想梭哈大模型？

我找两个热门行业问现在AI如何取代人，结果被泼了冷水