原创 | 壹零社-官方
01
抢滩手机的大模型
大模型的火,终究还是烧到了智能手机市场。一方面,华为、小米、vivo等手机厂商纷纷推出自己的大模型APP植入旗下手机产品,另一方面,通义千问、文心一言等大模型纷纷推出APP版抢滩智能手机产品,大模型与智能手机的结合,不仅仅让手机助手变得更聪明,更能让搭载AI的智能手机帮忙写邮件、写总结文档甚至帮忙制定旅游行程攻略,打开了手机应用新的空间。
不过相对于影像、游戏等具体应用性能的比拼,大模型从进入手机似乎就选择了不同的道路。单就手机助手而言,在最新版本的iOS系统中,已经有了部分机器学习的功能融入Siri中。
其官网显示,机器学习 (ML) App 使用模型来执行图像识别或查找数值数据之间的关系等任务。通过使用算法和数据模型分析数据中的模式并从中进行推断,从而无须遵循明确指令即可学习和适应。这意味着阿里、百度等第三方大模型在手机AI助手应用领域上并不具备优势,而这些通用大模型在产品设计上也走上了各自的“问道”之路。
从左到右分别为通义千问、文心一言及豆包(字节跳动)单看UI设计界面,通义千问、文心一言及豆包(字节跳动)三款大模型APP的定位分化就相当明显了,通义千问APP不仅仅是一款大型预训练语言模型,其更整合了创意文案、办公助理、学习助手、趣味生活等多个方面预设对话角色,其本身在App Store上的介绍也是“生活和工作的智能助手”。
字节旗下的“豆包”则很精准地定位语言对话模型,除陪用户聊天对话外,更会主动给用户发消息以强化虚拟社交属性。而文心一言通过多轮升级后,当前已经具有非常明显的平台属性,虽然目前看到的文心一言默认主界面是“对话”,但1.8.1.10版文心一言全新搭载“社区”和“发现”两个栏目,分别针对用户交互和差异化应用需求,平台化的定位已经非常明显了。
从功能设计和定位看,同属通用大模型的通义千问和文心一言选择了平台化的发展方向,“大而全”路线是否意味着两款大模型未来将成为“AI大模型应用商店”一般的存在呢?
02
生活助手路线:文心一言领先一步
想要抢滩智能手机,成为用户的生活助手,必然需要海量的应用落地,覆盖人们日常生活学习乃至工作的方方面面,才能让软件获得更高的用户留存率以及用户使用时间。
通义千问APP的主界面设计走简约路线,其每一次默认给用户推送4个细分应用赛道让用户选择,用户如果不满意的话也可点选右上角的“换一批”,以获得更贴合当前应用需求的大模型细分应用场景。用户点选需要的场景后,通义千问APP会在底部对话框中弹出预设好的聊天模板,用户可根据个人具体需求的不同,对聊天模板内容进行替换,然后点击发送。
相当于通义千问APP针对不同聊天场景,做出了预设的用户对话内容模板,用户只需要根据个人需求,在模板的基础上进行修改即可,为用户带来便利的同时,也更方便AI理解用户意图和指令。
事实上,每一个预设的场景对话模式完全可以再进一步深挖,令其成为独立的AI应用,进而通过持续的用户对话实现语料投喂和单独的升级,通义千问APP也可以成为应用平台一般的存在,文心一言在该领域明显做得更好一些。
启动文心一言APP后,点击顶部“发现”选项,可以看到新界面针对角色、职场、学习、绘画等细分应用领域打造了不同的品类集合,绝大多数用户都可以在这些品类中找到,点击进入某一个细分品类的应用后,AI会以该应用角色出现,进而引导用户完成对话。
而在“文心一言”的社区中,则展示了用户分享出来的各种对话作品以供用户学习,同时,用户点击文心一言左上角“AI”按钮时,也可以看到当前对话的虚拟人物和自己的历史对话。目前文心一言的助手仅提供了虚拟的洛天依一个角色,希望未来会有很多虚拟人物加入,进而提升产品的丰富度。
显然,单从功能设计上看,平台化明显的文心一言显得更强大一些,其已经具备了初步构造生态的基础,而通义千问APP通过预设场景对话的形式,也有了构造生态的雏形,不过在具体的应用调用上多少有些不便利。
至于最终对话内容效果则相差无几,目前主流通用大模型均经过数代升级,单是通义千问2.0在10个权威测评中,已经全面超越GPT-3.5和Llama2,加速追赶GPT-4,完全能够满足大众日常对话所需。
03
大模型生态初现
国内大模型APP对应用集合的打造或多或少让我们看到了应用商店的雏形,这让我们第一时间想到了在2023年11月初的OpenAI开发者大会上,OpenAI对于生态的设定和构想。
企业不仅可以打造GPTs,更能将其上架在市场内,即GPT Store,可分享给其他用户使用,以及获得分成,类App Store的商业生态由此为出发点。
OpenAI GPT-4升级后的Turbo版本后,虽在技术上给人“查漏补缺”的感觉,但OpenAI发布的all tools工具、assistant API(助手API)则很好地解决了开发者们的痛点,在OpenAI打造的全流程工具链上开发运行,将降低研发的门槛,缩短研发、测试周期,同时节省人力成本,这让OpenAI生态有望在未来出现爆炸式增长的局面。
而国内通义大模型系列中语言大模型AliceMind-PLUG、多模态理解与生成统一模型AliceMind-mPLUG、多模态统一底座模型M6-OFA、超大模型落地关键技术S4框架等核心模型及能力已面向全球开发者开源,同样也是在生态上的布局。大型企业壮大自己“朋友圈”的同时,各类AI应用也有望出现井喷的局面。
04
期待大模型的App Store时刻
2022年底推出的ChatGPT一夜爆火,成为有史以来增长最快的应用。英伟达CEO黄仁勋为此感叹道:我们正处于 AI 的iPhone 时刻。
但鲜少被关注的是,苹果于2008年推出的App Store在某种程度上的重要性甚至高于iPhone,因为它重新定义了手机应用的装载逻辑。只有在吸引海量软件供应商入驻后,iPhone才从一个稍微有点用的电子设备变成革命性的智能手机。
大模型同样如此。通义千问、文心一言等通用模型一定程度上成为AIGC时代的基石,在具体的产业应用中同第三方企业或开发者合作,共同打造细分赛道的解决方案。而当AI的智力成为未来必备的生产要素时,相应的供应公共产品和服务的企业就一定会出现,而大模型也必将出现基础设施服务商,这或许也是阿里、百度们共同期待的。
编辑|张毅
审核|吴新