看了百度的年度 AI 秀,我们总结出今年全球 AI 三大趋势

2020-09-21     航通社

原标题:看了百度的年度 AI 秀,我们总结出今年全球 AI 三大趋势

AI 将更多地模拟真人;可用性越来越强;与人类劳动呈现竞争与合作相伴的关系。

2020年 第30期

文 / 书航 2020.9.21

9 月 15 日举行的“百度世界 2020”大会展现了百度过去一年的 AI(人工智能)布局及成果,为国际 AI 大厂年度“交作业”补上了一片重要的拼图。

谷歌、微软、亚马逊等实力雄厚的科技巨头,是全球 AI 产业的重要驱动力量。这些头部公司大多会每年一次集中发布新技术和新产品,每次都成为预测全球 AI 趋势的风向标。

受疫情影响,今年的谷歌和 Facebook 开发者大会取消,但是苹果、微软 和亚马逊等还是分别在线上发布 AI 相关进展。通过巨头们今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:

  1. AI 将更趋向于模拟真人,包括模拟语音、动作和性格。
  2. AI 在不断训练之下会变得更有用,可靠性更高;同时越来越不依赖云端,而是在本机和低功耗设备上运行。
  3. AI 将从事更多重复的事务性工作,人类与 AI 的分工合作也同时增加。
今年的“百度世界”都发布了什么

“百度世界 2020”定档 9 月,是 国内疫情防控常态化的又一标志。3 个小时的大直播 与央视新闻联合呈现,由康辉坐镇主持,多位央视新闻名嘴作为“AI体验官”全程参与。

让媒体感到新奇的是,百度安排大家在“分会场”——一家电影院的 IMAX 厅观看直播,这不禁让人想起去年央视携手全国影院以 5G+4K 直播国庆 70 周年阅兵式的情景。

无人驾驶、小度助手、度晓晓、虚拟人

会上的主要发布包括:

(1)无人驾驶:百度 Apollo 在首钢园区现场演示了完全无人驾驶所包含的三大要素:前装量产车、AI 老司机(即不配备安全员的“主驾无人驾驶”)、5G“云代驾”。当路面路况有变动或交通管制等情形时,车辆可由云端驾驶员远程控制来“平行驾驶”。

(2)小度助手:小度助手(DuerOS)版本升级到 6.0,公布数据称月交互次数超 58 亿次,有 4.2 万名开发者和 4000 多个优秀技能。大会展示了小度的三个主要场景即家庭、酒店地产、车载。此外发布了首款搭载小度的真无线智能耳机,为小度补充了第四个场景——随身。

(3)百度移动生态的服务化、人格化:大会介绍了百家号、智能小程序、托管页的相关进展。百度知道、文库等 U/PGC 平台正陆续和百家号体系打通。专家、达人通过百家号开设的直播会在百度搜索结果页优先展示。百家号创作者数量已达 340 万。

大会还发布了创新搜索产品“度晓晓”,这款手机上的养成类虚拟助理App建立在小度助手的能力基础上。随着用户的使用,“度晓晓”可以形成不同的性格。

(4)百度大脑 6.0:大会展示的终端虚拟人“小康”“小李”融合了视觉、语音、语言、知识等多模态的百度大脑 AI 技术。和同类产品相比,它们的“认知能力”有很大提升,生成和展示门槛也大大降低,有助于打造具有人情味的下一代虚拟客服。

百度大脑目前开放了 270 多项能力,聚集了 230 万开发者。飞桨深度学习平台和昆仑通用 AI 处理器,标志着百度掌握了 AI 核心底层技术。 会上还展示了山东电力、森林防火、央视新闻等 AI 应用案例。

可以明显地感受到,现在提及 全球范围的 AI 巨头时,人们越来越频繁地提到百度。有些时候,百度还可以作为其中唯一的中国企业代表。 去年《哈佛商业评论》中文版发布的 《2019 人工智能专项调研报告》显示谷歌、苹果、微软、百度、亚马逊为 2019“全球 AI 五强公司”。

2019 全球 AI 五强公司

虽然当今任何大型科技企业都会触及 AI,不过很多巨头的 AI 实践是分散在主营业务之内,随业务的发展而发展。百度则很明确地以 AI 作为发展方向,其业务线均围绕 AI 能力展开,并反哺 AI 能力的进一步增强。

李彦宏在 2017 年表示百度“是一家人工智能公司”,此后多次承诺增加在 AI 方面的投入。即使受疫情影响, 百度也没有削减研发预算 。2020 年 Q1/Q2,百度的研发费用分别为 44.43 亿元和 48.39 亿元,与当季总营收的比值分别为 19.71% 和 18.59%,均是近年来的高位。

根据沙利文公司(Frost & Sullivan) 《2019 中美人工智能产业及厂商评估》报告,百度、阿里、腾讯和华为等综合型厂商在计算机视觉、自然语言处理、语音识别等核心技术领域均有布局,同时加速基础层软硬件的布局和追赶。

中美 AI 厂商布局表

在此基础上,在智慧城市,智能客服与营销,智慧医疗,智能营销,智能制造,智慧能源,智能制造等方面, 百度均有自有布局。至于 Apollo 在出行方面的成就,更增添了百度 AI 版图的完整度。

从大厂动向看今年的全球 AI 三大发展趋势

疫情改变了全球科技企业的新品发布节奏。受疫情影响,今年的谷歌 I/O 大会 和 Facebook F8 开发者大会宣告取消,但是苹果 WWDC、微软 Build 和亚马逊 Alexa Live 2020 等还是在线上举行。

今年已经走过三分之二,此时召开的“百度世界 2020”可以说为国际 AI 大厂的年度“交作业”补上了一片重要的拼图。接下来还会有微软的 Ignite 和 AWS re:Invent 等活动,苹果还缺一场秋季发布会;谷歌也计划推出新的手机和智能音箱等。

今年各家 AI 巨头都省略了开发者现场参会的环节,变成视频和“PPT发布”,有的直接群发新闻稿了事。总体上说,今年它们带给开发者和市场的新东西都不多;更重要的是,疫情及远程办公也降低了工作效率,拖慢了内部研发和硬件制造的进度。

除小度之外,几大语音助手 Alexa、Siri、Google Assistant 也都趁机宣布了最新的用户数、装机数和开发者数量,但 微软的 Cortana 则退出了消费者端的竞争。在用户分布方面,中美两国继续保持着“划江而治”的状态,尚未出现什么产品可以广泛打入对方的市场。

看完百度世界 2020 之后,结合 其它国际AI 大厂今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:

人工智能将更趋向于模拟真人

其实 AI 每一年都在尝试模仿真人的音容笑貌,但 2020 年可以说是厂商们在拟人 AI 研发方面取得突出进展的一年。像是沙特“机器人公民”索菲亚那样的“实体 AI”尝试暂时消停了,但在屏幕内出现的三维形象,则在飞速跨越拟人形象的“恐怖谷”,变得越发实用。

AI 对真人的模拟包括语音、动作和性格。显然,语音方面的拟人 AI 技能现在已经“点满”,AI 客服在日常生活中已被大量应用。更多人会与 AI 互动,即使自己还没有意识到;但反过来,在我们不认识 AI 的同时,AI 会认出我们。

2018 年,航通社参观世界机器人大会 ,对服务型机器人的进展深感失望。迎宾、业务办理、服务员等类人形机器人,几乎无一例外的选择特别低幼的,长得像喜羊羊一样的卡通脸,露出傻乎乎的,近似“面瘫”的笑容。

2018 年机器人形象和 2020 年 Vtuber

如今,厂商们终于具备了跨越 “恐怖谷”,向人形 AI 这一高峰进军的决心和实力。过去一年诞生了众多虚拟偶像(Vtuber),而一些由人控制的 3D 形象,在需要采集人类动作时也不需要大量的传感器,只要用手机摄像头,甚至是一些录制好的视频片段就可以了。

在百度世界大会宣布上线的 虚拟助理“度晓晓”从2019年开始研发,她的造型、动作和语音都已经非常自然,知识储备更丰富,应答也更接近真人。

百小度、小度、度晓晓

用户见惯了多种 AI 助手之后,口味也更为挑剔。从 2015 年搜索框旁的机器人“百小度”,到语音形态存在,外形也是机器人的“小度”,再到 3D 人形 IP“度晓晓”,技术难度不断加大。

对人类性格的模拟也将帮助AI越来越多地用于创建电影、音乐和游戏。2019 年五四青年节晚会,百度帮助打造的虚拟主持人“小灵”亮相。一年以后,百度世界大会上的虚拟人“小康”技术水平又有了重大提升。

小灵、小康和小康的原型——90 年代的康辉

现在打造虚拟人不再需要录制长时间的视频,只需要几分钟现成的视频资料即可,而且它的对话能力也更强,两个虚拟人之间可以“机机对话”。虽然还是略显尴尬,但已经不至于出现停顿和“乱码”了。

今年很多家开发的 AI 助手在“认人”方面都有了新进展,认出不同的家庭成员成了新的“基本功”。小度助手(DuerOS)6.0 增强了根据音色区分家庭中不同成员的能力,并且只需要录入 20 句话,就可以模仿父母的声音给孩子讲故事。

此外,语音助手也在更努力地学习人类的交流逻辑,例如识别模糊化的指令。人与人交流的时候,对同一种事物有多种不同的表达方式,有时可能会相当模糊,对这种模糊指令的识别一直是一个难点。

7 月 22 日,亚马逊线上举办了 Alexa Live 2020 开发者大会。 本次 Alexa 发布了 31 个新功能,其中基于深度学习的多轮对话开发工具 Alexa Conversations,可以让语音助手的交互体验更加自然。

基于此,用户可以不用清晰记得技能的名称,只要大概说关键字让 Alexa 推断你的意图,就可以调用技能,使用更轻松方便。如果 Alexa 不能完全确定时,将会与用户确认,随着持续深度学习和训练,效果会更精确。还有,现在 Alexa 在执行一项任务的同时,还可以在中途暂停,等过段时间回来还会继续原来任务的进度。

人工智能将越来越有用

随着真实模拟的精度和可用性提高,数据变得更加准确和可用,人工智能变得越来越有用。例如,个性化推送将越来越多,成本也降低;AI 越来越处于“边缘”而不是云端,即在本机完成、在低功耗设备上运行。更多设备(包含物联网设备)将运行 AI 驱动的技术。

现在我们生活中最常用的网络服务,已经淘汰了大多数的手动推荐位,走向“千人千面”,这意味着对 AI 算法推荐的越来越信任和依赖。

本周有消息称, 手机淘宝客户端将全面“信息流化” ,原本顶部显眼的焦点图展示广告将和页面中部的聚划算、百亿补贴、淘宝直播、有好货等板块一起,融入算法推荐信息流“猜你喜欢” 。

手淘改版对比图 / 晚点 LatePost

疫情期间,百度内部聊天工具百度 Hi 升级为办公平台“如流”,加入了钉钉、飞书、腾讯会议、Teambition 等企业协同工具的战场。除标配的音视频会议、文档协作等功能外, 如流最差异化的特点是它的知识管理功能

如流的知识库搜索利用了百度擅长的搜索技术,同时基于知识图谱等 AI 技术实现个性化推荐,不同层级、岗位、知识背景、所属项目的员工看到的知识流将不相同。

如流知识管理界面

近年来,AI 巨头们越来越重视让 AI 算法以更节能,更省算力的方式达到和未优化前同样好的效果。

苹果应用在操作系统内的 AI 能力如自动生成相册、剪辑视频等,均可以离线由自带 AI 芯片完成;谷歌从去年 I/O 大会开始,也强调一些初步的 AI 运算可用本机算力完成。

这次百度世界大会展示的终端虚拟人“小康”和“小李”分别模拟了二十年前的康辉和李彦宏,相比之前的版本,虚拟人的生成门槛降低,只需要几分钟的视频资料;同时计算量降低,普通手机也可以正常运行。由于其具备认知能力并可“机机对话”,也减少了由真人调教,继续投喂信息的训练量。

在物联网、新基建、5G 等大背景下,AI 的训练量加大,算法日益精准,也让人们越来越信赖 AI 从事一些重要的工作。这次百度世界大会展示了一系列 AI 应用大规模推广,和用于重要岗位上的案例。

百度 Apollo 在全球27座城市进行了里程超 600 万公里,累计安全载客 10 万人次的训练, 展现了成熟的无人驾驶与 5G 平行驾驶能力。全无人驾驶是无人出租车(Robotaxi)实现商业闭环的必要条件,将加速中国自动驾驶大规模商业化部署。

小度助手将和人类互动的各种 AI 能力封装起来,可以用很低的成本将任何原本非智能、半智能的场合智能化,例如改造酒店、养老院和普通家庭。去年启动的 百度“AI 助盲行动” 把小度音箱安装到全国 40 多个城市的盲人按摩店,提升了盲人按摩师的工作与生活质量。上百万辆智能汽车装配了拥有小度智能交互的 Apollo 小度车载。

央视新闻AI体验官走进百度智慧养老社区

百度智能云为各行各业提供了完备的解决方案,也涌现出很多经典的合作案例。百度工业视觉智能平台通过对电网实时巡检画面快速检测, 帮助国网山东电力 实现施工机械、烟雾山火、导地线异物等隐患目标的高效检测和高精度危害预警。

百度智能云与山东电力合作建立 AI 中台

百度的另一项广受好评的公益行动“AI 寻人”正与国家机关、新闻媒体、公益组织等展开广泛合作,今年上半年又成功匹配了 1500 多例,总共帮助 11716 个家庭团聚。其跨年龄人脸识别技术采集了人脸的 100 多个特征,可以靠一张距今 20 年以上的老照片顺利完成匹配。

人工智能与人类:替代与协同

随着 AI 的稳定性、可靠性日益增强,它在部分人类岗位上完成彻底取代也是必然的。人工智能将越来越多地代替人类从事枯燥,重复的事务性工作。

2016 年, Facebook 的算法误将一张历史老照片判定为“色情”而删除引发争议 ,说明当年的算法还不成熟。但到了今年,微软旗下门户网站 MSN 裁撤了给新闻排序的人工编辑团队,放心地把首页交给算法打理。

电视业的关键流程之一——视频剪辑,也因为 AI 的进入而不再一样。早前, IBM 协助腾讯体育在转播 NBA 时,以最快速度实时剪辑直播中的精彩画面。这次百度披露,其联合央视网打造的“AI 帮你找”可以自动解析出视频中的人物、感情标签等。 已经上线的“AI 中华诗词”可以标注视频内出镜的主持人、专家等名人具体是在几分几秒出现的,点击时间戳即可跳转过去。

“AI 中华诗词”中,用户可以选择视频中自己感兴趣的点,精准观看

与此同时,人类与 AI 的合作增加,并更多从事 AI 尚无法完全接管的想象力、设计、战略和沟通技能。一些 AI 产品也自我定位成现在岗位上的人类的辅助自动化工具,而不是以取代人类为目的。

百度帮助央视网搭建的一套系统,为编导迅速找到所需的镜头,还能自动编辑。通过读取《等着我》的往期节目,几分钟内就能把节目中最感人的部分做成集锦,编辑只需要微调、最后确认。

8月下旬,刚从微软分拆出来的 小冰公司发布了“X 套件”,是对微软 Office 套件的理念进化。X Writer 允许用户输入一段文字开头后,召唤 AI 自动续写;X Studio 可将文章转制为音频,制作播客、电台节目等,以及调用音源作曲编曲;X Presenter 增强了传统的 PPT 演示,3D 人物可模拟真人讲解,取代真人出镜来制作网课、视频会议等内容。

X Presenter:“人工智能时代的演示文档”

小冰发言人讲解时称,它们希望 AI 不是取代人类工作,而是帮忙做好半成品,让人类做最后的审核把关即可。由X 套件辅助生成的所有成果,其知识产权均归用户所有。

很显然,人类不得不应对 AI 进入工作流程的趋势,善于利用 AI 为自己减轻工作量,同时及时从会被 AI 完全取代的工作中转行。

IDC 预测, 到 2025 年 75% 的组织将投资于员工再培训,以填补因需要采用 AI 而造成的技能缺口。以至于,如果你的雇主不投资于 AI 培训,那么你可以预判他们未来几年的成长空间可能很有限。

李彦宏在百度世界 2020 大会上提到了“数据标注师”,这是 AI 创造的其中一种新行业,对收集进来的数据进行标注,使其有条理,符合训练机器所需的条件。标注过的数据越多,机器学的越快。他说:“对人力的需求会被逐步的激发出来,我觉得人的需求是会不断膨胀、不断更新的。”

参考资料

https://baiduworld.baidu.com/zt/activity/index

https://www.cyzone.cn/article/571846.html

https://mp.weixin.qq.com/s/x6tXIXBvDcfkcYKCeYE6Xg

https://www.leiphone.com/news/202004/Hegr5IfY9Z21CoVN.html

http://www.chinanews.com/it/2020/08-25/9273618.shtml

https://www.theverge.com/2019/1/18/18187992/

https://mp.weixin.qq.com/s/tiiUYAxJ6qJNp6OpgfVmCQ

https://baijiahao.baidu.com/s?id=1677889259224363177

https://www.shenzhenware.com/articles/14248

http://mbd.baidu.com/webpage?type=live&action=liveshow&source=h5pre&room_id=3825953134

https://mp.weixin.qq.com/s/3Tx_kO7Z3nK25tbX8YixaQ

https://mp.weixin.qq.com/s/9OgpEkc2HhaPAzZW_EFb2w

https://mp.weixin.qq.com/s/LXpHlSgWoXEXtGR3-cn2OQ

https://tech.sina.com.cn/n/k/2018-06-19/doc-iheauxvz5976521.shtml

http://tv.cctv.com/2019/10/31/ARTIz6iRuOYu4UuaNgy8NOlS191031.shtml

https://www.ithome.com/0/504/552.htm

https://cdn.idc.com/research/viewtoc.jsp?containerId=US45576319

转载本文 / 商务合作请咨询

航通社助理微信号:hangtongshe

或邮箱:coop#lishuhang.me

航通社读者群招募中!

请联系航通社助理微信号:hangtongshe

附言填口令【航通社读者进群

分享| 点赞| 点在看

文章来源: https://twgreatdaily.com/zh-hans/bE2GvnQBLq-Ct6CZAg9I.html



















航通社简介

2020-07-07