看了百度的年度 AI 秀,我們總結出今年全球 AI 三大趨勢

2020-09-21     航通社

原標題:看了百度的年度 AI 秀,我們總結出今年全球 AI 三大趨勢

AI 將更多地模擬真人;可用性越來越強;與人類勞動呈現競爭與合作相伴的關係。

2020年 第30期

文 / 書航 2020.9.21

9 月 15 日舉行的「百度世界 2020」大會展現了百度過去一年的 AI(人工智慧)布局及成果,為國際 AI 大廠年度「交作業」補上了一片重要的拼圖。

谷歌、微軟、亞馬遜等實力雄厚的科技巨頭,是全球 AI 產業的重要驅動力量。這些頭部公司大多會每年一次集中發布新技術和新產品,每次都成為預測全球 AI 趨勢的風向標。

受疫情影響,今年的谷歌和 Facebook 開發者大會取消,但是蘋果、微軟 和亞馬遜等還是分別在線上發布 AI 相關進展。通過巨頭們今年的各項技術發布,全球 AI 業界的三個主要發展趨勢也逐漸清晰起來:

  1. AI 將更趨向於模擬真人,包括模擬語音、動作和性格。
  2. AI 在不斷訓練之下會變得更有用,可靠性更高;同時越來越不依賴雲端,而是在本機和低功耗設備上運行。
  3. AI 將從事更多重複的事務性工作,人類與 AI 的分工合作也同時增加。
今年的「百度世界」都發布了什麼

「百度世界 2020」定檔 9 月,是 國內疫情防控常態化的又一標誌。3 個小時的大直播 與央視新聞聯合呈現,由康輝坐鎮主持,多位央視新聞名嘴作為「AI體驗官」全程參與。

讓媒體感到新奇的是,百度安排大家在「分會場」——一家電影院的 IMAX 廳觀看直播,這不禁讓人想起去年央視攜手全國影院以 5G+4K 直播國慶 70 周年閱兵式的情景。

無人駕駛、小度助手、度曉曉、虛擬人

會上的主要發布包括:

(1)無人駕駛:百度 Apollo 在首鋼園區現場演示了完全無人駕駛所包含的三大要素:前裝量產車、AI 老司機(即不配備安全員的「主駕無人駕駛」)、5G「雲代駕」。當路面路況有變動或交通管制等情形時,車輛可由雲端駕駛員遠程控制來「平行駕駛」。

(2)小度助手:小度助手(DuerOS)版本升級到 6.0,公布數據稱月交互次數超 58 億次,有 4.2 萬名開發者和 4000 多個優秀技能。大會展示了小度的三個主要場景即家庭、酒店地產、車載。此外發布了首款搭載小度的真無線智能耳機,為小度補充了第四個場景——隨身。

(3)百度移動生態的服務化、人格化:大會介紹了百家號、智能小程序、託管頁的相關進展。百度知道、文庫等 U/PGC 平台正陸續和百家號體系打通。專家、達人通過百家號開設的直播會在百度搜索結果頁優先展示。百家號創作者數量已達 340 萬。

大會還發布了創新搜索產品「度曉曉」,這款手機上的養成類虛擬助理App建立在小度助手的能力基礎上。隨著用戶的使用,「度曉曉」可以形成不同的性格。

(4)百度大腦 6.0:大會展示的終端虛擬人「小康」「小李」融合了視覺、語音、語言、知識等多模態的百度大腦 AI 技術。和同類產品相比,它們的「認知能力」有很大提升,生成和展示門檻也大大降低,有助於打造具有人情味的下一代虛擬客服。

百度大腦目前開放了 270 多項能力,聚集了 230 萬開發者。飛槳深度學習平台和崑崙通用 AI 處理器,標誌著百度掌握了 AI 核心底層技術。 會上還展示了山東電力、森林防火、央視新聞等 AI 應用案例。

可以明顯地感受到,現在提及 全球範圍的 AI 巨頭時,人們越來越頻繁地提到百度。有些時候,百度還可以作為其中唯一的中國企業代表。 去年《哈佛商業評論》中文版發布的 《2019 人工智慧專項調研報告》顯示谷歌、蘋果、微軟、百度、亞馬遜為 2019「全球 AI 五強公司」。

2019 全球 AI 五強公司

雖然當今任何大型科技企業都會觸及 AI,不過很多巨頭的 AI 實踐是分散在主營業務之內,隨業務的發展而發展。百度則很明確地以 AI 作為發展方向,其業務線均圍繞 AI 能力展開,並反哺 AI 能力的進一步增強。

李彥宏在 2017 年表示百度「是一家人工智慧公司」,此後多次承諾增加在 AI 方面的投入。即使受疫情影響, 百度也沒有削減研發預算 。2020 年 Q1/Q2,百度的研發費用分別為 44.43 億元和 48.39 億元,與當季總營收的比值分別為 19.71% 和 18.59%,均是近年來的高位。

根據沙利文公司(Frost & Sullivan) 《2019 中美人工智慧產業及廠商評估》報告,百度、阿里、騰訊和華為等綜合型廠商在計算機視覺、自然語言處理、語音識別等核心技術領域均有布局,同時加速基礎層軟硬體的布局和追趕。

中美 AI 廠商布局表

在此基礎上,在智慧城市,智能客服與營銷,智慧醫療,智能營銷,智能製造,智慧能源,智能製造等方面, 百度均有自有布局。至於 Apollo 在出行方面的成就,更增添了百度 AI 版圖的完整度。

從大廠動向看今年的全球 AI 三大發展趨勢

疫情改變了全球科技企業的新品發布節奏。受疫情影響,今年的谷歌 I/O 大會 和 Facebook F8 開發者大會宣告取消,但是蘋果 WWDC、微軟 Build 和亞馬遜 Alexa Live 2020 等還是在線上舉行。

今年已經走過三分之二,此時召開的「百度世界 2020」可以說為國際 AI 大廠的年度「交作業」補上了一片重要的拼圖。接下來還會有微軟的 Ignite 和 AWS re:Invent 等活動,蘋果還缺一場秋季發布會;谷歌也計劃推出新的手機和智能音箱等。

今年各家 AI 巨頭都省略了開發者現場參會的環節,變成視頻和「PPT發布」,有的直接群發新聞稿了事。總體上說,今年它們帶給開發者和市場的新東西都不多;更重要的是,疫情及遠程辦公也降低了工作效率,拖慢了內部研發和硬體製造的進度。

除小度之外,幾大語音助手 Alexa、Siri、Google Assistant 也都趁機宣布了最新的用戶數、裝機數和開發者數量,但 微軟的 Cortana 則退出了消費者端的競爭。在用戶分布方面,中美兩國繼續保持著「劃江而治」的狀態,尚未出現什麼產品可以廣泛打入對方的市場。

看完百度世界 2020 之後,結合 其它國際AI 大廠今年的各項技術發布,全球 AI 業界的三個主要發展趨勢也逐漸清晰起來:

人工智慧將更趨向於模擬真人

其實 AI 每一年都在嘗試模仿真人的音容笑貌,但 2020 年可以說是廠商們在擬人 AI 研發方面取得突出進展的一年。像是沙特「機器人公民」索菲亞那樣的「實體 AI」嘗試暫時消停了,但在螢幕內出現的三維形象,則在飛速跨越擬人形象的「恐怖谷」,變得越發實用。

AI 對真人的模擬包括語音、動作和性格。顯然,語音方面的擬人 AI 技能現在已經「點滿」,AI 客服在日常生活中已被大量應用。更多人會與 AI 互動,即使自己還沒有意識到;但反過來,在我們不認識 AI 的同時,AI 會認出我們。

2018 年,航通社參觀世界機器人大會 ,對服務型機器人的進展深感失望。迎賓、業務辦理、服務員等類人形機器人,幾乎無一例外的選擇特別低幼的,長得像喜羊羊一樣的卡通臉,露出傻乎乎的,近似「面癱」的笑容。

2018 年機器人形象和 2020 年 Vtuber

如今,廠商們終於具備了跨越 「恐怖谷」,向人形 AI 這一高峰進軍的決心和實力。過去一年誕生了眾多虛擬偶像(Vtuber),而一些由人控制的 3D 形象,在需要採集人類動作時也不需要大量的傳感器,只要用手機攝像頭,甚至是一些錄製好的視頻片段就可以了。

在百度世界大會宣布上線的 虛擬助理「度曉曉」從2019年開始研發,她的造型、動作和語音都已經非常自然,知識儲備更豐富,應答也更接近真人。

百小度、小度、度曉曉

用戶見慣了多種 AI 助手之後,口味也更為挑剔。從 2015 年搜索框旁的機器人「百小度」,到語音形態存在,外形也是機器人的「小度」,再到 3D 人形 IP「度曉曉」,技術難度不斷加大。

對人類性格的模擬也將幫助AI越來越多地用於創建電影、音樂和遊戲。2019 年五四青年節晚會,百度幫助打造的虛擬主持人「小靈」亮相。一年以後,百度世界大會上的虛擬人「小康」技術水平又有了重大提升。

小靈、小康和小康的原型——90 年代的康輝

現在打造虛擬人不再需要錄製長時間的視頻,只需要幾分鐘現成的視頻資料即可,而且它的對話能力也更強,兩個虛擬人之間可以「機機對話」。雖然還是略顯尷尬,但已經不至於出現停頓和「亂碼」了。

今年很多家開發的 AI 助手在「認人」方面都有了新進展,認出不同的家庭成員成了新的「基本功」。小度助手(DuerOS)6.0 增強了根據音色區分家庭中不同成員的能力,並且只需要錄入 20 句話,就可以模仿父母的聲音給孩子講故事。

此外,語音助手也在更努力地學習人類的交流邏輯,例如識別模糊化的指令。人與人交流的時候,對同一種事物有多種不同的表達方式,有時可能會相當模糊,對這種模糊指令的識別一直是一個難點。

7 月 22 日,亞馬遜線上舉辦了 Alexa Live 2020 開發者大會。 本次 Alexa 發布了 31 個新功能,其中基於深度學習的多輪對話開發工具 Alexa Conversations,可以讓語音助手的交互體驗更加自然。

基於此,用戶可以不用清晰記得技能的名稱,只要大概說關鍵字讓 Alexa 推斷你的意圖,就可以調用技能,使用更輕鬆方便。如果 Alexa 不能完全確定時,將會與用戶確認,隨著持續深度學習和訓練,效果會更精確。還有,現在 Alexa 在執行一項任務的同時,還可以在中途暫停,等過段時間回來還會繼續原來任務的進度。

人工智慧將越來越有用

隨著真實模擬的精度和可用性提高,數據變得更加準確和可用,人工智慧變得越來越有用。例如,個性化推送將越來越多,成本也降低;AI 越來越處於「邊緣」而不是雲端,即在本機完成、在低功耗設備上運行。更多設備(包含物聯網設備)將運行 AI 驅動的技術。

現在我們生活中最常用的網絡服務,已經淘汰了大多數的手動推薦位,走向「千人千面」,這意味著對 AI 算法推薦的越來越信任和依賴。

本周有消息稱, 手機淘寶客戶端將全面「信息流化」 ,原本頂部顯眼的焦點圖展示廣告將和頁面中部的聚划算、百億補貼、淘寶直播、有好貨等板塊一起,融入算法推薦信息流「猜你喜歡」 。

手淘改版對比圖 / 晚點 LatePost

疫情期間,百度內部聊天工具百度 Hi 升級為辦公平台「如流」,加入了釘釘、飛書、騰訊會議、Teambition 等企業協同工具的戰場。除標配的音視頻會議、文檔協作等功能外, 如流最差異化的特點是它的知識管理功能

如流的知識庫搜索利用了百度擅長的搜索技術,同時基於知識圖譜等 AI 技術實現個性化推薦,不同層級、崗位、知識背景、所屬項目的員工看到的知識流將不相同。

如流知識管理介面

近年來,AI 巨頭們越來越重視讓 AI 算法以更節能,更省算力的方式達到和未優化前同樣好的效果。

蘋果應用在作業系統內的 AI 能力如自動生成相冊、剪輯視頻等,均可以離線由自帶 AI 晶片完成;谷歌從去年 I/O 大會開始,也強調一些初步的 AI 運算可用本機算力完成。

這次百度世界大會展示的終端虛擬人「小康」和「小李」分別模擬了二十年前的康輝和李彥宏,相比之前的版本,虛擬人的生成門檻降低,只需要幾分鐘的視頻資料;同時計算量降低,普通手機也可以正常運行。由於其具備認知能力並可「機機對話」,也減少了由真人調教,繼續投喂信息的訓練量。

在物聯網、新基建、5G 等大背景下,AI 的訓練量加大,算法日益精準,也讓人們越來越信賴 AI 從事一些重要的工作。這次百度世界大會展示了一系列 AI 應用大規模推廣,和用於重要崗位上的案例。

百度 Apollo 在全球27座城市進行了里程超 600 萬公里,累計安全載客 10 萬人次的訓練, 展現了成熟的無人駕駛與 5G 平行駕駛能力。全無人駕駛是無人計程車(Robotaxi)實現商業閉環的必要條件,將加速中國自動駕駛大規模商業化部署。

小度助手將和人類互動的各種 AI 能力封裝起來,可以用很低的成本將任何原本非智能、半智能的場合智能化,例如改造酒店、養老院和普通家庭。去年啟動的 百度「AI 助盲行動」 把小度音箱安裝到全國 40 多個城市的盲人按摩店,提升了盲人按摩師的工作與生活質量。上百萬輛智能汽車裝配了擁有小度智能交互的 Apollo 小度車載。

央視新聞AI體驗官走進百度智慧養老社區

百度智能云為各行各業提供了完備的解決方案,也湧現出很多經典的合作案例。百度工業視覺智能平台通過對電網實時巡檢畫面快速檢測, 幫助國網山東電力 實現施工機械、煙霧山火、導地線異物等隱患目標的高效檢測和高精度危害預警。

百度智能雲與山東電力合作建立 AI 中台

百度的另一項廣受好評的公益行動「AI 尋人」正與國家機關、新聞媒體、公益組織等展開廣泛合作,今年上半年又成功匹配了 1500 多例,總共幫助 11716 個家庭團聚。其跨年齡人臉識別技術採集了人臉的 100 多個特徵,可以靠一張距今 20 年以上的老照片順利完成匹配。

人工智慧與人類:替代與協同

隨著 AI 的穩定性、可靠性日益增強,它在部分人類崗位上完成徹底取代也是必然的。人工智慧將越來越多地代替人類從事枯燥,重複的事務性工作。

2016 年, Facebook 的算法誤將一張歷史老照片判定為「色情」而刪除引發爭議 ,說明當年的算法還不成熟。但到了今年,微軟旗下門戶網站 MSN 裁撤了給新聞排序的人工編輯團隊,放心地把首頁交給算法打理。

電視業的關鍵流程之一——視頻剪輯,也因為 AI 的進入而不再一樣。早前, IBM 協助騰訊體育在轉播 NBA 時,以最快速度實時剪輯直播中的精彩畫面。這次百度披露,其聯合央視網打造的「AI 幫你找」可以自動解析出視頻中的人物、感情標籤等。 已經上線的「AI 中華詩詞」可以標註視頻內出鏡的主持人、專家等名人具體是在幾分幾秒出現的,點擊時間戳即可跳轉過去。

「AI 中華詩詞」中,用戶可以選擇視頻中自己感興趣的點,精準觀看

與此同時,人類與 AI 的合作增加,並更多從事 AI 尚無法完全接管的想像力、設計、戰略和溝通技能。一些 AI 產品也自我定位成現在崗位上的人類的輔助自動化工具,而不是以取代人類為目的。

百度幫助央視網搭建的一套系統,為編導迅速找到所需的鏡頭,還能自動編輯。通過讀取《等著我》的往期節目,幾分鐘內就能把節目中最感人的部分做成集錦,編輯只需要微調、最後確認。

8月下旬,剛從微軟分拆出來的 小冰公司發布了「X 套件」,是對微軟 Office 套件的理念進化。X Writer 允許用戶輸入一段文字開頭後,召喚 AI 自動續寫;X Studio 可將文章轉制為音頻,製作播客、電台節目等,以及調用音源作曲編曲;X Presenter 增強了傳統的 PPT 演示,3D 人物可模擬真人講解,取代真人出鏡來製作網課、視頻會議等內容。

X Presenter:「人工智慧時代的演示文檔」

小冰發言人講解時稱,它們希望 AI 不是取代人類工作,而是幫忙做好半成品,讓人類做最後的審核把關即可。由X 套件輔助生成的所有成果,其智慧財產權均歸用戶所有。

很顯然,人類不得不應對 AI 進入工作流程的趨勢,善於利用 AI 為自己減輕工作量,同時及時從會被 AI 完全取代的工作中轉行。

IDC 預測, 到 2025 年 75% 的組織將投資於員工再培訓,以填補因需要採用 AI 而造成的技能缺口。以至於,如果你的僱主不投資於 AI 培訓,那麼你可以預判他們未來幾年的成長空間可能很有限。

李彥宏在百度世界 2020 大會上提到了「數據標註師」,這是 AI 創造的其中一種新行業,對收集進來的數據進行標註,使其有條理,符合訓練機器所需的條件。標註過的數據越多,機器學的越快。他說:「對人力的需求會被逐步的激發出來,我覺得人的需求是會不斷膨脹、不斷更新的。」

參考資料

https://baiduworld.baidu.com/zt/activity/index

https://www.cyzone.cn/article/571846.html

https://mp.weixin.qq.com/s/x6tXIXBvDcfkcYKCeYE6Xg

https://www.leiphone.com/news/202004/Hegr5IfY9Z21CoVN.html

http://www.chinanews.com/it/2020/08-25/9273618.shtml

https://www.theverge.com/2019/1/18/18187992/

https://mp.weixin.qq.com/s/tiiUYAxJ6qJNp6OpgfVmCQ

https://baijiahao.baidu.com/s?id=1677889259224363177

https://www.shenzhenware.com/articles/14248

http://mbd.baidu.com/webpage?type=live&action=liveshow&source=h5pre&room_id=3825953134

https://mp.weixin.qq.com/s/3Tx_kO7Z3nK25tbX8YixaQ

https://mp.weixin.qq.com/s/9OgpEkc2HhaPAzZW_EFb2w

https://mp.weixin.qq.com/s/LXpHlSgWoXEXtGR3-cn2OQ

https://tech.sina.com.cn/n/k/2018-06-19/doc-iheauxvz5976521.shtml

http://tv.cctv.com/2019/10/31/ARTIz6iRuOYu4UuaNgy8NOlS191031.shtml

https://www.ithome.com/0/504/552.htm

https://cdn.idc.com/research/viewtoc.jsp?containerId=US45576319

轉載本文 / 商務合作請諮詢

航通社助理微信號:hangtongshe

或郵箱:coop#lishuhang.me

航通社讀者群招募中!

請聯繫航通社助理微信號:hangtongshe

附言填口令【航通社讀者進群

分享| 點贊| 點在看

文章來源: https://twgreatdaily.com/zh-mo/bE2GvnQBLq-Ct6CZAg9I.html


















航通社簡介

2020-07-07