烏鎮論劍,百度飛槳的show time

2019-10-20     Alter聊IT

枕水人家的木門徐徐打開,網際網路再次進入到烏鎮時間。

作為烏鎮網際網路大會的保留節目,組委會第四次面向全球發布了「世界網際網路領先科技成果」,涉及人工智慧、5G、大數據、雲計算、區塊鏈等前沿領域的原理、技術、產品或商業模式上的創新,揭示了年度最具代表性的科技創新成果。



其中飛槳(PaddlePaddle)深度學習平台成為入選的第四個百度產品,就如百度首席技術官王海峰之前為飛槳作出的註解:「作為新一代人工智慧的核心基礎,深度學習技術及平台具有很強的通用性,呈現出自動化、標準化和模塊化的大生產特徵,正在推動人工智慧進入工業大生產階段。」

01 開發者的「船槳」

如果要為中國的產業智能化進程找一個活化石的話,百度無疑是最適合的人選。迄今為止進行的四次「世界網際網路領先科技成果」評選中,百度每年都有項目入選,且全部集中在人工智慧領域。

2016年的世界網際網路大會期間,剛剛發布兩個多月的百度大腦,成為當年「世界網際網路領先科技成果」的最大熱門。作為百度人工智慧的核心技術引擎,百度大腦涵蓋了視覺、語音、自然語言處理、知識圖譜、深度學習等AI基礎技術,開發者只需要進行一個簡單的調用,即可獲得百度的AI能力。

2017年智能音箱迎來了爆髮式增長的元年,不過出現在「世界網際網路領先科技成果」評選名單中的產品,不是某家知名的智能音箱品牌,而是百度的對話式人工智慧系統DuerOS,可以適用於音箱、電視、冰箱、手機、機器人、車載、可穿戴等多種場景,語音交互開始從科幻電影走進千家萬戶。

2018年代表百度入選「世界網際網路領先科技成果」的是Apollo自動駕駛開放平台,作為一個開放的、完整的、安全的自動駕駛開源平台,Apollo的代碼已經跑通了園區物流、自動泊車、園區接駁、智慧農業、高速物流、智慧環衛、健康養老等場景,並推出了面向量產的人車聯網解決方案小度車載OS。

2019年嶄露頭角的飛槳深度學習平台,可以說是沒有懸念的「世界網際網路領先科技成果」。不僅在基本功能、性能、晶片支持的完備性等技術指標上與谷歌、Facebook等主導的深度學習平台相當,還在中文自然語言處理的算法模型、大規模分布式訓練、推理引擎等技術上遠遠領先於國外同類產品。

從時間上看,從輸出AI技術的百度大腦,到提供場景化解決方案的DuerOS和Apollo,再到端到端的開源深度學習平台,百度人工智慧技術在烏鎮上的「奪魁史」,也是百度AI開放的進化史。

按照百度首席技術官王海峰的觀點,深度學習平台就像是所有人工智慧應用的一個基礎的底座,從組網、訓練、到預測,深度學習平台對底層語言和重要算法模型進行封裝,極大降低了研發門檻,屬於典型的共性技術平台。



大抵也就可以理解百度將深度學習平台命名為「飛槳」的原因。

百度大腦的技術輸出,讓人臉識別、語音識別等AI基礎能力逐漸落地應用;DuerOS和Apollo在語音交互、自動駕駛領域的深耕,加速了人工智慧的落地應用;飛槳就像是深度學習開發者手中的「船槳」,要給開發者獨自過河的能力。

02 告別「摩登時代」

至於百度為何要打造深度學習平台,以及飛槳為何會得到世界網際網路大會組委會的一致認可?不妨從一個「假想」說起。

電影大師卓別林在《摩登時代》中以獨特的喜劇表演,對美國工業起步時期勞動人民的生活悲劇展開進行了辛辣詼諧的諷刺。如果卓別林生活中智能化剛剛起步的當代,「摩登時代」的故事多半會是這樣的場景:

一位中年脫髮的程式設計師被老闆安排了各種人工智慧的開發任務,每接手一個新項目就要熬夜搭建新的深度學習模型,為複雜的神經網絡寫上幾十萬行的代碼。每天的工作內容要麼在寫代碼,要麼在找bug,重複著枯燥乏味的「流水線」工作……

而飛槳等深度學習平台的出現,就是要幫助開發者從寫代碼的工作中解脫出來,利用搭積木的方式進行工作:一個深度學習平台就像是一套積木,深度學習模型和算法就像是積木的組件,開發者可以根據不同的需求進行組裝。

當然,被飛槳們告別「摩登時代」的,除了熬夜加班的程式設計師們,還有哪些真正忙碌在工業流水線上的工人們。

比如在農業生產領域,每到桃子成熟的季節,桃農們需要在採摘後進行品質篩選,大多時候需要僱傭大量工人用肉眼挨個識別,由於缺少質量上的硬性標準,往往會造成質量參差不齊的現象。有開發者製造了一台智能桃子分揀機,在飛槳上進行了6個小時的桃子智能分類模型訓練,分揀的準確度就達到了90%以上,節約了90%以上的人力成本;

再比如在林業防治方面,紅脂大小蠹一種危害超過35種松科植物的害蟲,從1998年到2004年就導致600多萬株松樹枯死。而對紅脂大小蠹密度及分布監控,需要工作人員進行實地探查,不僅工作專業度要求高,還要花費大量的時間。北京林業大學基於飛槳打造了一套林業蟲情監測系統,在模型訓練後可以準確識別出紅脂大小蠹,原本需要兩周的檢查任務被壓縮到了一個小時。

如此也就解釋了王海峰為何要刻意提及「工業大生產」的說法,有了深度學習平台這樣的通用性平台,人工智慧的應用不再是象牙塔里的小規模測試,從傳統的農林牧,到半自動化的工業生產,再到城市裡服務業,人工智慧正加速滲透到生活的方方面面。



簡單來說,飛槳的價值不僅僅局限在給開發者提供了AI應用落地的「船槳」,還將加速人工智慧進入工業大生產階段,《摩登時代》中的流水線工作即將成為歷史。

03 有擔當的「頭雁」

百度為何要打造深度學習平台,或許還有另一個原因。

連續四年入選「世界網際網路領先科技成果」的百度,無疑是中國人工智慧產業中的「頭雁」。就像坊間流傳的一種說法:頭雁勤,群雁就能「春風一夜到衡陽」;頭雁懶,只會「萬里寒雲雁陣遲」。中國人產業智能化的進程,或多或少肩負在以百度為代表的「頭雁」身上。

一味地利用人工智慧講故事畫大餅,用於推高估值或市值;還是做人工智慧技術的保守派,以此作為對友商降維打擊的武器;抑或是紮實推動人工智慧應用落地,扮演起產業智能化的領跑者?所幸,百度在飛槳深度學習平台上釋放了積極的信號:

一方面,深度學習平台處於硬體層和應用層之間,向下對接晶片指令集,向上承接各種業務模型、行業應用,作用相當於個人電腦時代的Windows和移動時代的Android,堪稱人工智慧技術研發和產業化的關鍵基礎設施。

百度沒有選擇將深度學習平台「私有化」,飛槳深度學習平台已累計服務150多萬開發者,僅在定製化訓練平台上就有超過6.5萬企業用戶,發布了16.9萬個模型。同時百度還和華為等合作夥伴進行了軟硬一體的合作優化,一同促進更多人工智慧應用落地,切實推動中國的產業智能化。

另一方面,世界上的深度學習平台不只飛槳一個選項,谷歌、Facebook、亞馬遜等都推出了類似的產品,甚至在時間上稍早於百度。當美國開源平台的爭奪戰早已火星四溢的時候,百度是否有必要去「湊熱鬧」?

這個問題並不難回答,至少晶片行業的遭遇已經讓不少中國企業吃夠了「下游之苦」,在「智能時代的作業系統」的選項上,作為國內當前唯一全面開源開放、功能完備的產業級深度學習平台,無論是基於人工智慧的應用性、安全性,還是中文開發的必然性,飛槳深度學習平台的意義都不言而喻。

或許還有另外一個問題,為什麼國內的其他網際網路巨頭在深度學習平台上近乎靜音?可以給出的解釋是,深度學習開始大規模應用的時候,仍然面臨很多棘手問題,比如如何提升深度學習模型的開發效率,如何讓訓練模型真正可以產業化應用,如何平衡部署時的推理速度和成本……



All in AI的百度,可能是顧忌最少的網際網路巨頭,尤其從王海峰挂帥AIG、ACG、TG三大事業群的動態來看,加速產業智能化已經是百度自我賦予的使命之一。畢竟只有當行業看到AI技術遍地開花的實質利好,真正意義上的產業化才會提上日程,這恰恰就是雁群中頭雁應有的擔當。

04 寫在最後

王海峰曾這樣闡述他對技術的理解:「AI的發展最終還是要回到』服務用戶需求』的本質,利用好人工智慧來服務好我們的用戶和客戶,以及更好地打磨AI能力來推動各行各業的效率提升,是每一位人工智慧領域從業者的期望。」

如此來看,從開放AI能力的百度大腦,到DuerOS、Apollo、飛槳等作業系統的開放開源,百度正在幫助開發者們「推倒」人工智慧的技術門檻、成本門檻和時間門檻,對人類科技革命史上的影響,註定不會局限於「世界網際網路領先科技成果」的獎項。

文章來源: https://twgreatdaily.com/jsQB6m0BMH2_cNUgeT3M.html