王剛認為,自動駕駛的研發依賴於三個要素:精細化場景、針對性算法和自動化平台。
作者 | 安琪編輯 | 唐里
10月17日-19日,由CCF主辦的 CNCC 2019 在蘇州成功舉辦,本屆大會以「智能+引領社會發展」為主題,1000家機構的代表、8000餘人參展參會。在第三天舉辦的「計算機視覺技術賦能智慧城市」分論壇中,阿里巴巴自動駕駛實驗室主任、首席科學家王剛發表了《自動駕駛沒有免費的午餐》的主題演講。
王剛認為,單用一套通用的自動駕駛算法很難覆蓋複雜多樣化的交通場景,需要將多場景問題進行分解、細化,有針對性的解決。而自動駕駛的研發依賴於三個要素:精細化場景、針對性算法和自動化平台。
以下為王剛演講全文,AI 科技評論進行了不改變原意的編輯:
(演講正文)
自動駕駛是智慧城市裡面非常重要的一個部分,也可以說是人工智慧里最複雜的一個系統,非常具有挑戰性。我今天主要想講講,阿里巴巴在自動駕駛系統上的一些思考和觀點。
關於自動駕駛,很多公司都在做載人的自動駕駛。阿里跟他們不一樣,從一開始關注的就是物流行業的自動駕駛,怎麼讓物流車變得無人化。
阿里為什麼要選擇這個行業?大家都聽說過,去年的「雙11」活動,光「天貓」一個電商平台就產生了10億個包裹。未來以天貓、淘寶為代表的電商平台,包括餓了麼、盒馬代表的本地生活平台將會產生越來越多的包裹。有人做了一個預測:五年之後,物流包裹可能會突破5億個/每天。
與龐大的包裹數量形成反差的是,我們社會的老齡化非常的嚴重,年輕人在慢慢變少。在可以預見的未來,社會將會缺乏足夠的勞動力去運輸這些包裹。因此阿里相信,物流車的無人化是整個物流產業發展的必然選擇,也是社會發展的必然選擇。
阿里目前專注於兩個物流場景:第一是末端物流場景,最後1~3公里的問題。這應該是未來幾年內最容易實現落地的場景,其在安全、法律上的挑戰都相對少一些。除了末端物流之外,阿里也在做公開道路的技術研發,自動駕駛必然會從末端走向開放道路。我們也在杭州街頭進行了常態化路測以及相應的研發工作。
阿里的無人車不僅可以應對各種複雜的開放道路路況,包括轉彎、與非機動車輛以及行人的交互,還能在複雜的城市道路實現上千公里的自動駕駛,而不需要人工的監管。
1、以場景精細化應對交通多樣化
最近幾年,國內外的無人駕駛公司都取得了非常大的技術進步,但從客觀來看,自動駕駛還存在非常多的困難和挑戰,目前還沒有能夠完全落地的產品。
自動駕駛為什麼這麼難?不同的人有不同的看法:硬體還沒準備好、基礎交通設施不夠完善,但是阿里認為智能系統或者軟體是最上層的內容。多數情況下,還沒落地是因為自動駕駛的算法還不能夠處理道路上的複雜交通狀況。
在阿里內部,有稱之為cut-in(超車)的場景,即別的車輛跑在了自動駕駛車的前面。很多人認為這是一個非常簡單的場景,但我們發現由於車輛的側車型不一樣,cut-in的原因也不一樣,導致的行為方式也是非常不一樣的。很多時候,自動駕駛算法不能有效處理這麼多複雜、多樣化的場景。這對自動駕駛來說是一個非常大的挑戰。
交通場景過於複雜、多樣化,那要怎麼處理這樣多樣化的場景?我認為,我們非常有必要回想人工智慧里的經典理論,比如no free lunch理論。
這個理論是,假如用一種通用算法來解決所有問題,是不可能在所有的問題上都取得很大成功的。相反,需要針對每一個問題進行相對應的研發,針對性的優化可以取得更好的結果。
這個理論在自動駕駛領域也是適用的。交通場景眾多,很難用一套或者幾套通用的自動駕駛算法去解決問題。相應地,阿里希望能夠把自動駕駛的多場景問題進行分解、細化,有針對性的解決,這也是阿里稱之為的「自動駕駛里的no free lunch」理論。
將交通場景進行分類,聽上去很簡單,但仔細考慮就會發現這是一個非常複雜的問題。我覺得一個好的分類至少要滿足兩個標準:
第一,分類必須非常精細化,粗粒度的分類是不能分解問題、降低問題的難度的;
第二,分類必須為算法服務,跟算法高度融合,而不是為了測試和管理服務。
我們也審視了業界常用的分類方法,發現離這兩個標準還有非常大的距離。有人按照行駛環境來分類,按高速、城市道路、鄉村道路來分,這樣粗粒度的分類,無法把問題分解為更簡單的問題。
也有人按場景要素來分,按照物體類型、天氣等情況進行組合。我們也發現,很多組合非常冗餘並且和算法是沒有關係的。因此從這兩個角度來看,現有的場景分類方式都不夠理想。
基於此,阿里內部提出了自己的自動駕駛場景庫,阿里巴巴中央場景庫。我們的場景庫有非常典型的分類。我們聯合感知和決策,有針對性地對場景類別進行開發。比如感知到場景後,決策環節可以預先做一些判斷,把速度降下來,避免事故的發生。我們的分類是針對算法來進行開發的。
這種分類方法的一個特點是,非常精細化。還是以cut-in場景為例,我們的場景庫里cut-in分為25個子類。通過精細化分類可以把非常複雜的cut-in問題降解為25個比較容易解決的問題。
這些分類是怎麼產生的?過去,分類主要是由專家來設計,根據對場景的理解得出結論。遺憾的是,這些理解是非常粗粒度的,到不了非常精細的程度。而阿里採用的是數據驅動的方法,通過搜集大量的路測數據,從數據里挖掘、發現什麼樣的場景是算法更應該關注的場景,從而形成精細化的分類。
另外一個特點是,我們的分類包括很多動態化的場景,比如與社會車輛、行人的交互。如果路上沒有其它車輛,自動駕駛就不是一個難題了。因此動態場景才是自動駕駛最大的困難,我們也基於數據驅動的方法得到這些動態場景。單純的人工設計很難描述動態場景,因此也很容易錯失一些重要的場景分類。
2、基於精細化場景的算法問題
基於這個自動駕駛場景庫和no free lunch理論,需要針對每個場景分類做相應的算法開發。可以想像的是,假如有1000個場景分類,我們需要開發1000個不同的算法來解決問題。這是一個非常巨大的災難。因為現在算法的開發模式稱之為「人工+智能」,算法的設計極度依賴自動駕駛工程師的領域知識,包括規則、算法模型、超參數等。所以這也是自動駕駛公司在市場上處於供不應求狀態的原因。
這樣分類方法必然在研發效率上帶來很大的局限性。阿里也在通過計算換智能的方式來研發。這個詞並不新鮮,人工智慧尤其是深度學習,本質上就是計算換智能。
最開始可能需要依賴計算機視覺和圖像處理專家來進行人工設計,但可能會喪失非常重要的信息。深度學習被發明之後,可以通過神經網絡、計算去搜索、找到最好的設計,從而提升了研發的效率和質量。
但非常遺憾是,這樣的方式在自動駕駛領域應用的並不多,其滲透率還遠遠不夠。有以下幾個原因:一個原因是設計理念上的差別;另一個原因是基礎設施以及工程平台的缺失。這兩個原因導致了我們在自動駕駛上對人工的依賴過於嚴重。
3、數據驅動的自動化平台
為解決這個問題,阿里提出了AutoDrive平台。希望通過這個平台的開發,能更多地採取數據驅動、計算驅動的方式,讓計算機更聰明地找到適合每個場景的算法、參數、結構等,從而提高系統的智能程度。
目前阿里取得了一些初步結果。
在決策規划上,比如在非常困難的路口碰撞項目上,過去完全依賴人工設計規則和參數,但結果並不令人滿意。採用了數據驅動的方式之後,AutoDrive平台可以提高16個百分點。
在研發效率上,基於這個平台,研發效率也能夠獲得極大提高。
在場景精細化上,我們把場景分成25個子類,再進行針對性的優化能把成功率提高18個百分點。這些初步結果,也表明了我們的方向是非常正確的。
再舉一些視覺案例,視覺也是自動駕駛里非常重要的部分,它能捕捉到雷射雷達無法得到的語義信息。這些語義信息對於理解場景、預測來說是非常重要的。
對一些典型識別和檢測任務,我們也用AutoDrive平台進行了計算化智能,在效率和效果上都有很大的提升。比如用人工來設計一個典型的檢測網絡,由於不知道哪些部分是最核心的網絡部分,就可能帶來冗餘,但經過AutoDrive平台的優化之後,可以極大地降低網絡複雜度。因為自動駕駛對實時性要求非常高,降低網絡複雜度可以提高整個效率以及降低對硬體的依賴程度。
最後講一下,AutoDrive背後其實是有非常堅實的工程支撐的,它需要很多的工程電路以及工程經驗的。但AutoDrive平台能夠運行起來還有幾個要素:
第一、我們將全量的海量數據全部都放在了雲上,只有雲上才有足夠多的內存和計算資源。將海量自動駕駛數據是放在單獨的伺服器,是不可能跑起來。
第二、我們打通了整個AutoDrive運行起來需要的閉環。用計算換智能必須從input到output都有一個完整的結果。所以我們打通了數據收集,數據標註以及仿真、模型訓練、評價等一整套系統,就能知道伺服器上的每一個結構能產生什麼樣的結果,從而達到計算換智能的效果。
總結一下,我認為未來自動駕駛的研發需要依賴三個要素,這三個要素會進行協同,產生更好的化學反應。
1、場景(需要精細化)。過去業界的場景分類過於粗獷,因此需要研發出一個更好的精細化場景分類方式帶動整個研發體系。
2、算法。需要對算法進行相應的優化,有的放矢地針對每個場景進行處理。
3、自動化平台、雲平台。為了實現高效的研發,需要AutoDrive自動化平台,但AutoDrive平台背後離不開整個雲平台的支撐,包括數據的採集、回歸、仿真、以及模型訓練、測試評價等。
這三個要素結合在一起才能高效地推進自動駕駛技術的研發。
最後再講一下阿里的晶片,過去在整個AI領域裡,討論的晶片主要是inference晶片,但我認為訓練晶片需要引起業界的注意。現在業內認為訓練晶片還可以用,那是因為業內還沒有廣泛地應用計算換智能的方式,晶片的一些方法限制了訓練算法的大規模使用,只有解決這個問題,計算換智能才能得到普及。
招聘
1
論文內容運營
AI研習社是一個服務AI學生、學者、從業者的UGC內容平台,目標是從教學課程、技術經驗分享、學術見解討論、比賽和工作機會等角度提供資訊,也是用戶輸出觀點、互相交流、打造個人品牌的土壤。
工作內容:
1. AI研習社社區論文板塊運營
2. 聯繫、維護外部兼職稿源
3. 參與多樣化內容輸出、活動策劃
4. 參與社區產品的長期維護和改進
任職要求:
1. 有一定IT、計算機科學知識見聞
2. 熱情友善,善於溝通
3. 英語能力是加分項
簡歷投遞地址:yangxiaofan@leiphone.com
招聘
2
論文內容編輯(可招實習生)
AI研習社是一個服務AI學生、學者、從業者的UGC內容平台,目標是從教學課程、技術經驗分享、學術見解討論、比賽和工作機會等角度提供資訊,也是用戶輸出觀點、互相交流、打造個人品牌的土壤。
工作內容:
1. 關注、了解人工智慧相關領域學術研究動向,形成兼具專業度和傳播力的報道內容(發表在雷鋒網、公眾號以及AI研習社社區)
2. 採訪高校學術青年領袖,輸出人工智慧領域的深度觀點;
3. 解讀國內外學術熱點,深入剖析學術動態
任職要求:
1. 理工科背景,有一定計算機科學知識
2. 英語好,能閱讀英文科技網站&博客
3. 樂於鑽研,認真嚴謹;有文字功底更佳
簡歷投遞地址:yangxiaofan@leiphone.com
招聘
3
兼職外翻
AI研習社是一個服務AI學生、學者、從業者的UGC內容平台,目標是從教學課程、技術經驗分享、學術見解討論、比賽和工作機會等角度提供資訊,也是用戶輸出觀點、互相交流、打造個人品牌的土壤。
工作內容:
1. 翻譯一些人工智慧相關領域的學術動態、技術博客等(文章發表在雷鋒網、公眾號以及AI研習社社區)
2.無需坐班,工作時間、地點自由
任職要求:
1.英文讀寫能力較強,能閱讀英文科技網站&博客
2.具備一定的計算機科學知識,能看懂相關的專業詞彙
3.認真嚴謹,做事不拖拉,能夠按時完成派下來的外翻任務
簡歷投遞地址:xinglijuan@leiphone.com