「要對城市NOA有客觀的認識。」
這是汽車百人會論壇上,地平線創始人兼CEO余凱的表態,同時也是業界諸多智駕工作者的心聲。
大家普遍認為,當前市面上的高速NOA剛好達到「好用」,還未讓消費者「愛用」,城區NOA的現狀,恐怕連「可用」都是一個問題。
由此可見,高階智駕的赤膊戰還有「終局」未分勝負。賽道玩家現階段關注的,是解決「可用和「愛用」的問題,接著再解決「好用」的難題。標準場景的通過率、體驗更擬人、通行效率更高,成了所有企業重點加碼的智駕「痛點」。
從本屆北京車展來看,智駕公司與車企強調的技術熱點,已經從去年的BEV+Transformer切換到「端到端」。從車展媒體日的發布會可以看出,大部分高管提及智駕業務,都會提一嘴「端到端」的戰略部署——
未來幾年,似乎誰真正走通了「端到端」,誰就有可能在智駕終局拿到勝利的入場券。
不過,從「端到端」鼻祖特斯拉來看,基於該公司的投資強度,端到端大模型其實非常燒錢,可能得百億起步。
毫末智行數據智能科學家賀翔曾在採訪中提到,端到端模型是一個純粹的數據系統,原則上模型參數夠大,數據分布性更好,就能不斷地提高。燒錢,且費時間,但天花板也很高。
01
高階智駕爭奇鬥豔
華為
北京車展前夕,華為發布了以智駕為核心的「干崑」新品牌。其中,高階智能駕駛干崑ADS 3.0採用了端到端的全新架構,基於GOD(通用障礙物識別)大網,實現了從簡單「識別障礙物」到深度「理解駕駛場景」的進步。
干崑ADS 3.0全新架構採用PDP(預測決策規控)網絡實現預決策和規劃一張網,從而實現類人化的決策和規劃,行駛軌跡更類人,通行效率更高,複雜路口通過率>96%。
小鵬
小鵬汽車的智駕一直處於國內第一梯隊,據悉,基於端到端大模型,小車的XNGP高階智能駕駛輔助系統,將完成感知大模型升級和規控大模型上車。
何小鵬表示,目前小鵬汽車已開始公測端到端的解決方案,並將在5月正式對外分享端到端實際數據表現。通過行業首個量產的2K純視覺占用網絡大模型上車,用超過200萬個高精度網格重構世界,能清晰識別動、靜態障礙物的每一個細節。
商湯絕影
作為首個提出感知決策一體化自動駕駛通用模型的公司,商湯絕影在本屆車展首次向公眾展示了面向量產的端到端自動駕駛解決方案UniAD(Unified Autonomous Driving)的道路測試。
該方案能在無高精地圖條件下,僅依靠視覺感知的實際道路測試成果。無論是複雜城市道路還是無中線的鄉村道路上,車輛能高效準確地完成包括大角度左轉上橋、避讓占道車輛及施工區域、繞行跑步行人等一系列高難度操作。
博世
雖然沒有強調端到端的布局,但傳統供應鏈巨頭博世,成為傳Tier1在高階智駕的一抹亮色。博世在此次車展帶來的智駕技術和產品,呈現出跨越式的飛躍。
旗下最新的艙駕一體解決方案,只用一顆晶片就能搞定智駕和智艙,有望在2026年量產,對比當前智艙、智駕雙晶片的解決方案,可降本30%。
博世中國高階智能駕駛解決方案,由博世智能駕駛與控制系統事業部中國區本土開發,已於2023年實現量產。其中,城市領航輔助功能將從5月開始逐步推送。
地平線
地平線展出了全場景智能駕駛解決方案SuperDrive,這是該公司打造的高階城區智駕樣板間。如果說,征程6是地平線軟硬結合領域的硬體集大成,SuperDrive則是軟體層面的護城河。
憑藉動態、靜態、OCC(Occupancy占用網絡)三網合一的端到端感知架構,數據驅動的交互式博弈算法,SuperDrive在任何道路環境下都能兼顧場景通過率、通行效率和行為擬人。
據悉,SuperDrive可以像老司機一樣靈活處理複雜交通流,在擁堵場景下變道成功率提升50%,路口通過率提升67%。
02
新的燒錢巨坑
2022年底,商湯及其聯合實驗室提出了行業首個感知決策一體化自動駕駛通用模型UniAD,並於次年榮獲2023年國際計算機視覺與模式識別會議(CVPR)最佳論文。
如果說,商湯2022年還無法讓業界感受到端到端的潛在價值,那麼到2023年,這家企業榮獲的論文大獎,終於讓學術圈和汽車行業意識到端到端在自動駕駛賽道的廣闊前景。
在實踐層面,特斯拉曾在去年嘗試了特斯拉FSD V12的直播測試,讓更多企業看到端到端的落地可能性;今年3月向北美車主推送了FSDV12.3.1版本,引入了端到端神經網絡,瞬時掀起業界的極大波瀾。
很多人默認,特斯拉是端到端的鼻祖。也正因為此,特斯拉也成了業界抽絲剝繭、詳細了解端到端的先鋒案例。此前有諮詢公司分析,參考特斯拉這幾年的投資強度,端到端大模型其實非常燒錢,可能得百億起步。
前文也提到,毫末智行數據智能科學家賀翔曾在採訪中提到,端到端模型是一個純粹的數據系統,原則上模型參數夠大,數據分布性更好,就能不斷地提高——
天花板很高,但燒錢,且費時間。
此外,端到端模型的訓練非常依賴且消耗算力,僅僅是2024年,特斯拉計劃向Dojo超算投入的資金就要超10億美元。
2023年初,特斯拉曾表示,該公司已經分析了從特斯拉客戶的汽車中收集的1000 萬個視頻片段(clips)。且特斯拉判斷,完成一個端到端自動駕駛的訓練至少需要100萬個、分布多樣、高質量的clips才能正常工作。
不僅是燒錢巨坑,端到端還是個長期工程,很多企業在短期內是很難看到結果的。這也意味著,端到端是少數企業的遊戲,只有資金儲備充足、且願意長期投資的頭部公司,才有能力支持端到端所需的龐大數據與算力。
商湯在此次車展表示,行業里很多企業在布局端到端解決方案,但一般都分為三種——
第一,是決策層和感知層彼此獨立的雲端計算工程;第二,是組合式端到端,意味著連接感知層和決策層需要強力中介,也更容易落地;第三即真正的端到端,也就是商湯目前開發出的方案,能夠讓企業以最低成本滿足智駕需要。
不過,這套蓄力已久的端到端方案,累計投入了多少資金,商湯絕影並沒有提及。