中國車企的大模型戰爭,才剛剛開始

2023-11-15     AI狐頭條

原標題:中國車企的大模型戰爭,才剛剛開始

原創 | 42號車庫

2022 年 11 月 30 日,當 OpenAI 在官網上發布 ChatGPT 的時候,誰都預料不到:上線短短兩個月,ChatGPT 就獲取了 1 億月度活躍用戶,並由此成為歷史上增長最快的消費者應用。

不到一年時間,2023 年 11 月 6 日,在 OpenAI 的首屆開發者日上,ChatGPT 迎來了一次史詩級重磅升級,不僅上線了一個「GPT 商店」,甚至還允許每個人都可以定製一個擁有專屬技能的 GPT。

這樣的發展和落地速度,讓外界為之驚嘆的同時,也讓「大模型」再次成為關注的焦點。

實際上,伴隨著 ChatGPT 的爆火,它背後所依賴的大模型技術,也已經像一股「衝擊波」,從 AI 領域出發延伸到整個社會層面,並且開始從商業維度為各行各業賦能——其中,正在經歷一場重大科技變革、全面擁抱智能化的汽車行業也毫不例外。

具體來說,從 ChatGPT 問世到現在的將近一年時間裡,車企們紛紛大張旗鼓地擁抱大模型,不僅僅是在技術層面深入布局,而且還在通過智能座艙、智能駕駛等多種用戶場景出發來探索大模型的落地機會——它們也希望通過各自的努力來發揮大模型的能力,提升用戶的實際用車體驗。

所以,一個值得思考的問題來了:大模型究竟該用什麼樣的方式上車?

擁抱大模型:一個快速達成的共識

在具體談到汽車行業對大模型的擁抱之前,我們先要明確一個前提:儘管包括汽車行業在內的千行百業都在談論 ChatGPT 和大模型,而且大模型技術也的確是因為 ChatGPT 的火爆而層層破圈,二者關係極為密切,但 ChatGPT 並不能和大模型直接劃等號。

實際上,ChatGPT 只是 OpenAI 旗下深度學習大模型 GPT 的一個典型應用,而 GPT 也只是業內諸多大模型中比較知名和破圈的其中一個——比如說,當 ChatGPT 在 2022 年 11 月底橫空出世並在行業引起廣泛關注的時候,它基於的是 GPT 的其中一個版本,也就是 GPT-3.5 系列。

不過,ChatGPT 作為大模型技術的現象級作品,確實是讓汽車行業關注到大模型技術的關鍵入口。

這其中,橫跨 AI 領域和電動汽車產業的馬斯克,無疑是最大的引路人。

實際上,就在 ChatGPT 發布兩天後,馬斯克就在社交平台上多次表達對 ChatGPT 的讚嘆,他表示「ChatGPT 好得讓人毛骨悚然」;這樣的評價,在第一時間就在大洋彼岸的中國引發了關注,也讓 ChatGPT 背後的「大模型」技術迅速在汽車行業引發關注。

然而,中國車企們與大模型發生密集關聯的節點,卻是百度的文心一言。

2023 年 2 月 7 日,百度官宣了它的大模型新項目「文心一言」,該項目是百度基於它旗下的文心大模型而推出的生成式對話產品,類似於「中國版的 ChatGPT」。

此後一段時間,儘管文心一言還沒有正式上線,來自多個行業的企業宣布加入「文心一言」生態;其中在汽車行業,包括嵐圖、紅旗、長城、東風日產、愛馳、零跑、吉利、海馬、哪吒等在內的車企紛紛加入「文心一言」朋友圈。

但相對來說,這些車企擁抱「文心一言」,與其說是擁抱大模型,不如說是搶占聲勢,並藉此展現自己面向智能化轉型的決心。

到了 3 月,一些頭部新勢力車企,開始在公開場合表達對 ChatGPT 和大模型技術的思考,這些思考相對更加深入。

比如,2023 年 3 月初,在理想汽車春季媒體分享會上,李想系統地談到了理想汽車發展背後的邏輯和思考。

其中,李想提到「AI 能夠改變物理世界」,也由此談到了他對 ChatGPT 和大模型的看法。關於 ChatGPT ,李想表示「ChatGPT 的難度很高,但並不怕它犯錯」;而在談到大模型時,李想則強調了大模型對自動駕駛業務發展的影響,他認為「只有大模型才能實現我真正想要的 2.0 的人工智慧」。

接著,在 2023 年 3 月中旬的小鵬汽車 2022 年 Q4 及全年財報電話會議上,何小鵬也談到了 ChatGPT。

他表示,以 ChatGPT 為代表的人工智慧應用,讓數以億級的用戶看到生成式 AI 模型的巨大潛力,這標誌在未來類似機器大腦的通識能力會進入到一個全新的階段,並且可以本地化部署,讓自動駕駛的實現方式在將來都會有新的詮釋以及效率上的提升,並且讓自動駕駛更快地能夠從 L4 將來走向 L5。

相對於理想和小鵬,蔚來方面在 ChatGPT 和大模型方面的表態更晚一些。5 月底,李斌在公開場合發聲時表示,「大模型最好的應用場景就是車上」;他還在蔚來 ES6 發布會後的採訪中表示,蔚來正在開展將大模型融入到自身語音交互系統 NOMI 的工作。

值得一提的是,在車企擁抱大模型的趨勢中,一個不可忽視的玩家是科技巨頭華為。

實際上,早在今年 4 月份的發布會上,余承東就宣布將在年底發布的問界 M9 上通過鴻蒙 4.0 系統接入盤古大模型的技術,盤古大模型將讓 AI 的能力在問界 M9 上登上一個新的台階——儘管目前尚未公布更多信息,但依託華為在大模型方面的積累,大模型在問界 M9 上的實際表現值得期待。

到了六月份以後,幾乎所有的車企都會抓住公開場合的發聲機會,去談論自己對於大模型的擁抱或布局。

可以說,經歷了 ChatGPT 的強大衝擊波和眾多車企對於「文心一言」的前呼後擁,以及「蔚小理」等頭部新勢力車企對於大模型的觀點輸出,正在激烈競爭並集體尋求智能化轉型的中國汽車產業,在很短的時間裡形成了一個共識,那就是:無論以何種姿態,必須要快速擁抱大模型。

在這樣的聲勢下,大模型如何在應用場景中具體落地,開始成為車企們不斷探索的問題——目前來看,智能座艙和智能駕駛,成為大模型在車端落地的兩個主要著力點。

從 AI 交互入口,到 AI 作業系統

從落地的角度來看,由於 ChatGPT 的對話能力和助手屬性與各類 AI 語音助手有著天然的關聯性和相似性,因此,當前車企對於大模型落地場景的探索,普遍側重於用戶感知更強的智能座艙領域,尤其是車載語音助手。

這其中,備受關注的是「蔚小理」三家。

6 月 17 日,在理想家庭科技日上,理想汽車發布了它在大模型方面的布局動態,其核心在於它所發布的自研認知大模型「Mind GPT」。

具體來看,理想汽車的 Mind GPT 更加類似於 ChatGPT,通過知識儲備能力的加持,其目的是為了讓「理想同學」更加聰明。從功能上來說,Mind GPT 可以讓對話生成、語言理解、知識問答、邏輯推理等在內的各項能力變得更安全,更準確,也更有邏輯;它所自帶的記憶網絡也能夠允許用戶選擇讓理想同學基於歷史對話記住個性化偏好和習慣,從而更好理解用戶。

根據官方說法,在 Mind GPT 的通用能力加持下,理想同學可以成為伴隨用戶走遍世界的良師益友,專業的用車管家,或是教用戶畫畫、編程的專家,讓 AI 為每一位用戶賦能——總體來說,通過理想同學,大模型帶來的能力更側重於娛樂、知識等方面的提升,也適用於理想汽車所定位的家庭用車場景。

不過,目前來看,Mind GPT 的實際能力,尚且還在開發中。根據官方說法,預計在 2023 年年底之前,由大模型加持的理想同學將會通過 OTA 推送給用戶。

在理想汽車之外,作為智能座艙領域的一個重要玩家,小鵬汽車也在 1024 科技日上宣布,小鵬汽車自研的 XGPT 靈犀大模型接入了語音系統,全新 AI 小 P 擁有超過 800 項技能,感知理解和推理能力均大幅提升——小鵬汽車官方表示,AI 小 P 將會搭載在 XOS 天璣智能座艙系統上,並且會在小鵬 X9 MPV 車型上量產首發。

另外,蔚來汽車也申請了「NOMIGPT」「NIOGPT」等商標,並且也在此前不久的一次小規模溝通會中宣布:NOMI 已經接入了高達千億 Token 的自研 GPT 模型,這將會增加 NOMI 的理解和推理能力。但這一自研 GPT 模型將如何在功能上為 NOMI 賦能,官方尚未發布具體動態。

從「蔚小理」三家頭部新勢力車企的情況來看,它們都選擇從車內語音助手出發,通過 AI 大模型的接入,來提供語音助手的對話、理解、創作等能力,對於用戶的價值更側重於知識交互、信息提供、娛樂等方面——當然,在大模型的構建上,這三家強調的都是自研。

在新勢力企業之外,也有一些致力於轉型的傳統車企也在大模型的擁抱上不遺餘力,有的選擇自研,有的選擇合作夥伴。

比如說,吉利在 7 月份宣布已經具備全棧自研的 AI 大模型技術。根據吉利官方的說法,它的全場景 AI 大模型囊括了繪畫大模型、音樂大模型、語言大模型和自動駕駛大模型,提供 AI 智能交互、AI 音樂 MV、AI 兒童繪本、WoW 壁紙等功能。

不僅如此,在 9 月份的吉利銀河 L6 發布會上,吉利方面宣布將其自研的全球首個汽車行業全場景 AI 大模型引入到了銀河 L6 上——從吉利銀河 L6 的實際情況來看,目前落地到車上的是用戶體驗感知更強的 WoW 壁紙功能。

另外,今年 8 月中旬,奇瑞汽車與科大訊飛合作,宣布訊飛星火認知大模型首發搭載在星紀元 ES 上。

基於這一合作,星紀元 ES 立在面向用戶打造一款知冷暖、懂關心、更體貼的語音助手,它不僅可以為用戶規劃旅遊攻略,推薦喜歡的電影,還能根據用戶自身情況提供健康諮詢服務,其在能力層面的發揮,也是指向了 ChatGPT——而用戶要想體驗到這個更加貼心的語音助手,需要等到星紀元 ES 在 11 月 30 日上市之後。

當然,除了上述廠商之外,還有更多的車企也都在努力通過語音助手這個入口接入到大模型的底層技術加持。

不過,整體來看,在智能座艙框架下,大模型在智能座艙和語音助手的落地還在前期探索階段,它要想真正地走向更加廣泛的用戶群體,還是需要一個顛覆式的場景。

此前在與 42 號車庫對話時,何小鵬告訴我們,大模型加持下的 AI 小 P 更聰明,會讓人覺得更有趣味。它可以完成持續對話、繪圖、寫詩等娛樂性比較高的功能,但不足以成為核心競爭力,它解決的是小癢點的問題,但不是大痛點的問題。

與此同時,理想汽車座艙團隊在與 42 號車庫交流時表示,目前對於大模型落地的探索,主要還是從用戶的實際用車體驗出發,努力尋找到一些能夠貼合用戶真實需求的場景,目前這些場景都還在探索中。商湯絕影智能車艙產品總監李珂強調,大模型要想在用戶端發揮明顯作用,就需要貼著用戶的頻繁使用場景。

儘管如此,通過大模型賦能車載語音助手,是所有車企都不敢錯過的方向。

對此,正在與某家車企進行智能座艙領域大模型合作的虎博科技創始人兼 CEO 陳燁告訴 42 號車庫,目前汽車行業在產品層面已經出現了高度同質化的情況,大模型在車端的落地,各家之所以都在做,主要目的還是為了在智能化的加持下尋求產品差異化。

但是,他認為,大模型要想在車端真正發揮作用,還需要時間來打造一個真正的 Killer App,也就是殺手級應用,這也是眾多車企要努力探索的方向。

不過,一位 AI 行業人士告訴我們,目前車企在布局大模型落地的過程中,首先選擇了車載語音助手這個角度,是因為這個角度的切入相對容易一些,用戶感知度更高;但從長遠來看,大模型將很有可能通過這個入口,扮演車上的「AI 作業系統」的角色,也就是將 AI 能力與用戶的不同用車場景進行緊密結合,從而探索出更多的可能性。

智能駕駛,大模型的「應許之地」

除了智能座艙之外,作為汽車智能化的另外一個關鍵支點,智能駕駛也開始在大模型的技術框架下尋找突破和提升的機會。

這裡我們需要闡明的一個前提是:類似於 GPT 這樣的大模型,其最底層的技術支撐是 Transformer 算法,而 Transformer 算法自從通過《Attention is All You Need》這篇論文提出之後,也一直被應用於自然語言處理領域;然而,在 2021 年 8 月的特斯拉 AI Day 上,特斯拉首次將 Transformer 引入到它的自動駕駛算法架構中,並由此推動 BEV+Transformer 成為整個自動駕駛領域走向量產落地的新範式。

所以,以 Transformer 為連接點,實際上大模型與自動駕駛一直存在著某種最底層的技術關聯——也因此,一些車企在談到自家採用的 BEV+Transformer 感知架構時,也會用到類似於「Transformer 大模型」或者「大模型時代」這樣的字樣。

這無可厚非——但是從實際來看,這一輪大模型對自動駕駛的加持,主要是在發生在 2023 年。

畢竟,伴隨著 ChatGPT 的橫空出世和一片火熱,GPT 所體現出來的通用性和泛化能力,也引發了自動駕駛領域對於模型構建方式的新思考,並且有了一些新的嘗試。

目前來看,做得比較多的是毫末智行和小鵬汽車。

今年 4 月,與長城汽車密切相關的毫末智行在 AI Day 上發布了行業首個自動駕駛生成式大模型 DriveGPT。它的底層模型借鑑了 GPT 的思路,但與 ChatGPT 不同,DriveGPT 輸入的是感知融合後的文本序列,輸出的是自動駕駛場景文本序列,即將自動駕駛場景 Token 化,形成「Drive Language」,最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。

半年後,毫末智行進一步展示了它通過大模型來推進自動駕駛 AI 技術的探索和突破。舉例來看,在感知方面,DriveGPT 通過構建視覺感知大模型來實現對真實物理世界的學習,將真實世界建模到三維空間,再加上時序形成 4D 向量空間;在此基礎上,毫末進一步引入開源的圖文多模態大模型,構建更為通用的語義感知大模型,實現文、圖、視頻多模態信息的整合,從而完成 4D 向量空間到語義空間的對齊。

同時,在認知階段,DriveGPT 通過構建駕駛語言來描述駕駛環境和駕駛意圖,再結合導航引導信息以及自車歷史動作,並藉助外部大語言模型 LLM 的海量知識來輔助給出駕駛決策——相當於讓自動駕駛系統在認知決策中獲取了人類社會中的常識和推理能力。

總體來說,毫末所做的,是在感知、認知、決策等各個環節來引入大模型的方法,目的是增加自動駕駛系統處理能力的通用性和泛化性,從而讓它整體上變得更加聰明。

無獨有偶。在 10 月份舉行的小鵬汽車 1024 科技日上,小鵬汽車在最新發布的 XNet 2.0 感知架構中,也引入了大模型的能力。具體來說,在大模型的加持下,小鵬 XNet 2.0 可以實現讀懂交通標識上文字信息、具備時間觀念、理解不同城市特點交通元素的語義等能力——同樣也是為了增加感知層面的泛化性。

實際上,大模型能力的加持,也成為小鵬汽車在推進城市 NGP 在更多城市可用過程中的有效助力因素。

值得一提的是,在自動駕駛技術本身不斷向前推進的過程中,端到端也成為自動駕駛發展的另外一個範式,典型的代表是特斯拉——而端到端這一概念,也被部分從業者納入到「大模型」的範疇。

今年 8 月,馬斯克在社交平台上首次直播演示了特斯拉的 FSD V12 系統,它也是有史以來第一個端到端 AI 自動駕駛系統。對此,馬斯克表示,FSD V12 全程都是通過 AI 來實現,其中不包括任何一行由程式設計師編寫的道路識別、行人識別等代碼,全部由神經網絡來完成。

與特斯拉的「端到端」思路高度一致的,是在計算機視覺領域國際頂級會議 CVPR 上獲得最佳論文的《Planning-oriented Autonomous Driving》 ,它由上海人工智慧實驗室、武漢大學、商湯科技團隊聯合發表。

這篇論文主要介紹的是 UniAD 一體化自動駕駛算法框架。具體來說,它將自動駕駛算法中的感知、預測、規劃等諸多模塊,統合到一個以任務為導向的端到端框架中,該框架同樣基於 Transformer。

就這篇論文的意義而言,有自動駕駛業內人士稱之為「自動駕駛之光」;但顯然,作為一篇學術論文,它離真正落地的距離還很遠——需要注意的是,商湯科技在介紹 UniAD 時,也用到了「自動駕駛通用大模型」的說法。

不過,儘管各家對於「大模型」的概念界定和落地方式不同,但在自動駕駛領域,端到端正在成為一個逐漸明晰的方向,比如說毫末智行也多次在 AI Day 上強調,端到端自動駕駛是它未來要實現的方向。而清華大學智能產業研究院院長張亞勤所言,AI 大模型帶來了從判別式 AI 到生成式 AI 的新技術範式變革,自動駕駛要想達到最後的安全、可靠階段,一定是端到端方式實現。

但眼下,普通用戶還難以直觀感受到大模型給智能駕駛帶來的明顯改變——他們也許需要一個類似於馬斯克所說的特斯拉的「ChatGPT 時刻」:突然之間,數百萬輛車能夠實現自動駕駛。

一位長期關注大模型的行業觀察人士告訴我們,目前行業里對於大模型的概念界定是非常混沌的,是不夠清晰的。

但是有一點可以確認:大模型的思路和方法,是對以往 AI 運行模式的顛覆,而考慮到 AI 在過去十年間對自動駕駛的持續賦能,則大模型的發展,可能會在自動駕駛領域帶來革命性的變化,並且將在推動自動駕駛的進化方面發揮重大作用。

一個從量變到質變的過程,才剛剛開始

無論是智能駕駛,還是智能座艙,車企們對大模型的擁抱,都指向了一個基本事實:在極度內卷的競爭環境下,面對智能化轉型的大勢,所有的車企都非常焦慮,唯恐在這場 AI 技術的競爭中落後於對手。

而在 2023 年爆火的大模型,已經成為它們轉型過程中不得不把握的重要抓手。

一位從事 AI 大模型的研究人員告訴 42 號車庫,大模型本身是 AI 發展的一個關鍵節點,它的意義重大;但目前來看,大模型這個概念被汽車行業大面積泛化後,勢必會在消費者心中建立更強的認知度。從另一個層面上來看,車企們對大模型的強調和探索,很大程度上也是因為汽車行業與 AI 領域正在發生密切關聯,這是無可阻擋的趨勢。

當然,大模型落地,從技術上來說,確實存在一定的難度。

從技術屬性上來說,大模型本身就需要大算力和大數據的支撐,它的原生開發和優化環境更適用於雲端,而車端無論是算力還是數據存儲空間上都非常有限,所以無論是從車企研發還是從部署落地的角度來說,大模型上車本身就是一件技術門檻很高的事情。

換句話說,大模型技術首先需要一個足夠龐大的雲計算硬體體系做支撐,其次就是將它更好地通過「端雲部署」等能力落地到更加具體的車端應用場景上。

這對於傳統車企來說是巨大的考驗,而對於已經部署了算力基礎的新勢力企業來說,相對容易一些——而對於華為這樣的從雲到端都有強勢部署的企業來說,更是其巨大的優勢所在。

正是因為如此,也需要車企們在擁抱和探索大模型的過程中,不僅僅要充分考慮用戶價值,還需要有足夠強大的戰略定力。

畢竟,從長期來看,對於汽車行業來說,作為 AI 時代的最新成果,大模型勢必能夠帶來某種確定性的價值。

虎博科技創始人兼 CEO 陳燁認為,大模型就像一道通向未來的門,它能夠給汽車智能化帶來無限的機會和可能性,無論是智能座艙層面,還是在智能駕駛層面——這就意味著,車企要想把握住潛在的機會,勢必要投入其中,否則就完全沒有機會。

一位在某頭部新勢力從事大模型研發的人士告訴我們,實際上車企技術部門積極研究大模型,還有一個潛在動因是對通用人工智慧的追求,這也是技術人員們夢寐以求的。

總體來說,從眼下的情況來看,儘管 AI 大模型能夠帶來的實際用戶體驗價值還處於早期探索階段,要想真正上車並發揮價值,可能還需要車企們不斷圍繞技術進展和用戶需求的結合點進行推進。

但是從長遠來看,它對於汽車產品和行業的影響都將是無比深遠的,也是所有車企都必須面對的確定性趨勢——從這個角度上來看,大模型賦能汽車,也需要經歷一個量變的漫長過程,並最終到達一個質變的臨界點。

那麼,這個過程需要多久?

一切尚未可知,也許三到五年,也許長達十年——但有一點是非常明確的:無論是否情願,車企們已經被動或者主動捲入到 AI 大模型時代,並且將在這條終點未知的漫長賽道中不斷跋涉;但在到達那個臨界點之前,它們要先讓自己在汽車市場更加殘酷的廝殺中活下來。

文章來源: https://twgreatdaily.com/748dfb42487e1fa05e8a874fbec2590b.html