不肯錯過大模型風口!小米瘋狂補課

2023-10-07     AI狐頭條

原標題:不肯錯過大模型風口!小米瘋狂補課

原創 | AI藍媒匯

小米不肯錯過大模型風口。

來源|AI藍媒匯

ID:lanmeih001

作者|黑羊

編輯|魏曉

講真,小米最近在AI大模型上的速度,比造車要快。

越想聽小米汽車的動向,雷軍越不說。憋到十月一號國慶假期這天,放了個大招——還是關於大模型的。

十月一日這天的消息是,雷軍投資了王小川的大模型公司百川智能。後者今年 3月成立,說要「構建中國最好的大模型底座」,還要在年底追平GPT-3.5。

其最新的版本還通過了《生成式人工智慧服務管理暫行辦法》備案,正式上線面向公眾提供服務,可以說在國產大模型領域,百川的速度很快。

當然雷軍也不慢,這次投資百川智能屬於A+輪,據說,之前一輪雷軍也投了。在大模型上,雷軍不僅下手快,目標還多,另外兩個知名的國產大模型公司智普AI和minimax也得到了他的垂青。

此外,小米還有自己的AI智能團隊,研發人員比百川智能整個公司的人還多,而其公布的2023年Q2財報上說,研發費用達到了46億。

雖然,小米的高層曾表態:「小米不做通用大模型「,但無論是」 跑通端側大模型「,還是接連押注通用大模型公司,雷軍的AI野心,著實不小。

百川抱大腿

3月份成立的百川智能,比小米大模型團隊早了一個月。

王小川領銜,團隊里有不少搜狗的舊部,磨合起來異常順利,一些老員工甚至感覺:只是換了個地方辦公。

5月,百川智能就誕生了第一款大模型Baichuan-7B,然後一個月更新一次,到了9月,530億參數的閉源Baichuan2-53B,已經開始進軍To B了。

百川智能看起來一切順利,又有王小川這個金字招牌,融資也是順水推舟,但國內的大模型市場今年以來一直處在風口,一大群科技網際網路公司都擠在一起分一杯羹,百川人強馬快,但現實並不是特別美好。

首先,大模型實在太多了。

中國科學技術信息研究所發布的《中國人工智慧大模型地圖研究報告》顯示,截止到今年5月,國內已經發布了79個大模型——盤古、悟道、文心一言、通義千問、星火認知……還有一堆名字奇怪的模型,百川智能夾在裡面,競爭壓力相當之大。

其次,大模型這東西,一旦幹起來就需要多如牛毛的顯卡晶片、算力和不停疊代的技術,這些都換算成錢,就一個字——燒。

因此,王小川需要雷軍。

恰好雷軍不僅有錢,關鍵還懂技術,小米在大模型這一領域,擁抱出一個手機上運行的模型,雷軍雖然不做通用模型,但從獨角獸到百川這樣的實力派創業公司,給錢真是沒有猶豫過。

小米的野心

在大模型上,小米是有野心的——並不比造車差。

8月,雷軍在舞台上喊出「小米全面擁抱大模型「後,就拿出了一款「端側」的輕量大模型——「端側」,是指模型服務不是部署在雲端,而是直接存儲在手機設備內部的晶片中,僅利用晶片的算力生成結果。

小米這樣做是有原因的。

今年5月份的谷歌I/O大會上,谷歌一口氣發布了四個新一代大語言模型 PaLM 2。其中最小的「壁虎」大模型,可以適配手機運行。而 「壁虎」也被稱讚為PaLM 2模型中 「最重要的亮點」——這與小米的端側輕量化模型相得益彰。

雷軍顯然知道,在大模型混亂的戰場上,端側輕量化並適配手機的模型,另闢蹊徑,卻能為助推手機銷量乃至小米高端化策略,打開新的局面。

小米高級副總裁、手機部總裁曾學忠也認為,AI和手機的端側結合可能成為下一次跨越。AI讓設備能夠真正「理解」人,從而讓人與設備更進一步結合。

而另一方面,通用模型表面上沒有被小米「擁抱」,實際上也不能少,畢竟未來的小米汽車和其他硬體產品的人機對話、語義理解,都需要得到通用大模型來加持。

而對於更長遠的科技硬體軍備競賽,小米麵臨著和百川智能同樣的壓力。

如今蘋果、華為、三星、OV、榮耀等幾乎所有頭部廠商都先後宣布了落地,或將要落地大模型,小米依靠自研+投資雙管齊下的布局,要在其中殺出一條血路非常艱難。

但是對於小米來說,即便它並不想成為下一個OpenAI,也必須得投出下一個OpenAI。

文章來源: https://twgreatdaily.com/zh/4e51d6846aca1a0b76a0d73093ae4449.html