原創 | 親愛的數據
原創:譚婧
夏盡秋來,2023年國產大模型看似喧鬧已止,進入穩定競爭期。
作為一種新的IT解決方案,國產大模型一出生便伴隨著激烈競爭。
外有GPT4,內有多家公司角逐「中國版ChatGPT」。
據我所知,就國內某家頭部大模型創業公司的收入來說,幾千萬的合同已經有了。
況且,組隊窗口期已經進入後期,難度越來越大。
而競爭格局未定,研發還在拚命燒錢。
雖說優秀人才越多越好,但客觀規律是IT人才結構呈金字塔形,頂部人才是極少數。
本文中,我借用《王者榮耀》遊戲段位順序,劃分大模型技術段位:
王者,白金,黃金,青銅。
王者們,那些科技大廠背景的領軍人,硬核科研背景的AI科學家,已經陸續「眾神歸位」。
位元組跳動的楊紅霞(原阿里達摩院)。
百川智能的陳煒鵬(原搜狗舊部)。
崑崙萬維的顏水成(原360),等等。
另有一些大神獨立門戶,愛詩科技(原位元組跳動王長虎),HiDream.ai(原京東梅濤),銜遠科技(原京東周伯文)……
無論大廠,還是創業公司,挖人靠錢。
那麼當下,白金,黃金,青銅段位面臨什麼樣的境況呢?
(一)白金段位:不設上線
當獵頭詢問「薪酬帶寬」,多家大模型創業公司負責人做出類似表態:
「收入不設上限,就怕你們找不來人。」
通用大模型有且有很多未知的技術秘密,關鍵技術路線更依靠金字塔上一層決策。
路線創新會有風險,但又不能一味跟在別人屁股後面跑。
不設上線的表態,從一個側面反映出這類人才的重要性,尤其是已有大模型高水平實戰經驗,且「實線帶人」。
一位從業者向我表達:「不要用資深一詞描述研發管理層主力,過於模糊,他們實現技術,把握節奏,以及保持團隊內部穩定。」
這時候,不得不說:「火車跑得快,全靠車頭帶。
比如百川智能,有面試候選人告訴我:「陳煒鵬負責大模型開源策略。」
而百川的開源策略也被業內專家誇讚頗多,在短短几個月的時間內打出了聲量,也打出了技術影響力,亦使融資受益。
近幾個月,甲方客戶(傳統行業頭部)和大模型創業公司頻繁交流。
中石油旗下尤其擅長數字化的企業(崑崙數智科技)的員工告訴我,目前市面上鼎鼎有名的大模型科技巨頭和上市公司差不多都來交流過。上一波如此密集的交流還是國產資料庫。
一些甲方企業在「煉」行業大模型,甲方企業對領先創業公司的員工很是偏愛,畢竟,跳槽會帶來珍貴的經驗。不僅如此,老牌IT服務廠商也不想落後。
比如,一家甲方客戶告訴我:
「有的AI初創公司,技術水平真的很高。那些骨幹研發管理層的水平就很好,哪怕下面帶的兵都是校招的,團隊逼一逼也能出活。雖然花的時間長些,但遲早都能弄出來。我們就缺這樣的人才。」
至此,市場上大致上有四批僱主在搶「白金」:網際網路科技公司,大模型創業公司,有創新能力的甲方公司,老牌IT服務廠商。
前兩者尤其搶得厲害,後兩者似乎沒有什麼勝算。
有些創業公司的核心競爭力是王者和白金兩個段位共同產生的合力。一些王者本身就是知名學者,悉心培養高業弟子,無論從信任,還是技術傳承方面都頗有默契,一些白金段位的人才之間,還是師兄弟。
況且,「白金」的需求就是有高手指導,大師指點,讓能力更上層樓。收入重要,但不是全部。
因此,「白金」高價難求。
說到底,好公司里,骨幹的薪酬一定會有競爭力,他們給企業貢獻的價值也是實打實。
「實線帶人」要發揮帶著跑的能力,既關注技術細節,又保證組織效率。
眾所周知,團隊素質高則研發效率高,研發周期短。反之,小夥伴們水平有限,壓力就給到白金段位這一邊。
任務布置需講得更為詳細,安排更為具體,勞力費心。這樣,對「白金」的要求更高,不僅技術高,還要心(脾)胸(氣)廣(好)。
這一輪大模型的競爭,比較起上一輪CV獨角獸的競爭,競爭不可同日語,那時候的獨角獸雖然也是跑步前進,但也是小几年做大的。而這一輪,瞬間集結,月余紅海,家家有大佬,司司都加班,卡卡都燒錢。
譚老師我私下笑談:「大模型創業公司拿出北京海淀區虎媽雞娃的方法瘋狂雞團隊。」
畢竟,「獨角獸創業上市未半,而中道崩殂」的案例在前,這一輪創業者水平更顯成熟。
另一方面,在與一家垂直行業頭部企業(安防)的CTO交流後,我觀察到,他們很清楚自身狀況。作為「場景」的所有者,雖然技術水平難爭一流,說是「積極跟進」都不夠準確,而是「唯恐落後」。
畢竟,一旦技術較力的平衡被打破,很快會帶動市場形勢變化。那些諳熟多次數字化和AI技術疊代的老兵,不會弛懈。談話間,海康衛視GPU卡的購買量就給脫口而出了。
譚老師觀察身邊的「白金」,若有機會在通用大模型團隊中負責無監督的預訓練,則煉「行業垂直大模型」的意願會較低。原因之一是通用大模型的實戰經驗難得,在通用大模型團隊對個人價值提升更大。
「行業大模型」團隊中的行業專家多,大模型專家少,缺少相互探討精進技術的氛圍。
有些公司,怎麼做還沒有想好就招人,還被有經驗的面試者發現了,怪尷尬的。
我的結論是:搶「白金」最激烈的競爭,發生在網際網路頭部和大模型創業公司之間。白金段位的人才在這個階段很難被垂直行業頭部企業的吸引。
當然,這是一個擺在所有人面前的問題,白金段位的人才格外稀少。
所以,才會有「不設上線」的說法。
在白金段位中,還有一批隱藏高手,他們是AI infra的資深技術和架構。
人家本身在網際網路大廠的起點年薪就很高,部分優秀人才年薪甚至可達150-200萬。市場上牛人AI Infra的年薪,達300-400萬或者更高,但是給出這個薪酬價格的廠商名字不能說。
另一方面,現在頭部大模型創業公司的估值急增,拿到的早期股權激勵會相當可觀。
此外,除了四類廠商不斷出價舉牌之外,量化頭部企業也出其不意殺了進來,尤其像幻方和九坤這類技術驅動的量化投資公司,也對此類人才也鍾愛有加。
某一家量化公司技術高管對我說的原話是:
「我心儀的候選人不是被大模型創業公司挖走,就是被大廠大模型團隊挖走,如果大模型遇冷,AI Infra同學們的薪酬溢價就沒這麼高了。」
可惜,大模型不僅沒涼,還在搶人。
譚老師我認為:AI Infra這類隱藏高手的收入確實應該高,厲害人物不僅節省大量訓練經費,也能極大地縮短訓練周期。
我長期看AI Infra條線,前兩年AI遇冷時期,AI算法收入縮水,而AI Infra的收入在頭部AI企業是只漲不跌,只是較少人關注。不過,AI Infra還是美國那邊高手更多。
同樣重要,又往往易被忽略的是數據團隊負責人,高端人才,非常核心。大模型數據組的功能大致分為採集、清洗和配比。其中配比的技術含量還高些。
雖然數據配比不屬於算法技能,但是多數時候極為考驗洞察力和經驗。
對於網際網路大廠來說,因為人才儲備足,白金段位人才多,且較為穩定。不過,大廠也怕被挖角。原阿里達摩院大模型團隊在幾個月前「通義千問」沒有發布的時候,就重新簽了一遍競業協議。百度亦是如此。
(二)黃金段位:極致性價比
這一段位可被稱為在研發管理層領導下的開發主力
分兩種情況:
第一種,非常幸運,有過大模型訓練經驗,跳槽的紅利期來了。
第二種,僱主內部組建大模型團隊,原地轉型。
第一種情況下,人才的技術能力不一定覆蓋大模型開發全周期,或許某一具體環節可獨當一面,比如Instruction 指令微調,RLHF訓練, Reward Model訓練等等。
第一批的跳槽高峰早在三個月前就已經結束。
那些經歷過的人說,誰不是脫一層皮呢?
刷Leedcode,投簡歷,接觸獵頭,一二三面,談薪酬,列印收入流水,到崗,很費一番功夫。
創業公司招聘周期短,決策快,能較快到崗;網際網路大廠的速度次之;而有些企業招聘程序冗長,比如AWS(不過面試官態度很好)。
「黃金」大多會面試一定數量的企業,甚至我聽說有一個「卷王」一天面試高達7場。
面試了一堆公司,包括但不限於:
智譜華章,百川智能,瀾舟科技,面壁智能,月之暗面,智源研究院,深言科技,愛詩科技,生數科技,銜遠科技;
阿里,螞蟻,百度,位元組跳動,AWS,貝殼,網易伏羲,小紅書。
為什麼說有實戰經驗的人幸運?
大模型創業公司的需求急,競爭窗口期小。
沒時間培養,先錄用「已有大模型經驗」。
俗稱,來了就能幹活。
三十年河東西,此前,大模型技術枯做板凳,有的企業摳門起來,恨不得一張卡都扣住不給大模型研發團隊用。若沒有ChatGPT,恐怕崗位和預算都保持不住。
一些營銷號鼓吹「早有布局」「多年投入」,聽的我直苦笑。
有點跑題,拉回主題。
後面,和HR大大們再來一番博弈。
辛辣式提問:「你目前手上幾個Offer?」
有的大模型創業公司會有北京戶口指標,畫餅式提問:
「今年北京戶口名額滿了,明年可能輪到你。」
不出意外的話,意外就該來了。
獵頭說,有估值靠前的創業公司的面試現場,候選人和面試官激烈爭吵。
我的理解可能是因為大模型技術較為前沿,對同一個技術問題的認知和觀點會不一樣,面試官和候選人在面試問題的答案上有分歧實屬正常,都不容易。
不過,一位多家公司Offer在手,原供職於小冰Research組的技術小哥哥也向我真誠吐露,他更喜歡文化包容的團隊。
他還告訴我一件事情:
因為小冰管理扁平化,項目制,有時候無法提供績效,他在面試時正欲解釋,結果對方HR說:「你們小冰的情況,我們都比較清楚。」
可見已經面試了不少小冰的人。
相信大家也看出來了,為了這篇文章,譚老師我和不少跳槽技術同學大擺龍門陣,但薪酬信息較為敏感,也無法做大規模詳盡調研。
情況大致是:
拿到30%漲幅者居多。也有網際網路頭部企業的資深算法去往大模型創業公司頭部的一名同學,100%漲幅,只此一位,我暫時沒有聽說有更高漲幅。
假如你問我,文章標題提出的問題。
我的答案是:在黃金這個段位,並不是。
我做了一個對比。
先說結論:對比下來,大模型黃金段位漲幅並不出眾。
我的對比參照物是此前阿里跳槽位元組跳動那批人員的漲幅。
這裡的此前是2022年底到2023年初。
一位前阿里雲P9大佬告訴我:「參考在前一陣子從阿里跳槽位元組跳動的那批人,漲幅30%。」
為此,我又找到其中一位已經入職位元組跳動,原來供職於阿里雲AIS(基礎設施服務部)的技術小哥哥聊了聊。
他告訴我,位元組跳動挖人的目標人群是其他網際網路頭部大廠的開發主力,基本漲薪在30%,只高不低。
我問:什麼情況下會有高於30%的漲幅?
他答:「就算人力制度再健全,萬人大廠也會有職級不能體現個人實力的情況。比如,也許入職時級別不高,但成長性強,又或者一直沒有趕上好業績或者好領導。經位元組跳動入職資格審核認可後,漲幅會突破30%,大約在35-40%範圍。」
這也算是,大家喜聞樂見的天道酬勤系列。
回到我們的主題,我的結論是黃金段位的大模型人才跳槽漲幅,沒有超過頭部網際網路之間跳槽主力研發人員的薪酬漲幅。
當然,看法求同存異,歡迎補充,歡迎文末留言。
在用人需求方面,武漢人工智慧研究院院長王金橋博士告訴我:「大模型創業公司注重細節打磨,會有更多用人需求。」
我請他告訴我一個數字,他的答案是「百人規模」。
他告訴我:「大模型創業公司打法講究精兵強將,高端崗位的需求會持續旺盛,但是不傾向於把攤子鋪得過大,和上一輪CV獨角獸面對的算法碎片化場景的打法完全不同。這也是大模型通用性強的特點決定的,多個場景問題會被同一個大模型一舉解決,工程量變小。」
在人才需求的流動上,他也給出了觀點:「未來會出現高(牛)端(逼)客戶自己微調的需求,黃金段位的人才會往客戶技術團隊自然流動。」
似乎當年「CV四小龍」商湯曠視依圖的「千人研發規模」在大模型這個時代「盛況」不可能重現,而少數幾家大模型頭部創業公司規模也仍在壯大。
智譜華章成立較早,於2020年開始大模型業務研發與拓展,其團隊規模相對較大,近期一位面試候選人告訴我:「當前團隊規模在400人左右。」
截止2023年9月20日,王小川微信朋友圈「秀出」160人團隊規模,而第100位員工入職時間,僅在不久前的7月21日。
一位成功跳槽大廠的技術小哥哥告訴我,一家「中科」開頭的老牌上市公司的HR和他商量:
「你可以在拿到所有的Offer之後,再來和我談薪資。」HR似乎暗示可以出價比其他企業都高,拿出「最高競價」策略來搶奪人才。
譚老師我一開始推想跳槽到知名創業公司,技術好,估值高,薪資慷慨。而實際觀察到的是:這份慷慨似乎更傾向於留給「白金」。
在這一輪跳槽中,個別算法同學從知名公司平薪或者小幅降薪到生活宜居的二線城市。
結論是:
用人企業在人才滿足職位要求的前提下,追求極致性價比。而且越是頭部企業(網際網路公司/大模型創業公司)越有談判優勢,將黃金段位薪酬磋商到最佳性價比。這也是這個章節小標題的由來。
第二種情況,原地轉型。
有的公司研發人才儲備紮實,鼓勵員工原地轉型。一方面公司用人成本不會增加,另一方面,技術人員也樂於跟上技術潮流。
另外,數據採集和清洗屬於黃金段位。
一位朋友在求職過程中向我抱怨:「假如你想進入大廠,找工作的人又很多,根本不知道在三輪面試會出現什麼么蛾子,明星創業公司也不那麼好進。」
對個體而言,如果不往「高精尖」的職級發展,你在大模型這一場人才的競爭當中,根本殺不出一條好路。
對公司而言,GPU卡買也好,租也好,要儘量多的算力,再儘量搶奪人才,趕在競爭對手之前,做出成熟有效的產品。多米諾骨牌會依次推到,時間成為最後的限制。
一位面試騰訊公司(CSIG)的候選人告訴我,面試官說了,年底出成果,不出成果,面試官自己都得走人。
怎麼說呢?留給中國隊的時間不多了。
(三)青銅:英雄不問出處
對於「青銅」來說,譚老師似乎沒有帶來好消息。
的確,這一輪,青銅段位普遍陷入焦慮。
大模型技術本來就難學,再加上大模型公司「精銳之師」的打法,入門和轉行門檻比以往都高。
即使對於「原地轉型」的人來說,上手難度也大。
前沿研究成果層出不窮,學習者大喊:「看不完,根本看不完」。
動手實現之時又有大量工程問題,大坑踩不完,根本踩不完。
「逼人退學」,動不動Bug拖很久解決不了,用來學習核心知識的時間精力被白白消耗了。
不僅入門難,進階難度也高。
想摸索參數大一些的模型訓練,非個人資源所能及。
別說個人,很多企業和研究機構都因為卡不夠用需要排隊,或者壓根排不上。
而理解模型結構和熟悉大模型的技術,很多時候都需要算力的支撐,前線吃緊,哪有多餘的「卡」給你練手和實驗。
有位讀者在周五下班的時候向我感慨:「終於到周末了,我又可以學習大模型了。」
可見壓力是有,社區學習氣氛也是高漲的。
用武漢人工智慧研究院副院長張家俊博士的觀點結束這次討論:
「人才要升級,眼界要超前一些,卷基礎模型可能是比較短暫的一個周期,畢竟基礎模型難以直接產生收入,而且基礎模型也就訓練那麼幾個,更加重要的是如何將基礎大模型發揮最大潛力:做出超級應用的人,將是下一波弄潮兒。」
要我說,允許100分的努力,只有60分的收穫。
反正,也沒有哪家公司是完美的。
大不了終身學習。
在譚老師看來,那些內心熱愛技術的人,從哪裡出發都可以奔赴山海。
(完)