先分享兩件小事。
自從ChatGPT帶火了AI賽道,我基本每隔幾天就能在朋友圈裡刷到小漢所在的公司。這家公司有大廠血統,自研大模型,有成熟的對話式AI應用,並且融資能力卓絕——成立不到兩年,就成功地讓紅杉、明勢、高瓴、米哈游這些自帶光環的名字出現在股權架構里,進而成為國內最早一批估值超過10億美元的大模型企業——從大家的論述邏輯來看,我發現很多人相信這種「強勢」的成長方式背後意味深長,讀懂了他們就能讀懂中國科技行業在這場範式革命中所扮演的角色。
有說紅杉、米哈游對他們的連續投資,象徵著「通用大模型首戰即將終結」的,有說他們橫空出世的方式「神似OpenAI」的。樂觀派會稱他們的存在代表著中國有「一群信仰AGI的年輕人」,理性派把他們和小冰、西湖心辰、瀾舟科技羅列在一起,推導誰最能帶來屬於中國的「AI的iPhone時刻」。
大概是出於職業的原因,我莫名地「共情」到了一股PR層面的壓力。於是在上個月的某天,我忍不住轉發了其中的一篇近似於捧殺的報道給小漢,問他「面對這麼高強度的『自來水』,公司現在的感受如何」,然後很快得到了一個非常簡單的答案「哈哈哈都還好」。
由於「哈哈哈」的存在,我不確定小漢是在「謙虛」,還是希望能「一切盡在不言中」,於是我又求證式地補充了一個問題:「所以你們身處一個正在快速成長的行業,是覺得有宣傳就好,還是『寧可少宣傳不要亂宣傳』?」
這次小漢利落地回復了三個不帶語氣詞的短句:「寧可沒有,(面對報道)沒有觀感,我們不在意這個。」
另一件事也發生在上個月。大概是周受資代表tiktok出席聽證會的那天晚上,科技媒體人老編輯同志在社交平台即刻上發一通關於「人工智慧被卡脖子」的感慨,大意是李彥宏聲稱的「兩個月代差」過於樂觀了,與國外人工智慧產業相比國內賽道用戶差了一個數量級、硬體差了一個數量級,在英偉達GTC之後差距只會越來越大。不過他並不認為這是李彥宏的錯,而是單獨成段強調「這十年的彎路,完全是小眼鏡片一手造成的」。
這裡的小眼鏡片,普遍認為指代的是張先生。在高喊過「確保Web3在此發生」的即刻,相當一部分用戶認為位元組跳動賴以成功的「算法推薦」是Web2最後的護城河,進而認為位元組跳動的巨大成功讓中國科技行業錯誤地評估了技術範式疊代的必要性。這通感慨顯然是這個共識延伸。
但這次對共識的強調並沒有帶來整齊劃一的點贊,相當部分圍觀群眾更認同另一位即刻大佬金葉宸提出的反對意見。他認為老編輯整段論調毫無意義,當前的大模型訓練方式決定了「數量級差異」很難出現,包括英偉達GTC之後也沒有改變GPU的使用在「超過一定數量後很難再形成訓練速度的邊際遞增」。更關鍵地是他跳出「大模型」發出了這樣的感嘆:我們要充分認識到一個人的認知知識體系必然是存在缺陷的……作為一個前自媒體從業者,一定要向ChatGPT學習,和自媒體從業者嘮嗑還是要經常習慣性說「你說的是對的」還有「對不起,我只是一個大型語言模型」。
兩件事前赴後繼,讓我的腦子裡不斷蹦出「毒奶」這個詞。特別是到了4月初,先有馬斯克拉著數名頂著圖靈獎光環的科技界大佬聯合呼籲「暫緩GPT5的開發」、揚言當下目前人工智慧技術的發展面臨失控,後有谷歌專家驚嘆「大模型已經擁有了我們難以理解的推理能力」,我甚至有回到2017年的感覺。
那時候比特幣正火,以太坊和EOS即將大牛,微信群里流傳著各種命名為「ICO白皮書」的pdf,群友們最喜聞樂見交易所開單記錄,其次是空投擼羊毛教程。創作來源於生活,整個科技媒體圈呈現出赤裸的「創世感」,前腳李笑來宣布「要用Pressone重建整個網際網路」,後腳「價值網際網路時代」的新概念應聲而起,順便再區分出來一個「古典網際網路」,大膽地把BAT掃進歷史的塵埃。宋歡平用一種「話不敢說太滿」的畫風提點跟風者們「少談夢想,因為這個夢想的掌控者並不是你」,就已經稱得上「清醒派」。
所以為了確定這波AI創業潮是否正在經歷同樣的劇情,過熱的輿論是否嚴重拔高了行業現狀,是否給創業者帶來了額外的麻煩,是否干擾了投資人的判斷,我設計了一份簡單問卷,從上周開始向超過30個人工智慧賽道內的創業團隊發出的QA邀請。現在我試著整理答案。
「創業的霸權時代」
創業者們最明顯的感受是,他們身處於一個備受鼓勵的環境里,並且鼓勵的力度正在持續升溫,「千模大戰」的口號在升溫的過程中逐漸成型。
「千模大戰」,「千團大戰」的魔改,後者誕生於2010年前後,是《人民日報》盤點的2011年網際網路11大看點之一。當時隨著4G網絡和智慧型手機的普及,陡然增加的「國民總時間」帶來了大量高頻、剛需、基建式的市場需求,很多人開始高喊「所有領域都值得在移動網際網路時代重做一遍」,然後集體選擇在「團購」「O2O」賽道嘗試兌現這個「範式預言」。資本最瘋狂的時候,整個電子商務領域一個自然年發生了所有融資事件,有三分之一投向了團購,僅2010年3月到8月這不到半年的時間裡中國大陸就有超過200家團購迅速成立又迅速倒閉,很多媒體都選擇引用某匿名VC的評價來形容市場的慘烈程度:「這是典型的紅海,衝進去就得做好斷胳膊斷腿的準備。」
現在主流的觀點認為,「千團大戰」雖然本質上是一場「資本鬧劇」,大量資本、人力、智力成本被浪費在「商場團購券販賣機」之類的偽需求上,但在中國網際網路產業發展史上「千團大戰」卻有不可替代的里程碑意義。它的資本過熱在相當程度上幫助消費者們快速熟悉了線上消費場景,最終形成了規模化、常態化的線上消費群體。移動支付工具的超前成熟,「本地生活」等新興概念被快速接納,基本都可以看做是「千團大戰」的副產品。
「千模大戰」這個挪用理論上恰如其分地解釋了當下大模型熱潮的價值所在:這是一次新的底層技術革命,天然地需要大量的創業嘗試來探索可能性。
也有更激進的人直接點出「千模大戰」意味著小公司和個人將迎來前所未有的創業機遇,並按照這個思路重新拆解了midjouney等人工智慧賽道的明星公司。例如一篇來自「AIGC研修社」的文章就寫到:「midjouney沒有軟體、沒有 App、沒有融資,靠著 11 個人自籌資金在不到一年的時間擁有了全球千萬用戶,年營收上億美金……它寄生其中的 discord這家非常正統的網際網路公司,卻需要不斷融資,營收也只不過是一億美金,並且員工人數目前是 650 人。」
但鼓勵不是風險和成本的平替。需要不斷被現實問題研磨的創業者們普遍覺得自己的脖子不夠粗,戴不上這頂高帽子。永寧老師就認為現在的討論氛圍經常陷入極端,「一會兒說AI讓所有人都要下崗了,一會兒又說AI能夠給大家找到很好的工作。」
永寧老師的職場履歷基本都圍繞著「技術」展開,供職過位元組跳動,在亞馬遜擔任過資深軟體工程師。AIGC大熱之後,他擁有了自己的創業計劃,還出過一本科普讀物《一本書讀懂AIGC》。他用自己的寫書經歷舉了一個「極端化」的例子:「最近很多媒體都在引用一家公司給AIGC提問工程師開40萬美金年薪的例子,我的書里也用過……但這就是某家舊金山初創公司的招聘信息,全世界並沒有哪家公司會開這麼高的工資……這件事顯然被過分放大了。」
拿掉被刻意放大的信息渲染,他覺得AI創業就是一個「屁股決定腦袋」的事。「沒有非常強大的算力做支撐,很難去研發出一個很好的AI產品。」他說,「OpenAI也是因為很早就綁定了馬斯克和微軟,很廉價地獲得了必要的資源。對於一個就是沒有任何嫡系背景的小公司來講(從0到1)就太難了……所以國內很多AI的公司其實都是在做應用。」
Synfesys創始人李金龍也感受到了同樣的氣息。Synfesys是李金龍開發的一款AIGC遊戲生成工具,Base矽谷,拿過3個term,目前正在美國爭取大VC的機會。他的肉測體驗是,即使在「領先全球一個身位」的美國,在ChatGPT出現之前整個人工智慧賽道也是一片寂靜:「很多名校教授牽頭的項目拿了VC數億美元,高薪聘請了一群Phd和精英大牛搞研發,雖然有一些成果出來了,但其實在產業端並做不成什麼大名堂。無非就是人臉識別、語音意義識別等應用相對普遍的技術,其他很多項目的投入產出都不成正比」。
集智魔方創始人徐大大則直接建議我和同行們不要過於樂觀,認為人工智慧這一次的熱潮在應用層面的很難留下太多機會,反而可能即將面臨一個「霸權式創業」的時代。我希望他能解釋一下「霸權」的含義,他補充了很長一段話:「我們認為人工智慧這一輪的發展是不斷集成人類智能的過程,在這個過程中很多流程、環節、都會吞噬,形成端到端、自動化的解決方案,最後會不可避免地形成超級智能——這些環節在上一代網際網路的時代是存在獨角獸公司的(所以網際網路時代是一個「平權」的創業時代),但是現在沒機會了——比如GPT4出現之前很多企業做視頻和圖片處理,但GPT4出來以後對他們是一個重大打擊,模式是否成立都是問題。」
而這種「霸權創業」的感受也正在完整地通過創業者傳遞給投資人。徐大大和很多VC接觸後,發現大家目前形成的共識是創業規劃要有「戰略提前量」,而不是尋求「時間提前量」,因為「如果方向錯了,早晚被AI追上」。於是他的團隊目前的思路是推論「AI發展到最後可能有什麼樣的機會,以這樣的終局反推現在做什麼可能能成」。
其實我和徐大大的交流並不是一開始就這麼坦誠。剛剛加上微信表明身份和事由的時候,徐大大的第一個回復語是「費用這塊怎麼算」——我以為徐大大是在要求「採訪費」,徐大大卻以為我在進行一次「商務拓展」——這似乎一定程度上佐證了小公司、小個體的AI創業者們正在經歷什麼。所以我在通用QA之外補充了兩個問題:
「會不會是您在正式開始AI創業後,出現了一波所謂的產業媒體、WEB3媒體、AI媒體,打著可以為您提供社群傳播、投融資對接的旗號,希望您付費買他們的內容?」
「這個一直就有啊哈哈。」
「他們真的給你帶來了什麼幫助嗎?」
「沒多大幫助,頂多就是知道了一些案例吧。」
「枯竭技術的水平思考」
當然,沒有人覺得「誇張」的輿論氛圍是媒體的鍋,中美之間在AI領域尤其是LLM(大語言模型)和生成式模型(如Stable Diffusion、Mid Journey等)方面確實存在著無法迴避的技術代差。一個更積極的應對心態是,媒體的下場參與可以幫助關注者們更簡單、靈活地正視產業差距,進而再通過輿論的槓桿撬動更多資金投入和政策扶持創業來完成真正意義上的追趕。
唯一的分歧在於「重新造輪子」到底有沒有必要。
永寧老師沒有那麼強烈的「造輪子」情懷。在他的認知里,「人工智慧」是一個類似「計算機科學」這樣擁有豐富細分賽道的領域,並且已經消費級應用中得到廣泛應用,開頭被污名為「Web2護城河」的「位元組算法」就是一個典型應用案例,其中支撐起算法引擎運行的標籤識別、興趣匹配都可以歸類到技術範疇當中。他也因此更多鼓勵「基於GPT再創業」——建議普通創業者們思考GPT如何改造已有的應用場景,而不是「掌握更好的技術」。
只是他發現缺乏從業經歷的人很容易把「人工智慧」想窄。再具體到人工智慧尚未完全從實驗室中走出的新概念,當ChatGPT在媒體的幫助下出圈成為大眾層面的公共議題,「基建的必要性被誇大,應用層的執行難度被低估」的現象幾乎不可避免。
行者AI持相同的觀點。他們認為人臉識別、翻譯、語音識別和Chatgpt、Mid Journey是AI1.0和AI2.0的關係,相信AI最實際的創業潮應該在細分領域發生。例如他們的產品遊戲AI Bot,就是對遊戲、元宇宙產品里剛需的內容填充進行「直接解決」。但缺點就是基於細分領域的應用往往在後端運行,對於普通網友缺乏接觸的機會和了解的渠道,AI仍然難以擺脫「陌生感」——這其實是有隱憂的:「大家對於陌生的、能力強的事物都會先入為主的帶有恐慌情緒,從而帶來更多的負面情緒和一些過於激烈的言語和行動。」
徐大大建議創業者們換一個視角。一個基本邏輯是,相比於底層技術,應用層面的開發可以更容易形成數據,方便VC通過「唯結果論」來進行投資決策。而且他發現在和投資人交流的時候,最高頻出現的問題就是「對AI的未來是怎麼看」。他覺得這個規律說明了兩個問題:「一個是看創始人的認識,第二VC也在這個過程中學習。大家都是很混沌的狀態,追求模糊的正確而已。」
GPTHUB創始人杜宇洋認為目前的「大模型狂熱」「人工基建狂熱」不是行業發展的一個線性結果:「ChaGPT背後的語言模型如果從參數等技術指標進行考量,它一定不是最大的,國外很多公司與國內部分公司都存在參數量、模型大小比GPT大得多得多的模型……OpenAI公司在ChatGPT還不很成熟的時候就把模型公布出來,一定有商業層面最大化公司或組織利益的考量。ChatGPT的公布也使得這些仍然在人工智慧領域布局過程中的其他公司不得不提前他們的計劃,對自己的語言模型進行公布,並進行較大規模的宣傳與營銷。」
當風口以跨線性的方式「空降」,杜宇洋隨之收穫了一個和徐大大相似的遭遇:投資人會下意識地用ChatGPT及類產品與前幾年元宇宙進行比較,他的辦法是從「元宇宙是概念,ChatGPT是產品」的角度為投資人進行解釋。「大部分人對此類產品屬於『知道是什麼,但不知道它多有用』的程度……這說明賽道仍處於較早期,而且操作路徑較長,公眾仍然沒有產生其使用層面的價值共識,也沒有較大範圍養成公眾使用習慣……不過這也是一個很正常的現象,就像當初的網際網路、抖音一樣,早期的參與者中公眾一定是占少數的。」
類似的保守表達在我的問卷反饋中不勝枚舉,似乎一夜之間所有人都開始信仰橫井軍平的產品哲學。
橫井軍平是很多人心目中20世紀最偉大的產品經理,其一手打造的Game Boy在遊戲主機賽道足以比肩喬布斯的iPhone 4,是能以一己之力定義全品類發展趨勢的天才。但他從不尋求技術上「領先」,固執地相信優秀的產品都是「枯竭技術的水平思考」——掌握必要的成熟技術,通過應用層面讓用戶獲得更好的體驗——任天堂前掌門人山內溥在一次新聞發布會上把這套拗口的哲學翻譯成了大白話:
無論遊戲主機是16位、32位、64位,重要的是遊戲能和玩家互動,能玩得有趣,畫面很厲害,音效很厲害。
而且頗具「啟示錄」意味地是,橫井軍平的滑鐵盧正是來自於對「枯竭技術的水平思考」的違背,低估了應用層面開發的必要性。他在1995年推出的全新主機Virtua Boy通過簡單的「視覺延遲原理+鏡像掃描顯示器」,超前地實現了近似於VR設備所能提供的頭戴式體驗、裸眼3D縱深效果。但由於上市倉促,發售時沒有任何一款遊戲來得及根據特性進行過針對性開發,「不適應」成為了玩家們的集體感受,佩戴不便、傷害眼睛等差評「劫持」了這款產品的全部印象,產品出現嚴重滯銷。截止停產前總銷量也沒有超過80台,距離發布時山內溥提出的500萬台目標相去甚遠。
我沿著這個感受,邀請AI創業者們能試著回憶和投資人們溝通時記憶深刻的有趣場景。杜宇洋思考了一下:「應該就是在演示產品的時候,投資人對於目前語言模型生成結果的那種被驚艷吧。」
「我們希望英文報道」
我發出了超過30份問卷邀請,其中有三分之一表達了委婉的拒絕,理由幾乎相同:「我們會在4月/5月發布大模型/類GPT產品,在此之前關於AI的深度問題我們都不做解答。」有一個團隊詢問我這次的採訪是用「中文進行還是用英文進行」。我回答「中文」,對方很快表現出了失望:「我們這個項目可能更希望英文的採訪報道這樣子」,隨即再也沒有得到過任何回復。
不過其實我也無法確定這30多份問卷,是否都發給了合適的QA對象,很多項目的定義模稜兩可。比如「更希望英文採訪」的這個團隊,通過搜尋引擎的幫助,我得到的項目介紹是這樣的:
「擁有繼OpenAI、百度、谷歌后,全球首個基於Web3的GPT大模型發布。在香港發布。由Stability AI前聯合創始人Cyrus Hodes發起,是一個公共、去中心化的第二層解決方案。用Go語言構建的,最初與以太坊和iPollo合作。」
——這看起來更接近「幣圈創業」。海外社媒平台上的網友似乎也和我感受相同,他們大多將這個項目稱之為「AI新公鏈大(羊)毛」「排名前3的AI概念幣」,產品亮點是「申請節點可以獲得代幣空投」。
很多有相同觀察的創業者,因此相信AI項目在資本市場上只能呈現出「外熱內冷」的情況,產業會「實際上變得安靜」。李金龍相信由於ChatGPT太過耀眼,太過強大,被因此吸引而來地「動態投資人」很難找到第二天可以借鑑參考的成功範式:「投出第二個GPT是極難的,而投資基於API做應用的項目又看起來沒有壁壘,(投資人會想)不如觀望一下讓創業項目之間競爭內卷,看看最後誰跑出來了,再加碼投資。」
杜宇洋認為「模稜兩可」並不是壞事,因為這本質上是公眾仍然缺乏對當前語言模型產品的更多了解,意味著還沒有形成清晰指向性的輿論,因此也不會普遍存在投資人「被輿論帶跑偏」的情況。
節點科技的高澤林覺得沒必要擔心投資人的信息渠道。「他們的信息來源是都是創業者、實驗室、高校或者海外一手信息。他們能判斷現在真正能做出大模型的其實沒有幾家。」
這個趨勢其實在2個月前就有所報道。2月10日,中國企業家雜誌以「ChatGPT」為題策划過一次面向投資人的群訪,後來將大家的整體態度描述為「二級市場在喧囂,一級市場靜悄悄」,暗示著資本市場在經曆元宇宙、crypto、Web3之後對於「宏大敘事」的疲勞感,也沒人知道這種疲勞感什麼時候能緩過來。
唯一比較確定的是,這種疲態暫時還很難傳遞給「二級市場」,因為缺乏「做空機制」——中泰傳媒首席分析師康雅雯補充的二級市場從業者的視角大概就是這樣:「(二級市場裡)沒有人會因為你提示看空風險,幫他省了錢而感謝你,只會在意提前下車,會不會錯過了這波行情……二級市場裡,輿論真的非常容易影響投資人的判斷。」
只不過這種「恐懼」的來源就不僅限於媒體和社媒了。「這個圈子裡本來就有很多所謂的小道消息。」康雅雯說,「就像前幾天盛傳某公司拿到了7nm(晶片)技術,傳到市場層面這個傳聞太容易直接被坐實……講的人和看的人本來就是兩種語義理解環境。」(文/蒲凡,來源/投中網)
(網友@元宇宙公主對本文亦有貢獻)