全球科創觀察 | 人工智慧和機器學習行業發展情況及風險投資活動

2023-05-15     清華五道口金融EMBA

原標題:全球科創觀察 | 人工智慧和機器學習行業發展情況及風險投資活動

全球科創觀察

「全球科創觀察」定位及時、專業、特色、深度的科技創新智庫產品,聚焦全球科技創新領域,覆蓋科技前沿賽道,精選來自清華五道口、全球700+知名智庫和海外科技媒體的研究成果與資訊,把握全球科技創新領域政策脈搏,洞察科技企業生態變化,捕捉全球科技創新投資風向,提供行業前瞻動態與價值資訊。

特別觀察

Pitchbook [1]:人工智慧和機器學習行業發展情況及風險投資活動

主題1:垂直領域

在人工智慧(AI)領域,OpenAI、Anthropic、AI21 Labs、Stability AI、Midjourney和Cohere利用風險投資(VC)資金,取得了突破性的AI訓練成果,這些公司在AI領域的發展超越了科技巨頭。初創公司敢於承擔大規模訓練的風險、利用未經驗證的架構並靈活設計產品,從而成功將尖端模型商業化。大語言模型的突破性進展可以促進大眾與AI系統的互動,催生新的商業模式,例如開發者願意提供付費的高級服務。智能基礎模型降低了數據科學家們構建新AI系統的固定成本,並允許對高級分析進行可擴展的消費。

公共市場正在獎勵在AI領域處於領先地位的企業,這提高了我們對AI應用前景的預期。除了消費者,企業也競相將ChatGPT整合到他們的產品中。在宣布應用新的AI模型後,包括Buzzfeed、C3 AI、SoundHound、Veritone和BigBear.ai在內的一些AI公司股價大幅上漲。這種趨勢促使AI雲服務和超大規模模型開發平台的大型企業不斷湧現。即使如此,各個領域AI技術的普及程度差異仍然很大,無法支撐需要客戶高凈留存率的高增長初創企業。在經過長時間的銷售周期並爭取到新客戶後,客戶使用產品仍然有限,從而降低了新客戶的長期價值。

未來三年內,應用前景可能會推動大型初創企業的發展壯大。最近的數據表明,AI應用雖然分散,但在一些機構內也達到了足夠的數量和規模:2022年6月對首席信息官(CIO)的一份調查顯示,大多數機構在其IT和財務部門都廣泛應用了AI。

來源:數據經許可轉載自《麻省理工科技評論》,截至2022年9月20日。

圖1:CIO當前和預期的核心業務領域AI普及比例

這表明即使整個機構沒有完全應用某項技術,但該技術在某些單獨的職能領域內得到廣泛應用,也會帶來企業價值。展望未來,CIO們預計到2025年前將AI融入各個部門,以開發應用程式為核心業務的初創公司銷售周期將縮短。屆時,60%的CIO計劃在企業各個職能部門廣泛應用AI。大語言模型提高各領域企業創造價值的能力,最終可以孕育出一家在AI技術方面具備天然優勢的軟體公司,可以與微軟、IBM和SAP等老牌公司競爭。

我們估計,2022年AI和機器學習(ML)市場的最終用戶支出達到1,975億美元,其中垂直應用領域支出金額最大,以及半導體和自主機器領域也做出了重要貢獻。隨著對AI核心技術及軟體產品的研究的增加,AI市場研究數據質量正在改善。雖然幾乎沒有AI應用以接近100%的速度增長,但許多應用達到20%—30%的增長,並有潛力在未來三年內繼續高速增長。由於對計算能力的需求放緩,越來越多的應用程式建立在現成的數據中心基礎上,以AI為中心的軟體正在加速發展,已經超過了硬體的需求。AI核心軟體市場仍然相對較小,為189億美元(不包括與垂直應用重疊的自然語言處理(NLP)和計算機視覺應用)。這一估計表明,在AI的平台和應用層都將出現巨額支出,而隨著計算成本的降低,硬體的價值逐漸下降。

來源:PitchBook Emerging Tech Research,數據截至2022年12月31日。

圖2:各領域AI和ML市場規模預計

(單位:十億美元)

主題2:風險投資活動

圖三是每個細分市場中VC支持或成長階段供應商的代表。所列出的公司已獲得VC或其他值得注意的私人投資。

圖3:AI與ML風險投資生態系統市場分布圖

2022年,獲高額資助但不太可能推動該領域未來發展的AI供應商面臨著挑戰。垂直領域的融資總額下降了34.9%,降至780億美元,跌幅高於整個IT行業。成長型企業的VC估值的中位數下降至1.3倍,低於總體風險投資中位數,這表明像Dataiku和Noodle.ai等領先供應商面臨著平價融資和異常下跌的風險。2022年,AI領域的交易總額與全球IT行業一樣均超過了2020年;但交易量下降13.2%,跌幅大於IT行業,其中,早期投資交易額下降較多,而晚期投資交易量保持較高水平。由於投資者不願投資需要大量的硬體設備和人力成本的企業,自動駕駛汽車、處理器設計、自動化平台和智能傳感器等領域交易量下降超過50%。鑒於消費者對AI應用的關注度較高,消費者AI是最具韌性的垂直應用領域,年度風投融資僅下降了20.5%。

第四季度風險投資退出次數繼續下降,但由於中國的上市交易數量較大,交易額有所回升。我們追蹤到第四季度的風投退出價值為70億美元,雖然較第三季度有所增長,但仍是2020年第二季度以來的次低值。退出次數仍高於疫情前的水平。在科技巨頭中,積極收購者包括Meta、Oracle和Spotify。私募股權(PE)公司在生成式AI(generative AI)方面找到了投資機會。其中,成長型股權投資公司PSG以生成式寫作初創公司Copywriter AI為平台,通過收購Frase和Rytr兩家寫作初創公司,構建了一個名為Copyrytr的新平台。這個平台的出現展示了生成式AI初創公司在不同應用中的協同作用。AI編寫軟體領導者Jasper作為該公司提供兼容格式的統一內容套件戰略的一部分,也已經成為一個收購者。

來源:PitchBook,數據截至2022年12月31日。

圖4:AI和ML風投公司在不同融資階段的估值

中位數增長幅度

來源:PitchBook,數據截至2022年12月31日。

圖5:2022年第四季度不同領域AI和ML

風險投資交易情況

來源:PitchBook,數據截至2022年12月31日。

圖6:12個月內不同領域AI和ML風險投資交易情況

來源:PitchBook,數據截至2022年12月31日。

圖7:不同階段AI和ML風險投資交易額中位數

(單位:百萬美元)

來源:PitchBook,數據截至2022年12月31日。

圖8:不同階段的AI和ML風險投資前估值中位數

(單位:百萬美元)

來源:PitchBook,數據截至2022年12月31日。

圖9:不同類型AI和ML風險投資退出價值

(單位:十億美元)

來源:PitchBook,數據截至2022年12月31日。

圖10:不同類型AI和ML風險投資退出數量

(單位:十億美元)

來源:PitchBook,數據截至2022年12月31日。

圖11:主要AI和ML風險投資退出案例

(單位:百萬美元)

主題3:人工智慧和機器學習:橫向平台

人工智慧和機器學習行業包括:

(1)橫向平台:開源技術的應用加速了生成式AI商業化進程,使其能夠面向大眾市場。

(2)垂直應用:收入運營、國防和媒體領域迎來重大發展機遇。

(3)自主機器:自動駕駛技術初創公司正在通過創新和制定更切合實際的目標應對融資下降的局面。

(4)半導體:陷入困境的數據中心初創企業鼓勵邊緣計算和光子學應用的創新。

概述

橫向平台使終端用戶能夠在各種應用中構建和部署AI和ML算法。這些平台將AI和ML科學研究中的進展直接用於商業應用。該領域的公司應用不同的AI和ML方法,並從一開始就以AI和ML為基礎,這被稱為以AI為先。此外,一些橫向平台用於改進AI和ML算法,但本身並不使用AI和ML。

細分市場包括:

(1)AI核心:建立和部署AI和ML的模塊,包括構建和將模型部署到生產環境所需的開發工具。此子領域中的類別包括AI即服務(AI as a Service,AIaaS)、AI和ML開發工具、AI平台即服務(Platform as a Service,PaaS)、自動化ML(Auto ML)、認知計算、數據準備平台、量子AI和微型ML。

(3)基礎模型:基礎模型公司使用可推廣的技術,包括Transformers模型、Diffusion模型和多模態方法來訓練定製的神經網絡。這個領域的公司需要投入大量的計算資源來提升模型的性能,它們的長期目標通常是實現人工通用智能(AGI)。

(4)自然語言技術(NLT):NLT使用計算語言學技術從通信數據中學習,並對語言的結構和內容進行預測。該子領域中的類別包括會話AI、神經機器翻譯、自然語言生成、自然語言處理和自然語言理解。

(5)AI自動化平台:通過使用AI實現對關鍵業務流程的預測分析的軟體和服務。分類包括以下產品和應用:IT運營的AI(AIOps)、商業智能、合同生命周期管理自動化、資料庫管理、決策智能和智能過程自動化。

行業驅動因素

(1)基礎模型訓練成本降低:截至2020年GPT-3發布時,單次訓練成本高達1,000萬美元左右。Stable Diffusion模型將最先進的生成模型成本降至約60萬美元。優化硬體可以進一步節約成本,採用來自SambaNova和MosaicML等供應商的定製硬體和加速軟體,可以降低5倍至20倍的訓練成本。例如,AI21實驗室只籌集了3,500萬美元的風險投資,就能夠訓練出一種具有競爭力的大語言模型。

(2)人才短缺:根據全球調查,過去三年中,47%的AI領導者招聘AI數據科學家變得更加困難。78%的機構發現招聘AI數據科學家非常困難。購買AI軟體可以緩解這種人才短缺。

市場規模

我們估計,該領域的支出在2022年達到324億美元,並將於2024年增長到757億美元,復合年增長率為32.7%。這個數據包括我們對計算機視覺和NLT應用支出的估計(即使它們與垂直應用支出重疊)。我們估計AI核心軟體,包括AI平台和模型開發工具、 AI數據準備、模型訓練和基礎架構平台,市場規模將達到140億美元。經過更精準的數據分析,我們對於水平計算機視覺軟體的市場規模進行了重新估算,估計市場規模為1.8億美元。此外,2022年,包括AI集成的業務分析和機器人流程自動化(RPA)平台的AI自動化平台市場規模將達到49億美元。

來源:PitchBook Emerging Tech Research,數據截至2023年3月15日。

圖12:橫向平台市場規模預計

(單位:十億美元)

商業模式

橫向平台通常包含各種計算成本,包括以下典型超大規模機器學習(Hyperscaler ML)部署的組件:

基礎設施成本:

(1)存儲:數據通常存儲在雲伺服器中,根據數據的規模收取名義成本。

(2)網絡:進入和離開雲環境的數據按基於數據量的費率計費。

(3)計算:模型構建包括構建、訓練和部署的單獨成本。

(4)操作成本:雲伺服器按照小時計費,費用會因合同期限和計算要求等因素而有所不同。

(5)安全與合規成本:AI和ML數據必須具有各種數據隱私合規框架的審計跟蹤記錄。

這些組成部分中的每個都有獨立的培訓和部署成本。因此,我們估計訓練單個GPT-3模型需要花費約250萬美元的計算資源。可選的增量成本包括漏洞發現和日誌管理、維護和支持成本、數據加密和安全網關。初創公司可以拆分超大規模平台,並在超大規模平台之上提供數據預處理和監視。

市場機會

(1)生成式AI:開源技術的應用加速了生成式AI商業化進程。Stability AI的Stable Diffusion模型在推出後的前三個月內,在GitHub上獲得了近3.4萬點贊,這是開發人員流行度的主要衡量標準之一。Hugging Face將語言模型引入了開源社區,並在成立後僅六年就達到了20億美元的估值。開源模型具有創造新商業應用的能力,這一點可以從使用Stable Diffusion的衍生產品中看到,其中包括Playground AI、Google Research的DreamBooth、Replicate和RunwayML。自在GitHub上發布以來,Stable Diffusion已經被複製了5,000多次,表明了正在構建新項目和商業產品的開發人員數量。生成式AI技術已經在各個領域引起了開發者的興趣,並在開源AI的發展中起到了重要作用。

創業初期,使用基礎模型可以支持各種商業模式的發展。如,Jasper應用OpenAI的大語言模型GPT-3支持營銷文案撰寫業務,Regie.ai通過使用這個基礎模型使跨渠道的銷售內容標準化。除了具備語境理解能力外,該公司還重新訓練了模型,針對3,500萬封銷售電子郵件進行了訓練,使得公司在該領域擁有獨特的優勢,公司估值在A輪融資中增長了4.3倍,達到5,500萬美元。從Peech的830萬美元種子輪融資以及音頻生成中可以看出,視頻合成和編輯方面也有新興發展機會。

(2)以數據為中心的AI:儘管基礎模型獲得了成功,但數據質量仍然對模型準確性至關重要。OpenAI的ChatGPT依賴於初創公司Sama的手動數據標註來補充該公司大語言模型的原始輸出。Sama的數據標註者對ChatGPT的響應進行評分以驗證準確性,從而使得該聊天機器人具有跨問題回答、軟體開發和文本生成等多種能力。在數據標註方面,Scale AI在計算機視覺應用中擁有競爭優勢,繼續在AI社區中發揮重要作用,該公司在2021年實現了73億美元的後估值。

鑒於市場低迷,2022年該領域並未發生大型交易,但後期供應商表現出持續增長的態勢。在2021年推出後,數據工程初創公司Galileo籌集了1,800萬美元的A輪融資,用於自動糾正數據錯誤。該公司由來自Google AI,Uber,Stanford’s AI Lab和Carnegie Mellon大學的前ML工程師創立。其他重要的後期融資包括來自DataLoop和Superb AI的B輪融資,對這些公司的估值超過了1億美元。我們相信可以在這個利基市場創建大型公司。

(3)流式資料庫管理:資料庫管理創新者將流式處理作為其AI戰略的一部分。Snowflake和Databricks都在2022年6月的會議上宣布了新的流媒體產品。Databricks指出,自2019年1月推出以來,截至2022年7月,使用其結構化流媒體平台的流媒體作業同比增長了一倍,從約200萬增加到超過400萬。在其Data+AI峰會上,該公司推出了Project Lightspeed以降低其結構化流產品的延遲,特別是增加了對Python應用程式編程接口(API)的支持,我們相信這將更好地促進ML對流數據的推理。在Snowflake的峰會上,該公司宣布推出流數據攝取服務Snowpipe。這些供應商正在響應客戶需求以及對持續AI推理的長期需求。

對於支持流數據管道的數據集成初創公司, VC表現出了很高的收購興趣。在第二季度,Software AG以5.84億美元的價格完成了對StreamSets的收購,使該公司獲得了7.6倍的投資回報倍數(MOIC)。到2025年,StreamSets將在數據集成領域打開一個總計35億美元的潛在市場,從而證明此次收購是合理的。此前,在2021年第三季度,Fivetran以7億美元的價格對數據集成初創公司HVR Software的收購展示了該領域可以實現較高的退出價值。在VC中,Astronomer在其C輪融資中實現了5.9倍的估值提升和獨角獸地位。傳統資料庫公司可以從與初創公司的合作中以集成來自雲、物聯網(IoT)和Web應用程式等新來源的實時數據獲益。

風險和注意事項

(1)上市公司努力實現AI的廣泛應用:AI上市公司通過將AI帶給廣大受眾以努力實現高收入增長。在新冠早期享有高估值溢價的純橫向AI公司(包括Palantir、C3 AI和Veritone)將面臨著充滿挑戰的市場環境,因為技術估值已經低於新冠前的估值水平,而且企業正在轉移支出。在市場低迷期間,公共AI公司已成為賣空者的目標,旨在揭露圍繞未來合同價值的過高的索賠。這些公司還面臨收入增長下降和核心客戶群以外的有限擴張問題。

(2)公有雲的主機提供全面的AI&ML模型構建和部署能力:公有雲主機可以提供AutoML、語言和視覺服務。它們還以AI市場為特色與橫向平台競爭,其中包括API、微服務、數據集和預構建算法等產品。在這一領域提供產品的現有企業包括阿里巴巴、亞馬遜、蘋果、百度、微軟、谷歌、騰訊和IBM。我們認為預算有限的企業可以結合使用開源框架和雲管理工具來啟動有限的AI和ML項目。出於這個原因,多雲和基於API的ML操作(MLOps)工具的擴展可能會延遲,直到現有AI和ML項目的投資回報(ROI)足以激勵整個企業對AI和ML功能進行更多投資。

(3)AI倫理和監管:隨著深度學習變得更加有效,深度學習正在加劇AI和ML的黑盒性質,因為它的特徵本質上是波動的,甚至對訓練它們的數據科學家來說也是模糊的。模型可能缺乏關鍵指標的清晰度,包括隱私、安全、道德和透明度,從而限制了它們在敏感用例中的實用性。美國聯邦政府、歐盟、中國網際網路監管機構和聯合國民權事務高級專員正在積極開展監管工作。可解釋性對於理解訓練數據偏差和歧視性模型參數中的倫理問題至關重要,但如果在需求階段沒有徹底的關注,就無法獲得可解釋性。根據提供的模型透明度水平以及道德數據收集,可能會出現供應商差異化。

[1]PitchBook成立於2007年,是一家美國服務商,致力於為全球資本市場提供及時的綜合數據、獨到的研究和分析。

來源:全球科創觀察

編輯:丹凌

文章來源: https://twgreatdaily.com/zh-sg/d493cecbb72547e601c93f86428d53ae.html