文 | 王方玉
編輯 | 蘇建勛
大模型競爭下半場,行業開始走深走實。健康、文旅、大數據、城市治理……越來越多的垂直領域大模型興起並開始商業化應用,AI應用及其產業生態發展進入了新的階段。
在這股垂直大模型浪潮之前,有一家AI創業公司,從創立伊始就選擇專注生命科學垂類大模型,並從底層的基礎大模型做起,至今已有4年時間。
2020年,百度集團創始人李彥宏和時任百度風投CEO的劉維,聯合創辦了百圖生科。2021年,百圖生科構建了千億參數規模的大模型「xTrimo」。據介紹,這是全球首個、也是目前最大的生命科學領域的「超大規模多模態模型體系」。
需要指出的是,百圖生科的生命科學基礎大模型並非自然語言大模型+生物學文本的垂直「大模型」,而是圍繞生命科學的胺基酸、鹼基等高複雜序列數據,用 Transformer 等技術去提煉序列中的隱藏規律,從而對單個蛋白質、細胞中蛋白質相互作用、細胞本身,以及細胞系統的規律實現建模,從而批量化地解決創新藥物或者生命科學項目研發的挑戰。
剛剛過去的10月,百圖生科在第三屆中國生物計算大會上正式發布了全新一代生命科學基礎大模型——xTrimo V3。
據悉,該模型在V2大模型突破千億參數、理解蛋白質語言、初步進入細胞等場景的基礎上,進一步擴展到2100億參數,覆蓋蛋白質、DNA、RNA等七大生命科學主流模態,並在各個原有模態上依靠新的數據、新的架構,做了顯著的增強。
會後,百圖生科聯合創始人兼CEO劉維,中國總裁鄧永富、技術副總裁張曉明等管理團隊與36氪等多家媒體進行了交流,闡釋了百圖生科耕耘生命科學基礎大模型四年的長期布局與戰略思考。
專注高價值、前沿未知問題
2024年諾貝爾化學獎的頒布,讓AI for Science(AI4S,即人工智慧驅動的科學研究)這一科學研究的新範式出現在聚光燈下。諾貝爾化學獎的決定,很大程度上肯定了這一研究範式、乃至整個賽道的長期價值。
實際上,在獲得諾獎加持之前,AI4S已經在生命科學、藥物研發領域有了較廣泛的實踐和應用,可以幫助縮短藥物研發周期,降低研發成本。目前全球AI製藥的市場規模已超過百億元人民幣。
百圖生科的生命科學基礎大模型所解決的問題,與AI製藥既有相似和交叉之處,也有顯著差異。
百圖生科方面表示,目前市面上的AI製藥公司專注於解決效率提升的問題,通過AI建模行業所積累的數據,加速藥物的研發;而百圖生科更加偏重於利用大模型和生成式AI解決前沿、未知問題,特別是今天行業里已有的數據和模擬軟體解決不了的問題。
「百圖生科並非以完成某個單點技術突破或者純粹的科研論文為目的,而是希望能將大模型能力實際應用到在生物製藥以及生命科學領域的一個個垂直前沿場景之中,圍繞各類前沿發現問題,一個個去建立依靠多個AI模型才能實現的系統能力。」
劉維告訴36氪,生命科學行業其實是願意冒風險去買沒有確定性結果、但帶來新的可能性的技術服務,這些技術最常見的就是動物模型和實驗模型,每年大藥企購買實驗模型從而產生可能的候選分子的金額高達千億美金。今天AI模型要代替或者擴充的是這部分市場,而不是狹義的軟體市場。
他預測,未來在前沿藥物研發領域,至少會有百分之二三十的費用是用來購買AI模型,因為實驗模型的性價比和絕對能力都不能匹配前沿研發的需求。
正如晶片和汽車電子在新能源車成本中的比例從燃油車時代的1%提升到如今的20%-30%。隨著生命科學研發的目標更多從天然產物篩選和改造,變成理性設計的前沿產物,未來生命科學行業的AI化將是大勢所趨。
在此背景下,百圖生科將自身定位為「一家生命科學AI模型提供商」。
生命科學大模型,不止於製藥
要做生命科學領域的基礎大模型,長期的技術積累和訓練至關重要,但同時商業化也是無法避開的關鍵問題。
為了避免過早地被商業利益所裹挾,百圖生科過去很長時間一直沒有把商業化作為核心任務,而是專注於技術突破。但自從去年下半年開始,百圖生科的商業化有所提速。
特別是百圖生科與賽諾菲達成的戰略合作,不僅總交易金額體量大,而且是少有的基於 Foundation Model (基礎大模型)的AI模型開發合作,而不是聯合開發某類特定靶點或藥物。國際大客戶願意斥巨資為AI模型買單,這無疑進一步凸顯出了大模型的價值。
「應該說前幾年的百圖生科的前期投入,得到了市場的reward。」 劉維表示,截至目前,百圖生科已服務了全球300多家用戶,實現超過20億美元(約合140億元)的訂單總價值, 客戶包括了跨國藥企、大型CRO、明星創業公司、國內外研究機構等。
百圖生科生命科學大模型的商業化應用,也不止於服務藥企。
百圖生科方面表示,百圖生科生命科學大模型不僅可以應用在藥物研發中涉及通用蛋白、多種構型的抗體、細胞療法、基因療法等多個領域,在靶點發現、工藝優化、合成生物學、生物製造、生命科學工具等多樣的方向上均有不錯的水平展現。
例如,生物學的酶本身也是一種蛋白,目前百圖生科已經完成了多個海外客戶的AI生成生物酶的項目。今年9月,百圖生科與大北農達成戰略合作。雙方將共建大農業生物科技AI大模型,聚焦生物合成、基因編輯、蛋白質組學、醫藥健康、人工智慧+等方向,開始在中國市場的落地。
「由於歷史投入原因,生物製造領域應用前沿技術的力度遠不如生物製藥大,我們也希望能夠借這個機會把新技術引入進去,加速該領域價值的發現。我們判斷,在合成生物學和生物製造領域中國大有可為,市場規模將遠超美國。」 劉維指出。
當然,藥物研發始終是百圖生科最專注的核心領域。百圖生科表示,目前藥物研發領域綜合投入每年高達萬億美元,但主要集中在解決幾個高價值的大病種問題上,如果利用 AI 能夠將研發效率進一步提高,會有更多的精準藥物能被設計和商業落地,將極大地推動人類在個性化藥物、罕見病等領域的健康福祉,也自然的能為AI企業帶來足夠的回報。
要實現這一超級目標,在平衡商業化和企業成長的同時,百圖生科始終面向前瞻性的問題,持續進行研發投入。
「我們的一個整體判斷是,生命科學大模型是一個長周期的事情,因此戰略選擇是面向未來,面向終極,我們下一代要做的研發,是領先生命科學行業三五年的新主題,為下一代藥物或者生物公司提前做好AI能力上的布局,只有看得更遠,解決前沿問題,才能為行業創造更多社會價值的同時分享更多的經濟價值。」 劉維對36氪表示。