在9月20日2024雲棲大會上,阿里雲智能集團副總裁,資料庫產品事業部負責人,ACM、CCF、IEEE會士(Fellow)李飛飛發表《從數據到智能:Data+AI驅動的雲原生資料庫》主題演講。他表示,數據是生成式AI的核心資產,大模型時代的數據管理系統需具備多模處理和實時分析能力。阿里雲瑤池將數據+AI全面融合,構建一站式多模數據管理平台,以數據驅動決策與創新,為用戶提供像「搭積木」一樣易用、好用、高可用的使用體驗。
為滿足企業用戶在多雲多端環境下對元數據統一管理的需求,促進數據自由流動,阿里雲瑤池在會上重磅發布由Data+AI驅動的多模數據管理平台DMS:OneMeta+OneOps,通過統一、開放、多模的元數據服務實現跨環境、跨引擎、跨實例的統一治理,可支持高達40+種數據源,實現自建、他雲數據源的無縫對接,助力業務決策效率提升10倍。
1
打通底層元數據,打造面向「Data+AI」的一站式多模數據平台
由於靈活性、成本、業務連續性等綜合因素,當前近80%的企業在建設數據平台時開始採用多種數據引擎、多數據實例組合的策略。隨著AI興起、非結構化數據的指數級增長,多雲數據的管理難度加劇,企業也對數據的高效檢索和分析提出了更高的要求,元數據管理能力成為協調跨環境、跨引擎、跨實例資源的核心要素。
為此,阿里雲瑤池資料庫在會上正式推出由Data+AI驅動的多模數據管理平台DMS: OneMeta+OneOps,以更好地滿足大模型時代的用數需求。面向智能營銷、企業級RAG智能大腦和智能搜索等應用場景,該平台可提供規模化、精細化的元數據管理服務,助力構建企業智能Data Mesh(數據網格)。
自上線以來,DMS已服務超過10萬+企業客戶。藉助跨引擎、跨實例管理和開發以及數據智能一體化,DMS:OneMeta+OneOps將幫助企業從分散式數據治理升級至開放統一數據智能管理,實現革新性的智能Data Mesh架構,進而可降低高達90%的數據管理成本,業務決策效率提升10倍。
據介紹,DMS創新設計了統一、開放、跨雲的元數據服務OneMeta及DMS+X的多模聯動模式OneOps。其中,OneMeta首次打通不同數據系統,可支持全域40+種不同數據源,支持他雲、自建數據源無縫對接,提供數據血緣和數據質量的一站式Data+AI數據治理。
OneOps是基於Notebook和Copilot的數據開發平台DataOps和AI數據平台MLOps,可實現DMS+X的多模聯動模式,將X( X即雲原生資料庫PolarDB、雲原生數據倉庫AnalyticDB、雲原生多模資料庫Lindorm等多樣化的數據存儲、分析、計算、AI引擎)集結到統一平台。企業用戶可使用Notebook進行數據和模型開發,完成一站式數據和模型任務編排,實現數據加工、特徵加工、特徵提取、分析計算、模型Serving等DataOps和MLOps全鏈路的數據加工和計算能力。同時利用各種CPU/GPU算力,以及面向行業的算法優化,進一步完成計算和模型加速。
阿里雲智能集團副總裁、資料庫產品事業部負責人李飛飛表示:「DMS:OneMeta+OneOps是阿里雲瑤池繼雲原生資料庫2.0以來,又一次里程碑式的改造升級。通過Data+AI的全面融合,基於統一、開放、多模的數據管理與服務,我們為企業提供全域數據資產管理能力,讓業務數據「看得清、查得快、用得好」,助力企業構建智能Data Mesh,大幅提升業務決策效率。」
以某大型遊戲公司為例,其遊戲業務的智能推薦場景採用DMS + PolarDB & AnalyticDB的一站式DataOps+MLOps解決方案,提供基於玩家遊戲行為數據的數據挖掘和精準預測。該方案支持一站式In-DB海量數據特徵提取,資料庫內置大模型,讓AI距離數據更近,從而實現用戶數據內循環不出域,整個過程更加高效、安全。此外,一站式DataOps+MLOps方案還為業務提供了模型效果實時反饋和加工的海量日誌數倉存儲與分析,模型算法能夠自主優化疊代,成功將其遊戲業務用戶付費與流失預測的準確率提高30%,大幅提升了遊戲推廣與運營的ROI。
據介紹,在大模型領域,DMS+Lindorm的一站式多模數據解決方案支撐月之暗面構建AI智能助手Kimi,幫助Kimi準確理解用戶的搜索意圖、整合與概述多種信息源,實現精準和全面的信息召回,提升用戶交互體驗。
2
全面解耦、全棧池化,AlwaysOn
雲原生究其本質是資源池化和資源解耦,能夠充分發揮出資源池化的架構,才是真正的雲原生架構。2021年起,阿里雲瑤池在業界開創性地落地「三層解耦, 三層池化」(計算、存儲、內存)架構,基於全棧池化技術,將雲計算的彈性能力發揮到極致,助力用戶業務提質增效。
據悉,利用AI與雲資料庫的深度結合和大模型智能調參,瑤池資料庫進一步引領雲原生Serverless 2.0技術升級,通過旗下核心產品(PolarDB、RDS、AnalyticDB、Lindorm)提供智能無感秒級彈性,實現「彈的更快、更穩、更廣、更細」。系統會根據業務負載動態匹配,用戶只需專注核心業務,按需付費:
彈的更快:亞秒級彈升,彈升速度提升5倍
彈的更穩:縱向伸縮無抖動,橫向伸縮事務不中斷
彈的更廣:0~3000核資源範圍,彈升範圍提升3倍
彈的更細:三層解耦,CPU、內存、存儲獨立伸縮,成本降低90%
彈的更快:亞秒級彈升,彈升速度提升5倍
彈的更穩:縱向伸縮無抖動,橫向伸縮事務不中斷
彈的更廣:0~3000核資源範圍,彈升範圍提升3倍
彈的更細:三層解耦,CPU、內存、存儲獨立伸縮,成本降低90%
2024年6月,因雲而生的雲原生資料庫PolarDB首次提出基於「三層解耦, 三層池化」(存儲、內存、計算)、AlwaysOn架構的多主多寫和秒級Serverless能力,解決了多主架構中衝突處理和數據融合、以及Serverless秒級彈性租戶隔離的難題,並完成了全球首個大規模商用、基於共享存儲的雲原生多主資料庫實踐。測試數據顯示,在8節點高並發場景下,PolarDB性能為業界同類資料庫3倍。憑以上成果,PolarDB成功摘得了中國首個ACM SIGMOD和IEEE ICDE的工業賽道「最佳論文獎」。
目前PolarDB用戶數已突破10000家,在遊戲行業,PolarDB支持米哈游新游《絕區零》全球開服,見證其全球下載量突破5000萬,登頂138個國家和地區下載榜首。針對《絕區零》大規模的存檔數據讀寫場景,PolarDB通過分布式存儲和多線程能力提供超大的IO讀寫帶寬,幫助遊戲玩家在高峰期流暢快速存檔和回檔,平滑支撐海量玩家同時在線的遊戲數據處理。
雲原生數據倉庫AnalyticDB(以下簡稱ADB)兼具數據湖的擴展性和資料庫的易用性,ADB支持靈活、多維度的數據分析,可為相關負載節省高達90%的總體擁有成本。通過自研在線分析MPP引擎和Native執行引擎,ADB性能可提升50%。基於實例的CPU/內存負載、查詢排隊、查詢並發數等指標,自動進行cluster彈性伸縮,可將彈性時間降至20秒。
此外,ADB還集成了離線處理Spark引擎,通過Native執行引擎+OSS數據緩存,對比開源版本,ADB性能提升7倍。同時,ADB還為用戶提供搶占式資源,從而進一步降低資源使用成本。
面向AI和車聯網等創新應用開發場景,阿里雲瑤池旗下的雲原生多模資料庫Lindorm內置了AI推理服務,可加載業務所需的模型處理數據,並提供統一的表視圖和SQL訪問接口,一體化實現數據查詢、融合檢索、離線分析、交互分析等功能。Lindorm還具備雲原生多模一體化的數據處理能力,針對車聯網超寬列時序數據優化,已助力支撐極氪汽車的全系車型智能化升級和超32萬在線車輛、上萬信號數據的彈性處理分析。Lindorm現已應用於國內65%的車企和50%的基模公司,驅動汽車應用持續創新。
據李飛飛介紹,近年來,阿里雲瑤池緊隨硬體演進步伐,在資料庫系統的架構設計中,充分挖掘和施展硬體的獨有優勢,通過軟硬結合的一體化設計,優化提升資料庫系統的技術實力。
會上,瑤池資料庫正式發布了雲原生內存資料庫Tair Serverless KV服務,該服務是阿里雲首個基於NVIDIA TensorRT-LLM的推理緩存加速雲資料庫產品。針對快速增長的大模型推理需求,Tair採用NVIDIA TensorRT-LLM一起進行了深度優化。在In-flight batching、Paged Attention等技術的基礎上,結合TensorRT-LLM的Prefill/Decoding分離技術,並通過存儲池化將LLM推理過程中占用大量顯存資源的KVCache卸載到遠端,大幅加速超長和重複上下文場景。相比開源方案,該服務通過KVCache池化,預計成本降低 20%, PD分離/調度優化吞吐預計提升 30%, 軟硬協同優化 Context Cache TTFT(首 token 延時)預計降低30% *注。
阿里雲智能集團資料庫產品事業部NoSQL產品負責人張為表示,Tair與NVIDIA TensorRT-LLM的技術結合,標誌著緩存KV技術從支撐網際網路時代的訪問加速服務進化到AI時代的推理在線加速服務,將為未來飛速發展的商業化AI推理需求提供規模化的支撐。
3
賦能核心業務與AI應用實踐,讓創新觸手可及
最新數據顯示,阿里雲已連續多年位居中國資料庫市場份額第一。Data+AI驅動的雲原生資料庫已從概念進入到加速落地階段,服務於千行百業的核心業務及AI應用。
在2024巴黎奧運會的賽事系統中,雲資料庫RDS憑藉出色的性能表現和高可用架構,支撐了過萬QPS的並發響應和超過百萬條實時數據處理,平均響應時間保持在毫秒級,為全球觀眾提供了流暢的實時賽事觀看體驗。RDS通過備份恢復、實時監控、容災切換等產品能力,保障了奧運期間RPO=0, RTO 1分鐘級別的高可用在線資料庫服務,穩定支持了300多個賽事項目的管理與結果發布,助力雲上奧運穩定運行。
為避免各類故障及災害對核心數據產生影響,瑤池資料庫為用戶提供了完備的高可用與容災方案。應對機房級故障,阿里雲瑤池跨多個可用區部署的實例可提供秒級RTO及RPO=0的保障;如機房所在城市發生地域級故障,瑤池提供的跨地域容災實例,可實現分鐘級的RPO及RTO保障。企業可根據具體業務屬性,在瑤池資料庫多層級容災架構上進行靈活選擇,支撐數據業務持續在線。
隨著大模型技術的迅猛發展,AI搜索類產品如SearchGPT應運而生,徹底改變了傳統搜索領域的格局。從最初的關鍵詞搜索到如今的對話式問答,搜索方式的演變意味著新的機遇與挑戰。雲原生多模資料庫Lindorm內置的AI推理服務為SearchGPT的開發提供了一站式解決方案,並已落地包括月之暗面、MiniMax在內的多家大模型企業客戶。
以月之暗面(Moonshot AI) 為例,在其AI檢索應用場景下,Lindorm支持PB級別的存儲與檢索,滿足了月之暗面全網海量數據的存儲需求。
月之暗面 Kimi 搜索技術負責人Mark表示:「大模型驅動搜索技術經歷深刻變革,從關鍵詞輸入轉變為更自然的聊天式提問,搜索結果的消費模式也由逐個點擊結果連結轉變為依賴模型批量理解搜索結果並為用戶進行總結,用戶願意接受約10秒的延遲,以期獲得更智能的回答;這些演變給搜索技術帶來了新挑戰,如多來源的召回機制、多步驟的搜索流程以及多模型的融合檢索。
為應對這些挑戰,Kimi藉助Lindorm一體化多模資料庫平台秒級彈性、無縫推理及融合檢索等優勢,構建全新的AI搜索平台。憑藉深度壓縮、自適應編碼、分級存儲以及向量磁碟索引等技術,Lindorm助力業務整體資源成本下降超過50%,並支持標籤生成、向量生成、重排等多種AI任務,大幅提升了應用開發效率,為月之暗面的業務發展注入了強勁動能。」
除了依託自身的研發力量開展前沿技術研究,阿里雲瑤池資料庫團隊與國內產學研界的各大高校和研究機構也有著深入的學術合作。2021年,由阿里雲瑤池與華東師範大學共同撰寫的國內首部雲原生資料庫教材《雲原生資料庫:原理與實踐》正式出版。一經問世,該書便得到了來自高校師生和領域從業者的廣泛歡迎。
會上,李飛飛宣布今年將再度推出國內首部雲原生數據倉庫教材《雲原生數據倉庫:原理與實踐》,以及面向DBA的《雲資料庫運維》技術圖書,旨在為雲資料庫相關理論與實踐提供系統性的教材引導,助力推動中國雲資料庫領域的人才發展。
*注-數據來源:基於Qwen2 7B模型在長上下文場景構造實驗環境數據測試,最終效果以實際產品和場景測試數據為準。
點擊了解多模數據管理平台DMS
歡迎點贊/分享/在看哦