甲骨文(Oracle)宣布推出首個Zettascale(十垓,10的21次方)級雲計算集群,采英偉達(Nvidia Corp.)次世代「Blackwell」平台。與此同時,甲骨文並透露,已取得三座小型模塊化反應爐(Small Modular Reactor,簡稱SMRs、小型核電廠)的建照,準備用來供應AI數據中心所需。
甲骨文11日發布新聞稿宣布,「甲骨文雲計算基礎架構」(Oracle Cloud Infrastructure,簡稱OCI)現在開始接受雲計算大型AI超級計算機訂單,能組建涵蓋最多131,072顆Blackwell GPU的運算集群,峰值算力高達前所未見的2.4 zettaFLOPS。
甲骨文指出,OCI超級集群(OCI Supercluster)規模最大的款式,提供的繪圖處理器(GPU)數量是Frontier超級計算機(配備37,888顆AMD Instinct MI250X GPU)的三倍以上,更是其他大型雲計算服務商(Hyperscaler)的超過六倍。
OCI超級集群目前能供訂購的OCI運算組態,有英偉達H100或H200 Tensor Core GPU、或英偉達Blackwell GPU可選。
其中,配備H100 GPU的OCI超級集群最多可拓展至16,384顆GPU、提供高達65 ExaFLOPS的算力和13Pb/s的總網絡吞吐量。配備H200 GPU的OCI超級集群最多可拓展至65,536顆GPU、提供最多260 ExaFLOPS的算力和52Pb/s的總網絡吞吐量,預計今年稍晚推出。
另外,配備英偉達GB200 NVL72液冷裸機伺服器的OCI超級集群,將通過NVLink和NVLink Switch技術,讓最多72顆Blackwell GPU以129.6 TB/s的總帶寬在同一NVLink域內互聯。英偉達Blackwell GPU預定2025年上半年供貨。
值得注意的是,Tom's Hardware、The Register等外電報道,甲骨文創辦人兼董事長、首席技術官Larry Ellison 9日在財報電話會議表示,已取得三座SMR建照,滿足AI數據中心對電力的需求。
SMR是迷你版的核子反應爐,可以大量生產,不需要大型實體基礎建設。理論上,SMR運營起來較不昂貴,但仍可產生數十至數百MW(百萬瓦)的電力。不過,目前並無實際開始運行的SMR,試運營也不太順利。
甲骨文希望拓展數據中心業務,對SMR相當感興趣。Ellison 9日通過電話會議說,甲骨文在世界各地有162座雲計算數據中心,有些已開始運行、有些還在建造中。其中規模最大者為800 MW,配備許多英偉達GPU集群,能夠訓練全球規模最大的AI模型。Ellison並表示,甲骨文很快就能建造規模超過1 GW的數據中心。
(首圖來源:Oracle)