稱AI仍處於「撥接時代」！Cerebras發布全球最快AI推論解決方案

目標挑戰NVIDIA、專門開發AI運算系統的創業公司Cerebras宣布發布「Cerebras Inference」AI推論工具平台，努力打破NVIDIA在AI晶片市場壟斷局面。

外媒《金融時報》（Financial Times）報道，包括Cerebras、d-Matrix和Groq等小型公司的目標是在AI晶片市場中獲得市場占有率，並將重點放在更便宜、專運行AI模型的晶片上。

Cerebras全新的「Cerebras Inference」平台以CS-3晶片為基礎，晶片只有餐盤大小。該公司宣稱，這個解決方案在Llama 3.1 8B模型上每秒可生成1,800個Token，在Llama 3.1 70B模型上每秒可生成450個Token，在AI推理速度比NVIDIA Hopper晶片快20倍，但成本僅五分之一。

Cerebras執行長Andrew Feldman指出，「擊敗800磅大猩猩（意指NVIDIA）的方法，是將更好的產品推向市場，我們已從（NVIDIA）那搶走不少有意義的客戶」。

CS-3晶片沒採用NVIDIA所使用的獨立高帶寬內存（HBM）晶片，而是提供另一種直接將內存內置於晶片中的架構。Feldman指出，其優勢在於內存使用方式，因為內存帶寬的限制，會限制AI晶片推論速度，因此將邏輯晶片和內存結合至單一大晶片中，可提供「幾個量級的速度」。

也因此，Cerebras的晶片不像GPU和其他處理器，需要介面連接內存才能訪問資訊。彭博社報道，Cerebras這個方法依賴由單片矽晶片製成的巨型晶片。通過這種新技術，Cerebras的晶片功能比傳統同類產品強，但傳統硬體無法容納這些超大尺寸晶片，必須設計專容納這些晶片的計算機。

Feldman形容，「直到今天，我們還處於Gen AI撥接時代，沒多少GPU可拼湊在一起，實現這個目標」，而他的計算機將顛覆AI產業，使AI系統反應更迅速，如同轉換到高速網絡。

據悉，Cerebras已提交一份首度在公開募股中出售股票的保密計劃，同時創建自家數據中心，試圖將晶片銷售給微軟、亞馬遜等雲計算服務供應商。

d-Matrix、Groq同樣對NVIDIA虎視眈眈

另一家創業公司d-Matrix也有同樣的野心。

d-Matrix計劃今年底全面推出自有晶片平台Corsair。d-Matrix創辦人Sid Sheth指出，該公司將產品與Triton等開放式軟體搭配，目前NVIDIA最大客戶支持使用Triton等開放軟體。應用程式開發人員不喜歡被某種特定工具所束縛，人們也逐漸發現受NVIDIA的AI軟體平台Cuda限制。

d-Matrix由創辦人Sid Sheth於2019年創立，在新加坡國有基金淡馬錫領投的B輪融資中籌得1.1億美元，不到一年便啟動新一輪融資。d-Matrix目標是在今年或明年初籌集2億美元以上資金。

另一家AI推理競爭對手Groq本月從BlackRock Private Equity Partners領投的投資者那籌集6.4億美元，估值為28億美元。知情人士透露，晶片製造商Graphcore上個月被軟銀以略高於6億美元收購，少於2016年成立以來籌資約7億美元的風險資金。

（首圖來源：Cerebras）

稱AI仍處於「撥接時代」！Cerebras發布全球最快AI推論解決方案

文章來源: https://twgreatdaily.com/zh-cn/330e9c095356a9283ec3cb8b74947b36.html

業界首款16層HBM3E明年送樣！SK海力士目標AI內存全方位供貨

Meta機器人觸覺創新研究，推進人機互動技術發展

Arm高層談AI趨勢，異質運算、小晶片堆棧是機會

Anthropic發布Mac版Claude程序另類人工智慧助理選擇

黑膠復興美國最老唱片廠聯合唱片壓制公司日產8萬張供不應求

網友問什麼時候推出GPT-5？ OpenAI Altman回應

Meta AI再進化，傳自建AI搜尋引擎減少依賴Google、微軟

澳洲自主戰士演習，「鬼鯊」大型無人水下載體首度公開海中運行

持續篩選阿提米絲3號登月地點，NASA公布9個潛在著陸區域

Meta發布Llama 3.2 1B/3B模型的量化版

Intel二代Arc Battlemage顯卡規格泄露，2.85GHz頻率創新高

OpenAI圖片生成AI新方法sCM，速度是傳統擴散模型的50倍

美國晶片法加持，Hemlock Semiconductor密西根州新廠獲3.25億美元補助

黃仁勛：Blackwell AI晶片設計瑕疵問題已解決

傳三星S25全線搭載高通旗艦Snapdragon 8 Elite

高通Amon：未來將有成千上萬個殺手級應用

IBM公布新AI模型Granite 3.0，以英偉達H100訓練

蘋果iPhone 16中國熱銷，開賣三周銷量大增20%

美政府鬆綁規定，部分太空產品出口盟國免許可

Apple Car曾與比亞迪秘密合作，催生刀片電池設計

Mistral公布邊緣運算AI模型Les Ministraux

FOPLP勢頭猛廠商搶攻Chip Last技術！TrendForce估最快2026年量產

NVIDIA開放Blackwell平台設計，宣布Blackwell進入全面量產階段

神盾集團與Arm共同宣布戰略合作，推動AI HPC晶片創新