全面發力生成式AI,亞馬遜雲科技重塑雲計算

2023-12-15   甲子光年

原標題:全面發力生成式AI,亞馬遜雲科技重塑雲計算

生成式AI已經成為雲服務商的兵家必爭之地,全球雲計算市場的領頭羊亞馬遜雲科技,也在全面發力生成式AI。

亞馬遜雲科技在2023 re:Invent全球大會上圍繞底層基礎設施、生成式人工智慧(AI)、數據戰略等推出了一系列新服務及功能,包括重塑未來工作方式的新型生成式AI助手Amazon Q、Amazon Bedrock更多的模型選擇和全新強大功能、Amazon SageMaker助力規模化開發應用模型的五大新功能等,幫助企業更輕鬆、安全地構建和應用生成式AI。

亞馬遜雲科技大中華區產品部總經理陳曉建表示:「亞馬遜雲科技在每年的re:Invent全球大會上都會發布眾多新服務、新功能和新應用,在基礎設施、計算、存儲、數據等領域持續重塑雲計算,並圍繞當今最具變革性的技術生成式AI推出重磅新服務及功能。我們希望通過這些技術創新,幫助更多企業加快創新速度,利用生成式AI全面重塑未來。」

亞馬遜雲科技2023 re:Invent中國行城市巡展活動於今天正式開啟,將覆蓋北京、上海、廣州、深圳、成都、青島、南京、西安、杭州、長沙 10 座城市,為中國構建者全面展示2023 re:Invent全球大會上的最新服務及技術、前沿趨勢以及最佳實踐。

1、全面發力生成式AI

亞馬遜雲科技為生成式AI提供三層架構,包括利用基礎模型構建的應用程式、使用基礎模型進行構建的工具和用於基礎模型訓練和推理的基礎設施。

在底層,亞馬遜雲科技通過自研晶片提供用於基礎模型訓練和推理的基礎設施。

Amazon Trainium2處理器是用於生成式 AI 和機器學習訓練的專用晶片,針對訓練具有數千億至數萬億參數的基礎模型進行優化,相較 Amazon Trainium 4 倍性能提升,65 exaflops的按需超級計算性能;Amazon SageMaker HyperPod 服務,可大規模加速基礎模型訓練,能夠縮短高達40%的訓練時間,並可以確保持續數周或數月的訓練過程不中斷。

亞馬遜雲科技還與英偉達共同宣布了幾項最新合作:

  • 亞馬遜雲科技將提供首款搭載NVIDIA Grace Hopper超級晶片和亞馬遜雲科技UltraClusters技術的雲AI超級計算機;首款使用NVIDIA最新晶片GH200 NVL32 的NVIDIA DGX雲即將登錄亞馬遜雲科技;兩家公司共同開展「Project Ceiba」合作項目, 將全球最快的GPU驅動AI超級計算機和NVIDIA DGX雲超級計算機用於NVIDIA AI的訓練、研發、定製化模型的開發,它將擁有1.6萬個最新的GH200超級晶片,提供高達65 ExaFLOPS的驚人算力。

在中間層工具層,亞馬遜雲科技提供使用基礎模型進行構建的工具。

Amazon Bedrock是利用大模型構建和擴展生成式人工智慧應用的最簡單方法。Amazon Bedrock支持Anthropic Claude 2.1和Meta LLama 2 70B,以及亞馬遜獨家的Amazon Titan 模型。

企業創造真正價值的生成式人工智慧應用程式的關鍵就是能夠用企業自己的書據進行定製,用數據進行定製才能構建企業的差異化壁壘。Amazon Bedrock具備持續預訓練、微調、具有知識庫的檢索增強生成三大功能,並提供預覽

有了模型和定製能力,還需要和應用集成才能服務於業務。因此,Amazon Bedrock 提供代理功能,它可以使生成式AI應用跨公司系統和數據源執行多步驟任務。

Guardrails for Amazon Bedrock 預覽版,通過負責任的人工智慧策略來保護生成式人工智慧應用程式。同時,Amazon Bedrock確保數據安全和隱私:客戶的任何數據都不會用於訓練底層模型;所有數據在傳輸和靜態時均經過加密;用於自定義模型的數據保留在您的 VPC 內;支持GDPR和HIPAA等標準。

在頂層應用層,亞馬遜雲科技提供利用基礎模型構建的應用程式——Amazon Q預覽版。

Amazon Q是一種新型生成式AI支持的助手,可以根據客戶業務進行定製,專門用於滿足辦公場景需要。客戶可以快速獲得複雜問題的相關答案、生成內容並採取行動,所有這些都基於客戶自身的信息存儲庫、代碼和企業系統的見解。此外,客戶的內容絕不會用於訓練Amazon Q的底層模型。Amazon Q可以在亞馬遜雲科技上進行構建,也可以使用內部數據和系統,使用亞馬遜雲科技應用程式實現商業智能(BI)、聯絡中心和供應鏈管理。Amazon Q已向客戶提供預覽版,Amazon Connect中的Amazon Q已正式推出,Amazon Supply Chain中的Amazon Q即將推出。

強大的數據支持對生成式AI至關重要,在2023 re:Invent全球大會上,亞馬遜雲科技圍繞數據基礎設施、集成以及治理等推出多項服務及功能。

首先,進一步豐富向量資料庫選擇,亞馬遜雲科技推出了Amazon OpenSearch Serverless向量引擎、Amazon DocumentDB和Amazon DynamoDB的新向量搜索功能、Amazon Memory DB for Redis向量搜索預覽版,提升生成式AI應用在響應和延遲方面的性能表現。

推出四項Zero-ETL集成特性,讓跨數據存儲的數據訪問與分析更快速、更便捷。

在數據治理方面,亞馬遜雲科技為Amazon DataZone推出了AI描述建議功能預覽版,它能夠為企業的數據集自動生成更易理解的業務描述,並提供該數據集的使用建議。

2、重塑雲計算——自研晶片、存儲、無伺服器

在2023 re:Invent全球大會上,亞馬遜雲科技推出Amazon Graviton4和Amazon Trainium2自研晶片。

Graviton4與當前一代Graviton3處理器相比,性能提升高達30%,獨立核心增加50%以上,內存帶寬提升75%以上,為在Amazon Elastic Compute Cloud (Amazon EC2)上運行的工作負載提供最佳性能和能效;基於Graviton4的Amazon EC2 R8g實例目前已提供預覽。通過與光環新網和西雲數據的合作,基於Graviton3處理器的Amazon EC2 C7g、M7g、R7g實例目前均已在亞馬遜雲科技中國(北京)區域和中國(寧夏)區域正式可用。

Trainium2晶片專為以高性能訓練具有數萬億個參數或變量的基礎模型和大語言模型而構建。Trainium2與第一代Trainium晶片相比,性能提升多達4倍,內存提升3倍,能源效率(每瓦性能)提升多達2倍。Amazon EC2 Trn2實例採用最新的Trainium2,一個單獨實例包含16個Trainium加速晶片。Trainium2實例致力於為客戶在新一代EC2 UltraClusters中擴展多達100,000個Trainium2加速晶片,並與Amazon Elastic Fabric Adapter(EFA)PB級網絡互聯,提供的算力高達65 exaflops,客戶可按需獲得超級計算級別的性能。

亞馬遜雲科技推出的第二款新品是存儲。

Amazon Simple Storage Service(Amazon S3)自17年前推出以來,已成為最受歡迎的雲存儲服務之一,在全球擁有數百萬各行各業的客戶。在本次大會上,亞馬遜雲科技宣布Amazon S3 Express One Zone正式可用,與Amazon S3 Standard相比,數據訪問速度提高至多10倍,數據請求成本降低50%,為機器學習訓練和推理、交互式分析以及媒體內容創建等請求密集型工作負載提供最高性能存儲。

最後一款新品是無伺服器Serverless

亞馬遜雲科技在17年前就開創性地推出了無伺服器技術,為客戶提供極致的彈性和自動擴展能力。在2023 re:Invent全球大會上,亞馬遜雲科技推出了三款無伺服器服務創新,幫助客戶以任意規模分析和管理數據並顯著簡化運營,客戶無需花費時間和精力去配置、管理和擴展其數據基礎設施。

其中,Amazon Aurora Limitless資料庫可跨多個Amazon Aurora Serverless實例自動分發和查詢數據,並能夠擴展到每秒百萬次的事務級寫入並管理PB級數據。Amazon ElastiCache Serverless可以幫助客戶在一分鐘內創建高可用的緩存,並實時進行垂直和水平擴展以支持客戶複雜的應用程式,且無需管理基礎架構。Amazon Redshift Serverless利用人工智慧(AI)預測工作負載並自動擴展和優化資源,幫助客戶實現高性價比的目標。