邁向普羅大眾的生成式 AI:如何為技術爆發創造條件

2023-07-11     InfoQ

原標題:邁向普羅大眾的生成式 AI:如何為技術爆發創造條件

作者 | 鄭思宇

生成式 AI、大語言模型(LLM)無疑是 AI 行業當下的最大熱點。自 2023 年初以來,ChatGPT、Stable Diffusion 等生成式 AI 技術憑藉驚人的輸出表現,在行業領域以及大眾層面都引發了大量關注與應用熱潮。

2023 年 6 月 27 日 - 28 日,亞馬遜雲科技中國峰會在上海世博中心盛大召開。大會第一天,亞馬遜雲科技全球產品副總裁 Matt Wood 博士發表主題演講,向與會者傳達了亞馬遜雲科技對生成式 AI 技術的態度與願景。Matt Wood 表示,生成式 AI 是整個技術行業的一項巨大突破,亞馬遜雲科技對此感到十分興奮。為了讓更多人更早從這一技術創新中受益,亞馬遜雲科技正在幫助企業、開發者乃至整個行業,利用亞馬遜雲科技積累的技術、資源和經驗推動生成式 AI 技術向大眾化發展。

1生成式 AI:行業離未來還有多遠?

生成式 AI 的基礎是參數規模可達千億級別的大型模型,基於大量文本、代碼或圖像數據集訓練,需要數萬甚至更多的 GPU,經過幾千小時才能訓練完成。大模型能夠釋放超越傳統界限的創新,將人類推向未知的領域。用戶可以使用大模型加速創意流程、加快總結排序過程,或創造全新的交互體驗,乃至提升複雜決策的可靠性與效率等。

然而,雖然生成式 AI 技術擁有廣闊的應用前景,但它在普及的路上也面臨著重重阻礙。大模型訓練所需的龐大硬體資源、時間、人力成本投入,對於大多數企業而言都是沉重的負擔。企業在訓練模型時需要收集海量數據,而如何應對這些數據的法律授權問題,如何保障數據的安全性也會讓很多企業的開發團隊頭痛不已。現階段大模型的輸出質量仍然是一個問題,包括 ChatGPT 在內的公開服務都在實踐中表現出了輸出質量不穩定、回答過分自信、對領域知識了解不足等問題。

針對上述問題,亞馬遜雲科技在本次峰會上也提出了相應的解決方案。Matt Wood 博士在演講中提到了亞馬遜雲科技涉足生成式 AI 領域研發的幾項關鍵產品和服務:Amazon Bedrock、Amazon Titan 與 Amazon CodeWhisperer。這些產品與亞馬遜雲科技已有的 Amazon SageMaker、Amazon Aurora 等服務,以及亞馬遜雲科技自研的 Inferentia 和 Trainium 晶片結合,將為行業提供一條通向平民化的生成式 AI 普及路徑。

2大模型平民化,亞馬遜雲科技的理想與方案

Amazon Bedrock 是亞馬遜雲科技剛剛推出的全託管生成式 AI 服務,其允許用戶通過 API 訪問亞馬遜雲科技和第三方基礎模型提供商的預訓練基礎模型。開發人員無需擔憂底層基礎架構,只需通過簡單易用的 API,選擇所需模型,就能輸出合適的文本或圖像內容。亞馬遜雲科技還提供了 Amazon Titian 模型庫,讓用戶可以在安全、私有的環境下對模型進行優化和微調。最後,Amazon CodeWhisperer 工具則藉助了生成式 AI 技術,幫助用戶顯著提升開發效率,快速獲得生成式 AI 的收益,並降低大模型應用的門檻。

Matt Wood 提到,從雲計算開始,亞馬遜雲科技就一直在推動創新技術的民主化進程。在生成式 AI 領域,亞馬遜雲科技認為大模型民主化的關鍵就在於使用門檻較低、種類豐富、較為低廉的開發和應用成本,易於為行業和領域需求定製模型,同時安全可靠、無需擔憂法律和隱私問題。為此,Amazon Bedrock 與 Amazon Titan 提供了一系列有著各自專長的基礎模型,用戶可以輕鬆將數據輸入模型,通過無伺服器的 API 部署應用。Amazon Bedrock 支持私有數據定製化,為開發人員提供了安全的開發環境。

對於企業而言,Amazon Bedrock 為他們創造了一個非常合適的生成式 AI 起點和開發框架,他們可以將 Amazon Titan 模型庫中的模型,快速調整為可以更好解決領域問題的行業模型,大幅降低了大模型的開發門檻。Amazon Bedrock 即用即付的費用模式,結合亞馬遜雲科技自研的高效能推理和訓練晶片,則可以大幅降低大型模型訓練前期的成本投入。Matt Wood 認為,這樣的方式足夠簡便、經濟實惠,可以同時適應大企業與中小創投企業的需求。

值得一提的是,Amazon Bedrock 還能大幅降低大模型輸出自信滿滿但錯誤回答的機率,且輸出內容都經過了雲端認真審核,確保健康無害。亞馬遜雲科技在訓練 Amazon Titan 模型時,使用的數據也都經過了授權或使用許可,符合相關法律要求,企業可以放心地使用這些模型,無需擔心潛在的隱私與法律問題。

如今,已經有企業利用 Amazon Bedrock 開發了針對廣告內容分發的行業模型,並取得了 50% 的成本節約、35% 的效率提升與 45% 的點擊率提升。在可見的未來,會有大批行業企業意識到亞馬遜雲科技提供的生成式 AI 服務解決方案的優勢,並通過這些方案享受到類似的收益。

3釋放 AI 潛力:從前台實踐到後台支撐

在開發生成式 AI 基礎框架服務的同時,亞馬遜雲科技也在關注如何利用生成式 AI 改善生產力,新推出的 Amazon CodeWhisperer 便是這樣的工具。它可以為開發人員提供很好的幫助,用戶通過自然語言指示系統生成他們所需的代碼,大幅提升開發效率。Amazon CodeWhisperer 支持 15 種程式語言,未來還會加入更多選項。該工具能夠從開發人員使用的原始碼庫中提取有用的資源來生成代碼,從而更準確地把握需求。

在內部對比中,CodeWhisperer 帶來了 57% 的開發時間節省和 27% 的代碼質量提升,效果十分明顯,已經有包括瑞士軍刀在內的企業,開始使用 Amazon CodeWhisperer 來改進現有的軟體開發流程。亞馬遜雲科技認為,Amazon CodeWhisperer 還能幫助用戶進一步降低大模型技術應用的門檻,讓他們以更快的速度、更高的質量和更安全的方式開發生成式 AI 應用,為技術民主化的進程提供助力。

Matt Wood 提到,生成式 AI 的本質是以前所未有的方式支持和處理數據。數據對於生成式 AI 而言是一切工作的起點,而亞馬遜雲科技對此的答案就是雲原生的數據戰略。 如果說 Amazon CodeWhisperer 是生成式 AI 的前台應用,那麼雲原生的數據戰略就是亞馬遜雲科技為企業提供的後台支撐

首先,亞馬遜雲科技提供了全球領先的全類別雲資料庫服務,提供低時延、低成本等優勢。例如,元宇宙企業 Gevos 就使用了亞馬遜雲科技的雲資料庫作為核心負載的託管平台,顯著提升了遊戲開發的生產力。與此同時,用戶還可以使用 Amazon EMR、Amazon Aurora 的全新 ETL 服務等工具組合,獲得廣泛而深入的數據分析能力。最後,Amazon DataZone 這樣的數據管理服務可以幫助企業搭建數據治理框架,進而形成自己的數據戰略。

所有這些數據能力組合在一起,為亞馬遜雲科技的客戶帶來了可見的先發優勢。當用戶充分利用這些能力來結合諸如 Amazon SageMaker、Amazon Bedrock 等 AI 服務,就能夠快速實現一些全新的應用,從現有的數據中挖掘出可觀的價值。

在用戶推動數據與 AI 戰略的過程中,亞馬遜雲科技還為企業設置了足夠的安全護欄,幫助開發團隊在免於安全與法律問題的同時獲得更高的自由度,進行更廣泛的實驗。通過這些實驗的成果,開發人員就能夠整合自身所處行業的專業知識,推出效果令人滿意的行業 AI 應用。

4寫在最後

本次亞馬遜雲科技中國峰會,標誌著亞馬遜雲科技在生成式 AI 領域正式開始全面出擊,向著這一技術全面普及的目標大踏步前進。Matt Wood 博士的演講不僅全面回顧了亞馬遜雲科技的一系列創新產品和服務,也為企業如何利用這些服務搭建自己的生成式 AI 開發框架,並制定 AI 與數據戰略提供了很好的建議。

Matt Wood 總結說,在整個行業中,亞馬遜雲科技實現了以最快、最低成本以及最簡單易行的方式提供生成式 AI 模型。最近,亞馬遜雲科技還投資了一億美元來進一步促進生成式 AI 領域的創新和進步,其中的一項重要舉措就是建立一個新的生成式 AI 創新中心。這個創新中心集結了亞馬遜雲科技在機器學習方面的科學家,與此同時也會積極地同客戶合作,幫助他們構想、設計和推出新的生成式 AI 產品、服務和流程。

Matt Wood 認為,隨著越來越多的企業甚至個人經常使用這些生成式 AI 模型,它們的反饋與輸出會越來越好。對於行業的未來,Matt Wood 博士也充滿樂觀: 「我們正處於一項重大技術創新的發展早期和爆發前夜,我們所見的一切都只是起跑線,而非天花板。」

文章來源: https://twgreatdaily.com/zh/c8a5bbe6219b5fa70fbec9d18d848a00.html