OPPO 推出自主訓練大模型 AndesGPT，初衷是智能助手的技術升級

作者 | 羅燕珊

11 月 16 日，在 2023 OPPO 開發者大會上，OPPO 正式推出了自主訓練的大模型 AndesGPT。

據介紹，AndesGPT 擁有對話增強、個性專屬和端雲協同三大技術特徵，對於大模型帶來的變革，OPPO 認為體現在四個方面：知識、記憶、工具和創作。

在知識能力方面，AndesGPT 融合了知識圖譜及通用搜索能力，為用戶提供更專業的問答。通過知識增強技術，將外部知識與模型融合生成結果，降低幻覺。
在記憶能力方面，AndesGPT 實現長期記憶機制，以支持無限長度的上下文和有狀態服務。而長期記憶帶來首字推理延遲這個技術挑戰。為了解決該難題，OPPO 研發了一種注意力算法命名為 SwappedAttention。SwappedAttention 能夠在多輪長上下文對話中，有效降低每個 query 的首字推理時長。其核心技術原理是，通過外部存儲和 KV 壓縮的方式實現會話級 KV 緩存。結合 PagedAttention 算法一起使用，能夠帶來 50% 的首字延遲降低，以及 30% 的推理吞吐提升。
工具使用也是 AndesGPT 一項核心能力，更好的理解設備控制與服務 API，端到端生成可執行指令。目前 AndesGPT 已支持使用系統設置、一方應用、三方服務、代碼解釋器等各類工具。
在創作方面，AndesGPT 已全面支持文生圖與圖生圖場景。

AndesGPT 主要訓練三種參數規格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan，可根據不同場景靈活選擇。AndesGPT 使用行業主流的網絡結構，主要做了兩個組合優化：

RoPE 位置編碼探索了 base 的最優值，結合 log-scale 和 attention 加 bias，擴展外推能力；
GQA 結合複雜移動窗口（Dilated Attention）加速了訓練和推理，實現了 O（Nd）的線性複雜度。

OPPO 數智工程事業部總裁劉海鋒在接受 InfoQ 採訪時表示，OPPO 做大模型的一個最基本的初衷就是升級智能助手產品，讓小布助手變得更有用更智能。「對於手機廠商或者智能終端廠商、本來就有智能助手的團隊來說，這個事兒是非常自然且水到渠成的，因為我們有現實的用戶的需求，有數據的積累，也有一些 knowhow 積累，那麼我們肯定要做技術升級。」

除了落地應用，OPPO 還在推進產學研聯合促進前沿技術研究。去年 OPPO 聯合中國科學技術大學成立的智能計算聯合實驗室，已將大模型技術作為核心研究方向。此外，OPPO 還和國內外超過 45 所重點院校建立了 AI 相關的合作。未來，AndesGPT 還將面向開發者開放核心的智能體開發平台。

點擊底部閱讀原文訪問 InfoQ 官網，獲取更多精彩內容！

今日好文推薦

突發！「ChatGPT 之父」Sam Altman 被開除，與董事會矛盾早有端倪？

好萊塢大導預測成真，Meta 讓 AI 「一句話生成一部電影」不再是夢

ClickHouse 彪悍發言：雲數倉死貴死貴的，Snowflake 這種就不應該成為當前主流！

「谷歌有谷歌的規矩」

OPPO 推出自主訓練大模型 AndesGPT，初衷是智能助手的技術升級

麥當勞中國：打造 MACH 架構的數字化巨無霸

vivo 軒轅文件系統：AI 計算平台存儲性能優化實踐

從架構角度認識 AI：為架構師解讀機器學習與生成增強技術

全球科技巨頭扎堆的機密計算，迎來了中國「黑馬」

都2024年了，端到端保護軟體供應鏈安全真的實現了嗎？

AI 驅動的可觀測性革新：攜程如何通過架構升級實現高效數據治理與性能平衡

人工智慧缺乏「激勵機制」，如何重新定位和思考 AI 的發展？

Flux、SD 等圖片生成模型遭「封禁」，但這次矽谷大廠不反對了！

Uber 履約系統如何實現零停機時間遷移

前端策略：使用框架還是純JavaScript？

卷模型還是做平台？

三年虧損51億元，去年賣出22台車！文遠知行被爆赴美IPO，估值超360億元

Forrester在HashiCorp 2024雲戰略現狀調查中推薦了雲成熟度修復措施

40 個頂尖數據團隊的構成剖析

改善 Kubernetes 日誌以增強可觀測性

優步使用谷歌雲平台實現大數據基礎設施的現代化

鴻蒙崛起背後：作業系統新格局，關業務場景什麼事？

LLM 能提高開發人員的生產力嗎

華盛頓大學開源語音深度學習算法，可以在嘈雜的環境中鎖定某個說話者

2024年8款資料庫數據分析能力（TPC-H）真實性能評測，真有100倍差距

AI 大模型如何在各行業跑通業務閉環？

豆包大模型家族發布、火山方舟升級，火山引擎如何打造全棧AI技術服務？

百度文心智能體平台舉辦開發者沙龍，打造國內領先的智能體生態 | Q推薦

領英是如何利用機器學習解決內容相關威脅和濫用問題