都在追「新潮」技術,但你有大廠們的動作快嗎?

2023-08-03     InfoQ

原標題:都在追「新潮」技術,但你有大廠們的動作快嗎?

文中有不定時驚喜哦!

曾經,觸屏技術幾乎將諾基亞淘汰出手機市場,如今的 AIGC 撼動了谷歌多年的搜索龍頭地位地位。就像 API7.ai 聯合創始人 & CEO 溫銘曾說的,「真正的挑戰可能不是來自技術,而是其他完全不同的產品將傳統的這些廠商擠出市場。」

每年,Gartner 都會做戰略科技的預測,入圍的都是當下最流行的技術,也是讓各種規模企業、創業者紛紛趨之若鶩的領域。但能改變當下競爭格局的技術並不多。比如 2017 年入榜的區塊鏈,到 2021 時候已經少有人提起;元宇宙也出現了一次後就迅速退出大家視野。

Gartner 近五年戰略科技預測,by InfoQ

但人們還是不會放棄追逐每次新出來的技術熱點,因為畢竟有 AIGC、雲計算這樣的例外。大廠們亦是如此。

騰訊雲,「卷向」向量資料庫

大模型的爆火帶紅了向量資料庫。向量資料庫專門用於存儲和查詢向量數據,業界稱之為大模型的「海馬體」。

市場方面,根據華福證券推測,到 2025 年,向量資料庫將約占非結構化數據處理需求的三成,同時數據向量化後相比傳統非結構化數據存儲有較大膨脹,因此其價格將會數倍於傳統的非關係型資料庫產品。

此前,向量資料庫賽道仍是創業公司為主。但如今已有不少企業入局,騰訊便是其中之一。

7 月 4 日,騰訊雲正式發布 AI 原生向量資料庫 Tencent Cloud VectorDB。據介紹,該資料庫最高支持 10 億級向量檢索規模,延遲控制在毫秒級,具備百萬級每秒查詢(QPS)的峰值能力,能夠被廣泛應用於大模型的訓練、推理和知識庫補充等場景。

據悉,騰訊雲向量資料庫提供了接入層、計算層、存儲層的 AI 化解決方案,企業原先接入一個大模型需要一個月左右時間,現在可以用三天左右的時間完成。騰訊雲向量資料庫目前也已經在騰訊視頻、QQ 瀏覽器、QQ 音樂等 30 多款國民級產品中應用。官方數據顯示,使用騰訊雲向量資料庫後,QQ 音樂人均聽歌時長提升 3.2%、騰訊視頻有效曝光人均時長提升 1.74%、QQ 瀏覽器成本降低 37.9%。

有統計顯示,將騰訊雲向量資料庫用於大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現 10 倍效率的提升,如果將向量資料庫作為外部知識庫用於模型推理,則可以將成本降低 2-4 個數量級。

那麼,騰訊是如何快速打造出這款向量資料庫的呢?

負責向量資料庫研發的騰訊雲 NoSQL 資料庫團隊向 InfoQ 表示,他們前後用了兩個多月完成了全自研,「走了不少彎路,也踩過很多坑,但最終還是遇見了星辰大海。」期間的更多精彩故事,可以查看 中國卓越技術團隊訪談錄(2023 年第二季)

看精彩內容,順便抽個獎~

網易伏羲,做個 100% 國產的大模型

2022 年,AI 繪畫實火。輸入三四個形容詞,點擊「生成」,然後人們就得到了相關的圖片。這像不像你給魔術師一張紙,最後他給你「變出」了一張百元大鈔?英國科幻小說家 Arthur C. Clarke 曾說過,任何足夠先進的技術都等同於魔術。而在 AI 繪畫這場「魔術表演」中,大模型就扮演著魔術師的角色。

AI 繪畫是 AIGC 重要的應用分支。網易伏羲是從 2018 年開始關注 AIGC 技術在產品中應用可能性的,直到今年的 2023 世界人工智慧大會,聯合推出了首屆 AI 繪畫體驗,向更多人展示了自己多年的研發成果。對於這次展示,網易伏羲的丹青約提供了技術支持,背後依託於網易伏羲自研的文生圖模型「丹青」。

據悉,丹青是網易伏羲自研的中文模型,基於原生中文語料數據及網易自有高質量圖片數據訓練,為 100% 的國產大模型。該模型訓練數據經過嚴格的文本及圖片審核,在確保數據來源合規、生成內容合規的同時,使得模型擁有較好的中文理解能力,創作出的作品能更好滿足中式審美。

丹青約還充分結合了網易遊戲美術設計的工作流,無論是生成圖片的美觀度,還是滿足高質量要求的圖片生產 (如原畫、美術資產等),都做了深入的探索和研發。

丹青模型生成的「天空之城」

網易伏羲 AI 平台團隊向 InfoQ 表示,Stable Diffusion 在很大程度上仍是「黑盒」,如果在其基礎上進行修改,對模型的優化和控制力是相對有限的。做文生圖模型,如果只是簡單的重複並無意義,需要走出自己的一條路子。那麼,網易伏羲如何摸索出屬於自己的路呢?更多精彩內容,可查看 中國卓越技術團隊訪談錄(2023 年第二季)

阿里雲,做好「提高效能」這件事

講了 AIGC 的大廠故事,我們再看看雲計算的。

作為小型券商,德邦證券面臨來自外部市場競爭和內部人員提效的雙重壓力。在德邦證券內部有多種內部運營系統工具,如 OA 系統、專屬釘、工豹等,這些工具在某些情況下是不可替換的。為了深入結合 DevOps,他們需要針對不同場景落地規範協作流程,如確定每個階段的具體步驟和責任人、要做什麼、何時做等問題。

在競爭激烈的現代,高效、持續的交付能力是企業搶占市場先機的重要基礎。在多數企業完成上雲後,雲原生研發效能平台成為越來越多企業和開發團隊關注的重點。

雲原生研發效能平台建立在雲計算基礎之上,將現代開發工具、自動化流程和持續交付理念結合在一起。軟體開發團隊藉此能夠更加專注於業務創新和功能開發,而不是被繁瑣的基礎架構和運維工作所束縛。通過雲原生研發效能平台,團隊可以快速構建、部署和擴展應用程式,縮短產品上市時間,提升市場競爭力。不少企業收益於此,如 Spotify、Airbnb、Pinterest 等。

但國內能建立這樣團隊的企業並不多。

構建和維護一個完善的雲原生研發效能平台需要深厚的技術功底和專業知識。涉及到多種技術棧和開發工具的集成,以及複雜的自動化流程和持續交付機制。這對於許多企業來說是一個巨大的挑戰。同時,企業需要大量的資源投入,包括技術團隊、硬體設施、雲計算資源等。對於一些中小型企業來說,這樣的成本可能難以承擔。採購成熟的商業產品成了大多企業的選擇,德邦證券也是如此。

幫助德邦證券解決難題的阿里云云效團隊告訴 InfoQ,這一賽道的工程師往往都帶著一些「客服色彩」,「讓後端的人,干前端的事,這對團隊心性、企業文化是個考驗。」那麼,阿里云云效團隊是如何組建起來的?又是如何隨著需求變化而調整策略的?更多精彩內容,可查看 中國卓越技術團隊訪談錄(2023 年第二季)

QQ 的一次重構

前端,是非常熱鬧的一個領域。新的前端框架、庫、工具和技術不斷湧現,社區里的開發者們積極探討,共享代碼和經驗。而前端的技術選型則是備受關注的一點。

今年 4 月底,新版 Windows QQ 正式公測,採用全新 QQ NT 架構,並帶來了全新交互介面。至此,QQ 最大的無法跨平台的問題得到了解決。在此之前,Windows QQ 最早用的是 MFC,後來用了 DirectUI、WPF 等,Linux 和 Mac 端則必須使用其他技術,比如 Qt。這三個平台的更新疊代節奏也完全不同。

但引發大家廣泛討論的是,這次重構中,QQ 開發團隊使用了 Electron 作為新版 QQ 桌面端 UI 跨平台解決方案。

Electron 是由 GitHub 開發的開源框架,使用 Web 技術(HTML、CSS 和 Java)開發,Web 開發者可以輕鬆轉向桌面應用程式開發,並復用現有的 Web 技能和代碼。社區也有許多開源插件和工具。但是,Electron 性能消耗比較大,在處理大規模數據和複雜動畫時可能表現不如原生應用。

那麼,QQ 是如何考慮這次重構的技術選型的呢?QQ 開發團隊向 InfoQ 表示,「我們歷史上踩過了很多很多非標準化的坑,一旦某個技術棧熱度一過、維護力度不夠,它就會成為全新的負債,做選型時必然也是避免再有類似經歷。」更多選型細節和過程,查看 中國卓越技術團隊訪談錄(2023 年第二季

內容推薦

大模型競爭突然升級!亞馬遜 CEO 親自監督、組建新的核心技術團隊,集中優勢資源打造「最具野心」的大語言模型

一場 AI 引發的開源革命迫在眉睫?Hugging Face 更改文本推理軟體許可證,不再「開源」

「Twitter如今就像瘋人院!」睡地板仍被裁女高管爆料:馬斯克帶來「恐懼文化」,被裁是最大解脫

網傳小紅書研發因客戶端閃退被辭退;OpenAI將推出代號G3PO的開源LLM;9.9元「妙鴨相機」刷屏,官方點名批評 | Q資訊

活動推薦

讀者福利

2023 必備 AIGC 知識庫

文章來源: https://twgreatdaily.com/zh-cn/d0f96f9051249e62525d5680242eb626.html