原創 | 虎嗅APP
出品 | 虎嗅科技組
作者 | 齊健
編輯 | 廖影
頭圖 | 視覺中國
8月30日下午,網上傳出一則消息稱:百度、位元組、商湯、中科院旗下紫東太初、百川智能、智譜華章等8家企業/機構的大模型位列首批通過《生成式人工智慧服務管理暫行辦法》(以下簡稱「生成式AI管理辦法」)備案的名單。
博主「李飛」的爆料微博
經過一晚發酵,8月31日,這則消息中的多家廠商對外官宣了全面開放服務的消息。
對於算法備案流程,2022年2月28日中央網絡安全和信息化委員會辦公室(以下簡稱「中央網信辦」)發布的「關於網際網路信息服務算法備案系統上線的通告」中,曾對此作出過解釋:網際網路信息服務算法備案僅對備案主體所提供的算法推薦服務及服務中使用的算法推薦技術進行備案,信息由備案主體自行填報,該備案不代表對有關主體、算法、產品、服務等的認可,任何組織和個人不得將備案結果用於宣傳和其他商業用途。
目前這8家公司在宣傳上均未強調「備案」,只是宣傳產品和對公眾開放的舉措。 「其實這次的備案就是發放牌照的前奏。」參與了某大模型備案工作的張華(化名)告訴虎嗅,雖說備案不等於獲得「牌照」,但目前這8家陸續對公眾開放模型的動作,無一例外都在暗示他們已經非常接近牌照了。
AI新規何以閃電落地
有關部門上一次推出人工智慧管理規定,是在不到一年前,2022年11月公布的《網際網路信息服務深度合成管理規定》。這則規定的徵求意見稿發布於2022年1月,2023年1月正式施行,到6月20日公布了阿里、騰訊、位元組、美團等第一批備案企業。
相比於上一條規定,這次的生成式AI新規不可謂不快。
生成式AI管理辦法自2023年4月開始徵集意見,僅用3個月時間,就完成了暫行辦法制定。新規8月15日正式生效,此後半個月時間就已經公布了第一批備案企業。
閃電出台,閃電落地,AI大模型市場的變化日新月異,規則的制定也不得不隨著技術發展實時更新。
「最近我們和監管部門的交流幾乎是一周三次,同時也不斷在跟北京市相關部門報材料。」另一位參與了本次備案工作的楊明(化名)告訴虎嗅,從4月生成式AI管理辦法徵集意見開始,監管部門頻繁與大模型技術供應商開會探討技術、管理細節,並在內部對管理辦法進行了幾輪疊代。
在規則的疊代過程中,監管工作也是平行開展的。
「其實備案工作已經跑了幾個月,遠比8月15日早很多。」楊明告訴虎嗅,2021年底頒布的《網際網路信息服務算法推薦管理規定》中規定,算法備案的法定時限為30個工作日。但在實際操作過程中企業往往會不斷補充新材料,完成時間可能在2-3個月。在國內百模大戰的情況下,這個工作難度更大了。
新規迅速落地的動力,一方面來自高層對生成式AI等前沿技術的重視,另一方面則來自巨大市場潛力的倒逼。
「在消費場景、勞動密集型的工作場景中,大模型工具都是面向公眾用戶的,缺乏監管會給技術供應商帶來巨大的困擾。」在某數字化技術供應商6月召開的大模型應用產品發布會上,該公司技術負責人曾向虎嗅表示,他們被這家AI技術供應商要求嚴格保密,如果透露使用了誰的大模型,會被視為違約。而對於為何要對案例保密,這位負責人分析,很大一部分原因可能是要規避監管風險。
「生成式AI的安全風險在全球範圍內都有共識,但它畢竟是一個商業化產品,其背後蘊含的市場潛力巨大,任何市場也不會因噎廢食,一味封堵。」接近監管部門的馮清(化名)表示,對於生成式AI來說,符合商業化、市場化需求的監管或將是當前的重點。
「生成式AI管理辦法出台後,政策會從問題導向轉為目標導向發展就是我們的目標。」觀韜中茂律師事務所合伙人王渝偉認為,從規定的條文來看,新規是重「疏」而不重「堵」。
備案之後還有多長的路?
楊明告訴虎嗅,目前生成式AI的責任主體仍是技術供應商,這對於技術供應商來說,存在很大的安全挑戰。但要在技術上把控大模型輸出的內容並不十分困難,真正的難點在於如何識別用戶對模型的惡意引導。
在實際操作中,通過前後處理、SFT、Prompt微調,以及域內知識增強等多種方法,都可以減少大模型的錯誤和幻覺。某國產大模型研發經理周鑫(化名)介紹說,國內一些基於開源模型發布的對話產品曾出現過:在回答「你是誰」這個簡單問題時,錯把LLaMA當國產模型的情況,這就是因為開發者對「你是誰」這個問題進行了處理。
然而,在一些用戶隱晦的表達中,這些技術手段並不能保證百分之百地過濾有害信息。在此前對ChatGPT的測試中,就曾有網友以電影劇本創作為陷阱,誘導AI描述了危險爆炸物的製作方法。
「我們曾經在大模型上做過多個測試,很多問題不一定會觸發敏感詞,但輸出的內容卻可能不太合規。」楊明表示,中文裡有很多詞語在不同語境中的表達意思完全不同,這也很容易導致生成內容「跑偏」。
雖然監管嚴格,但有了「合法身份」的大模型在研發和商業化方面,無疑會更加快人一步。首先,在研發方面,隨著公眾用戶的湧入,大模型可以獲得更多來自真實用戶的數據反饋,對模型的優化疊代能起到很大的支持。
在商業化方面,二級市場對通過備案的AI公司表示了「熱烈歡迎」。 8月31日收盤後,百度股價上漲2.12%,商湯股價上漲3.31%,未在備案名單中被提及的科大訊飛股價則下跌了1.14%。
然而,一些業內人士對此並不看好。多位AI大模型研發人員對虎嗅表示,取得牌照對大模型商業化的主力——B端、G端用戶的刺激恐怕不會太大,因為這些應用本來都在強監管下,生成內容能產生的社會影響有限且可控。
通過備案真正獲益的應該是C端用戶,「最大的受益者應該是像百度這樣,C端產品比較成熟的公司。」張華表示,國內C端用戶對AI大模型的好奇心很強,但一直沒有特別好的使用途徑,開放公眾註冊,會大大降低生成式AI的使用門檻。
「不過大模型的運營成本太高了,國內大模型可能也會像ChatGPT一樣,在開放初期免費,後續再逐步收費。」不過,張華認為,雖然很多人都對AI大模型感興趣,但最終為AI付費、買單的人恐怕不會是使用AI的人。
彭博社在7月30日發布的一項對股票市場投資者的調查Markets Live Pulse顯示,在514名受調投資者中,約77%的人計劃在未來六個月內增加或保持對科技股的投資,且只有不到10%的投資者認為科技行業面臨嚴重的泡沫危機。然而這些看好科技行業發展的投資者中,卻只有一半人對AI技術持開放的接受態度。
50.2%的受訪者表示,目前還不打算為購買AI工具付費,多數投資公司也沒有計劃將AI大範圍應用到交易或投資中。
即便是在SaaS意識比較強的美國市場的專業投資人士,對AI工具的付費意願都不甚強烈,國內的普通用戶付費意願可想而知。
百度、谷歌兩大搜索巨頭分別在最新一季度的財報中強調了AI對廣告業務的推動作用。由此看去,AI時代的商業模式,很可能會與網際網路時代一樣。為ToC市場買單的人大機率還是那些網際網路公司的廣告主們。
下一波備案的可能有誰?
除中國科學院自動化研究所的紫東太初是多模態模型,本次提出的備案產品大多是文生文內容。不過,在6月20日公布的《網際網路信息服務深度合成管理規定》備案算法清單中,百度的文生圖產品文心一格已經完成了備案。
在安全方面,雖然文生圖通過圖片識別、prompt調整,在技術上很容易限制生成不安全內容,但對於一些細節內容的生成仍然存在風險,例如旗幟、地圖的生成都很容易出問題。
楊明認為,本次備案的企業在篩選過程中,可能考慮到企業成分的平衡。有商業化公司,有高校背景的企業,也有中科院這樣的研究機構。另一方面,也是考察大模型產品的能力。
在本次備案的模型中,並未出現備受關注的通義千問、訊飛星火,以及360智腦等。新華社研究院此前發布的《人工智慧大模型體驗報告2.0》中,上述3款模型均位列國產主流大模型測評榜前列,僅次於文心一言、商湯商量和智譜ChatGLM。
「我認為首批備案的模型,首先是考察能力和安全性,另一方面可能也會考慮到國產化的因素。」中國科學院自動化研究所主管劉昊介紹說,紫東太初的研發主要是基於自建的全棧國產化基礎軟體體系,在訓練過程中,用到的算力也大多基於華為昇騰GPU的910和910b。
截至發稿,登錄網信辦官方的「網際網路信息服務算法備案系統」,仍只能查到6月20日公布的, 「根據《網際網路信息服務深度合成管理規定》,公開發布境內深度合成服務算法備案信息」。前述消息中提到的,根據《生成式人工智慧服務管理暫行辦法》公布的備案算法名單仍無法在系統中查到。
網際網路信息服務算法備案系統