國家網信辦出手:《生成式人工智慧服務管理辦法(徵求意見稿)》要點解讀

2023-04-12     零壹財經

原標題:國家網信辦出手:《生成式人工智慧服務管理辦法(徵求意見稿)》要點解讀

來源 | 冰鑒科技研究院

4月11日,為促進生成式人工智慧技術健康發展和規範應用,根據《中華人民共和國網絡安全法》等法律法規,國家網際網路信息辦公室發布關於《生成式人工智慧服務管理辦法(徵求意見稿)》(下稱《辦法》)公開徵求意見的通知。 這是國家首次針對現下爆火的生成式人工智慧產業發布規範性政策。

按照《辦法》的定義,生成式人工智慧,是指基於算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。

隨著生成式人工智慧持續獲得市場關注,網際網路巨頭集中發布大語言模型,外有微軟、谷歌、Meta,內有百度、華為、阿里、崑崙萬維,然而各路巨頭訓練數據參差不齊,數據來源及涉及的著作權不甚明了。

網信辦在此時發布管理辦法,對生成式人工智慧服務提出了多項規制,強調生成式人工智慧產品提供者的責任、突出個人信息的保護、明確向監管部門備案和申報安全評估的硬性要求,以及多次重申要從數據源開始確保「生成內容」的真實準確等,開啟了中國對生成式人工智慧產業的監管之路。

冰鑒科技研究院將從《辦法》徵求意見稿中擇要進行解讀。

《辦法》第二條規定了適用和管轄範圍,只要是「面向中華人民共和國境內公眾提供服務的」, 無論是國外還是國內的公司,均適用本辦法。

《辦法》第四條第二款要求,「在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中,採取措施防止出現種族、民族、信仰、國別、地域、性別、年齡、職業等歧視。」 個人信息保護是貫穿AI研發和應用的紅線,但往往更加受到關注的合規點在於是否為公開信息,個人信息是否得到充分授權,而該款所列內容關注到的個人信息類別——歧視和偏見則更為隱蔽,而這將在生成式人工智慧上被進一步放大。訓練數據中可能存在的一系列社會歧視和偏見,會導致生成內容「繼承」這種歧視和偏見。

目前許多海外立法已經對此給予了充分關注,此次《辦法》的明確,也表示國內對於這一問題的逐漸重視。

《辦法》第四條第四款要求,「利用生成式人工智慧生成的內容應當真實準確,採取措施防止生成虛假信息。」在現實操作中,生成式人工智慧生成的內容是否「真實準確」較難界定。很多ChatGPT用戶發現,在和AI交互過程中,遇到某些創造性較強的內容,如寫小說、發表評價性看法,乃至長時間問答交互之後,人工智慧經常會一本正經「胡說八道」,甚至出現幻覺(hallucinations)——而這恰恰又是生成式人工智慧不同於其他語言模型的獨特創新之處。 冰鑒科技研究院認為,該條規定更強調生成式人工智慧提供者,要有「防止生成虛假信息」的前置舉措,並在應用實踐中部署執行。至於最終生成的內容是否為「虛假信息」,還要根據實踐中是否造成不良影響或侵犯他人權利來進一步認定。

《辦法》第五條指出,生成式人工智慧提供者,通過API接口支持他人生成內容的,也要「承擔該產品生成內容生產者的責任」「涉及個人信息的,承擔個人信息處理者的法定責任,履行個人信息保護義務。」——從該條來看,各類B端客戶在使用生成式人工智慧對外提供服務時,也都要追溯到源頭提供者的責任,涉及個人信息處理的則按照《個人信息保護法》執行。

《辦法》第六條,利用生成式人工智慧產品向公眾提供服務前,需按規定向國家網信部門申報安全評估。 實際上明確了向監管部門備案和申報安全評估的硬性要求。至於目前網際網路巨頭已經開始向公眾提供服務的,理論上應當補齊安全評估程序及算法備案手續。而在《辦法》正式出台之後,計劃向公眾提供服務的生成式人工智慧提供者,則需要提前向網信辦申請安全評估及備案。

如前所述, 要確保「生成內容」的真實準確,則需要從數據源頭確保真實準確。《辦法》第七條按照《網絡安全法》,對「生成式人工智慧產品的預訓練數據、優化訓練數據來源的合法性」提出了詳細要求。第十七條則要求,應根據主管部門的要求,向用戶提供「包括預訓練和優化訓練數據的來源、規模、類型、質量等描述……」

《辦法》第八條要求「對標註人員進行必要培訓,抽樣核驗標註內容的正確性」。眾所周知,生成式人工智慧在(有監督、半監督)深度學習時,涉及到大量人員對數據進行標註,「抽樣核驗」原本就是必不可少的過程。但當前有不少AI公司(如自動駕駛)將標註工作進行外包,或放在網際網路平台上進行眾包,是否需要以及如何對這些標註人員進行培訓? 此舉或將提高生成式人工智慧提供商的人力成本。

《辦法》第十六條非常有意思,要求對AI「生成的圖片、視頻等內容進行標識」。比如打上「本圖片由某某GPT自動生成」這樣的水印?國外很多平台已經允許將ChatGPT列為論文合著者。而這類明顯的標識,既是生成式人工智慧提供商的廣告式宣言,也為普通用戶區別「人工智慧」和真正「人工」生成的內容提供了幫助。 我國法律學界與實務界目前對人工智慧生成物是否屬於著作權法下的作品觀點不一,如果生成內容獨創性不足,可能還構成對現有作品的侵權,如果人工智慧生成物的確侵犯了著作權,這類標識也為作者法律維權打開了方便之門。

《辦法》對投訴舉報的處理機制也做了詳細的規定,第十五條指出,對於運行中發現、用戶舉報的不符合辦法要求的生成內容,除採取內容過濾等措施外,應在3個月內通過模型優化訓練等方式防止再次生成。第十八條和十九條又分別明確了用戶和使用者發現生成內容不合規或使用生成產品過程中產生不合法不道德行為的投訴處理機制,並且在第二十條列出了處罰的法律依據和相關規定。

生成式人工智慧監管號角已經吹響,產業格局和行業規則或將發生重大改變。本次發布的《辦法》僅為 徵求意見稿,公眾可在 2023年5月10日前通過多個途徑提出反饋意見,後續監管也將根據行業實踐和意見反饋調整相應內容。

更多詳情請點擊: 《生成式人工智慧服務管理辦法(徵求意見稿)》全文

文章來源: https://twgreatdaily.com/zh-my/71836b5beef9aac06eb32acb8e3aa165.html

新基建下的蛋

2024-05-16