如何鑑別AI大語言模型生成文本?國際最新研發出添加水印工具

2024-10-24   生活報

中新網北京10月24日電(記者 孫自法)國際著名學術期刊《自然》最新發表一篇人工智慧(AI)研究論文稱,研究人員開發出一種能為AI大語言模型(LLM)生成的文本添加水印的工具,或能提高對合成內容的鑑別和追溯能力。

該論文介紹,大語言模型是廣泛使用的人工智慧工具,能為聊天機器人、寫作支持和其他目的生成文本。不過,人們很難識別並追溯AI生成文本的來源,使信息的可靠性成疑。水印被認為能解決這一問題,但生產系統對質量和計算效率的嚴格要求阻礙了其規模化應用。

在本項研究中,知名人工智慧企業谷歌DeepMind團隊開發出一個利用一種全新採樣算法給AI生成文本添加水印的系統,稱為SynthID-Text。該工具利用一個採樣算法對LLM的詞彙選擇進行巧妙偏移,插入一個能被相關檢測軟體識別的簽名。這既可以通過一種「扭曲」路徑實現——該路徑能提高水印質量但會輕微影響輸出質量,或是通過一種能保留文本質量的「非扭曲」路徑。

論文作者團隊在多個公開模型上評估了這些水印的可檢測性,發現SynthID-Text的可檢測性優於當前其他方法。該團隊還用Gemini LLM的近2000萬次在線對話回答評估了這些文本的質量,結果顯示,非扭曲水印形式不會降低文本質量。同時,SynthID-Text的使用對LLM運行所需算力的影響可忽略不計,這也減少了其應用上的障礙。

論文作者總結說,雖然編輯文本或改寫輸出就能避免出現文本水印,但他們的研究表明,一個為AI生成內容的生成式文本添加水印的工具是可行的,繼而有望提升LLM使用的責任制和透明度。

來源:中國新聞網