AI生成書籍泛濫:誰在製造「假書」?

2023-10-23   AI狐頭條

原標題:AI生成書籍泛濫:誰在製造「假書」?

原創 | 南方周末

亞馬遜的自助出版系統允許任何人在亞馬遜上自行出版和銷售書籍,這給AI生成書籍的泛濫提供了漏洞。 (視覺中國/圖)

「誰在寫我的傳記?」

當羅里·塞蘭-瓊斯在亞馬遜上發現一本自己的傳記時,他奇怪地發出疑問。他翻閱了部分內容,書中顯示他生活在一個學術家庭中,父親是一位和藹可親的學者,母親是一名教師。這本書幾乎可以與他自己寫的回憶錄相媲美,只不過上面的信息「完全是幻想」,他告訴《衛報》。

事實上,羅里的父親是BBC的一位電視導演,母親也在BBC工作。某一天,他在一個裝著信件的鞋盒中發現了父母的感情故事,並由此揭開家族的歷史真相,這些故事被記錄在他真正的回憶錄中。

至於那本有關他的傳記,羅里從未聽說過那位傳記作者,不過,他很快發現,這本書是由AI生成的。

羅里的遭遇並非孤例。據多家外媒報道,AI生成的書籍正充斥在亞馬遜上,這些書籍涉及範圍廣泛,從傳記、食譜、科普書籍到旅遊指南等,無所不有。其中,有些書中的某些錯誤信息甚至會威脅到生命。

紐約真菌學會(NYMS)便公開表示,亞馬遜等電商平台上的許多AI生成的蘑菇覓食科普書籍存在諸多錯誤描述,這可能會誤導大眾吃到有毒蘑菇,「意味著生與死」。

「AI已經擊垮亞馬遜」

6月,作家凱特琳·林奇在社交平台上發帖,指出在亞馬遜青少年當代愛情電子書暢銷排行榜的前100名中,只有19本是正常的書籍,其餘都是AI生成的「廢話」。

她還附上了一本書的截圖,名字叫《等你愛我》,封面是一張黑白的海鷗照片。在此之前,在亞馬遜的青少年當代愛情類別前100名暢銷書排行榜中,這本書位於第90名。底下的兩條一星評論也指出,它是一本由AI生成的書籍。

「AI已經擊垮了亞馬遜。」林奇在推文中這樣寫道。

據8月《紐約時報》報道,旅遊指南也成為AI書籍泛濫的主要類別之一。3月,旅行者艾米·科爾斯基為即將到來的法國之旅在亞馬遜上購買旅行指南。當她輸入幾個搜索關鍵詞「旅行」「指南」「法國」後,一本排名靠前的《法國旅遊指南》引起了她的注意。

根據作者頁面顯示,該書作者邁克·史蒂夫斯是一位「著名的旅行作家」。書籍的介面上有一百多個五星好評,該指南還承諾有行程安排和當地人的推薦。於是,艾米·科爾斯基下了單。

令她失望的是,收到書籍後,她發現裡面的描述模糊、文字重複,並且缺乏行程安排,看起來像是從維基百科上複製粘貼的。她將這本書退回了。

《紐約時報》發現事情並不簡單。他們無法找到該書所謂的「作者」之前發表的任何作品,甚至介面上「作者」的照片也顯得奇怪,比如耳朵附近存在的異常元素、歪歪扭扭的衣服等,看起來是由AI生成的照片。

根據AI檢測工具Originality.ai的結果,幾乎可以肯定邁克·史蒂夫斯的書AI生成。此外,《紐約時報》發現,AI生成的書籍也開始滲透到烹飪、編程、醫學、園藝等許多類別中。

而在許多媒體的報道中,AI生成的書籍不僅給讀者帶來誤導信息,也給真人作者造成了極大的困擾。8月,作家簡·弗里德曼在自己的博客上稱,有一些「垃圾書」被上傳到亞馬遜上,作者一欄赫然寫著她的名字,但她並沒有寫過這些書,它們極大可能是AI生成的。

從2009年開始,她一直在寫博客,很多內容都是公開的,可以用於AI的模型訓練。因此,當她讀到這些「假書」的第一頁時,就像在閱讀自己生成的ChatGPT回復一樣。更讓她覺得雪上加霜的是,這些「假書」被添加到她的Goodreads個人資料中,這很容易引起誤導。

她在社交平台上抱怨這件事情之後,一些作者回應稱,他們也有過類似的經歷。「人們一直告訴我他們買了我的新書,上面有我的名字,但我從未寫過。」一位作者說。還有的作者僅僅一周就舉報了29本類似情況的書籍。

「可怕的是,這種情況可能發生在任何一個有名聲、有地位、有需求的人身上,有人看到了從中獲利的途徑。」在接受美國有線電視新聞網採訪時,簡·弗里德曼說道。

「實際上是在允許『垃圾書』的存在」

在羅里發現有關他的傳記是AI生成的內容後,亞馬遜給他發了一封電子郵件,上面推薦說,「你可能會喜歡這本書」。這讓羅里感到生氣,亞馬遜的算法竟認為這是一本他想要的書。

「他們實際上是在允許『垃圾書』的存在,還把它推薦給最討厭它的人。」羅里告訴《衛報》。儘管亞馬遜之後刪除了這本書,但還是有很多作品通過了旨在剔除低質量圖書的過濾系統。

實際上,許多AI生成的書籍出現在亞馬遜平台上,跟它本身的自助出版系統KDP(Kindle Direct Publishing)被濫用有很大關係。2007年,亞馬遜創建KDP,允許任何人在亞馬遜上自行出版和銷售書籍。目前,它可以提供超過45種語言選擇。

在亞馬遜KDP平台,作者可以自由選擇自助出版電子書或紙質書,完成自助出版書籍的上傳流程後,亞馬遜大約72小時內就能通過審核並進行銷售。在此平台上自助出版書籍是免費的,不過,如果出版紙質書,印刷成本會從每本書銷售所得的版稅中扣除。一般來說,作者可獲得的紙質書版稅最高為60%,電子書的版稅為35%或70%。

另外,隨著人工智慧技術的發展,在YouTube、TikTok等平台上,許多利用AI生成書籍的教程也紛紛出現,其主題範圍廣泛,不少用戶可以從中快速掌握AI生成書籍的方法,再加上亞馬遜自助出版功能的便利與收益,濫用此功能進行AI書籍出版和銷售的行為也很難避免。

在接到許多作者的投訴後,9月,亞馬遜在其KDP的社區頁面上引入了新的規則和指南。新規要求作者在發布作品時,回答系統關於作品是否為人工智慧生成的提問。在其內容指南部分,亞馬遜也增加了有關AI的內容,包括對「人工智慧生成」和「人工智慧輔助」的定義。

據《衛報》報道,出於對人工智慧的擔憂,亞馬遜推出限制自助出版者每日最多發布3本書的新規。

但即使新規已經發布,有些影響卻已造成。簡·弗里德曼的相關事件發酵後,那些假冒她之名的書籍從亞馬遜和她的Goodreads個人資料中被刪去。但這一過程並不順利,亞馬遜一開始拒絕停止出售那些書籍。簡·弗里德曼認為,最終是由於她在寫作和出版界的知名度和聲譽才促使亞馬遜撤下那些書。

「現在亞馬遜上發布的人工智慧內容泛濫成災,有時還以誤導或欺詐的方式歸屬於作者,怎麼能理所當然地指望在職作者在餘生中每周都花時間來監管這些內容呢?」她發出質問。

而即使那些書不再出現在她的亞馬遜或Goodreads頁面上,它們的影響仍然存在。簡·弗里德曼在自己的博客上寫道:「不幸的是,即使你把這些瘋狂的書從你的官方資料中刪除了,它們仍然會和你的名字在一起……而你對此卻無能為力。」

南方周末記者 翁榕榕 南方周末實習生 陳荃新

責編 李慕琰