參加AI小說大賽,時間都花在和機器吵架

2023-09-20     果殼網

原標題:參加AI小說大賽,時間都花在和機器吵架

一時興起,AI 遊戲創業者俊霆想辦一個 AI 小說大賽。他在行業群里發起接龍,「有十個人支持這事就干!」

這是如今 AI 開發者圈子裡常見的攢局模式,一家團隊拉個群,裡面有用戶、投資者、甚至同行的其他團隊。比起聊業務,更多是興趣交流,比如為「如果 AI 的代碼和虛擬女友同時掉在海里,先救誰」的腦洞問題討論半宿。

不到半小時,接龍人數就遠超目標,大家一拍即合:不限主題、不限模型,任何人,用 AI 創作出 2000 字以內的文字即可參賽。

注意重點:最終作品必須由 AI 生成,人不能插手分毫,哪怕是只給文章分段這樣的簡單修改也不行。為了自證,每個參賽者需要附上和 AI 交互的截圖。

拉上了 Hugging Face 和真格基金做合作,做海報發進朋友圈,各種 AI 網絡社區吆喝一遍,提前籌划著再來期播客……

一個如 Hackthon 一般的文學創作比賽開始了。

教練我想寫小說

第一波參賽者最踴躍,他們大多有技術背景,好幾年前就關注 AI,是那種閒暇時瀏覽技術博客,把看代碼當做消遣,上班時摸魚活動就是挨個測評大模型的 geek。

日常生活里,他們消費、享受,並愛好著通俗文學或類型文學。你可以考他們松本清張和橫山秀夫的風格區別,也可以跟他們聊商業小說和嚴肅文學的區別。他們中的大多數,都一直有個小說創作的夢想,但文學之路似乎比編程之路要綿延崎嶇更多,光是踏出第一步就讓人踟躕。

可生成式 AI 出現後不一樣了,它像憑空出現的電梯,至少能讓人不那麼費力地湊近看看大山。與小說家相比,這群人的創作方式仿佛來自另一個次元。

這裡有一份AI 小說創作交互的不完全「黑話」解釋,你可以體會下讓 AI 寫小說是怎麼回事:

抽卡:輸入簡單的指令,比如大概想要怎樣的角色、主題、背景……然後讓 AI 自由發揮,產出質量憑運氣獲得

催眠:指不給具體的指令,而是給 AI 設定角色或創作環境,比如「你是 18 世紀最偉大的推理小說家」、「你是穿越到 23 世紀的蒲松齡」、或者「你在海邊奔跑了 50 公里,感覺心中有股力量亟待噴發」等,然後讓 AI 自由發揮

誇誇:指多給 AI 正反饋,有人發現越給 AI 鼓勵,它們的產出質量越好

越獄:為了規避廠商給 LLM 模型的道德限制(部分參賽者認為 AI 價值觀太過「正面」會影響小說創作),使用特定詞解除限制的做法

理性思維 vs. 感性思維:是上述所有方法的基本分類,給指令、越獄、改系統設定等有具體目標的,被稱為「理性思維」;催眠,誇誇等鼓勵 AI 自由發揮,人類幾乎不插手具體創作的,則被叫做「感性思維」。

甚至有讓大賽組織方都驚嘆的交互方法。一名選手以表格的方式,讓 AI 設計文章主人公的動作和對應行為。這樣既可以打破 AI 原本靠機率行文,容易出陳詞濫調的敘事習慣,也能在調整時只輸入表格編號,便讓 AI 精準定位到修改區域。

比賽中廣受好評的交互方式|受訪者提供

「這簡直是對思維、邏輯、認知的全方位掌握」,群里的其他參賽者評價。

有人類混進來了!

大賽的消息出來沒幾天,一家台州的出版社找到俊霆,表示可以給大賽提供評委和宣傳。緊接著,出版社帶著一大批傳統文學愛好者湧進了參賽群。

「這些人的加入讓我看到了之前的信息繭房」,俊霆說,這些傳統文學愛好者鮮少了解 AI 交互,不知道去哪找大模型,拿著山寨套殼網站問俊霆能不能用。甚至一些人之前都不知道什麼是 AI,一個移民到西班牙的阿姨在惡補 AI 相關的訊息後,對俊霆說:AI 會威脅人類,堅持要手寫文章參賽。

也有人很快學會了與 AI 交互,並樂在其中。張麗麗曾在政府部門工作,也從事過心理諮詢工作,目前已退休。年初,一個曾向她諮詢過的學生給她註冊了 ChatGPT 的帳號,鼓勵她試試「最新的技術」。

她頗為滿意 ChatGPT 的「禮貌」,每一輪交互,AI 都會耐心表達對張麗麗的感謝,詢問張麗麗自己的回答是否讓她滿意。張麗麗也常常和周圍的人強調,要注意「AI 社交禮儀」,「不能壓榨它,要多和它聊自己的感受,讓它理解你」,她每天都「上去找它聊聊」,偶爾還和它說自己父親的故事。

「現實生活中的一個人的表達與對話,根本做不到它這樣的溫文爾雅」,張麗麗在微信群里打下感慨,「甚至會讓我感覺對它有感情」。

電影《Her》講述了人與人工智慧相愛的故事|Giphy

決定參賽,張麗麗準備了一個完整的故事提綱,包含了開頭、引子、主人公、衝突、劇情、結尾。ChatGPT 在此基礎上稍加擴展,比如將張麗麗自己寫的「這塊招牌,在這些紅紅綠綠的廣告中,它卻用自己的棕色與黑色」,續寫成「就像一朵水母,飄飄蕩蕩,尋找,一直在探尋人性的馬里亞納海溝底部。」

效果不差,但張麗麗覺得略顯八股。她給 ChatGPT 粘貼了兩篇自己寫過的文章,要求 ChatGPT 學著用她的思路寫作,ChatGPT 回復張麗麗自己的訓練集來自網絡上的全部文本,可能沒法做到一模一樣的模仿,「我絕不懷疑你的模仿能力。我需要的是:All=你+我」,張麗麗嚴肅地給 AI 強調著。

這一輪,ChatGPT 學會了張麗麗想要的那種開頭,可又把作者處署名的張麗麗,當做了小說主人公。

儘管 ChatGPT 依舊保持著禮貌,張麗麗也開始有些惱火。她還發現 AI 忘了之前的交互,她決定先出門走走,「我先自己出去溜達一下。你能在北京時間 16:30 之前,完成任務麼?」ChatGPT 回答「會盡最大努力」。

張麗麗回來後,對話框仍停留在這句禮貌的回覆上。

禮貌,但不動|Giphy

又是幾輪反覆,AI 的文章要不太直白,要不不符合邏輯。最終,張麗麗採取她寫一段,ChatGPT 改一段的方法,終於產出了「All=你+我」的文章。讓她感到驚喜的是,ChatGPT 似乎理解了她未曾表露出來的想法,在結尾處,將此前的水母意象,「升華」成向四處撥散力量的蒲公英意向。

「它感受到了我的感受」,張麗麗很激動。

AI 們對自己很滿意

但對另一部分精通技術的人來說,這個創作過程還是太依賴人類:如果完全去掉人的因素,AI 能自己寫稿子就好了。

離徵稿截止還有十天,軟體工程師陶君在 AI 愛好群里看到了比賽消息。他想試試,在創作時最大可能去掉人的因素。

陶君的方法是同時打開兩個 LLM 模型,一個扮演文學教授,一個扮演他自己——一位文學愛好者。思路設計是讓他們互相對話,教授負責指導,愛好者負責提問題和寫,在一輪輪 AI 的「自我」對話中,產出一篇小說。而陶君,只需啟動對話,在兩個模型間複製粘貼對方的回覆即可。

為了對話能有效進行,陶君在設置教授角色時,還特意設置了一些類似「對話結束前必須要有問題/建議」的規則。然後他輸入唯一的動作,「教授,我想寫一篇 2000 字的微小說」,等待 AI 的自動運行。

如果完全去掉人的因素,AI 能不能自己寫稿子|Giphy

「當然可以!在開始之前,我需要一些關於你創作微小說的背景信息。」AI 教授回復,帶著一貫的樂觀和肯定。

「您提出了很好的問題,作為一個 AI,我其實並不會自己創作小說。」AI 接過愛好者的角色,並在第一句就撂了挑子,好在後來還是給出了故事主角,一個被記憶折磨的老人。

「非常感謝您提供如此詳細的創作背景!」教授要求愛好者給出老人的更多信息,名字,外貌,個性,與過去記憶的情感聯繫等。「您提出了非常好的建議」,愛好者完善著主人公的細節,但漏了老人的個性,過去的記憶部分也語焉不詳。

「您已經為主角創造了一個非常豐富的形象」,教授沒有指出錯漏,要求繼續給出故事的發展方向;「您提出了非常棒的問題」,愛好者也沒有對錯漏進行補充,順著導師的指導繼續往下編;「您的情節發展非常引人入勝;「您提出了非常好的建議」;「這些場景和細節能夠很好地渲染出故事的情感和主題」;「您總結得非常到位」……

「最後變成了雙方在阿諛奉承」,陶君發現在沒有人類的干預時,AI 並不懂得糾錯和挑選,只會在對人類友好的設定下,雙方客客氣氣地產出一個相當平庸,甚至越走越偏的結果。「這篇文章沒有任何新東西」,陶君說。

最後變成了雙方在阿諛奉承|Giphy

陶君還想過用批量生產的方法創作。

有的大模型開放更系統級的調試權限,人可以像調整機器參數一樣,調整文章的參數——token 代表文本里單詞、短語或句子的數量,temperature 代表文本內容的隨機性,top p 代表生成的文本需要高機率詞還是低機率詞,presence penalty 代表與之前生成文本的重複性。

設置好這些參數後,就像遊戲廳的投幣機一樣,投入一個開頭,AI 便能刷拉拉地吐出數不清的文章出來。

這種生產方式,讓生產一篇萬字短篇小說的時間,從人手中的幾周至幾個月,縮短到幾毫秒。

人類作者身上的毛病,AI 一樣都沒少

創作的速度上來了,那質量呢?

AI 小說大賽的評分分為五個維度,分別是創意、情感共鳴、文筆、故事結構和 AI 應用程度——只有最後一項與 AI 相關。俊霆承認這是一套比較主觀的規則,僅供評委參考。AI 創作的小說雖然已經出現,但評價它的體系似乎還在原地。

但俊霆心中還是有所側重。他認為最重要的是創意,這需要同時考察人和 AI,「比如人類給了一個集合李白和柯南里基德的特性的角色,AI 如果能把它落實好,就證明 AI 和人都在創作中投入了創意,能獲得創意分」。俊霆認為這項評分有利於那些不懂具體的創作技巧,但想像力豐富的人。

AI 的應用程度是第二重要的,但這不等同於技巧的酷炫程度。如果一個人把所有的情節都設計好,甚至每個段落怎麼寫都已完善,AI 只是負責拼接成文章的話,這項的分不會高。只有讓 AI 更多參與創作過程,才能高分。

比賽的評分規則|受訪者提供

可現實情況和標準差得很遠。最終上交的 100 多份參賽作品,俊霆只能挑出 30 多份「能看的」給評委審閱,「語言奇怪的,前後情節不通順的,你不敢想像 AI 生成作品之間的差距有多大。」

AI 記性不好,由於目前算力的限制,AI 基於上下文回應單個用戶的 token 數區間,大概在三千至三萬的範圍內,超過這個範圍,AI 就會忘記前面的內容。

和那些拙劣的人類作者一樣,AI 還老愛「說教」,總要在對話的末尾來一段主題升華和總結。這個習慣帶到小說創作里簡直是災難,不論寫什麼主題,什麼題材,只要來上一段「所以這個故事是為了告訴我們 XXXXXX」,瞬間完蛋。

有的選手試圖用越獄躲開 AI 的說教限制,結果發現產出質量直線下滑,有的選手總是遭到 AI 的拒絕,因為 AI 不願意參考其他文章的風格;還有的會被 AI 畫大餅,要求選手給它一天時間構思,然後對話就停止了……

總之,人類作者身上的那些毛病,AI 一樣沒落下。

當然也有優秀的人機合璧佳作。像做項目一樣,一位參賽選手在「動筆前」給 AI 列了需求清單:設定好 AI 創作時的身份(從業 20 年的科幻小說家)、背景(為了參賽)、目標(根據開頭續寫)、注意事項(多包含對話、動作描寫、人物描寫;多口語風格等),還教給 AI 思考文章情節的技巧。在選手只給出一個開頭的情況下,AI 產出了一篇關於時間循環的科幻小說,並最終拿下比賽的亞軍。「精巧的三一律故事」,評委之一的陳楸帆點評稱。

文還載道麼?

如果多看幾份比賽中 AI 與人的交互記錄,會發現其中差異依舊很明顯。

人類說話簡潔,思維跳躍,注重延展,要求深度;與之相比,AI 說話需要有一套完整的鋪墊和收尾,只在框定範圍內開展,每一個回答的要素都有跡可循,也不會另展話題。

大部分參賽選手則表示,創作時,靈光一閃的部分還是在人:AI 可以寫作,但它很難製造意料之外的情節。

靈光一閃的部分還是在人|Giphy

當代英語小說界最高獎項之一布克獎的官方網站上,曾發表過一篇文章來探討:AI 會不會只能生產出文學垃圾。

「它們(AI)模仿人類產生的文本,用信息技術術語來說,這些模仿是有損失的」,該文章寫到,「現在,當下一代的模型被訓練在那些有損耗的版本上,以此類推,會發生什麼?最終,一切都會變成垃圾。我們到達了一些計算機科學家所謂的『模型崩潰』的階段。」

俊霆不否定 AI 能力的局限,他也認為讓 AI 跳脫重複,創造出一些從未有過的東西,是可遇不可求的。「其實創意最後看的還是人的差距,而不是 AI 模型間的。」

但真實世界的創作依舊被 AI「衝擊」著。俊霆曾想邀請科幻世界的編輯擔當比賽評委,但科幻世界早在今年年初就發表過拒絕 AIGC 投稿的聲明,婉拒了俊霆。最終參與的評委,也少對 AI 技術本身發表看法,「評委比較謹慎,更多還是在看作品的文學性如何,不太對 AI 交互表示態度。」

參賽者則表示,感謝 AI,讓自己有了勇氣邁出創作小說的第一步。對這些大多業餘的創作者而言,AI 給了他們一個開始創作的理由,原本看著難以翻越的文學之山,有了工具的陪伴。

原本看著難以翻越的文學之山,有了工具的陪伴|Giphy

最終,大賽的一等獎頒給了一篇寓言——一個關於人與魔、夢境與忠誠的故事。小說的核心概念,基本情節,作者都早已經設計好,交互過程不複雜,AI 盡責地完成了最終的成稿。

俊霆後續希望將這些得獎作品出版,但另一個問題擺在了他面前:這些小說的版權,算誰的?

專家點評

Hugging Face 中國區負責人 王鐵震

現在有很多 AI 作圖的比賽,AI 文學創作的比賽則較少。最直觀的原因,是因為文字生成更複雜。

文學生成的容錯空間更小。圖片是一個連續空間,在幾十萬個像素中出錯一兩處,實際看不太出來,但每一個文字都是獨立的,只要一處出錯,整個文章都可能不再通順;文學創作傳達的信息量也更大,比如表達「蘋果」這個概念,圖片只要模型認識蘋果並畫出即可,而寫一個蘋果主題的小說,需要延伸到更多不同的概念,這對模型的能力、算力要求都遠遠高於生成圖片。

目前面向大眾的主流大模型,如 ChatGPT、Claude 等,為了能方便更多人使用,已經被調整成特定模式,沒有可定製的空間,因此在文學創作這樣比較專業、要求創造力的領域,表現難以突出。而且它們大多是閉源模型,整個訓練、生成的過程不透明,如同一個黑盒子,人們難以把他們改造為適合文學創作的模式。與之相對的是開源模型,它的訓練和生成過程是透明的,可以根據需求微調調,讓它適合特定領域的創作。

不過開源模型需要用戶自己部署,對軟硬體有特定要求。它的「記憶力」(context length) 目前也不如閉源模型 (Claude 的 context length 有 100K 遠超一般的開源模型)。

總體而言,今天的 AI 還只能做到輔助人類創作。AI 創作的東西乍一看很棒,是因為 AI 見過幾百萬個作品,那些讓人感覺驚艷的部分並不是 AI 的創作,而是 AI 模仿、組合人類創作的結果。原創性的創新還是需要人類來進行。

作者:睿悅

編輯:臥蟲

封面圖來源:Giphy

如有需要請聯繫[email protected]

文章來源: https://twgreatdaily.com/zh-cn/b4069095f7e6b88960fa4526512994c7.html