觸樂夜話:SD發展小談

2023-11-16     觸樂

原標題:觸樂夜話:SD發展小談

觸樂夜話,每天胡侃和遊戲有關的屁事、鬼事、新鮮事。

圖/小羅

昨天,我的同事祝思齊老師發布了一篇關於AI工具應用的文章。今天,作為一名使用StableDiffusion(以下簡稱SD)工具的AI繪畫老玩家,我想簡單聊聊SD在過去1年內,如何被「業餘」地使用。

我想粗略地將這1年的SD大眾向發展分為3個階段。從去年10月到今年春節前為「初探期」,這段時間的SD作用有限,對生產毫無幫助,但頗具潛力,許多二次元愛好者把它當作純粹的「玩具」;今年春節後到5月為「爆發期」,幾乎是在短短一周內,SD相關技術席捲網際網路,許多遊戲公司開辦「AI興趣小組」,鼓勵大家研究SD;今年6月開始為「徘徊期」,SD技術的發展似乎停滯不前,業餘大眾對SD興趣驟降,一些從事遊戲美術的朋友告訴我,大廠對SD應用的研究日漸專業化,「技術壁壘」正在產生,但因為保密協議限制,不便透露太多。

先來聊聊「初探期」。去年10月初,一位策劃朋友告訴我:「我最近發現了一個叫『Novel AI』的網址,只需要設置關鍵詞和參數,就可以生成二次元妹子,我可以用它來給Tiera添加參考圖。」Tiera是他正在設計的高難度關卡的最終Boss,形象為白髮藍瞳的魔女。

Tiera角色參考

我點開他發來的網址,看上去像是一個專為二次元輕小說生成AI創意插圖的工具,介面是全英文,專業名詞扎堆,我理解起來有些費力。生成圖片需要排隊,還總是卡住。過了幾天,網站開始收費,一些人把網站所使用的SD工具架構到本地。

我和朋友也架構了SD,但生成的圖片並不理想,線條粗糙、畫質模糊且色塊混亂。因為架構到本地後,生成圖片時需要電腦的顯卡進行計算,而我的顯卡功效一般。那時的SD效果極其不穩定,我可能需要生成100多張圖片,才能從中選出一張勉強符合要求的。而朋友在嘗試了一段時間用SD添加參考圖後,再也沒打開過它——效率實在是太低了,而且風格受限,完全沒有Pinterest(一個圖片分享網站)好用。

因為SD起源平台的受眾是宅圈群體,在「一鍵式生成老婆」這個噱頭之下,SD影響力越來越大。雖然生成的圖片質量差,但是看教程或者「整活」視頻的人很多。我同朋友打趣說:「搞個帳號開始做自媒體,用AI生產內容,保准賺得盆滿缽滿。」

宅男們在AI圖站樂此不疲地生成「老婆」

玩AI繪畫的人越來越多,一些從事相關領域工作的技術人員也加入進來,SD被不斷疊代,一直有人在開發相關插件。

由於Lora(小模型)研究的深入,SD所顯現出的潛力越來越大:它不僅可以生成二次元美少女,還可以生成三次元形象;不僅能生成人,還能生成貓、狗甚至「克蘇魯」古神。今年1月,在全球最大的Lora模型站Civitai,已經有許多通過真人照片生成的Lora,但以歐美形象為主。到了月底,東亞形象的Lora出現在模型站,有人利用它生成真人Coser照片,並進行詐騙宣傳,此舉引起國內警方的注意。在某次警方通告後,SD開始「破圈」。

到了「爆發期」,SD有一些革命性的新技術湧現,其中令我印象最深刻的,是AI動畫領域的多幀渲染法。

在多幀渲染法出現之前,AI動畫的製作方法比較笨重:先把視頻拆成一幀幀的圖片,按序號順序放在同一個文件夾里,再將文件夾地址填到本地的SD中,設置好Checkpoint(大模型)和參數,也可以一同設置角色的Lora,使畫面中的角色形象更穩定。同時需要開啟Control net插件來識別角色肢體動作,保持動作的流暢性。這種方法下產出的AI動畫崩壞感嚴重,例如角色跳舞時背過身去,SD會在某幾幀把角色的後腦勺轉換成正臉。

而多幀渲染法需要使用一個叫作「Multi-frame Video rendering」的插件。通俗點說,這一插件在耗費舊方法3倍顯卡算力的基礎上,減少了AI動畫中間幀崩壞的現象,大幅提高了AI動畫的穩定性。此方法出現後,B站的AI動畫視頻數量陡增。

多幀渲染法的視頻教程

但我也發現,這一時期的大多數AI動畫都有著比較明顯的色情意味,並且在多幀渲染法出現後愈發明顯。換個極端點的說法,許多人接觸SD,目的就是為了生產此類圖片或者動畫——有受眾就有市場,有觀眾就有創作者。在視頻網站,這類AI動畫可以被標註為原創,且在創作者激勵的範疇內,還能參與瓜分現金的創作活動。因為有利可圖,創作者越來越多。

在B站,播放量高的AI動畫中不乏遊戲題材

以我了解的一名AI動畫創作者為例,他每天下班後用現成的資源做一個MMD視頻,然後用SD進行風格轉化,再投稿到視頻網站。轉化過程中,他會玩手游或者看書,並不耽誤自己的時間。半年時間裡,他通過AI動畫獲得的「額外收入」約為1萬元。

今年6月之後,AI繪畫逐漸進入「徘徊期」。大眾開始對AI出現審美疲勞,新技術遲遲不出現,創作者也感到乏味。歸根結底,業餘愛好者和觀眾們並不像專業從業者,有改善工作流的需求,大多只是想「圖一樂」。因此,對於他們來說,SD更像是一種高門檻的玩具——感興趣時很「上頭」,玩膩了就丟在一邊。我了解的那位AI動畫創作者,在意識到繼續做AI動畫產生的收益不能覆蓋電費和顯卡壽命損耗的折價後,也暫停了視頻更新。

不過,就像其他AI創作工具一樣,SD在這些發展階段中也面臨著許多矛盾和爭議。比如傳統創作者與AI使用者之間的矛盾——我們經常能看到一些知名插畫師的風格被AI簡單粗暴地「煉成」,並用來創作圖片在約稿網站上售賣,也能看到AI繪畫的反對者網暴AI工具使用者,並採取舉報等方式限制他們的活動。

又如利用AI工具生成真人形象的侵權和欺詐問題,因此訴諸法律的案例也不少。只不過,由於AI尚屬新鮮事物,相關法律顯得較為模糊,與大眾印象里對AI工具的「審判」並不一定完全貼合。從現有情況來看,似乎還沒有出現一個特別有代表性的案例能夠供普通人參考。

一些Up主的教程被人惡意盜用與售賣

在祝老師的文章中,受訪者提到,未來AI創作可能會出現兩極分化的現象,低門檻越來越低,高門檻越來越高。目前,這種情況似乎已經有了趨勢:一些AI工具已經支持多語言(包括中文)輸入,普通用戶最直接的一道障礙已經逐漸被跨過;大型廠商則在嘗試將AI融入工作流,尋找到了一些方向,也取得了一定的進展。

也許,正如這位受訪者所說,「圍繞AI還是有很多爭議,但面對新事物和技術的發展,一些人心中會有被落下的恐懼,另一些人則把這種變化視為機遇」——技術是技術,會呈現出什麼狀態,仍然取決於人們怎樣使用它。

文章來源: https://twgreatdaily.com/zh-cn/d86d8618e6e5ba19f7d906946afbdf7c.html